• Home
  • Química
  • Astronomia
  • Energia
  • Natureza
  • Biologia
  • Física
  • Eletrônicos
  •  Science >> Ciência >  >> Química
    Pesquisadores constroem uma IA para descoberta de enzimas
    Resíduos de aminoácidos destacados pela rede neural DeepECtransformer. Crédito:Nature Communications (2023). DOI:10.1038/s41467-023-43216-z

    Embora a E. coli seja um dos organismos mais estudados, a função de 30% das proteínas que a compõem ainda não foi claramente revelada. Para isso, foi utilizada uma inteligência artificial para descobrir 464 tipos de enzimas a partir de proteínas desconhecidas, e os pesquisadores passaram a verificar as previsões de três tipos de proteínas que foram identificadas com sucesso por meio de ensaio enzimático in vitro.



    Uma equipe de pesquisa conjunta, incluindo Gi Bae Kim, Ji Yeon Kim, Dr. Jong An Lee e o Distinto Professor Sang Yup Lee do Departamento de Engenharia Química e Biomolecular da KAIST, e Dr. o Departamento de Bioengenharia da UCSD desenvolveu o DeepECtransformer, uma inteligência artificial que pode prever as funções enzimáticas a partir da sequência da proteína. Além disso, a equipe estabeleceu um sistema de previsão utilizando IA para identificar com rapidez e precisão a função da enzima.

    O trabalho da equipe é descrito no artigo intitulado “Anotação funcional de genes codificadores de enzimas usando aprendizado profundo com camadas transformadoras”. O artigo foi publicado em 14 de novembro na Nature Communications .

    As enzimas são proteínas que catalisam reações biológicas, e identificar a função de cada enzima é essencial para a compreensão das diversas reações químicas que existem nos organismos vivos e das características metabólicas desses organismos.

    O número da Enzyme Commission (EC) é um sistema de classificação de funções enzimáticas desenvolvido pela União Internacional de Bioquímica e Biologia Molecular e, para compreender as características metabólicas de vários organismos, é necessário desenvolver uma tecnologia que possa analisar rapidamente enzimas e números CE das enzimas presentes no genoma.

    Várias metodologias baseadas em aprendizagem profunda foram desenvolvidas para analisar as características de sequências biológicas, incluindo a previsão da função proteica, mas a maioria delas apresenta o problema de uma caixa preta, onde o processo de inferência da IA ​​não pode ser interpretado.

    Vários sistemas de predição que utilizam IA para predição da função enzimática também foram relatados, mas eles não resolvem este problema de caixa preta, ou não podem interpretar o processo de raciocínio em um nível refinado (por exemplo, o nível de resíduos de aminoácidos na sequência enzimática ).
    A estrutura da rede neural artificial do DeepECtransformer. Crédito:Instituto Avançado de Ciência e Tecnologia da Coreia (KAIST)

    A equipe conjunta desenvolveu o DeepECtransformer, uma IA que utiliza aprendizado profundo e um módulo de análise de homologia de proteínas para prever a função enzimática de uma determinada sequência de proteína.

    Para compreender melhor as características das sequências proteicas, a arquitetura do transformador, que é comumente usada no processamento de linguagem natural, foi adicionalmente usada para extrair características importantes sobre as funções enzimáticas no contexto de toda a sequência proteica, o que permitiu à equipe prever com precisão a CE. número da enzima. O DeepECtransformer desenvolvido pode prever um total de 5.360 números de EC.

    A equipe conjunta analisou ainda mais a arquitetura do transformador para entender o processo de inferência do DeepECtransformer e descobriu que no processo de inferência, a IA utiliza informações sobre sítios ativos catalíticos e/ou sítios de ligação de cofatores que são importantes para a função enzimática. Ao analisar a caixa preta do DeepECtransformer, foi confirmado que a IA foi capaz de identificar por si só as características que são importantes para o funcionamento da enzima durante o processo de aprendizagem.

    “Ao utilizar o sistema de previsão que desenvolvemos, fomos capazes de prever as funções de enzimas que ainda não haviam sido identificadas e verificá-las experimentalmente”, disse Gi Bae Kim, primeiro autor do artigo.

    “Ao usar o DeepECtransformer para identificar enzimas até então desconhecidas em organismos vivos, seremos capazes de analisar com mais precisão várias facetas envolvidas nos processos metabólicos dos organismos, como as enzimas necessárias para biossintetizar vários compostos úteis ou as enzimas necessárias para biodegradar plásticos”, ele adicionou.

    "O DeepECtransformer, que prevê funções enzimáticas com rapidez e precisão, é uma tecnologia chave na genômica funcional, permitindo-nos analisar a função de enzimas inteiras no nível do sistema", disse o professor Sang Yup Lee.

    Ele acrescentou:“Seremos capazes de usá-lo para desenvolver fábricas microbianas ecologicamente corretas com base em modelos metabólicos abrangentes em escala genômica, minimizando potencialmente a falta de informações do metabolismo”.

    Mais informações: Gi Bae Kim et al, Anotação funcional de genes codificadores de enzimas usando aprendizagem profunda com camadas transformadoras, Nature Communications (2023). DOI:10.1038/s41467-023-43216-z
    Informações do diário: Comunicações da Natureza

    Fornecido pelo Instituto Avançado de Ciência e Tecnologia da Coreia (KAIST)



    © Ciência https://pt.scienceaq.com