Crédito:Domínio Público CC0
Nas últimas décadas, muito poucos novos antibióticos foram desenvolvidos, em grande parte porque os métodos atuais para triagem de medicamentos potenciais são proibitivamente caros e demorados. Uma nova estratégia promissora é usar modelos computacionais, que oferecem uma maneira potencialmente mais rápida e barata de identificar novos medicamentos.
Um novo estudo do MIT revela o potencial e as limitações de uma dessas abordagens computacionais. Usando estruturas de proteínas geradas por um programa de inteligência artificial chamado AlphaFold, os pesquisadores exploraram se os modelos existentes poderiam prever com precisão as interações entre proteínas bacterianas e compostos antibacterianos. Se assim for, os pesquisadores podem começar a usar esse tipo de modelagem para fazer telas em larga escala para novos compostos que visam proteínas anteriormente não direcionadas. Isso permitiria o desenvolvimento de antibióticos com mecanismos de ação sem precedentes, uma tarefa essencial para enfrentar a crise de resistência aos antibióticos.
No entanto, os pesquisadores, liderados por James Collins, o Professor Termeer de Engenharia Médica e Ciência do Instituto de Engenharia e Ciência Médica (IMES) do MIT e do Departamento de Engenharia Biológica, descobriram que esses modelos existentes não tiveram um bom desempenho para esse propósito. Na verdade, suas previsões tiveram um desempenho pouco melhor do que o acaso.
"Avanços como o AlphaFold estão expandindo as possibilidades para os esforços de descoberta de medicamentos in silico, mas esses desenvolvimentos precisam ser combinados com avanços adicionais em outros aspectos da modelagem que fazem parte dos esforços de descoberta de medicamentos", diz Collins. "Nosso estudo fala tanto das habilidades atuais quanto das limitações atuais das plataformas computacionais para a descoberta de drogas".
Em seu novo estudo, os pesquisadores conseguiram melhorar o desempenho desses tipos de modelos, conhecidos como simulações de docagem molecular, aplicando técnicas de aprendizado de máquina para refinar os resultados. No entanto, mais melhorias serão necessárias para aproveitar totalmente as estruturas de proteínas fornecidas pelo AlphaFold, dizem os pesquisadores.
Collins é o autor sênior do estudo, que aparece hoje na revista
Molecular Systems Biology . Os pós-docs do MIT Felix Wong e Aarti Krishnan são os principais autores do artigo.
Interações moleculares O novo estudo faz parte de um esforço lançado recentemente pelo laboratório de Collins chamado Antibiotics-AI Project, que tem o objetivo de usar inteligência artificial para descobrir e projetar novos antibióticos.
AlphaFold, um software de IA desenvolvido pela DeepMind e Google, previu com precisão as estruturas das proteínas a partir de suas sequências de aminoácidos. Essa tecnologia gerou entusiasmo entre pesquisadores em busca de novos antibióticos, que esperam poder usar as estruturas AlphaFold para encontrar drogas que se ligam a proteínas bacterianas específicas.
Para testar a viabilidade dessa estratégia, Collins e seus alunos decidiram estudar as interações de 296 proteínas essenciais de E. coli com 218 compostos antibacterianos, incluindo antibióticos como as tetraciclinas.
Os pesquisadores analisaram como esses compostos interagem com as proteínas de E. coli usando simulações de encaixe molecular, que prevêem a força com que duas moléculas se unirão com base em suas formas e propriedades físicas.
Esse tipo de simulação tem sido usado com sucesso em estudos que rastreiam um grande número de compostos contra um único alvo proteico, para identificar os compostos que se ligam melhor. Mas neste caso, onde os pesquisadores estavam tentando rastrear muitos compostos contra muitos alvos em potencial, as previsões acabaram sendo muito menos precisas.
Ao comparar as previsões produzidas pelo modelo com interações reais para 12 proteínas essenciais, obtidas em experimentos de laboratório, os pesquisadores descobriram que o modelo tinha taxas de falsos positivos semelhantes às taxas de verdadeiros positivos. Isso sugere que o modelo foi incapaz de identificar consistentemente as verdadeiras interações entre as drogas existentes e seus alvos.
Usando uma medida frequentemente usada para avaliar modelos computacionais, conhecida como auROC, os pesquisadores também encontraram baixo desempenho. “Utilizando essas simulações de encaixe molecular padrão, obtivemos um valor de auROC de aproximadamente 0,5, o que basicamente diz que você não está se saindo melhor do que se estivesse adivinhando aleatoriamente”, diz Collins.
Os pesquisadores encontraram resultados semelhantes quando usaram essa abordagem de modelagem com estruturas de proteínas que foram determinadas experimentalmente, em vez das estruturas previstas pelo AlphaFold.
“O AlphaFold parece funcionar tão bem quanto as estruturas determinadas experimentalmente, mas precisamos fazer um trabalho melhor com os modelos de encaixe molecular se quisermos utilizar o AlphaFold de maneira eficaz e extensiva na descoberta de medicamentos”, diz Collins.
Melhores previsões Uma possível razão para o baixo desempenho do modelo é que as estruturas de proteínas alimentadas no modelo são estáticas, enquanto em sistemas biológicos, as proteínas são flexíveis e muitas vezes mudam suas configurações.
Para tentar melhorar a taxa de sucesso de sua abordagem de modelagem, os pesquisadores executaram as previsões por meio de quatro modelos adicionais de aprendizado de máquina. Esses modelos são treinados em dados que descrevem como as proteínas e outras moléculas interagem umas com as outras, permitindo que incorporem mais informações nas previsões.
“Os modelos de aprendizado de máquina aprendem não apenas as formas, mas também as propriedades químicas e físicas das interações conhecidas e, em seguida, usam essas informações para reavaliar as previsões de encaixe”, diz Wong. “Descobrimos que, se você filtrar as interações usando esses modelos adicionais, poderá obter uma proporção maior de verdadeiros positivos para falsos positivos”.
No entanto, melhorias adicionais ainda são necessárias antes que esse tipo de modelagem possa ser usado para identificar com sucesso novos medicamentos, dizem os pesquisadores. Uma maneira de fazer isso seria treinar os modelos com mais dados, incluindo as propriedades biofísicas e bioquímicas das proteínas e suas diferentes conformações, e como essas características influenciam sua ligação com potenciais compostos de drogas.
Com mais avanços, os cientistas poderão aproveitar o poder das estruturas de proteínas geradas pela IA para descobrir não apenas novos antibióticos, mas também medicamentos para tratar uma variedade de doenças, incluindo câncer, diz Collins. "Estamos otimistas de que, com melhorias nas abordagens de modelagem e expansão do poder de computação, essas técnicas se tornarão cada vez mais importantes na descoberta de medicamentos", diz ele. "No entanto, temos um longo caminho a percorrer para atingir todo o potencial da descoberta de medicamentos in silico."
+ Explorar mais Pesquisadores identificam novos medicamentos usando previsões interpretáveis de aprendizado profundo