Crédito CC0:domínio público
Os pesquisadores desenvolveram um algoritmo de aprendizado de máquina para descoberta de drogas que se mostrou duas vezes mais eficiente que o padrão da indústria, o que poderia acelerar o processo de desenvolvimento de novos tratamentos para doenças.
Os pesquisadores, liderado pela Universidade de Cambridge, usaram seu algoritmo para identificar quatro novas moléculas que ativam uma proteína considerada relevante para os sintomas da doença de Alzheimer e da esquizofrenia. Os resultados são relatados no jornal PNAS .
Um problema chave na descoberta de medicamentos é prever se uma molécula ativará um determinado processo fisiológico. É possível construir um modelo estatístico procurando por padrões químicos compartilhados entre moléculas conhecidas por ativar esse processo, mas os dados para construir esses modelos são limitados porque os experimentos são caros e não está claro quais padrões químicos são estatisticamente significativos.
"O aprendizado de máquina fez um progresso significativo em áreas como visão computacional, onde os dados são abundantes, "disse o Dr. Alpha Lee do Laboratório Cavendish de Cambridge, e o autor principal do estudo. "A próxima fronteira são as aplicações científicas, como a descoberta de medicamentos, onde a quantidade de dados é relativamente limitada, mas temos insights físicos sobre o problema, e a questão passa a ser como casar os dados com a química e a física fundamentais. "
O algoritmo desenvolvido por Lee e seus colegas, em colaboração com a empresa biofarmacêutica Pfizer, usa matemática para separar padrões químicos farmacologicamente relevantes de irrelevantes.
Mais importante, o algoritmo analisa as moléculas sabidamente ativas e as moléculas sabidamente inativas, e aprende a reconhecer quais partes das moléculas são importantes para a ação do medicamento e quais não são. Um princípio matemático conhecido como teoria da matriz aleatória fornece previsões sobre as propriedades estatísticas de um conjunto de dados aleatório e ruidoso, que é então comparado com as estatísticas de características químicas de moléculas ativas / inativas para destilar quais padrões químicos são verdadeiramente importantes para a ligação, em oposição a surgirem simplesmente por acaso.
Esta metodologia permite aos pesquisadores pescar padrões químicos importantes não apenas de moléculas que estão ativas, mas também de moléculas que são inativas - em outras palavras, experimentos que falharam agora podem ser explorados com esta técnica.
Os pesquisadores construíram um modelo começando com 222 moléculas ativas, e foram capazes de rastrear computacionalmente seis milhões de moléculas adicionais. A partir disso, os pesquisadores compraram e examinaram as 100 moléculas mais relevantes. A partir destes, eles identificaram quatro novas moléculas que ativam o receptor CHRM1, uma proteína que pode ser relevante para a doença de Alzheimer e esquizofrenia.
"A capacidade de pescar quatro moléculas ativas de seis milhões é como encontrar uma agulha em um palheiro, "disse Lee." Uma comparação direta mostra que nosso algoritmo é duas vezes mais eficiente que o padrão da indústria. "
Fazer moléculas orgânicas complexas é um desafio significativo na química, e drogas potenciais abundam no espaço de moléculas ainda não fabricáveis. Os pesquisadores de Cambridge estão atualmente desenvolvendo algoritmos que prevêem maneiras de sintetizar moléculas orgânicas complexas, além de estender a metodologia de aprendizado de máquina para descoberta de materiais.
A pesquisa foi apoiada pelo Programa Winton para a Física da Sustentabilidade.