Um aplicativo de inteligência artificial está sendo usado pelo pesquisador do KAUST para encontrar genes que causam doenças. Credit:Kiyoshi Takahase Segundo / Alamy Foto de stock
A inteligência artificial (IA) está sendo aproveitada por pesquisadores para rastrear genes que causam doenças. Uma equipe KAUST está tomando um criativo, Abordagem combinada de aprendizagem profunda que usa dados de várias fontes para ensinar algoritmos como encontrar padrões entre genes e doenças.
O aprendizado de máquina usa algoritmos e modelos estatísticos para identificar padrões e associações entre dados para resolver problemas específicos. Ao inserir dados conhecidos suficientes, como imagens marcadas de "Jack, "o sistema pode eventualmente aprender a sugerir outras imagens não marcadas que incluem Jack.
Os pesquisadores estão usando este aplicativo de IA para encontrar genes que causam doenças. Contudo, apenas um número limitado de genes foi experimentalmente confirmado como causador. Isso significa que os cientistas não têm muitos dados para inserir em seus programas para ajudá-los a aprender os padrões que retratam as associações entre genes e doenças. Assim, eles precisam ser criativos para encontrar maneiras de ensinar algoritmos de aprendizado de máquina a aprender e, em seguida, procurar esses padrões.
O especialista em gerenciamento de banco de dados e informações, Panagiotis Kalnis, O biocientista computacional Xin Gao e seus colegas desenvolveram um modelo de aprendizado profundo que, segundo eles, supera os métodos atuais de última geração.
Primeiro, eles recorreram a bancos de dados conhecidos para extrair informações sobre as localizações e funções dos genes e sobre como e quando eles ligam e desligam. Esses dados foram usados para ensinar algoritmos para encontrar genes que funcionam juntos. Então, eles obtiveram dados sobre as características das doenças genéticas de outros bancos de dados. Isso ensinou aos algoritmos como identificar doenças com manifestações semelhantes. Eles combinaram esses conjuntos de dados com dados sobre as associações conhecidas entre 12, 231 genes e 3, 209 doenças.
O modelo KAUST extrai os padrões aprendidos de como os genes se formam em rede e sobre as semelhanças entre as doenças genéticas e os transfere para um modelo de aprendizado profundo denominado rede convolucional de grafos. Isso fornece outro conjunto de dados que são colocados em matrizes, como aqueles usados em sistemas de recomendação, para prever a associação gene-doença.
O modelo foi capaz de identificar complexos, associações não lineares entre genes e doenças, permitindo que ele preveja novas associações. “Ao utilizar mais informações, alcançamos uma precisão melhor do que os métodos de última geração atualmente em uso, "diz Peng Han, o primeiro autor do estudo. "Mas, embora tenhamos superado outros métodos em nossos experimentos, ainda não é preciso o suficiente para ser aplicado à indústria, " ele adiciona.
A próxima equipe planeja melhorar a precisão de seu modelo incorporando mais tipos de dados. Eles também aplicarão o método para resolver outros tipos de problemas onde apenas dados limitados estão disponíveis, como recomendar novos locais para visitar com base nas preferências anteriores do usuário.