• Home
  • Química
  • Astronomia
  • Energia
  • Natureza
  • Biologia
  • Física
  • Eletrônicos
  •  Science >> Ciência >  >> Biologia
    Engenheiros desenvolvem ferramentas inovadoras de software de análise de microbioma
    Crédito:Domínio Público CC0

    Desde que o primeiro genoma microbiano foi sequenciado em 1995, os cientistas reconstruíram a composição genómica de centenas de milhares de microrganismos e até desenvolveram métodos para realizar um censo das comunidades bacterianas na pele, no intestino, ou no solo, na água e noutros locais. em amostras a granel, levando ao surgimento de um campo de estudo relativamente novo conhecido como metagenômica.



    Analisar dados metagenômicos pode ser uma tarefa difícil, assim como tentar montar vários quebra-cabeças enormes com todas as peças misturadas. Assumindo este desafio computacional único, o especialista em inteligência artificial (IA) gráfica da Rice University, Santiago Segarra, e o biólogo computacional Todd Treangen se uniram para explorar como a análise de dados alimentada por IA poderia ajudar a criar novas ferramentas para turbinar a pesquisa metagenômica.

    A dupla de cientistas concentrou-se em dois tipos de dados que tornam a análise metagenómica particularmente desafiante – repetições e variantes estruturais – e desenvolveu ferramentas para lidar com estes tipos de dados que superam os métodos atuais.

    As repetições são sequências idênticas de DNA que ocorrem repetidamente em todo o genoma de um único organismo e em vários genomas de uma comunidade de organismos.

    “O DNA em uma amostra metagenômica de múltiplos organismos pode ser representado como um gráfico”, disse Segarra, professor assistente de engenharia elétrica e de computação.

    “Essencialmente, uma das ferramentas que desenvolvemos aproveita a estrutura deste gráfico para determinar quais pedaços de DNA aparecem repetidamente entre micróbios ou dentro do mesmo microrganismo”.

    Chamado de GraSSRep, o método combina aprendizado auto-supervisionado, um processo de aprendizado de máquina onde um modelo de IA se treina para distinguir entre entradas ocultas e disponíveis, e redes neurais gráficas, sistemas que processam dados que representam objetos e suas interconexões como gráficos.

    O artigo, também disponível no arXiv servidor de pré-impressão, foi apresentado na 28ª sessão de uma conferência internacional anual sobre pesquisa em biologia molecular computacional, RECOMB 2024. O projeto foi liderado pelo estudante de graduação e assistente de pesquisa da Rice, Ali Azizpour. Advait Balaji, ex-aluno de doutorado da Rice, também é autor do estudo.

    As repetições são de interesse porque desempenham um papel significativo nos processos biológicos, como a resposta bacteriana a mudanças no seu ambiente ou a interação dos microbiomas com os organismos hospedeiros. Um exemplo específico de fenômeno em que as repetições podem desempenhar um papel é a resistência aos antibióticos.

    De modo geral, rastrear a história ou dinâmica das repetições em um genoma bacteriano pode esclarecer as estratégias de adaptação ou evolução dos microrganismos. Além do mais, às vezes as repetições podem ser vírus disfarçados ou bacteriófagos. Da palavra grega para "devorar", os fagos às vezes são usados ​​para matar bactérias.

    "Esses fagos realmente aparecem como repetições, então você pode rastrear a dinâmica entre bactérias e fagos com base nas repetições contidas nos genomas", disse Treangen, professor associado de ciência da computação.

    “Isso poderia fornecer pistas sobre como se livrar de bactérias difíceis de matar ou apresentar uma imagem mais clara de como esses vírus estão interagindo com uma comunidade bacteriana”.

    Anteriormente, quando uma abordagem baseada em gráficos era usada para realizar a detecção de repetições, os pesquisadores usavam especificações predefinidas sobre o que procurar nos dados do gráfico. O que diferencia o GraSSRep dessas abordagens anteriores é a falta de quaisquer parâmetros ou referências predefinidos que informem como os dados são processados.

    “Nosso método aprende como usar melhor a estrutura do gráfico para detectar repetições, em vez de depender da entrada inicial”, disse Segarra. "A aprendizagem auto-supervisionada permite que esta ferramenta se treine na ausência de qualquer verdade básica que estabeleça o que é uma repetição e o que não é uma repetição. Ao manusear uma amostra metagenômica, você não precisa saber nada sobre o que está dentro lá para analisá-lo."

    O mesmo é verdade no caso de outro método de análise metagenômica co-desenvolvido por Segarra e Treangen – detecção de variantes estruturais sem referência em microbiomas por meio de gráficos de comontagem de leitura longa, ou ema. Seu artigo sobre ema será apresentado na conferência anual da Sociedade Internacional de Biologia Computacional, que acontecerá de 12 a 16 de julho em Montreal.

    A autora principal do artigo é Kristen Curry, ex-aluna de doutorado em ciência da computação da Rice, que ingressará no laboratório de Rayan Chikhi – também coautor do artigo – no Institut Pasteur em Paris como cientista de pós-doutorado. Uma versão do artigo está disponível no bioRxiv servidor de pré-impressão.

    Enquanto o GraSSRep é projetado para lidar com repetições, a ema lida com variantes estruturais, que são alterações genômicas de 10 pares de bases ou mais que são relevantes para a medicina e a biologia molecular devido ao seu papel em diversas doenças, regulação da expressão gênica, dinâmica evolutiva e promoção da diversidade genética. dentro das populações e entre as espécies.

    “Identificar variantes estruturais em genomas isolados é relativamente simples, mas é mais difícil fazê-lo em metagenomas onde não existe um genoma de referência claro para ajudar a categorizar os dados”, disse Treangen.

    Atualmente, um dos métodos amplamente utilizados para processamento de dados metagenômicos é através de genomas montados em metagenoma ou MAGs.

    “Esses montadores de novo ou guiados por referência são ferramentas bastante bem estabelecidas que envolvem todo um pipeline operacional com detecção repetida ou identificação de variantes estruturais sendo apenas algumas de suas funcionalidades”, disse Segarra.

    "Uma coisa que estamos investigando é substituir os algoritmos existentes pelos nossos e ver como isso pode melhorar o desempenho desses montadores metagenômicos amplamente utilizados."

    Rhea não precisa de genomas de referência ou MAGs para detectar variantes estruturais e superou os métodos que dependem de tais parâmetros pré-especificados quando testado contra dois metagenomas simulados.

    “Isso foi particularmente notável porque obtivemos uma leitura muito mais granular dos dados do que usando genomas de referência”, disse Segarra.

    “A outra coisa que estamos investigando atualmente é aplicar a ferramenta a conjuntos de dados do mundo real e ver como os resultados se relacionam com os processos biológicos e quais insights isso pode nos fornecer”.

    Treangen disse que GraSSRep e ema combinados - com base em contribuições anteriores na área - têm o potencial "de desbloquear as regras subjacentes da vida que governam a evolução microbiana".

    Os projetos são resultado de uma colaboração de anos entre os laboratórios Segarra e Treangen.

    "Este foi o produto da realização de pesquisas colaborativas de vários anos em diferentes áreas de especialização, o que permitiu aos nossos alunos Ali e Kristen desafiar os paradigmas existentes e desenvolver novas abordagens para os problemas existentes na metagenômica", disse Treangen.

    Mais informações: Ali Azizpour et al, GraSSRep:Aprendizagem auto-supervisionada baseada em gráficos para detecção de repetição em montagem metagenômica, arXiv (2024). DOI:10.48550/arxiv.2402.09381
    Kristen D. Curry et al, Detecção de variante estrutural sem referência em microbiomas por meio de gráficos de comontagem de leitura longa, bioRxiv (2024). DOI:10.1101/2024.01.25.577285

    Informações do diário: bioRxiv , arXiv

    Fornecido pela Rice University



    © Ciência https://pt.scienceaq.com