p Mihai Pop, um professor de ciência da computação na Universidade de Maryland, com uma nomeação conjunta no Instituto de Estudos Avançados de Computação da Universidade de Maryland. Crédito:John T. Consoli, Universidade de Maryland
p Comunidades de bactérias vivem em todos os lugares:dentro de nossos corpos, em nossos corpos e ao nosso redor. O intestino humano sozinho contém centenas de espécies de bactérias que ajudam a digerir os alimentos e fornecer nutrientes, mas também pode nos deixar doentes. Para saber mais sobre esses grupos de bactérias e como eles afetam nossas vidas, os cientistas precisam estudá-los. Mas esta tarefa apresenta desafios, porque levar a bactéria para o laboratório é impossível ou interromperia os processos biológicos que os cientistas desejam estudar. p Para contornar essas dificuldades, os cientistas se voltaram para o campo da metagenômica. Na metagenômica, os pesquisadores usam algoritmos para reunir o DNA de uma amostra ambiental para determinar o tipo e a função das bactérias presentes. Ao contrário de campos estabelecidos como a química, onde os pesquisadores avaliam seus resultados em relação a um conjunto de padrões conhecidos, metagenômica é um campo relativamente jovem que carece de tais referências.
p Mihai Pop, um professor de ciência da computação na Universidade de Maryland com uma nomeação conjunta no Instituto de Estudos Avançados de Computação da Universidade de Maryland, recentemente ajudou a julgar um desafio internacional chamado Avaliação Crítica da Interpretação do Metagenoma (CAMI), que comparou o software de metagenômica. Os resultados foram publicados na revista
Métodos da Natureza em 2 de outubro, 2017
p "Não há um algoritmo que possamos dizer que é o melhor em tudo, "disse Pop, que também é codiretor do Centro de Informática Relacionada à Saúde e Bioimagem da UMD. "O que descobrimos foi que uma ferramenta funciona melhor em um contexto, mas outro se sai melhor em outro contexto. É importante que os pesquisadores saibam que precisam escolher o software com base nas perguntas específicas que estão tentando responder. "
p Os resultados do estudo não foram surpreendentes para Pop, por causa dos muitos desafios que os desenvolvedores de software de metagenômica enfrentam. Primeiro, A análise de DNA é um desafio na metagenômica porque o DNA recuperado geralmente vem do campo, não é um ambiente de laboratório rigidamente controlado. Além disso, DNA de muitos organismos - alguns dos quais podem não ter genomas conhecidos - se misturam em uma amostra, dificultando a montagem correta, ou peça junto, genomas individuais. Além disso, O DNA se degrada em ambientes hostis.
p "Gosto de pensar na metagenômica como um novo tipo de microscópio, "Pop disse." Nos velhos tempos, você usaria um microscópio para estudar bactérias. Agora temos um microscópio muito mais poderoso, que é o sequenciamento de DNA acoplado a algoritmos avançados. A metagenômica tem a promessa de nos ajudar a entender o que as bactérias fazem no mundo. Mas primeiro precisamos ajustar esse microscópio. "
p O líder da CAMI convidou Pop para ajudar a avaliar as inscrições dos participantes do desafio por causa de sua experiência em montagem de genoma e metagenoma. Em 2009, Pop ajudou a publicar Bowtie, um dos pacotes de software mais comumente usados para a montagem de genomas. Mais recentemente, ele colaborou com a Escola de Medicina da Universidade de Maryland para analisar centenas de milhares de sequências de genes como parte do maior, estudo mais abrangente de doenças diarreicas infantis já realizado em países em desenvolvimento.
p "Descobrimos novos, bactérias desconhecidas que causam doenças diarreicas, e também encontramos interações entre bactérias que podem piorar ou melhorar a doença, "Pop disse." Acho que é um dos projetos mais impactantes que fiz usando metagenômica. "
p Para a competição, Os pesquisadores do CAMI combinaram aproximadamente 700 genomas microbianos e 600 genomas virais com outras fontes de DNA e simularam como essa coleção de DNA poderia aparecer no campo. A tarefa dos participantes era reconstruir e analisar os genomas do pool de DNA simulado.
p Os pesquisadores do CAMI pontuaram as submissões dos participantes em três áreas:quão bem eles montaram os genomas fragmentados; quão bem eles "jogaram no lixo, "ou organizado, Fragmentos de DNA em grupos relacionados para determinar as famílias de organismos na mistura; e quão bem eles "traçaram o perfil, "ou reconstruído, a identidade e abundância relativa dos organismos presentes na mistura. Pop contribuiu com métricas e software para avaliar os genomas reunidos enviados.
p Dezenove equipes enviaram 215 entradas usando seis montadores de genoma, nove binners e 10 profilers para enfrentar esse desafio.
p Os resultados mostraram que, para a montagem, algoritmos que montaram um genoma usando diferentes comprimentos de fragmentos de DNA menores superaram aqueles que usaram fragmentos de DNA de um comprimento fixo. Contudo, nenhum montador se saiu bem em separar diferentes, ainda genomas semelhantes.
p Para a tarefa de binning, os pesquisadores encontraram compensações na precisão com que os programas de software identificaram o grupo ao qual um fragmento de DNA particular pertencia, versus quantos fragmentos de DNA o software atribuiu a quaisquer grupos. Este resultado sugere que os pesquisadores precisam escolher seu software binning com base na precisão ou cobertura é mais importante. Além disso, o desempenho de todos os algoritmos de categorização diminuiu quando as amostras incluíram vários genomas relacionados.
p No perfil, o software recuperou melhor a abundância relativa de bactérias na amostra ou detectou melhor os organismos, mesmo em quantidades muito baixas. Contudo, os últimos algoritmos identificaram o organismo errado com mais freqüência.
p Daqui para frente, Pop disse que o grupo CAMI continuará a enfrentar novos desafios com diferentes conjuntos de dados e novas avaliações voltadas para aspectos mais específicos do desempenho do software. Pop está animado em ver os cientistas usarem os benchmarks para abordar questões de pesquisa no laboratório e na clínica.
p "O campo da metagenômica precisa de padrões para garantir que os resultados sejam corretos, bem validado e seguir as melhores práticas, "Pop disse." Por exemplo, se um médico vai realizar uma intervenção com base nos resultados do software metagenômico, é essencial que esses resultados sejam corretos. Nosso trabalho fornece um roteiro para a escolha do software apropriado. "