O aprendizado de máquina classifica 191 dos vírus mais prejudiciais do mundo
Duas visualizações de dados 3D PCA de frequências k-mer de sequências de Mamastrovirus e Avastrovirus:sequências de astrovírus no conjunto de dados 2 (rótulos de gênero conhecidos), juntamente com os 191 genomas de astrovírus com rótulos de gênero previstos por 3PCM. Para fins de comparação, HAstV e GoAstV são destacados com cores diferentes em comparação com o resto dos Mamastrovírus (Mamastrovírus não-HAstV), respectivamente, o resto dos Avastrovírus (Avastrovírus não-GoAstV). O plano lilás ilustra a separação entre dois possíveis subgêneros de Mamastrovirus. O plano cinza ilustra a separação entre dois possíveis subgêneros de Avastrovirus. Crédito:Fronteiras em Biociências Moleculars (2024). DOI:10.3389/fmolb.2023.1305506 Pesquisadores da Universidade de Waterloo classificaram com sucesso 191 astrovírus anteriormente não identificados usando um novo processo de classificação habilitado para aprendizado de máquina.
O estudo, "Aproveitando o aprendizado de máquina para classificação taxonômica de astrovírus emergentes", foi publicado recentemente na Frontiers in Molecular Biosciences. .
Os astrovírus são alguns dos vírus mais prejudiciais e difundidos no mundo. Esses vírus causam diarreia grave, que mata mais de 440 mil crianças com menos de 5 anos anualmente. Na indústria avícola, os astrovírus como a gripe aviária têm uma taxa de infecção de 80% e uma taxa de mortalidade de 50% entre o gado, levando à devastação económica, à interrupção da cadeia de abastecimento e à escassez de alimentos.
Os astrovírus sofrem mutações rapidamente e podem espalhar-se facilmente pelas suas mais de 160 espécies hospedeiras, colocando investigadores e autoridades de saúde pública numa corrida constante para classificar e compreender novos astrovírus à medida que surgem. Em 2023, havia 322 astrovírus não identificados com genomas distintos. Este ano, esse número subiu para 479.
“Em qualquer momento, entre 2% e 9% dos humanos são portadores de um desses vírus. Esse número pode chegar a 30% em alguns países”, disse Fatemeh Alipour, Ph.D. candidato em ciência da computação em Waterloo e principal autor de ciência da computação do estudo de pesquisa. “Compreender e classificar estes vírus de forma eficaz é essencial para o desenvolvimento de vacinas”.
A equipe de pesquisa do astrovírus incluiu pesquisadores de ciência da computação em Waterloo e pesquisadores de biologia da Universidade de Western Ontario.
O novo método de classificação em três partes inclui aprendizado de máquina supervisionado, aprendizado de máquina não supervisionado e rotulagem manual do hospedeiro de cada astrovírus.
“A ideia principal por trás do método de classificação é aproveitar o aprendizado de máquina para classificar espécies, aprendendo com suas ‘assinaturas genômicas’”, disse Lila Kari, professora da Escola de Ciência da Computação David R. Cheriton. "O método de classificação é interessante tanto pela sua velocidade quanto pela aplicabilidade geral."
"Este método pode ajudar-nos a compreender como os vírus são transmitidos entre diferentes animais. Também pode ser usado para classificar vírus noutras famílias de vírus, como o VIH e a Dengue."