p Nesta parte de um exemplo de hipergrafo de um sistema biológico, linhas coloridas representam genes e envolvem condições experimentais (círculos pretos) onde o gene era significativo. Quanto maior o círculo preto, as condições mais experimentais estão nesse grupo. Crédito:Emilie Purvine | PNNL
p Os cientistas estão correndo para acompanhar o COVID-19, criar novas ferramentas para descobrir como o novo coronavírus funciona. p Para pesquisadores do Pacific Northwest National Laboratory (PNNL), compreender a infecção viral é uma questão de matemática, e não uma análise puramente molecular. Eles estão usando uma ferramenta matemática avançada chamada hipergrafos para identificar como as células humanas respondem à infecção viral, incluindo o novo coronavírus. As proteínas-chave que participam dessa resposta podem ser alvos para o desenvolvimento de medicamentos para tratar COVID-19.
p A matemática do PNNL Emilie Purvine e o biólogo computacional Jason McDermott recentemente apresentaram seu trabalho virtualmente no SIGKDD da Association for Computing Machinery (Grupo de interesse especial em descoberta de conhecimento e mineração de dados), uma conferência anual para mineração de dados, ciência de dados, e análises.
p
Hipergrafos para infecção viral
p Em uma etapa importante, a equipe testou a nova abordagem com dados de um vírus semelhante, o coronavírus que causa a Síndrome Respiratória Aguda Grave, ou SARS. Esse vírus infectou mais de 8, 000 pessoas enquanto varria o globo em 2003.
p A equipe do PNNL descobriu que os resultados do novo método correspondem aos dados coletados anteriormente sobre o vírus. Usando hipergrafos, a equipe identificou e classificou a atividade de vários genes agora conhecidos por serem importantes para a atividade do vírus que causou o surto de SARS-1.
p "Nosso trabalho identificou independentemente os mesmos genes conhecidos por serem importantes com a atividade da SARS. Esta foi uma etapa importante a ser tomada antes de aplicar nosso trabalho ao vírus que causa o COVID-19, "disse McDermott.
p Agora a equipe PNNL está aplicando a nova tecnologia ao vírus atual, usando hipergrafos para classificar e classificar a importância de muitas das centenas de genes ativos no COVID-19.
p Purvine e McDermott têm usado hipergrafos para explorar como as células humanas respondem a infecções virais nos últimos dois anos. Eles trabalharam com dados coletados pela bióloga do PNNL Katrina Waters, que tem rastreado a expressão do gene, expressão de proteína, e mudanças moleculares em células humanas infectadas com vírus, incluindo influenza, Zika, Ebola, e coronavírus por cerca de uma década.
p Para aplicar hipergrafos a este grande conjunto de dados, os pesquisadores primeiro tiveram que descobrir como identificar grupos de proteínas de uma forma que os configurasse para construir um hipergrafo significativo. A equipe estava enfrentando esse desafio no início deste ano, ao mesmo tempo, ocorreu a pandemia do coronavírus.
p
De gráficos a hipergrafos
p A colaboração com a Purvine oferece uma nova ferramenta para McDermott, que tem usado técnicas matemáticas baseadas em gráficos para analisar conexões entre genes, proteínas, e moléculas de sinalização nas células por anos.
p Ele e seus colegas identificam relações entre duas moléculas de cada vez. Em seguida, eles categorizam as conexões entre muitas interações separadas. Essas conexões rapidamente se emaranham em gráficos complexos que representam redes moleculares que mantêm as células funcionando.
p Os pesquisadores analisam a estrutura e a forma desses gráficos, procurando por padrões significativos que indicam componentes moleculares com funções-chave. Centralidade, ou quando uma molécula tem muitas conexões com outras, é um tipo de padrão.
p Toda a estrutura de um gráfico é outro padrão significativo. Algumas conexões centrais agem como pontes para manter o fluxo de informações entre as diferentes partes da rede. Os genes ou proteínas envolvidos nessas conexões de "intermediação" provavelmente mantêm uma célula inteira funcionando adequadamente.
p Os hipergrafos representam um salto potencial. Em vez de representar conexões entre componentes individuais, os hipergrafos mostram relações entre grupos de coisas. Uma vez que as redes biológicas operam por meio de grupos moleculares, os cientistas acreditam que os hipergrafos podem representar sua estrutura de forma mais realista do que os gráficos padrão.
p Os cientistas usaram hipergrafos para representar grupos sociais e infraestrutura de rede de computadores, mas sua complexidade computacional os torna uma técnica incomum para estudar redes biológicas em grande escala que surgem de dados experimentais.
p Uma ferramenta de software hipergrafo de código aberto chamada HyperNetX, desenvolvido no PNNL, torna esta análise mais acessível a pesquisadores em várias disciplinas. Mas aplicar a técnica a dados de uma variedade de campos ainda requer alguns ajustes.
p "Uma vez que existem tantas maneiras de construir hipergrafos a partir de dados biológicos, biólogos provavelmente precisam envolver um matemático computacional para fazer isso, por enquanto, "Purvine disse.