Bioteque é um recurso de descritores para diferentes entidades biológicas. Ao percorrer este gráfico de conhecimento através de entidades e relacionamentos específicos, exploramos mais de 1000 caminhos (também conhecidos como metacaminhos) que foram codificados em vetores numéricos e disponibilizados para a comunidade. Crédito:IRB Barcelona
O rápido desenvolvimento das diferentes disciplinas nas áreas de pesquisa biológica e biomédica (como genômica, proteômica e transcriptômica) nas últimas décadas levou a um crescimento exponencial na quantidade de dados biológicos disponíveis. Por exemplo, no Instituto Europeu de Bioinformática (EMBL-EBI), eles passaram de gerenciar um volume de 40 petabytes para trabalhar com 250 petabytes em apenas 6 anos.
Cientistas liderados pelo Dr. Patrick Aloy, pesquisador do ICREA e chefe do laboratório de Bioinformática Estrutural e Biologia de Redes do IRB Barcelona, desenvolveram uma ferramenta computacional para harmonizar, integrar e simplificar esses dados. O resultado é um gráfico de conhecimento que fornece informações sobre como diferentes entidades biológicas estão relacionadas entre si, incluindo mais de 30 milhões de interações funcionais.
A Bioteque funciona integrando diferentes níveis de complexidade biológica e assim pode informar, por exemplo, sobre dois genes que estão relacionados, se interagem fisicamente, se estão ativos no mesmo tipo de células e se estão relacionados com a mesma doença . Também pode prever a sensibilidade ou resistência de um tipo de célula a um medicamento específico.
"Este recurso computacional que desenvolvemos é um dos primeiros voltados para unificar a informação biológica e é o único a abordar tamanha diversidade e quantidade de dados. Permite acesso, de forma fácil e harmonizada, a praticamente todo o conhecimento biológico atualmente disponível e tem um enorme potencial para acelerar a pesquisa biomédica", explica Aloy.
Ilustrando 4 descritores diferentes para 4 tipos de entidades biológicas. Crédito:IRB Barcelona
Quase 1.000 descritores para 12 entidades biológicas As informações contidas na Bioteque são estruturadas em 12 tipos de entidades biológicas, como gene, doença, tecido, célula, etc. Para cada uma dessas entidades, a ferramenta considera uma série de descritores ou características, por exemplo, o padrão de mutações de um gene, o perfil de interações físicas das proteínas resultantes, a expressão do referido gene em diferentes tipos de células ou sua relação com diferentes doenças. Entre as 12 entidades biológicas, o sistema abrange cerca de 1.000 tipos de descritores.
"Trabalhamos com informações de 150 bancos de dados diferentes, então primeiro tivemos que integrá-los, ou seja, colocar todos na mesma 'linguagem'. E então convertemos esse conhecimento em descritores numéricos que pudessem ser interpretados por algoritmos, e isso como poderíamos explorar computacionalmente essas redes e conexões", conclui Adrià Fernández, primeiro autor do artigo e doutorando no mesmo laboratório.
Três grupos são destacados onde as doenças e seus tratamentos estão associados. Crédito:IRB Barcelona
A Bioteque será ampliada periodicamente com novas bases de dados, à medida que forem divulgadas. Tanto a ferramenta quanto as bases de dados e algoritmos são de acesso aberto e estão disponíveis online.
A pesquisa foi publicada em
Nature Communications .
+ Explorar mais O aprendizado de máquina profundo completa informações sobre um milhão de moléculas bioativas