• Home
  • Química
  • Astronomia
  • Energia
  • Natureza
  • Biologia
  • Física
  • Eletrônicos
  •  science >> Ciência >  >> Química
    Identificando a matéria escura do mundo molecular

    Crédito CC0:domínio público

    Imagine que seu feed do Facebook representa um quebra-cabeça tentador. São apresentados a você alguns fragmentos sobre uma pessoa - a cor dos olhos, cor de cabelo, era, e altura - e tem apenas um minuto para escolher o nome e a identidade da pessoa em centenas de perfis. Se você fizer assim, você ganha $ 100 milhões.

    Mas você conhece apenas 10 dessas pessoas pelo nome. Para os outros, você tem apenas uma escassez de dados para trabalhar. Alguns são jovens e alguns não são tão jovens. Alguns são loiros e outros são morenos. Alguns de seus nomes parecem familiares, mas você não consegue identificar como os conhece.

    Esse tipo de cenário - uma tarefa aparentemente impossível com uma enorme recompensa - confronta os pesquisadores do PNNL que estudam a metabolômica. Esse é o estudo de pequenas moléculas que fundamentam e informam todos os aspectos de nossas vidas, incluindo produção de energia, o destino do planeta, e nossa saúde.

    Os cientistas estimam que menos de 1 por cento das pequenas moléculas são conhecidas. Uma biblioteca típica de metabolômica disponível comercialmente tem talvez 5, 000 compostos, mas os cientistas sabem que existem bilhões a mais.

    Como eles "identificam" algo sobre o qual sabem tão pouco? É como pedir a Galileu para identificar estrelas no espaço profundo que eram impossíveis de detectar quando ele usou um dos primeiros telescópios há mais de 400 anos.

    Digite DarkChem, um projeto de pesquisa financiado pelo Deep Learning for Scientific Discovery Agile Investment do PNNL. Uma equipe liderada por Ryan Renslow está trazendo inteligência artificial para a mesa para enfrentar o vasto, paisagem desconhecida de metabólitos que atormentam pesquisadores como Tom Metz, que lidera o esforço de metabolômica do PNNL.

    "Agora mesmo, estamos apenas examinando o que é potencialmente conhecível e dizendo adeus aos dados muito interessantes porque não podemos identificar a grande maioria dos metabólitos que nossa tecnologia detecta, "disse Metz." O aprendizado profundo está fornecendo uma nova maneira de resolver o quebra-cabeça. "

    Renslow e seus colegas Sean Colby e Jamie Nunez adotaram princípios de aprendizado profundo comumente usados ​​em aplicações como tradução de idiomas e os aplicaram a esta matéria escura do mundo molecular.

    Os primeiros resultados são dignos de nota:a rede DarkChem da equipe pode calcular uma característica-chave de uma molécula em milissegundos e com 13 por cento menos erros, em comparação com 40 horas em um supercomputador executando o software de química quântica carro-chefe da PNNL, NWChem.

    "Ficamos chocados com o quão bem DarkChem se saiu, "disse Renslow.

    A rede não está simplesmente analisando dados para compilar resultados. Em vez, a rede baseia-se na inteligência artificial. DarkChem foi desenvolvido para que possa descobrir coisas novas que ainda são desconhecidas para os humanos.

    De seção transversal de futebol e colisão

    Nesse caso, a equipe treinou o programa para compreender e prever uma propriedade química conhecida como seção transversal de colisão (CCS). Enquanto o CCS se mascara como um acrônimo científico intimidante, qualquer pessoa que assistiu a um jogo de futebol viu algo como o CCS em ação.

    Imagine um ballcarrier esmagando jogadores adversários. Um jogador menor pode ter menos colisões, mas quando eles colidem com um oponente, o efeito é diferente de quando um marshawn Lynch parecido com o Hulk entra no modo de besta e sacode vários impactos.

    Você aprende muito sobre jogadores de futebol ao vê-los colidir uns com os outros.

    Do mesmo jeito, rastrear colisões entre íons metabólitos viajando através de um instrumento de laboratório cheio de moléculas de gás diz aos cientistas muito sobre as estruturas dos íons metabólitos - seu tamanho, sua massa, e outros recursos. CCS é a medida matemática dessa ação, e é fundamental para desbloquear a estrutura química da fase gasosa - a verdadeira "identificação" - de uma molécula.

    Renslow e sua equipe treinaram DarkChem para calcular CCS para estruturas químicas, em seguida, soltou-o para fazer o cálculo de mais de 50 milhões de compostos - uma parte da biblioteca do PubChem. O programa resolveu essa tarefa em um piscar de olhos.

    Embora seja um passo promissor, a equipe está mais animada com as implicações para todas as pequenas moléculas ainda não identificadas.

    A rede pode ser executada tanto para frente quanto para trás, ou seja, pode resolver o CCS de uma molécula e prever outras propriedades, mas também pode gerar novas estruturas químicas com base nas propriedades que se procuram. Por exemplo, A equipe de Renslow usou DarkChem para apresentar várias novas estruturas químicas que têm potencial para influenciar o receptor NMDA, que está envolvida na memória e outras funções cerebrais importantes.

    A rede não está simplesmente memorizando dados. Na verdade, a equipe adiciona intencionalmente alguma imprecisão numérica aos desafios que a rede enfrenta para evitar que ela memorize.

    "É como ensinar um computador a reconhecer um cachorro, "disse Renslow." Poderia simplesmente memorizar a imagem, mas você quer que a rede reconheça uma variedade de cães, então você pode virar a imagem de cabeça para baixo, estique um pouco, mude suas cores. Você perturba a imagem para que o programa seja forçado a generalizar e confiar no conhecimento e nas regras que aprendeu. "

    Ensinando a rede a aprender

    Para criar a rede, a equipe usou uma forma de inteligência artificial chamada aprendizagem por transferência, onde a rede aprende com um conjunto de dados e, em seguida, aplica seu conhecimento a outro conjunto de dados. O treinamento consistiu principalmente em três etapas:

    O programa examinou mais de 50 milhões de moléculas conhecidas no PubChem, aprender os conceitos básicos de química e como representar estruturas químicas matematicamente. Mas o banco de dados não tinha informações sobre CCS, uma medida crucial para a compreensão dos metabólitos.

    Então, a equipe expôs DarkChem a um conjunto de dados computacionais CCS desenvolvido por PNNL, cerca de 700, 000 moléculas. Isso ajudou a treinar o programa sobre como vincular as informações gerais que havia aprendido sobre a estrutura química ao CCS.

    Finalmente, a equipe ajustou a rede usando um pequeno, conjunto de dados robusto de cerca de 1, 000 estruturas químicas cujas medições CCS foram determinadas através de um trabalho árduo de laboratório.

    A capacidade de calcular CCS para moléculas desconhecidas - moléculas cuja única sugestão de existência pode ser uma linha fina de um experimento de espectrometria de massa - adiciona um recurso importante para ajudar os cientistas a diferenciar um metabólito de outro. Para iluminar a matéria molecular escura.

    "Cada dimensão que você adiciona oferece melhor poder de resolução, "disse Colby, que está ajudando a descobrir outras características moleculares possíveis para DarkChem analisar, como espectros infravermelhos, padrões de fragmentação, e dados de superfície acessíveis a solventes.

    É análogo a aprimorar nossa capacidade de identificar milhares de conhecidos no Facebook.

    "Você pode dizer que alguém é do sexo masculino e usa óculos, "disse Renslow." Mas se você puder acrescentar que ele tem 54 anos e dirige uma Mercedes vermelha, você restringe os candidatos.

    "Não é muito diferente com os metabólitos. Continuamos adicionando características que podemos medir, e, eventualmente, há apenas uma molécula no universo que se encaixa nessa combinação de dados, " ele adicionou.


    © Ciência https://pt.scienceaq.com