p O modelo de aprendizado de máquina Graph2Structure usa gráficos de compostos químicos (à esquerda) para prever suas coordenadas 3D (à direita). Crédito:Dominik Lemm, Universidade de viena
p As configurações 3D dos átomos ditam todas as propriedades dos materiais. Predições quantitativas de estruturas de equilíbrio precisas, Coordenadas 3D de todos os átomos, de um gráfico químico, uma representação da fórmula estrutural, é uma tarefa desafiadora e computacionalmente cara que está no início de praticamente todos os fluxos de trabalho de química computacional. Pesquisadores da Universidade de Viena desenvolveram agora um novo modelo baseado em aprendizado de máquina para atalhos de cálculos caros para prever estruturas diretamente a partir de gráficos. O novo método para "predições de moléculas de estrutura livre de energia com base em aprendizado de máquina, estados de transição, e sólidos "é apresentada na última edição da
Nature Communications . p Embora comumente descrito como rígido, compostos químicos são objetos tridimensionais flexíveis feitos de átomos que se movem e oscilam continuamente. Cyrus Levinthal observou já em 1969 que a grande quantidade de graus de liberdade dos compostos químicos leva formalmente a um número catastroficamente grande de conformações possíveis bem até 10, 300 (Paradoxon de Levinthal). Dentro das observações experimentais, Contudo, As configurações 3D de átomos correspondem a mínimos de energia livre bem definidos e, portanto, ditam todas as propriedades dos materiais. O paradigma de que a estrutura determina a função é a chave para determinar as interações medicamentosas, otimizar catalisadores ou reações, e descoberta de materiais. Como consequência, na maioria das campanhas de triagem computacional de alto rendimento (um método para experimentação científica rápida), apenas as configurações mais estáveis são procuradas. Dependendo do nível de sofisticação dentro das aproximações feitas ao estimar as estabilidades dos materiais, o custo computacional pode variar de minutos a horas ou mesmo dias para o cálculo de uma única estrutura. Dada a vastidão do espaço de compostos químicos, o espaço povoado por todos os compostos concebíveis (estimado em mais de 1, 060) esta relação custo-qualidade representa um grande gargalo no campo.
p Pesquisadores da Universidade de Viena liderados por Anatole von Lilienfeld abordaram esse problema de uma perspectiva diferente, desenvolver um novo método que aproveita os dados e é universalmente aplicável a qualquer tipo de produtos químicos. Seu novo método, Graph2Structure, usa dados de química quântica de alta qualidade para treinar modelos de aprendizado de máquina capazes de prever novas estruturas 3D para gráficos moleculares de compostos invisíveis. Este mapeamento direto de um gráfico molecular para uma configuração 3D específica permite que o modelo contorne efetivamente qualquer forma de minimização de energia, levando a uma aceleração de mais de um milhão em comparação com os métodos convencionais. "A possibilidade de gerar estruturas de alta qualidade não apenas acelera o projeto molecular de alto rendimento, mas também acelera o fluxo de trabalho diário, "diz o autor principal do estudo em
Nature Communications Dominik Lemm. "Gerando estruturas 3D de maneira confiável até mesmo para produtos químicos exóticos, como sistemas de shell aberto ou estados de transição, é uma das tarefas mais difíceis na simulação atomística. "
p Outras descobertas sugerem que as estruturas geradas podem ser usadas diretamente como uma entrada para avaliação subsequente de modelos de predição de propriedade baseados em aprendizado de máquina, ligando assim um gráfico molecular a uma propriedade dependente da estrutura de uma forma rigorosa e mais eficaz.