• Home
  • Química
  • Astronomia
  • Energia
  • Natureza
  • Biologia
  • Física
  • Eletrônicos
  •  science >> Ciência >  >> Química
    Os pesquisadores usam a técnica de aprendizado de máquina para avaliar rapidamente novos compostos de metais de transição

    Os resultados de uma análise de rede neural artificial (RNA) podem não ser confiáveis ​​para moléculas muito diferentes daquelas nas quais a RNA foi treinada. As nuvens pretas mostradas aqui cobrem complexos de metais de transição no conjunto de dados cujas representações numéricas estão muito distantes daquelas dos complexos de treinamento para serem consideradas confiáveis. Crédito:Massachusetts Institute of Technology

    Nos últimos anos, O aprendizado de máquina tem se mostrado uma ferramenta valiosa para identificar novos materiais com propriedades otimizadas para aplicações específicas. Trabalhando com grandes, conjuntos de dados bem definidos, os computadores aprendem a realizar uma tarefa analítica para gerar uma resposta correta e então usam a mesma técnica em um conjunto de dados desconhecido.

    Embora essa abordagem tenha guiado o desenvolvimento de novos materiais valiosos, eles são principalmente compostos orgânicos, notas Heather Kulik Ph.D. '09, professor assistente de engenharia química. Kulik se concentra em compostos inorgânicos, em particular, aqueles baseados em metais de transição, uma família de elementos (incluindo ferro e cobre) que possuem propriedades únicas e úteis. Nesses compostos - conhecidos como complexos de metais de transição - o átomo de metal ocorre no centro com braços quimicamente ligados, ou ligantes, feito de carbono, hidrogênio, azoto, ou átomos de oxigênio irradiando para fora.

    Os complexos de metais de transição já desempenham papéis importantes em áreas que vão desde o armazenamento de energia até a catálise para a fabricação de produtos químicos finos - por exemplo, para produtos farmacêuticos. Mas Kulik acredita que o aprendizado de máquina pode expandir ainda mais seu uso. De fato, seu grupo tem trabalhado não apenas para aplicar o aprendizado de máquina aos inorgânicos - um empreendimento novo e desafiador - mas também para usar a técnica para explorar novos territórios. "Estávamos interessados ​​em entender até que ponto poderíamos levar nossos modelos para fazer descobertas - para fazer previsões sobre compostos que não foram vistos antes, "diz Kulik.

    Sensores e computadores

    Nos últimos quatro anos, Kulik e Jon Paul Janet, um estudante de graduação em engenharia química, têm se concentrado em complexos de metais de transição com "spin" - uma propriedade da mecânica quântica dos elétrons. Usualmente, elétrons ocorrem em pares, um com spin up e outro com spin down, então eles se cancelam e não há rotação da rede. Mas em um metal de transição, elétrons podem ser desemparelhados, e o spin líquido resultante é a propriedade que torna complexos inorgânicos de interesse, diz Kulik. "Ajustar o grau de desemparelhamento dos elétrons nos dá um botão exclusivo para as propriedades de ajuste."

    Um determinado complexo tem um estado de spin preferido. Mas adicione um pouco de energia - digamos, da luz ou do calor - e pode mudar para outro estado. No processo, ele pode exibir alterações nas propriedades da macroescala, como tamanho ou cor. Quando a energia necessária para causar a inversão - chamada de energia de divisão do spin - é próxima de zero, o complexo é um bom candidato para uso como sensor, ou talvez como um componente fundamental em um computador quântico.

    Os químicos sabem de muitas combinações de metal-ligante com energias de divisão de spin perto de zero, tornando-os potenciais complexos "spin-crossover" (SCO) para tais aplicações práticas. Mas o conjunto completo de possibilidades é vasto. A energia de divisão de spin de um complexo de metal de transição é determinada por quais ligantes são combinados com um determinado metal, e há quase infinitos ligantes para escolher. O desafio é encontrar novas combinações com a propriedade desejada para se tornarem SCOs - sem recorrer a milhões de testes de tentativa e erro em um laboratório.

    Tradução de moléculas em números

    A maneira padrão de analisar a estrutura eletrônica das moléculas é usando um método de modelagem computacional chamado teoria do funcional da densidade, ou DFT. Os resultados de um cálculo DFT são bastante precisos, especialmente para sistemas orgânicos, mas realizar um cálculo para um único composto pode levar horas, ou mesmo dias. Em contraste, uma ferramenta de aprendizado de máquina chamada rede neural artificial (RNA) pode ser treinada para realizar a mesma análise e, em seguida, fazê-lo em apenas alguns segundos. Como resultado, As RNAs são muito mais práticas para procurar possíveis SCOs no enorme espaço de complexos viáveis.

    Este gráfico representa um exemplo de complexo de metal de transição. Um complexo de metal de transição consiste em um átomo de metal de transição central (laranja) rodeado por uma série de moléculas orgânicas quimicamente ligadas em estruturas conhecidas como ligantes. Crédito:Massachusetts Institute of Technology

    Como uma RNA requer uma entrada numérica para operar, o primeiro desafio dos pesquisadores foi encontrar uma maneira de representar um determinado complexo de metal de transição como uma série de números, cada um descrevendo uma propriedade selecionada. Existem regras para definir representações para moléculas orgânicas, onde a estrutura física de uma molécula diz muito sobre suas propriedades e comportamento. Mas quando os pesquisadores seguiram essas regras para complexos de metais de transição, não funcionou. "A ligação metal-orgânico é muito difícil de acertar, "diz Kulik." Existem propriedades únicas da ligação que são mais variáveis. Existem muitas outras maneiras que os elétrons podem escolher para formar uma ligação. ”Portanto, os pesquisadores precisaram criar novas regras para definir uma representação que pudesse ser preditiva em química inorgânica.

    Usando o aprendizado de máquina, eles exploraram várias maneiras de representar um complexo de metal de transição para analisar a energia de divisão de spin. Os resultados foram melhores quando a representação deu mais ênfase às propriedades do centro do metal e da conexão metal-ligante e menos ênfase às propriedades dos ligantes mais distantes. Interessantemente, seus estudos mostraram que representações que deram mais ênfase igual no geral funcionaram melhor quando o objetivo era prever outras propriedades, como o comprimento da ligação ligante-metal ou a tendência de aceitar elétrons.

    Testando a RNA

    Como um teste de sua abordagem, Kulik e Janet - assistidos por Lydia Chan, um estagiário de verão da Troy High School em Fullerton, Califórnia - definiu um conjunto de complexos de metais de transição com base em quatro metais de transição - cromo, manganês, ferro, e cobalto - em dois estados de oxidação com 16 ligantes (cada molécula pode ter até dois). Ao combinar esses blocos de construção, eles criaram um "espaço de busca" de 5, 600 complexos - alguns deles familiares e bem estudados, e alguns deles totalmente desconhecidos.

    Em trabalhos anteriores, os pesquisadores treinaram uma RNA em milhares de compostos que eram bem conhecidos na química dos metais de transição. Para testar a capacidade da RNA treinada de explorar um novo espaço químico para encontrar compostos com as propriedades visadas, eles tentaram aplicá-lo ao pool de 5, 600 complexos, 113 dos quais tinha visto no estudo anterior.

    O resultado foi o gráfico denominado "Figura 1" na apresentação de slides acima, que classifica os complexos em uma superfície conforme determinado pela RNA. As regiões brancas indicam complexos com energias de divisão de spin dentro de 5 quilo-calorias por mol de zero, o que significa que eles são potencialmente bons candidatos ao SCO. As regiões vermelha e azul representam complexos com energias de divisão de spin muito grandes para serem úteis. Os diamantes verdes que aparecem na inserção mostram complexos que têm centros de ferro e ligantes semelhantes - em outras palavras, compostos relacionados cujas energias de cruzamento de spin devem ser semelhantes. Seu aparecimento na mesma região da trama é uma evidência da boa correspondência entre a representação dos pesquisadores e as propriedades-chave do complexo.

    Mas há um problema:nem todas as previsões de divisão de spin são precisas. Se um complexo for muito diferente daqueles em que a rede foi treinada, a análise da ANN pode não ser confiável - um problema padrão ao aplicar modelos de aprendizado de máquina para descoberta em ciência de materiais ou química, observa Kulik. Usando uma abordagem que parecia bem-sucedida em seu trabalho anterior, os pesquisadores compararam as representações numéricas para os complexos de treinamento e teste e descartaram todos os complexos de teste onde a diferença era muito grande.

    Focando nas melhores opções

    Realizando a análise ANN de todos os 5, 600 complexos demoraram apenas uma hora. Mas no mundo real, o número de complexos a serem explorados poderia ser milhares de vezes maior - e qualquer candidato promissor exigiria um cálculo DFT completo. Os pesquisadores, portanto, precisavam de um método de avaliação de um grande conjunto de dados para identificar quaisquer candidatos inaceitáveis ​​mesmo antes da análise da RNA. Para esse fim, eles desenvolveram um algoritmo genético - uma abordagem inspirada pela seleção natural - para pontuar complexos individuais e descartar aqueles considerados inadequados.

    Uma rede neural artificial previamente treinada em compostos bem conhecidos analisados ​​5, 600 complexos de metais de transição para identificar potenciais complexos de spin-crossover. O resultado foi este enredo, em que os complexos são coloridos com base em sua energia de divisão de spin em quilocalorias por mol (kcal / mol). Em candidatos promissores, essa energia está dentro de 5 kcal / mol de zero. Os diamantes verdes brilhantes na inserção são complexos relacionados. Crédito:Massachusetts Institute of Technology

    Para pré-selecionar um conjunto de dados, o algoritmo genético primeiro seleciona aleatoriamente 20 amostras do conjunto completo de complexos. Em seguida, atribui uma pontuação de "aptidão" a cada amostra com base em três medidas. Primeiro, sua energia de spin-crossover é baixa o suficiente para ser um bom SCO? Descobrir, a rede neural avalia cada um dos 20 complexos. Segundo, o complexo está muito longe dos dados de treinamento? Se então, a energia de cruzamento de spin da ANN pode ser imprecisa. E finalmente, o complexo está muito próximo dos dados de treinamento? Se então, os pesquisadores já executaram um cálculo DFT em uma molécula semelhante, portanto, o candidato não tem interesse na busca por novas opções.

    Com base em sua avaliação de três partes dos primeiros 20 candidatos, o algoritmo genético descarta as opções inadequadas e salva as mais adequadas para a próxima rodada. Para garantir a diversidade dos compostos salvos, o algoritmo exige que alguns deles sofram uma pequena mutação. Um complexo pode ser atribuído a um novo, ligante selecionado aleatoriamente, ou dois complexos promissores podem trocar ligantes. Afinal, se um complexo parece bom, então, algo muito semelhante poderia ser ainda melhor - e o objetivo aqui é encontrar novos candidatos. O algoritmo genético então adiciona alguns novos, complexos escolhidos aleatoriamente para preencher o segundo grupo de 20 e realizar sua próxima análise. Ao repetir este processo um total de 21 vezes, produz 21 gerações de opções. Assim, prossegue através do espaço de busca, permitindo que os candidatos mais aptos sobrevivam e se reproduzam, e os impróprios para morrer.

    Realizando a análise de 21 gerações em 5, Conjunto de dados complexos de 600 necessários pouco mais de cinco minutos em um computador desktop padrão, e rendeu 372 derivações com uma boa combinação de alta diversidade e confiança aceitável. Os pesquisadores então usaram DFT para examinar 56 complexos escolhidos aleatoriamente entre essas ligações, e os resultados confirmaram que dois terços deles poderiam ser bons SCOs.

    Embora uma taxa de sucesso de dois terços possa não parecer muito boa, os pesquisadores destacam dois pontos. Primeiro, sua definição do que poderia fazer um bom SCO era muito restritiva:para um complexo sobreviver, sua energia de divisão de spin tinha que ser extremamente pequena. E em segundo lugar, dado um espaço de 5, 600 complexos e nada para continuar, quantas análises DFT seriam necessárias para encontrar 37 derivações? Como Janet observa, "Não importa quantas avaliamos com a rede neural, porque é muito barata. São os cálculos DFT que levam tempo."

    Melhor de todos, usar sua abordagem permitiu aos pesquisadores encontrar alguns candidatos SCO não convencionais que não teriam sido pensados ​​com base no que foi estudado no passado. "Existem regras que as pessoas têm - heurísticas em suas cabeças - sobre como construir um complexo spin-crossover, "diz Kulik." Nós mostramos que você pode encontrar combinações inesperadas de metais e ligantes que não são normalmente estudados, mas podem ser promissores como candidatos para crossover de spin. "

    Compartilhando as novas ferramentas

    Para apoiar a busca mundial por novos materiais, os pesquisadores incorporaram o algoritmo genético e RNA em "molSimplify, "o grupo está online, kit de ferramentas de software de código aberto que qualquer pessoa pode baixar e usar para construir e simular complexos de metal de transição. Para ajudar usuários em potencial, o site fornece tutoriais que demonstram como usar os principais recursos dos códigos de software de fonte aberta. O desenvolvimento do molSimplify começou com financiamento da MIT Energy Initiative em 2014, e todos os alunos do grupo de Kulik contribuíram para isso desde então.

    Os pesquisadores continuam a melhorar sua rede neural para investigar SCOs em potencial e publicar versões atualizadas do molSimplify. Enquanto isso, outros no laboratório de Kulik estão desenvolvendo ferramentas que podem identificar compostos promissores para outras aplicações. Por exemplo, uma importante área de enfoque é o design do catalisador. O aluno de graduação em química Aditya Nandy está se concentrando em encontrar um catalisador melhor para converter o gás metano em um combustível líquido mais fácil de manusear, como o metanol - um problema particularmente desafiador. "Agora temos uma molécula externa entrando, e nosso complexo - o catalisador - tem que agir sobre essa molécula para realizar uma transformação química que ocorre em uma série de etapas, "diz Nandy." O aprendizado de máquina será muito útil para descobrir os parâmetros de projeto importantes para um complexo de metal de transição que tornará cada etapa desse processo energeticamente favorável. "

    Esta história foi republicada por cortesia do MIT News (web.mit.edu/newsoffice/), um site popular que cobre notícias sobre pesquisas do MIT, inovação e ensino.




    © Ciência https://pt.scienceaq.com