Um iterativo, processo de várias etapas para treinar uma rede neural, conforme ilustrado no canto superior esquerdo, leva a uma avaliação das compensações entre duas qualidades concorrentes, conforme ilustrado no gráfico ao centro. A linha azul representa a chamada frente de Pareto, definir os casos além dos quais a seleção de materiais não pode ser melhorada. Isso torna possível identificar categorias específicas de novos materiais promissores, como aquele representado pelo diagrama molecular à direita. Crédito:Massachusetts Institute of Technology
Ao pesquisar listas teóricas de possíveis novos materiais para aplicações específicas, como baterias ou outros dispositivos relacionados à energia, muitas vezes existem milhões de materiais potenciais que podem ser considerados, e vários critérios que precisam ser atendidos e otimizados ao mesmo tempo. Agora, pesquisadores do MIT encontraram uma maneira de agilizar drasticamente o processo de descoberta, usando um sistema de aprendizado de máquina.
Como demonstração, a equipe chegou a um conjunto dos oito materiais mais promissores, de quase 3 milhões de candidatos, para um sistema de armazenamento de energia denominado bateria de fluxo. Este processo de seleção levaria 50 anos por métodos analíticos convencionais, eles dizem, mas eles conseguiram em cinco semanas.
Os resultados são relatados no jornal ACS Central Science , em um artigo do professor de engenharia química do MIT, Heather Kulik, Jon Paul Janet Ph.D. 19, Sahasrajit Ramesh, e o estudante de graduação Chenru Duan.
O estudo analisou um conjunto de materiais chamados complexos de metais de transição. Eles podem existir em um grande número de formas diferentes, e Kulik diz que eles "são realmente fascinantes, materiais funcionais que são diferentes de muitas outras fases materiais. A única maneira de entender por que eles funcionam dessa maneira é estudá-los usando a mecânica quântica. "
Para prever as propriedades de qualquer um dos milhões desses materiais exigiria espectroscopia demorada e intensiva em recursos e outros trabalhos de laboratório, ou demorado, modelagem de computador baseada na física altamente complexa para cada material candidato possível ou combinação de materiais. Cada um desses estudos pode consumir horas a dias de trabalho.
Em vez de, Kulik e sua equipe pegaram um pequeno número de diferentes materiais possíveis e os usaram para ensinar uma rede neural de aprendizado de máquina avançada sobre a relação entre as composições químicas dos materiais e suas propriedades físicas. Esse conhecimento foi então aplicado para gerar sugestões para a próxima geração de materiais possíveis a serem usados na próxima rodada de treinamento da rede neural. Por meio de quatro iterações sucessivas deste processo, a rede neural melhorou significativamente a cada vez, até chegar a um ponto em que estava claro que novas iterações não produziriam mais melhorias.
Esse sistema de otimização iterativa simplificou muito o processo de obtenção de soluções potenciais que atendessem aos dois critérios conflitantes buscados. Esse tipo de processo de encontrar as melhores soluções em situações, onde melhorar um fator tende a piorar o outro, é conhecido como uma frente de Pareto, representando um gráfico dos pontos de forma que qualquer melhoria adicional de um fator tornaria o outro pior. Em outras palavras, o gráfico representa os melhores pontos de compromisso possíveis, dependendo da importância relativa atribuída a cada fator.
O treinamento de redes neurais típicas requer conjuntos de dados muito grandes, variando de milhares a milhões de exemplos, mas Kulik e sua equipe foram capazes de usar esse processo iterativo, baseado no modelo frontal de Pareto, para agilizar o processo e fornecer resultados confiáveis usando apenas algumas centenas de amostras.
No caso de triagem para os materiais da bateria de fluxo, as características desejadas estavam em conflito, como costuma acontecer:O material ideal teria alta solubilidade e alta densidade de energia (a capacidade de armazenar energia para um determinado peso). Mas aumentar a solubilidade tende a diminuir a densidade de energia, e vice versa.
Não só a rede neural foi capaz de rapidamente apresentar candidatos promissores, também foi capaz de atribuir níveis de confiança a suas diferentes previsões em cada iteração, o que ajudou a permitir o refinamento da seleção da amostra em cada etapa. "Desenvolvemos uma técnica de quantificação de incerteza melhor do que a melhor da classe para realmente saber quando esses modelos iriam falhar, "Kulik diz.
O desafio que eles escolheram para o teste de prova de conceito foram os materiais para uso em baterias de fluxo redox, um tipo de bateria que promete para grandes, baterias em escala de grade que podem desempenhar um papel significativo em permitir a limpeza, energia renovável. Complexos de metais de transição são a categoria preferida de materiais para essas baterias, Kulik diz, mas existem muitas possibilidades para avaliar por meios convencionais. Eles começaram com uma lista de 3 milhões de complexos antes de finalmente reduzir para os oito bons candidatos, junto com um conjunto de regras de design que devem permitir aos experimentalistas explorar o potencial desses candidatos e suas variações.
"Por meio desse processo, a rede neural fica cada vez mais inteligente sobre o espaço [design], mas também cada vez mais pessimista de que qualquer coisa além do que já caracterizamos pode melhorar ainda mais o que já sabemos, " ela diz.
Além dos complexos de metais de transição específicos sugeridos para uma investigação mais aprofundada usando este sistema, ela diz, o método em si poderia ter aplicações muito mais amplas. "Nós o vemos como uma estrutura que pode ser aplicada a qualquer desafio de design de materiais onde você realmente está tentando abordar vários objetivos ao mesmo tempo. todos os desafios de design de materiais mais interessantes são aqueles em que você tem algo que está tentando melhorar, mas melhorar isso piora outro. E para nós, o par redox da bateria de fluxo redox foi apenas uma boa demonstração de onde achamos que podemos chegar com esse aprendizado de máquina e descoberta de materiais acelerada. "
Por exemplo, otimizar catalisadores para vários processos químicos e industriais é outro tipo de pesquisa de materiais complexos, Kulik diz. Os catalisadores usados atualmente muitas vezes envolvem elementos raros e caros, portanto, encontrar compostos igualmente eficazes com base em materiais abundantes e baratos pode ser uma vantagem significativa.
"Este artigo representa, Eu acredito, a primeira aplicação de melhoria multidimensional direcionada nas ciências químicas, "diz ela. Mas o significado de longo prazo do trabalho está na própria metodologia, por causa de coisas que poderiam não ser possíveis de outra forma. "Você começa a perceber que mesmo com cálculos paralelos, esses são casos em que não teríamos criado um princípio de design de outra maneira. E essas ligações que estão saindo do nosso trabalho, essas não são necessariamente ideias que já eram conhecidas da literatura ou que um especialista teria sido capaz de apontar para você. "
"Esta é uma bela combinação de conceitos em estatística, matemática aplicada, e ciências físicas que serão extremamente úteis em aplicações de engenharia, "diz George Schatz, professor de química e de engenharia química e biológica na Northwestern University, que não estava associado a este trabalho. Ele diz que esta pesquisa aborda "como fazer aprendizado de máquina quando há vários objetivos. A abordagem de Kulik usa métodos de ponta para treinar uma rede neural artificial que é usada para prever qual combinação de íons de metal de transição e ligantes orgânicos será melhor para a bateria de fluxo redox eletrólitos. "
Schatz diz, "This method can be used in many different contexts, so it has the potential to transform machine learning, which is a major activity around the world."
Esta história foi republicada por cortesia do MIT News (web.mit.edu/newsoffice/), um site popular que cobre notícias sobre pesquisas do MIT, inovação e ensino.