A geração automatizada de conjuntos de dados fornece uma amostragem altamente diversificada de posições atômicas para treinar um modelo de aprendizado de máquina geral e preciso. Crédito:Laboratório Nacional de Los Alamos
Uma abordagem revolucionária de aprendizado de máquina (ML) para simular os movimentos dos átomos em materiais como o alumínio é descrita no Nature Communications Diário. Esta abordagem automatizada para "desenvolvimento de potencial interatômico" pode transformar o campo da descoberta de materiais computacionais.
"Esta abordagem promete ser um bloco de construção importante para o estudo de danos e envelhecimento de materiais a partir dos primeiros princípios, "disse o líder do projeto, Justin Smith, do Laboratório Nacional de Los Alamos." Simular a dinâmica dos átomos em interação é a base para a compreensão e o desenvolvimento de novos materiais. Os métodos de aprendizado de máquina estão fornecendo aos cientistas computacionais novas ferramentas para conduzir com precisão e eficiência essas simulações atomísticas. Modelos de aprendizado de máquina como este são projetados para emular os resultados de simulações quânticas altamente precisas, por uma pequena fração do custo computacional. "
Para maximizar a precisão geral desses modelos de aprendizado de máquina, ele disse, é essencial projetar um conjunto de dados altamente diversificado a partir do qual treinar o modelo. Um desafio é que não é óbvio, a priori, quais dados de treinamento serão mais necessários para o modelo de ML. O trabalho recente da equipe apresenta uma metodologia automatizada de "aprendizado ativo" para construir iterativamente um conjunto de dados de treinamento.
Em cada iteração, o método usa o melhor modelo de aprendizado de máquina atual para realizar simulações atomísticas; quando novas situações físicas são encontradas que estão além do conhecimento do modelo de ML, novos dados de referência são coletados por meio de simulações quânticas caras, e o modelo de ML é retreinado. Através deste processo, o procedimento de aprendizado ativo coleta dados sobre muitos tipos diferentes de configurações atômicas, incluindo uma variedade de estruturas cristalinas, e uma variedade de padrões de defeitos que aparecem dentro dos cristais.