Impressão do artista sobre a arquitetura de aprendizado de máquina que codifica explicitamente a simetria de calibre para uma teoria de campo de rede 2D. Crédito:colaboração MIT-DeepMind.
O modelo padrão da física de partículas descreve todas as partículas elementares conhecidas e três das quatro forças fundamentais que governam o universo; tudo exceto a gravidade. Essas três forças - eletromagnéticas, Forte, e fraco - governa como as partículas são formadas, como eles interagem, e como as partículas decaem.
Estudar partículas e física nuclear dentro desta estrutura, Contudo, é difícil, e depende de estudos numéricos em grande escala. Por exemplo, muitos aspectos da força forte requerem simular numericamente a dinâmica na escala de 1/10 a 1/100 do tamanho de um próton para responder a questões fundamentais sobre as propriedades dos prótons, nêutrons, e núcleos.
"Em última análise, somos limitados computacionalmente no estudo de prótons e estrutura nuclear usando a teoria de campos de rede, "diz o professor assistente de física Phiala Shanahan." Existem muitos problemas interessantes que sabemos como resolver, em princípio, mas simplesmente não temos computação suficiente, embora operemos nos maiores supercomputadores do mundo. "
Para ultrapassar essas limitações, Shanahan lidera um grupo que combina física teórica com modelos de aprendizado de máquina. Em seu artigo "Amostragem baseada em fluxo equivariante para teoria de calibre de rede, "publicado este mês em Cartas de revisão física , eles mostram como a incorporação das simetrias das teorias da física em arquiteturas de aprendizado de máquina e inteligência artificial pode fornecer algoritmos muito mais rápidos para a física teórica.
"Estamos usando o aprendizado de máquina para não analisar grandes quantidades de dados, mas para acelerar a teoria dos primeiros princípios de uma forma que não comprometa o rigor da abordagem, "Shanahan diz." Este trabalho em particular demonstrou que podemos construir arquiteturas de aprendizado de máquina com algumas das simetrias do Modelo Padrão de partículas e física nuclear incorporadas, e acelerar o problema de amostragem que estamos almejando em ordens de magnitude. "
Shanahan lançou o projeto com o estudante de pós-graduação do MIT Gurtej Kanwar e com Michael Albergo, que agora está na NYU. O projeto foi expandido para incluir os pós-doutorandos do Centro de Física Teórica Daniel Hackett e Denis Boyda, Professor Kyle Cranmer da NYU, e cientistas de aprendizado de máquina com experiência em física no Google Deep Mind, Sébastien Racanière e Danilo Jimenez Rezende.
O artigo deste mês é um de uma série que visa possibilitar estudos em física teórica que atualmente são intratáveis computacionalmente. "Nosso objetivo é desenvolver novos algoritmos para um componente-chave dos cálculos numéricos em física teórica, "diz Kanwar." Esses cálculos nos informam sobre o funcionamento interno do Modelo Padrão da física de partículas, nossa teoria mais fundamental da matéria. Esses cálculos são de vital importância para comparar os resultados de experimentos de física de partículas, como o Large Hadron Collider no CERN, tanto para restringir o modelo com mais precisão quanto para descobrir onde o modelo falha e deve ser estendido para algo ainda mais fundamental. "
O único método conhecido sistematicamente controlável de estudar o Modelo Padrão da física de partículas no regime não perturbativo é baseado em uma amostragem de instantâneos de flutuações quânticas no vácuo. Ao medir as propriedades dessas flutuações, uma vez pode inferir propriedades das partículas e colisões de interesse.
Essa técnica vem com desafios, Kanwar explica. "Esta amostragem é cara, e queremos usar técnicas de aprendizado de máquina inspiradas na física para desenhar amostras com muito mais eficiência, ", diz ele." O aprendizado de máquina já fez grandes avanços na geração de imagens, Incluindo, por exemplo, trabalho recente da NVIDIA para gerar imagens de rostos 'sonhados' por redes neurais. Pensando nesses instantâneos do vácuo como imagens, pensamos que é bastante natural recorrer a métodos semelhantes para o nosso problema. "
Adiciona Shanahan, "Em nossa abordagem para amostrar esses instantâneos quânticos, otimizamos um modelo que nos leva de um espaço de fácil amostragem para o espaço de destino:dado um modelo treinado, a amostragem é então eficiente, pois você só precisa obter amostras independentes no espaço fácil de amostrar, e transformá-los por meio do modelo aprendido. "
Em particular, o grupo introduziu uma estrutura para a construção de modelos de aprendizado de máquina que respeitam exatamente uma classe de simetrias, chamado de "simetrias de calibre, "crucial para estudar física de alta energia.
Como prova de princípio, Shanahan e colegas usaram sua estrutura para treinar modelos de aprendizado de máquina para simular uma teoria em duas dimensões, resultando em ganhos de eficiência de ordens de magnitude em relação às técnicas de última geração e previsões mais precisas da teoria. Isso abre caminho para uma pesquisa significativamente acelerada sobre as forças fundamentais da natureza, usando o aprendizado de máquina baseado em física.
Os primeiros artigos do grupo como uma colaboração discutiram a aplicação da técnica de aprendizado de máquina a uma teoria de campo de rede simples, e desenvolveu esta classe de abordagens compactas, variedades conectadas que descrevem as teorias de campo mais complicadas do Modelo Padrão. Agora eles estão trabalhando para dimensionar as técnicas para cálculos de última geração.
"Acho que mostramos no ano passado que é muito promissor combinar o conhecimento da física com as técnicas de aprendizado de máquina, "diz Kanwar." Estamos pensando ativamente em como lidar com as barreiras restantes na forma de realizar simulações em grande escala usando nossa abordagem. Espero ver a primeira aplicação desses métodos a cálculos em escala nos próximos anos. Se formos capazes de superar os últimos obstáculos, isso promete estender o que podemos fazer com recursos limitados, e sonho em realizar cálculos em breve que nos dêem novos insights sobre o que está além de nossa melhor compreensão da física hoje. "
Essa ideia de aprendizado de máquina baseado em física também é conhecida pela equipe como "ab-initio AI, "um tema-chave do recém-lançado Instituto Nacional da Fundação de Ciência para Inteligência Artificial e Interações Fundamentais (IAIFI), com base no MIT, onde Shanahan é coordenador de pesquisa de teoria da física.