Estes são os pixels de detecção de elétrons e jatos de quark produzidos por uma colisão de prótons simulada, medido pelo detector ATLAS. Crédito:Taylor Childers
Embora a física de alta energia e a cosmologia pareçam mundos à parte em termos de escala, físicos e cosmologistas da Argonne estão usando métodos de aprendizado de máquina semelhantes para resolver problemas de classificação de partículas subatômicas e galáxias.
A física de alta energia e a cosmologia parecem mundos à parte em termos de escala, mas os componentes invisíveis que compõem o campo de um informam a composição e dinâmica do outro - estrelas em colapso, nebulosas nascentes de estrelas e, possivelmente, matéria escura.
Por décadas, as técnicas pelas quais os pesquisadores de ambos os campos estudaram seus domínios pareciam quase incompatíveis, também. A física de alta energia se baseou em aceleradores e detectores para obter alguns insights das interações energéticas das partículas, enquanto os cosmologistas olhavam através de todos os tipos de telescópios para desvendar os segredos do universo.
Embora nenhum tenha desistido do equipamento fundamental de seu campo particular, físicos e cosmologistas do Laboratório Nacional de Argonne do Departamento de Energia dos Estados Unidos (DOE) estão atacando problemas complexos em várias escalas usando várias formas de uma técnica de inteligência artificial chamada aprendizado de máquina.
Já usado em vários campos, o aprendizado de máquina pode ajudar a identificar padrões ocultos, aprendendo a partir de dados de entrada e melhorando progressivamente as previsões sobre novos dados. Pode ser aplicado a tarefas de classificação visual ou na reprodução rápida de cálculos complicados e computacionalmente caros.
Com o potencial de transformar radicalmente a forma como a ciência é conduzida, essas técnicas de IA nos ajudarão a compreender melhor a distribuição das galáxias em todo o universo ou a visualizar melhor a formação de novas partículas a partir das quais podemos inferir uma nova física.
"Ao longo das décadas, desenvolvemos algoritmos tradicionais que reconstroem as assinaturas das várias partículas nas quais estamos interessados, "disse Taylor Childers, um físico de partículas e um cientista da computação com o Argonne Leadership Computing Facility (ALCF), um DOE Office of Science User Facility.
"Demorou muito para desenvolvê-los e são muito precisos, "acrescentou." Mas, ao mesmo tempo, seria interessante saber se as técnicas de classificação de imagens de aprendizado de máquina usadas com sucesso pelo Google e pelo Facebook podem simplificar ou encurtar o desenvolvimento de algoritmos que identificam assinaturas de partículas em nossos detectores 3-D. "
Childers trabalha com físicos de alta energia de Argonne, todos membros da colaboração experimental ATLAS no Large Hadron Collider (LHC) do CERN, o maior e mais poderoso colisor de partículas do mundo. Procurando resolver uma ampla gama de problemas de física, o detector ATLAS tem oito andares de altura e 150 pés de comprimento em um ponto em torno do anel colisor de circunferência de 17 milhas do LHC, onde mede os produtos de prótons colidindo em velocidades próximas à velocidade da luz.
De acordo com o site da ATLAS, "mais de um bilhão de interações de partículas ocorrem no detector ATLAS a cada segundo, uma taxa de dados equivalente a 20 conversas telefônicas simultâneas mantidas por todas as pessoas na Terra. "
Embora apenas uma pequena porcentagem dessas colisões seja considerada digna de estudo - cerca de um milhão por segundo - ainda fornece uma montanha de dados para os cientistas investigarem.
Essas colisões de partículas de alta velocidade criam novas partículas em seu rastro, como elétrons ou chuvas de quark, cada um deixando uma assinatura única no detector. São essas assinaturas que Childers gostaria de identificar por meio do aprendizado de máquina.
Entre os desafios está a captura dessas assinaturas de energia como imagens em um espaço 3-D complexo. Uma foto, por exemplo, é essencialmente uma representação 2-D de dados 3-D com posições verticais e horizontais. Os dados de pixel, as cores da imagem, são orientados espacialmente e têm informações espaciais codificadas neles - por exemplo, os olhos de um gato estão próximos ao nariz, e as orelhas estão acima à esquerda e à direita.
"Portanto, a orientação espacial deles é importante. O mesmo vale para as imagens que tiramos no LHC. À medida que uma partícula atravessa nosso detector, ele deixa uma assinatura de energia em padrões espaciais que são específicos para as diferentes partículas, "explicou Childers.
Adicione a isso a quantidade de dados codificados não apenas nas assinaturas, mas o espaço 3-D em torno deles. Onde exemplos tradicionais de aprendizado de máquina para reconhecimento de imagem - aqueles gatos, novamente - lidar com centenas de milhares de pixels, As imagens do ATLAS contêm centenas de milhões de pixels detectores.
Então, a ideia, ele disse, é tratar as imagens do detector como imagens tradicionais. Usando uma técnica de aprendizado de máquina chamada redes neurais convolucionais - que aprendem como os dados estão espacialmente relacionados - eles podem extrair o espaço 3-D para identificar mais facilmente características de partículas específicas.
A imagem mostra um anel de Einstein (meio à direita) formado por lentes gravitacionais de uma galáxia em formação de estrelas (azul) por uma massiva galáxia vermelha luminosa (laranja). Este sistema foi descoberto pela primeira vez pelo Sloan Digital Sky Survey em 2007; as imagens são do Telescópio Espacial Hubble. Crédito:NASA
Childers espera que esses algoritmos de aprendizado de máquina eventualmente substituam os algoritmos tradicionais feitos à mão, reduzindo muito o tempo que leva para processar quantidades semelhantes de dados, bem como melhorando a precisão dos resultados medidos.
"Também podemos substituir o desenvolvimento de uma década necessário para novos detectores e reduzi-lo com novos modelos de treinamento para futuros detectores, " ele disse.
Um espaço maior
Os cosmologistas de Argonne estão usando métodos de aprendizado de máquina semelhantes para resolver problemas de classificação, mas em uma escala muito maior.
"O problema com a cosmologia é que os objetos que estamos olhando são complicados e confusos, "disse Salman Habib, Diretor da Divisão de Ciência da Computação da Argonne e Diretor Adjunto Interino da divisão de Física de Altas Energias. "Portanto, descrever os dados de uma maneira mais simples se torna muito difícil."
Ele e seus colegas estão aproveitando supercomputadores em Argonne e outros laboratórios nacionais do DOE para reconstruir as particularidades do universo, galáxia por galáxia. Eles estão criando catálogos de galáxias simulados altamente detalhados que podem ser usados para comparação com dados reais obtidos de telescópios de pesquisa, como o Large Synoptic Survey Telescope, uma parceria entre o DOE e a National Science Foundation.
Mas para tornar esses ativos valiosos para os pesquisadores, eles devem estar o mais próximos possível da realidade.
Algoritmos de aprendizado de máquina, Habib disse, são muito bons em escolher recursos que podem ser facilmente caracterizados pela geometria - como aqueles gatos. Ainda, semelhante ao aviso nos espelhos de veículos, os objetos nos céus nem sempre são como parecem.
Considere o fenômeno das lentes gravitacionais fortes; a distorção de uma fonte de luz de fundo - uma galáxia ou um aglomerado de galáxias - por uma massa interveniente. O desvio das trajetórias dos raios de luz da fonte devido à gravidade leva a uma distorção da forma da fonte de fundo, posição e orientação; esta distorção fornece informações sobre a distribuição em massa do objeto interveniente. A situação de observação real não é tão simples, Contudo.
Um blob completamente redondo que tem lente, por exemplo, pode parecer esticado em uma direção ou outra, enquanto uma rodada, objeto em forma de disco sem lente pode parecer elíptico se visto parcialmente na borda.
"Então, como você sabe se o objeto que você está olhando não é um objeto redondo que foi girado, ou um que foi fotografado? ", perguntou Habib." Esses são os tipos de coisas complicadas que o aprendizado de máquina precisa ser capaz de descobrir. "
Para fazer isso, pesquisadores criam uma amostra de treinamento de milhões de objetos de aparência realista, metade dos quais são lentes. Os algoritmos de aprendizado de máquina então realizam o trabalho de tentar aprender as diferenças entre os objetos com e sem lente. Os resultados são verificados em um conjunto conhecido de objetos com e sem lente sintéticos.
Mas os resultados contam apenas metade da história - quão bem os algoritmos funcionam em dados de teste. Para aumentar ainda mais sua precisão para dados reais, pesquisadores misturam alguma porcentagem de dados sintéticos com dados observados anteriormente e executam os algoritmos, novamente, comparando o quão bem eles escolheram objetos com lente na amostra de treinamento versus os dados de combinação.
"No fim, você pode descobrir que funciona razoavelmente bem, mas talvez não tão bem quanto você deseja, "explicou Habib." Você pode dizer 'OK, esta informação por si só não vai ser suficiente, Eu preciso coletar mais. ' É um processo bastante longo e complexo. "
Dois objetivos principais da cosmologia moderna, ele disse, devem entender por que a expansão do universo está se acelerando e qual é a natureza da matéria escura. A matéria escura é cerca de cinco vezes mais abundante que a matéria normal, mas sua origem última permanece misteriosa. Para chegar remotamente perto de uma resposta, a ciência deve ser muito deliberada, muito preciso.
"No estágio atual, Não acho que possamos resolver todos os nossos problemas com aplicativos de aprendizado de máquina, "admitiu Habib." Mas eu diria que o aprendizado de máquina será muito importante para todos os aspectos da cosmologia de precisão no futuro próximo. "
Conforme as técnicas de aprendizado de máquina são desenvolvidas e refinadas, sua utilidade para a física e cosmologia de alta energia certamente crescerá exponencialmente, proporcionando a esperança de novas descobertas ou novas interpretações que alteram nossa compreensão do mundo em múltiplas escalas.