Uma análise assistida por IA da distribuição tridimensional de galáxias em nosso universo
Fluxograma de funcionamento do emulador desenvolvido pela equipe de pesquisa. Crédito:Kavli IPMU, NAOJ
Ao aplicar uma técnica de aprendizado de máquina, um método de rede neural, a quantidades gigantescas de dados de simulação sobre a formação de estruturas cósmicas no universo, uma equipe de pesquisadores desenvolveu um programa de software muito rápido e altamente eficiente que pode fazer previsões teóricas sobre a estrutura formação. Ao comparar as previsões do modelo com conjuntos de dados observacionais reais, a equipe conseguiu medir com precisão os parâmetros cosmológicos, relata um estudo em
Revisão Física D .
Quando o maior levantamento de galáxias até hoje no mundo, o Sloan Digital Sky Survey (SDSS), criou um mapa tridimensional do universo através da distribuição observada de galáxias, ficou claro que as galáxias tinham certas características. Algumas se aglomeravam ou se espalhavam em filamentos, e em alguns lugares havia vazios onde não existiam galáxias. Todas essas galáxias do show não evoluíram de maneira uniforme, elas se formaram como resultado de seu ambiente local. Em geral, os pesquisadores concordam que essa distribuição não uniforme de galáxias é por causa dos efeitos da gravidade causados pela distribuição de matéria escura "invisível", a matéria misteriosa que ninguém ainda observou diretamente.
Ao estudar os dados no mapa tridimensional de galáxias em detalhes, os pesquisadores puderam descobrir as quantidades fundamentais, como a quantidade de matéria escura no universo. Nos anos mais recentes, simulações de N-corpos têm sido amplamente utilizadas em estudos que recriam a formação de estruturas cósmicas no universo. Essas simulações imitam as heterogeneidades iniciais em altos desvios para o vermelho por um grande número de partículas de N-corpos que efetivamente representam partículas de matéria escura e, em seguida, simulam como a distribuição de matéria escura evolui ao longo do tempo, calculando as forças de atração gravitacional entre partículas em um universo em expansão. No entanto, as simulações geralmente são caras, levando dezenas de horas para serem concluídas em um supercomputador, mesmo para um modelo cosmológico.
Distribuição de cerca de 1 milhão de galáxias observadas pelo Sloan Digital Sky Survey (canto superior esquerdo) e uma imagem ampliada da fina região retangular (canto inferior esquerdo). Isso pode ser comparado à distribuição de matéria escura invisível prevista pela simulação de supercomputador assumindo o modelo cosmológico que nossa IA deriva (canto superior direito). O canto inferior direito mostra a distribuição de galáxias simuladas que são formadas em regiões com alta densidade de matéria escura. A distribuição de galáxias prevista compartilha os padrões característicos, como aglomerados de galáxias, filamentos e vazios vistos nos dados reais do SDSS. Crédito:Takahiro Nishimichi
Uma equipe de pesquisadores, liderada pelo ex-Kavli Institute for the Physics and Mathematics of the Universe (Kavli IPMU) Pesquisador do Projeto Yosuke Kobayashi (atualmente Associado de Pesquisa de Pós-Doutorado na Universidade do Arizona), e incluindo Kavli IPMU Professor Masahiro Takada e Kavli IPMU Visiting Scientists Takahiro Nishimichi e Hironao Miyatake, combinaram aprendizado de máquina com dados de simulação numérica pelo supercomputador "ATERUI II" no Observatório Astronômico Nacional do Japão (NAOJ) para gerar cálculos teóricos do espectro de potência, a quantidade mais fundamental medida em pesquisas de galáxias que informa aos pesquisadores estatisticamente como as galáxias são distribuídas no universo.
Normalmente, vários milhões de simulações de N-corpos precisariam ser executadas, mas a equipe de Kobayashi conseguiu usar o aprendizado de máquina para ensinar seu programa a calcular o espectro de potência com o mesmo nível de precisão de uma simulação, mesmo para um modelo cosmológico para o qual a simulação ainda não havia sido executada. Essa tecnologia é chamada de Emulador e já está sendo usada em áreas de ciência da computação fora da astronomia.
"Ao combinar aprendizado de máquina com simulações numéricas, que custam muito, conseguimos analisar dados de observações astronômicas com alta precisão. Esses emuladores já foram usados em estudos de cosmologia antes, mas quase ninguém conseguiu levar em conta os inúmeros outros efeitos, o que comprometeria os resultados dos parâmetros cosmológicos usando dados reais de pesquisa de galáxias. Nosso emulador faz e tem sido capaz de analisar dados de observações reais. Este estudo abriu uma nova fronteira para a análise de dados estruturais em larga escala", disse o principal autor Kobayashi .
No entanto, para aplicar o emulador aos dados reais de pesquisa de galáxias, a equipe teve que levar em conta a incerteza do "viés da galáxia", uma incerteza levando em consideração que os pesquisadores não podem prever com precisão onde as galáxias se formam no universo por causa de sua física complicada inerente à formação de galáxias. .
Para superar essa dificuldade, a equipe se concentrou em simular a distribuição de “halos” de matéria escura, onde há alta densidade de matéria escura e alta probabilidade de formação de galáxias. A equipe conseguiu fazer uma previsão de modelo flexível para um determinado modelo cosmológico, introduzindo um número suficiente de parâmetros "incômodos" para levar em consideração a incerteza do viés da galáxia.
Uma comparação do mapa de galáxias tridimensional do Sloan Digital Sky Survey e os resultados gerados pelo Emulador desenvolvido por Kobayashi et al. O eixo x mostra a fração de matéria no universo atual, o eixo y mostra os parâmetros físicos correspondentes à aglomeração do universo atual (quanto maior o número, mais galáxias existem nesse universo). As bandas azul claro e azul escuro correspondem a 68% e 95% de confiança, e dentro desta área mostra a probabilidade de que aqui exista um valor real do universo. A faixa laranja corresponde aos resultados do SSDS. Crédito:Yosuke Kobayashi
Em seguida, a equipe comparou a previsão do modelo com um conjunto de dados real do SDSS e mediu com sucesso os parâmetros cosmológicos com alta precisão. Confirma como uma análise independente que apenas cerca de 30 por cento de toda a energia vem da matéria (principalmente matéria escura), e que os 70 por cento restantes são o resultado da energia escura causando a expansão acelerada do universo. Eles também conseguiram medir a aglomeração da matéria em nosso universo, enquanto o método convencional usado para analisar os mapas 3D da galáxia não foi capaz de determinar esses dois parâmetros simultaneamente.
A precisão de sua medição de parâmetros excede a obtida pelas análises anteriores de pesquisas de galáxias. Esses resultados demonstram a eficácia do emulador desenvolvido neste estudo. O próximo passo para a equipe de pesquisa será continuar a estudar a massa da matéria escura e a natureza da energia escura aplicando seu emulador a mapas de galáxias que serão capturados pelo Prime Focus Spectrograph, em desenvolvimento, liderado pelo Kavli IPMU, a ser montado no Telescópio Subaru do NAOJ.
+ Explorar mais Ferramenta de inteligência artificial desenvolvida para prever a estrutura do universo