Ilustração de um quasar ativo. Novas pesquisas mostram que a IA pode identificá-los e classificá-los. Crédito:ESO/M. Kornmesser A inteligência artificial e o aprendizado de máquina tornaram-se onipresentes, com aplicações que vão desde análise de dados, segurança cibernética, desenvolvimento farmacêutico, composição musical e representações artísticas.
Nos últimos anos, também surgiram grandes modelos de linguagem (LLMs), acrescentando a interação humana e a escrita à longa lista de aplicações. Isso inclui o ChatGPT, um LLM que teve um impacto profundo desde que foi lançado, há menos de dois anos. Esta aplicação gerou um debate considerável (e controvérsia) sobre os potenciais usos e implicações da IA.
A astronomia também se beneficiou imensamente, onde o aprendizado de máquina é usado para classificar grandes volumes de dados em busca de sinais de trânsitos planetários, corrigir interferências atmosféricas e encontrar padrões no ruído. De acordo com uma equipe internacional de astrofísicos, este pode ser apenas o começo do que a IA poderia fazer pela astronomia.
Em um estudo recente, a equipe ajustou um modelo de Transformador Pré-treinado Generativo (GPT) usando observações de objetos astronômicos. No processo, eles demonstraram com sucesso que os modelos GPT podem auxiliar efetivamente na pesquisa científica.
O estudo foi conduzido pela Rede Internacional do Centro de Astrofísica Relativística (ICRANet), um consórcio internacional formado por pesquisadores do Centro Internacional de Astrofísica Relativística (ICRA), do Instituto Nacional de Astrofísica (INAF), da Universidade de Ciência e Tecnologia de China, o Instituto de Física de Altas Energias da Academia Chinesa de Ciências (CAS-IHEP), a Universidade de Pádua, a Universidade de Tecnologia de Isfahan e a Universidade de Ferrera.
O artigo deles, "A IA pode entender nosso universo? Teste de ajuste fino do GPT por dados astrofísicos", foi postado recentemente no arXiv servidor de pré-impressão.
Conforme mencionado, os astrônomos dependem extensivamente de algoritmos de aprendizado de máquina para classificar os volumes de dados obtidos por telescópios e instrumentos modernos. Esta prática começou há cerca de uma década e desde então tem crescido aos trancos e barrancos até ao ponto em que a IA foi integrada em todo o processo de investigação. Como o presidente da ICRA e principal autor do estudo, Yu Wang, disse ao Universe Today por e-mail:
"A astronomia sempre foi impulsionada por dados e os astrônomos são alguns dos primeiros cientistas a adotar e empregar o aprendizado de máquina. Agora, o aprendizado de máquina foi integrado a todo o processo de pesquisa astronômica, desde a fabricação e controle de equipamentos terrestres e espaciais. telescópios (por exemplo, otimizando o desempenho de sistemas de óptica adaptativa, melhorando o início de ações específicas (gatilhos) de satélites sob certas condições, etc.), à análise de dados (por exemplo, redução de ruído, imputação de dados, classificação, simulação, etc.) , e o estabelecimento e validação de modelos teóricos (por exemplo, teste de gravidade modificada, restrição da equação de estado de estrelas de nêutrons, etc.)."
A análise de dados continua sendo a mais comum entre essas aplicações, pois é a área mais fácil onde o aprendizado de máquina pode ser integrado. Tradicionalmente, dezenas de investigadores e centenas de cientistas cidadãos analisavam os volumes de dados produzidos por uma campanha de observação.
No entanto, isto não é prático numa época em que os telescópios modernos recolhem terabytes de dados diariamente. Isso inclui pesquisas de todo o céu, como o Very Large Array Sky Survey (VLASS) e as muitas fases conduzidas pelo Sloan Digital Sky Survey (SDSS).
Até à data, os LLMs só foram aplicados esporadicamente à investigação astronómica, visto que são uma criação relativamente recente. Mas, de acordo com proponentes como Wang, teve um tremendo impacto social e tem um potencial inferior equivalente a uma “Revolução Industrial”.
Quanto ao limite superior, Wang prevê que poderá variar consideravelmente e talvez resultar na “iluminação ou destruição” da humanidade. No entanto, ao contrário da Revolução Industrial, o ritmo da mudança e da integração é muito mais rápido para a IA, levantando questões sobre até onde irá a sua adoção.
Para determinar seu potencial para o campo da astronomia, disse Wang, ele e seus colegas adotaram um modelo GPT pré-treinado e o ajustaram para identificar fenômenos astronômicos:
"O OpenAI fornece modelos pré-treinados, e o que fizemos foi um ajuste fino, que envolve alterar alguns parâmetros com base no modelo original, permitindo-lhe reconhecer dados astronômicos e calcular resultados a partir desses dados. Isso é como se o OpenAI nos fornecesse um estudante de graduação, que então treinamos para se tornar um estudante de pós-graduação em astronomia.
"Fornecemos dados limitados com resolução modesta e treinamos o GPT menos vezes em comparação com os modelos normais. No entanto, os resultados são impressionantes, alcançando uma precisão de cerca de 90%. Este alto nível de precisão pode ser atribuído à base robusta do GPT, que já entende o processamento de dados e possui capacidades de inferência lógica, bem como habilidades de comunicação."
Para afinar o seu modelo, a equipa introduziu observações de vários fenómenos astronómicos derivados de vários catálogos. Isso incluiu 2.000 amostras de quasares, galáxias, estrelas e quasares de linha de absorção ampla (BAL) do SDSS (500 cada). Eles também integraram observações de explosões de raios gama (GRBs) curtas e longas, galáxias, estrelas e simulações de buracos negros. Quando testado, o seu modelo classificou com sucesso diferentes fenómenos, distinguiu entre tipos de quasares, inferiu a sua distância com base no desvio para o vermelho e mediu a rotação e a inclinação dos buracos negros.
“Este trabalho demonstra pelo menos que os LLMs são capazes de processar dados astronômicos”, disse Wang. "Além disso, a capacidade de um modelo para lidar com vários tipos de dados astronômicos é uma capacidade não possuída por outros modelos especializados. Esperamos que os LLMs possam integrar vários tipos de dados e então identificar princípios subjacentes comuns para nos ajudar a compreender o mundo. Claro , esta é uma tarefa desafiadora e não uma tarefa que os astrônomos possam realizar sozinhos."
Claro, a equipe reconhece que o conjunto de dados que experimentaram era muito pequeno em comparação com a produção de dados dos observatórios modernos. Isto é particularmente verdadeiro no caso de instalações de próxima geração, como o Observatório Vera C. Rubin, que recebeu recentemente a sua câmara LSST, a maior câmara digital do mundo!
Assim que o Rubin estiver operacional, ele conduzirá a Pesquisa Legada de Espaço e Tempo (LSST) de 10 anos, que deverá produzir 15 terabytes de dados por noite! Satisfazer as exigências de campanhas futuras, diz Wang, exigirá melhorias e colaboração entre observatórios e empresas profissionais de IA.
No entanto, é uma conclusão precipitada que haverá mais aplicações de LLM para astronomia num futuro próximo. Este não é apenas um desenvolvimento provável, mas também necessário, considerando os grandes volumes de dados que os estudos astronómicos estão a gerar hoje. E como é provável que isto aumente exponencialmente num futuro próximo, a IA provavelmente se tornará indispensável para o campo de estudo.