• Home
  • Química
  • Astronomia
  • Energia
  • Natureza
  • Biologia
  • Física
  • Eletrônicos
  •  science >> Ciência >  >> Astronomia
    Um novo pipeline de detecção de anomalias para sistemas de recomendação e descoberta astronômica

    Localização de três campos ZTF analisados ​​neste trabalho com candidatos a anomalias marcadas. Crédito:Maria Pruzhinskaya (2020)

    A equipe SNAD, uma rede internacional formada por pesquisadores da Rússia, França e EUA, desenvolveu um pipeline para encontrar objetos raros e exóticos entre os montes de feno de dados de pesquisas astronômicas.

    Dado o tamanho cada vez maior dos conjuntos de dados astronômicos, mesmo que nossos telescópios detectem fenômenos astronômicos inesperados e interessantes, é muito improvável que sejamos capazes de reconhecê-los no meio de milhões ou mesmo bilhões de observações. A solução está em ferramentas automáticas projetadas especificamente para reconhecer comportamentos incomuns ocultos entre bilhões de medições. Algumas dessas ferramentas já existem e são utilizadas, por exemplo, para identificar atividades fraudulentas de cartão de crédito entre milhões de transações todos os dias. Contudo, sua adaptação aos dados científicos não é direta devido a complicações decorrentes da natureza das observações em astronomia. A equipe SNAD trabalha há 3 anos no desenvolvimento e adaptações dessas soluções ao contexto da astronomia.

    Durante sua última reunião anual, o grupo concentrou seus esforços em objetos cujo brilho varia com o tempo. O pipeline combina os pontos fortes dos algoritmos de aprendizado de máquina e o conhecimento insubstituível de especialistas humanos para construir uma ferramenta robusta de detecção de anomalias. O artigo descreve os resultados da aplicação dessa estrutura ao terceiro lançamento de dados do Zwicky Transient Facility. Seu processo de três estágios envolveu a extração de recursos em curvas de luz (que rastreia o brilho dos objetos ao longo do tempo), procure candidatos a anomalias usando vários algoritmos de aprendizado de máquina e filtragem manual de candidatos por um especialista humano. Esta última etapa também incluiu a realização de observações com outros telescópios sempre que possível. Neste estudo, 4 algoritmos de aprendizagem automática foram usados ​​para sinalizar 277 candidatos a anomalias para investigação humana - de um conjunto de dados inicial de 2,25 milhões de objetos.

    O grupo também desenvolveu uma interface web especialmente projetada que permitiu a visualização imediata e o cruzamento de cada candidato com os catálogos astronômicos existentes. Isso foi construído para facilitar o trabalho dos especialistas que precisam correlacionar os candidatos a anomalias com qualquer outra informação publicamente disponível sobre as coordenadas do céu sob investigação.

    Ocultação de uma estrela de fundo pelo asteróide de Barcelona, encontrado pela equipe SNAD entre os dados ZTF DR3. Crédito:Vadim Krushinsky (2020)

    Dos 277 objetos considerados anômalos pela máquina, 188 (68%) foram encontrados para exibir características incomuns devido a efeitos não astrofísicos (incluindo defeitos devido ao pipeline de subtração de imagem da ZTF), 66 (24%) eram objetos já catalogados antes e 23 (8%) eram objetos até então desconhecidos. A primeira categoria inclui algumas curiosidades divertidas e os dois últimos casos de interesse científico. Por exemplo, um objeto sinalizado como anomalia pela máquina era na verdade a ocultação de uma estrela de fundo pelo asteróide de Barcelona, que, do ponto de vista de um observador da Terra, foi detectado como uma fonte pontual variável quando, na realidade, nem a estrela nem o asteróide realmente mudaram de brilho. Os autores também caracterizaram artefatos de subtração de imagem exóticos e recorrentes que interferem na análise da curva de luz e podem enganar um pipeline de detecção de anomalia fazendo-o pensar que é real, objeto anômalo. Para ajudar a separar rapidamente a primeira turma dos candidatos restantes, eles foram capazes de identificar uma relação bidimensional simples que pode ser usada para auxiliar na filtragem de curvas de luz potencialmente falsas em estudos futuros.

    Entre a segunda e terceira categorias, os autores encontraram quatro candidatos a supernovas, seis binários eclipsantes não classificados anteriormente, quatro candidatos pré-sequência principal, um possível sinalizador de anã vermelha, e espectroscopicamente confirmou uma estrela RS Canum Venaticorum, entre outros candidatos a anomalias.

    Separar rapidamente e sem esforço artefatos de candidatos a anomalias interessantes é crucial para observatórios atuais e próximos da próxima geração, como o Vera Rubin Observatory Legacy Survey of Space and Time (LSST). O LSST irá gerar cerca de 10 milhões de fontes transitórias por noite - algoritmos sofisticados e robustos serão necessários para filtrar todos os dados para que objetos inesperados e interessantes não sejam perdidos, e os cientistas podem entender melhor essas esquisitices espaciais.

    Autor principal Konstantin Malanchev, pesquisador da Universidade de Illinois em Urbana-Champaign (EUA) e do instituto astronômico Sternberg de Lomonosov Moscou (Rússia), diz, "Projetar ferramentas especificamente dedicadas à pesquisa de anomalias astrofisicamente interessantes é nossa única opção para garantir a exploração total dos conjuntos de dados que lutamos tanto para adquirir. A equipe SNAD está totalmente empenhada em ajudar a comunidade astronômica a explorar todo o potencial dos conjuntos de dados futuros . "

    O artigo foi aceito para publicação em Avisos mensais da Royal Astronomical Society e também está disponível publicamente como uma pré-impressão. O código-fonte e os resultados, incluindo uma lista completa de objetos com potencial aplicação científica, bem como as técnicas de pipeline, estão abertos ao público para o benefício e verificação da comunidade astronômica.


    © Ciência https://pt.scienceaq.com