• Home
  • Química
  • Astronomia
  • Energia
  • Natureza
  • Biologia
  • Física
  • Eletrônicos
  •  science >> Ciência >  >> Astronomia
    Como um cientista estabeleceu um sistema de alerta precoce para explosões solares de dois estágios

    A visualização de quatro feições durante a existência de uma região ativa. O eixo x representa o tempo e sua unidade é uma amostra, onde “0” representa o tempo de início de uma região ativa, e o intervalo de tempo entre tempos adjacentes é de 1,5 h. O eixo y representa o valor de um recurso. As linhas azuis indicam que não haverá erupção solar nas próximas 48 horas, e as linhas amarelas são o oposto. Crédito:Espaço:Ciência e Tecnologia

    As erupções solares são eventos de tempestades solares impulsionadas pelo campo magnético na área de atividade solar. Quando esta radiação de flare chega à vizinhança da Terra, a foto-ionização aumenta a densidade de elétrons na camada D da ionosfera, causando absorção de comunicação de rádio de alta frequência, cintilação de comunicação por satélite e interferência de ruído de fundo aprimorada com radar.
    As estatísticas e a experiência mostram que quanto maior a erupção, maior a probabilidade de ser acompanhada por outras explosões solares, como um evento de prótons solares, e mais graves serão os efeitos sobre a Terra, afetando voos espaciais, comunicação, navegação, transmissão de energia e outros sistemas tecnológicos.

    Fornecer informações de previsão sobre a probabilidade e intensidade de surtos de erupções é um elemento importante no início da previsão operacional do clima espacial. O estudo de modelagem da previsão de erupções solares é uma parte necessária da previsão precisa de erupções e tem um importante valor de aplicação. Em um artigo de pesquisa publicado recentemente em Space:Science &Technology , Hong Chen, da Faculdade de Ciências da Universidade Agrícola de Huazhong, combinou o algoritmo de agrupamento k-means e vários modelos da CNN para construir um sistema de alerta que pode prever se uma erupção solar ocorreria nas próximas 48 horas.

    Primeiro, o autor apresentou os dados usados ​​no artigo e os analisou do ponto de vista estatístico para fornecer uma base para o projeto do sistema de alerta de erupções solares. Para reduzir o efeito de projeção, o centro da região ativa localizada a ±30° do centro do disco solar foi selecionado. Depois disso, o autor rotulou os dados de acordo com os dados de erupções solares fornecidos pela NOAA, incluindo os horários de início e término das erupções, o número da região ativa, a magnitude das erupções, etc.

    Houve um sério desequilíbrio entre o número de amostras positivas e negativas no conjunto de dados. Para aliviar o desequilíbrio de amostras positivas e negativas, foi encontrado um princípio para selecionar os eventos que têm amostras positivas tanto quanto possível. O autor visualizou a distribuição de densidade de probabilidade de cada característica em todas as amostras negativas e todas as amostras positivas. Pode ser facilmente encontrado que as distribuições de densidade de probabilidade das amostras negativas eram todas distribuições com assimetria negativa e as características das amostras positivas eram geralmente maiores do que as das amostras negativas. Assim, foi possível filtrar eventos com amostras positivas pelos valores das características de cada evento.

    Em seguida, o autor construiu todo o pipeline com um método contendo as duas etapas a seguir:pré-processamento de dados e treinamento do modelo. Para realizar o pré-processamento de dados, K-means, um método de agrupamento não supervisionado, foi usado para agrupar eventos para diminuir ao máximo os eventos que incluem apenas amostras negativas.

    Após o agrupamento k-means, todos os eventos foram divididos em três categorias, a saber, categoria A, categoria B e categoria C. O autor descobriu que a proporção de amostras positivas na categoria C é de 0,340633, que é muito maior que a de todo o conjunto de dados. Portanto, apenas os dados da categoria C foram escolhidos como dados de entrada na próxima etapa do algoritmo.

    Na 2ª etapa, as redes neurais utilizadas pelo autor foram Resnet18, Resnet34 e Xception, que são comumente utilizadas em deep learning. Três quartos das amostras na categoria C foram escolhidos aleatoriamente. Em cada evento foram dados de treinamento para os modelos de rede neural e o restante das amostras foram consideradas como dados de validação no processo de treinamento do modelo.

    Para evitar a influência da dimensão, o autor também padronizou os dados originais. O método de padronização foi diferente dos comumente usados. De acordo com a fórmula de cálculo de padronização, se o rótulo de uma amostra fosse previsto como 1 pela rede neural, essa amostra era considerada um sinal de erupção solar que ocorreria nas próximas 48 horas. Mas se for previsto que seja 0, a probabilidade de ocorrer uma erupção solar nas próximas 48 horas seria tão pequena que poderia ser ignorada.

    Em seguida, o autor realizou experimentos e discutiu os resultados. O autor primeiro fez uma introdução à configuração experimental e, em seguida, realizou vários experimentos de ablação e comparações com diferentes modelos para verificar a melhoria do algoritmo de agrupamento k-means e da estratégia de reforço. Além disso, o autor também fez comparações entre o método utilizado no experimento e outros 13 algoritmos de classificação binária comumente usados ​​para apresentar seu desempenho de predição.

    Os resultados experimentais mostraram que o desempenho de previsão do modelo que integrou várias redes neurais foi melhor do que o de uma única rede neural convolucional. Finalmente, os resultados de previsão de Resnet18, Resnet34 e Xception foram combinados por meio de estratégia de reforço. Para todas as redes, o recall pode permanecer inalterado ou até mesmo bastante reduzido após o agrupamento. No entanto, a precisão estava destinada a aumentar significativamente.

    Após o agrupamento, embora a taxa de amostras positivas fosse muito melhorada, de 5% para 34%, cerca de 40% das informações de amostras positivas também seriam perdidas. O autor achava que essa era a principal razão pela qual a recordação permaneceu inalterada ou até diminuiu. Isso também significava que o número de amostras positivas previstas no experimento era menor do que aquele sem agrupamento, mas a probabilidade de que uma amostra positiva prevista fosse um verdadeiro positivo era maior.

    Em contraste com o fenômeno de que o desempenho de previsão de outros métodos de classificação binária estava diminuindo ou mesmo muito ruim após o agrupamento, o desempenho do método do autor melhorou em mais de 9% após o agrupamento. Em conclusão, o sistema de alerta precoce de erupção solar de dois estágios consistiu em um algoritmo de agrupamento não supervisionado (k-means) e vários modelos CNN, onde o primeiro foi para aumentar a taxa de amostragem positiva, e o último integrou os resultados de previsão dos modelos CNN para melhorar o desempenho da previsão.

    Os resultados do experimento comprovaram a eficácia do método. + Explorar mais

    Como o cientista aplicou o algoritmo de recomendação para antecipar os horários de chegada das CMEs




    © Ciência https://pt.scienceaq.com