• Home
  • Química
  • Astronomia
  • Energia
  • Natureza
  • Biologia
  • Física
  • Eletrônicos
  •  science >> Ciência >  >> Natureza
    Um novo método para identificar rapidamente outliers nos dados de monitoramento da qualidade do ar
    p Os instrumentos de monitoramento PM2.5 no Laboratório Estadual de Física da Camada Limite Atmosférica e Química Atmosférica (LAPC), Instituto de Física Atmosférica, Academia Chinesa de Ciências. Crédito:TANG Xiao

    p Os dados de monitoramento da qualidade do ar ambiente constituem a fonte mais importante para a conscientização pública sobre a qualidade do ar, e são amplamente utilizados em muitos campos de pesquisa, como melhorar a previsão da qualidade do ar e a análise de episódios de neblina. Contudo, existem outliers entre esses dados de monitoramento, devido a mau funcionamento do instrumento, a influência de ambientes hostis, e a limitação dos métodos de medição. p Na prática, a inspeção manual é freqüentemente aplicada para identificar esses outliers. Contudo, conforme a quantidade de dados cresce rapidamente, este método torna-se cada vez mais complicado.

    p Para lidar com o problema, Dr. Wu Huangjian e Professor Associado Tang Xiao do Instituto de Física Atmosférica, Academia Chinesa de Ciências, propor um método de detecção de valores discrepantes totalmente automático com base na probabilidade de resíduos. O método adota vários métodos de regressão, e os resíduos da regressão são usados ​​para discriminar outliers. Com base nos desvios padrão dos resíduos, probabilidades dos resíduos podem ser calculadas, e as observações com pequenas probabilidades são marcadas como outliers e removidas por um programa de computador. Suas descobertas são publicadas em Avanços nas Ciências Atmosféricas .

    p "Ao introduzir as probabilidades de resíduos, várias regras podem ser usadas para identificar outliers na mesma estrutura, "diz o Dr. Wu." Por exemplo, assumindo que os resíduos de regressão espacial e regressão temporal obedecem a uma distribuição normal bivariada, consistências espacial e temporal podem ser avaliadas simultaneamente para melhor identificação de outliers ”.

    p O método pode sinalizar dados potencialmente errados nas observações de hora em hora de 1436 estações do Centro Nacional de Monitoramento Ambiental da China (CNEMC) em um minuto. De fato, tem sido usado no sistema de previsão da qualidade do ar do CNEMC, e será integrado ao sistema de gerenciamento de dados. A esperança é que os dados discrepantes nos dados de qualidade do ar em tempo real do sistema sejam removidos em um futuro próximo.

    p O método é publicado em Avanços nas Ciências Atmoféricas .


    © Ciência https://pt.scienceaq.com