p O processo de previsão do tempo. Crédito:Li Haochen.
p A previsão do tempo é um problema típico de acoplamento de big data com modelos de processos físicos, de acordo com o Prof. Pingwen Zhang, um acadêmico da Academia Chinesa de Ciências, Diretor do Laboratório Nacional de Engenharia para Análise de Big Data e Tecnologia de Aplicação, Diretor do Centro de Ciência e Engenharia Computacional, Universidade de Pequim. O Prof. Zhang é o autor correspondente de um estudo colaborativo da Universidade de Pequim e do Instituto de Física Atmosférica, Academia Chinesa de Ciências. p De um modo geral, a previsão do tempo é uma prática amplamente bem-sucedida nas geociências e, hoje em dia, é inseparável da previsão numérica do tempo (NWP). Contudo, porque as saídas de NWP e observações contêm diferentes erros sistemáticos, uma "consulta meteorológica" é uma parte indispensável do processo para melhorar ainda mais a precisão das previsões.
p "Na verdade, o modelo físico baseado em teoria e o aprendizado de máquina baseado em dados são ferramentas complementares. Combinando essas duas abordagens, um sistema de consulta meteorológica inteligente pode ser construído para auxiliar o processo manual atual de consulta meteorológica, "diz o Prof. Zhang." Um dos desafios associados a isso é construir uma engenharia de recursos apropriada para ambos os tipos de informação para fazer uso completo dos dados. "
p Para resolver esses problemas, O Prof. Zhang e sua equipe propuseram o método "model output machine learning" (MOML) para simular a consulta do tempo, e esta pesquisa foi publicada recentemente em
Avanços nas Ciências Atmosféricas .
p MOML é um método de pós-processamento baseado em aprendizado de máquina, que combina as previsões do NWP com as observações por meio de uma função de regressão. Para testar a nova abordagem para previsões de temperatura da rede, a temperatura do ar de superfície de 2 m na área de Pequim foi empregada. O método MOML, com engenharia de recursos diferentes, foi comparado com a previsão do modelo ECMWF e o método de estatísticas de saída do modelo modificado (MOS). MOML mostrou melhor desempenho numérico do que o modelo ECMWF e MOS, especialmente para o inverno; a precisão ao usar MOML aumentou 27,91% e 15,52%, respectivamente.
p Os dados da consulta meteorológica são únicos, e incluem principalmente informações contidas nos dados do modelo NWP e nos dados observacionais. Eles têm diferentes estruturas de dados e recursos, o que torna a engenharia de recursos uma tarefa complicada. A qualidade da engenharia de recursos afeta diretamente o resultado final. O grupo de Zhang propôs vários esquemas de engenharia de recursos seguindo extensos experimentos numéricos. Esses esquemas garantem a eficiência do cálculo e foram empregados em estudos meteorológicos pela primeira vez. O Prof. Zhang destaca que o método MOML permite que os dados observacionais participem diretamente do cálculo, e usa as informações de alta e baixa frequência dos dados para tornar os resultados da previsão mais precisos. O método MOML proposto neste estudo pode ser aplicado à previsão do tempo durante os próximos Jogos Olímpicos de Inverno de 2022, esperançosamente fornecendo mais preciso, serviços inteligentes e eficientes de previsão do tempo para este evento internacional.
p O aprendizado de máquina e o aprendizado profundo oferecem diversas ferramentas para previsões do tempo na era do big data, mas também existem muitos desafios em aplicações práticas.
p "É uma importante direção de pesquisa futura incorporar dados de previsão do tempo e modelos acoplados em uma estrutura de computação híbrida para explorar e estudar a estrutura e os recursos de dados observacionais e NWP, e propor algoritmos de aprendizado de máquina baseados em dados adequados para previsão do tempo, “O Prof. Zhang conclui.