p Crédito:Georgia Institute of Technology
p Big data e mineração de dados proporcionaram vários avanços em campos como informática em saúde, cidades inteligentes e marketing. As mesmas técnicas, Contudo, não entregaram descobertas importantes consistentes para as mudanças climáticas. p Existem alguns motivos para isso. A principal delas é que a mineração de dados anterior funciona na ciência do clima, e, em particular na análise de teleconexões climáticas, confiou em métodos que oferecem respostas simplistas do tipo "sim ou não".
p "Não é tão simples no clima, "disse Annalisa Bracco, professor da Escola de Ciências da Terra e Atmosféricas da Georgia Tech. "Mesmo conexões fracas entre regiões muito diferentes do globo podem resultar de um fenômeno físico subjacente. A imposição de limites e o descarte de conexões fracas interromperiam tudo. Em vez disso, a experiência de um cientista do clima é a etapa chave para encontrar semelhanças entre conjuntos de dados ou campos muito diferentes para explorar o quão robustos eles são. "
p E com milhões de pontos de dados espalhados pelo mundo, Bracco disse que os modelos atuais dependem muito da experiência humana para dar sentido ao resultado. Ela e seus colegas queriam desenvolver uma metodologia que dependesse mais de dados reais do que da interpretação de um pesquisador.
p É por isso que a equipe da Georgia Tech desenvolveu uma nova maneira de extrair dados de conjuntos de dados climáticos que é mais independente do que as ferramentas tradicionais. A metodologia traz semelhanças de conjuntos de dados sem tanto conhecimento do usuário, permitindo que os cientistas confiem nos dados e obtenham resultados mais robustos - e transparentes.
p A metodologia é de código aberto e atualmente está disponível para cientistas de todo o mundo. Os pesquisadores da Georgia Tech já estão usando para explorar a temperatura da superfície do mar e dados de campo de nuvens, dois aspectos que afetam profundamente o clima do planeta.
p "Existem tantos fatores - dados em nuvem, aerossóis e campos de vento, por exemplo, que interagem para gerar clima e impulsionar mudanças climáticas, "disse Athanasios Nenes, outro professor de clima da Faculdade de Ciências do projeto. "Dependendo do aspecto do modelo em que você se concentra, eles podem reproduzir as características do clima com eficácia - ou não reproduzir. Às vezes é muito difícil dizer se um modelo é realmente melhor do que outro ou se ele prevê o clima pelas razões certas. "
p Nenes diz que a metodologia Georgia Tech analisa tudo de uma forma mais robusta, quebrando o gargalo típico de outros algoritmos de avaliação e análise de modelo. A metodologia, ele diz, pode ser usado para observações, e os cientistas não precisam saber nada sobre códigos e modelos de computador.
p "A metodologia reduz a complexidade de milhões de pontos de dados ao essencial - às vezes, apenas 10 regiões que interagem entre si, "disse Nenes." Precisamos de ferramentas que reduzam a complexidade da saída do modelo para entendê-los melhor e avaliar se estão fornecendo os resultados corretos pelos motivos certos. "
p Para desenvolver a metodologia, os cientistas do clima fizeram parceria com Constantine Dovrolis e outros cientistas de dados do College of Computing da Georgia Tech. Dovrolis disse que é emocionante aplicar o pensamento algorítmico e computacional em problemas que afetam a todos de maneiras importantes, como o aquecimento global. "
p "A ciência do clima é uma disciplina com grande volume de dados, com muitas questões intelectualmente interessantes que podem se beneficiar da modelagem e previsão computacional, "disse Dovrolis, professor da Escola de Ciência da Computação, "Colaborações interdisciplinares são desafiadoras no início - cada disciplina tem sua própria linguagem, abordagem preferida e cultura de pesquisa - mas podem ser bastante gratificantes no final. "
p O papel, "Avançar a ciência do clima com descoberta de conhecimento por meio de mineração de dados, "é publicado em
Clima e Ciência Atmosférica .