A nuvem de plataforma de uma tempestade se aproxima do campus da Iowa State. Crédito:Bill Gallus
Bill Gallus é conhecido por perseguir uma ou duas tempestades de verão. Mas ele não teve que ir atrás deste.
Em 17 de julho, 2019, uma tempestade se aproximou do campus da Iowa State University. Gallus, professor de ciências geológicas e atmosféricas, dirigiu-se ao telhado acima de seu escritório no Edifício Agronomia. E ele não se esqueceu de uma câmera.
Uma de suas fotos mostra uma nuvem de prateleira marcando a borda de fortes ventos de tempestade. A linha distinta da nuvem corta a foto ao meio, baixo, afiado e imponente, sem fofura aqui. A normalmente movimentada Osborn Drive fora de seu escritório está quase vazia - algumas pessoas na rua estão viradas para o norte-noroeste, de olho na tempestade.
"A suavidade e a baixa elevação de uma nuvem de plataforma tornam-na uma visão impressionante de se observar, "Gallus escreveu uma descrição da foto." Ela se forma à medida que o ar frio que se move rapidamente dentro de uma tempestade se espalha, levantando o ar úmido e quente rapidamente acima dele. "
Todos nós vimos dezenas de tempestades. E o Serviço Meteorológico Nacional obedientemente mantém registros de cada um e classifica sua força em seu banco de dados de Relatórios de Tempestades. Para uma tempestade ser marcada como "severa, " por exemplo, deve produzir um tornado, granizo maior que 1 polegada de diâmetro ou ventos maiores que 58 mph.
Mas a maioria das tempestades não atinge os instrumentos de sopro. Portanto, os meteorologistas fizeram estimativas de vento com base nos danos da tempestade, como árvores derrubadas, telhados destruídos ou galpões derrubados. E na maioria das vezes, quando esse tipo de dano causado pelo vento foi relatado, tempestades foram simplesmente classificadas como severas, sem medições reais apoiando a designação.
Isso é um problema para pesquisadores como Gallus, que precisam de bons dados para ajudá-los a desenvolver melhores maneiras de prever graves, tempestades localizadas.
Um problema de big data
Quando Gallus ouviu colegas do campus do grupo de pesquisa Teórica e Ciência de Dados Aplicados do Estado de Iowa falar sobre aprendizado de máquina, ele achou que os recursos de análise de dados da tecnologia poderiam ajudá-lo a estudar e analisar o banco de dados do Storm Reports. Talvez os computadores possam encontrar relacionamentos ou conexões nos relatórios que podem levar a novas ferramentas de previsão?
Nós vamos, não tão rápido, disseram cientistas da Administração Nacional Oceânica e Atmosférica (NOAA).
O banco de dados de tempestades existentes mantido pelos Centros Nacionais de Informações Ambientais não seria de muita utilidade para Gallus ou outros pesquisadores que buscam dados sobre o vento. Os relatórios do vento não eram confiáveis. Os relatórios precisavam ser limpos antes que pudessem ser úteis para estudos de vento severo.
Então é isso que Gallus e uma equipe de cientistas de dados do estado de Iowa vão fazer. Apoiado por um período de três anos, $ 650, Subsídio de 000 NOAA, eles usarão computadores e ferramentas de aprendizado de máquina para vasculhar os relatórios e identificar a probabilidade de que cada um realmente descreva uma tempestade com ventos fortes.
Não é uma tarefa fácil - Gallus disse que os cientistas começarão com 12 anos de relatos de fortes tempestades. Isso é cerca de 180, 000 deles.
"E 90 por cento desses 180, 000 relatórios contêm estimativas de vento, "Gallus disse." Eles não são baseados em dados de estações meteorológicas. A maioria deles diz árvores ou galhos caídos - alguém ligou e disse:"Minha árvore caiu." "
A classificação desses relatórios levanta todos os tipos de desafios para os pesquisadores de dados, disse Eric Weber, colaborador do projeto e professor de matemática do estado de Iowa.
Primeiro, ele disse que os relatórios estão cheios de dados coletados por pessoas, não por instrumentos precisos e sofisticados. Os relatórios também contêm natural, linguagem cotidiana. Existem expressões idiomáticas, viradas de frases e até erros de digitação que precisam ser analisados pelo software de aprendizado de máquina.
E em segundo lugar, tempestades são muito complexas. Existem muitas variáveis - temperatura do ar ascendente, condensação, chuva, relâmpagos e muito mais - que precisam ser coletados, quantificados e analisados para entender as tempestades.
Weber - que descreve o aprendizado de máquina como uma rede neural artificial que "faz conexões com base nas informações disponíveis" - disse que o software do computador pode lidar com enormes quantidades de dados de tempestade que sobrecarregariam equipes de pessoas.
O software de aprendizado de máquina também faz isso de uma maneira nada humana.
"Quando olhamos para os dados, tentamos entendê-los como seres humanos, "Disse Weber." Trazemos nossas percepções e preconceitos. Um dos principais motivos pelos quais o aprendizado de máquina é usado com tanto sucesso agora é que ele não traz noções preconcebidas para a análise dos dados.
"Ele pode encontrar relacionamentos potenciais que os humanos não conseguem por causa de seus preconceitos."
Rumo a uma melhor previsão
À medida que os computadores progridem com os relatórios de tempestade, Gallus disse que fornecerá atualizações e demonstrações no evento anual da NOAA, Hazardous Weather Testbed com duração de semanas em Norman, Oklahoma. Os bancos de ensaio acontecem durante a temporada de tornados de maio e são uma oportunidade para pesquisadores e analistas usarem as ideias de previsão mais recentes, ferramentas e tecnologias.
Gallus espera mostrar o progresso do estudo do vento da tempestade. Ele vai coletar feedback e sugestões. E tudo isso pode levar a uma nova ferramenta de previsão que prevê a probabilidade de uma tempestade produzir ventos fortes.
"A principal necessidade da NOAA agora é limpar o banco de dados para pesquisas melhores, "Gallus disse." Mas percebemos que, se esse projeto for bem com o aprendizado de máquina, pudemos ver como ele pode funcionar como uma ferramenta de previsão. "