Número de surtos de cólera relatados nos relatórios epidemiológicos semanais publicados pelo Programa Integrado de Vigilância de Doenças da Índia (IDSP) durante o período de janeiro de 2010 a dezembro de 2018 para os 40 distritos costeiros da Índia selecionados no estudo. Apenas os distritos que relatam dados de incidência de cólera para os quais todos os sete conjuntos de dados de Variáveis Climáticas Essenciais (ECV) estavam disponíveis são mostrados. Crédito:Campbell et al., 2020
Dados climáticos retirados de satélites em órbita terrestre, combinado com técnicas de aprendizado de máquina, estão ajudando a prever melhor os surtos de cólera e potencialmente salvar vidas.
A cólera é uma doença transmitida pela água causada pela ingestão de água ou alimentos contaminados com a bactéria Vibrio cholerae, que podem ser encontrados em muitas regiões costeiras ao redor do mundo, especialmente em áreas tropicais densamente povoadas. O patógeno responsável geralmente vive em temperaturas quentes, salinidade e turbidez moderadas, e pode ser abrigado por plâncton e detritos na água.
O aquecimento global e um aumento nos eventos climáticos extremos estão causando surtos de cólera - uma doença que afeta 1,3 a 4 milhões de pessoas a cada ano em todo o mundo e causa até 143.000 mortes. Um novo estudo mostra como os surtos de cólera nas regiões costeiras da Índia podem ser previstos com uma taxa de sucesso de 89%, na primeira demonstração do uso da salinidade da superfície do mar para prever a cólera.
A pesquisa publicada ontem no Jornal Internacional de Pesquisa Ambiental e Saúde Pública concentra-se na previsão de surtos de cólera no norte do Oceano Índico, onde mais da metade dos casos globais da doença foram notificados no período de 2010-2016.
A relação entre as causas ambientais da incidência de cólera é complexa, e variam sazonalmente, com diferentes efeitos retardados, por exemplo, da estação das monções. Os algoritmos de aprendizado de máquina podem ajudar a superar esses problemas, aprendendo a reconhecer padrões em grandes conjuntos de dados para fazer previsões testáveis.
O estudo foi conduzido por Amy Campbell durante um estágio de pós-graduação de um ano com o Escritório do Clima da ESA. Amy, junto com seus co-autores no Laboratório Marinho de Plymouth (PML), usou um algoritmo de aprendizado de máquina popular em aplicativos de ciência ambiental - o classificador de floresta aleatório - que pode reconhecer padrões em longos conjuntos de dados e fazer previsões testáveis.
Resultados das métricas de desempenho do Random Forest Model quando aplicado a dados de teste invisíveis para distritos individuais na costa da Índia que relataram surtos de cólera. Os distritos costeiros sem surtos de cólera relatados no período de estudo e os distritos não costeiros são mostrados em cor cinza. Crédito:Campbell et al., 2020
O algoritmo foi treinado em surtos de doenças relatados em distritos costeiros da Índia entre 2010 e 2018, e aprendeu as relações com seis registos climáticos baseados em satélite gerados pela Iniciativa de Mudança Climática da ESA (CCI).
Incluindo ou removendo variáveis ambientais e sub-configuração para diferentes estações, o algoritmo identificou variáveis-chave para prever surtos de cólera como a temperatura da superfície terrestre, salinidade da superfície do mar, concentração de clorofila a e diferença do nível do mar em relação à média (anomalia do nível do mar).
Amy Campbell disse, "O modelo apresentou resultados promissores, e há muito espaço para desenvolver este trabalho usando diferentes conjuntos de dados de vigilância do cólera ou em diferentes locais. Em nosso estudo, testamos diferentes técnicas de aprendizado de máquina e descobrimos que o classificador de floresta aleatório é o melhor, mas existem muito mais técnicas que podem ser investigadas.
"Seria interessante testar o impacto da inclusão de conjuntos de dados socioeconômicos; os dados de sensoriamento remoto poderiam ser usados para desenvolver registros para contabilizar os fatores humanos que são importantes para a incidência de cólera, como o acesso aos recursos hídricos. "
O estudo e seus novos insights contribuíram para o Projeto PODCAST (Pathways of Dispersal for Cholera and Solution Tools) do UKRI-NERC, liderado pela co-autora Marie-Fanny Racault da PML, que está avaliando o impacto do aquecimento do clima e extremos climáticos em habitats adequados para Vibrio cholerae.
Os resultados do estudo serão demonstrados na reunião da COP26 da UNFCCC em 2021 por meio de uma ferramenta de previsão baseada na web como parte do projeto PODCAST-DEMO.