Os pesquisadores demonstraram a utilidade de seu modelo de cópula de fator aplicando-o à análise das temperaturas médias diárias em toda a Suíça. Alistair Scott. Crédito:Alamy stock image
Um modelo estatístico que considera dependências comuns em dados espaciais produz resultados mais realistas para estudos de temperatura, níveis de vento e poluição.
Um modelo estatístico para dados espaciais, como temperaturas em locais diferentes, que representa com mais precisão a relação geográfica entre as variáveis medidas foi desenvolvido por pesquisadores da King Abdullah University of Science and Technology (KAUST) da Arábia Saudita.
Modelos estatísticos robustos e realistas são essenciais para quase todos os campos da pesquisa científica e da engenharia. A escolha do modelo estatístico errado para um determinado conjunto de dados pode levar a uma interpretação incorreta dos resultados potencialmente catastrófica, enquanto um modelo que leva em conta a relação mecanicista entre as variáveis pode levar a novos insights e descobertas.
"A estatística espacial envolve modelar variáveis medidas em diferentes localizações espaciais, "disse Marc Genton, Professor de Matemática Aplicada e Ciências da Computação na KAUST. "Muitos modelos existentes, chamadas cópulas, não consegue capturar adequadamente a dependência espacial entre as variáveis, como quando a dependência entre as variáveis se torna mais fraca com o aumento da distância - como é o caso da temperatura. "
Genton, com seus colegas Dr. Pavel Krupskii e Professor Raphaël Huser, projetou uma cópula que pode lidar com diferentes tipos de dependências entre as variáveis. Seu modelo também oferece uma interpretação mais simples dos dados em comparação com outros modelos:esta interpretação, simplificado, diz que existe um fator comum não observado que afeta todas as variáveis simultaneamente.
"Por exemplo, dados de temperatura em uma pequena região geográfica podem estar sujeitos a condições climáticas comuns, que pode ser considerado um fator comum, "explicou Genton." Para representar tais situações, usamos um modelo gaussiano padrão e adicionamos um fator aleatório comum que afeta todas as variáveis simultaneamente, que é uma suposição plausível em muitas aplicações espaciais. "
Um modelo gaussiano é um dos modelos estatísticos mais fundamentais e versáteis. É usado para descrever uma distribuição aleatória de valores sobre um valor médio semelhante à curva de sino clássica em que a maioria dos valores medidos ocorrem perto da média com duas caudas de cada lado. Essas caudas representam a raridade crescente de valores significativamente mais altos ou mais baixos da média. O modelo gaussiano é particularmente poderoso na cópula baseada em fatores de Genton porque permite a integração natural de uma dependência de fator comum entre as variáveis.
Os pesquisadores demonstraram a utilidade de seu modelo de cópula de fator aplicando-o à análise das temperaturas médias diárias em toda a Suíça. Seu modelo teve um bom desempenho em comparação com outras abordagens estatísticas e deu uma representação mais robusta da dependência subjacente entre localizações geográficas.
Esperando ansiosamente, Genton explicou, "Nossa cópula pode ser usada para modelar qualquer variável medida repetidamente no tempo em diferentes localizações espaciais, como temperatura diária ou de hora em hora ou dados de vento em diferentes estações meteorológicas, ou para modelar os níveis de poluição medidos usando balões meteorológicos ou satélites. "