p Estrutura de dependência total. Crédito:Björn Böttcher
p Em dezembro, a editora acadêmica De Gruyter lançou seu novo jornal
Estatísticas abertas com um artigo de abertura do matemático da TU Dresden, Dr. Björn Böttcher. O artigo apresenta a extensão da medida estatística de multivariância à distância desenvolvida por Böttcher e seus colegas na TU Dresden. p Multivariância de distância é uma medida de dependência multivariada que pode detectar dependências entre um número arbitrário de vetores aleatórios, cada um dos quais pode ter uma dimensão distinta. Em seu novo artigo, Böttcher agora apresenta o conceito como uma teoria unificadora que combina várias medidas clássicas de dependência. Conexões entre duas ou mais variáveis de alta dimensão podem ser capturadas e até mesmo dependências não lineares complicadas, bem como dependências de ordem superior, podem ser detectadas. Para inúmeras disciplinas científicas, este método abre novas abordagens para detectar e avaliar dependências.
p O número de dias letivos perdidos pode ser vinculado à idade, gênero ou origem dos alunos da escola? Em uma pesquisa com 146 alunos de escolas, os cientistas sociais analisaram várias variáveis de influência em dias letivos perdidos e examinaram-nas em busca de dependências para derivar um modelo de previsão. Esta questão clássica já foi amplamente discutida e analisada com várias abordagens estatísticas.
p A medida estatística de multivariância de distância apresenta uma nova abordagem para esta questão:Dr. Björn Böttcher do Institute of Mathematical Stochastics foi capaz de usar multivariância de distância para determinar o contexto cultural e uma dependência de ordem superior, incluindo idade e gênero como fatores de influência para os perdidos dias escolares. Ele, portanto, foi capaz de sugerir um modelo mínimo. "Este é um exemplo elementar de uma aplicação do método desenvolvido. Não posso julgar se este é também um achado fundamentado no que diz respeito à questão investigada. Trabalhar com dados reais e, especialmente, a interpretação específica do assunto dos resultados sempre requer perícia na respectivo assunto, "Dr. Böttcher diz, e fornece vários outros exemplos ilustrativos da aplicação de seu método:"No artigo, Refiro-me a mais de 350 conjuntos de dados disponíveis gratuitamente de todas as disciplinas científicas nas quais ocorrem dependências de ordem superior estatisticamente significativas. Novamente, se essas dependências são significativas em termos de pesquisas subjacentes requer investigações adicionais, bem como a experiência nos respectivos campos, "e ele acrescenta, "claro, pedidos de cooperação são sempre bem-vindos. "
p A análise estatística geralmente considera dependências entre variáveis individuais. Especialmente com muitas variáveis, é desejável remover variáveis independentes antes de estudar quaisquer tipos específicos de dependência. O Dr. Björn Böttcher apresenta um método para este propósito denominado "detecção de estrutura de dependência, "que também pode ser usado para detectar dependências de ordem superior. As variáveis são chamadas de" dependentes de ordem superior "se forem independentes de pares, mas mais de duas variáveis ainda influenciam uma à outra em conjunto. Dependências desse tipo não estiveram no foco dos aplicativos até agora.
p Alguns cientistas suspeitam que dependências de ordem superior ocorrem na genética em particular:a ideia básica aqui é que vários genes juntos determinam uma propriedade, mas esses genes não mostram, individualmente, nenhuma dependência entre si, nem individualmente com a propriedade - portanto, de fato, esses seriam dependentes de ordem superior. A estrutura de multivariância de distância e o método de detecção de estrutura de dependência são agora ferramentas promissoras para tais investigações.
p Implementações dos novos métodos são fornecidas para aplicações diretas no pacote "multivariância" para o ambiente de computação estatística livre R.