O teste Tukey HSD ("diferença significativa honesta" ou "diferença significativa honesta") é uma ferramenta estatística usada para determinar se o relacionamento entre dois conjuntos de dados é estatisticamente significativo - ou seja, se existe uma grande chance de uma alteração numérica observada em um valor estar relacionada causalmente a uma alteração observada em outro valor. Em outras palavras, o teste de Tukey é uma maneira de testar uma hipótese experimental.
O teste de Tukey é chamado quando você precisa determinar se a interação entre três ou mais variáveis é mutuamente estatisticamente significativa, o que infelizmente não é simplesmente uma soma ou produto dos níveis individuais de significância.
Por que não um teste t?
Problemas simples de estatística envolvem a observação dos efeitos de uma variável (independente), como o número de horas estudadas por cada aluno em uma classe para um teste específico, em uma segunda variável (dependente), como as pontuações do aluno no teste. Nesses casos, você geralmente define seu ponto de corte para significância estatística em P <0,05, em que o experimento revela uma chance maior que 95% de que as variáveis em questão realmente se relacionem. Então você se refere a uma tabela t que leva em consideração o número de pares de dados em seu experimento para verificar se sua hipótese estava correta.
Às vezes, no entanto, o experimento pode examinar várias variáveis independentes ou dependentes simultaneamente. Por exemplo, no exemplo acima, as horas de sono de cada aluno na noite anterior ao teste e a nota da turma pode ser incluída. Tais problemas multivariados exigem algo diferente de um teste t devido ao número absoluto, se houver relações independentemente variáveis.
ANOVA
ANOVA significa "análise de variância" e aborda precisamente o problema descrito. Isso explica os graus de liberdade em rápida expansão em uma amostra, à medida que as variáveis são adicionadas. Por exemplo, olhar horas x notas é um emparelhamento, sono x notas é outro, notas x notas é um terço e, enquanto isso, todas essas variáveis independentes também interagem umas com as outras. No teste ANOVA, a variável de interesse após a execução dos cálculos é F, que é a variação encontrada das médias de todos os pares ou grupos, dividida pela variação esperada dessas médias. Quanto maior esse número, mais forte o relacionamento e "significância" geralmente é fixada em 0,95. O relatório dos resultados da ANOVA geralmente requer o uso de uma calculadora interna, como as encontradas no Microsoft Excel, bem como programas estatísticos dedicados, como o SPSS.
O teste Tukey HSD
John Tukey apresentou o teste que leva seu nome quando ele percebeu as armadilhas matemáticas de tentar usar valores-P independentes para determinar a utilidade de uma hipótese de múltiplas variáveis como um todo. Na época, os testes t estavam sendo aplicados a três ou mais grupos, e ele considerou essa desonesta - portanto, "diferença honestamente significativa".
O que o teste faz é comparar as diferenças entre médias de valores em vez de comparar pares de valores. O valor do teste de Tukey é obtido considerando o valor absoluto da diferença entre pares de médias e dividindo-o pelo erro padrão da média (SE), conforme determinado por um teste ANOVA unidirecional. O SE é, por sua vez, a raiz quadrada de (variação dividida pelo tamanho da amostra). Um exemplo de calculadora online está listado na seção Recursos.
O teste Tukey é um teste post hoc, no qual as comparações entre variáveis são feitas depois que os dados já foram coletados. Isso difere de um teste a priori, no qual essas comparações são feitas com antecedência. No primeiro caso, você pode observar os tempos de corrida de milha dos alunos em três classes diferentes de educação física por ano. Neste último caso, você pode designar alunos para um dos três professores e depois fazer com que eles percorram uma milha cronometrada.