A significância estatística é um indicador objetivo de se os resultados de um estudo são matematicamente "reais" e estatisticamente defensáveis, e não apenas uma ocorrência casual. Os testes de significância comumente usados procuram diferenças nas médias dos conjuntos de dados ou diferenças nas variâncias dos conjuntos de dados. O tipo de teste aplicado depende do tipo de dados que está sendo analisado. Cabe aos pesquisadores determinar quão significativos eles exigem que os resultados sejam - em outras palavras, quanto risco eles estão dispostos a assumir de estar errado. Normalmente, os pesquisadores estão dispostos a aceitar um nível de risco de 5%.
Erro Tipo I: Rejeitar Incorretamente a Hipótese Nula -
São realizadas experiências para testar hipóteses específicas ou perguntas experimentais com uma expectativa resultado. Uma hipótese nula é aquela que não detecta diferença entre os dois conjuntos de dados que estão sendo comparados. Em um estudo clínico, por exemplo, a hipótese nula pode ser que não há diferença na melhora entre os pacientes que recebem o medicamento do estudo e os pacientes que recebem o placebo. Se o pesquisador rejeitar erroneamente essa hipótese nula quando ela for de fato verdadeira, em outras palavras, se eles "detectarem" uma diferença entre os dois grupos de pacientes quando realmente não houve diferença, então eles cometerão um erro do Tipo I. Os pesquisadores determinam com antecedência quanto risco de cometer um erro do tipo I eles estão dispostos a aceitar. Esse risco é baseado em um valor p máximo que eles aceitarão antes de rejeitar a hipótese nula, e é chamado de alfa.
Erro do tipo II: Rejeitar erroneamente a hipótese alternativa
Uma hipótese alternativa é um que detecta uma diferença entre os dois conjuntos de dados que estão sendo comparados. No caso do ensaio clínico, você esperaria ver diferentes níveis de melhorias nos pacientes que recebem o medicamento em estudo e nos pacientes que receberam o placebo. Se os pesquisadores falharem em rejeitar a hipótese nula quando deveriam, em outras palavras, se "detectarem" nenhuma diferença entre os dois grupos de pacientes quando realmente houve uma diferença, então eles cometeram um erro do Tipo II.
Determinando o nível de significância
Quando os pesquisadores realizam um teste de significância estatística e o valor de p resultante é menor que o nível de risco considerado aceitável, o resultado do teste é considerado estatisticamente significativo. Neste caso, a hipótese nula - a hipótese de que não há diferença entre os dois grupos - é rejeitada. Em outras palavras, os resultados indicam que há uma diferença na melhora entre os pacientes que recebem o medicamento do estudo e os pacientes que recebem o placebo.
Como escolher um teste de significância
Existem vários testes estatísticos para escolher a partir de. Um teste t padrão compara as médias de dois conjuntos de dados, como nossos dados de medicamentos do estudo e nossos dados de placebo. Um teste t pareado é usado para detectar diferenças no mesmo conjunto de dados, como um estudo antes e depois. Uma Análise de Variância unidirecional (ANOVA) pode comparar as médias de três ou mais conjuntos de dados, e uma ANOVA de dois fatores compara as médias de dois ou mais conjuntos de dados em resposta a duas variáveis independentes diferentes, como diferentes intensidades do conjunto de dados. droga do estudo. Uma regressão linear compara as médias dos conjuntos de dados ao longo de um gradiente de tratamentos ou tempo. Cada teste estatístico resultará em medidas de significância, ou alfa, que podem ser usadas para interpretar os resultados do teste.