Experiências testam previsões. Essas previsões são muitas vezes numéricas, o que significa que, à medida que os cientistas coletam dados, esperam que os números se dividam de uma determinada maneira. Dados do mundo real raramente correspondem exatamente às previsões que os cientistas fazem, então os cientistas precisam de um teste para dizer se a diferença entre os números observados e esperados se deve ao acaso ou a algum fator imprevisto que forçará o cientista a ajustar a teoria subjacente. . Um teste de qui-quadrado é uma ferramenta estatística que os cientistas usam para esse fim.
O tipo de dados necessários
Você precisa de dados categóricos para usar um teste de qui-quadrado. Um exemplo de dados categóricos é o número de pessoas que responderam uma pergunta "sim" versus o número de pessoas que responderam à pergunta "não" (duas categorias) ou o número de rãs em uma população que é verde, amarela ou cinza ( três categorias). Você não pode usar um teste de qui-quadrado em dados contínuos, como pode ser coletado de uma pesquisa perguntando às pessoas como elas são altas. De tal pesquisa, você teria uma ampla gama de alturas. No entanto, se você dividiu as alturas em categorias como "menos de 1,80m de altura" e "mais de 1,80m de altura", você poderia usar um teste de qui-quadrado nos dados.
A bondade-de- Fit Test
Um teste de bondade de ajuste é um teste comum, e talvez o mais simples, realizado usando a estatística qui-quadrado. Em um teste de ajuste, o cientista faz uma previsão específica sobre os números que espera ver em cada categoria de seus dados. Ela então coleta dados do mundo real - chamados de dados observados - e usa o teste do qui-quadrado para ver se os dados observados correspondem às expectativas dela.
Por exemplo, imagine um biólogo estudando os padrões de herança em um espécie de sapo. Entre 100 filhos de um grupo de pais de sapos, o modelo genético do biólogo a leva a esperar 25 filhotes amarelos, 50 filhotes verdes e 25 filhotes cinzentos. O que ela realmente observa são 20 filhotes amarelos, 52 filhotes verdes e 28 filhotes cinzentos. Sua previsão é suportada ou seu modelo genético é incorreto? Ela pode usar um teste do qui-quadrado para descobrir.
Calculando a estatística do Qui-Quadrado
Comece a calcular a estatística qui-quadrado subtraindo cada valor esperado de seu valor observado correspondente e quadrando cada resultado. O cálculo para o exemplo da descendência de sapo seria assim:
amarelo = (20 - 25) ^ 2 = 25 verde = (52 - 50) ^ 2 = 4 cinza = (28 - 25) ^ 2 = 9
Agora divida cada resultado pelo seu correspondente valor esperado.
amarelo = 25 ÷ 25 = 1 verde = 4 ÷ 50 = 0.08 cinza = 9 ÷ 25 = 0.36
Finalmente, some as respostas da etapa anterior.
qui-quadrado = 1 + 0,08 + 0,36 = 1,44
Interpretando a Estatística do Qui-Quadrado
O qui A estatística -quadrada informa a diferença entre os valores observados e os valores previstos. Quanto maior o número, maior a diferença. Você pode determinar se o seu valor de qui-quadrado é muito alto ou baixo o suficiente para sustentar sua previsão, verificando se ela está abaixo de um determinado valor crítico em uma tabela de distribuição de qui-quadrado. Esta tabela corresponde aos valores do qui-quadrado com probabilidades, chamados valores-p. Especificamente, a tabela informa a probabilidade de que as diferenças entre seus valores observados e esperados sejam simplesmente devidas ao acaso aleatório ou a algum outro fator presente. Para um teste de qualidade de ajuste, se o valor p for 0,05 ou menos, você deve rejeitar sua previsão.
Você deve determinar os graus de liberdade (df) em seus dados antes de poder pesquisar o valor crítico do qui-quadrado em uma tabela de distribuição. Os graus de liberdade são calculados subtraindo 1 do número de categorias nos seus dados. Existem três categorias neste exemplo, portanto há dois graus de liberdade. Uma olhada nesta tabela de distribuição qui-quadrado indica que, para dois graus de liberdade, o valor crítico para uma probabilidade de 0,05 é de 5,99. Isso significa que, contanto que seu valor qui-quadrado calculado seja menor que 5,99, seus valores esperados e, portanto, a teoria subjacente, são válidos e suportados. Como a estatística do qui-quadrado para os dados dos filhotes de rã era 1,44, a bióloga pode aceitar seu modelo genético.