Encontrar a força da associação entre duas variáveis é uma habilidade importante para cientistas de todos os tipos. Se duas variáveis estiverem correlacionadas, isso mostra que há um link entre elas. Uma correlação positiva significa que quando uma variável aumenta, a outra também e uma correlação negativa significa que quando uma variável aumenta, a outra diminui. As correlações não provam causalidade, embora seja possível que testes adicionais provem uma relação causal entre as variáveis. O coeficiente de correlação R mostra a força do relacionamento entre as duas variáveis e se é uma correlação positiva ou negativa.
TL; DR (Muito longo; Não leu)
Chamada uma variável x e uma variável y. Calcule o valor de R usando a fórmula:
R \u003d [n (Σxy) - (Σx) (Σy)] ÷ √ {[n Σx 2− (Σx) 2] [ , 3, [[n Σy 2− (Σy) 2]} Onde n é o tamanho da sua amostra. Faça uma tabela com seus dados. Isso deve incluir uma coluna para o número do participante, uma coluna para a primeira variável (rotulada x) e uma coluna para a segunda variável (rotulada y). Por exemplo, se você está olhando para ver se existe uma correlação entre altura e tamanho do sapato, uma coluna identifica cada pessoa que você mede, uma coluna mostra a altura de cada pessoa e outra mostra o tamanho do sapato. Faça três colunas adicionais, uma para xy, uma para x 2 e uma para y 2. Use seus dados para preencher as três colunas adicionais. Por exemplo, imagine sua primeira pessoa medindo 75 polegadas de altura e tamanho 12 pés. A coluna x (altura) mostraria 75 e a coluna y (tamanho do sapato) mostraria 12. Você precisa encontrar xy, x 2 e y 2. Portanto, usando este exemplo: xy \u003d 75 × 12 \u003d 900 x 2 \u003d 75 2 \u003d 5.625 y 2 \u003d 12 2 \u003d 144 Complete estes cálculos para todas as pessoas para quem você tem dados. Crie uma nova linha em na parte inferior da sua tabela para as somas de cada coluna. Adicione todos os valores x, todos os valores y, todos os valores xy, todos os valores x 2 e todos os valores y 2 e, em seguida, coloque os resultados na parte inferior do coluna correspondente em sua nova linha. Você pode rotular sua nova linha como "soma" ou usar um símbolo sigma (Σ). Você encontra R a partir de seus dados usando a fórmula: R \u003d [n (Σxy) - (Σx) (Σy)] √ {[nΣx 2− (Σx) 2] [nΣy 2− (Σy) 2]} Isso parece um pouco assustador, então você pode dividi-lo em duas partes, que chamaremos de s e t. s \u003d n (Σxy) - (Σx) ( )Y) t \u003d √ {[n Σx 2− (Σx) 2] [n Σy 2− (Σy) 2]} Nestas equações, n é o número de participantes que você tem (o tamanho da sua amostra). O restante das partes da equação são as somas que você calculou na última etapa. Portanto, para s, multiplique o tamanho da sua amostra pela soma da coluna xy e subtraia a soma da coluna x multiplicada pela soma da coluna y. Para t, existem quatro etapas principais. Primeiro, calcule n multiplicado pela soma da coluna x 2 e subtraia a soma da coluna x ao quadrado (multiplicada por ela mesma) desse valor. Segundo, faça exatamente a mesma coisa, mas com a soma da coluna y 2 e a soma da coluna y ao quadrado no lugar das partes x (ou seja, n × Σy 2 - [×y × Σy]) . Terceiro, multiplique esses dois resultados (para os xs e ys) juntos. Quarto, pegue a raiz quadrada desta resposta. Se você trabalhou em partes, pode calcular R como simplesmente R \u003d s 't. Você receberá uma resposta entre -1 e 1. Uma resposta positiva mostra uma correlação positiva, com algo acima de 0,7 sendo geralmente considerado um relacionamento forte. Uma resposta negativa mostra uma correlação negativa, com algo acima de 0,7 considerado um forte relacionamento negativo. Da mesma forma, ± 0,5 é considerado um relacionamento moderado e ± 0,3 é considerado um relacionamento fraco. Qualquer coisa próxima de 0 mostra falta de correlação.