Encontrar a força da associação entre duas variáveis é uma habilidade importante para cientistas de todos os tipos. Se duas variáveis estão correlacionadas entre si, isso mostra que existe um link entre elas. Uma correlação positiva significa que quando uma variável aumenta, a outra também, e uma correlação negativa significa que quando uma variável aumenta, a outra diminui. Correlações não provam causalidade, embora seja possível que mais testes provem uma relação causal entre as variáveis. O coeficiente de correlação R mostra a força da relação entre as duas variáveis, e se é uma correlação positiva ou negativa.
TL; DR (muito longo; não leu)
uma variável xe uma variável y. Calcule o valor de R usando a fórmula:
R = [n (Σxy) - (Σx) (Σy)] ÷ √ {[n Σx 2− (Σx) 2] [ ,null,null,3],n Σy 2− (Σy) 2]} Em que n é o tamanho da amostra. Crie uma tabela com os seus dados Crie uma tabela dos seus dados. Isso deve incluir uma coluna para o número do participante, uma coluna para a primeira variável (rotulada x) e uma coluna para a segunda variável (rotulada y). Por exemplo, se você deseja ver se há uma correlação entre a altura e o tamanho do tênis, uma coluna identifica cada pessoa que você mede, uma coluna mostrará a altura de cada pessoa e outra mostrará o tamanho do sapato. Faça três colunas adicionais, uma para xy, uma para x e um para y. as três colunas adicionais. Por exemplo, imagine sua primeira pessoa mede 75 centímetros de altura e tem tamanho 12 pés. A coluna x (altura) mostraria 75, e a coluna y (tamanho do calçado) mostraria 12. Você precisa encontrar xy, x 2 e y 2. Portanto, usando este exemplo: xy = 75 × 12 = 900 x 2 = 75 2 = 5,625 y 2 = 12 2 = 144 Conclua estes cálculos para cada pessoa para quem você tem dados. Encontre a soma de cada coluna Crie uma nova linha na parte inferior de sua tabela para as somas de cada coluna. Soma todos os valores x, todos os valores y, todos os valores xy, todos os valores x 2 e todos os valores y 2 e, em seguida, coloca os resultados na parte inferior da coluna correspondente em sua nova linha. Você pode rotular sua nova linha “soma” ou usar um símbolo sigma (Σ). Calcular R Usando a Fórmula Você encontra R a partir de seus dados usando a fórmula: R = [n (Σxy) - (Σx) (Σy)] ÷ √ {[nΣx 2− (Σx) 2] [nΣy 2− (Σy) 2]} Isso parece um pouco assustador, então você pode dividi-lo em duas partes, que chamaremos de s e t. s = n (Σxy) - (Σx) (Σy) t = √ {[n Σx 2− (Σx) 2] [n Σy 2− (Σy) 2]} equações, n é o número de participantes que você tem (o tamanho da sua amostra). O resto das partes da equação são as somas calculadas no último passo. Então, para s, multiplique o tamanho de sua amostra pela soma da coluna xy e subtraia a soma da coluna x multiplicada pela soma da coluna y desta. Para t, há quatro principais etapas. Primeiro, calcule n multiplicado pela soma de sua coluna x 2 e subtraia a soma de sua x coluna ao quadrado (multiplicada por si mesma) desse valor. Segundo, faça exatamente a mesma coisa, mas com a soma da coluna y 2 e a soma da coluna y ao quadrado no lugar das x partes (ou seja, n × Σy 2 - [Σy × Σy]) . Em terceiro lugar, multiplique esses dois resultados (para xs e ys) juntos. Em quarto lugar, tome a raiz quadrada dessa resposta. Se você trabalhou em partes, pode calcular R como simplesmente R = s ÷ t. Você obterá uma resposta entre −1 e 1. Uma resposta positiva mostra uma correlação positiva, com mais de 0,7 geralmente sendo considerado um relacionamento forte. Uma resposta negativa mostra uma correlação negativa, com algo acima de -0,7 considerado um forte relacionamento negativo. Da mesma forma, ± 0,5 é considerada uma relação moderada e ± 0,3 é considerada uma relação fraca. Qualquer coisa perto de 0 mostra uma falta de correlação.