A correlação mede a força da associação entre duas variáveis. O coeficiente de correlação, r, varia no valor de -1 a +1, com 1 significando uma correlação perfeita. Na vida real, correlações perfeitas são raras. Experimentos simples podem testar a correlação. Por exemplo, você pode fazer medições dos pés das mulheres para ver se o tamanho médio do sapato sobe um tamanho para cada polegada da medida do pé, o que indicaria uma correlação positiva +1. Se os casos de gripe caírem 10% para cada 10% da população cada vez mais vacinada ao longo de um mês, isso é uma correlação negativa -1.
Determinar medidas equivalentes
Um passo importante na medir a correlação é padronizar os valores das duas variáveis. Isso elimina diferenças entre as duas variáveis, como diferenças de escala. Outro exemplo seria duas variáveis medidas em preços, nas quais os valores de uma variável são expressos em dólares e outros em euros.
Calcular média das variáveis
Calcule a média das duas variáveis de interesse. A média é a média aritmética, obtida adicionando os valores de cada caso em um conjunto de observações e dividindo a soma pelo número total de casos que foram observados.
Encontre o desvio padrão
Obtenha os desvios padrão das duas variáveis. O desvio padrão é uma medida de dispersão em um conjunto de pontuações. Calcule a soma das diferenças ao quadrado dividida pelo número de casos em cada variável para obter a variância. A raiz quadrada da variação é o desvio padrão.
Calcular valores padronizados
Calcule os valores padronizados subtraindo a média das pontuações dos casos individuais e dividindo os valores resultantes pelo desvio padrão. Os valores padronizados informarão, em unidades de desvio padrão, até que ponto os valores individuais estão acima ou abaixo da média.
Verifique suas figuras
Verifique se você calculou os valores padronizados corretamente, calculando as médias e desvios padrão para eles. A média de uma variável padronizada deve ser zero e o desvio padrão deve ser 1.
Calcular o coeficiente de correlação
Calcule o coeficiente de correlação, r, para suas variáveis padronizadas. Multiplique os valores padronizados individuais das variáveis x e y para obter os produtos. Em seguida, calcule a média dos produtos dos valores padronizados e interprete os resultados. Quanto maior o valor de r, maior a correlação entre as duas variáveis. Um coeficiente de correlação zero indica que não há correlação. Softwares estatísticos como o IBM SPSS e programas de planilhas como o Excel podem calcular coeficientes de correlação, mas fazê-lo manualmente ajuda na compreensão.