Um gráfico de dispersão é um gráfico que mostra a relação entre dois conjuntos de dados. Às vezes, é útil usar os dados contidos em um gráfico de dispersão para obter um relacionamento matemático entre duas variáveis. A equação de um gráfico de dispersão pode ser obtida manualmente, usando uma das duas maneiras principais: uma técnica gráfica ou uma técnica chamada regressão linear.
Criando um gráfico de dispersão
Use papel milimetrado para criar um gráfico de dispersão. Desenhe os eixos x e y, verifique se eles se cruzam e identificam a origem. Assegure-se de que os eixos x e y também tenham títulos corretos. Em seguida, plote cada ponto de dados dentro do gráfico. Quaisquer tendências entre os conjuntos de dados plotados agora devem ser evidentes.
Linha de melhor ajuste
Uma vez que um gráfico de dispersão foi criado, supondo que haja uma correlação linear entre dois conjuntos de dados, podemos usar um método gráfico para obter a equação. Pegue uma régua e desenhe uma linha o mais próximo possível de todos os pontos. Tente garantir que haja tantos pontos acima da linha quanto abaixo da linha. Uma vez que a linha foi desenhada, use métodos padrão para encontrar a equação da linha reta
Equação da linha reta
Uma vez que uma linha de melhor ajuste foi colocada em um gráfico de dispersão é simples para encontrar a equação. A equação geral de uma linha reta é:
y = mx + c
Onde m é a inclinação (gradiente) da linha ec é a interceptação y. Para obter o gradiente, encontre dois pontos na linha. Por causa deste exemplo, vamos supor que os dois pontos são (1,3) e (0,1). O gradiente pode ser calculado tomando a diferença nas coordenadas y e dividindo pela diferença nas coordenadas x:
m = (3 - 1) /(1 - 0) = 2/1 = 2
O gradiente neste caso é igual a 2. Até agora, a equação da linha reta é igual a
y = 2x + c
O valor para c pode ser obtido substituindo os valores por um ponto conhecido. Seguindo o exemplo, um dos pontos conhecidos é (1,3). Conecte isso à equação e reorganize para c:
3 = (2 * 1) + c
c = 3 - 2 = 1
A equação final neste caso é:
y = 2x + 1
Regressão Linear
A regressão linear é um método matemático que pode ser usado para obter a equação linear de um gráfico de dispersão. Comece colocando seus dados em uma tabela. Para este exemplo, vamos supor que temos os seguintes dados:
(4.1, 2.2) (6.5, 4.5) (12.6, 10.4)
Calcule a soma dos valores de x:
x_sum = 4.1 + 6.5 + 12.6 = 23.2
Em seguida, calcule a soma dos valores y:
y_sum = 2.2 + 4.4 + 10.4 = 17
Soma agora os produtos de cada conjunto de pontos de dados:
xy_sum = (4.1 * 2.2) + (6.5 * 4.4) + (12.6 * 10.4) = 168.66
Em seguida, calcule a soma dos valores-x ao quadrado e os valores-y ao quadrado:
x_square_sum = (4.1 ^ 2) + (6.5 ^ 2) + (12.6 ^ 2) = 217.82
y_square_sum = (2.2 ^ 2) + (4.5 ^ 2) + (10.4 ^ 2) = 133,25
Por fim, conte o número de pontos de dados que você tem. Neste caso, temos três pontos de dados (N = 3). O gradiente para a linha de melhor ajuste pode ser obtido de:
m = (N * xy_sum) - (x_sum * y_sum) /(N * x_square_sum) - (x_sum * x_sum) = (3 * 168.66) - (23,2 * 17) /(3 * 217,82) - (23,2 * 23,2) = 0,968
O intercepto para a linha de melhor ajuste pode ser obtido a partir de:
c = (x_square_sum * y_sum) - (x_sum * xy_sum) /(N * x_square_sum) - (x_sum * x_sum)
\\ = (217,82 17) - (23,2 a 168,66) /(3 * 217,82) - (23.2 * 23.2) \\ = -1.82 A equação final é portanto: y = 0.968x - 1.82