Um gráfico de dispersão é um gráfico que mostra a relação entre dois conjuntos de dados. Às vezes, é útil usar os dados contidos em um gráfico de dispersão para obter um relacionamento matemático entre duas variáveis. A equação de um gráfico de dispersão pode ser obtida manualmente, usando uma das duas maneiras principais: uma técnica gráfica ou uma técnica chamada regressão linear.
Criando um gráfico de dispersão
Use papel milimétrico para criar um gráfico de dispersão . Desenhe os eixos x e y, verifique se eles se cruzam e identifique a origem. Verifique se os eixos x e y também possuem títulos corretos. Em seguida, plote cada ponto de dados no gráfico. Quaisquer tendências entre os conjuntos de dados plotados agora devem ser evidentes.
Linha de melhor ajuste
Depois que um gráfico de dispersão é criado, assumindo que haja uma correlação linear entre dois conjuntos de dados, podemos usar um método gráfico para obter a equação. Pegue uma régua e desenhe uma linha o mais próximo possível de todos os pontos. Tente garantir que haja tantos pontos acima da linha quanto abaixo da linha. Depois que a linha for traçada, use métodos padrão para encontrar a equação da linha reta
Equação de linha reta
Depois que uma linha de melhor ajuste for colocada em um gráfico de dispersão, é fácil encontrar o equação. A equação geral de uma linha reta é:
y \u003d mx + c
Onde m é a inclinação (gradiente) da linha ec é a interceptação em y. Para obter o gradiente, encontre dois pontos na linha. Para o propósito deste exemplo, vamos supor que os dois pontos sejam (1,3) e (0,1). O gradiente pode ser calculado considerando a diferença nas coordenadas y e dividindo pela diferença nas coordenadas x:
m \u003d (3 - 1) /(1 - 0) \u003d 2/1 \u003d 2
O gradiente nesse caso é igual a 2. Até agora, a equação da reta é
y \u003d 2x + c
O valor para c pode ser obtido substituindo nos valores por um ponto conhecido. Seguindo o exemplo, um dos pontos conhecidos é (1,3). Conecte isso à equação e reorganize para c:
3 \u003d (2 * 1) + c
c \u003d 3 - 2 \u003d 1
A equação final neste caso is:
y \u003d 2x + 1
Regressão linear
A regressão linear é um método matemático que pode ser usado para obter a equação linear de um gráfico de dispersão. Comece colocando seus dados em uma tabela. Neste exemplo, vamos supor que temos os seguintes dados:
(4.1, 2.2) (6.5, 4.5) (12.6, 10.4)
Calcule a soma dos valores x:
x_sum \u003d 4.1 + 6.5 + 12.6 \u003d 23.2
Em seguida, calcule a soma dos valores y:
y_sum \u003d 2.2 + 4.4 + 10.4 \u003d 17
Agora some os produtos de cada conjunto de pontos de dados:
xy_sum \u003d (4.1 * 2.2) + (6.5 * 4.4) + (12.6 * 10.4) \u003d 168.66
Em seguida, calcule a soma dos valores de x ao quadrado e de y ao quadrado:
x_square_sum \u003d (4.1 ^ 2) + (6.5 ^ 2) + (12.6 ^ 2) \u003d (12.6 ^ 2) \u003d 217.82
y_square_sum \u003d (2,2 ^ 2) + (4,5 ^ 2) + (10,4 ^ 2) \u003d 133,25
Finalmente, conte o número de pontos de dados que você possui. Neste caso, temos três pontos de dados (N \u003d 3). O gradiente para a linha de melhor ajuste pode ser obtido em:
m \u003d (N * xy_sum) - (x_sum * y_sum) /(N * x_square_sum) - (x_sum * x_sum) \u003d (3 * 168.66) - (23,2 * 17) /(3 * 217,82) - (23,2 * 23,2) \u003d 0,968
A interceptação para a linha de melhor ajuste pode ser obtida em:
c \u003d (x_square_sum * y_sum) - (x_sum * xy_sum) /(N * x_square_sum) - (x_sum * x_sum)
\\ \u003d (217,82 17) - (23,2 e 168,66) /(3 * 217,82) - (23,2 * 23,2) \\ \u003d -1,82 A equação final é, portanto: y \u003d 0,968x - 1,82