Uma equação de regressão linear modela a linha geral dos dados para mostrar a relação entre as variáveis x e y. Muitos pontos dos dados reais não estarão na linha. Outliers são pontos que estão muito longe dos dados gerais e são normalmente ignorados ao calcular a equação de regressão linear. É possível encontrar a equação de regressão linear desenhando uma linha de melhor ajuste e depois calculando a equação para essa linha.
Faça um gráfico dos pontos. Desenhe um gráfico dos pontos no conjunto dado.
Desenhe uma linha que melhor se adapte aos dados. Observe os dados e decida se são crescentes ou decrescentes em geral e, em seguida, coloque uma linha mais próxima do maior número de pontos. Por exemplo, dados os pontos {(2,3) (5,7) (1,2) (4,8)}, a equação de regressão linear será ascendente, ou em outras palavras, os pontos serão geralmente subindo de a esquerda para a direita no gráfico.
Calcule a equação da linha. Escolha dois pontos na linha para calcular a inclinação e observe a interceptação de y. Na linha de melhor ajuste para os pontos {(2,3) (5,7) (1,2) (4,8)}, um ponto é (0,5,1,25) e outro é o intercepto y (0, 0,5). Use a fórmula para a inclinação de uma linha, m = (y2 - y1) /(x2 - x1), para encontrar a inclinação. Conectando os valores dos pontos, m = (0,5 - 1,25) /(0 - 0,5) = 1,5. Assim, com o intercepto y e a inclinação, a equação de regressão linear pode ser escrita como y = 1,5x + 0,5.