A regressão linear é um processo em matemática estatística. Ele fornece uma medida numérica da força de uma relação entre variáveis, uma das quais, a variável independente, é assumida como tendo uma associação com a outra variável dependente. Note que esta relação não é assumida como sendo de causa e efeito - embora possa ser - mas simplesmente uma de correlação.
Um Exemplo
Digamos que você tenha uma lista de corredores em uma equipe de pista, juntamente com seus registros individuais de treinamento e tempos de execução de 5K. Você pode assumir que o número de milhas que eles executam no treinamento, M, influencia seu desempenho de 5K, T. Com M como a variável independente e T como a variável dependente, você pode plotar um gráfico de T vs. M e usar este gráfico como uma estimativa visual de se existe uma relação.
A linha de regressão
Como acontece com qualquer linha reta, uma linha de regressão assume a forma y = ax + b, em que y é a variável dependente , a é o declive da linha, x é a variável independente eb é o ponto no eixo y no qual a linha a atravessa.