Por Thomas BourdinAtualizado em 30 de agosto de 2022
Tevarak/iStock/GettyImages
A regressão linear é a base da análise estatística, permitindo-nos estimar a relação entre uma variável preditora
x e uma variável de resposta
y usando a equação
y = mx + b . Embora a linha ajustada muitas vezes capture a tendência subjacente, ela raramente passa perfeitamente por todos os pontos de dados. As discrepâncias resultantes - chamadas de resíduos - introduzem incerteza em nossas estimativas de parâmetros, especialmente na inclinação
m . O erro padrão da inclinação quantifica essa incerteza, possibilitando intervalos de confiança e testes de hipóteses.
Etapa 1:calcular a soma dos resíduos quadrados (SSR)
SSR é a soma dos quadrados das diferenças entre
y observados valores e os valores previstos pela linha ajustada. Por exemplo, se os valores observados forem 2,7, 5,9 e 9,4 e o modelo prever 3, 6 e 9, os resíduos quadrados serão 0,09, 0,01 e 0,16, respectivamente. Adicioná-los resulta em um SSR de 0,26.
Etapa 2:estimar a variação dos resíduos
Divida o SSR pelos graus de liberdade, que é o número de observações menos dois (para inclinação e interceptação). No exemplo, com três observações, o divisor é 1, dando uma estimativa de variância de 0,26. Chame esse valor de
A .
Etapa 3:calcular a raiz quadrada da estimativa de variância
A raiz quadrada de
A (√0,26) é igual a 0,51. Este valor representa o desvio padrão dos resíduos e será utilizado no cálculo final.
Etapa 4:calcular a Soma Explicada dos Quadrados (ESS) para x
A ESS mede a variabilidade da variável preditora em torno de sua média. Para
x valores de 1, 2 e 3, a média é 2. Subtrair a média e elevar ao quadrado cada diferença dá 1, 0 e 1, que somam 2. Assim, ESS =2.
Etapa 5:calcule a raiz quadrada de ESS
A raiz quadrada de ESS (√2) é 1,41. Denote isso como
B .
Etapa 6:calcular o erro padrão da inclinação
Divida a raiz quadrada da estimativa de variância (etapa 3) pela raiz quadrada de ESS (etapa 5):0,51 ÷ 1,41 =0,36. Este valor – 0,36 – é o erro padrão da inclinação.
TL;DR
Para grandes conjuntos de dados, automatize o cálculo para evitar erros manuais e economizar tempo.