Ao ajustar uma linha reta a um conjunto de dados, você pode estar interessado em determinar quão bem a linha resultante se ajusta aos dados. Uma maneira de fazer isso é calcular a soma do erro de quadrados (SSE). Esse valor fornece uma medida de quão bem a linha de melhor ajuste se aproxima do conjunto de dados. O SSE é importante para a análise de dados experimentais e é determinado através de apenas alguns passos curtos.
Encontre uma linha de melhor ajuste para modelar os dados usando a regressão. A linha de melhor ajuste tem a forma y = ax + b, onde aeb são parâmetros que você precisa determinar. Você pode encontrar esses parâmetros usando uma análise de regressão linear simples. Por exemplo, suponha que a linha de melhor ajuste tenha a forma y = 0.8x + 7.
Use a equação para determinar o valor de cada valor y previsto pela linha de melhor ajuste. Você pode fazer isso substituindo cada valor x na equação da linha. Por exemplo, se x é igual a 1, substituí-lo pela equação y = 0,8x + 7 dá 7,8 para o valor y.
Determine a média dos valores previstos a partir da linha de equação de melhor ajuste. Você pode fazer isso somando todos os valores y previstos pelas equações e dividindo o número resultante pelo número de valores. Por exemplo, se os valores forem 7,8, 8,6 e 9,4, somar esses valores dará 25,8 e dividir esse número pelo número de valores, 3 nesse caso, fornecerá 8,6.
Subtrair cada um dos valores individuais de a média, e quadrada o número resultante. No nosso exemplo, se subtrairmos o valor 7,8 da média 8,6, o número resultante será 0,8. Squaring este valor dá 0,64.
Soma todos os valores ao quadrado da Etapa 4. Se você aplicar as instruções na Etapa 4 a todos os três valores em nosso exemplo, você encontrará valores de 0,64, 0 e 0,64. Somando estes valores dá 1,28. Este é o erro da soma dos quadrados.
Aviso
Os números dos dados são usados apenas para determinar a equação da linha de melhor ajuste. Use valores da linha de melhor ajuste ao calcular o erro de soma de quadrados.