Quando cientistas, economistas ou estatísticos fazem previsões baseadas em teoria e, em seguida, coletam dados reais, eles precisam de uma maneira de medir a variação entre os valores previstos e os medidos. Eles geralmente contam com o erro quadrático médio (MSE), que é a soma das variações dos pontos de dados individuais ao quadrado e dividido pelo número de pontos de dados menos 2. Quando os dados são exibidos em um gráfico, você determina o MSE por Somando as variações nos pontos de dados do eixo vertical. Em um gráfico x-y, esses seriam os valores y.
Por que quadrar as variações?
Multiplicar a variação entre os valores preditos e observados tem dois efeitos desejáveis. O primeiro é garantir que todos os valores sejam positivos. Se um ou mais valores forem negativos, a soma de todos os valores poderá ser irrealisticamente pequena e uma representação pobre da variação real entre os valores previstos e observados. A segunda vantagem da quadratura é dar mais peso a diferenças maiores, o que garante que um grande valor para MSE signifique grandes variações de dados.
Algoritmo de estoque de cálculo de amostra
Suponha que você tenha um algoritmo que prevê os preços de uma determinada ação em uma base diária. Na segunda-feira, a previsão é de que o preço das ações seja de US $ 5,50, na terça-feira de US $ 6,00, quarta-feira de US $ 6,00, quinta-feira de US $ 7,50 e sexta-feira de US $ 8,00. Considerando segunda-feira como Dia 1, você tem um conjunto de pontos de dados que aparecem assim: (1, 5,50), (2, 6,00), (3, 6,00), (4, 7,50) e (5, 8,00). Os preços reais são os seguintes: segunda-feira $ 4,75 (1, 4,75); Terça-feira $ 5,35 (2, 5,35); Quarta-feira $ 6,25 (3, 6,25); Quinta-feira $ 7,25 (4, 7,25); e sexta-feira: US $ 8,50 (5, 8,50).
As variações entre os valores y desses pontos são 0,75, 0,65, -0,25, 0,25 e -0,50, respectivamente, onde o sinal negativo indica um valor previsto menor do que o observado. Para calcular o MSE, você primeiro faz o quadrado de cada valor de variação, o que elimina os sinais menos e gera 0,5625, 0,4225, 0,0625, 0,0625 e 0,25. Somando estes valores dá 1,36 e dividindo pelo número de medições menos 2, que é 3, produz o MSE, que resulta ser 0,45.
MSE e RMSE
Valores menores para MSE indicam maior concordância entre os resultados previstos e observados, e um MSE de 0,0 indica perfeita concordância. É importante lembrar, no entanto, que os valores de variação são elevados ao quadrado. Quando é necessária uma medição de erro que esteja nas mesmas unidades dos pontos de dados, os estatísticos usam o RMSE (Root Mean Square Error). Eles obtêm isso pegando a raiz quadrada do erro quadrático médio. Para o exemplo acima, o RSME seria 0,671 ou cerca de 67 centavos.