• Home
  • Química
  • Astronomia
  • Energia
  • Natureza
  • Biologia
  • Física
  • Eletrônicos
  • Como calcular outliers

    Um outlier é um valor em um conjunto de dados que está longe dos outros valores. Os outliers podem ser causados ​​por erros experimentais ou de medição, ou por uma população de cauda longa. Nos primeiros casos, pode ser desejável identificar outliers e removê-los dos dados antes de realizar uma análise estatística, porque eles podem rejeitar os resultados para que eles não representem com precisão a população da amostra. A maneira mais simples de identificar outliers é com o método quartile.

    Classifique os dados em ordem crescente. Por exemplo, pegue o conjunto de dados {4, 5, 2, 3, 15, 3, 3, 5}. Classificado, o conjunto de dados de exemplo é {2, 3, 3, 3, 4, 5, 5, 15}.

    Encontre a mediana. Este é o número em que metade dos pontos de dados são maiores e metade são menores. Se houver um número par de pontos de dados, os dois do meio terão uma média. Para o conjunto de dados de exemplo, os pontos médios são 3 e 4, então a mediana é (3 + 4) /2 = 3,5.

    Encontre o quartil superior, Q2; Este é o ponto de dados em que 25% dos dados são maiores. Se o conjunto de dados for par, calcule a média dos dois pontos em torno do quartil. Para o conjunto de dados de exemplo, isso é (5 + 5) /2 = 5.

    Encontre o quartil inferior, Q1; Este é o ponto de dados em que 25% dos dados são menores. Se o conjunto de dados for par, calcule a média dos dois pontos em torno do quartil. Para os dados do exemplo, (3 + 3) /2 = 3.

    Subtraia o quartil inferior do quartil superior para obter o intervalo interquartil, QI. Para o conjunto de dados de exemplo, Q2 - Q1 = 5 - 3 = 2.

    Multiplique o intervalo interquartílico por 1,5. Adicione isto ao quartil superior e subtraia-o do quartil inferior. Qualquer ponto de dados fora desses valores é um valor atípico moderado. Para o conjunto de exemplos, 1,5 x 2 = 3; portanto, 3 - 3 = 0 e 5 + 3 = 8. Portanto, qualquer valor menor que 0 ou maior que 8 seria um valor atípico leve. Isso significa que 15 se qualifica como um outlier leve.

    Multiplique o intervalo interquartílico por 3. Adicione isso ao quartil superior e subtraia-o do quartil inferior. Qualquer ponto de dados fora desses valores é um extremo outlier. Para o conjunto de exemplos, 3 x 2 = 6; portanto, 3 - 6 = –3 e 5 + 6 = 11. Portanto, qualquer valor menor que –3 ou maior que 11 seria um extremo discrepante. Isso significa que 15 se qualifica como um outlier extremo.

    Dica

    Extremos discrepantes são mais indicativos de um ponto de dados inválido do que um outlier moderado.

    © Ciência http://pt.scienceaq.com