O intervalo interquartílico, geralmente abreviado como IQR, representa o intervalo do percentil 25 ao percentil 75, ou o meio 50%, de qualquer conjunto de dados. O intervalo interquartílico pode ser usado para determinar qual seria a faixa média de desempenho em um teste: você pode usá-lo para ver a pontuação da maioria das pessoas em determinado teste ou determinar quanto dinheiro o funcionário médio de uma empresa produz mensalmente . O intervalo interquartil pode ser uma ferramenta de análise de dados mais eficaz do que a média ou a mediana de um conjunto de dados, pois permite identificar o intervalo de dispersão em vez de apenas um único número.
TL; ; Não leu)
O intervalo interquartílico (IQR) representa os 50% do meio de um conjunto de dados. Para calcular, primeiro ordene seus pontos de dados de menos a maior e, em seguida, determine suas posições no primeiro e terceiro quartis usando as fórmulas (N + 1) /4 e 3 * (N + 1) /4 respectivamente, onde N é o número de pontos no conjunto de dados. Finalmente, subtraia o primeiro quartil do terceiro quartil para determinar o intervalo interquartil para o conjunto de dados.
O cálculo de intervalo interquartil é uma tarefa simples, mas antes de calcular você precisará organizar os vários pontos do seu conjunto de dados. Para fazer isso, comece solicitando seus pontos de dados de menos a maior. Por exemplo, se seus pontos de dados fossem 10, 19, 8, 4, 9, 12, 15, 11 e 20, você os rearranjaria assim: {4, 8, 9, 10, 11, 12, 15, 19, 20}. Uma vez que seus pontos de dados foram ordenados assim, você pode passar para a próxima etapa.
Determine a posição do primeiro quartil
Em seguida, determine a posição do primeiro quartil usando a seguinte fórmula: (N + 1 ) /4, em que N é o número de pontos no conjunto de dados. Se o primeiro quartil cai entre dois números, tome a média dos dois números como sua pontuação no primeiro quartil. No exemplo acima, uma vez que existem nove pontos de dados, você adicionaria 1 a 9 para obter 10 e, em seguida, dividir por 4 para obter 2,5. Uma vez que o primeiro quartil cai entre o segundo e terceiro valor, você tomaria a média de 8 e 9 para obter uma posição no primeiro quartil de 8,5.
Scienced Video Vault Review: Crie o suporte (quase) perfeito: Veja como
Crie o (quase) parêntese perfeito: Veja como determinar a posição do terceiro quartil -
Depois de determinar seu primeiro quartil, determine a posição do terceiro quartil usando a seguinte fórmula: 3 * ( N + 1) /4 onde N é novamente o número de pontos no conjunto de dados. Da mesma forma, se o terceiro quartil cai entre dois números, simplesmente pegue a média como você faria ao calcular a pontuação do primeiro quartil. No exemplo acima, uma vez que existem nove pontos de dados, você adicionaria 1 a 9 para obter 10, multiplicaria por 3 para obter 30 e, em seguida, dividir por 4 para obter 7,5. Como o primeiro quartil fica entre o sétimo e o oitavo valor, você tomaria a média de 15 e 19 para obter uma pontuação de terceiro quartil de 17.
Calcular intervalo interquartil
Uma vez que você determinou o seu primeiro e terceiro quartis, calcule o intervalo interquartílico subtraindo o valor do primeiro quartil do valor do terceiro quartil. Para finalizar o exemplo usado no decorrer deste artigo, subtraia 8.5 de 17 para descobrir que o intervalo interquartílico do conjunto de dados é igual a 8.5.
Vantagens e desvantagens do IQR
O intervalo interquartil tem um vantagem de ser capaz de identificar e eliminar outliers em ambas as extremidades de um conjunto de dados. O IQR também é uma boa medida de variação em casos de distribuição de dados distorcida, e esse método de cálculo de IQR pode funcionar para conjuntos de dados agrupados, desde que você use uma distribuição de frequência cumulativa para organizar seus pontos de dados. A fórmula do intervalo interquartil para dados agrupados é a mesma que para dados não agrupados, com o IQR sendo igual ao valor do primeiro quartil subtraído do valor do terceiro quartil. No entanto, ela apresenta várias desvantagens em relação ao desvio padrão: menos sensibilidade a algumas pontuações extremas e uma estabilidade de amostragem que não é tão forte quanto o desvio padrão.