O cálculo da proporção da amostra nas estatísticas de probabilidade é simples. Esse cálculo não é apenas uma ferramenta útil por si só, mas também é uma maneira útil de ilustrar como o tamanho das amostras em distribuições normais afeta os desvios padrão dessas amostras.
Diga que um jogador de beisebol está batendo .300 em uma carreira que inclui muitos milhares de aparições em placas, o que significa que a probabilidade de ele receber uma base atingida sempre que enfrentar um arremessador é 0,3. Com isso, é possível determinar o quão perto de .300 ele atingirá um número menor de aparências de placas.
Definições e parâmetros
Para esses problemas, é importante que o tamanho da amostra seja suficientemente grande para produzir resultados significativos. O produto do tamanho da amostra n A amostra a proporção p̂ é simplesmente o número de eventos observados x dividido pelo tamanho da amostra n, ou p̂ \u003d (x /n). A média de x é simplesmente np, o número de elementos na amostra multiplicado pela probabilidade de ocorrência do evento. O desvio padrão de x é √np (1 - p). Voltando ao exemplo do jogador de beisebol, suponha que ele tenha 100 aparições de placa em seus primeiros 25 jogos. Qual é a média e o desvio padrão do número de acertos que ele espera obter? np \u003d (100) (0,3) \u003d 30 e √np (1 - p) \u003d √ (100) (0,3) (0,7) \u003d 10 √0,21 \u003d 4,58. Isso significa que o jogador que obtiver apenas 25 acertos em suas aparições de 100 placas ou até 35 não será considerado estatisticamente anômalo. A média de qualquer proporção da amostra p̂ é apenas p. O desvio padrão de p é √p (1 - p) /√n. Para o jogador de beisebol, com 100 tentativas no prato, a média é simplesmente 0,3 e o desvio padrão é: √ (0,3) (0,7) /√100, ou (√0,21) /10 ou 0,0458. Observe que o desvio padrão de p̂ é muito menor que o desvio padrão de x.
e a probabilidade p
do evento em questão ocorrer devem ser maiores ou iguais a 10 e, da mesma forma, o produto do tamanho da amostra e > um menos
a probabilidade de ocorrência do evento também deve ser maior ou igual a 10. Na linguagem matemática, isso significa que np ≥ 10 e n (1 - p) ≥ 10.
Média e desvio padrão da variável
Média e Padrão Desvio da proporção da amostra