O tamanho da amostra representa o número de observações realizadas para realizar uma análise estatística. Os tamanhos das amostras podem ser compostos de pessoas, animais, lotes de comida, máquinas, baterias ou qualquer população que esteja sendo avaliada.
Amostragem aleatória
Amostragem aleatória é um método pelo qual amostras aleatórias são coletadas de um população, a fim de estimar informações sobre a população sem ser parcial. Por exemplo, se você quer saber que tipo de pessoas vive em uma determinada cidade, você tem que entrevistar /medir pessoas diferentes ao acaso. No entanto, se você acabou de usar todo mundo da biblioteca, você não teria uma estimativa justa /imparcial do que é a população em geral que ocupa a cidade, apenas as pessoas que vão à biblioteca.
Precisão
À medida que os tamanhos das amostras aumentam, as estimativas se tornam mais precisas. Por exemplo, se escolhermos aleatoriamente 10 humanos adultos do sexo masculino, poderemos descobrir que a estatura média deles é 6 pés-3 polegadas de altura, talvez porque há um jogador de basquete que inflaciona nossa estimativa. Se, no entanto, medíssemos dois milhões de seres humanos adultos masculinos, teríamos um melhor preditor da altura média dos machos, porque os extremos se equilibrariam e a média real poderia ofuscar quaisquer desvios da média.
Intervalos de confiança
Quando um estatístico faz uma previsão sobre um resultado, ele freqüentemente constrói um intervalo em torno de sua estimativa. Por exemplo, se medíssemos o peso de 100 mulheres, poderíamos dizer que estamos 90% confiantes de que o peso médio real das mulheres está no intervalo de 103 a 129 libras. (Isso, é claro, depende de outros fatores, como a variabilidade nas medições também.) À medida que o tamanho da amostra aumenta, nos tornamos mais confiantes sobre nossa estimativa e nossos intervalos se tornam menores. Por exemplo, com um milhão de mulheres, poderíamos dizer que estamos 98% confiantes de que o peso médio real das mulheres é entre 115 e 117 libras. Em outras palavras, conforme aumenta o tamanho da amostra, nossa confiança em nossas medições aumenta e o tamanho de nossos intervalos de confiança diminui.
Erro padrão
A variação é uma medida da dispersão de dados em torno da média . O desvio padrão é a raiz quadrada da variação e ajuda a aproximar-se de qual porcentagem da população cai entre um intervalo de valores em relação à média. À medida que o tamanho da amostra aumenta, o erro padrão, que depende do desvio padrão e do tamanho da amostra, diminui. Conseqüentemente, as estimativas aumentam em precisão e as pesquisas baseadas nessas estimativas são consideradas mais confiáveis (com menor risco de erro).
Dificuldade para usar tamanhos maiores de amostra
Amostras maiores obviamente produzem melhor, mais estimativas precisas sobre populações, mas há vários problemas com pesquisadores usando amostras maiores. Primeiro de tudo, pode ser difícil encontrar uma amostra aleatória de pessoas dispostas a tentar um novo medicamento. Quando você faz isso, torna-se mais caro fornecer o medicamento a mais pessoas e monitorar mais pessoas ao longo do tempo. Além disso, é preciso mais esforço para obter e manter um tamanho de amostra maior. Mesmo que amostras maiores produzam estatísticas mais precisas, o custo e esforço extra nem sempre são necessários, pois tamanhos menores de amostras também podem produzir resultados significativos.