Por Jon Zamboni | Atualizado em 30 de agosto de 2022
ALFSnaiper/iStock/GettyImages
Na pesquisa, o número de observações – muitas vezes denotado como
n —é fundamental para resultados confiáveis. Uma amostra maior dá uma imagem mais clara da população, reduz a influência de dados anómalos e diminui a margem de erro.
TL;DR
Amostras grandes produzem médias mais precisas, destacam valores discrepantes verdadeiros e diminuem os intervalos de confiança, tornando as descobertas mais confiáveis.
Tamanho da amostra
O tamanho da amostra refere-se à contagem de pontos de dados coletados em uma pesquisa ou experimento. Por exemplo, testar 100 amostras de água do mar em busca de resíduos de óleo significa um tamanho de amostra de 100; pesquisar 20.000 indivíduos sobre ansiedade resulta em um tamanho de amostra de 20.000. Embora amostras maiores exijam mais recursos, a recompensa são dados mais ricos e robustos.
Valor médio e valores discrepantes
O cálculo da média – a média aritmética – torna-se mais preciso à medida que
n cresce. Considere medir a altura:com 40 participantes a média pode ser de 1,70m, mas com 100 participantes pode mudar para 1,70m, oferecendo uma estimativa mais representativa. Um conjunto de dados maior também expõe valores discrepantes genuínos – valores que se desviam acentuadamente da média – fornecendo informações valiosas para investigações adicionais.
O perigo das pequenas amostras
Amostras pequenas são vulneráveis a resultados distorcidos. Pesquisar apenas quatro pessoas sobre afiliação política e encontrar um eleitor independente sugeriria incorretamente que 25% da população é independente. A expansão da amostra dilui o impacto de tais anomalias, garantindo que as estatísticas reflectem a realidade.
Margem de erro
O tamanho da amostra influencia diretamente a margem de erro de uma estatística. Para questões binárias (por exemplo, propriedade de um carro), a margem de erro é de aproximadamente 100÷√
n . Uma amostra de 100 produz uma margem de 10%. Para métricas contínuas (por exemplo, altura), multiplique este valor por duas vezes o desvio padrão para capturar a variabilidade. Em todos os casos, maior
n diminui a margem, aumentando a confiança nos resultados.