As estatísticas têm tudo a ver com tirar conclusões diante da incerteza. Sempre que você coleta uma amostra, não pode ter certeza absoluta de que sua amostra realmente reflete a população da qual foi retirada. Os estatísticos lidam com essa incerteza, levando em consideração os fatores que podem impactar a estimativa, quantificando sua incerteza e realizando testes estatísticos para tirar conclusões desses dados incertos.
Os estatísticos usam intervalos de confiança para especificar um intervalo de valores que é provavelmente contenha a média “verdadeira” da população com base em uma amostra e expresse seu nível de certeza nisso através de níveis de confiança. Embora o cálculo dos níveis de confiança nem sempre seja útil, calcular os intervalos de confiança para um determinado nível de confiança é uma habilidade muito útil.
TL; DR (Muito tempo; Não leu)
Calcule um intervalo de confiança para um determinado nível de confiança multiplicando o erro padrão pela pontuação Z Repita o mesmo processo, mas com a pontuação t Encontre um nível de confiança para um conjunto de dados, pegando metade do tamanho do intervalo de confiança, multiplicando-o pela raiz quadrada do tamanho da amostra e depois dividindo pelo desvio padrão da amostra. Procure a pontuação Z Quando você vê um estatística citada, às vezes há um intervalo fornecido depois dela, com a abreviatura “CI” (para “intervalo de confiança”) ou simplesmente um símbolo de mais-menos seguido de uma figura. Por exemplo, "o peso médio de um homem adulto é de 180 libras (IC: 178,14 a 181,86)" ou "o peso médio de um homem adulto é de 180 ± 1,86 libras". Ambos fornecem a mesma informação: com base na amostra usado, o peso médio de um homem provavelmente cai dentro de um certo intervalo. O intervalo em si é chamado de intervalo de confiança. Se você quiser ter a maior certeza possível de que o intervalo contém o valor verdadeiro, poderá ampliá-lo. Isso aumentaria seu "nível de confiança" na estimativa, mas o intervalo cobriria mais pesos em potencial. A maioria das estatísticas (incluindo a citada acima) são fornecidas como intervalos de confiança de 95%, o que significa que há uma chance de 95% de que o verdadeiro valor médio esteja dentro do intervalo. Você também pode usar um nível de confiança de 99% ou 90%, dependendo de suas necessidades. Quando você usa um nível de confiança nas estatísticas, geralmente precisa para calcular um intervalo de confiança. Isso é um pouco mais fácil se você tiver uma amostra grande, por exemplo, mais de 30 pessoas, porque você pode usar Z Pegue seus dados brutos e calcule a média da amostra (basta somar os resultados individuais e dividir pelo número de resultados). Calcule o desvio padrão subtraindo a média de cada resultado individual para encontrar a diferença e depois quadrada essa diferença. Adicione todas essas diferenças e divida o resultado pelo tamanho da amostra menos 1. Pegue a raiz quadrada desse resultado para encontrar o desvio padrão da amostra (consulte Recursos). Determine o intervalo de confiança localizando primeiro o erro padrão: SE Onde s SE Para encontrar o intervalo de confiança disso, procure o nível de confiança para o qual você deseja calcular o intervalo em um Z Média ± Z Aqui, ± 1,86 libras é o intervalo de confiança de 95%. Se você tiver essa informação, juntamente com o tamanho da amostra e o desvio padrão, poderá calcular o nível de confiança usando a seguinte fórmula: Z O tamanho do o intervalo de confiança é apenas o dobro do valor ±, portanto, no exemplo acima, sabemos que 0,5 vezes esse valor é 1,86. Isso fornece: Z Isso nos dá um valor para Z Para amostras pequenas, existe um processo semelhante para calculando o intervalo de confiança. Primeiro, subtraia 1 do tamanho da amostra para encontrar seus "graus de liberdade". Nos símbolos: df Para uma amostra n Encontre seu valor alfa subtraindo a versão decimal do nível de confiança ( ou seja, seu nível de confiança percentual dividido por 100) de 1 e dividindo o resultado por 2 ou em símbolos: α α Pesquise seu valor alfa e graus de liberdade em uma tabela de distribuição (uma cauda) t na tabela de distribuição e anote o resultado. Como alternativa, omita a divisão por 2 acima e use um valor t Como na etapa anterior, calcule o intervalo de confiança multiplicando esse número pelo erro padrão, que é determinado usando o desvio padrão da amostra e o tamanho da amostra da mesma maneira. A única diferença é que, no lugar da pontuação Z
do nível de confiança escolhido. Subtraia esse resultado da média da amostra para obter o limite inferior e adicione-o à média da amostra para encontrar o limite superior. (Consulte Recursos)
no lugar da pontuação Z
para amostras menores ( n
<30 ).
ou t resultante em uma tabela para encontrar o nível.
A diferença entre nível de confiança e intervalo de confiança
Cálculo de intervalos ou níveis de confiança para amostras grandes
score para sua estimativa em vez de mais complicado t
scores.
\u003d s
/√ n
é o desvio padrão da amostra e n
é o tamanho da amostra. Por exemplo, se você pegasse uma amostra de 1.000 homens para calcular o peso médio de um homem e obtivesse um desvio padrão de 30, isso resultaria em:
\u003d 30 /√1000 \u003d 30 /31,62 \u003d 0,95
-score tabela e multiplique esse valor pela pontuação Z
. Para um nível de confiança de 95%, o escore Z
é 1,96. Usando o exemplo, isso significa:
× SE
\u003d 180 libras ± 1,96 × 0,95 \u003d 180 ± 1,86 libras
\u003d 0,5 × tamanho do intervalo de confiança × √ n
/ s
\u003d 1,86 × √1000 /30 \u003d 1,96
, que você pode procurar em uma tabela Z
-core para encontrar o nível de confiança correspondente.
Cálculo de intervalos de confiança para amostras pequenas
\u003d n
−1
\u003d 10, isso fornece df
\u003d 9.
\u003d (1 - nível de confiança decimal) /2
Então, para um nível de confiança de 95% (0,95):
\u003d (1 - 0,95) /2 \u003d 0,05 /2 \u003d 0,025
bicaudal. Neste exemplo, o resultado é 2.262.
, você usa a pontuação t
.