Fórmula para determinar o tamanho da amostra da população
A fórmula do tamanho da amostra ajuda a calcular ou determinar o tamanho mínimo da amostra que é necessário para saber a proporção adequada ou correta da população junto com o nível de confiança e a margem de erro.
O termo “amostra” refere-se à porção da população que nos permite fazer inferências sobre a população e, portanto, é importante que o tamanho da amostra seja adequado o suficiente para que possam ser feitas inferências significativas. Em outras palavras, é o tamanho mínimo necessário para estimar a proporção real da população com a margem de erro necessária e o nível de confiança. Como tal, a determinação do tamanho de amostra apropriado é um dos problemas recorrentes na análise estatística. Sua equação pode ser derivada usando o tamanho da população, o valor crítico da distribuição normal, a proporção da amostra e a margem de erro.
Tamanho da amostra n = N * (Z 2 * p * (1-p) / e 2 ) / (N - 1 + (Z 2 * p * (1-p) / e 2 )
Onde,
- N = tamanho da população,
- Z = valor crítico da distribuição normal no nível de confiança exigido,
- p = proporção da amostra,
- e = Margem de erro
Como calcular o tamanho da amostra? (Passo a passo)
- Etapa 1: em primeiro lugar, determine o tamanho da população, que é o número total de entidades distintas em sua população e é denotado por N. (Observação: caso o tamanho da população seja muito grande, mas o número exato não seja conhecido, use 100.000 porque o tamanho da amostra não muda muito para populações maiores do que isso.)
- Etapa 2: Em seguida, determine o valor crítico da distribuição normal no nível de confiança necessário. Por exemplo, o valor crítico com nível de confiança de 95% é 1,96.
- Passo 3: Em seguida, determine a proporção da amostra que pode ser usada a partir de resultados de pesquisas anteriores ou coletada por meio de uma pequena pesquisa piloto. (Nota: se não tiver certeza, pode-se sempre usar 0,5 como uma abordagem conservadora, e isso dará o maior tamanho de amostra possível.)
- Etapa 4: a seguir, determine a margem de erro, que é o intervalo em que se espera que a população verdadeira se encontre. (Observação: quanto menor a margem de erro, maior é a precisão e, portanto, a resposta exata.)
- Etapa 5: finalmente, a equação do tamanho da amostra pode ser derivada usando o tamanho da população (etapa 1), o valor crítico da distribuição normal no nível de confiança necessário (etapa 2), proporção da amostra (etapa 3) e margem de erro ( etapa 4) conforme mostrado abaixo.

Exemplos
Exemplo 1
Tomemos o exemplo de um varejista que está interessado em saber quantos de seus clientes compraram um item deles depois de ver seu site em um determinado dia. Dado que o site deles tem, em média, 10.000 visualizações por dia determinam o tamanho da amostra dos clientes que eles devem monitorar com um nível de confiança de 95% e uma margem de erro de 5% se:
- Eles não têm certeza da taxa de conversão atual.
- Eles sabem por pesquisas anteriores que a taxa de conversão é de 5%.
Dado,
- Tamanho da população, N = 10.000
- Valor crítico com nível de confiança de 95%, Z = 1,96
- Margem de erro, e = 5% ou 0,05
1 - Como a taxa de conversão atual é desconhecida, vamos supor que p = 0,5

Portanto, o tamanho da amostra pode ser calculado usando a fórmula como,

= (10.000 * (1,96 2 ) * 0,5 * (1-0,5) / (0,05 2 ) / (10000 - 1 + ((1,96 2 ) * 0,5 * (1-0,5) / (0,05 2 ))))

Portanto, 370 clientes serão adequados para derivar inferências significativas.
2 - A taxa de conversão atual é p = 5% ou 0,05
Portanto, o tamanho da amostra pode ser calculado usando a fórmula acima como,

= (10.000 * (1,96 2 ) * 0,05 * (1-0,05) / (0,05 2 ) / (10000 - 1 + ((1,96 2 ) * 0,05 * (1-0,05) / (0,05 2 ))))

Portanto, um tamanho de 72 clientes será adequado para derivar inferências significativas neste caso.
Exemplo # 2
Tomemos o exemplo acima e, neste caso, suponhamos que o tamanho da população, ou seja, a visualização diária do site, esteja entre 100.000 e 120.000, mas o valor exato não é conhecido. O resto dos valores são iguais, junto com uma taxa de conversão de 5%. Calcule o tamanho da amostra para 100.000 e 120.000.
Dado,
- Proporção da amostra, p = 0,05
- Valor crítico com nível de confiança de 95%, Z = 1,96
- Margem de erro, e = 0,05

Portanto, o tamanho da amostra para N = 100.000 pode ser calculado como,

= (100000 * (1,96 2 ) * 0,05 * (1-0,05) / (0,05 2 ) / (100000 - 1 + ((1,96 2 ) * 0,05 * (1-0,05) / (0,05 2 ))))

Portanto, o tamanho da amostra para N = 120.000 pode ser calculado como,

= (120000 * (1,96 2 ) * 0,05 * (1-0,05) / (0,05 2 ) / (120000 - 1 + ((1,96 2 ) * 0,05 * (1-0,05) / (0,05 2 ))))

Portanto, fica provado que à medida que o tamanho da população aumenta para se tornar muito grande, torna-se irrelevante no cálculo do tamanho da amostra.
Relevância e usos
O cálculo do tamanho da amostra é importante para entender o conceito do tamanho de amostra apropriado, pois é usado para validar os resultados da pesquisa. Caso seja muito pequeno, não produzirá resultados válidos, enquanto uma amostra é muito grande pode ser uma perda de tempo e dinheiro. Estatisticamente, o tamanho significativo da amostra é usado predominantemente para pesquisas de mercado, saúde e educação.