Definição de Distribuição Hipergeométrica
Na estatística e na teoria da probabilidade, a distribuição hipergeométrica é basicamente uma distribuição de probabilidade distinta que define a probabilidade de k sucessos (ou seja, alguns sorteios aleatórios para o objeto desenhado que tem alguma característica especificada) em n no de sorteios, sem qualquer substituição, de um dado tamanho da população N, que inclui precisamente K objetos com essa característica, onde o sorteio pode ser bem-sucedido ou pode falhar.
A fórmula para a probabilidade de uma distribuição hipergeométrica é derivada usando vários itens na população, número de itens na amostra, número de sucessos na população, número de sucessos na amostra e algumas combinações. Matematicamente, a probabilidade é representada como,
P = K C k * (N - K) C (n - k) / N C n
Onde,
- N = Nº de itens na população
- n = número de itens na amostra
- K = Nº de sucessos na população
- k = Nº de sucessos na amostra
A média e o desvio padrão de uma distribuição hipergeométrica são expressos como,
Média = n * K / N Desvio padrão = (n * K * (N - K) * (N - n) / (N 2 * (N - 1))) 1/2Explicação
Passo 1: Em primeiro lugar, determine o número total de itens na população, que é denotado por N. Por exemplo, o número de cartas de jogar em um baralho é 52.
Passo 2: Em seguida, determine o número de itens na amostra, denotados por n - por exemplo, o número de cartas retiradas do baralho.
Passo 3: Em seguida, determine as ocorrências que serão consideradas sucessos na população e isso é denotado por K. Por exemplo, o número de copas no baralho geral, que é 13.
Passo 4: Em seguida, determine as instâncias que serão consideradas sucessos na amostra sorteada e é denotado por k. Por exemplo, o número de copas nas cartas tiradas do baralho.
Etapa 5: finalmente, a fórmula para a probabilidade de uma distribuição hipergeométrica é derivada usando um número de itens na população (etapa 1), número de itens na amostra (etapa 2), número de sucessos na população (etapa 3) e o número de sucessos na amostra (etapa 4) conforme mostrado abaixo.
P = K C k * (N - K) C (n - k) / N C nExemplos de distribuição hipergeométrica (com modelo Excel)
Exemplo 1
Tomemos o exemplo de um baralho comum de cartas de baralho em que 6 cartas são sorteadas aleatoriamente sem reposição. Determine a probabilidade de tirar exatamente 4 cartas de suítes vermelhas, ou seja, ouros ou copas.
- Dado, N = 52 (uma vez que existem 52 cartas em um baralho de jogo comum)
- n = 6 (número de cartas tiradas aleatoriamente do baralho)
- K = 26 (uma vez que existem 13 cartas vermelhas em cada um no conjunto de ouros e copas)
- k = 4 (Número de cartões vermelhos a serem considerados bem-sucedidos na amostra sorteada)
Solução:
Portanto, a probabilidade de tirar exatamente 4 cartas de suítes vermelhas nas 6 cartas tiradas pode ser calculada usando a fórmula acima como,

Probabilidade = K C k * (N - K) C (n - k) / N C n
= 26 C 4 * (52 - 26) C (6 - 4) / 52 C 6
= 26 C 4 * 26 C 2 / 52 C 6
= 14950 * 325/20358520
A probabilidade será -

Probabilidade = 0,2387 ~ 23,87%
Portanto, há uma probabilidade de 23,87% de tirar exatamente 4 cartas vermelhas enquanto tira 6 cartas aleatórias de um baralho comum.
Exemplo # 2
Tomemos outro exemplo de carteira que contém 5 notas de $ 100 e 7 notas de $ 1. Se 4 notas forem escolhidas aleatoriamente, determine a probabilidade de escolher exatamente 3 notas de $ 100.
- Dado, N = 12 (número de notas de $ 100 + número de notas de $ 1)
- n = 4 (número de notas escolhidas aleatoriamente)
- K = 5 (uma vez que existem 5 notas de $ 100)
- k = 3 (Número de notas de $ 100 a serem consideradas um sucesso na amostra escolhida)
Solução:
Portanto, a probabilidade de escolher exatamente 3 notas de $ 100 nas 4 notas escolhidas aleatoriamente pode ser calculada usando a fórmula acima como,

Probabilidade = K C k * (N - K) C (n - k) / N C n
= 5 C 3 * (12 - 5) C (4 - 3) / 12 C 4
= 5 C 3 * 7 C 1 / 12 C 4
= 10 * 7/495
A probabilidade será -

Probabilidade = 0,1414 ~ 14,14%
Portanto, há uma probabilidade de 14,14% de escolher exatamente 3 notas de $ 100 enquanto tira 4 notas aleatórias.
Relevância e usos
O conceito de distribuição hipergeométrica é importante porque fornece uma maneira precisa de determinar as probabilidades quando o número de tentativas não é muito grande e as amostras são retiradas de uma população finita sem reposição. Na verdade, a distribuição hipergeométrica é análoga à distribuição binomial, que é usada quando o número de tentativas é substancialmente grande. No entanto, a distribuição hipergeométrica é predominantemente usada para amostragem sem reposição.