Distribuição Hipergeométrica (Definição, Fórmula) - Como calcular?

Definição de Distribuição Hipergeométrica

Na estatística e na teoria da probabilidade, a distribuição hipergeométrica é basicamente uma distribuição de probabilidade distinta que define a probabilidade de k sucessos (ou seja, alguns sorteios aleatórios para o objeto desenhado que tem alguma característica especificada) em n no de sorteios, sem qualquer substituição, de um dado tamanho da população N, que inclui precisamente K objetos com essa característica, onde o sorteio pode ser bem-sucedido ou pode falhar.

A fórmula para a probabilidade de uma distribuição hipergeométrica é derivada usando vários itens na população, número de itens na amostra, número de sucessos na população, número de sucessos na amostra e algumas combinações. Matematicamente, a probabilidade é representada como,

P = K C k * (N - K) C (n - k) / N C n

Onde,

  • N = Nº de itens na população
  • n = número de itens na amostra
  • K = Nº de sucessos na população
  • k = Nº de sucessos na amostra

A média e o desvio padrão de uma distribuição hipergeométrica são expressos como,

Média = n * K / N Desvio padrão = (n * K * (N - K) * (N - n) / (N 2 * (N - 1))) 1/2

Explicação

Passo 1: Em primeiro lugar, determine o número total de itens na população, que é denotado por N. Por exemplo, o número de cartas de jogar em um baralho é 52.

Passo 2: Em seguida, determine o número de itens na amostra, denotados por n - por exemplo, o número de cartas retiradas do baralho.

Passo 3: Em seguida, determine as ocorrências que serão consideradas sucessos na população e isso é denotado por K. Por exemplo, o número de copas no baralho geral, que é 13.

Passo 4: Em seguida, determine as instâncias que serão consideradas sucessos na amostra sorteada e é denotado por k. Por exemplo, o número de copas nas cartas tiradas do baralho.

Etapa 5: finalmente, a fórmula para a probabilidade de uma distribuição hipergeométrica é derivada usando um número de itens na população (etapa 1), número de itens na amostra (etapa 2), número de sucessos na população (etapa 3) e o número de sucessos na amostra (etapa 4) conforme mostrado abaixo.

P = K C k * (N - K) C (n - k) / N C n

Exemplos de distribuição hipergeométrica (com modelo Excel)

Exemplo 1

Tomemos o exemplo de um baralho comum de cartas de baralho em que 6 cartas são sorteadas aleatoriamente sem reposição. Determine a probabilidade de tirar exatamente 4 cartas de suítes vermelhas, ou seja, ouros ou copas.

  • Dado, N = 52 (uma vez que existem 52 cartas em um baralho de jogo comum)
  • n = 6 (número de cartas tiradas aleatoriamente do baralho)
  • K = 26 (uma vez que existem 13 cartas vermelhas em cada um no conjunto de ouros e copas)
  • k = 4 (Número de cartões vermelhos a serem considerados bem-sucedidos na amostra sorteada)

Solução:

Portanto, a probabilidade de tirar exatamente 4 cartas de suítes vermelhas nas 6 cartas tiradas pode ser calculada usando a fórmula acima como,

Probabilidade = K C k * (N - K) C (n - k) / N C n

= 26 C 4 * (52 - 26) C (6 - 4) / 52 C 6

= 26 C 4 * 26 C 2 / 52 C 6

= 14950 * 325/20358520

A probabilidade será -

Probabilidade = 0,2387 ~ 23,87%

Portanto, há uma probabilidade de 23,87% de tirar exatamente 4 cartas vermelhas enquanto tira 6 cartas aleatórias de um baralho comum.

Exemplo # 2

Tomemos outro exemplo de carteira que contém 5 notas de $ 100 e 7 notas de $ 1. Se 4 notas forem escolhidas aleatoriamente, determine a probabilidade de escolher exatamente 3 notas de $ 100.

  • Dado, N = 12 (número de notas de $ 100 + número de notas de $ 1)
  • n = 4 (número de notas escolhidas aleatoriamente)
  • K = 5 (uma vez que existem 5 notas de $ 100)
  • k = 3 (Número de notas de $ 100 a serem consideradas um sucesso na amostra escolhida)

Solução:

Portanto, a probabilidade de escolher exatamente 3 notas de $ 100 nas 4 notas escolhidas aleatoriamente pode ser calculada usando a fórmula acima como,

Probabilidade = K C k * (N - K) C (n - k) / N C n

= 5 C 3 * (12 - 5) C (4 - 3) / 12 C 4

= 5 C 3 * 7 C 1 / 12 C 4

= 10 * 7/495

A probabilidade será -

Probabilidade = 0,1414 ~ 14,14%

Portanto, há uma probabilidade de 14,14% de escolher exatamente 3 notas de $ 100 enquanto tira 4 notas aleatórias.

Relevância e usos

O conceito de distribuição hipergeométrica é importante porque fornece uma maneira precisa de determinar as probabilidades quando o número de tentativas não é muito grande e as amostras são retiradas de uma população finita sem reposição. Na verdade, a distribuição hipergeométrica é análoga à distribuição binomial, que é usada quando o número de tentativas é substancialmente grande. No entanto, a distribuição hipergeométrica é predominantemente usada para amostragem sem reposição.

Artigos interessantes...