Distribuição Normal em Estatística - Definição, Exemplo, Interpretação

O que é distribuição normal em estatísticas?

A distribuição normal é uma curva de distribuição de frequência em forma de sino que ajuda a descrever todos os valores possíveis que uma variável aleatória pode assumir dentro de um determinado intervalo, com a maior parte da área de distribuição no meio e poucos na cauda, ​​nos extremos. Essa distribuição tem dois parâmetros principais: a média (µ) e o desvio padrão (σ), que desempenha papel fundamental no cálculo do retorno dos ativos e na estratégia de gerenciamento de risco.

Como interpretar a distribuição normal

A figura acima mostra que a distribuição normal estatística é uma curva em forma de sino. A gama de resultados possíveis desta distribuição são os números reais inteiros situados entre -∞ a + ∞. As caudas da curva do sino se estendem em ambos os lados do gráfico (+/-) sem limites.

  • Aproximadamente 68% de todas as observações estão dentro de +/- um desvio padrão (σ)
  • Aproximadamente 95% de todas as observações estão dentro de +/- dois desvios padrão (σ)
  • Aproximadamente 99% de todas as observações caem dentro de +/- três desvios padrão (σ)

Possui assimetria zero (simetria de uma distribuição). Se a distribuição dos dados for assimétrica, a distribuição será desigual se o conjunto de dados tiver assimetria maior que zero ou positiva. Então, a cauda direita da distribuição é mais prolongada do que a esquerda, e para assimetria negativa (menor que zero) a cauda esquerda será mais longa que a direita.

Tem uma curtose de 3 (mede o pico de uma distribuição), o que indica que a distribuição não é nem muito pontiaguda nem muito fina. Se a curtose for maior do que três, a distribuição tem mais pico com caudas mais grossas, e se a curtose for menor que três, então ela tem caudas finas e o ponto do pico é mais baixo do que a distribuição normal.

Características

  • Eles representam uma família de distribuição onde a média e o desvio determinam a forma da distribuição.
  • A média, mediana e modo desta distribuição são todos iguais.
  • Metade dos valores estão à esquerda do centro e a outra metade à direita.
  • O valor total sob a curva padrão será sempre um.
  • Muito provavelmente, a distribuição está no centro e menos valores estão no final.

Transformação (Z)

A função de densidade de probabilidade (PDF) de uma variável aleatória (X) seguinte distribuição é dada por:

onde -∞ <x <∞; -∞ <µ 0

Onde,

  • F (x) = Função de probabilidade normal
  • x = variável aleatória
  • µ = Média de distribuição
  • σ = desvio padrão da distribuição
  • π = 3,14159
  • e = 2,71828

Fórmula de Transformação

Onde,

  • X = variável aleatória

Exemplos de distribuição normal em estatísticas

Vamos discutir os exemplos a seguir.

Exemplo 1

Suponha que uma empresa tenha 10.000 funcionários e uma estrutura de vários salários de acordo com a função em que o funcionário trabalha. Os salários são geralmente distribuídos com a média da população de µ = $ 60.000 e o desvio padrão da população σ = $ 15.000. Qual será a probabilidade de que o funcionário selecionado aleatoriamente tenha um salário inferior a $ 45.000 por ano.

Solução

Conforme mostrado na figura acima, para responder a essa pergunta, precisamos descobrir a área sob a curva normal de 45 até a cauda do lado esquerdo. Além disso, precisamos usar o valor da tabela Z para obter a resposta certa.

Em primeiro lugar, precisamos converter a média e o desvio padrão fornecidos em uma distribuição normal padrão com média (µ) = 0 e desvio padrão (σ) = 1 usando a fórmula de transformação.

Após a conversão, precisamos consultar a tabela Z para encontrar o valor correspondente, que nos dará a resposta correta.

Dado,

  • Média (µ) = $ 60.000
  • Desvio padrão (σ) = $ 15.000
  • Variável aleatória (x) = $ 45.000

Transformação (z) = (45.000 - 60.000 / 15.000)

Transformação (z) = -1

Agora, o valor que é equivalente a -1 na tabela Z é 0,1587, que representa a área sob a curva de 45 para a esquerda. Indicou que, quando selecionamos aleatoriamente um funcionário, a probabilidade de ganhar menos de $ 45.000 por ano é de 15,87%.

Exemplo # 2

Agora, mantendo o mesmo cenário acima, descubra a probabilidade de que um funcionário selecionado aleatoriamente ganhe mais de $ 80.000 por ano usando a distribuição normal.

Solução

Portanto, nesta questão, precisamos descobrir a área sombreada de 80 à cauda direita usando a mesma fórmula.

Dado,

  • Média (µ) = $ 60.000
  • Desvio padrão (σ) = $ 15.000
  • Variável Aleatória (X) = $ 80.000

Transformação (z) = (80.000 - 60.000 / 15.000)

Transformação (z) = 1,33

De acordo com a tabela Z, o valor equivalente a 1,33 é 0,9082 ou 90,82%, o que mostra que a probabilidade de selecionar aleatoriamente funcionários que ganham menos de $ 80.000 por ano é 90,82%.

Mas, de acordo com a pergunta, precisamos determinar a probabilidade de os funcionários aleatórios ganharem mais de $ 80.000 por ano, portanto, precisamos subtrair o valor de 100.

  • Variável aleatória (X) = 100% - 90,82%
  • Variável Aleatória (X) = 9,18%

Portanto, a probabilidade de os funcionários ganharem mais de US $ 80.000 por ano é de 9,18%.

Usos

  • O gráfico técnico do mercado de ações costuma ser uma curva em sino, permitindo que analistas e investidores façam inferências estatísticas sobre o retorno esperado e o risco das ações.
  • É usado no mundo real, como para determinar o melhor horário mais provável para as pizzarias entregarem pizza e muitos outros aplicativos reais.
  • Usado na comparação de alturas de um determinado conjunto de população em que a maioria das pessoas terá um tamanho médio, com muito poucas pessoas tendo uma altura acima ou abaixo da média.
  • Eles são usados ​​para determinar o desempenho acadêmico médio dos alunos, o que ajuda a comparar a classificação dos alunos.

Conclusão

A distribuição normal encontra aplicativos em ciência de dados e análise de dados. Tecnologias avançadas como Inteligência Artificial e aprendizado de máquina usadas junto com essa distribuição podem fornecer melhor qualidade de dados, o que ajudará indivíduos e empresas na tomada de decisões eficazes.

Artigos interessantes...