O que é distribuição normal em estatísticas?
A distribuição normal é uma curva de distribuição de frequência em forma de sino que ajuda a descrever todos os valores possíveis que uma variável aleatória pode assumir dentro de um determinado intervalo, com a maior parte da área de distribuição no meio e poucos na cauda, nos extremos. Essa distribuição tem dois parâmetros principais: a média (µ) e o desvio padrão (σ), que desempenha papel fundamental no cálculo do retorno dos ativos e na estratégia de gerenciamento de risco.
Como interpretar a distribuição normal

A figura acima mostra que a distribuição normal estatística é uma curva em forma de sino. A gama de resultados possíveis desta distribuição são os números reais inteiros situados entre -∞ a + ∞. As caudas da curva do sino se estendem em ambos os lados do gráfico (+/-) sem limites.
- Aproximadamente 68% de todas as observações estão dentro de +/- um desvio padrão (σ)
- Aproximadamente 95% de todas as observações estão dentro de +/- dois desvios padrão (σ)
- Aproximadamente 99% de todas as observações caem dentro de +/- três desvios padrão (σ)
Possui assimetria zero (simetria de uma distribuição). Se a distribuição dos dados for assimétrica, a distribuição será desigual se o conjunto de dados tiver assimetria maior que zero ou positiva. Então, a cauda direita da distribuição é mais prolongada do que a esquerda, e para assimetria negativa (menor que zero) a cauda esquerda será mais longa que a direita.
Tem uma curtose de 3 (mede o pico de uma distribuição), o que indica que a distribuição não é nem muito pontiaguda nem muito fina. Se a curtose for maior do que três, a distribuição tem mais pico com caudas mais grossas, e se a curtose for menor que três, então ela tem caudas finas e o ponto do pico é mais baixo do que a distribuição normal.
Características
- Eles representam uma família de distribuição onde a média e o desvio determinam a forma da distribuição.
- A média, mediana e modo desta distribuição são todos iguais.
- Metade dos valores estão à esquerda do centro e a outra metade à direita.
- O valor total sob a curva padrão será sempre um.
- Muito provavelmente, a distribuição está no centro e menos valores estão no final.

Transformação (Z)
A função de densidade de probabilidade (PDF) de uma variável aleatória (X) seguinte distribuição é dada por:

onde -∞ <x <∞; -∞ <µ 0
Onde,
- F (x) = Função de probabilidade normal
- x = variável aleatória
- µ = Média de distribuição
- σ = desvio padrão da distribuição
- π = 3,14159
- e = 2,71828
Fórmula de Transformação

Onde,
- X = variável aleatória
Exemplos de distribuição normal em estatísticas
Vamos discutir os exemplos a seguir.
Exemplo 1
Suponha que uma empresa tenha 10.000 funcionários e uma estrutura de vários salários de acordo com a função em que o funcionário trabalha. Os salários são geralmente distribuídos com a média da população de µ = $ 60.000 e o desvio padrão da população σ = $ 15.000. Qual será a probabilidade de que o funcionário selecionado aleatoriamente tenha um salário inferior a $ 45.000 por ano.

Solução
Conforme mostrado na figura acima, para responder a essa pergunta, precisamos descobrir a área sob a curva normal de 45 até a cauda do lado esquerdo. Além disso, precisamos usar o valor da tabela Z para obter a resposta certa.
Em primeiro lugar, precisamos converter a média e o desvio padrão fornecidos em uma distribuição normal padrão com média (µ) = 0 e desvio padrão (σ) = 1 usando a fórmula de transformação.
Após a conversão, precisamos consultar a tabela Z para encontrar o valor correspondente, que nos dará a resposta correta.
Dado,
- Média (µ) = $ 60.000
- Desvio padrão (σ) = $ 15.000
- Variável aleatória (x) = $ 45.000
Transformação (z) = (45.000 - 60.000 / 15.000)
Transformação (z) = -1
Agora, o valor que é equivalente a -1 na tabela Z é 0,1587, que representa a área sob a curva de 45 para a esquerda. Indicou que, quando selecionamos aleatoriamente um funcionário, a probabilidade de ganhar menos de $ 45.000 por ano é de 15,87%.
Exemplo # 2
Agora, mantendo o mesmo cenário acima, descubra a probabilidade de que um funcionário selecionado aleatoriamente ganhe mais de $ 80.000 por ano usando a distribuição normal.

Solução
Portanto, nesta questão, precisamos descobrir a área sombreada de 80 à cauda direita usando a mesma fórmula.
Dado,
- Média (µ) = $ 60.000
- Desvio padrão (σ) = $ 15.000
- Variável Aleatória (X) = $ 80.000
Transformação (z) = (80.000 - 60.000 / 15.000)
Transformação (z) = 1,33
De acordo com a tabela Z, o valor equivalente a 1,33 é 0,9082 ou 90,82%, o que mostra que a probabilidade de selecionar aleatoriamente funcionários que ganham menos de $ 80.000 por ano é 90,82%.
Mas, de acordo com a pergunta, precisamos determinar a probabilidade de os funcionários aleatórios ganharem mais de $ 80.000 por ano, portanto, precisamos subtrair o valor de 100.
- Variável aleatória (X) = 100% - 90,82%
- Variável Aleatória (X) = 9,18%
Portanto, a probabilidade de os funcionários ganharem mais de US $ 80.000 por ano é de 9,18%.
Usos
- O gráfico técnico do mercado de ações costuma ser uma curva em sino, permitindo que analistas e investidores façam inferências estatísticas sobre o retorno esperado e o risco das ações.
- É usado no mundo real, como para determinar o melhor horário mais provável para as pizzarias entregarem pizza e muitos outros aplicativos reais.
- Usado na comparação de alturas de um determinado conjunto de população em que a maioria das pessoas terá um tamanho médio, com muito poucas pessoas tendo uma altura acima ou abaixo da média.
- Eles são usados para determinar o desempenho acadêmico médio dos alunos, o que ajuda a comparar a classificação dos alunos.
Conclusão
A distribuição normal encontra aplicativos em ciência de dados e análise de dados. Tecnologias avançadas como Inteligência Artificial e aprendizado de máquina usadas junto com essa distribuição podem fornecer melhor qualidade de dados, o que ajudará indivíduos e empresas na tomada de decisões eficazes.