Média vs Mediana - Diferenças entre métodos usados ​​em estatísticas

Diferença entre média e mediana

Média e mediana são dois termos comumente usados ​​em matemática, a média é como a média de um dado número e soma os números e os divide com a contagem de números que nos dá a média, enquanto a mediana, por outro lado, retorna o número do meio do todo conjunto de dados e se o conjunto de dados for par, a mediana adiciona os dois números do meio e divide por 2, dando-nos a mediana.

Eles são a medida da tendência central e são freqüentemente usados ​​na medição de grandes conjuntos de dados onde a análise precisa ser desenhada e os resultados são interpretados. Média, mediana e modo são três medidas de médias que mostram a dispersão dos dados a partir da média ou da média. Esses métodos são amplamente usados ​​em estatística, enquanto o valor médio dos dados é o método mais usado entre os três.

O que é meio?

Média é uma soma simples do número de observações em uma matriz, que é dividida pelo número de observações. Por exemplo, se falamos sobre a altura média ou a altura média de um grupo de 5 pessoas. A altura média seria calculada somando a altura de 5 pessoas dividida pelo número de pessoas, ou seja, 5.

Fórmula

Fórmula média = (soma de todas as observações / número de observações)

Qual é a mediana?

A mediana, por outro lado, é o número do meio no conjunto da matriz de dados, que separa o conjunto superior de dados do inferior. Os dados precisam ser organizados em ordem crescente primeiro para calcular a mediana dos dados. Quando o conjunto de dados tem cardinalidade, a média dos dois números do meio no conjunto de dados precisa ser obtida. No entanto, esses dois métodos são freqüentemente usados ​​de forma intercambiável.

Fórmula

Fórmula mediana = (n + 1) / 2

quando n é um número ímpar

Mediana = ((n / 2) + ((n / 2) +1)) / 2

quando n é um número par

Infográficos médios vs medianos

Vamos ver as principais diferenças entre a média e a mediana.

Diferenças principais de média vs mediana

  • A média é simples de usar e aplicar e pode ser aplicada a qualquer conjunto de matriz de dados, seja par ou ímpar. A mediana, por outro lado, é ligeiramente complexa de usar e o conjunto de dados precisa ser organizado em ordem crescente ou decrescente antes do cálculo.
  • A média é normalmente usada para distribuições normais, enquanto a mediana é usada para o conjunto de dados de distribuições assimétricas.
  • A média é simples, mas não é robusta, pois pode conter outliers nas distribuições e às vezes pode não fornecer ao usuário os resultados corretos para interpretação. Por outro lado, o método da mediana é robusto e é mais adequado para uso, pois é usado para distribuições enviesadas para derivar a tendência central do conjunto de datas e fornecerá ao usuário muitos resultados precisos quando comparado à média
  • Existe apenas uma fórmula de média que é a soma de todas as observações dividida pelo número de observações. Enquanto a mediana tem duas fórmulas, uma das ímpares, em que apenas os números do meio do conjunto de dados se tornam a mediana. Mas quando temos um conjunto de dados pares, o meio dos dois valores é escolhido e dividido por 2, o que nos dá a mediana do conjunto de dados pares.

Tabela Comparativa Média vs Mediana

Significar Mediana
A média é calculada somando todos os valores na matriz de dados, que é então dividida pelo número de observações. A mediana é o valor médio exato do conjunto de dados. Ele pode ser calculado organizando o conjunto de dados em ordem crescente e, em seguida, encontrando ou selecionando o valor médio do conjunto de dados.
É mais amplamente utilizado na indústria devido a um cálculo fácil da média e nos fornece um número rápido. Não é usado com frequência na indústria, mas é mais completo e preciso do que a média, que é apenas uma simples soma de números.
É geralmente usado para conjunto de dados normalmente inclinado, ou seja, distribuição normal. É particularmente útil descrever o conjunto de dados com uma distorção significativa nos dados ou quando os dados têm uma cauda longa. É amplamente utilizado onde os outliners têm peso significativo nos dados, o que significa que não é um bom método de cálculo.
Não é uma ferramenta robusta para um cálculo derivar a tendência central. É uma ferramenta muito robusta, pois determina o peso nos dados, que geralmente é alto nas caudas mais longas.
É muito sensível a outliers. É muito menos afetado pelos outliers.
É simples de usar É complexo por natureza.
Não pode ser calculado para dados categóricos, pois os valores não podem ser somados. Não pode ser identificado para dados nominais categorizados, pois não pode ser ordenado logicamente.

Conclusão

Além da média e da mediana, há mais um método frequentemente usado para medir a tendência central que é a moda. Um modo é um valor que ocorre com mais frequência no conjunto de dados; o modo tem uma vantagem sobre a média e a mediana, pois pode ser encontrado para conjuntos de dados numéricos e categorizados.

Apesar da existência de moda e mediana, da superioridade de melhores resultados e análises sobre a média, a média ainda é a medida mais adequada de tendência central, especialmente se o conjunto de dados é uma distribuição normal e os dados são normalmente enviesados.

Como um bom analista, a tendência central deve ser medida com todos os três métodos de dados, e a variância na análise deve ser ponderada e cuidadosamente analisada para produzir resultados melhores e mais precisos no conjunto de dados.

Artigos interessantes...