A análise de dados é uma parte crucial em várias disciplinas, como estatística, ciência de dados, economia e muitas outras. Uma das primeiras etapas na análise de dados é a descrição dos dados, que inclui a utilização de medidas de tendência central, como, por exemplo, a mediana.

As medidas de tendência central fornecem um resumo único de um conjunto de dados, representando um valor típico ao redor do qual os dados se distribuem. As três medidas de tendência central mais comuns são a média, a mediana e a moda.

Este artigo foca na mediana, explorando sua definição, cálculo, propriedades e comparando-a com a média e a moda. Também discutiremos quando é mais apropriado usar cada uma dessas medidas.

 

O que é a Mediana?

A mediana é o valor central de um conjunto de dados ordenados. Se os dados forem dispostos em ordem crescente ou decrescente, a mediana é o ponto que divide o conjunto em duas partes iguais, com metade dos dados sendo menores e metade sendo maiores que este valor.

Como Calcular a Mediana?

Para calcular a mediana, siga os seguintes passos:

  1. Ordene os dados em ordem crescente ou decrescente.
  2. Determine o número total de observações, [math]n[/math].
  3. Se [math]n[/math] for ímpar, a mediana é o valor da posição central, que pode ser encontrado pela fórmula [math](n + 1)/2[/math].
  4. Se [math]n[/math] for par, a mediana é a média dos dois valores centrais, que podem ser encontrados nas posições [math]n/2[/math] e [math](n/2) + 1[/math].

Exemplos de Cálculos da Madiana

Exemplo 1: Número ímpar de observações

Considere o conjunto de dados: [7, 3, 1, 5, 9]

  1. Ordene os dados: [1, 3, 5, 7, 9]
  2. Como [math]n = 5[/math] (ímpar), a mediana é o valor da posição [math](5 + 1)/2 = 3[/math]. Portanto, a mediana é 5.

Exemplo 2: Número par de observações

Considere o conjunto de dados: [8, 4, 6, 2, 10, 12]

  1. Ordene os dados: [2, 4, 6, 8, 10, 12]
  2. Como [math]n = 6[/math] (par), a mediana é a média dos valores das posições [math]6/2 = 3[/math] e [math](6 / 2) + 1 = 4[/math]. Os valores são 6 e 8. Portanto, a mediana é [math](6 + 8)/2 = 7[/math].

Propriedades da Mediana

A mediana possui várias propriedades úteis:

  • Robustez: A mediana não é afetada por valores extremos ou outliers. Por exemplo, adicionar um valor muito grande ou muito pequeno ao conjunto de dados não altera significativamente a mediana.
  • Simplicidade: A mediana é fácil de calcular e interpretar, especialmente para distribuições assimétricas.
  • Aplicabilidade: A mediana é útil para dados ordinais e não requer suposições sobre a distribuição dos dados.

Comparando Mediana, Média e Moda

Média

A média, também conhecida como média aritmética, é a soma de todos os valores dividida pelo número total de observações. A fórmula para calcular a média é:

[math] \text{Média} = \frac{\sum_{i=1}^{n} x_i}{n}
[/math]

onde [math]x_i[/math] representa os valores individuais e [math]n[/math] é o número total de observações.

Propriedades da Média

  • Sensibilidade a Outliers: A média pode ser influenciada por valores extremos, o que pode distorcer a interpretação dos dados.
  • Utilização Comum: A média é frequentemente utilizada em estatísticas inferenciais e análises descritivas.
  • Exatidão: Em distribuições simétricas, a média é uma medida precisa da tendência central.

Moda

A moda é o valor que ocorre com maior frequência em um conjunto de dados. Um conjunto de dados pode ter uma única moda (unimodal), duas modas (bimodal) ou mais (multimodal).

Propriedades da Moda

  • Identificação Simples: A moda é fácil de identificar em distribuições simples.
  • Aplicabilidade: A moda é útil para dados categóricos onde não é possível calcular a média ou mediana.
  • Limitações: A moda pode não ser representativa em distribuições com múltiplas modas ou sem uma moda clara.

Quando Usar Média, Mediana e Moda

Média

  • Use a média quando os dados são aproximadamente simétricos e não possuem outliers significativos.
  • É ideal para análises estatísticas que exigem uma medida de centralidade sensível a todas as observações.

Mediana

  • Use a mediana quando os dados possuem outliers ou são assimétricos.
  • É preferível para dados ordinais e quando se deseja uma medida robusta de tendência central.

Moda

  • Use a moda para dados categóricos ou quando se deseja identificar a categoria mais comum.
  • É útil em distribuições multimodais para identificar os valores mais frequentes.

 

Exemplos Práticos

Exemplo 1: Salários

Considere um conjunto de dados de salários anuais de empregados em uma empresa: [30, 35, 40, 45, 50, 1000]

Média: [math] \frac{30 + 35 + 40 + 45 + 50 + 1000}{6} = \frac{1200}{6} = 200 [/math] – A média é 200, mas é significativamente influenciada pelo salário de 1000.

Mediana: Ordenando os dados: [2, 4, 6, 8, 10, 12] – Mediana = [math] \frac{40 + 45}{2} = 42.5 [/math]

Moda: Não há moda, pois todos os valores são únicos.

Neste exemplo, a mediana (42.5) fornece uma melhor representação do salário típico dos empregados, pois não é afetada pelo outlier (1000).

Exemplo 2: Notas de Alunos

Considere as notas de uma turma: [70, 80, 80, 85, 90, 95, 100]

Média: [math] \frac{70 + 80 + 80 + 85 + 90 + 95 + 100}{7} = \frac{600}{7} \approx 85.71 [/math]

Mediana: Ordenando os dados: [70, 80, 80, 85, 90, 95, 100] – Mediana = 85

Moda: A moda é 80, pois é a nota mais frequente.

Neste caso, a média (85.71) e a mediana (85) são bastante próximas, mas a moda (80) mostra que a nota mais comum é 80.

 
Média, Moda e Mediana

 

Quando é melhor usar a Mediana em vez da Média?

Darrell Huff, em seu livro “Como Mentir com Estatística”, destaca como diferentes medidas de tendência central, incluindo a mediana, podem ser usadas (ou manipuladas) para apresentar dados de maneiras específicas.

A mediana é especialmente útil para entender a distribuição dos dados de forma que não seja influenciada por outliers ou valores extremos. Vamos explorar um exemplo que ilustra bem isso:

Suponha que você tenha as idades dos participantes de um evento: [20, 21, 22, 23, 24, 25, 26, 27, 90].

Média: A média das idades é [math] \frac{20 + 21 + 22 + 23 + 24 + 25 + 26 + 27 + 90}{9} = \frac{278}{9} \approx 30.89 [/math]. Este valor é distorcido pela idade de 90.

Mediana: Ordenando os dados: [20, 21, 22, 23, 24, 25, 26, 27, 90]. Como o número de observações é ímpar ([math]n = 9[/math]), a mediana é o valor na posição [math](9 + 1)/2 = 5[/math]. Portanto, a mediana é 24.

Segundo Huff, a mediana é uma ferramenta poderosa para evitar a distorção causada por valores extremos e fornecer uma visão mais clara da idade central dos participantes.

 

Conclusão

A escolha entre média, mediana e moda depende da natureza dos dados e do objetivo da análise. A média é útil para dados simétricos sem outliers, a mediana é preferível para dados assimétricos ou com outliers, já a moda é ideal para dados categóricos.

Compreender essas medidas e saber quando utilizá-las pode fornecer insights valiosos e garantir uma análise de dados precisa e informativa.

💡
Curtiu o post? Então deixa um comentário e compartilha nas redes sociais. Quer trocar uma ideia pelo LinkeIN? Me adiciona lá!

Categorized in:

Estatística,

Last Update: maio 21, 2024