Média versus Mediana

Imagem pelo autor

A mediana corresponde a observação do meio de um conjunto ordenado de dados, de forma que exista um número igual de observações maiores e menores que ela. Como consequência, não é afetada por dados excepcionalmente altos ou baixos.

A média aritmética, usualmente chamada apenas de “média”, por outro lado, soma todos os pontos de dados e divide pelo número de pontos de dados para determinar o valor “normal”.  Assim, a média pode ser bastante influenciada por poucos dados excepcionalmente altos ou baixos.

Veja a diferença se, por exemplo, você tiver 100 resultados, onde 97 deles são 100 e os três últimos valores são 1.000,  10.000 e 100.000,  que seriam dados extremos:

 ● Mediana = 100

 ● Média aritmética = 1.207

Essa é uma discrepância bastante grande entre as duas estatísticas que indicam o ponto central dos dados. Então, devemos ser cuidadosos na escolha para a análise e publicação de dados.

Em resumo

A vantagem, em relação à média, é que a mediana geralmente representa melhor o valor típico da amostra, pois não é distorcida por valores extremamente altos ou baixos. Portanto, nas comparações, de modo geral é melhor usar a mediana. Entretanto, o ideal é que a decisão seja tomada depois de observar a distribuição dos dados.

Nota: Quando um texto em inglês usa o termo “average”, pode estar se referindo à média, à mediana ou à moda, três conceitos de valor central bastante diferente. É preciso cuidado. – Darrel Huff

Post de jul/20, atualizado em mar/22.

Médias versus extremos

No uso da média temos que ficar atentos a duas situações. Na primeira, um valor atípico (outlier) distorce a média, induzindo a erros de interpretação.

No segundo, o número ou os números extremos são mais interessantes ou úteis que a média em si.

O uso da média, ou ainda melhor, da mediana nas análises tem a vantagem de eliminar o efeito de números extremos que, geralmente, estão associados às excepcionalidades ou mesmo aos erros. Entretanto, há casos em que os valores extremos podem ser mais úteis e relevantes para a gestão, como demonstra o depoimento de Guilherme Lessa, Diretor de TI do Banco Matone [1]:

“Antes a equipe de TI só considerava a média das notas que recebia dos usuários; hoje, considera os extremos. Se alguma nota está abaixo de seis ou sete, significa que a TI está fazendo algo errado, então alguém liga para a pessoa que deu a nota abaixo da média para descobrir o que aconteceu”.

Referência: 1. Revista Informática Hoje. Nº 629. 2010, p. 7.