Média versus Mediana

Imagem pelo autor

A mediana corresponde a observação do meio de um conjunto ordenado de dados, de forma que exista um número igual de observações maiores e menores que ela. Como consequência, não é afetada por dados excepcionalmente altos ou baixos.

A média aritmética, usualmente chamada apenas de “média”, por outro lado, soma todos os pontos de dados e divide pelo número de pontos de dados para determinar o valor “normal”.  Assim, a média pode ser bastante influenciada por dados excepcionalmente altos ou baixos.

Veja a diferença se, por exemplo, você tiver 100 pontos de dados, onde 97 deles são 100 e os três últimos valores são 1.000,  10.000 e 100.000,  que seriam dados extremos:

 â— Mediana = 100

 â— Média aritmética = 1.207

Essa é uma discrepância bastante grande entre as duas estatísticas que indicam o ponto central dos dados. Então, devemos ser cuidadosos na escolha para a publicação e análise dos dados.

A vantagem da mediana, em relação à média, é que a mediana geralmente representa melhor o valor típico da amostra, pois não é distorcida por valores extremamente altos ou baixos. Portanto, nas comparações, de modo geral é melhor usar a mediana. Entretanto, o ideal é que a decisão seja tomada depois de observar a distribuição dos dados.

Nota: Quando um texto em inglês usa o termo “average”, pode estar se referindo à média, à mediana ou à moda, três conceitos de valor central bastante diferente. É preciso cuidado. – Darrel Huff

Médias versus extremos

No uso da média temos que ficar atentos a duas situações. Na primeira, um valor atípico (outlier) distorce a média, induzindo a erros de interpretação.

No segundo, o número ou os números extremos são mais interessantes ou úteis que a média em si.

O uso da média, ou ainda melhor, da mediana nas análises tem a vantagem de eliminar o efeito de números extremos que, geralmente, estão associados às excepcionalidades ou mesmo aos erros. Entretanto, há casos em que os valores extremos podem ser mais úteis e relevantes para a gestão, como demonstra o depoimento de Guilherme Lessa, Diretor de TI do Banco Matone [1]:

“Antes a equipe de TI só considerava a média das notas que recebia dos usuários; hoje, considera os extremos. Se alguma nota está abaixo de seis ou sete, significa que a TI está fazendo algo errado, então alguém liga para a pessoa que deu a nota abaixo da média para descobrir o que aconteceu”.

Referência: 1. Revista Informática Hoje. Nº 629. 2010, p. 7.