Amostragem com viés

Em 1936, a Literary Digest realizou uma pesquisa eleitoral para a presidência dos Estados Unidos que recebeu mais de 2 milhões de respostas, prevendo que Alfred Landon prevaleceria sobre Franklin Roosevelt por uma margem de dois dígitos. Na verdade, Roosevelt venceu de lavada.

A Literary Digest errou ao conduzir sua pesquisa por telefone, que na época era desproporcionalmente usada pelos ricos. Nesse sentido, a enorme amostra ainda era muito pequena. Analogamente, hoje, petabytes de dados de mídias sociais não são garantia para refletir com precisão os sentimentos da população de interesse.

Uma questão de amostra

Qual a lição a tirar desse erro do Ipea, que divulgou que 65% dos brasileiros concordam que “mulheres que usam roupas que mostram o corpo merecem ser atacadas”, quando o número correto é 26%?

O Ipea teve o mérito de corrigir o seu erro. Mas mesmo os números corrigidos podem continuar a suscitar dúvidas. A pesquisa domiciliar, da forma como o Ipea fez, distorce a amostragem. Eles ouvem os pesquisados em casa, durante o dia. Nesse horário é mais provável encontrar em casa pessoas mais velhas, mulheres e pessoas com baixa escolaridade. Esses perfis não são representativos da população brasileira. Na amostra de entrevistados do Ipea, mais de 65% são mulheres, enquanto a taxa real da população brasileira feminina é de 52%. Eu não concordo com quem dá valor a essas aferições meramente probabilísticas. A confusão recente do Ipea só reforçou minhas convicções.

Fonte: Revista Veja. Editora Abril. Edição 2369 – ano 47 – n°16. 16 de abril de 2014. P.23. Páginas amarelas. Entrevista com Mauro Paulino – Diretor do DataFolha.