
– Imagem de Auke Hunneman no LinkedIn em 2022.
Para tirar conclusões a partir de amostras, é preciso que, além de terem tamanho mínimo adequado, elas sejam representativas do universo que se deseja analisar. Quando esses critérios são ignorados, por desconhecimento, descuido ou má-fé, os resultados podem ficar distorcidos. Compreender como esses erros ocorrem é fundamental para evitá-los.
Grande amostra, conclusão errada
Em 1936, a revista Literary Digest realizou uma pesquisa eleitoral para a Presidência dos Estados Unidos. A enquete recebeu mais de 2 milhões de respostas e previa que Alfred Landon venceria Franklin D. Roosevelt por ampla margem. O resultado real foi o oposto: Roosevelt venceu com folga.
O erro ocorreu porque a pesquisa foi conduzida, em grande parte, com base em listas telefônicas e registros de proprietários de automóveis — bens que, à época, estavam concentrados nas camadas mais ricas da população. Assim, apesar do grande tamanho da amostra, ela não era representativa do eleitorado.

Hoje, fenômeno semelhante pode ocorrer em pesquisas realizadas nas mídias sociais. Embora o volume de dados seja elevado, cada plataforma possui um perfil específico de usuários. Por isso, sem critérios adequados de ponderação, não é possível avaliar com precisão o posicionamento da população de interesse.
Durante a Segunda Guerra Mundial, na tentativa de reduzir o número de aviões abatidos, os Aliados analisaram os danos sofridos pelas aeronaves que retornavam das missões. A ideia era simples: reforçar as áreas que sofriam mais danos.
A conclusão inicial foi reforçar as pontas das asas, os lemes e a parte central da fuselagem — regiões onde se observava maior número de perfurações.
Entretanto, o estatístico Abraham Wald, que trabalhava para a área de defesa, propôs abordagem diferente: reforçar o cockpit, os motores e a parte traseira da fuselagem.
Por que reforçar justamente as áreas onde quase não havia impactos?
O especialista identificou um viés na análise: estavam sendo considerados apenas os aviões que conseguiram retornar. Wald argumentou que a distribuição dos tiros provavelmente era relativamente homogênea. As marcas observadas concentravam-se em áreas não vitais — prova de que, mesmo danificadas, permitiam o retorno à base. Já os aviões atingidos gravemente no cockpit, nos motores ou na cauda não retornavam. Por isso, não apareciam na amostra analisada.
Esse é um exemplo clássico do que, em estatística, se denomina viés de seleção; mais especificamente, viés de sobrevivência. Dados analisados sem consideração adequada do processo de seleção podem induzir a conclusões equivocadas, especialmente quando reforçam uma intuição aparentemente lógica.
Quando Só os Vencedores São Contados
A empresa americana de análise de investimentos Morningstar criou a categoria de fundos denominada Large Blend, composta por fundos que investem em ações de grandes empresas listadas nas bolsas dos Estados Unidos.
De acordo com seus cálculos, esses fundos apresentaram valorização média de 178,4% entre 1995 e 2004 — o equivalente a quase 11% ao ano, um excelente desempenho para os padrões do mercado americano.
Para chegar a esse resultado, a Morningstar considerou todos os fundos classificados como Large Blend e analisou sua evolução ao longo de dez anos. Mas ignorou os fundos que deixaram de existir no período, justamente aqueles com maior chance de terem apresentado menor lucratividade.
Avaliar o desempenho de uma categoria ao longo de uma década considerando apenas os fundos que permanecem em operação ao final do período constitui uma distorção evidente, que tende a superestimar os resultados. Se os fundos encerrados fossem incluídos no cálculo, a rentabilidade acumulada cairia para 134,5%, o que corresponde a uma taxa média anual inferior a 9%.
Resumindo
A análise de dados deve começar pela verificação de sua representatividade. Como os estatísticos ressaltam há muito tempo, é essencial assegurar que todos os elementos da população tenham a mesma probabilidade de serem incluídos na amostra.
Não há nada mais enganador do que um fato óbvio. —Sherlock Holmes
INSTITUTO DE ENGENHARIA. Uma defesa apaixonada do pensamento matemático. Instituto de Engenharia, 18 maio 2015. Disponível em: https://www.institutodeengenharia.org.br/site/2015/05/18/uma-defesa-apaixonada-do-pensamento-matematico/. Acesso em: 3 fev. 2026.
POST260303 de mar/26








