28 | maio | 2018 | Bachmann

The signal and the Noise

Fazendo uso de exemplos fundamentados na polÃtica norte-americana, nos jogos de baseball, em projeÃ§Ãµes econÃ´micas e na probabilidade de ocorrÃªncias de terremotos, o autor apresenta os aspectos mais importantes no trabalho de previsÃ£o de resultados.

Enquanto as eleiÃ§Ãµes americanas sÃ£o tema de conhecimento comum, as muitas consideraÃ§Ãµes sobre beisebol – esporte pouco conhecido entre nÃ³s – podem ser enfadonhas; o capÃtulo sobre a bolha do pÃ´quer foi, ao menos para mim, intragÃ¡vel.

Ainda assim, para os curiosos sobre o tema da anÃ¡lise e interpretaÃ§Ã£o de dados, Ã© um livro instigante e interessante. Mas, o foco do autor estÃ¡ nas muitas histÃ³rias interessantes e pouco contribui com ferramental para separar os sinais dos ruÃdos, como por exemplo o Controle EstatÃstico de Processos CEP, ferramenta apenas citada no texto.

Algumas observaÃ§Ãµes selecionadas:

A verdadeira era da informaÃ§Ã£o comeÃ§ou em 1440, com a invenÃ§Ã£o da imprensa por Johannes Guttemberg. Antes, uma pÃ¡gina de livro manuscrito custava cerca de 20 dÃ³lares, limitando o acesso ao conhecimento.

Ã‰ importante lembrar que os modelos sÃ£o simplificaÃ§Ãµes da realidade e devem ser usados com cuidado.

Um sinal Ã© uma indicaÃ§Ã£o de uma verdade subjacente por trÃ¡s de uma estatÃstica ou problema preditivo, enquanto ruÃdos sÃ£o padrÃµes aleatÃ³rios que podem facilmente ser confundidos com sinais. O sinal Ã© a verdade. O ruÃdo Ã© o que nos distrai da verdade.

O objetivo de qualquer modelo de prediÃ§Ã£o Ã© capturar tantos sinais quanto possÃvel e tÃ£o poucos ruÃdos quanto puder. Armstrong argumenta que â€œquanto mais complexo o modelo, piores sÃ£o as previsÃµesâ€. Ã‰ uma frase bonita que faria sucesso nas redes sociais, mas que deve ser encarada com algum ressalva.

Na estatÃstica, a confusÃ£o de tomar ruÃdos como sinais Ã© denominada overfitting. Modelos puramente estatÃsticos, com grande nÃºmero de variÃ¡veis e uma pequena quantidade de eventos para sua validaÃ§Ã£o, geralmente levam ao risco de overfitting. Esse risco Ã© consideravelmente menor quando se usa modelos fÃsicos de causa e efeito.

Segundo o autor, o caminho para maior objetividade Ã© reconhecer a influÃªncia que nossas premissas tÃªm em nossas previsÃµes.

A estatÃstica tem sido parte dos esportes desde hÃ¡ muito tempo. O primeiro conjunto de informaÃ§Ãµes – com cinco informaÃ§Ãµes sobre cada jogador – foi publicado em jornal por Henry Chadwick em 1859.

Nosso instinto Ã© categorizar as informaÃ§Ãµes, geralmente em um pequeno nÃºmero de categorias, pois isso facilita o entendimento.

A inspeÃ§Ã£o visual de um grÃ¡fico que mostra a interaÃ§Ã£o entre duas variÃ¡veis geralmente Ã© um caminho mais rÃ¡pido e confiÃ¡vel para identificar outliers nos dados do que um teste estatÃstico.

Predizer o passado Ã© um oximoro e obviamente nÃ£o pode ser contado entre os sucessos.

Uma previsÃ£o cientÃfica exige um resultado probabilÃstico, ou seja, nas previsÃµes Ã© importante informar tambÃ©m a incerteza. Coisa comum nas pesquisas eleitorais, porÃ©m rara nos resultados de outras previsÃµes. Laplace via a probabilidade como um meio caminho entre a ignorÃ¢ncia e o conhecimento.

A heurÃstica do â€œacompanhe a maioria, especialmente quando nÃ£o sabe nada melhorâ€ normalmente funciona bem.

Consenso nÃ£o Ã© sinÃ´nimo de unanimidade, mas um grande acordo obtido apÃ³s um processo de deliberaÃ§Ã£o. Ã‰, portanto, uma alternativa Ã votaÃ§Ã£o.

InformaÃ§Ã£o sÃ³ se transforma em conhecimento quando colocada em um contexto.

Fonte:

Silver, Nate. The Signal and the Noise: Why So Many Predictions Fail-But Some Don’t. The Penguin Press. New York, 2012. (InglÃªs)

Nota: JÃ¡ estÃ¡ disponÃvel em portuguÃªs.

Bachmann

Damos valor à sua informação!

Arquivo diários:28 de maio de 2018

The Signal and the Noise – Resumo do livro

Fonte: