The Signal and the Noise – Resumo do livro

The signal and the Noise

Fazendo uso de exemplos fundamentados na política norte-americana, nos jogos de baseball, em projeções econômicas e na probabilidade de ocorrências de terremotos, o autor apresenta os aspectos mais importantes no trabalho de previsão de resultados.

Enquanto as eleições americanas são tema de conhecimento comum, as muitas considerações sobre beisebol – esporte pouco conhecido entre nós – podem ser enfadonhas; o capítulo sobre a bolha do pôquer foi, ao menos para mim, intragável.

Ainda assim, para os curiosos sobre o tema da análise e interpretação de dados, é um livro instigante e interessante. Mas, o foco do autor está nas muitas histórias interessantes e pouco contribui com ferramental para separar os sinais dos ruídos, como por exemplo o Controle Estatístico de Processos CEP, ferramenta apenas citada no texto.

Algumas observações selecionadas:

A verdadeira era da informação começou em 1440, com a invenção da imprensa por Johannes Guttemberg. Antes, uma página de livro manuscrito custava cerca de 20 dólares, limitando o acesso ao conhecimento.

É importante lembrar que os modelos são simplificações da realidade e devem ser usados com cuidado.

Um sinal é uma indicação de uma verdade subjacente por trás de uma estatística ou problema preditivo, enquanto ruídos são padrões aleatórios que podem facilmente ser confundidos com sinais. O sinal é a verdade. O ruído é o que nos distrai da verdade.

O objetivo de qualquer modelo de predição é capturar tantos sinais quanto possível e tão poucos ruídos quanto puder. Armstrong argumenta que “quanto mais complexo o modelo, piores são as previsões”. É uma frase bonita que faria sucesso nas redes sociais, mas que deve ser encarada com algum ressalva.

Na estatística, a confusão de tomar ruídos como sinais é denominada overfitting. Modelos puramente estatísticos, com grande número de variáveis e uma pequena quantidade de eventos para sua validação, geralmente levam ao risco de overfitting. Esse risco é consideravelmente menor quando se usa modelos físicos de causa e efeito.

Segundo o autor, o caminho para maior objetividade é reconhecer a influência que nossas premissas têm em nossas previsões.

A estatística tem sido parte dos esportes desde há muito tempo. O primeiro conjunto de informações – com cinco informações sobre cada jogador – foi publicado em jornal por Henry Chadwick em 1859.

Nosso instinto é categorizar as informações, geralmente em um pequeno número de categorias, pois isso facilita o entendimento.

A inspeção visual de um gráfico que mostra a interação entre duas variáveis geralmente é um caminho mais rápido e confiável para identificar outliers nos dados do que um teste estatístico.

Predizer o passado é um oximoro e obviamente não pode ser contado entre os sucessos.

A estatística é uma das habilidades fundamentais necessárias à ciência dos dados.

Uma previsão científica exige um resultado probabilístico, ou seja, nas previsões é importante informar também a incerteza. Coisa comum nas pesquisas eleitorais, porém rara nos resultados de outras previsões. Laplace via a probabilidade como um meio caminho entre a ignorância e o conhecimento.

A heurística do “acompanhe a maioria, especialmente quando não sabe nada melhor” normalmente funciona bem.

Consenso não é sinônimo de unanimidade, mas um grande acordo obtido após um processo de deliberação. É, portanto, uma alternativa à votação.

Informação só se transforma em conhecimento quando colocada em um contexto.

Fonte:

Silver, Nate. The Signal and the Noise: Why So Many Predictions Fail-But Some Don’t. The Penguin Press. New York, 2012. (Inglês)

Nota: Já está disponível em português.

Informação motiva e gera pertencimento

Somos um

De acordo com uma pesquisa com 2.000 empregados nos Estados Unidos e Reino Unido:

  • Mais de 80% das pessoas gostaria que seus chefes compartilhassem mais informações de desempenho do negócio.
  • 25% dos empregados saíram, ou conhecem alguém que saiu, do emprego porque não recebia informações sobre o desempenho do negócio.
  • Mais da metade dos respondentes disseram que conhecer os dados de desempenho da companhia contribuiu significativamente para sua boa performance.

Fonte: Research Report: One in four employees leave due to Mushroom Management de Simon Whittick, www.geckoboard.com/blog/research-report-one-in-four-employees-leave-due-to-mushroom-management/#.WM8NUxjOpp9 Acesso em 21.09.15.

Quem não mede não gerencia.

Medidas

Graças a internet, não sabemos se quem disse isso foi Deming, Falconi, Einstein ou o Érico Veríssimo. Independentemente da origem, sabemos que é verdade. Mas, o fato é que não basta medir. É importante medir a coisa correta, pois a simples existência da medida já comunica à equipe o que é importante, contribuindo para a melhoria dos resultados.

Cuidado! O indicador dirige os resultados.

callcenter

Há algum tempo, o call center da Dell usava o indicador “Tempo de Atendimento”, que descrevia o tempo gasto no telefone com um determinado cliente. A intenção era tornar o atendimento mais dinâmico e eficaz.

Entretanto, isso acabou incentivando que os atendentes transferissem qualquer problema mais complexo para outros e, enquanto o tempo de atendimento efetivamente baixou, a satisfação dos clientes desandou.

A Dell então trouxe um gerente da área de manufatura que mudou a métrica de atendimento para “Tempo Total Despendido pelo Cliente no Telefone”. De imediato os consumidores da Dell disseram que a qualidade do serviço de atendimento melhorou dramaticamente.

Este exemplo ilustra claramente a importância da escolha dos indicadores usados na gestão.

Fonte: Petrone, Paul. The Two Recruting Metrics That Actually are Worth Measuring.