O número de piratas influencia a temperatura global? ou Correlação implica em causa e efeito?

Quantidade de piratas versus temperatura global

Quantidade de piratas versus temperatura global

É uma brincadeira comum entre os analistas de dados a conclusão, baseada em uma forte correlação de dados [2], que a redução na quantidade de piratas provocou o aumento da temperatura global. Isso serve para mostrar que uma boa correlação nem sempre está associada a um vínculo de causa e efeito.

Mas, uma relação de causa e efeito necessariamente implica em correlação?

A resposta parece óbvia, mas talvez não seja. Melhor começar por entender que correlação quantifica a dependência linear entre duas variáveis. Logo, relações não-lineares não são percebidas.

Para esclarecer, vamos avaliar duas variáveis bem comuns, pois sabemos que a temperatura influencia a densidade da água. Mas, como a figura 1 indica, a densidade da água alcança seu maior valor a 4°C.

Figura 1 – Densidade da água versus Temperatura

Figura 1 – Densidade da água versus Temperatura

Então, não há uma relação linear ou correlação entre causa (temperatura) e efeito (densidade). Isto é, quando uma variável aumenta a outra aumenta ou quando uma aumenta a outra diminui. Não perceberíamos a anomalia observando apenas uma parte do gráfico (figura 2), o que poderia nos levar a fazer previsões irrealistas.

Figura 2 – Densidade da água versus Temperatura (0ºC a 2ºC)

Figura 2 – Densidade da água versus Temperatura (0ºC a 2ºC)

Esse tipo de fenômeno é relativamente comum e resulta em previsões com grandes erros. Portanto, antes de usar correlações, é conveniente analisar os dados, se possível graficamente, e não fazer projeções distantes dos dados existentes.

Embora tenhamos usado a variação incomum da densidade da água com a temperatura como exemplo, é bom saber que esse comportamento também ocorre em vários fenômenos sociais, como o aumento da motivação com o ganho salarial [3].

Resumindo:

  1. Uma boa correlação nem sempre está associada a um vínculo de causa e efeito.
  2. Uma relação real de causa e efeito não implica, necessariamente, em correlação.
  3. O desconhecimento do comportamento das variáveis torna arriscadas as projeções baseadas em correlações.

Referências

  1. SRIVASTAVA, Tavish. 7 most commonly asked questions on Correlation. 23.06.15. Disponível em www.analyticsvidhya.com/blog/2015/06/correlation-common-questions. Acesso em 27.04.17. (figuras 1 e 2)
  2. ANDERSEN, Erika. True Fact: The Lack of Pirates Is Causing Global Warming www.forbes.com/sites/erikaandersen/2012/03/23/true-fact-the-lack-of-pirates-is-causing-global-warming/#4a29ea263a67 Acesso em 3.05.17. (figura da capa)
  3. Gallup. Majority of American Workers Not Engaged in Their Jobs. Disponível em: www.gallup.com/poll/150383/majority-american-workers-not-engaged-jobs.aspx Acesso em 3.05.17.

Nota: Post publicado em maio de 2017 e atualizado em maio de 2020.

Viés de Confirmação (ou, somos humanos!)

Vemos o que preferimos ver

Vemos o que preferimos ver

Nas análises de dados para a gestão, devemos levar em conta que as pessoas favorecem as informações que confirmam suas crenças. Por exemplo, se um supervisor sabe que o colaborador passou por um treinamento, ele espera uma melhora no aspecto correspondente. Logo, ele pode “ver” um resultado que na realidade não existe [1]. É uma racionalização comum, no sentido de comprovar uma expectativa, mas que pode influenciar a avaliação do resultado do treinamento.

Assim como a falta de dados dificulta boa parte das análises, o excesso de dados também é inconveniente. Com um grande volume de dados, um profissional inexperiente, ou mal intencionado, acaba sempre conseguindo um conjunto de números que serve para confirmar suas crenças ou suposições.

O uso de dados e ferramentas de análise para justificar crenças é chamado de Viés de Confirmação (Confirmation Bias). E, com a disseminação das técnicas de Big Data, esse problema tende a ser cada vez mais comum, na medida em que ferramentas estatísticas e softwares complexos permitem diferentes análises que podem ser usadas para provar as teses pretendidas.

Na verdade, o Viés de Confirmação – também denominado de Efeito Hallo – atende à necessidade humana de reforçar pontos de vista conhecidos e que trazem conforto ou conveniência. Desse modo, muitos vezes é provocado de forma inconsciente.

Conhece alguma situação em que isso aconteceu em sua organização? Como ocorreu?

Referência: 1. Fitz-enz, Jac e Davison, Barbara. How to Measure Human Resources Management. McGraw-Hill. 2002. 3rd edition. p. 185.

Texto inspirado em: Webb, Jack. Better Decision Making with Objective Data is Impossible. Disponível em: http://sloanreview.mit.edu/article/for-better-decision-making-look-at-facts-not-data

 

Espelho retrovisor?

Retrovisor

Frequentemente os relatórios de gestão são acusados de mostrar apenas o passado, enquanto os críticos dizem que a organização deveria colocar seu foco no futuro. Vejo esse posicionamento com alguma ressalva. Os dados do passado, especialmente quando observados como uma série histórica, nos permitem saber se as ações que estamos tomando estão efetivamente colaborando para a melhora do desempenho e dos resultados. As séries históricas também nos permitem saber se os resultados são suficientemente estáveis e consistentes para permitir projeções e previsões. Assim, é muito bonito dizer que o importante é o futuro, mas ele será fundamentado nos resultados do passado e no aprendizado do presente.

Frequência das Medições

pes

Quem faz dieta para perder peso não sobe na balança apenas uma vez por trimestre. Mas, fazer a pesagem três vezes ao dia também não faz sentido.

Nos processos empresariais, administrativos ou não, ocorre o mesmo. Cada processo tem seu ritmo e isso deve ser levado em conta para decidir a frequência das medições e das análises dos indicadores de desempenho.

Em caso de dúvida, é melhor começar com medidas mais frequentes e, depois, espaçar. Em outros casos, a disponibilidade dos dados impõe a frequência possível, como geralmente ocorre nos indicadores financeiros.

Nota: Baseado no texto “How to set your KPI’s Calculation Cadence” de Stacey Barr, publicado em 21.07.16 (www.staceybarr.com).

Uma questão filosófica

Pensador

Uma questão filosófica

Um diretor de empresa tem o hábito de ler três jornais diários, o que lhe custa cerca de uma hora por dia. Outro se limita a ler o jornal de domingo, mas investe algum tempo refletindo sobre as tendências e os impactos de cada notícia relevante. Qual destes profissionais faz melhor uso da informação?

Da mesma forma que na vida cotidiana, o ambiente empresarial convive com uma sobrecarga de informações que não é possível absorver de forma completa. Assim, o administrador tem que ser seletivo e adotar algumas práticas que lhe permita tirar o melhor proveito dos dados disponíveis.

A maioria dos administradores quer um grande volume de informações entregue em tempo real e, para isto, investe em sofisticados sistemas que demandam trabalhos de muitas pessoas para que se mantenham atualizados. Porém, da mesma forma que na leitura diária dos jornais, não há como investir tempo para analisar e refletir sobre cada informação, para usá-la de forma a contribuir para o sucesso do negócio. Nossa posição é de que o gestor eficaz periodicamente se concentra para analisar com profundidade alguns poucos indicadores que são efetivamente importantes para seu empreendimento. Quanto às demais métricas, ele deve ter um sistema de controle, baseado em delegação aos responsáveis de cada área, para ser alertado em caso de desvios significativos.

Exemplificando: Embora a medida da inadimplência seja importante, só deveria ser destacada se superasse um patamar pré-acordado de, digamos, 2%. Nessa situação, o responsável pela área de cobrança deveria notificar de imediato seu gerente. Flutuações inferiores a este valor devem ser geridas pela área de cobrança, sem necessidade de interferência dos escalões superiores. Este tipo de indicador, de caráter operacional, deveria constar apenas de forma complementar no relatório mensal, com algum mecanismo, como cor diferenciada, destacando os casos de desvio.

Moral da história: A qualidade da análise é mais importante que a velocidade de acesso a informação.

Escolhendo indicadores

Ontem, assistindo uma palestra do Walter Longo, na Mercosuper 2012, percebi que o critério recomendado por ele para analisar as ações de marketing, composto de 3 pontos:

  • Coerência
  • Relevância
  • Eficiência

seria igualmente adequado para a escolha das métricas que devem ser usados em uma organização. Afinal, bons indicadores devem ser coerentes com a estratégia da empresa e a variação positiva em seus resultados deve ter impacto nos resultados do negócio. Também é importante que os indicadores usados sejam eficientes em avaliar as mudanças pretendidas.

Você concorda?

Médias versus extremos

O uso da média, ou ainda melhor, da mediana nas análises tem a vantagem de eliminar o efeito de números extremos que, geralmente, estão associados às excepcionalidades ou mesmo a erros. Entretanto, há casos em que os valores extremos podem ser mais úteis e relevantes para a gestão, como demonstra o depoimento de Guilherme Lessa, Diretor de TI do Banco Matone*:

“Antes a equipe de TI só considerava a média das notas que recebia dos usuários; hoje, considera os extremos. Se alguma nota está abaixo de seis ou sete, significa que a TI está fazendo algo errado, então alguém liga para a pessoa que deu a nota abaixo da média para descobrir o que aconteceu”.

* – Revista Informática Hoje. Nº 629. 2010, p. 7.