O número de piratas influencia a temperatura global? ou Correlação implica em causa e efeito?

Quantidade de piratas versus temperatura global

Quantidade de piratas versus temperatura global

É uma brincadeira comum entre os analistas de dados a conclusão, baseada em uma forte correlação de dados [2], que a redução na quantidade de piratas provocou o aumento da temperatura global. Isso serve para mostrar que uma boa correlação nem sempre está associada a um vínculo de causa e efeito.

Mas, uma relação de causa e efeito necessariamente implica em correlação?

A resposta parece óbvia, mas talvez não seja. Melhor começar por entender que correlação quantifica a dependência linear entre duas variáveis. Logo, relações não-lineares não são percebidas.

Para esclarecer, vamos avaliar duas variáveis bem comuns, pois sabemos que a temperatura influencia a densidade da água. Mas, como a figura 1 indica, a densidade da água alcança seu maior valor a 4°C.

Figura 1 – Densidade da água versus Temperatura

Figura 1 – Densidade da água versus Temperatura

Então, não há uma relação linear ou correlação entre causa (temperatura) e efeito (densidade). Isto é, quando uma variável aumenta a outra aumenta ou quando uma aumenta a outra diminui. Não perceberíamos a anomalia observando apenas uma parte do gráfico (figura 2), o que poderia nos levar a fazer previsões irrealistas.

Figura 2 – Densidade da água versus Temperatura (0ºC a 2ºC)

Figura 2 – Densidade da água versus Temperatura (0ºC a 2ºC)

Esse tipo de fenômeno é relativamente comum e resulta em previsões com grandes erros. Portanto, antes de usar correlações, é conveniente analisar os dados, se possível graficamente, e não fazer projeções distantes dos dados existentes.

Embora tenhamos usado a variação incomum da densidade da água com a temperatura como exemplo, é bom saber que esse comportamento também ocorre em vários fenômenos sociais, como o aumento da motivação com o ganho salarial [3].

Resumindo:

  1. Uma boa correlação nem sempre está associada a um vínculo de causa e efeito.
  2. Uma relação real de causa e efeito não implica, necessariamente, em correlação.
  3. O desconhecimento do comportamento das variáveis torna arriscadas as projeções baseadas em correlações.

Referências

  1. SRIVASTAVA, Tavish. 7 most commonly asked questions on Correlation. 23.06.15. Disponível em www.analyticsvidhya.com/blog/2015/06/correlation-common-questions. Acesso em 27.04.17. (figuras 1 e 2)
  2. ANDERSEN, Erika. True Fact: The Lack of Pirates Is Causing Global Warming www.forbes.com/sites/erikaandersen/2012/03/23/true-fact-the-lack-of-pirates-is-causing-global-warming/#4a29ea263a67 Acesso em 3.05.17. (figura da capa)
  3. Gallup. Majority of American Workers Not Engaged in Their Jobs. Disponível em: www.gallup.com/poll/150383/majority-american-workers-not-engaged-jobs.aspx Acesso em 3.05.17.

Nota: Post publicado em maio de 2017 e atualizado em maio de 2020.