Como as pessoas reagem aos números

Se um político pretende usar os números para explicar alguma coisa aos eleitores, diz Gary Base, cientista da Universidade do Kansas, deve mostrá-los em três formatos.

Por exemplo: se ele pretende conseguir verba para montar centros de tratamento de uma doença rara, deve dizer que essa doença atinge um a cada mil brasileiros – ou seja, atinge 185 mil brasileiros. Gary Base estuda como as pessoas compreendem os números: diz que, no geral, elas acham mais fácil compreender frequências (um a cada mil), grandes porcentagens (20% ou 60%) e números absolutos (185 mil).

Mas uma coisa é explicar, outra é persuadir. Se um político pretende persuadir os eleitores, deve mostrar só o número absoluto, especialmente se for grande, como 185 mil. As pessoas dão maior importância para 185 mil brasileiros do que para 0,1% dos brasileiros, embora o número seja o mesmo.

Ao contrário, se o político da oposição pretende dissuadir os eleitores, deve usar só a versão pequena do número – 0,1%. “As pessoas não entendem números assim de verdade”, diz Base. “O que elas entendem é: isso é muito, muito pouco.”

Fonte: Revista Informática Hoje ano 24 – Julho 2008, p. 6.

Seus dados são confiáveis?

Para decisões eficazes, é necessário acesso rápido e fácil às informações relevantes e corretas. Dados que forneçam verdadeiros insights para o negócio.

Uma pesquisa mundial feita pela Kelton Research [1] indica que quase 50% das empresas relataram alguma má decisão decorrente de dados ruins.

Nem todos os dados necessitam ser atualizados continuamente, mas dados superados não são úteis e podem conduzir às más decisões. Portanto, dados têm um período de validade e os sistemas de gestão da informação devem levar isto em conta.

Apesar do grande volume de dados geralmente disponíveis, os decisores frequentemente têm dificuldade em saber quais são ou não confiáveis e quão homogêneos são em relação aos outros dados disponíveis, para que possam ser feitas comparações, correlações e projeções.

Para seu melhor uso, os dados devem, além de corretos, ser apresentados da forma adequada, algumas vezes por meio de tabelas, mas na maioria das vezes também por meio de gráficos que favoreçam seu entendimento e uso.

Referência:

1- Citada em Domo. Is Your Data Cheating on You?  Disponível em www.domo.com/blog/2012/03/is-your-data-cheating-on-you Acesso em 10.10.16.

Um pequeno detalhe

ruptura

Um pequeno detalhes faz muita diferença nos resultados das pesquisas. O exemplo abaixo, de autoria de Andrew Grenville, traduzido do site da Maru/Matchbox, é bem didático.

Como uma pequena mudança em uma questão do recenseamento teve um enorme impacto sobre a população judaica

De acordo com a Statistics Canada, havia 351.705 pessoas que identificaram sua etnia como judeus no censo de 2006. No censo de 2016, eles relataram menos da metade desse número: 143.665. Existe um êxodo de proporções bíblicas? “É óbvio que metade da comunidade judaica no Canadá não desapareceu …”, disse Shimon Koffler Fogel, presidente-executivo do Centro para Israel e Assuntos Judaicos, em entrevista ao Globe and Mail. Houve, no entanto, uma pequena mudança em uma questão censitária que teve um enorme impacto.

Vamos aprender com isso. Tanto no censo de 2006 como em 2016, a questão era a mesma: “Quais foram as origens étnicas ou culturais dos antepassados ​​dessa pessoa?” O que mudou foi uma lista de exemplos de origens étnicas. De acordo com a Statistics Canada “… a lista de exemplos de origens étnicas foi atualizada em 2016 para refletir a frequência de respostas únicas relatadas na Pesquisa Nacional de Agregados Familiares de 2011. Para 2016, “iraniano” e “mexicano” foram adicionados à lista de exemplos, enquanto “judeus” e “salvadorenhos” foram removidos”. Ao remover o exemplo de “judeus”, o número de pessoas que o escreveram como sua etnia decresceu.

Mas esse foi apenas um dos fatores que tornaram a questão vulnerável a uma mudança radical nos resultados. O fato do cidadão ter sido solicitado a escrever sua etnia, em vez de selecionar de uma lista, significava que os exemplos tinham uma influência ainda mais poderosa sobre o que as pessoas escreveram. E, para piorar as coisas, a questão da etnia é vaga. Ser judaico é uma etnia, uma identidade religiosa ou ambos? Mesmo a Statistics Canada admite que “a etnia é um conceito difícil de medir, e não existe uma classificação reconhecida internacionalmente para esse conceito”. Todos esses fatores se uniram em uma tempestade perfeita e, aparentemente, a metade da população judaica do Canadá desapareceu em poucos anos.

Existem três lições que podemos aprender com essa gafe pública por uma agência estatística bem conhecida internacionalmente:

  1. As perguntas abertas são particularmente vulneráveis ​​à influência pelo contexto;
  2. Fornecer exemplos influenciará invariavelmente os resultados;
  3. Perguntas sobre construções vagas fornecem resultados menos concretos do que parecem.

O serviço de estatísticas do Canadá deve ser penalizado pela fragilidade da questão, mas certamente não está sozinho. O Censo dos EUA (U. S. Census Bureau) faz uma pergunta muito semelhante e igualmente vulnerável sobre ascendência e etnia, e fornece exemplos da mesma maneira. Pergunto-me que grupo étnico desaparecerá repentinamente dos Estados Unidos quando mudarem seus exemplos?

Acesse o texto original em: https://marumatchbox.com/blog/tiny-change-census-question-huge-impact-jewish-population/?utm_content=65570946&utm_medium=social&utm_source=facebook (Acesso em 2.2.18).

O número de piratas influencia a temperatura global? ou Correlação implica em causa e efeito?

Quantidade de piratas versus temperatura global

Quantidade de piratas versus temperatura global

É uma brincadeira comum entre os analistas de dados a conclusão, baseada em uma forte correlação de dados [2], que a redução na quantidade de piratas provocou o aumento da temperatura global. Isso serve para mostrar que uma boa correlação nem sempre está associada a um vínculo de causa e efeito.

Mas, uma relação de causa e efeito necessariamente implica em correlação?

A resposta parece óbvia, mas talvez não seja. Melhor começar por entender que correlação quantifica a dependência linear entre duas variáveis. Logo, relações não-lineares não são percebidas.

Para esclarecer, vamos avaliar duas variáveis bem comuns, pois sabemos que a temperatura influencia a densidade da água. Mas, como a figura 1 indica, a densidade da água alcança seu maior valor a 4°C.

Figura 1 – Densidade da água versus Temperatura

Figura 1 – Densidade da água versus Temperatura

Então, não há uma relação linear ou correlação entre causa (temperatura) e efeito (densidade). Isto é, quando uma variável aumenta a outra aumenta ou quando uma aumenta a outra diminui. Não perceberíamos a anomalia observando apenas uma parte do gráfico (figura 2), o que poderia nos levar a fazer previsões irrealistas.

Figura 2 – Densidade da água versus Temperatura (0ºC a 2ºC)

Figura 2 – Densidade da água versus Temperatura (0ºC a 2ºC)

Esse tipo de fenômeno é relativamente comum e resulta em previsões com grandes erros. Portanto, antes de usar correlações, é conveniente analisar os dados, se possível graficamente, e não fazer projeções distantes dos dados existentes.

Embora tenhamos usado a variação incomum da densidade da água com a temperatura como exemplo, é bom saber que esse comportamento também ocorre em vários fenômenos sociais, como o aumento da motivação com o ganho salarial [3].

Resumindo:

  1. Uma boa correlação nem sempre está associada a um vínculo de causa e efeito.
  2. Uma relação real de causa e efeito não implica, necessariamente, em correlação.
  3. O desconhecimento do comportamento das variáveis torna arriscadas as projeções baseadas em correlações.

Referências

  1. SRIVASTAVA, Tavish. 7 most commonly asked questions on Correlation. 23.06.15. Disponível em www.analyticsvidhya.com/blog/2015/06/correlation-common-questions. Acesso em 27.04.17. (figuras 1 e 2)
  2. ANDERSEN, Erika. True Fact: The Lack of Pirates Is Causing Global Warming www.forbes.com/sites/erikaandersen/2012/03/23/true-fact-the-lack-of-pirates-is-causing-global-warming/#4a29ea263a67 Acesso em 3.05.17. (figura da capa)
  3. Gallup. Majority of American Workers Not Engaged in Their Jobs. Disponível em: www.gallup.com/poll/150383/majority-american-workers-not-engaged-jobs.aspx Acesso em 3.05.17.

Nota: Post publicado em maio de 2017 e atualizado em maio de 2020.

Qualidade dos dados. Isso é um problema?

Imagem por Tumisu em Pixabay 

A qualidade dos dados refere-se à sua capacidade de atender à finalidade pretendida. Você pode estar usando o indicador certo, mas se os dados para o cálculo estiverem errados, tuas decisões também serão erradas.

A qualidade — o grau em que os dados são adequados para uso — é julgada no momento do uso. Se atender às necessidades naquele momento, pode ser considerado “de qualidade”.

A qualidade dos indicadores e sua capacidade de contribuir para a gestão depende dos dados usados nos cálculos. Infelizmente, a experiência mostra que é comum que tais dados não sejam adequados. As principais razões são:

  • Erros por falta de padronização na coleta ou falha de entendimento sobre o que se deseja.
  • Mudança não informada na forma da coleta, para simplificar o processo.
  • Dados colhidos sem cuidado ou responsabilidade, como muitas vezes é feito na apropriação de tempo das pessoas em que qualquer soma que resulte em 40 horas por semana parece aceitável.
  • Erros na transcrição dos dados.
  • Dados manipulados para melhorar os resultados ou esconder algum resultado ruim.

O hábito de dar uma “melhorada” nos dados para que resultados ruins não cheguem aos superiores ou ao público é, infelizmente, bastante comum.

Essa prática, delicadamente chamada de “massagear os dados”, leva a situações como a de Detroit, nos Estados Unidos. A cidade acabou acusada de camuflar a quantidade de mortes porque não queria ser conhecida como a “capital norte-americana dos homicídios”. Após análise, os críticos concluíram que Detroit adotava um critério diferente das demais grandes cidades americanas para contar os assassinatos. Eles escaparam do rótulo, mas os funcionários foram atacados pela mídia [1].

Lee Schwartz, especialista em indicadores, conta um caso em que os produtos que não podiam ser entregues no prazo eram negociados com os clientes e se eles concordavam com a mudança de data, eram computados como “Entregues no Prazo (“On Time Delivery“) [2].

As organizações devem abordar de frente a qualidade dos dados, implementar políticas, criar estruturas organizacionais e promover cultura na qual [3]:

  • Os criadores de dados criam dados corretamente, pela primeira vez, com total entendimento do que isso significa para os clientes, aqueles que usam os dados que eles criam.
  • Os clientes de dados devem comunicar seus requisitos de dados às fontes de dados e fornecer feedback quando os dados estiverem errados.
  • Praticamente todos reconhecem que são ao mesmo tempo criadores e clientes de dados.

Antes de usar um conjunto de resultados no cálculo de indicadores é necessário efetuar uma “limpeza” na amostra. Essa atividade, que inclui identificar e, se for o caso, excluir outliers, buscar valores faltantes e esclarecer anomalias, é frequentemente ignorada, com péssimos efeitos para a gestão e para a credibilidade dos responsáveis.

Portanto, para uma gestão eficaz, os dados devem ser adequados, válidos e confiáveis. Parte da solução do problema é adotar uma cultura na qual os resultados dos indicadores são usados como aprendizado para a melhoria dos processos e não para premiar ou penalizar as pessoas.

        Apenas informações confiáveis permitem conclusões confiáveis. Daí a importância da qualidade dos dados.

Os indicadores em tua organização oferecem referência adequada para responder as perguntas associadas à gestão? Qual é o maior problema encontrado?

Referências

1. Is Your Data Cheating on You? Disponível em: www.domo.com/learn/executive-brief-is-your-data-cheating-on-you Acesso em 10.10.16

2. It’s All in the numbers – KPI Best Practices. Disponível em:https://www.industryweek.com/operations/continuous-improvement/article/22008174/its-all-in-the-numbers-kpi-best-practices Acesso em 13.12.22.

3. Redman, Thomas C. Break the Bad Data Habit. Harvard Business Review. May 30, 2012. Disponível em https://hbr.org/2012/05/break-the-bad-data-habit Acesso em 17.4.24

Saiba mais

Números significativos / Arredondamento de números / Caracterizando a qualidade dos dados

POST170321 de mar/17 atualizado em abr/24

Entregue o relatório do 4º Benchmarking Paranaense de Recursos Humanos

O relatório do 4º Benchmarking Paranaense de Recursos Humanos foi enviado sexta-feira (dia 31 de agosto), às empresas que participaram do levantamento fornecendo dados.

Essa edição do Benchmarking avaliou 12 indicadores, como: absenteísmo, rotatividade e grau de terceirização, entre outros, usando uma amostra com mais de 200.000 empregados, de 235 organizações.

Cópias adicionais podem ser obtidas junto à ABRH-PR (41 3262-4317  abrh-pr@abrh-pr.org.br – R. Prof. Brandão, 520 – Alto da Rua Quinze) por R$100,00 para associados e R$150,00 para não associados e alunos do ISAE/FGV.

Maiores informações sobre o projeto podem ser encontradas em: www.bachmann.com.br/website/indicadores_rh.htm