Head First – Data analysis

Comentários sobre o livro

É quase um texto didático que aborda a análise de dados e apresenta diversas ferramentas para tornar essa atividade mais prática e eficaz, destacando os princípios fundamentais do trabalho:

  • Mostrar comparações, contrastes e diferenças.
  • Mostrar causalidade, mecanismo, explicações e estrutura sistemática.
  • Mostrar dados multivariados; ou seja, mais de uma ou duas variáveis.
  • Integrar completamente palavras, números, imagens e diagramas.
  • Descrever minuciosamente as evidências.

O texto oferece dicas sobre o uso do Excel e, também (Capítulo 9) uma introdução prática e simples ao software estatístico R, disponível gratuitamente na Internet e um dos mais usados para a análise de dados. O capítulo sobre erros é especialmente útil e didático.

Seguem alguns conceitos apresentados no livro:

  • A visualização dos dados objetiva, na maioria das vezes, facilitar comparações.
  • Como regra geral, o eixo horizontal do gráfico de dispersão representa a variável independente (a variável que imaginamos ser uma causa), e o eixo vertical a variável dependente (que imaginamos ser o efeito).
  • Uma maneira de tornar a visualização multivariada (isto é, com mais de duas variáveis) é colocar vários gráficos de dispersão de duas variáveis próximos uns dos outros, para facilitar a comparação visual.
  • Um aspecto importante da análise de dados é sua consolidação resumida por meio de médias, medianas, etc., com foco no que é importante saber para monitorar ou melhorar o processo.
  • A regressão é uma ferramenta estatística incrivelmente poderosa que, quando usada corretamente, tem a capacidade de ajudar a prever determinados valores.  Quando usada em um experimento controlado, a regressão pode realmente ajudar a prever o futuro.
  • A extrapolação é diferente da interpolação, na qual você está prevendo pontos dentro do seu intervalo de dados e para a qual a regressão é projetada. A interpolação é boa, mas você deve desconfiar da extrapolação.
  • A divisão de dados em grupos é chamada de segmentação, e é útil para usar diferentes modelos preditivos para os subgrupos, resultando em menos erros em todos os modelos.
  • O segredo sujo da análise de dados é que, como analista, você pode gastar mais tempo limpando os dados do que analisando-os.

O livro:

Milton, Michael. Head First: Data Analysis. O’Reilly Media, USA. 2009. ISBN: 978-0-596-15393-9. (em inglês) – Disponível em português: “Use a Cabeça! Análise de Dados”, pela Alta Books.

Nudge: Improving Decisions About Health, Wealth, and Happiness.

Nudge: Improving Decisions About Health, Wealth, and Happiness.

Crítica do livro

Escrito por Richard H. Thaler, ganhador do Prêmio Nobel de Economia e Cass R. Sunstein, laureado pelo governo da Noruega pelo uso prático dos conhecimentos acadêmicos, o livro descreve como pequenos cuidados no design das alternativas oferecidas às pessoas podem contribuir para melhores decisões, com ganhos para todos e sem interferência na liberdade individual das pessoas.

Os autores justificam essas ações, ou “nudges”, porque questionam a capacidade das pessoas de fazer boas escolhas, ainda que no interesse delas próprias. Citam que em muitos casos as decisões acabam sendo tomadas pelas pessoas que estruturam os processos, os chamados “arquitetos das decisões“. Isso ocorre, por exemplo, quando são definidos os “defaults”, ou as opções que serão automaticamente adotadas se não forem informadas ou selecionadas outras. Afinal, poucas pessoas se dão ao trabalho de fazer personalizações e ajustes para sua situação particular, seja em um software, seja em um contrato.

Em alguns trechos, como quando discute opções para bolsas de estudos e planos de previdência, o texto fica chato. Mas, no geral, tem exemplos interessantes e agradáveis.

É uma boa leitura para executivos, jornalistas, designers, curiosos e para quem deseja se aprimorar na capacidade de analisar criticamente as situações ou tomar melhores decisões. Deveria ser leitura obrigatória para todo legislador.

Fonte

Thaler, Richard H. e Sunstein, Cass R. Nudge: Improving Decisions About Health, Wealth, and Happiness. Penguin Books. USA. 2009.

Pense Fora do Quadrado

Capa do livro: Pense Fora do Quadrado.

Comentários sobre o livro

O livro destaca as peculiaridades dos chamados “trabalhadores do conhecimento” que são importantes considerar quando se busca resultados.

Diferentemente dos operários que fazem trabalhos manuais repetitivos, e que têm o efeito de seus esforços facilmente mensurados por número de peças produzidas ou quantidade de clientes servidos, o desempenho dos profissionais que fazem trabalhos intelectuais é de avaliação mais complexa. Eles podem passar várias horas olhando para o espaço, ou lendo um livro de arte que aparentemente não tem qualquer ligação com seu trabalho e, de repente, gerar um resultado significativo para a organização.

Isso porque trabalhadores do conhecimento precisam níveis elevados de expertise, escolaridade ou experiência e seu objetivo principal no trabalho envolve a criação, a distribuição ou a aplicação do conhecimento.

Por conta da necessidade de buscar extrair o melhor destes trabalhadores, Davenport critica o uso do conceito frio de produtividade, defendendo a adoção de termos como “desempenho” e “resultados”, pois entende que abrangem produtividade e qualidade, eficiência e eficácia.

Na opinião dele, qualquer que seja a atividade ou processo empresarial que o trabalhador do conhecimento tente executar, é possível definir o nível de desempenho e resultados em termos de velocidade, custos, ausência de defeitos ou satisfação do cliente. E afirma que o desempenho e os resultados devem ser granulares o suficiente para que possam ser usados como medidas para cada trabalhador do conhecimento, para grupos de uma empresa ou para organizações inteiras.

Como dicas mais práticas, ele destaca:

  • Quase todos os trabalhadores do conhecimento precisam sentir que participaram da definição ou da redefinição de seu trabalho, se tiverem de seguir um novo processo.
  • Quanto mais criativo o trabalho do conhecimento, menos estruturado ele deve ser.

Entretanto, ele não propõe o caos e afirma que “Qualquer esforço para mudar o modo de execução do trabalho necessita de uma dose de ambos: processo – concepção de como o trabalho deverá ser feito – e prática – uma compreensão de como cada funcionário responde ao mundo real do trabalho e executa as tarefas a ele designadas. Para mudar o trabalho do conhecimento com sucesso, é necessário ter uma delicada interação entre processo e prática”.

Em resumo, apesar de antigo, é um livro interessante e útil para quem tem responsabilidade sobre a gestão de processos e profissionais voltados à criatividade, à ruptura e à inovação.

Tornar o trabalhador do conhecimento produtivo será a grande missão da administração deste século, assim como tornar produtiva a mão de obra braçal foi o principal desafio do século passado.  – Peter Drucker

O livro

Davenport, Thomas H. Pense fora do quadrado. Rio de Janeiro: Elsevier, 2006.

Um análise curiosa

É importante ter consciência que correlação não corresponde, necessariamente, a uma relação de causa e efeito e que nenhuma conclusão pode ser tirada apenas com base na correlação entre duas variáveis, como esclarece o exemplo adiante.

Uma curiosa inversão de causa e efeito

O exemplo mais interessante que vi sobre inversão entre causa e efeito foi o apresentado no clássico “Lie with Statistics” [1]. Os indígenas de Vanuatu observaram, ao longo dos séculos, que as pessoas saudáveis tinham piolhos, enquanto os doentes muitas vezes não. Então, com base nas evidências e alguma lógica, concluíram que os piolhos tornam um homem saudável e todo mundo deveria tê-los.

Já nós, à luz do conhecimento ocidental, acreditamos que quando as pessoas ficam doentes os piolhos caem fora.

Referência

1. Huff, Darrel. How to Lie with Statistics. W. W. Norton & Company Inc. New York, 1954. p. 98.

POST230606 de jul/20, atualizado em abr/24

Média versus Mediana

Imagem pelo autor

A mediana corresponde a observação do meio de um conjunto ordenado de dados, de forma que exista um número igual de observações maiores e menores que ela. Como consequência, não é afetada por dados excepcionalmente altos ou baixos.

A média aritmética, usualmente chamada apenas de “média”, por outro lado, soma todos os pontos de dados e divide pelo número de pontos de dados para determinar o valor “normal”.  Assim, a média pode ser bastante influenciada por poucos dados excepcionalmente altos ou baixos.

Veja a diferença se, por exemplo, você tiver 100 resultados, onde 97 deles são 100 e os três últimos valores são 1.000,  10.000 e 100.000,  que seriam dados extremos:

 ● Mediana = 100

 ● Média aritmética = 1.207

Essa é uma discrepância bastante grande entre as duas estatísticas que indicam o ponto central dos dados. Então, devemos ser cuidadosos na escolha para a análise e publicação de dados.

Em resumo

A vantagem, em relação à média, é que a mediana geralmente representa melhor o valor típico da amostra, pois não é distorcida por valores extremamente altos ou baixos. Portanto, nas comparações, de modo geral é melhor usar a mediana. Entretanto, o ideal é que a decisão seja tomada depois de observar a distribuição dos dados.

Nota: Quando um texto em inglês usa o termo “average”, pode estar se referindo à média, à mediana ou à moda, três conceitos de valor central bastante diferente. É preciso cuidado. – Darrel Huff

Post de jul/20, atualizado em mar/22.

Curva de distribuição normal

A distribuição normal, também chamada distribuição gaussiana ou de Gauss, é uma das distribuições de probabilidade mais usadas para modelar fenômenos naturais. Isso porque grande número de fenômenos apresenta uma distribuição de probabilidade bem próxima da normal.

As distribuições normais têm as seguintes características:

  • Forma simétrica de sino.
  • Média e mediana iguais; ambas localizadas no centro da distribuição.
  • Aproximadamente 68% dos dados estão dentro de um desvio-padrão da média.
  • Aproximadamente 95% dos dados estão dentro de 2 desvios-padrão da média.
  • Aproximadamente 99,7% dos dados estão dentro de 3 desvios-padrão da média.

Saiba mais em: https://pt.khanacademy.org/math/statistics-probability/modeling-distributions-of-data/normal-distributions-library/a/normal-distributions-review

Post de jul/20 atualizado em mar/22.

Medindo o desempenho de máquinas

Imagem por MustangJoePixabay 

         Alguns cuidados que favorecem a boa gestão.

Os fatores que influenciam a eficiência das máquinas podem ser técnicos e operacionais.

Os fatores técnicos incluem a velocidade de operação, a qualidade da manutenção e os aspectos relacionados à instalação.

Os fatores operacionais compreendem as características dos operadores (habilidade, agilidade, etc.), o suprimento de matéria-prima, interferências de outras máquinas e as características do produto [1].

Logo, a avaliação do desempenho de uma máquina deve ocorrer em diversos níveis. No primeiro, observa-se a performance geral. No seguinte, monitoram-se as eficiências técnica e operacional. Posteriormente, a mensuração deve ser estratificada de modo a entender cada um dos fatores que influenciam negativamente as diversas eficiências.

Essa abordagem, que vai do geral para o específico, evita o desperdício de recursos, pois concentra a atenção nos fatores que estão contribuindo de forma mais intensa para as perdas de desempenho.

Por exemplo, uma máquina de papel que fabrica vários tipos de produto tem maior influência de fatores operacionais que outra que produz um único tipo de papel. Logo, as medidas das eficiências técnica e operacional possivelmente irão conduzir o trabalho de acompanhamento a um maior detalhamento dos aspectos operacionais, nos quais o benefício dos esforços para otimização serão maiores.

Referência:

[1] – Harding, H. A. Administração da Produção. São Paulo. Editora Atlas. 1981. p. 96.

POST200818 de jul/20, atualizado em abr/24.

ROI de Treinamento – um exemplo didático

Do ponto de vista da organização, a maneira mais eficaz de avaliar o resultado da maioria dos projetos é a Taxa de Retorno do Investimento (ROI, do inglês Return on Investment).

Para entender essa métrica que, de modo geral, é usada pela área financeira, imagine a seguinte situação: A empresa tem uma máquina envasadora semiautomática de óleo de soja operada por 4 pessoas. 

Em conversa com o gerente industrial, o RH fica sabendo que a máquina sofre várias interrupções por falha de operação e, então, oferece um treinamento para a equipe de operadores. Treinamento concluído, o gestor do RH faz a seguinte análise.

Custos

A capacitação teve os seguintes custos:

  • Instrutor – cedido gratuitamente pelo fabricante da máquina; a empresa pagou apenas as despesas de locomoção e hospedagem, totalizando R$2.000,00.
  • O treinamento, fora do horário de trabalho, exigiu 8 horas extras por empregado, ao custo unitário de R$30,00, resultando em R$960,00 (8 horas/empregado x 4 empregados x R$30,00/h).

Logo, o custo foi:

       Instrutor:            R$2.000,00

       Horas extras:    R$   960,00

       Totalizando       R$2.960,00

Benefício

Três meses depois do treinamento – período necessário para a estabilização na nova situação – o RH consulta o gerente industrial e descobre que a quantidade de interrupções na envasadora, por falha de operação, caiu 7%, resultando em uma produção 5% maior. 

Isso representou um aumento de receita de R$30.000,00/mês. Como o lucro é aprox. 3% da receita (informação obtida na contabilidade da empresa), conclui-se que o treinamento resultou em aumento de lucro de R$900,00/mês.

Ganho

Considerando que as pessoas treinadas permanecem por algum tempo na função e que, possivelmente depois de um ano, o treinamento deva ser refeito, podemos concluir que a análise do ganho deve ser feita com base em 12 meses.

Assim,

       Ganho total estimado = 12 * R$900,00 = R$10.800,00

Retorno do Investimento

Com um ganho anual estimado de R$10.800,00 e um custo de R$2.960,00, é seguro afirmar que o treinamento foi um bom negócio para a empresa.

Mas, para valorização da equipe do RH, esse sucesso deve ser comunicado em uma linguagem que seja mais bem interpretada pelos demais gestores da organização. Aqui entra o Retorno do Investimento.

ROI = (Retorno – investimento) x 100

                investimento

Considerando os valores calculados anteriormente, para o horizonte de um ano.

ROI = (10.800,00 – 2.960,00) x 100

                        2.960,00

ROI = 264,9%

Para maior clareza, algumas pessoas preferem apresentar o resultado como uma relação. No exemplo, o ROI foi de 2,6 reais por real investido.

Em geral, a maior dificuldade no cálculo da Taxa de Retorno de Investimento é avaliar os ganhos porque:

  • As informações geralmente dependem de outras áreas da organização.
  • As empresas ainda não têm uma cultura voltada a quantificar os resultados.
  • Muitos benefícios são subjetivos e de difícil tradução em números, como motivação e alinhamento da equipe.

Mas, ainda que os ganhos sejam estimados com algum erro, o cálculo do ROI torna a gestão mais objetiva e eficaz.

Dicas

Antes de solicitar recursos para investimentos em capacitação, e também para outros projetos do RH – já que a sistemática é a mesma – o ideal é fazer um cálculo preliminar do ROI, ainda que com base em estimativas de custo e benefícios. Isso permite avaliar se o ganho justifica ou não a oferta do treinamento.

A mesma metodologia pode ser usada para selecionar os projetos que estão disponíveis para execução, naturalmente priorizando aqueles com as maiores taxas de retorno do investimento.

Nota: Texto baseado em palestra apresentada via Internet para o SESCOOP/PR em 3.07.20.

Post200707 de jul/20, ajustado em out/24

A Meta – Comentário sobre o livro

Trata-se de um livro de administração, romanceado, escrito pelo físico israelense Eliyahu Goldratt. A história conta as aventuras e desventuras do gerente Alex Rogo para exemplificar, didaticamente, a Teoria das Restrições (TOC, do inglês Theory of Constraints), que tem como ponto principal a identificação dos gargalos, aqueles recursos cuja capacidade é igual ou menor que a demanda desejada deles.

A “receita” proposta por Goldratt é bem simples:

  1. Identificar os gargalos
  2. Decidir como explorar os gargalos
  3. Adequar o restante do sistema à decisão do item 2.
  4. Elevar os gargalos do sistema.
  5. Se, num passo anterior, um gargalo for eliminado, volte ao primeiro passo.

Mas, ao longo da história, ele observa diversos aspectos como inventário, demanda, etc. Observada com algum distanciamento, a Teoria das Restrições atende a pura lógica e é até surpreendente que tenha, nos anos 90, alcançado tanto sucesso. De qualquer modo, é uma leitura agradável e interessante, especialmente para os gestores de processos de produção e de entrega de serviços.

Fonte

Goldratt, Eliyahu e Cox, Jeff. A Meta: um processo de aprimoramento contínuo. Educator. 14ª ed. 2014.

Sabe a diferença entre Selo e Certificado?

Frequentemente confundidos, há diferenças entre “selo” e “certificado”. Selos podem ser criados e concedidos por empresas, instituições, associações de classe, laboratórios, organizações governamentais ou não governamentais, que descrevem regras ou padrões que são avaliados constantemente visando um objetivo estabelecido.

Os certificados, entretanto, são concedidos apenas por empresas acreditadas pelo Inmetro, que buscam evidências de conformidades com normas estabelecidas por organismos de normalização, como a Associação Brasileira de Normas Técnicas (ABNT).

Mas não é assim tão simples. Por exemplo, alguns produtos só podem ser comercializados se forem certificados pelo Inmetro; e essa certificação é informada por meio de um selo. Produtos como extintores de incêndio e aparelhos de ar-condicionado têm de ser certificados e vendidos com o selo do Inmetro para garantia da saúde e segurança dos usuários. Para alguns produtos, como a água mineral, a certificação é opcional, constituindo-se em um diferencial, mas para muitos é obrigatória. No caso do álcool em gel, o produto da moda, o que é obrigatório é a certificação da embalagem, devido ao risco de vazamento de material inflamável.

Assim, se colocarmos à venda o produto sem que a embalagem tenha o Selo do Inmetro, atestando a conformidade, estaremos nos arriscando à penalidade e, ainda pior, colocando nossos clientes em risco. A mesma coisa ocorre para brinquedos, inclusive os importados. É importante estar atento!

Post de jul/20, atualizado em jul/22.