Geralmente acontece quando os dados não podem ultrapassar um limite. O pico se aproxima de um dos lados, e os dados fora de padrão decrescem para o lado oposto.
Bimodal
O histograma bimodal, ou com dois picos, geralmente ocorre quando são tratadas duas amostras distintas. A análise deve ser feita separadamente, observando ao desenho dos dois gráficos. Edward Tufte [1] apresenta, didaticamente, um histograma com distribuição bimodal de estudantes de faculdade organizados por altura, (veja a foto).
1. Tufte, Edward. Mini Tufte. Versão eletrônica. Página 40, reproduzido de Brian L. Joiner. “Living Histogramsâ€. International Statistics Review, 43 (1975). pp. 339-240. DisponÃvel em: https://www.cs.unm.edu/~pgk/IVCDs14/minitufte.pdf Acesso em 5.3.21
Para exemplificar, ele apresenta em detalhes as análises que levaram a identificar a fonte da cólera em Londres em 1854 e o acidente com o ônibus espacial Challenger, que já havia explorado no livro Beautiful Evidence. Naquela publicação, ele fez uma análise das causas básicas do acidente que provocou a explosão do ônibus espacial, matando 11 pessoas e trazendo um prejuÃzo enorme à reputação da NASA. Ainda comenta as diferentes visões e explicações dos administradores, psicólogos e engenheiros que tentaram explicar os fatos que levaram à catástrofe.
4. Messerl. Franz H. i, Chocolate Consumption, Cognitive Function, and Nobel Laureates. The New England Journal of Medicine. 18.10.12. DisponÃvel em http://www.nejm.org/doi/full/10.1056/NEJMon1211064. Acesso em 17.04.20.
É quase um texto didático que aborda a análise de dados e apresenta diversas ferramentas para tornar essa atividade mais prática e eficaz, destacando os princÃpios fundamentais do trabalho:
Mostrar comparações, contrastes e diferenças.
Mostrar causalidade, mecanismo, explicações e estrutura sistemática.
Mostrar dados multivariados; ou seja, mais de uma ou duas variáveis.
Integrar completamente palavras, números, imagens e diagramas.
A visualização dos dados objetiva, na maioria das vezes, facilitar comparações.
Como regra geral, o eixo horizontal do gráfico de dispersão representa a variável independente (a variável que imaginamos ser uma causa), e o eixo vertical a variável dependente (que imaginamos ser o efeito).
Milton, Michael. Head First: Data Analysis. O’Reilly Media, USA. 2009. ISBN: 978-0-596-15393-9. (em inglês) – DisponÃvel em português: “Use a Cabeça! Análise de Dadosâ€, pela Alta Books.
Nudge: Improving Decisions About Health, Wealth, and Happiness.
CrÃtica do livro
Escrito por Richard H. Thaler, ganhador do Prêmio Nobel de Economia e Cass R. Sunstein, laureado pelo governo da Noruega pelo uso prático dos conhecimentos acadêmicos, o livro descreve como pequenos cuidados no design das alternativas oferecidas às pessoas podem contribuir para melhores decisões, com ganhos para todos e sem interferência na liberdade individual das pessoas.
Os autores justificam essas ações, ou “nudgesâ€, porque questionam a capacidade das pessoas de fazer boas escolhas, ainda que no interesse delas próprias. Citam que em muitos casos as decisões acabam sendo tomadas pelas pessoas que estruturam os processos, os chamados “arquitetos das decisões“. Isso ocorre, por exemplo, quando são definidos os “defaultsâ€, ou as opções que serão automaticamente adotadas se não forem informadas ou selecionadas outras. Afinal, poucas pessoas se dão ao trabalho de fazer personalizações e ajustes para sua situação particular, seja em um software, seja em um contrato.
Em alguns trechos, como quando discute opções para bolsas de estudos e planos de previdência, o texto fica chato. Mas, no geral, tem exemplos interessantes e agradáveis.
É uma boa leitura para executivos, jornalistas, designers, curiosos e para quem deseja se aprimorar na capacidade de analisar criticamente as situações ou tomar melhores decisões. Deveria ser leitura obrigatória para todo legislador.
Fonte
Thaler, Richard H. e Sunstein, Cass R. Nudge: Improving Decisions About Health, Wealth, and Happiness. Penguin Books. USA. 2009.
Do mesmo modo que há pequenas variações no sabor dos bolos ou churrascos,
ainda que preparados pela mesma pessoa, todos os processos têm alguma variação
natural e inerente.
Muitas vezes, levados por resultados que estão dentro da faixa normal de
variação, tendemos a atuar de forma indevida no processo, provocando sua piora
ou o desperdÃcio de recursos.
Ao pesar 72,5 kg,
a pessoa não decidiria iniciar imediatamente uma dieta. Ela sabe que pequenas
variações são normais e não representam descontrole no peso.
Entretanto essa
mesma pessoa, ao observar o indicador mensal de absenteÃsmo em sua empresa,
sente-se na obrigação de “tomar uma ação” se o resultado do indicador
se elevou um pouco.
Por quê isso
acontece? Porque com seu peso ela já tem sensibilidade sobre quais variações
podem ser consideradas normais, mas o mesmo não acontece na medida do
absenteÃsmo.
1. Campos, Vicente Falconi, TQC – Controle da Qualidade Total: no estilo japonês, Belo Horizonte, Editora de Desenvolvimento Gerencial, 1999.
2. Wheeler, Donald J. Understanding Variation: The key to managing chaos. SPC Press, Inc. Tenesse. 1993.
3. Siqueira, Luiz G. P. Controle EstatÃstico do Processo. Pioneira. São Paulo. 1997.
Serviço: A
Bachmann & Associados oferece serviço de consultoria, ajudando sua equipe a
construir e usar Gráficos de Controle (CEP) de modo fácil e prático.
Durante a Segunda Guerra Mundial, na tentativa de reduzir o número de aviões abatidos pelo inimigo, os aliados estudaram onde os aviões retornados sofreram mais danos. Desta forma, eles poderiam reforçar essas partes. A conclusão: reforçar as pontas das asas, os lemes e o centro do avião, que foi onde eles identificaram mais impactos.
Mas Abraham Wald, um estatÃstico que trabalhava para a defesa, propôs algo diferente: reforçar o cockpit, os motores e as costas do corpo. E por que reforçar as áreas onde não houve impactos?
Wald identificou que a distribuição dos impactos seria mais ou menos homogênea. Eles viram impactos em áreas que não eram vitais. Porque, apesar de sofrerem grandes danos, os aviões conseguiram retornar à base.
Se um avião receber grandes danos na cabine, nos motores e na cauda, ele será abatido e, assim, será incapaz de retornar à base. Mas estes não foram considerados no estudo inicial.
Outro exemplo, desta vez na análise de fundos de investimento, mostra problema semelhante. A empresa de análise de investimentos americana Morningstar criou uma categoria de fundos chamada Large Blend — aqueles que aplicam em ações de grandes empresas da bolsa americana.
Para chegar ao resultado, a Morningstar pegou todos os fundos classificados como Large Blend e viu quanto cresceram no prazo de dez anos. Mas ignorou os fundos que já não existiam; esses, provavelmente, são os que não deram lucro.
A história dos testes de “significância” envolve
estatÃsticos que se desprezavam. Tudo
começou com um grupo de acadêmicos que se reuniu para o chá, em 1920. Uma delas
foi a Dra. Blanche Bristol que, quando recebeu uma xÃcara de chá de um colega,
recusou. O homem colocava o chá e depois
acrescentava o leite. A Dra. Bristol
rejeitou-o porque preferia que o leite fosse despejado primeiro no copo. O Dr. Ronald Aylmer Fisher, que servira o
chá, afirmou que ela não notaria a diferença.
Ela insistiu que podia. O Dr.
Fisher propôs um teste, que ele descreveu em seu livro The Design of
Experiments. Ele prepararia oito xÃcaras de chá; quatro com o chá derramado primeiro e quatro com
o leite servido primeiro. Ela tinha que
adivinhar qual era qual.
Ele propôs a hipótese nula de que ela seria incapaz de fazer
isso corretamente. Fisher calculou que a
chance de adivinhar todos os copos corretamente era de 1/70. Ele estava disposto a reconhecer sua
habilidade (rejeitando a hipótese nula) apenas nesse caso. Ela, supostamente, acertou todos. A hipótese nula foi rejeitada. Este foi o começo do teste de significância.