Comentários sobre o livro
É quase um texto didático que aborda a análise de dados e apresenta diversas ferramentas para tornar essa atividade mais prática e eficaz, destacando os princÃpios fundamentais do trabalho:
- Mostrar comparações, contrastes e diferenças.
- Mostrar causalidade, mecanismo, explicações e estrutura sistemática.
- Mostrar dados multivariados; ou seja, mais de uma ou duas variáveis.
- Integrar completamente palavras, números, imagens e diagramas.
- Descrever minuciosamente as evidências.
O texto oferece dicas sobre o uso do Excel e, também (CapÃtulo 9) uma introdução prática e simples ao software estatÃstico R, disponÃvel gratuitamente na Internet e um dos mais usados para a análise de dados. O capÃtulo sobre erros é especialmente útil e didático.
Seguem alguns conceitos apresentados no livro:
- A visualização dos dados objetiva, na maioria das vezes, facilitar comparações.
- Como regra geral, o eixo horizontal do gráfico de dispersão representa a variável independente (a variável que imaginamos ser uma causa), e o eixo vertical a variável dependente (que imaginamos ser o efeito).
- Uma maneira de tornar a visualização multivariada (isto é, com mais de duas variáveis) é colocar vários gráficos de dispersão de duas variáveis próximos uns dos outros, para facilitar a comparação visual.
- Um aspecto importante da análise de dados é sua consolidação resumida por meio de médias, medianas, etc., com foco no que é importante saber para monitorar ou melhorar o processo.
- A regressão é uma ferramenta estatÃstica incrivelmente poderosa que, quando usada corretamente, tem a capacidade de ajudar a prever determinados valores. Quando usada em um experimento controlado, a regressão pode realmente ajudar a prever o futuro.
- A extrapolação é diferente da interpolação, na qual você está prevendo pontos dentro do seu intervalo de dados e para a qual a regressão é projetada. A interpolação é boa, mas você deve desconfiar da extrapolação.
- A divisão de dados em grupos é chamada de segmentação, e é útil para usar diferentes modelos preditivos para os subgrupos, resultando em menos erros em todos os modelos.
- O segredo sujo da análise de dados é que, como analista, você pode gastar mais tempo limpando os dados do que analisando-os.
O livro:
Milton, Michael. Head First: Data Analysis. O’Reilly Media, USA. 2009. ISBN: 978-0-596-15393-9. (em inglês) – DisponÃvel em português: “Use a Cabeça! Análise de Dadosâ€, pela Alta Books.