The Signal and The Noise: Why So Many Predictions Fail-but Some Don’t – Nate Silver (09/2018)

Nate Silver e o fundador do famoso site de previsões FiveThrirtyEight. O site, que inicialmente era um blog, ficou famoso em 2008 ao predizer, com bastante acuracidade, a vitória do então senador Barack Obama sobre a ex-primeira dama e ex-senadora Hillary Clinton, na corrida pela nomeação do candidato a presidente do partido democrata norteamericano. Mais tarde Nate viria também a predizer a vitória de Obama.

Porém, mesmo antes da fama, como conta em The Signal and The Noise, Nate já havia acumulado alguma fama (e dinheiro) através do uso de análise estatística na produção de predições ou na criação de técnicas preditivas aplicadas. Algumas das áreas em que ele esteve envolvido com algum sucesso foram na análise de jogadores de baseball, bolsa de valores e no poker.

No livro, Nate traz uma série de casos em que o uso da estatística pode ser um fator determinante ou um fracasso, dependendo da forma como ela é usada. O ponto principal que o livro traz é a importância de conseguir separar o que realmente é um dado valioso para uso em modelos preditivos, do que é apenas “barulho”, ou seja, dados que, apesar de a primeira vista parecerem fazer sentido ao explicar algo, na verdade não passam de informação que não é útil e/ou que não apresenta causalidade, apesar de apresentar correlação.

O cuidado em separar o sinal do barulho é ainda mais preocupante no mundo atual, onde diariamente um enorme volume de dados é gerado, ou seja, onde a quantidade de sinal aumentou levemente, porem o ruído aumentou consideravelmente. É mais ou menos o conceito de “untangling the data hairball” presente no livro Big Data Marketing.

Cada capítulo do livro apresenta um tema central onde o autor traz exemplos de previsões que falharam miserávelmente e porque elas falharam, mas também casos onde o trabalho dos forecasters foi realizado com primazia. E aqueles que mais conseguem ser efetivos na função de predizer algo, seja na área política, na previsão do tempo ou na detecção e acompanhamento de furações, são justamente aqueles que sabem dos limites da análise estatística, dos seus próprios limites e que, além de se aterem aos dados e à ciência, sabem estimar o nível de imprevisibilidade dos dados que se propõem a estudar.

Acho que o único problema do livro e a doutrinação acerca da probabilidade bayesiana que o autor faz. Sim, o Teorema de Bayes pode ser aplicado a uma série de situações, mas existem diversas técnicas estatísticas importantes que não podem ser ignoradas, até porque para usar Bayes, provavelmente alguma destas técnicas precisam ser utilizadas na preparação dos dados.

É um livro interessante, porém que pressupõe que o leitor já tenha algum conhecimento em análise de dados, modelos estatísticos ou matemáticos, raciocínio lógico. Se não for o caso, ainda aconselho A Field Guide to Lies como “iniciação”.

Be happy 🙂

Deixe um comentário

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair /  Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair /  Alterar )

Conectando a %s