Home // 2012 // May

Perigo, Will Robinson!

Drew Conway nos lembra que há mais na análise de dados do que ter acesso a ferramentas bacaninhas.

Repare na Zona de Perigo quando pesquisadores sem conhecimentos sólidos de Estatística botam as mãos em ferramentas tecnológicas. Na verdade, é daí que surgem muitas das conclusões ruins dos cientistas. Já falei sobre isso antes mas, para entender como a coisa acontece na prática, nada supera esta tirinha.

Se você ainda duvida da seriedade do perigo, é porque ainda não descobriu que a maior parte dos resultados de pesquisas publicados são falsos.

Qualidade é mais importante do que quantidade

Adoro Big Data. Adoro mesmo.

Só que, quanto mais olho, mais vejo que estamos entrando num ciclo de hype assustador. Parece haver (muita) gente que acha que coletar um zigalhão de dados resolve todos os problemas inerentes à análise de dados. Ah, quem dera fosse assim…

É por isso que gosto da “blasfêmia” de Meta Brown: explica quando vale a pena emburacar em Big Data e quando amostragem resolve melhor. Afinal, quanto menor a massa de dados a limpar, melhor.

Do alto da experiência de anos como faxineiro de dados, posso afirmar categoricamente: quanto menos faxina você tiver de fazer, mais feliz será.

In God We Trust

Existe uma história, provavelmente apócrifa, de que W. Edwards Deming teria cunhado a frase:

In God we trust. Everybody else bring data.

W. Edwards Deming

(O engraçado é que não há evidências de que tenha sido mesmo Deming que criou a frase.)

Me escapa completamente por que ainda há quem deixe de usar os tantos recursos que existem hoje para embasar as decisões, e vá pela “intuição” e diga que “eu já sei a resposta”.

Para os que “já sabem a resposta” existe outra frase pronta:

O que mata não é o que não sabemos. É o que sabemos mas não é verdade.