Home // Archive by category "Prática"

O Santo Graal é mágica e mágica não existe

 

Anomaly Detection for Monitoring

O primeiro parágrafo do livro Anomaly Detection for Monitoring, de Preetam Jinka e Baron Schwartz, editado pela O’Reilly com patrocínio da Ruxit, é um primor:

Wouldn’t it be amazing to have a system that warned you about new behaviors and data patterns in time to fix problems before they happened, or seize opportunities the moment they arise? Wouldn’t it be incredible if this system was completely foolproof, warning you about every important change, but never ringing the alarm bell when it shouldn’t? That system is the holy grail of anomaly detection. It doesn’t exist, and probably never will. However, we shouldn’t let imperfection make us lose sight of the fact that useful anomaly detection is possible, and benefits those who apply it appropriately.

Quantas vezes os clientes de um sistema de aprendizado de máquina não ficam decepcionados quando constatam que as predições não são 100% corretas? Se todo mundo sabe que experts humanos erram de vez em quando, por que esperar que um sistema automatizado nunca erre?

Quantas vezes não vi atitudes do tipo “se não acerta sempre não serve para nada”?

Embasar as decisões? Isso é para os frouxos!

A veneranda cadeia americana de lojas J.C.Penney está à beira do colapso graças à inacreditável arrogância do seu (agora ex) CEO, que achava que testes e pesquisas de mercado são para os frouxos. Veja a notícia no New York Times.

Em resposta aos que ponderavam que as suas ações iam contra os dados de mercado, Ronald Johnson respondia que “há dois tipos de pessoa: os que creem e os incrédulos; na Apple [onde Johnson trabalhou anteriormente], só há os que creem.”.

Ronald B. Johnson

“Sigam-me ou sejam tachados de incrédulos.”

Perigos do Excel

André Carregal me enviou este artigo de Paul Krugman numa mensagem com o subject “Bug no Excel?”. Na verdade, um subject mais apropriado seria “bug em Excel”. Excel é uma linguagem de programação e o que o artigo descreve é um programa buguento desenvolvido em Excel.

Planilhas eletrônicas são mais perigosas do que a maioria das linguagens de programação. Além da referência citada no artigo, é interessante conhecer o European Spreadsheet Risks Interest Group para se ter uma ideia do tamanho do problema. Tenho um grande amigo que se especializa em ensinar empresas a usar planilhas de maneira menos perigosa.

Uma coisa que não foi mencionada no artigo é que, de fato, o Excel tem bugs nas funções estatísticas. Há relatos de que nas últimas versões de Excel os bugs andaram sendo consertados, mas não está claro se a versão que Reinhart e Rogoff usaram ainda os continha.

Tudo isso se encaixa no contexto de uma discussão mais ampla, a da reprodutibilidade dos estudos publicados. Hoje em dia é muito fácil publicar um paper com uma seção de Métodos vaga, dizendo basicamente que “apliquei análise de Bigschutz” e sem dar maiores detalhes, e sem divulgar o conjunto de dados utilizado. Isso facilita a publicação de muitos resultados errados ou até propositalmente falsos. Nos últimos anos tenho observado uma reação forte da comunidade científica em relação a esses critérios frouxos. Parece que a tendência é algum dia termos resultados mais confiáveis, mesmo porque a coisa está feia, como já mencionei.

Como não dormir em aulas em vídeo

O que você quer aprender, na Internet tem vídeos ensinando. Matemática, biologia, leis babilônicas, como fazer pizza de chocolate, tem tudo lá. Gosto de aproveitar essa cornucópia de recursos — frequentemente gratuitos — para estudar continuamente.

O difícil é prestar atenção. Natualmente, nas aulas em vídeo os expositores falam no mesmo ritmo em que falariam numa aula ao vivo… devagar… aí começo a pensar noutras coisas… divagar… “divagar” lembra “devagar”… que outras palavras se parecem e como se associam?

Qual era o assunto mesmo?

Quando dou por mim, estive pensando noutras coisas a maior parte do tempo e perdi o que o palestrante estava falando. Droga, tenho de começar de novo. Agora vou prestar atenção… até que divago novamente.

Acabo de encontrar aqui uma solução para este problema. O objetivo de Scott era assistir às aulas mais rápido, então ele as baixa em MP4 e as assiste com o software VLC no dobro da velocidade normal. Só que isso tem o feliz efeito colateral de tornar as aulas menos sonolentas, com menos estímulos e oportunidades para divagar.

A experiência tem sido ótima. Além de ganhar tempo assistindo às aulas em menos tempo, só preciso assistir uma vez, já que presto atenção o tempo todo.

Claro que alguns conceitos são difíceis de digerir mesmo e exigem mais tempo. Para isto existe o botão de pause do tocar de vídeo, uai.

Diferença entre Ciência e Engenharia

Em The Art of Doing Science and Engineering, Richard Hamming faz uma interessante distinção entre Ciência e Engenharia:

Em Ciência, se você sabe o que está fazendo, então você não deveria estar fazendo. Em Engenharia, se você não sabe o que está fazendo, então você não deveria estar fazendo.

É algo para ter em mente. Tenho duas vidas paralelas: como pesquisador e como provedor de soluções. Da mesma maneira que um pesquisador que só faz o que sabe é irrelevante, um profissional contratado para prover uma solução para uma empresa é desonesto se tenta fazer o que não sabe.

Profissionais de TI frequentemente cometem o pecado de prejudicar o cliente ou empregador, aproveitando seus projetos para experimentar. Fico triste em constatar que eu mesmo já cometi esse pecado mais de uma vez.