anÁlise preditiva
TRANSCRIPT
ANÁLISE PREDITIVA
O PODER DE PREVER QUEM VAI CLICAR, COMPRAR, MENTIR OU MORRER
ERIC SIEGEL
Rio de Janeiro, 2017
Prova: CG_Predictive_Analytics Data: 26/05/2017Liberado por: Bianca Teodoro
Prova: CG_Predictive_Analytics Data: 26/05/2017Liberado por: Bianca Teodoro
CG_PREDICTIVE_ANALYTICS.indb 7 31/05/2017 14:26:20
XI
Prova: CG_Predictive_Analytics Data: 26/05/2017Liberado por: Bianca Teodoro
Sumário
Prólogo Thomas H. Davenport xv
Prefácio da Edição Revista e Atualizada xvii
O que é novo e para quem é este livro — Perguntas Frequentes de Análise Preditiva
Prefácio da Edição Original xxiii
Qual é o risco ocupacional da análise preditiva?
Introdução
O Efeito Predição 2
Como prever o comportamento humano combate o risco, fortalece a assistência médica e o combate ao crime, impulsiona as vendas e reduz custos? Por que um computador deve aprender para poder prever? Como previsões ruins podem ser extremamente valiosas? O que torna os dados excepcionalmente empolgantes? Como a ciência de dados se assemelha à pornografia? Por que computadores não deviam ser chamados de computadores? Por que organizações preveem quando você vai morrer?
Capítulo 1
Decolagem! A Predição em Ação (implantação) 20
Quanta coragem é necessária para implantar um modelo preditivo na operação de campo, e o que você espera obter? O que acontece quando uma pessoa investe as eco-nomias de uma vida inteira em seu próprio sistema preditivo de negociação de ações?
Prova: CG_Predictive_Analytics Data: 26/05/2017Liberado por: Bianca Teodoro
CG_PREDICTIVE_ANALYTICS.indb 11 31/05/2017 14:26:21
XII análise preditiva
Prova: CG_Predictive_Analytics Data: 26/05/2017Liberado por: Bianca Teodoro
Prova: CG_Predictive_Analytics Data: 26/05/2017Liberado por: Bianca Teodoro
Capítulo 2
Com o Poder Vem a Responsabilidade: Hewlett-Packard, Target, a Polícia e a NSA Descobrem Seus Segredos (éticas)
42
Como podemos equipar com segurança uma máquina preditiva que consiga prever pedidos de demissão do emprego, gravidez e crime? As liberdades civis estão em risco? Por que uma companhia de seguro de saúde líder no mercado prediz a morte do
segurado? Dois pontos a serem explorados: 1) O governo realiza a detecção de fraude por seus cidadãos ou por autopreservação? e 2) Por qual motivo convincente a NSA precisa de seus dados mesmo que você não tenha nenhuma conexão com crime, e pode a agência usar os supercomputadores de aprendizado de máquina para combater o terrorismo sem ameaçar os direitos humanos?
Capítulo 3
O Efeito Dados: A Fartura no Fim do Arco-Íris (dados) 86
Estamos mergulhados em dados até as orelhas, mas quanto essa matéria-prima pode realmente nos dizer? O que realmente os torna preditivos? Quais são as descobertas mais bizarras feitas a partir dos dados? Quando encontramos uma percepção interes-sante, por que em geral é melhor não perguntar o porquê? De que maneira maiores volumes de dados são mais perigosos? Como podemos evitar ser enganados pelo ruído aleatório e garantir que as descobertas científicas sejam confiáveis?
Capítulo 4
A Máquina Que Aprende: Um Olhar Dentro da Predição de Risco de Hi-poteca do Chase Bank (modelagem)
124
Que forma de risco tem o disfarce perfeito? Como a predição transforma o risco em oportunidade? O que todos os negócios deviam aprender das companhias de seguro? Por que o aprendizado de máquina requer arte além da ciência? Que tipo de modelo preditivo pode ser compreendido por todos? Como podemos confiar com segurança nas predições de máquina? Por que a predição não pode impedir crises financeiras globais?
Capítulo 5
O Efeito Agrupamento: Netf lix, Crowdsourcing e Predição Turbinada (agrupamentos)
156
Para a contribuição colaborativa (crowdservice) na análise preditiva — terceirizá-la ao público em geral — uma companhia divulga sua estratégia, dados e descobertas de pesquisa para o público. Como isso pode ajudar a companhia a ser mais competitiva? Qual inovação chave na análise preditiva o crowdsourcing ajudou a desenvolver? A acurácia da predição turbinada precisa envolver uma complexidade gigantesca ou existe uma solução simples? Existe inteligência em grupos não humanos?
CG_PREDICTIVE_ANALYTICS.indb 12 31/05/2017 14:26:21
Sumário XIII
Prova: CG_Predictive_Analytics Data: 26/05/2017Liberado por: Bianca Teodoro
Prova: CG_Predictive_Analytics Data: 26/05/2017Liberado por: Bianca Teodoro
Capítulo 6
Watson e o Desafio do Jeopardy! (resposta de perguntas) 176
Como o Watson — o computador da IBM jogador de Jeopardy! — funciona? Por que ele precisa de modelagem preditiva para responder perguntas e qual ingrediente secreto possibilita sua alta performance? Como a Siri do iPhone se compara a ele? Por que a linguagem humana é um desafio tão grande para os computadores? A inteligência artificial é possível?
Capítulo 7
Persuasão pelos Números: Como a Telenor, o U.S. Bank e a Campanha de Obama Projetaram a Inf luência (uplift)
214
Qual a chave científica para persuasão? Por que alguns tipos de marketing dão er-rado? Por que o comportamento humano é a coisa errada a se predizer? O que todos os negócios deveriam aprender sobre persuasão com as campanhas presidenciais? Que predições de eleitores ajudaram Obama a vencer em 2012 mais do que a detecção de eleitores indecisos? Como médicos podem matar menos pacientes inadvertidamente? Em que uma pessoa se parece com uma partícula quântica? Enigma: O que normal-mente acontece com você sem que você perceba e que você não pode nem ter certeza se realmente aconteceu — mas que pode ser predito com antecedência?
Epílogo 249
Onze Predições para A Primeira Hora de 2022
Apêndices
A. Os Cinco Efeitos da Predição 252
B. Vinte Aplicações de Análise Preditiva 253
C. Pessoas da Predição — As “Personalidades” 257
Guia Prático 260
Recursos para Aprender Mais
Agradecimentos 265
Sobre o Autor 267
Central de Tabelas — para um compêndio de 182 exemplos de análise preditiva de diversos setores.
268
Índice 289
CG_PREDICTIVE_ANALYTICS.indb 13 31/05/2017 14:26:21
XV
Prova: CG_Predictive_Analytics Data: 26/05/2017Liberado por: Bianca Teodoro
Prólogo
Este livro trata das iniciativas quantitativas para prever o comportamento humano. Uma das primeiras tentativas de se fazer isso foi durante a Segunda Guerra Mundial. Norbert Wiener, o pai da “cibernética”, começou tentando prever o comportamento dos pilo-tos de avião alemães em 1940 — com o objetivo de atingi-los no céu. Seu método era considerar como informação de entrada a trajetória do avião a partir do movimento ob-servado, considerar as manobras evasivas mais prováveis do piloto e prever onde o avião estaria em um futuro próximo para que um projétil disparado pudesse atingi-lo. Infe-lizmente, Wiener podia prever o movimento do avião com antecedência de apenas um segundo, mas eram necessários 20 segundos da trajetória futura para derrubar um avião.
Entretanto, no livro de Eric Siegel, você conhecerá inúmeras tentativas de previsão mais bem-sucedidas. Os computadores ficaram muito mais rápidos desde a época de Wiener, e nós temos muito mais dados. Consequentemente, varejistas, bancos, cam-panhas políticas, médicos e hospitais, e muitas outras organizações ultimamente vêm conseguindo bastante sucesso em prever o comportamento de determinadas pessoas. Seus esforços têm sido úteis para conquistar clientes, ganhar eleições e combater doenças.
Minha visão — e a de Siegel, eu diria — é que esta atividade preditiva tem sido, de modo geral, boa para a humanidade. No contexto da assistência médica, crime e terro-rismo, ela pode salvar vidas. No contexto da propaganda, usar previsões é mais eficiente e pode, em tese, salvar árvores (das malas diretas e dos catálogos) e economizar o tempo e a atenção do destinatário. Na política, ela parece recompensar aqueles candidatos que respeitam o método científico (alguns podem discordar, mas eu vejo isso como positivo).
Mas, como aponta Siegel — no início do livro, o que é admirável — estas abordagens também podem ser usadas de maneiras um tanto nocivas. “Com um grande poder vem uma grande responsabilidade”, ele observa citando o Homem-Aranha. A implicação é que devemos tomar cuidado enquanto sociedade sobre como usamos os modelos predi-tivos, ou podemos ser impedidos de usá-los e de nos beneficiarmos deles. Assim como outras tecnologias poderosas ou inovações humanas perturbadoras, a análise preditiva é, essencialmente, amoral e pode ser usada para o bem e para o mal. Porém, para evitar as aplicações malignas, certamente é importante compreender o que é possível fazer com a análise preditiva, o que você aprenderá se continuar lendo.
Este livro foca na análise preditiva, que não é o único tipo de análise, mas é o mais importante e interessante. Eu não acho que precisamos de mais livros sobre análise pu-ramente descritiva, que apenas descreve o passado e não oferece nenhuma ideia sobre a razão de algo ter acontecido. Eu frequentemente também me refiro em meus próprios
Prova: CG_Predictive_Analytics Data: 26/05/2017Liberado por: Bianca Teodoro
CG_PREDICTIVE_ANALYTICS.indb 15 31/05/2017 14:26:21
Prova: CG_Predictive_Analytics Data: 26/05/2017Liberado por: Bianca Teodoro
XVI análise preditiva
Prova: CG_Predictive_Analytics Data: 26/05/2017Liberado por: Bianca Teodoro
escritos a um terceiro tipo de análise — a “prescritiva” — que diz para seus usuários o que fazer com experimentos controlados ou otimização. Estes métodos quantitativos são muito menos populares do que a análise preditiva.
Este livro e as ideias por trás dele são um bom contraponto ao trabalho de Nassim Nicholas Taleb. Seus livros, incluindo A Lógica do Cisne Negro (Ed. Saraiva), sugerem que muitos esforços de predição estão condenados ao fracasso por causa da aleatoriedade e a imprevisibilidade inerente de eventos complexos. Sem dúvida, Taleb está correto ao dizer que alguns eventos são cisnes negros que estão além da predição, mas o fato é que a maioria dos comportamentos humanos é bastante regular e previsível. Os muitos exemplos que Siegel oferece de previsões de sucesso nos faz lembrar que a maioria dos cisnes é branca.
Siegel também resiste à bajulação ao movimento do “big data”. Certamente alguns dos exemplos os quais ele cita se enquadram na categoria — dados que são muito volu-mosos ou desestruturados para serem facilmente digeridos por bancos de dados relacio-nais convencionais. Mas o ponto principal da análise preditiva não se refere ao volume relativo ou rebeldia dos dados, mas o que você faz com eles. Descobri que “big data frequentemente equivale a matemática simples”, e muitos profissionais de big data ficam satisfeitos apenas de usar seus dados para criar visualizações analíticas interessantes. Nem de perto isso tem o mesmo valor de se criar um modelo preditivo.
Siegel criou um livro que é tanto sofisticado quanto perfeitamente acessível para o leitor não adepto da análise quantitativa. O livro tem excelentes histórias, ótimas ilustrações e um tom divertido. Os não adeptos da análise quantitativa definitivamente precisam ler este livro, pois é quase certo que seus comportamentos serão analisados e previstos ao longo de suas vidas. É também bastante provável que a maioria dos não adeptos da análise quantitativa terá que, cada vez mais, avaliar e tomar decisões usando modelos preditivos no trabalho.
Resumindo, vivemos em uma sociedade preditiva. A melhor maneira de prosperar nela é compreender os objetivos, as técnicas e os limites dos modelos preditivos. E a me-lhor maneira de fazer isso é simplesmente continuar lendo este livro.
— Thomas H. Davenport
Professor Distinto na Babson College,
membro do Centro de Negócios Digitais do MIT,
Consultor Sênior na Deloitte Analytics,
e cofundador do International Institute for Analytics.
Ele é coautor de Competing on Analytics,
Big Data @ Work, e diversos outros livros sobre analytics.
CG_PREDICTIVE_ANALYTICS.indb 16 31/05/2017 14:26:21
XVII
Prova: CG_Predictive_Analytics Data: 26/05/2017Liberado por: Bianca Teodoro
Prova: CG_Predictive_Analytics Data: 26/05/2017Liberado por: Bianca Teodoro
Prefácio da Edição Revista e Atualizada
O Que É Novo e Para Quem É Este Livro — Perguntas Frequentes sobre Análise Preditiva
Cientista de Dados: O Trabalho Mais Sexy do Século XXI
— Título de um artigo de do Harvard Business Review, escrito por
Thomas Davenport e DJ Patil, que em 2015
se tornou o primeiro Cientista de Dados Chefe dos Estados Unidos
A predição é próspera. Ela está reinventando setores e dominando o mundo.
Cada vez mais, a análise preditiva (AP) impulsiona o comércio, a indústria, a assistên-cia médica, o governo e os agentes da lei. Nestas esferas, as organizações funcionam de modo mais eficiente utilizando-se da previsão de comportamento — ou seja, o resultado para cada cliente individual, funcionário, paciente, eleitor e suspeito.
Todo mundo está fazendo isso. A Accenture e a Forrester relatam que a adoção da AP mais do que dobrou nos últimos anos. A Transparency Market Research projeta que o mercado de AP atingirá 6,5 bilhões de dólares em poucos anos. Uma pesquisa da Gartner classificou os negócios de inteligência e análise como a prioridade de investimento nú-mero um dos diretores executivos de informação. E, em um estudo do Salesforce.com, a AP mostrou a maior taxa de crescimento entre todas as tendências de tecnologias de venda, tendo sua adoção mais do que dobrado nos 18 meses seguintes. Equipes de vendas de alto desempenho têm uma probabilidade quatro vezes maior de já estarem usando a AP do que as equipes de desempenho inferior.
Sou testemunha da crescente aplicação da AP em todos os setores. A série de conven-ções Predictive Analytics World (PAW), fundada por mim, já recebeu mais de 10.000 participantes desde seu lançamento em 2009 e está se expandindo muito além dos even-tos originais PAW Business (Negócios). Com o auxílio especializado de parceiros do setor, nós criamos eventos focados em diversos setores como PAW Government (Gover-no), PAW Healthcare (Assistência Médica), PAW Financial (Finanças), PAW Workforce (Força de Trabalho) e PAW Manufacturing (Indústria), eventos para executivos seniores e o site de notícias The Predictive Analytics Times.
CG_PREDICTIVE_ANALYTICS.indb 17 31/05/2017 14:26:21
XVIII análise preditiva
Prova: CG_Predictive_Analytics Data: 26/05/2017Liberado por: Bianca Teodoro
Prova: CG_Predictive_Analytics Data: 26/05/2017Liberado por: Bianca Teodoro
Desde a publicação da primeira edição deste livro, fui encarregado de proferir discur-sos programáticos em cada um dos seguintes setores: marketing, pesquisa de mercado, e-commerce, serviços financeiros, seguros, notícias, assistência médica, farmacêutica, governo, recursos humanos, viagens, mercado imobiliário, construção e direito, além de reuniões de executivos e convenções de universidades.
Quer uma futura carreira em futurologia? A demanda está nas alturas. A McKinsey prevê uma carência de 140 mil especialistas em analytics e de 1,5 milhão de gerentes “com habilidades para entender e tomar decisões com base na análise de big data.” A “Habili-dade mais Popular para uma Pessoa ser Contratada” no LinkedIn é “análise estatística e mineração de dados.”
AP é como Moneyball para…dinheiro.
Perguntas Frequentes sobre Análise Preditiva
Para Quem É Este Livro?Para todos. Ele é de fácil compreensão por todos os leitores. Em vez de um manual sobre “como fazer” para técnicos, o livro é útil para leitores leigos, entusiastas da tecnologia, executivos e especialistas em analytics e abrange novos estudos de caso, além das últimas e mais modernas técnicas.
A Ideia por Trás da Análise Preditiva É Difícil de Entender?De forma alguma. O conceito sofisticado e inebriante de aprender a partir dos dados para prever pode parecer inalcançável, mas basta dar uma rápida olhada no breve capítulo de Introdução para ver que a ideia básica é clara, acessível e inegavelmente poderosa.
Este Livro É um Manual Prático?
Não, é uma introdução substancial e conceitualmente completa e uma visão geral da atividade.
Não é um Manual Prático? Então, Por Que os Técnicos da Área Devem Ler?Embora esta introdução sem tecnicalidades seja compreensível para qualquer leitor — incluindo aqueles sem conhecimento técnico — veja por que ele também agrega valor para os profissionais experientes e iniciantes:
CG_PREDICTIVE_ANALYTICS.indb 18 31/05/2017 14:26:21
Prefácio da Edição Revista e Atualizada XIX
Prova: CG_Predictive_Analytics Data: 26/05/2017Liberado por: Bianca Teodoro
Prova: CG_Predictive_Analytics Data: 26/05/2017Liberado por: Bianca Teodoro
•• Um ótimo lugar para começar — oferece conhecimento conceitual necessário para aqueles que seguirão no aprendizado prático ou atuarão em posições de direção ou gerência na aplicação da AP.
•• Estudos de caso detalhados — que exploram as aplicações reais da AP em or-ganizações como Chase, IBM, HP, Netf lix, NSA, Target, U.S. Bank, entre outras.
•• Um compêndio de 182 mini estudos de caso — a Central de Tabelas, dividida em grupos por setor, incluindo exemplos da BBC, Citibank, ConEd, Facebook, Ford, Google, IRS, Match.com, MTV, PayPal, Pfizer, Spotify, Uber, UPS, Wiki-pédia, e muitos outros.
•• Tópicos avançados e super atuais — os últimos três capítulos apresentam sub-campos novos até mesmo para muitos especialistas: agrupamento de modelos, per-guntas e respostas sobre o Watson da IBM e modelagem uplift. Não importa quanta ex-periência você tenha, começar com uma visão geral conceitualmente rica, embora não técnica, pode ser mais benéfico do que você imagina — especialmente para modelagem uplift. As Notas desses três capítulos oferecem referências abrangentes sobre códigos fontes tecnicamente mais complexos (disponível em www.altabooks.com.br, procure pelo título do livro).
•• Privacidade e liberdades civis — o segundo capítulo trata das questões éticas específicas que surgem quando utilizamos o poder da AP.
•• Panorama holístico do setor — o livro abrange mais conteúdo do que uma introdução padrão de uma tecnologia — todos os pontos citados se juntam para for-necer uma pesquisa de campo que esclarece seu contexto social, comercial e ético.
Dito isso, profissionais da área mais experientes que desejam mergulhar diretamente em uma abordagem mais tradicional, tecnicamente mais profunda ou prática deste assunto devem se considerar avisados: este não é o livro que você procura (mas é um bom pre-sente; qualquer amigo ou familiar será capaz de entender e aprender sobre seu campo de interesse).
Assim como acontece com introduções a outros campos da ciência e da engenharia, se você estiver buscando uma carreira no setor, este livro estabelecerá a base, apenas para abrir seu apetite por mais. Ao final deste livro, você é orientado pelo Guia Prático sobre onde encontrar manuais técnicos, teoria avançada e a matemática por trás de tudo.
Qual é a Objetivo deste Livro?Escrevi este livro para demonstrar por que a AP é intuitiva, poderosa e impressionante. Este é um livro sobre as maiores e mais inf luentes conquistas da predição informatizada e sobre as duas coisas que tornam isso possível: as pessoas por trás dela e a ciência fasci-nante que a move.
CG_PREDICTIVE_ANALYTICS.indb 19 31/05/2017 14:26:21
XX análise preditiva
Prova: CG_Predictive_Analytics Data: 26/05/2017Liberado por: Bianca Teodoro
Prova: CG_Predictive_Analytics Data: 26/05/2017Liberado por: Bianca Teodoro
Enquanto há diversos livros que abordam o lado prático da AP, este livro tem um propósito diferente (que acabou se mostrando um desafio recompensador para o autor): compartilhar com um público mais amplo um panorama completo do campo, desde o modo como a AP fortalece as organizações, até o funcionamento interno da modelagem preditiva.
Com o impacto da AP crescendo tão rapidamente no mundo, já é hora de o poder preditivo dos dados — e como explorá-lo cientificamente — ser desmistificado. Apren-der com os dados para prever o comportamento humano não é mais um mistério.
Quão Técnico É Este Livro?Ao mesmo tempo que é acessível e proveitoso para os iniciantes com qualquer tipo de experiência anterior, este livro explora “os segredos” o suficiente para desvendar o fun-cionamento das árvores de decisão (Capítulo 4), uma forma exemplar de modelo prediti-vo que funciona bem como ponto de partida para aprender sobre AP, e geralmente como uma boa primeira opção ao executar um projeto de AP.
Eu me esforcei para ir o mais fundo possível nos fundamentos — em meio à gama de tópicos fascinantes relacionados à AP — mantendo ao mesmo tempo o interesse e a acessibilidade não apenas para os usuários novatos, mas até mesmo para os interessados na área como lazer, curiosos sobre a ciência e em como ela está mudando o mundo.
Este É um Livro-texto para a Universidade?Este livro tem sido utilizado como livro-texto em mais de 30 universidades e faculdades. Como ex-professor de ciência da computação, escrevi esta introdução para ser concei-tualmente completa. No sumário, as palavras entre parênteses ao lado de cada título “sugestivo e divertido” do capítulo descreve os fundamentos nele contidos: (1) modelo de implantação, (2) ética, (3) dados, (4) modelo preditivo, (5) agrupamento de modelos, (6) resposta de dúvidas e (7) modelagem uplift. Para uma orientação sobre o modo de leitura, veja o diagrama na próxima pergunta.
Entretanto, o livro não é escrito no estilo formal de livros-texto, a intenção foi criar uma obra divertida, envolvente e pertinente que ilustrasse os conceitos basicamente por meio de narrativas divertidas.
Para professores que estejam pensando em adotar este livro como material de aulas, mais recursos e informações podem ser encontradas em www.teachPA.com (conteúdo em inglês).
Como Devo Ler Este Livro?Os capítulos deste livro se somam. Alguns dependem apenas da leitura da introdução, mas outros seguem uma progressão lógica. A figura abaixo demonstra essas relações de
CG_PREDICTIVE_ANALYTICS.indb 20 31/05/2017 14:26:21
Prefácio da Edição Revista e Atualizada XXI
Prova: CG_Predictive_Analytics Data: 26/05/2017Liberado por: Bianca Teodoro
Prova: CG_Predictive_Analytics Data: 26/05/2017Liberado por: Bianca Teodoro
dependência — leia o capítulo apenas depois de ler o capítulo para o qual aponta a seta. Por exemplo, o Capítulo 3 presume que você tenha lido o Capítulo 1, que, por sua vez, pressupõe a leitura da introdução.
Prólogo Prefácio Introdução
Cap.2
Cap.3
Cap.1
Cap.4
Cap.5 Cap.7
Cap.6
Central de Tabelas(ética)(implantação)
(dados)
(modelagem)
(agrupamentos) (uplift)
(respostas de perguntas)
Dependências entre capítulos. Uma seta apontando para cima significa “Leia o capítulo acima primeiro”.
O Que É Novo na Edição “Revista e Atualizada” de Análise Preditiva?
•• O Real Motivo de a NSA Querer Seus Dados: Identificação Automática de Suspeitos. Um box especial no Capítulo 2 (sobre ética na AP) presume — com provas suficientes — que a Agência de Segurança Nacional dos Estados Unidos (NSA) considera a AP uma prioridade estratégica. É possível a organização usar a AP sem ameaçar as liberdades civis?
•• Dezenas de novos exemplos de organizações como o Facebook, Hopper, Shell, Uber, UPS, o governo dos Estados Unidos e muitos outros. O com-pêndio Central de Tabelas com mini estudos de caso aumentou para 182 entradas, incluindo exemplos de fracassos.
•• Um aviso bastante necessário com relação à ciência mal executada. O Capítulo 3, “O Efeito Dados”, inclui uma seção detalhada sobre uma armadilha bastante comum e como evitá-la, ou seja, como explorar o potencial dos dados sem ser enganado pelo ruído aleatório, garantindo que descobertas sólidas sejam feitas.
CG_PREDICTIVE_ANALYTICS.indb 21 31/05/2017 14:26:21
Prova: CG_Predictive_Analytics Data: 26/05/2017Liberado por: Bianca Teodoro
XXII análise preditiva
Prova: CG_Predictive_Analytics Data: 26/05/2017Liberado por: Bianca Teodoro
•• Observações ainda mais abrangentes, atualizadas e ampliadas para 120 páginas, e agora online. As Notas estão disponíveis em www.altabooks.com.br (conteúdo em inglês). Elas incluem citações e comentários relativos ao novo conte-údo mencionado, assim como citações atualizadas ao longo dos capítulos.
Onde Posso Aprender Mais com Algo Mais Prático Depois Deste Livro?
•• O Guia Prático ao final deste livro — opções de leitura e treinamento que orientam como começar
•• O site deste livro contém vídeos, artigos e mais recursos: www.theprediction-book.com (conteúdo em inglês)
•• Predictive Analytics World — uma série de convenções de fornecedores líde-res na América do Norte e na Europa, que inclui workshops avançados e eventos específicos em diferentes setores, como PAW Business, PAW Government, PAW Healthcare, PAW Financial, PAW Workforce, e PAW Manufacturing: www.paw-con.com (conteúdo em inglês)
•• The Predictive Analytics Guide — artigos, portais para diversas áreas de ativi-dade e outros recursos: www.pawcon.com/guide (conteúdo em inglês)
•• Análise Preditiva Aplicada — curso online do autor, traduzido para o portu-guês, que, ao contrário deste livro, é um manual prático sobre a AP. Acesse imedia-tamente, a qualquer momento: www.analisepreditiva.com.br
•• The Predictive Analytics Times — o recurso principal: notícias do setor, artigos técnicos, vídeos, eventos e comunidade: www.predictiveanalyticstimes.com (con-teúdo em inglês)
CG_PREDICTIVE_ANALYTICS.indb 22 31/05/2017 14:26:21
XXIII
Prova: CG_Predictive_Analytics Data: 26/05/2017Liberado por: Bianca Teodoro
Prova: CG_Predictive_Analytics Data: 26/05/2017Liberado por: Bianca Teodoro
Prefácio da Edição Original
Ontem é história, amanhã é um mistério, mas hoje é uma dádiva. Por isso o chamamos de presente.
— Atribuído a A. A. Milne, Bil Keane e Mestre Oogway,
a sábia tartaruga em Kung Fu Panda
As pessoas me olham de modo estranho quando eu digo o que faço. Ossos do ofício.
A Era da Informação padece de evidente omissão. Essa declaração pode surpreender muitas pessoas, considerando que registramos ativamente Tudo Que Acontece no Mun-do. A partir dos livros históricos que relatam eventos importantes, nós evoluímos para sistemas que registram cada clique, pagamento, chamada, falha, crime e doença. Com isso, você poderia imaginar que aficionados por dados estariam satisfeitos, para não dizer completamente mimados.
Mas essa aparente infinidade de informação exclui justamente os eventos que seriam mais importantes de saber: as coisas que ainda não aconteceram.
Todo mundo almeja o poder de ver o futuro; nós somos todos obcecados por pre-visões. Nós reverenciamos as divindades adivinhatórias. Esvaziamos nossos bolsos para alguém ler nossa mão. Prestamos atenção a horóscopos, adoramos astrologia e devoramos biscoitos da sorte.
Mas muitas pessoas que se empolgam com videntes também trilham o caminho da ciência. Sua resposta natural é dizer “eca” — ou é muito difícil de entender ou é muito chato. Ou talvez muitos acreditem que a predição, por sua natureza, é impossí-vel sem o auxílio do sobrenatural.
Há um programa de TV divertido de que gosto que trata deste tema, Psych, no qual um detetive muito astuto — um Sherlock Holmes moderno e entusiasta dos dados — aperfeiçoou a arte da observação com tal maestria que os policiais acham que suas deduções precisas só podem ser oriundas de sua culpa. O herói se safa do problema se adequando ao padrão: ele simplesmente diz à polícia que é vidente, conseguindo assim se livrar da cadeia e continuar a combater o crime. O resultado é uma comédia.
Eu vivencio o mesmo impulso, por exemplo, quando alguém pergunta qual meu signo no zodíaco. Mas, em vez de fingir que acredito em horóscopo, uso o humor: “Sou de Escorpião, e pessoas de Escorpião não acreditam em astrologia.”
A pergunta mais comum em festas é o que faço. Eu me preparo para olhos assustados quando cuidadosamente declaro: sou analista preditivo. A maioria das pessoas pode se dar ao luxo de descrever sua profissão em uma única palavra: advogado, médico, garçom, contador
CG_PREDICTIVE_ANALYTICS.indb 23 31/05/2017 14:26:21
XXIV análise preditiva
Prova: CG_Predictive_Analytics Data: 26/05/2017Liberado por: Bianca Teodoro
ou ator. Mas, para mim, descrever esse campo quase totalmente desconhecido sempre acaba com a conversa. Qualquer tentativa de ser sucinto vai por água abaixo:
Sou consultor de negócios em tecnologia. Eles não ficam satisfeitos e perguntam: Que tipo de tecnologia?
Faço com que computadores prevejam o que as pessoas farão. O resultado é perplexidade, acompanhada por uma total descrença e um pouco de medo.
Faço com que computadores aprendam a prever o comportamento humano individual a partir de dados. Perplexidade, e ninguém quer conversar sobre dados em uma festa.
Analiso dados para encontrar padrões. Olhos ainda mais arregalados; pausas desconcer-tantes mergulham em um mar de abstração.
Ajudo os profissionais de marketing a descobrir quais consumidores comprarão ou cancelarão um serviço. Eles meio que entendem, mas desvalorizam e menosprezam o campo.
Prevejo o comportamento do cliente, como quando a Target conseguiu prever se alguém estava grávida. O resultado é que fico falando sozinho.
Assim, escrevi este livro para demonstrar por que a análise preditiva é intuitiva, po-derosa e impressionante.
Tenho boas notícias: um pouco de previsão pode ir longe. Chamo isso de Efeito Predição, um tema recorrente ao longo do livro. O poder da predição é considerável, desde que as previsões sejam mais do que simples adivinhação. Esse efeito torna a análise prediti-va crível. Nós não temos que fazer o impossível e atingir a verdadeira clarevidência. A história é empolgante e ainda assim crível: lançando probabilidades sobre o futuro para remover um pouquinho a neblina de nossa visão embaçada do amanhã significa fazer descobertas valiosas. Dessa maneira, a análise preditiva combate os riscos, impulsiona as vendas, reduz custos, fortalece a assistência médica, aperfeiçoa a produção, filtra spams, fortalece o combate ao crime, otimiza as mídias sociais e vence eleições.
Você tem a alma de cientista ou de homem de negócios? Você fica mais empolgado apenas pela ideia da predição ou pelo valor que ela tem para o mundo?
Eu me impressionei pela ideia de saber o ininteligível. A predição parece desafiar as leis da natureza: você não pode prever o futuro porque ele ainda não aconteceu. Conseguimos vencer esse obstáculo construindo máquinas que aprendem com as experiências. É o méto-do controlado de usar o que já sabemos — na forma de dados — para fazer apostas cada vez mais precisas sobre o que está por vir. Mesclamos o melhor da matemática e da tecnologia, ajustando sistematicamente até que nossos corações de cientistas estejam satisfeitos para criar um sistema que enxergue além da barreira impenetrável entre o hoje e o amanhã.
Isso é que é ousar ir onde ninguém jamais esteve!
Algumas pessoas são da área de vendas; outras da política. Eu sou da área de predição, e ela é fantástica.
CG_PREDICTIVE_ANALYTICS.indb 24 31/05/2017 14:26:21
nunc
a
públi
co
tópico
saúd
e
Apre
nden
do
apre
ndeu
futur
o
poss
ível
par
vida
cartã
oEfe
ito
mão
fraud
ulent
a
resp
onde
pesq
uisad
ores
valor
efeito
s
dese
nvolv
eu
máqu
ina
algo
siste
mahip
otec
a
expe
riênc
ia
grup
o meno
s
traba
lho
prov
ável
como
cami
nho
basea
do
ciênc
ia
predit
iva
tecno
logia
crédit
oem
presa
pedid
o
bem
huma
no
Data ca
soan
ualm
ente
pess
oasind
ivídu
o
cresc
imen
to
quas
e
assis
tência
méd
ica
atrav
és d
ecli
entes
detec
tar
nome
usar
spam
bene
fício
sabe
r
colocar
dia
outro
s
estimado
fato
prime
iro
núme
rome
lhor
ment
e
poder
apen
asPe
ssoas
exem
plos
ver
milhão
comum
prevendo
anos
métodos
devedores
coisa
comportamento
governo
precedente
aprende
torna
morte
reivindica
precisão
timeprocesso
geral
tempo
cérebro
outra
pensar
novo
correio
levar a
fazer
melhor
gera
de acordo
Pesq
uisad
ores
livro
pega
r
coisa
s
comp
utado
res
cham
ar
segu
inte
huma
nidad
e
decis
ões
análi
se p
reditiv
ajoe
lhomu
itosde
mand
ar
cirur
gia
pode
literal
mente
dentro de
negó
cios
organ
izaçõ
espró
ximo
organ
izaçõ
es
conh
ecim
ento
respo
sta
clien
te
apren
dizad
o
segu
roma
rketi
ng
empr
esas
comp
letam
ente
médic
o
aind
acri
me
organ
izar
com
frequ
ência faz
dado
saprendizado de máquina
computador
previs
ãoap
rend
er
ainda
hosp
ital
tempo
s
alvo
mal
indivi
dual
cham
ado
todo
empre
go
ver
ver
usar
huma
nidad
e
médic
o
Efeito
quas
e
timemã
o
usar
algo
levar a
geral
nunc
ade
mand
ar
ver
ver
ver
time
alvo
alvo
alvo
algo
alvo
anos
par
todo
morteméd
ico
algo
ver
médic
o
morte
Prova: CG_Predictive_Analytics Data: 26/05/2017Liberado por: Bianca Teodoro
CG_PREDICTIVE_ANALYTICS.indb 1 31/05/2017 14:26:21