anÁlise preditiva

15
ANÁLISE PREDITIVA O PODER DE PREVER QUEM VAI CLICAR, COMPRAR, MENTIR OU MORRER ERIC SIEGEL Rio de Janeiro, 2017

Upload: others

Post on 15-Apr-2022

6 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: ANÁLISE PREDITIVA

ANÁLISE PREDITIVA

O PODER DE PREVER QUEM VAI CLICAR, COMPRAR, MENTIR OU MORRER

ERIC SIEGEL

Rio de Janeiro, 2017

Prova: CG_Predictive_Analytics Data: 26/05/2017Liberado por: Bianca Teodoro

Prova: CG_Predictive_Analytics Data: 26/05/2017Liberado por: Bianca Teodoro

CG_PREDICTIVE_ANALYTICS.indb 7 31/05/2017 14:26:20

Page 2: ANÁLISE PREDITIVA

XI

Prova: CG_Predictive_Analytics Data: 26/05/2017Liberado por: Bianca Teodoro

Sumário

Prólogo Thomas H. Davenport xv

Prefácio da Edição Revista e Atualizada xvii

O que é novo e para quem é este livro — Perguntas Frequentes de Análise Preditiva

Prefácio da Edição Original xxiii

Qual é o risco ocupacional da análise preditiva?

Introdução

O Efeito Predição 2

Como prever o comportamento humano combate o risco, fortalece a assistência médica e o combate ao crime, impulsiona as vendas e reduz custos? Por que um computador deve aprender para poder prever? Como previsões ruins podem ser extremamente valiosas? O que torna os dados excepcionalmente empolgantes? Como a ciência de dados se assemelha à pornografia? Por que computadores não deviam ser chamados de computadores? Por que organizações preveem quando você vai morrer?

Capítulo 1

Decolagem! A Predição em Ação (implantação) 20

Quanta coragem é necessária para implantar um modelo preditivo na operação de campo, e o que você espera obter? O que acontece quando uma pessoa investe as eco-nomias de uma vida inteira em seu próprio sistema preditivo de negociação de ações?

Prova: CG_Predictive_Analytics Data: 26/05/2017Liberado por: Bianca Teodoro

CG_PREDICTIVE_ANALYTICS.indb 11 31/05/2017 14:26:21

Page 3: ANÁLISE PREDITIVA

XII análise preditiva

Prova: CG_Predictive_Analytics Data: 26/05/2017Liberado por: Bianca Teodoro

Prova: CG_Predictive_Analytics Data: 26/05/2017Liberado por: Bianca Teodoro

Capítulo 2

Com o Poder Vem a Responsabilidade: Hewlett-Packard, Target, a Polícia e a NSA Descobrem Seus Segredos (éticas)

42

Como podemos equipar com segurança uma máquina preditiva que consiga prever pedidos de demissão do emprego, gravidez e crime? As liberdades civis estão em risco? Por que uma companhia de seguro de saúde líder no mercado prediz a morte do

segurado? Dois pontos a serem explorados: 1) O governo realiza a detecção de fraude por seus cidadãos ou por autopreservação? e 2) Por qual motivo convincente a NSA precisa de seus dados mesmo que você não tenha nenhuma conexão com crime, e pode a agência usar os supercomputadores de aprendizado de máquina para combater o terrorismo sem ameaçar os direitos humanos?

Capítulo 3

O Efeito Dados: A Fartura no Fim do Arco-Íris (dados) 86

Estamos mergulhados em dados até as orelhas, mas quanto essa matéria-prima pode realmente nos dizer? O que realmente os torna preditivos? Quais são as descobertas mais bizarras feitas a partir dos dados? Quando encontramos uma percepção interes-sante, por que em geral é melhor não perguntar o porquê? De que maneira maiores volumes de dados são mais perigosos? Como podemos evitar ser enganados pelo ruído aleatório e garantir que as descobertas científicas sejam confiáveis?

Capítulo 4

A Máquina Que Aprende: Um Olhar Dentro da Predição de Risco de Hi-poteca do Chase Bank (modelagem)

124

Que forma de risco tem o disfarce perfeito? Como a predição transforma o risco em oportunidade? O que todos os negócios deviam aprender das companhias de seguro? Por que o aprendizado de máquina requer arte além da ciência? Que tipo de modelo preditivo pode ser compreendido por todos? Como podemos confiar com segurança nas predições de máquina? Por que a predição não pode impedir crises financeiras globais?

Capítulo 5

O Efeito Agrupamento: Netf lix, Crowdsourcing e Predição Turbinada (agrupamentos)

156

Para a contribuição colaborativa (crowdservice) na análise preditiva — terceirizá-la ao público em geral — uma companhia divulga sua estratégia, dados e descobertas de pesquisa para o público. Como isso pode ajudar a companhia a ser mais competitiva? Qual inovação chave na análise preditiva o crowdsourcing ajudou a desenvolver? A acurácia da predição turbinada precisa envolver uma complexidade gigantesca ou existe uma solução simples? Existe inteligência em grupos não humanos?

CG_PREDICTIVE_ANALYTICS.indb 12 31/05/2017 14:26:21

Page 4: ANÁLISE PREDITIVA

Sumário XIII

Prova: CG_Predictive_Analytics Data: 26/05/2017Liberado por: Bianca Teodoro

Prova: CG_Predictive_Analytics Data: 26/05/2017Liberado por: Bianca Teodoro

Capítulo 6

Watson e o Desafio do Jeopardy! (resposta de perguntas) 176

Como o Watson — o computador da IBM jogador de Jeopardy! — funciona? Por que ele precisa de modelagem preditiva para responder perguntas e qual ingrediente secreto possibilita sua alta performance? Como a Siri do iPhone se compara a ele? Por que a linguagem humana é um desafio tão grande para os computadores? A inteligência artificial é possível?

Capítulo 7

Persuasão pelos Números: Como a Telenor, o U.S. Bank e a Campanha de Obama Projetaram a Inf luência (uplift)

214

Qual a chave científica para persuasão? Por que alguns tipos de marketing dão er-rado? Por que o comportamento humano é a coisa errada a se predizer? O que todos os negócios deveriam aprender sobre persuasão com as campanhas presidenciais? Que predições de eleitores ajudaram Obama a vencer em 2012 mais do que a detecção de eleitores indecisos? Como médicos podem matar menos pacientes inadvertidamente? Em que uma pessoa se parece com uma partícula quântica? Enigma: O que normal-mente acontece com você sem que você perceba e que você não pode nem ter certeza se realmente aconteceu — mas que pode ser predito com antecedência?

Epílogo 249

Onze Predições para A Primeira Hora de 2022

Apêndices

A. Os Cinco Efeitos da Predição 252

B. Vinte Aplicações de Análise Preditiva 253

C. Pessoas da Predição — As “Personalidades” 257

Guia Prático 260

Recursos para Aprender Mais

Agradecimentos 265

Sobre o Autor 267

Central de Tabelas — para um compêndio de 182 exemplos de análise preditiva de diversos setores.

268

Índice 289

CG_PREDICTIVE_ANALYTICS.indb 13 31/05/2017 14:26:21

Page 5: ANÁLISE PREDITIVA

XV

Prova: CG_Predictive_Analytics Data: 26/05/2017Liberado por: Bianca Teodoro

Prólogo

Este livro trata das iniciativas quantitativas para prever o comportamento humano. Uma das primeiras tentativas de se fazer isso foi durante a Segunda Guerra Mundial. Norbert Wiener, o pai da “cibernética”, começou tentando prever o comportamento dos pilo-tos de avião alemães em 1940 — com o objetivo de atingi-los no céu. Seu método era considerar como informação de entrada a trajetória do avião a partir do movimento ob-servado, considerar as manobras evasivas mais prováveis do piloto e prever onde o avião estaria em um futuro próximo para que um projétil disparado pudesse atingi-lo. Infe-lizmente, Wiener podia prever o movimento do avião com antecedência de apenas um segundo, mas eram necessários 20 segundos da trajetória futura para derrubar um avião.

Entretanto, no livro de Eric Siegel, você conhecerá inúmeras tentativas de previsão mais bem-sucedidas. Os computadores ficaram muito mais rápidos desde a época de Wiener, e nós temos muito mais dados. Consequentemente, varejistas, bancos, cam-panhas políticas, médicos e hospitais, e muitas outras organizações ultimamente vêm conseguindo bastante sucesso em prever o comportamento de determinadas pessoas. Seus esforços têm sido úteis para conquistar clientes, ganhar eleições e combater doenças.

Minha visão — e a de Siegel, eu diria — é que esta atividade preditiva tem sido, de modo geral, boa para a humanidade. No contexto da assistência médica, crime e terro-rismo, ela pode salvar vidas. No contexto da propaganda, usar previsões é mais eficiente e pode, em tese, salvar árvores (das malas diretas e dos catálogos) e economizar o tempo e a atenção do destinatário. Na política, ela parece recompensar aqueles candidatos que respeitam o método científico (alguns podem discordar, mas eu vejo isso como positivo).

Mas, como aponta Siegel — no início do livro, o que é admirável — estas abordagens também podem ser usadas de maneiras um tanto nocivas. “Com um grande poder vem uma grande responsabilidade”, ele observa citando o Homem-Aranha. A implicação é que devemos tomar cuidado enquanto sociedade sobre como usamos os modelos predi-tivos, ou podemos ser impedidos de usá-los e de nos beneficiarmos deles. Assim como outras tecnologias poderosas ou inovações humanas perturbadoras, a análise preditiva é, essencialmente, amoral e pode ser usada para o bem e para o mal. Porém, para evitar as aplicações malignas, certamente é importante compreender o que é possível fazer com a análise preditiva, o que você aprenderá se continuar lendo.

Este livro foca na análise preditiva, que não é o único tipo de análise, mas é o mais importante e interessante. Eu não acho que precisamos de mais livros sobre análise pu-ramente descritiva, que apenas descreve o passado e não oferece nenhuma ideia sobre a razão de algo ter acontecido. Eu frequentemente também me refiro em meus próprios

Prova: CG_Predictive_Analytics Data: 26/05/2017Liberado por: Bianca Teodoro

CG_PREDICTIVE_ANALYTICS.indb 15 31/05/2017 14:26:21

Page 6: ANÁLISE PREDITIVA

Prova: CG_Predictive_Analytics Data: 26/05/2017Liberado por: Bianca Teodoro

XVI análise preditiva

Prova: CG_Predictive_Analytics Data: 26/05/2017Liberado por: Bianca Teodoro

escritos a um terceiro tipo de análise — a “prescritiva” — que diz para seus usuários o que fazer com experimentos controlados ou otimização. Estes métodos quantitativos são muito menos populares do que a análise preditiva.

Este livro e as ideias por trás dele são um bom contraponto ao trabalho de Nassim Nicholas Taleb. Seus livros, incluindo A Lógica do Cisne Negro (Ed. Saraiva), sugerem que muitos esforços de predição estão condenados ao fracasso por causa da aleatoriedade e a imprevisibilidade inerente de eventos complexos. Sem dúvida, Taleb está correto ao dizer que alguns eventos são cisnes negros que estão além da predição, mas o fato é que a maioria dos comportamentos humanos é bastante regular e previsível. Os muitos exemplos que Siegel oferece de previsões de sucesso nos faz lembrar que a maioria dos cisnes é branca.

Siegel também resiste à bajulação ao movimento do “big data”. Certamente alguns dos exemplos os quais ele cita se enquadram na categoria — dados que são muito volu-mosos ou desestruturados para serem facilmente digeridos por bancos de dados relacio-nais convencionais. Mas o ponto principal da análise preditiva não se refere ao volume relativo ou rebeldia dos dados, mas o que você faz com eles. Descobri que “big data frequentemente equivale a matemática simples”, e muitos profissionais de big data ficam satisfeitos apenas de usar seus dados para criar visualizações analíticas interessantes. Nem de perto isso tem o mesmo valor de se criar um modelo preditivo.

Siegel criou um livro que é tanto sofisticado quanto perfeitamente acessível para o leitor não adepto da análise quantitativa. O livro tem excelentes histórias, ótimas ilustrações e um tom divertido. Os não adeptos da análise quantitativa definitivamente precisam ler este livro, pois é quase certo que seus comportamentos serão analisados e previstos ao longo de suas vidas. É também bastante provável que a maioria dos não adeptos da análise quantitativa terá que, cada vez mais, avaliar e tomar decisões usando modelos preditivos no trabalho.

Resumindo, vivemos em uma sociedade preditiva. A melhor maneira de prosperar nela é compreender os objetivos, as técnicas e os limites dos modelos preditivos. E a me-lhor maneira de fazer isso é simplesmente continuar lendo este livro.

— Thomas H. Davenport

Professor Distinto na Babson College,

membro do Centro de Negócios Digitais do MIT,

Consultor Sênior na Deloitte Analytics,

e cofundador do International Institute for Analytics.

Ele é coautor de Competing on Analytics,

Big Data @ Work, e diversos outros livros sobre analytics.

CG_PREDICTIVE_ANALYTICS.indb 16 31/05/2017 14:26:21

Page 7: ANÁLISE PREDITIVA

XVII

Prova: CG_Predictive_Analytics Data: 26/05/2017Liberado por: Bianca Teodoro

Prova: CG_Predictive_Analytics Data: 26/05/2017Liberado por: Bianca Teodoro

Prefácio da Edição Revista e Atualizada

O Que É Novo e Para Quem É Este Livro — Perguntas Frequentes sobre Análise Preditiva

Cientista de Dados: O Trabalho Mais Sexy do Século XXI

— Título de um artigo de do Harvard Business Review, escrito por

Thomas Davenport e DJ Patil, que em 2015

se tornou o primeiro Cientista de Dados Chefe dos Estados Unidos

A predição é próspera. Ela está reinventando setores e dominando o mundo.

Cada vez mais, a análise preditiva (AP) impulsiona o comércio, a indústria, a assistên-cia médica, o governo e os agentes da lei. Nestas esferas, as organizações funcionam de modo mais eficiente utilizando-se da previsão de comportamento — ou seja, o resultado para cada cliente individual, funcionário, paciente, eleitor e suspeito.

Todo mundo está fazendo isso. A Accenture e a Forrester relatam que a adoção da AP mais do que dobrou nos últimos anos. A Transparency Market Research projeta que o mercado de AP atingirá 6,5 bilhões de dólares em poucos anos. Uma pesquisa da Gartner classificou os negócios de inteligência e análise como a prioridade de investimento nú-mero um dos diretores executivos de informação. E, em um estudo do Salesforce.com, a AP mostrou a maior taxa de crescimento entre todas as tendências de tecnologias de venda, tendo sua adoção mais do que dobrado nos 18 meses seguintes. Equipes de vendas de alto desempenho têm uma probabilidade quatro vezes maior de já estarem usando a AP do que as equipes de desempenho inferior.

Sou testemunha da crescente aplicação da AP em todos os setores. A série de conven-ções Predictive Analytics World (PAW), fundada por mim, já recebeu mais de 10.000 participantes desde seu lançamento em 2009 e está se expandindo muito além dos even-tos originais PAW Business (Negócios). Com o auxílio especializado de parceiros do setor, nós criamos eventos focados em diversos setores como PAW Government (Gover-no), PAW Healthcare (Assistência Médica), PAW Financial (Finanças), PAW Workforce (Força de Trabalho) e PAW Manufacturing (Indústria), eventos para executivos seniores e o site de notícias The Predictive Analytics Times.

CG_PREDICTIVE_ANALYTICS.indb 17 31/05/2017 14:26:21

Page 8: ANÁLISE PREDITIVA

XVIII análise preditiva

Prova: CG_Predictive_Analytics Data: 26/05/2017Liberado por: Bianca Teodoro

Prova: CG_Predictive_Analytics Data: 26/05/2017Liberado por: Bianca Teodoro

Desde a publicação da primeira edição deste livro, fui encarregado de proferir discur-sos programáticos em cada um dos seguintes setores: marketing, pesquisa de mercado, e-commerce, serviços financeiros, seguros, notícias, assistência médica, farmacêutica, governo, recursos humanos, viagens, mercado imobiliário, construção e direito, além de reuniões de executivos e convenções de universidades.

Quer uma futura carreira em futurologia? A demanda está nas alturas. A McKinsey prevê uma carência de 140 mil especialistas em analytics e de 1,5 milhão de gerentes “com habilidades para entender e tomar decisões com base na análise de big data.” A “Habili-dade mais Popular para uma Pessoa ser Contratada” no LinkedIn é “análise estatística e mineração de dados.”

AP é como Moneyball para…dinheiro.

Perguntas Frequentes sobre Análise Preditiva

Para Quem É Este Livro?Para todos. Ele é de fácil compreensão por todos os leitores. Em vez de um manual sobre “como fazer” para técnicos, o livro é útil para leitores leigos, entusiastas da tecnologia, executivos e especialistas em analytics e abrange novos estudos de caso, além das últimas e mais modernas técnicas.

A Ideia por Trás da Análise Preditiva É Difícil de Entender?De forma alguma. O conceito sofisticado e inebriante de aprender a partir dos dados para prever pode parecer inalcançável, mas basta dar uma rápida olhada no breve capítulo de Introdução para ver que a ideia básica é clara, acessível e inegavelmente poderosa.

Este Livro É um Manual Prático?

Não, é uma introdução substancial e conceitualmente completa e uma visão geral da atividade.

Não é um Manual Prático? Então, Por Que os Técnicos da Área Devem Ler?Embora esta introdução sem tecnicalidades seja compreensível para qualquer leitor — incluindo aqueles sem conhecimento técnico — veja por que ele também agrega valor para os profissionais experientes e iniciantes:

CG_PREDICTIVE_ANALYTICS.indb 18 31/05/2017 14:26:21

Page 9: ANÁLISE PREDITIVA

Prefácio da Edição Revista e Atualizada XIX

Prova: CG_Predictive_Analytics Data: 26/05/2017Liberado por: Bianca Teodoro

Prova: CG_Predictive_Analytics Data: 26/05/2017Liberado por: Bianca Teodoro

•• Um ótimo lugar para começar — oferece conhecimento conceitual necessário para aqueles que seguirão no aprendizado prático ou atuarão em posições de direção ou gerência na aplicação da AP.

•• Estudos de caso detalhados — que exploram as aplicações reais da AP em or-ganizações como Chase, IBM, HP, Netf lix, NSA, Target, U.S. Bank, entre outras.

•• Um compêndio de 182 mini estudos de caso — a Central de Tabelas, dividida em grupos por setor, incluindo exemplos da BBC, Citibank, ConEd, Facebook, Ford, Google, IRS, Match.com, MTV, PayPal, Pfizer, Spotify, Uber, UPS, Wiki-pédia, e muitos outros.

•• Tópicos avançados e super atuais — os últimos três capítulos apresentam sub-campos novos até mesmo para muitos especialistas: agrupamento de modelos, per-guntas e respostas sobre o Watson da IBM e modelagem uplift. Não importa quanta ex-periência você tenha, começar com uma visão geral conceitualmente rica, embora não técnica, pode ser mais benéfico do que você imagina — especialmente para modelagem uplift. As Notas desses três capítulos oferecem referências abrangentes sobre códigos fontes tecnicamente mais complexos (disponível em www.altabooks.com.br, procure pelo título do livro).

•• Privacidade e liberdades civis — o segundo capítulo trata das questões éticas específicas que surgem quando utilizamos o poder da AP.

•• Panorama holístico do setor — o livro abrange mais conteúdo do que uma introdução padrão de uma tecnologia — todos os pontos citados se juntam para for-necer uma pesquisa de campo que esclarece seu contexto social, comercial e ético.

Dito isso, profissionais da área mais experientes que desejam mergulhar diretamente em uma abordagem mais tradicional, tecnicamente mais profunda ou prática deste assunto devem se considerar avisados: este não é o livro que você procura (mas é um bom pre-sente; qualquer amigo ou familiar será capaz de entender e aprender sobre seu campo de interesse).

Assim como acontece com introduções a outros campos da ciência e da engenharia, se você estiver buscando uma carreira no setor, este livro estabelecerá a base, apenas para abrir seu apetite por mais. Ao final deste livro, você é orientado pelo Guia Prático sobre onde encontrar manuais técnicos, teoria avançada e a matemática por trás de tudo.

Qual é a Objetivo deste Livro?Escrevi este livro para demonstrar por que a AP é intuitiva, poderosa e impressionante. Este é um livro sobre as maiores e mais inf luentes conquistas da predição informatizada e sobre as duas coisas que tornam isso possível: as pessoas por trás dela e a ciência fasci-nante que a move.

CG_PREDICTIVE_ANALYTICS.indb 19 31/05/2017 14:26:21

Page 10: ANÁLISE PREDITIVA

XX análise preditiva

Prova: CG_Predictive_Analytics Data: 26/05/2017Liberado por: Bianca Teodoro

Prova: CG_Predictive_Analytics Data: 26/05/2017Liberado por: Bianca Teodoro

Enquanto há diversos livros que abordam o lado prático da AP, este livro tem um propósito diferente (que acabou se mostrando um desafio recompensador para o autor): compartilhar com um público mais amplo um panorama completo do campo, desde o modo como a AP fortalece as organizações, até o funcionamento interno da modelagem preditiva.

Com o impacto da AP crescendo tão rapidamente no mundo, já é hora de o poder preditivo dos dados — e como explorá-lo cientificamente — ser desmistificado. Apren-der com os dados para prever o comportamento humano não é mais um mistério.

Quão Técnico É Este Livro?Ao mesmo tempo que é acessível e proveitoso para os iniciantes com qualquer tipo de experiência anterior, este livro explora “os segredos” o suficiente para desvendar o fun-cionamento das árvores de decisão (Capítulo 4), uma forma exemplar de modelo prediti-vo que funciona bem como ponto de partida para aprender sobre AP, e geralmente como uma boa primeira opção ao executar um projeto de AP.

Eu me esforcei para ir o mais fundo possível nos fundamentos — em meio à gama de tópicos fascinantes relacionados à AP — mantendo ao mesmo tempo o interesse e a acessibilidade não apenas para os usuários novatos, mas até mesmo para os interessados na área como lazer, curiosos sobre a ciência e em como ela está mudando o mundo.

Este É um Livro-texto para a Universidade?Este livro tem sido utilizado como livro-texto em mais de 30 universidades e faculdades. Como ex-professor de ciência da computação, escrevi esta introdução para ser concei-tualmente completa. No sumário, as palavras entre parênteses ao lado de cada título “sugestivo e divertido” do capítulo descreve os fundamentos nele contidos: (1) modelo de implantação, (2) ética, (3) dados, (4) modelo preditivo, (5) agrupamento de modelos, (6) resposta de dúvidas e (7) modelagem uplift. Para uma orientação sobre o modo de leitura, veja o diagrama na próxima pergunta.

Entretanto, o livro não é escrito no estilo formal de livros-texto, a intenção foi criar uma obra divertida, envolvente e pertinente que ilustrasse os conceitos basicamente por meio de narrativas divertidas.

Para professores que estejam pensando em adotar este livro como material de aulas, mais recursos e informações podem ser encontradas em www.teachPA.com (conteúdo em inglês).

Como Devo Ler Este Livro?Os capítulos deste livro se somam. Alguns dependem apenas da leitura da introdução, mas outros seguem uma progressão lógica. A figura abaixo demonstra essas relações de

CG_PREDICTIVE_ANALYTICS.indb 20 31/05/2017 14:26:21

Page 11: ANÁLISE PREDITIVA

Prefácio da Edição Revista e Atualizada XXI

Prova: CG_Predictive_Analytics Data: 26/05/2017Liberado por: Bianca Teodoro

Prova: CG_Predictive_Analytics Data: 26/05/2017Liberado por: Bianca Teodoro

dependência — leia o capítulo apenas depois de ler o capítulo para o qual aponta a seta. Por exemplo, o Capítulo 3 presume que você tenha lido o Capítulo 1, que, por sua vez, pressupõe a leitura da introdução.

Prólogo Prefácio Introdução

Cap.2

Cap.3

Cap.1

Cap.4

Cap.5 Cap.7

Cap.6

Central de Tabelas(ética)(implantação)

(dados)

(modelagem)

(agrupamentos) (uplift)

(respostas de perguntas)

Dependências entre capítulos. Uma seta apontando para cima significa “Leia o capítulo acima primeiro”.

O Que É Novo na Edição “Revista e Atualizada” de Análise Preditiva?

•• O Real Motivo de a NSA Querer Seus Dados: Identificação Automática de Suspeitos. Um box especial no Capítulo 2 (sobre ética na AP) presume — com provas suficientes — que a Agência de Segurança Nacional dos Estados Unidos (NSA) considera a AP uma prioridade estratégica. É possível a organização usar a AP sem ameaçar as liberdades civis?

•• Dezenas de novos exemplos de organizações como o Facebook, Hopper, Shell, Uber, UPS, o governo dos Estados Unidos e muitos outros. O com-pêndio Central de Tabelas com mini estudos de caso aumentou para 182 entradas, incluindo exemplos de fracassos.

•• Um aviso bastante necessário com relação à ciência mal executada. O Capítulo 3, “O Efeito Dados”, inclui uma seção detalhada sobre uma armadilha bastante comum e como evitá-la, ou seja, como explorar o potencial dos dados sem ser enganado pelo ruído aleatório, garantindo que descobertas sólidas sejam feitas.

CG_PREDICTIVE_ANALYTICS.indb 21 31/05/2017 14:26:21

Page 12: ANÁLISE PREDITIVA

Prova: CG_Predictive_Analytics Data: 26/05/2017Liberado por: Bianca Teodoro

XXII análise preditiva

Prova: CG_Predictive_Analytics Data: 26/05/2017Liberado por: Bianca Teodoro

•• Observações ainda mais abrangentes, atualizadas e ampliadas para 120 páginas, e agora online. As Notas estão disponíveis em www.altabooks.com.br (conteúdo em inglês). Elas incluem citações e comentários relativos ao novo conte-údo mencionado, assim como citações atualizadas ao longo dos capítulos.

Onde Posso Aprender Mais com Algo Mais Prático Depois Deste Livro?

•• O Guia Prático ao final deste livro — opções de leitura e treinamento que orientam como começar

•• O site deste livro contém vídeos, artigos e mais recursos: www.theprediction-book.com (conteúdo em inglês)

•• Predictive Analytics World — uma série de convenções de fornecedores líde-res na América do Norte e na Europa, que inclui workshops avançados e eventos específicos em diferentes setores, como PAW Business, PAW Government, PAW Healthcare, PAW Financial, PAW Workforce, e PAW Manufacturing: www.paw-con.com (conteúdo em inglês)

•• The Predictive Analytics Guide — artigos, portais para diversas áreas de ativi-dade e outros recursos: www.pawcon.com/guide (conteúdo em inglês)

•• Análise Preditiva Aplicada — curso online do autor, traduzido para o portu-guês, que, ao contrário deste livro, é um manual prático sobre a AP. Acesse imedia-tamente, a qualquer momento: www.analisepreditiva.com.br

•• The Predictive Analytics Times — o recurso principal: notícias do setor, artigos técnicos, vídeos, eventos e comunidade: www.predictiveanalyticstimes.com (con-teúdo em inglês)

CG_PREDICTIVE_ANALYTICS.indb 22 31/05/2017 14:26:21

Page 13: ANÁLISE PREDITIVA

XXIII

Prova: CG_Predictive_Analytics Data: 26/05/2017Liberado por: Bianca Teodoro

Prova: CG_Predictive_Analytics Data: 26/05/2017Liberado por: Bianca Teodoro

Prefácio da Edição Original

Ontem é história, amanhã é um mistério, mas hoje é uma dádiva. Por isso o chamamos de presente.

— Atribuído a A. A. Milne, Bil Keane e Mestre Oogway,

a sábia tartaruga em Kung Fu Panda

As pessoas me olham de modo estranho quando eu digo o que faço. Ossos do ofício.

A Era da Informação padece de evidente omissão. Essa declaração pode surpreender muitas pessoas, considerando que registramos ativamente Tudo Que Acontece no Mun-do. A partir dos livros históricos que relatam eventos importantes, nós evoluímos para sistemas que registram cada clique, pagamento, chamada, falha, crime e doença. Com isso, você poderia imaginar que aficionados por dados estariam satisfeitos, para não dizer completamente mimados.

Mas essa aparente infinidade de informação exclui justamente os eventos que seriam mais importantes de saber: as coisas que ainda não aconteceram.

Todo mundo almeja o poder de ver o futuro; nós somos todos obcecados por pre-visões. Nós reverenciamos as divindades adivinhatórias. Esvaziamos nossos bolsos para alguém ler nossa mão. Prestamos atenção a horóscopos, adoramos astrologia e devoramos biscoitos da sorte.

Mas muitas pessoas que se empolgam com videntes também trilham o caminho da ciência. Sua resposta natural é dizer “eca” — ou é muito difícil de entender ou é muito chato. Ou talvez muitos acreditem que a predição, por sua natureza, é impossí-vel sem o auxílio do sobrenatural.

Há um programa de TV divertido de que gosto que trata deste tema, Psych, no qual um detetive muito astuto — um Sherlock Holmes moderno e entusiasta dos dados — aperfeiçoou a arte da observação com tal maestria que os policiais acham que suas deduções precisas só podem ser oriundas de sua culpa. O herói se safa do problema se adequando ao padrão: ele simplesmente diz à polícia que é vidente, conseguindo assim se livrar da cadeia e continuar a combater o crime. O resultado é uma comédia.

Eu vivencio o mesmo impulso, por exemplo, quando alguém pergunta qual meu signo no zodíaco. Mas, em vez de fingir que acredito em horóscopo, uso o humor: “Sou de Escorpião, e pessoas de Escorpião não acreditam em astrologia.”

A pergunta mais comum em festas é o que faço. Eu me preparo para olhos assustados quando cuidadosamente declaro: sou analista preditivo. A maioria das pessoas pode se dar ao luxo de descrever sua profissão em uma única palavra: advogado, médico, garçom, contador

CG_PREDICTIVE_ANALYTICS.indb 23 31/05/2017 14:26:21

Page 14: ANÁLISE PREDITIVA

XXIV análise preditiva

Prova: CG_Predictive_Analytics Data: 26/05/2017Liberado por: Bianca Teodoro

ou ator. Mas, para mim, descrever esse campo quase totalmente desconhecido sempre acaba com a conversa. Qualquer tentativa de ser sucinto vai por água abaixo:

Sou consultor de negócios em tecnologia. Eles não ficam satisfeitos e perguntam: Que tipo de tecnologia?

Faço com que computadores prevejam o que as pessoas farão. O resultado é perplexidade, acompanhada por uma total descrença e um pouco de medo.

Faço com que computadores aprendam a prever o comportamento humano individual a partir de dados. Perplexidade, e ninguém quer conversar sobre dados em uma festa.

Analiso dados para encontrar padrões. Olhos ainda mais arregalados; pausas desconcer-tantes mergulham em um mar de abstração.

Ajudo os profissionais de marketing a descobrir quais consumidores comprarão ou cancelarão um serviço. Eles meio que entendem, mas desvalorizam e menosprezam o campo.

Prevejo o comportamento do cliente, como quando a Target conseguiu prever se alguém estava grávida. O resultado é que fico falando sozinho.

Assim, escrevi este livro para demonstrar por que a análise preditiva é intuitiva, po-derosa e impressionante.

Tenho boas notícias: um pouco de previsão pode ir longe. Chamo isso de Efeito Predição, um tema recorrente ao longo do livro. O poder da predição é considerável, desde que as previsões sejam mais do que simples adivinhação. Esse efeito torna a análise prediti-va crível. Nós não temos que fazer o impossível e atingir a verdadeira clarevidência. A história é empolgante e ainda assim crível: lançando probabilidades sobre o futuro para remover um pouquinho a neblina de nossa visão embaçada do amanhã significa fazer descobertas valiosas. Dessa maneira, a análise preditiva combate os riscos, impulsiona as vendas, reduz custos, fortalece a assistência médica, aperfeiçoa a produção, filtra spams, fortalece o combate ao crime, otimiza as mídias sociais e vence eleições.

Você tem a alma de cientista ou de homem de negócios? Você fica mais empolgado apenas pela ideia da predição ou pelo valor que ela tem para o mundo?

Eu me impressionei pela ideia de saber o ininteligível. A predição parece desafiar as leis da natureza: você não pode prever o futuro porque ele ainda não aconteceu. Conseguimos vencer esse obstáculo construindo máquinas que aprendem com as experiências. É o méto-do controlado de usar o que já sabemos — na forma de dados — para fazer apostas cada vez mais precisas sobre o que está por vir. Mesclamos o melhor da matemática e da tecnologia, ajustando sistematicamente até que nossos corações de cientistas estejam satisfeitos para criar um sistema que enxergue além da barreira impenetrável entre o hoje e o amanhã.

Isso é que é ousar ir onde ninguém jamais esteve!

Algumas pessoas são da área de vendas; outras da política. Eu sou da área de predição, e ela é fantástica.

CG_PREDICTIVE_ANALYTICS.indb 24 31/05/2017 14:26:21

Page 15: ANÁLISE PREDITIVA

nunc

a

públi

co

tópico

saúd

e

Apre

nden

do

apre

ndeu

futur

o

poss

ível

par

vida

cartã

oEfe

ito

mão

fraud

ulent

a

resp

onde

pesq

uisad

ores

valor

efeito

s

dese

nvolv

eu

máqu

ina

algo

siste

mahip

otec

a

expe

riênc

ia

grup

o meno

s

traba

lho

prov

ável

como

cami

nho

basea

do

ciênc

ia

predit

iva

tecno

logia

crédit

oem

presa

pedid

o

bem

huma

no

Data ca

soan

ualm

ente

pess

oasind

ivídu

o

cresc

imen

to

quas

e

assis

tência

méd

ica

email

atrav

és d

ecli

entes

detec

tar

nome

usar

spam

bene

fício

sabe

r

colocar

dia

outro

s

estimado

fato

prime

iro

núme

rome

lhor

ment

e

poder

apen

asPe

ssoas

exem

plos

ver

milhão

comum

prevendo

anos

métodos

devedores

coisa

comportamento

governo

precedente

aprende

torna

morte

reivindica

precisão

timeprocesso

geral

tempo

cérebro

outra

pensar

novo

correio

levar a

fazer

melhor

gera

de acordo

Pesq

uisad

ores

livro

pega

r

coisa

s

comp

utado

res

cham

ar

segu

inte

huma

nidad

e

decis

ões

análi

se p

reditiv

ajoe

lhomu

itosde

mand

ar

cirur

gia

pode

literal

mente

dentro de

negó

cios

organ

izaçõ

espró

ximo

organ

izaçõ

es

conh

ecim

ento

respo

sta

clien

te

apren

dizad

o

segu

roma

rketi

ng

empr

esas

comp

letam

ente

médic

o

aind

acri

me

organ

izar

com

frequ

ência faz

dado

saprendizado de máquina

computador

previs

ãoap

rend

er

ainda

hosp

ital

tempo

s

alvo

mal

indivi

dual

cham

ado

todo

empre

go

ver

ver

usar

huma

nidad

e

médic

o

Efeito

quas

e

timemã

o

usar

algo

levar a

geral

nunc

ade

mand

ar

ver

ver

ver

time

alvo

alvo

alvo

algo

alvo

anos

par

todo

morteméd

ico

algo

ver

médic

o

morte

Prova: CG_Predictive_Analytics Data: 26/05/2017Liberado por: Bianca Teodoro

CG_PREDICTIVE_ANALYTICS.indb 1 31/05/2017 14:26:21