Download - TDC2016SP - Trilha Data Science
Visual Literacycomunicar e decidir sobre dados
Ingrid Pino
Ingrid [email protected]
4 anosdedicados a
Marketing Intelligencena
5 paísesenvolvidos nos projetos de
desenvolvimento deDashboards
Como usar conhecimentos essenciais sobre visualização de dados
para tornar Data Science relevante para a empresa
?
Visual Literacyou
Data Visualization?
Data Visualizationestudar e criar representações
visuais para dados
capacidade de expor e interpretar dados de forma visual
Visual Literacy
Por que é importante?
Como aplicar no dia a dia?
Como facilitar absorção do conteúdo?
Dicas Avançadas
Visual Literacy
Por que DataViz é
importante?Comunicar a mensagem de
forma rápida e eficiente
50%das funções cerebrais estão relacionadas com processamento visual
70%de todos os receptores
sensoriais estão nos seus olhos
90%Das informações transmitidas para o cérebro são visuais
Informações visuais são processadas 60.000 vezes mais rápido do que texto
Pirâmide deAprendizado
5%Palestra
10%Leitura20%
Audiovisual30%
Demonstração50%
Discussão75%
Prática90%
Ensinar outros
Análise de dados
Estruturação de dados
Empresa guiada por
dados
Dados são seu produto
Ferramentas Básicas
Engenharia de Software
Estatística
Machine Learning
Mineração de dados
Visualização de Dados
Pensamento guiado por dados
Fonte: Holtz, Dave. (2014). 8 Skills you need to be a Data Scientist. http://blog.udacity.com/
Análise de dados
Estruturação de dados
Empresa guiada por
dados
Dados são seu produto
Ferramentas Básicas
Engenharia de Software
Estatística
Machine Learning
Mineração de dados
Visualização de Dados
Pensamento guiado por dados
Fonte: Holtz, Dave. (2014). 8 Skills you need to be a Data Scientist. http://blog.udacity.com/
Análise de dados
Estruturação de dados
Empresa guiada por
dados
Dados são seu produto
Ferramentas Básicas
Engenharia de Software
Estatística
Machine Learning
Mineração de dados
Visualização de Dados
Pensamento guiado por dados
Fonte: Holtz, Dave. (2014). 8 Skills you need to be a Data Scientist. http://blog.udacity.com/
Fonte: Holtz, Dave. (2014). 8 Skills you need to be a Data Scientist. http://blog.udacity.com/
Análise de dados
Estruturação de dados
Empresa guiada por
dados
Dados são seu produto
Ferramentas Básicas
Engenharia de Software
Estatística
Machine Learning
Mineração de dados
Visualização de Dados
Pensamento guiado por dados
Dados só têm valorquando são entendidos,
não basta estarem disponíveis
Quarteto de AnscombeConjuntos de dados
I II III IVx y x y x y x y
10.0 8.04 10.0 9.14 10.0 7.46 8.0 6.58
8.0 6.95 8.0 8.14 8.0 6.77 8.0 5.76
13.0 7.58 13.0 8.74 13.0 12.74 8.0 7.71
9.0 8.81 9.0 8.77 9.0 7.11 8.0 8.84
11.0 8.33 11.0 9.26 11.0 7.81 8.0 8.47
14.0 9.96 14.0 8.10 14.0 8.84 8.0 7.04
6.0 7.24 6.0 6.13 6.0 6.08 8.0 5.25
4.0 4.26 4.0 3.10 4.0 5.39 19.0 12.50
12.0 10.84 12.0 9.13 12.0 8.15 8.0 5.56
7.0 4.82 7.0 7.26 7.0 6.42 8.0 7.91
5.0 5.68 5.0 4.74 5.0 5.73 8.0 6.89
Quarteto de AnscombeConjuntos de dados
I II III IVx y x y x y x y
10.0 8.04 10.0 9.14 10.0 7.46 8.0 6.58
8.0 6.95 8.0 8.14 8.0 6.77 8.0 5.76
13.0 7.58 13.0 8.74 13.0 12.74 8.0 7.71
9.0 8.81 9.0 8.77 9.0 7.11 8.0 8.84
11.0 8.33 11.0 9.26 11.0 7.81 8.0 8.47
14.0 9.96 14.0 8.10 14.0 8.84 8.0 7.04
6.0 7.24 6.0 6.13 6.0 6.08 8.0 5.25
4.0 4.26 4.0 3.10 4.0 5.39 19.0 12.50
12.0 10.84 12.0 9.13 12.0 8.15 8.0 5.56
7.0 4.82 7.0 7.26 7.0 6.42 8.0 7.91
5.0 5.68 5.0 4.74 5.0 5.73 8.0 6.89
Y
X
Quarteto de AnscombeEstatística descritiva de cada um dos conjuntos
Média de X: 9 (exato)
Variância de X: 11 (exato)
Média de Y: 7.50 (2 casas decimais)
Variância de Y: 4.122 ou 4.127 (3 casas decimais)
Correlação entre X e Y: 0.816 (3 casas decimais)
Regressão Linear: y = 3.00 + 0.500x (2 e 3 casas decimais, respectivamente)
Média de X: 9 (exato)
Variância de X: 11 (exato)
Média de Y: 7.50 (2 casas decimais)
Variância de Y: 4.122 ou 4.127 (3 casas decimais)
Correlação entre X e Y: 0.816 (3 casas decimais)
Regressão Linear: y = 3.00 + 0.500x (2 e 3 casas decimais, respectivamente)
Quarteto de AnscombeEstatística descritiva de cada um dos conjuntos
Quarteto de AnscombeRepresentação gráfica dos quatro conjuntos
Por que fazer algo além de pizzas e linhas?
É uma ferramenta importante entre suas
habilidades profissionais?
Gráficos complexos são legais e fazem a mensagem
parecer importante?
ContextoVisualizações mais complexas devem mostrar o sistema a que pertencem as informações, ou as correlações entre os dados
Isso traz clareza para as análises e gera insights!
PersuasãoMostrar os dados de forma compreensível é essencial como ponte de
comunicação entre operacional e executivo.
Só assim as decisões são tomadas com base nos dados!
Fonte: Data Visualization Applications Market: 2015-2020. Mordor Intelligence
Como está o mercado de DataViz?
Global Data Visualization applications Market
$4.25 billion
$8.33 billion2015
2020
Big Data
Como está o mercado de DataViz?
Fonte: Data Visualization: 2015 HorizonWatch Trend Report. IBM Market Development & Insights
Big Data
Necessidade de decisões rápidas
Como está o mercado de DataViz?
Fonte: Data Visualization: 2015 HorizonWatch Trend Report. IBM Market Development & Insights
Big Data
Necessidade de decisões rápidas
Avanços em desenvolvimento de software
Como está o mercado de DataViz?
Fonte: Data Visualization: 2015 HorizonWatch Trend Report. IBM Market Development & Insights
Demanda por ferramentas fáceis de usar
Como está o mercado de DataViz?
Fonte: Data Visualization: 2015 HorizonWatch Trend Report. IBM Market Development & Insights
Demanda por ferramentas fáceis de usar
Integrar dashboards nas atividades diárias com as plataformas mobile
Como está o mercado de DataViz?
Fonte: Data Visualization: 2015 HorizonWatch Trend Report. IBM Market Development & Insights
Demanda por ferramentas fáceis de usar
Integrar dashboards nas atividades diárias com as plataformas mobile
Novos processos e habilidades necessárias
Como está o mercado de DataViz?
Fonte: Data Visualization: 2015 HorizonWatch Trend Report. IBM Market Development & Insights
Demanda por ferramentas fáceis de usar
Integrar dashboards nas atividades diárias com as plataformas mobile
Novos processos e habilidades necessárias
Gerenciamento da qualidade dos dados
Como está o mercado de DataViz?
Fonte: Data Visualization: 2015 HorizonWatch Trend Report. IBM Market Development & Insights
Como está o mercado de DataViz?
Aumento do interesse e do gasto com DataViz
Fonte: Data Visualization: 2015 HorizonWatch Trend Report. IBM Market Development & Insights
Como está o mercado de DataViz?
Aumento do interesse e do gasto com DataVizIntegração de dados
Fonte: Data Visualization: 2015 HorizonWatch Trend Report. IBM Market Development & Insights
Como está o mercado de DataViz?
Aumento do interesse e do gasto com DataVizIntegração de dados
Real Time
Fonte: Data Visualization: 2015 HorizonWatch Trend Report. IBM Market Development & Insights
Como está o mercado de DataViz?
Aumento do interesse e do gasto com DataVizIntegração de dados
Real TimeMobile
Fonte: Data Visualization: 2015 HorizonWatch Trend Report. IBM Market Development & Insights
Como está o mercado de DataViz?
Aumento do interesse e do gasto com DataVizIntegração de dados
Real TimeMobile
Self service
Fonte: Data Visualization: 2015 HorizonWatch Trend Report. IBM Market Development & Insights
Como está o mercado de DataViz?
Aumento do interesse e do gasto com DataVizIntegração de dados
Real TimeMobile
Self serviceStorytelling
Fonte: Data Visualization: 2015 HorizonWatch Trend Report. IBM Market Development & Insights
Como mostrar informações da melhor forma?
Dicas para o dia a dia
O que será mostrado no
gráfico?
O que será mostrado no
gráfico?
Comparação:confrontar dados ao longo do tempo ou entre várias categorias
O que será mostrado no
gráfico?
Comparação:confrontar dados ao longo do tempo ou entre várias categorias
Relação:mostrar a interdependência entre variáveis
O que será mostrado no
gráfico?
Comparação:confrontar dados ao longo do tempo ou entre várias categorias
Composição:mostrar os componentes de um todo
Relação:mostrar a interdependência entre variáveis
O que será mostrado no
gráfico?
Comparação:confrontar dados ao longo do tempo ou entre várias categorias
Distribuição:mostrar a frequência em que ocorrem os dados
Composição:mostrar os componentes de um todo
Relação:mostrar a interdependência entre variáveis
Quantas variáveis, itens ou
categorias?
Comparação:
Distribuição:Relação:
Composição:
Quando criar um gráfico, pergunte:
Objetivo?
Quando criar um gráfico, pergunte:
Objetivo?
Tipos de dados?
Quando criar um gráfico, pergunte:
Objetivo?
Tipos de dados?
Métricas e dimensões?
Quando criar um gráfico, pergunte:
Objetivo?
Tipos de dados?
Métricas e dimensões?
Quem vai ler?
Quando criar um gráfico, pergunte:
Objetivo?
Tipos de dados?
Métricas e dimensões?
Quem vai ler?
Quais decisões podem ser tomadas?
Como facilitar a absorção das informações?O cliente precisa entender
Lorem ipsum dolor sit amet, consectetur adipiscing elit. Etiam eget ligula eu lectus lobortis condimentum. Aliquam nonummy auctor massa. Pellentesque habitant morbi tristique senectus et netus et malesuada fames ac turpis egestas.
Ordem de Leitura
Ordem de Leitura
PADRÃO
F
Ordem de Leitura
PADRÃO
Z
Tipografia
A COM SERIFA (serif)Ex: Times New Roman
A SEM SERIFA (sans serif)Ex: Arial
Espaçamento
Percepção de área e comprimento
A B C D E F G H0
5
10
15
20
25
30
ABCDEFGH
Percepção de áreas 3D
Ângulo
Área na tela
Quais cuidados devemos tomar?
Não é só evitar pizzas
Número de pessoas que se afogaram em piscinastem correlação com
Filmes em que o Nicolas Cage apareceCorrelação: 66,6% (r=0.666004)
Fonte: tylervigen.com/spurious-correlations
140
120
100
80
6
4
2
0Afog
amen
tos e
m p
iscin
asFilm
es com Nicolas Cage
Nicolas Cage Afogamentos em piscinas
1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009
Correlação ≠ Causalidade!
Evitar distorcer os dados!
Evitar interpretações inadequadas!
Escolher o gráfico
conforme a mensagem
Comparação:
Distribuição:Relação:
Composição:
Testar mais de um gráfico
Como mudar a forma de pensar?
Para comunicar e interpretar melhor
Makeover tradicional
2011 2012 2013 2014 20150
5,000
10,000
15,000
20,000
25,000
São PauloRio de JaneiroMinas GeraisParaná
15.311 17.230 19.210 18.747 22.081
21.087 16.987 16.120 13.402 11.203
12.302 12.210 11.098 10.120 79.20
11.209 11.687 11.987 12.987 11.909
Makeover tradicional
2011 2012 2013 2014 20150
5,000
10,000
15,000
20,000
25,000
São PauloRio de JaneiroMinas GeraisParaná
15.311 17.230 19.210 18.747 22.081
21.087 16.987 16.120 13.402 11.203
12.302 12.210 11.098 10.120 79.20
11.209 11.687 11.987 12.987 11.909
EliminarEfeito 3D
Makeover tradicional
2011 2012 2013 2014 20150
5,000
10,000
15,000
20,000
25,000
São PauloRio de JaneiroMinas GeraisParaná
15.311 17.230 19.210 18.747 22.081
21.087 16.987 16.120 13.402 11.203
12.302 12.210 11.098 10.120 79.20
11.209 11.687 11.987 12.987 11.909
EliminarEfeito 3DFundo colorido
Makeover tradicional
2011 2012 2013 2014 20150
5,000
10,000
15,000
20,000
25,000
São Paulo Rio de Janeiro Minas Gerais Paraná
EliminarEfeito 3DFundo coloridoTabelas
Makeover tradicional
2011 2012 2013 2014 20150
5,000
10,000
15,000
20,000
25,000
São Paulo Rio de Janeiro Minas Gerais Paraná
EliminarEfeito 3DFundo coloridoTabelas
AlterarTipo do gráfico
Makeover tradicional
2011 2012 2013 2014 20150
5,000
10,000
15,000
20,000
25,000
São Paulo Rio de Janeiro Minas Gerais Paraná
EliminarEfeito 3DFundo coloridoTabelasGuias
AlterarTipo do gráfico
Makeover tradicional
2011 2012 2013 2014 20150
5,000
10,000
15,000
20,000
25,000
Rio de JaneiroParaná
Minas Gerais
São PauloEliminarEfeito 3DFundo coloridoTabelasGuias
AlterarTipo do gráficoLegenda
Makeover tradicional
2011 2012 2013 2014 20150
5,000
10,000
15,000
20,000
25,000
21,087
11,203 Rio de JaneiroParaná
Minas Gerais
São PauloEliminarEfeito 3DFundo coloridoTabelasGuias
AlterarTipo do gráficoLegendaDestaque
Makeover tradicional: Antes e Depois
Vamos um pouco além?
Vamos um pouco além?
DificuldadesComparar valores das etapasDestaque para o mês atual
Repensar um formato semelhante
3.32427%
12.24763%
19.59263%
31.03729%
107.24049%
217.93150%
434.716
2.815 21%
13.421 67%
20.063 61%
32.928 26%
128.367 37%
344.856 68%
504.797
Var.
-6pp.
+4pp.
-2pp.
-3pp.
-12pp.
+18pp.
Sucesso
Pagamento
Entrega
Cadastro
Identificação
Produto
Visitas
Dezembro Janeiro
Taxa deIntenção
24%
Taxa deIntenção
25%
Taxa de Conversão0,34%
Taxa de Conversão0,24%
Repensar um formato semelhante: Antes e Depois
Que tal repensar toda a leitura?
550.000DOWNLOADS
150,000
400,000
App1 App2 App3
DOWNLOADS
UPDATES
310.000
90.000
150.000
130.000
50.000
7.000
App4
40.000
5.000
Foco nas necessidades do negócio
550.000DOWNLOADS
150,000
400,000
DOWNLOADS
Quais apps tiveram mais downloads?
Qual é o perfil de usuários de cada app?
Foco nas necessidades do negócio
DOWNLOADS
Quais apps tiveram mais downloads?
Qual é o perfil de usuários de cada app?
0 2,000 4,000 6,000 8,0000
500
1,000
1,500
2,000
DOW
NLOA
DS
DOWNLOADS0
App1 App2 App3 App4
Foco nas necessidades do negócio
App1 App2 App3
UPDATES 90.000 130.000 7.000
App4
5.000
UPDATES
Os usuários adotaram as últimas versões de cada app?
O que pode levar os usuários a não adotarem as últimas versões?
Foco nas necessidades do negócio
UPDATES
Os usuários adotaram as últimas versões de cada app?
O que pode levar os usuários a não adotarem as últimas versões?
App 4
App 3
App 2
App 1
0% 20% 40% 60% 80% 100%Última versãoVersões anteriores
Foco nas necessidades do negócio
App 4
App 3
App 2
App 1
0% 20% 40% 60% 80% 100%Última versãoVersões anteriores
0 2,000 4,000 6,000 8,0000
500
1,000
1,500
2,000
DOW
NLOA
DS
DOWNLOADS0
App1 App2 App3 App4
Foco nas necessidades do negócio: Antes e Depois
Como usar perguntas de negócio pra
fazer melhores gráficos?
Visual Literacycapacidade de expor e interpretar
dados de forma visual
O que queremos ver com cada métrica?
O que queremos ver com cada métrica?
Quais são os objetivos do negócio e como sabemos se foram atingidos?
O que queremos ver com cada métrica?
Quais são os objetivos do negócio e como sabemos se foram atingidos?
Existe uma forma mais objetiva de mostrar os mesmos dados?
Qual informação realmente precisa ser mostrada no gráfico?
Qual informação realmente precisa ser mostrada no gráfico?
Qual é o contexto desses dados?
Qual informação realmente precisa ser mostrada no gráfico?
Qual é o propósito de mostrar esses dados?
Qual é o contexto desses dados?
Qual informação realmente precisa ser mostrada no gráfico?
Qual é o propósito de mostrar esses dados?
Qual é o contexto desses dados?
Quem vai ler e como vai interpretar o gráfico?
E se não der certo?
Prepare-se para falhar
Mapa de Pizzas
Visitas por ÁreaBlogComunidadeDownloadExemplosGaleriaOutros
Pior pizza de todos os tempos
Batatas fritas
Jan Fev Mar Abr Mai Jun Ago Set Out0
2000
4000
6000
8000
0%5%10%15%20%25%
Visitas Conversão
Visit
as
Conv
ersã
o
Jan Fev Mar Abr Mai Jun Ago Set Out0
2000400060008000
10000
0%5%10%15%20%25%
Visitas Conversão
Visit
as
Conv
ersã
o
Jan Fev Mar Abr Mai Jun Ago Set Out0
2000400060008000
1000012000
0%
5%
10%
15%
20%
Visitas Conversão
Visit
as
Conv
ersã
o
Jan Fev Mar Abr Mai Jun Ago Set Out0
2000400060008000
10000
0%5%10%15%20%25%
Visitas Conversão
Visit
as
Conv
ersã
o
Jan Fev Mar Abr Mai Jun Ago Set Out0
2000400060008000
1000012000
0%
5%
10%
15%
20%
Visitas Conversão
Visit
as
Conv
ersã
o
Landing Page A
Display Paid Search
Social Natural Search
Monthly Mobile Activities
Data Visualization é uma ponte de comunicação
Data Visualization é uma ponte de comunicação
O mercado está crescendo
Data Visualization é uma ponte de comunicação
O mercado está crescendo
A capacidade de expor e interpretar dados de forma visual se tornou praticamente indispensável
Pensar nos objetivos das métricas e dos gráficos
Pensar nos objetivos das métricas e dos gráficos
Considerar a ordem de leitura, espaçamento e outras percepções visuais
Pensar nos objetivos das métricas e dos gráficos
Considerar a ordem de leitura, espaçamento e outras percepções visuais
Testar mais de um tipo de gráfico
Repensar a leitura visual conformeos objetivos e necessidades do negócio
Converse sobre os gráficos
!
Converse sobre os gráficos
!
Escute o leitor
Quer mais?
DS3• https://d3js.org
Google Data Studio• www.google.com/analytics/360-suite/data-studio
Data Visualization - Coursera• https://www.coursera.org/learn/datavisualization
Ingrid [email protected]
Dúvidas?Obrigada!