curso intro à ciência de dados com r - 2 - aplicacoes

13
José Roberto Motta Garcia [email protected] Nov/2016

Upload: jose-roberto-motta-garcia

Post on 07-Feb-2017

32 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Curso Intro à Ciência de Dados com R - 2 - Aplicacoes

José Roberto Motta [email protected]/2016

Page 2: Curso Intro à Ciência de Dados com R - 2 - Aplicacoes

Fases da análise de dados – Aplicações

José Roberto M. Garcia Nov/2016Introdução à Ciência de Dados com R

Page 3: Curso Intro à Ciência de Dados com R - 2 - Aplicacoes

Boxplot – Distribuição e detecção de anomalias

Valor discrepante superior (extremo, outlier, anomalia)Maior valor não-discrepante

Terceiro quartil (75% da qtd de dados)

Média (pelos valores)Mediana (divide qtd de dados pela metade, 50%)

Primeiro quartil (25% da qtd de dados)

Menor valor não-discrepante Valores discrepantes inferiores (extremos, outliers, anomalia)

50% dos dados

(interquartil)

José Roberto M. Garcia Nov/2016Introdução à Ciência de Dados com R

Page 4: Curso Intro à Ciência de Dados com R - 2 - Aplicacoes

Boxplot – Distribuição e detecção de anomalias

José Roberto M. Garcia Nov/2016Introdução à Ciência de Dados com R

Page 5: Curso Intro à Ciência de Dados com R - 2 - Aplicacoes

Detecção de anomalias em séries temporais

José Roberto M. Garcia Nov/2016Introdução à Ciência de Dados com R

VERIFICAPADRÕES

DEVARIAÇÃO

Page 6: Curso Intro à Ciência de Dados com R - 2 - Aplicacoes

Mineração de redes sociais (Twitter)

José Roberto M. Garcia Nov/2016Introdução à Ciência de Dados com R

1. Create an application at dev.twitter

2. Authenticate3. Gets Tweets from Twitter4. Clean the data

Page 7: Curso Intro à Ciência de Dados com R - 2 - Aplicacoes

Mineração de texto – Nuvem de palavras - Código

José Roberto M. Garcia Nov/2016Introdução à Ciência de Dados com R

Page 8: Curso Intro à Ciência de Dados com R - 2 - Aplicacoes

Mineração de texto – Nuvem de palavras - Resultado

José Roberto M. Garcia Nov/2016Introdução à Ciência de Dados com R

Page 9: Curso Intro à Ciência de Dados com R - 2 - Aplicacoes

Agrupamento por similaridade (clustering) - Código

José Roberto M. Garcia Nov/2016Introdução à Ciência de Dados com R

Page 10: Curso Intro à Ciência de Dados com R - 2 - Aplicacoes

Agrupamento por similaridade (clustering) – Resultado gráfico

José Roberto M. Garcia Nov/2016Introdução à Ciência de Dados com R

Page 11: Curso Intro à Ciência de Dados com R - 2 - Aplicacoes

Agrupamento por similaridade (clustering) – Outros plots

José Roberto M. Garcia Nov/2016Introdução à Ciência de Dados com R

04.03-Agrupamento2.R

3D

Page 12: Curso Intro à Ciência de Dados com R - 2 - Aplicacoes

Agrupamento por similaridade (hierárquico) - dendograma

José Roberto M. Garcia Nov/2016Introdução à Ciência de Dados com R

Page 13: Curso Intro à Ciência de Dados com R - 2 - Aplicacoes

Criando mapas

José Roberto M. Garcia Nov/2016Introdução à Ciência de Dados com R