curso intro à ciência de dados com r - 2 - aplicacoes

Post on 07-Feb-2017

32 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

José Roberto Motta Garciagarcia.cptec@gmail.comNov/2016

Fases da análise de dados – Aplicações

José Roberto M. Garcia Nov/2016Introdução à Ciência de Dados com R

Boxplot – Distribuição e detecção de anomalias

Valor discrepante superior (extremo, outlier, anomalia)Maior valor não-discrepante

Terceiro quartil (75% da qtd de dados)

Média (pelos valores)Mediana (divide qtd de dados pela metade, 50%)

Primeiro quartil (25% da qtd de dados)

Menor valor não-discrepante Valores discrepantes inferiores (extremos, outliers, anomalia)

50% dos dados

(interquartil)

José Roberto M. Garcia Nov/2016Introdução à Ciência de Dados com R

Boxplot – Distribuição e detecção de anomalias

José Roberto M. Garcia Nov/2016Introdução à Ciência de Dados com R

Detecção de anomalias em séries temporais

José Roberto M. Garcia Nov/2016Introdução à Ciência de Dados com R

VERIFICAPADRÕES

DEVARIAÇÃO

Mineração de redes sociais (Twitter)

José Roberto M. Garcia Nov/2016Introdução à Ciência de Dados com R

1. Create an application at dev.twitter

2. Authenticate3. Gets Tweets from Twitter4. Clean the data

Mineração de texto – Nuvem de palavras - Código

José Roberto M. Garcia Nov/2016Introdução à Ciência de Dados com R

Mineração de texto – Nuvem de palavras - Resultado

José Roberto M. Garcia Nov/2016Introdução à Ciência de Dados com R

Agrupamento por similaridade (clustering) - Código

José Roberto M. Garcia Nov/2016Introdução à Ciência de Dados com R

Agrupamento por similaridade (clustering) – Resultado gráfico

José Roberto M. Garcia Nov/2016Introdução à Ciência de Dados com R

Agrupamento por similaridade (clustering) – Outros plots

José Roberto M. Garcia Nov/2016Introdução à Ciência de Dados com R

04.03-Agrupamento2.R

3D

Agrupamento por similaridade (hierárquico) - dendograma

José Roberto M. Garcia Nov/2016Introdução à Ciência de Dados com R

Criando mapas

José Roberto M. Garcia Nov/2016Introdução à Ciência de Dados com R

top related