pré-processamento em big data

37
João Gabriel Lima [email protected] Pré-processamento: ferramentas e aplicações

Upload: joao-gabriel-lima

Post on 05-Dec-2014

234 views

Category:

Technology


0 download

DESCRIPTION

Apresentação feita no PPGEE - Programa de Pós Graduação de Engenharia Elétrica da Universidade Federal do Pará Uma explanação geral sobre o funcionamento das principais ferramentas disponíveis no mercado para análise e pré-processamento de dados

TRANSCRIPT

Page 1: Pré-processamento em Big Data

João Gabriel [email protected]

Pré-processamento: ferramentas e aplicações

Page 2: Pré-processamento em Big Data
Page 3: Pré-processamento em Big Data

Importância do Pré-Processamento

● Seleção de atributos

● Limpeza dos Dados

● Transformação

● Construção de atributos

● Discretização

Page 4: Pré-processamento em Big Data
Page 5: Pré-processamento em Big Data

Big Data 6 Vs

• Volume• Variedade• Velocidade

• Valor• Variabilidade• Veracidade

5 29/09/14

V

Page 6: Pré-processamento em Big Data
Page 7: Pré-processamento em Big Data

Pré-Processamento

Vs

Big Data

Page 8: Pré-processamento em Big Data
Page 9: Pré-processamento em Big Data
Page 10: Pré-processamento em Big Data

Open-Source

Desenvolvimento Acadêmico

Inovação

Novos Paradigmas

Critérios

Page 11: Pré-processamento em Big Data

Critérios

Page 12: Pré-processamento em Big Data

Batch X Real-time Processing

Page 13: Pré-processamento em Big Data

Batch Processing

Page 14: Pré-processamento em Big Data
Page 15: Pré-processamento em Big Data

Hadoop (MapReduce)

Page 16: Pré-processamento em Big Data

Hadoop (MapReduce)

Page 17: Pré-processamento em Big Data

Hadoop

Page 18: Pré-processamento em Big Data

HPCC SystemHPCC System

Page 19: Pré-processamento em Big Data

HPCC SystemAPACHE DRILL

Page 20: Pré-processamento em Big Data

HPCC SystemAPACHE DRILL

Page 21: Pré-processamento em Big Data

HPCC SystemAPACHE DRILL

Page 22: Pré-processamento em Big Data

HPCC SystemEcosystems

Page 23: Pré-processamento em Big Data

APACHE SPARK

Page 24: Pré-processamento em Big Data

APACHE SPARK

Page 25: Pré-processamento em Big Data

APACHE SPARK

Page 26: Pré-processamento em Big Data

Yahoo S4

Page 27: Pré-processamento em Big Data

Apache Storm

Page 28: Pré-processamento em Big Data

Apache Storm

Page 29: Pré-processamento em Big Data

Apache Storm

Page 30: Pré-processamento em Big Data

Apache Storm

Page 31: Pré-processamento em Big Data

Apache Storm

Page 32: Pré-processamento em Big Data

Apache Storm

Page 33: Pré-processamento em Big Data

Apache Storm

Page 34: Pré-processamento em Big Data

Apache Storm

Page 35: Pré-processamento em Big Data
Page 36: Pré-processamento em Big Data

Considerações Finais

● Hot Topic

● Muitas ferramentas e frameworks disponíveis

● Importante conhecer o domínio

● Cuidado! Não existe chave mestra!

● Potencial em aprendizagem de máquina

Page 37: Pré-processamento em Big Data

João Gabriel [email protected]

Pré-processamento: ferramentas e aplicações