pentaho data integration ceça moraes setembro/2015

37
Pentaho Data Integration Ceça Moraes Setembro/2015

Upload: vagner-freire-regueira

Post on 07-Apr-2016

228 views

Category:

Documents


7 download

TRANSCRIPT

Page 1: Pentaho Data Integration Ceça Moraes Setembro/2015

Pentaho Data Integration

Ceça MoraesSetembro/2015

Page 2: Pentaho Data Integration Ceça Moraes Setembro/2015

Pentaho Data Integration (PDI)

• PDI ou Kettle• http://community.pentaho.com/– http://sourceforge.net/projects/pentaho/files/Dat

a%20Integration/5.4/pdi-ce-5.4.0.1-130.zip/download

• Componente da suite do Pentaho responsável pelos processos de ETL

• Extraction, Transformation and Load• Descompactar numa pasta

Page 3: Pentaho Data Integration Ceça Moraes Setembro/2015

Outra Aplicações do PDI

•Migração de dados entre aplicações/banco de dados

•Exportar dados de banco de dados para outros formatos

•Limpeza de dados

Page 4: Pentaho Data Integration Ceça Moraes Setembro/2015

Componentes PDI• Spoon– Criação de transformações e jobs

• Pan– Execução de transformações com agendamento em

intervalos• Kitchen– Execução de jobs com agendamento em intervalos

• Carte– web server para execução remota de transformações e

jobs

Page 5: Pentaho Data Integration Ceça Moraes Setembro/2015

Kettle

Page 6: Pentaho Data Integration Ceça Moraes Setembro/2015

Transformação•Conjunto de passos interligados ou não•Contém fontes e saídas dos dados•Conceito de stream (fluxo de dados) = entrada e saída de um passo•Uma transformação para cada dimensão•Arquivos *.KTR do Spoon

Page 7: Pentaho Data Integration Ceça Moraes Setembro/2015

Passos (Steps)•Unidade mínima da transformação

•Grande variedade de tipos

– Input, Output, Joins,...

•Tipos básicos: entrada, transformação, saída

Page 8: Pentaho Data Integration Ceça Moraes Setembro/2015

Passos (Steps)

Page 9: Pentaho Data Integration Ceça Moraes Setembro/2015

Hops

• Links entre os steps• Indicam fluxo dos dados (streams)– Origem e destino

Page 10: Pentaho Data Integration Ceça Moraes Setembro/2015

Jobs

• Conjunto para execução de várias transformações

• Arquivos *.KJB do Spoon

Page 11: Pentaho Data Integration Ceça Moraes Setembro/2015

Tcharan...

Page 12: Pentaho Data Integration Ceça Moraes Setembro/2015

ETLS NO PENTAHO DATA INTEGRATION (KETTLE)

Page 13: Pentaho Data Integration Ceça Moraes Setembro/2015

Base Operacional: northwind

Page 14: Pentaho Data Integration Ceça Moraes Setembro/2015

Data Warehouse: Vendas

Page 15: Pentaho Data Integration Ceça Moraes Setembro/2015

Conexões

Page 16: Pentaho Data Integration Ceça Moraes Setembro/2015

Conexões

Page 17: Pentaho Data Integration Ceça Moraes Setembro/2015

Dimensão: Produto

Page 18: Pentaho Data Integration Ceça Moraes Setembro/2015

Dimensão Produto

Page 19: Pentaho Data Integration Ceça Moraes Setembro/2015

Tipo de Steps

• Tipos de steps utilizados– Table Input (da aba

“Input”)

– Dimension lookup/update (da aba “Data Warehouse”

– Execute SQL Script (da aba “Scripting”)

Page 20: Pentaho Data Integration Ceça Moraes Setembro/2015

Dimensão Produto

Page 21: Pentaho Data Integration Ceça Moraes Setembro/2015

Dimensão Produto

Page 22: Pentaho Data Integration Ceça Moraes Setembro/2015

Dimensão Produto

Page 23: Pentaho Data Integration Ceça Moraes Setembro/2015

Dimensão Produto

Page 24: Pentaho Data Integration Ceça Moraes Setembro/2015

Fato Vendas

Page 25: Pentaho Data Integration Ceça Moraes Setembro/2015

Fato Vendas

Page 26: Pentaho Data Integration Ceça Moraes Setembro/2015

Tipo de Steps

• Tipos de steps utilizados– Table Input (da aba

“Input”)

– Database lookup (da aba “Lookup”

– Select Values (da aba “Transform”)

Page 27: Pentaho Data Integration Ceça Moraes Setembro/2015

Tipo de Steps

• Tipos de steps utilizados– Memory Group By (da

aba “Statistics”)

– Table Output (da aba “Output”

Page 28: Pentaho Data Integration Ceça Moraes Setembro/2015

Fato Vendas

Page 29: Pentaho Data Integration Ceça Moraes Setembro/2015

Fato Vendas

Page 30: Pentaho Data Integration Ceça Moraes Setembro/2015

Fato Vendas

Page 31: Pentaho Data Integration Ceça Moraes Setembro/2015

Fato Vendas

Page 32: Pentaho Data Integration Ceça Moraes Setembro/2015

Fato Vendas

Page 33: Pentaho Data Integration Ceça Moraes Setembro/2015

Fato Vendas

Page 34: Pentaho Data Integration Ceça Moraes Setembro/2015

Fato Vendas

Page 35: Pentaho Data Integration Ceça Moraes Setembro/2015

Fato Vendas

Page 36: Pentaho Data Integration Ceça Moraes Setembro/2015

Fato Vendas

Page 37: Pentaho Data Integration Ceça Moraes Setembro/2015

Mãos à obra e divirtam-se!!!