aula 2: apresentaÇÃo da suÍte pentaho - tiago silvatiago.blog.br › wp-content › uploads ›...
TRANSCRIPT
AULA 2: APRESENTAÇÃO DA SUÍTE PENTAHO
Prof. Esp. Tiago A. Silva
RIBEIRÃO PRETO 2017
SISTEMAS DE APOIO À DECISÃO
PLANO DE AULA
EXPOSITIVA E PRÁTICA (90 mim):
TRANSFORMAÇÃO DE DADOS:
XML para Microsoft Excel
2 www.tiago.blog.br
OBJETIVO: Aprender a configurar as transformações ETL com PDI (Pentaho Data Integration)
PRÁTICA • INSTALAÇÃO DAS “DEPENDÊNCIAS” DO PENTAHO:
– JDK/JRE
– MySQL
– Conector MySQL JDBC
• INSTALAÇÃO PDI – PENTAHO DATA INTEGRATION
– Por que?
• Atividades de ETL: Extraction, Transform, Load.
• Primeiro passo para construir um Data Warehouse: juntar os dados.
3 www.tiago.blog.br
COMEÇANDO
Executar o Spoon
Deu erro?
• Memória RAM é suficiente?
• Editar arquivo .bat ou .sh
• Alterar variáveis: xms e xmx
• Reduzir o valor, tente 512.
4 www.tiago.blog.br
Windows: *.bat Outros: *.sh
5 www.tiago.blog.br
O começo de tudo: Transformações
1
2
6 www.tiago.blog.br
Expressão regular para obter todos os
arquivos XML de um diretório: .*xml
3
4
5
6
7
8
Selecionando a entrada de dados: INPUT
7 www.tiago.blog.br
9
10
11
8 www.tiago.blog.br
12
DICA: Para testar, troque todos os tipos para
String!
13
14
9 www.tiago.blog.br
15
16
10
Selecionando a saída de dados
17
18
19
www.tiago.blog.br
ATENÇÃO: Antes de realizar essa etapa verifique se os
componentes estão ligados (hop) corretamente.
11 www.tiago.blog.br
20
21
12
Tudo verde?
www.tiago.blog.br
CONSIDERAÇÕES FINAIS No ambiente do Pentaho Data Integration nós sempre vimos o
esquema de entrada e saída de dados.
É importante que você selecione o tipo adequado para cada tipo de campo, na dúvida e para testar use apenas string.
DICA: veja a direção do hop quando for fazer a ligação, sempre da entrada de dados para a saída, exemplo XML -> Excel
13 www.tiago.blog.br
OBRIGADO!
www.tiago.blog.br
“Eu tinha chegado tão longe e me recusei a desistir porque em toda a minha vida eu sempre terminei a corrida.”
― Louis Zamperini