data warehouse 01 introdução

51
Prof. Rafael Pinheiro – [email protected] DATA WAREHOUSE OLTP OLAP ETL / ETC Datamining Data Mart “Eu presto atenção no que eles dizem mas eles não dizem nada” Humberto Gessinger Data Warehouse DW Cubo de decisão Dashboard

Upload: rafael-pinheiro

Post on 05-Jun-2015

3.286 views

Category:

Technology


1 download

DESCRIPTION

Uma visão introdutória sobre DataWarehouse

TRANSCRIPT

Page 1: Data warehouse   01 introdução

Prof. Rafael Pinheiro – [email protected]

DATA WAREHOUSE

OLTP

OLAP

ETL

/ ET

C

Datamining

Data Mart

“Eu presto atenção no que eles dizem mas eles não dizem nada”

Humberto Gessinger

Data Warehouse

DWCubo de decisão

Dashboard

Page 2: Data warehouse   01 introdução

Prof. Rafael Pinheiro – [email protected]

DATA WAREHOUSE

Dado x Informação x Conhecimento x Sabedoria

O dado é um pingo de água.

Você está andando e sente um pingo, Você está andando e sente um pingo,

um segundo pingo, um terceiro pingo.

Aquilo não significa que é uma chuva,

pode ser um ar condicionado, pingando num dia de calor.

Page 3: Data warehouse   01 introdução

Prof. Rafael Pinheiro – [email protected]

DATA WAREHOUSE

Dado x Informação x Conhecimento x Sabedoria

No momento em que você olha para o céu e

repara que existem nuvens e

que começa ver os primeirosque começa ver os primeiros

raios e sentir mais pingos,

complementa aquele conjunto de dados e

chega a uma informação: vai chover!

Page 4: Data warehouse   01 introdução

Prof. Rafael Pinheiro – [email protected]

DATA WAREHOUSE

Dado x Informação x Conhecimento x Sabedoria

O conhecimento é quando você percebe

que com a chuva você vai se molhar e que com a chuva você vai se molhar e

não poderá ir a um compromisso ou poderá ficar resfriado.

Então, isso é um conhecimento.

Page 5: Data warehouse   01 introdução

Prof. Rafael Pinheiro – [email protected]

DATA WAREHOUSE

Dado x Informação x Conhecimento x Sabedoria

A sabedoria é o que vai fazer com tudo isso.

Se você vai continuar andando no meio da chuva e Se você vai continuar andando no meio da chuva e

se molhar todo, ou vai se proteger em um abrigo e

deixar a chuva passar.

Page 6: Data warehouse   01 introdução

Prof. Rafael Pinheiro – [email protected]

DATA WAREHOUSE

Dado x Informação x Conhecimento x Sabedoria

Dado: Conjunto símbolos e sinais

Informação: É a interpretação de um conjunto de

dados

Conhecimento: Modelo da realidade, construído

através da experiência, aprendizado e

comunicação

Sabedoria: Meta-conhecimento, ou seja, um conhecimento sobre o próprio conhecimento.

Page 7: Data warehouse   01 introdução

Prof. Rafael Pinheiro – [email protected]

DATA WAREHOUSE

Dado x Informação x Conhecimento x Sabedoria

Dado: Sinal verde; Motoqueiro aproximando

Informação: Sinal verde posso passar; Motoqueiro tem que parar

Conhecimento: Motoqueiros apressados costumam não parar

Sabedoria: É melhor esperar o motoqueiro parar ou passar para depois eu atravessar

Page 8: Data warehouse   01 introdução

Prof. Rafael Pinheiro – [email protected]

DATA WAREHOUSE

¿ E no mundo computacional ?

• Geralmente nossos dados estão em sistemas, banco de dados, planilhas, arquivos, etc.

• Mais comum: banco de dados relacional

Page 9: Data warehouse   01 introdução

Prof. Rafael Pinheiro – [email protected]

DATA WAREHOUSE

¿ Onde estão meus dados ?

Page 10: Data warehouse   01 introdução

Prof. Rafael Pinheiro – [email protected]

DATA WAREHOUSE

OLTP – Online Transaction Processing(Processamento de transações Online)

• Sistemas que registram transações operacionais:

�ERP�ERP

�Sistema bancário

�Sistema de vendas,

�Gestão hospitalar

�Gestão acadêmica

�Controle de serviços

Page 11: Data warehouse   01 introdução

Prof. Rafael Pinheiro – [email protected]

DATA WAREHOUSE

Modelagem Entidade-Relacionamento(OLTP x ME-R)

• Modelo de abstração para descrever a organização dos dados em um Sistema de InformaçãoInformação

�Entidade

�Relacionamento

�Normalização (3NF)

�Integridade

�Banco de Dados Relacional

Page 12: Data warehouse   01 introdução

Prof. Rafael Pinheiro – [email protected]

DATA WAREHOUSE

Diagrama Entidade Relacioanmento

Page 13: Data warehouse   01 introdução

Prof. Rafael Pinheiro – [email protected]

DATA WAREHOUSE

Diagrama Entidade Relacioanmento

R/3: R/3: 14.000 tabelas

Linha RM:5.000 tabelas

Page 14: Data warehouse   01 introdução

Prof. Rafael Pinheiro – [email protected]

DATA WAREHOUSE

¿ Consigo produzir informações ?

• Relatórios

• Consultas SQL

– Inner Join– Inner Join

– Left Join

– UNION

– IN, LIKE

– SubConsulta

– AVG, SUM, MAX, MIN

Page 15: Data warehouse   01 introdução

Prof. Rafael Pinheiro – [email protected]

DATA WAREHOUSE

¿ E a velocidade do mundo atual ?

Page 16: Data warehouse   01 introdução

Prof. Rafael Pinheiro – [email protected]

DATA WAREHOUSE

É preciso agilidade, facilidade, flexibilidadeBusiness Intelligence

• Forma gráfica, fácil compreensão e interpretação, fácil navegação

• Cubo de decisão

– Uma informação vista de vários ângulos

• Gráficos de sinalização

– Semáforo, Gauge (velocímetro), Pizza

Page 17: Data warehouse   01 introdução

Prof. Rafael Pinheiro – [email protected]

DATA WAREHOUSE

OLAP – Online Analytical Processing(Processamento Analítico Online)

• Possibilidade de manipular e analisar uma grande quantidade de dados por várias perspectivasde dados por várias perspectivas

�Fácil análise

�Drill down

�Drill up

Page 18: Data warehouse   01 introdução

Prof. Rafael Pinheiro – [email protected]

DATA WAREHOUSE

É preciso agilidade, facilidade, flexibilidadeDashboard/Cockpit

Page 19: Data warehouse   01 introdução

Prof. Rafael Pinheiro – [email protected]

DATA WAREHOUSE

É preciso agilidade, facilidade, flexibilidadeDashboard/Cockpit

Page 20: Data warehouse   01 introdução

Prof. Rafael Pinheiro – [email protected]

DATA WAREHOUSE

É preciso agilidade, facilidade, flexibilidadeBusiness Intelligence

Page 21: Data warehouse   01 introdução

Prof. Rafael Pinheiro – [email protected]

DATA WAREHOUSE

É preciso agilidade, facilidade, flexibilidadeTomada de decisão

Page 22: Data warehouse   01 introdução

Prof. Rafael Pinheiro – [email protected]

DATA WAREHOUSE

É preciso agilidade, facilidade, flexibilidadeTomada de decisão

Page 23: Data warehouse   01 introdução

Prof. Rafael Pinheiro – [email protected]

DATA WAREHOUSE

¿ De onde buscar esses dados ?

• Banco de dados relacional?

�Consultas complexas

�Tratamento dos dados�Tratamento dos dados

�Compromete a performance OLAP e OLTP

�Pode ter dados que não estão no BD OLTP

Page 24: Data warehouse   01 introdução

Prof. Rafael Pinheiro – [email protected]

DATA WAREHOUSE

Data Warehouse

• Armazém (repositório) de dados (Base de dados relacional)

• Dados/informações consolidadas• Dados/informações consolidadas

• Grande quantidade de dados

• Dados não mudam (exceto na carga)

• Modelagem que favorece o desempenho de consultas

Page 25: Data warehouse   01 introdução

Prof. Rafael Pinheiro – [email protected]

DATA WAREHOUSE

Modelagem DimensionalOLAP X MD

• Modelo de dados voltado para performance de leitura (recuperação da informação)

• Não serão efetuados processos operacionais

• Não precisam estar Normalizados

Page 26: Data warehouse   01 introdução

Prof. Rafael Pinheiro – [email protected]

DATA WAREHOUSE

Modelagem Dimensional

• Dois pilares:

�Fatos

�Dimensões�Dimensões

• Dois tipos:

�Estrela

�Floco de neve

Page 27: Data warehouse   01 introdução

Prof. Rafael Pinheiro – [email protected]

DATA WAREHOUSE

Modelagem Dimensional

• Fato: É a tabela (ou entidade) mais importante do negócio é nela que estão todas as métricas que se pretende analisar:as métricas que se pretende analisar:

– Vendas

– Consultas

– Notas

– Pagamentos

– Empréstimos

Page 28: Data warehouse   01 introdução

Prof. Rafael Pinheiro – [email protected]

DATA WAREHOUSE

Modelagem Dimensional

• Métricas: São os valores que queremos analisar.

– Vendas: Quantidade, Valor– Vendas: Quantidade, Valor

– Consultas: Quantidade, tempo de espera

– Notas: Valor, média

– Pagamentos: Quantidade, valor monetário

– Empréstimos: Quantidade, valor monetário, quantidade de parcelas

Page 29: Data warehouse   01 introdução

Prof. Rafael Pinheiro – [email protected]

DATA WAREHOUSE

Modelagem Dimensional

• Dimensões: São os pontos de vista (visão de análise) das métricas de um fato

– Vendas: Produto, loja, data– Vendas: Produto, loja, data

– Consultas: Especialidade, plano, faixa etária

– Notas: Disciplina, bimestre, curso

– Pagamentos: Fornecedor, data, tipo de gasto

– Empréstimos: Tipo de cliente, motivo, classe econômica, grau de instrução

Page 30: Data warehouse   01 introdução

Prof. Rafael Pinheiro – [email protected]

DATA WAREHOUSE

Modelagem Dimensional

Page 31: Data warehouse   01 introdução

Prof. Rafael Pinheiro – [email protected]

DATA WAREHOUSE

Modelagem Dimensional

• Fato é a tabela principal

• Dimensão são tabelas que se relacionam com • Dimensão são tabelas que se relacionam com a tabela fato (entidade relacionamento)

Page 32: Data warehouse   01 introdução

Prof. Rafael Pinheiro – [email protected]

DATA WAREHOUSE

Modelagem Dimensional(Estrela - Star)

Page 33: Data warehouse   01 introdução

Prof. Rafael Pinheiro – [email protected]

DATA WAREHOUSE

Modelagem Dimensional(Floco de neve – Snowflake)

Page 34: Data warehouse   01 introdução

Prof. Rafael Pinheiro – [email protected]

DATA WAREHOUSE

Data Warehouse

• ¿ Então um Data Warehouse nada mais é que um Banco de Dados ?

Resposta: Sim. Mas com uma diferença, ele é modelado para ter uma excelente performance de consulta e contém dados consolidados de várias fontes.

Page 35: Data warehouse   01 introdução

Prof. Rafael Pinheiro – [email protected]

DATA WAREHOUSE

¿ E o que é Data Mart ?

• É um subconjunto de dados dentro do Data Warehouse voltado para uma finalidade específica: Vendas, Financeiro, Contábil, RH, específica: Vendas, Financeiro, Contábil, RH, Acadêmico

Page 36: Data warehouse   01 introdução

Prof. Rafael Pinheiro – [email protected]

DATA WAREHOUSE

Page 37: Data warehouse   01 introdução

Prof. Rafael Pinheiro – [email protected]

DATA WAREHOUSE

Page 38: Data warehouse   01 introdução

Prof. Rafael Pinheiro – [email protected]

DATA WAREHOUSE

ETL – Extract Transform and Load(ETC – Extração Transformação e Carga)

• É a fase de extração de dados de diversos sistemas, transformação desses dados conforme regras de negócios e por fim a carga dos dados em um Data Mart ou um Data Warehouse. Warehouse.

• É considerada uma das fases mais críticas do Data Warehouse e/ou Data Mart.

• Alguns consideram que ETL não são ferramentas e sim uma metodologia

Page 39: Data warehouse   01 introdução

Prof. Rafael Pinheiro – [email protected]

DATA WAREHOUSE

ETL – Extract Transform and Load

Page 40: Data warehouse   01 introdução

Prof. Rafael Pinheiro – [email protected]

DATA WAREHOUSE

¿ Afinal, o que é BI ?(Business Intelligence)

• É todo o processo de coleta, organização, análise, compartilhamento e monitoramento de informações que oferecem suporte a de informações que oferecem suporte a gestão de negócios.

Page 41: Data warehouse   01 introdução

Prof. Rafael Pinheiro – [email protected]

DATA WAREHOUSE

Business Intelligence

Page 42: Data warehouse   01 introdução

Prof. Rafael Pinheiro – [email protected]

DATA WAREHOUSE

Business Intelligence

Page 43: Data warehouse   01 introdução

Prof. Rafael Pinheiro – [email protected]

DATA WAREHOUSE

O caso da Fralda e da Cerveja• Conta uma lenda urbana, que uma loja

descobriu que a maioria das vendas de fraldas que ocorriam de quinta a domingo, eram acompanhadas da compra de cervejas

• Os donos, então, colocaram as cervejas perto das fraldas e as vendas dispararam

Page 44: Data warehouse   01 introdução

Prof. Rafael Pinheiro – [email protected]

DATA WAREHOUSE

O caso da Fralda e da CervejaDado

Informação (Padrão de comportamento)

Conhecimento

Sabedoria

Page 45: Data warehouse   01 introdução

Prof. Rafael Pinheiro – [email protected]

DATA WAREHOUSE

Ops... tenho um tesouro nas mãos

Page 46: Data warehouse   01 introdução

Prof. Rafael Pinheiro – [email protected]

DATA WAREHOUSE

¿ Posso procurar padrões de comportamento ?

Page 47: Data warehouse   01 introdução

Prof. Rafael Pinheiro – [email protected]

DATA WAREHOUSE

Data Mining(Mineração de Dados)

Page 48: Data warehouse   01 introdução

Prof. Rafael Pinheiro – [email protected]

DATA WAREHOUSE

Data Mining(Mineração de Dados)

• Data Mining ou Mineração de Dados consiste em um processo analítico projetado para explorar grandes quantidades de dados (tipicamente relacionados a negócios, mercado ou pesquisas científicas), na busca de padrões mercado ou pesquisas científicas), na busca de padrões consistentes e/ou relacionamentos sistemáticos entre variáveis e, então, validá-los aplicando os padrões detectados a novos subconjuntos de dados.

• O processo consiste basicamente em 3 etapas: exploração; construção de modelo ou definição do padrão; e validação/verificação.

Page 49: Data warehouse   01 introdução

Prof. Rafael Pinheiro – [email protected]

DATA WAREHOUSE

• Data Mining é parte de um processo maior de conhecimento denominado Knowledge Discovery in Database (KDD).

Data Mining(Mineração de Dados)

• KDD consiste, fundamentalmente, na estruturação do banco de dados; na seleção, preparação e pré-processamento dos dados; na transformação, adequação e redução da dimensionalidade dos dados; no processo de Data Mining; e nas análises, assimilações, interpretações e uso do conhecimento extraído do banco de dados, através do processo de Data Mining.

Page 50: Data warehouse   01 introdução

Prof. Rafael Pinheiro – [email protected]

DATA WAREHOUSE

Modelagem Entidade-RelacionamentoOLTP

Modelagem DimensionalOLAP

Data WarehouseDW

Dado x Informação x Conhecimento x Sabedoria

Cubo de decisão

ETL / ETC Extract Tranform and Load

Cockpit

Data Mart

“Nem tão longe que eu não possa crer, que um dia chego lá...”

Humberto Gessinger

Dashboard

Cockpit

Datamining

Page 51: Data warehouse   01 introdução

Prof. Rafael Pinheiro – [email protected]

DATA WAREHOUSE

¿Dúvidas?

@_rpinheiro

www.facebook.com/rpinheiro2

www.linkedin.com/pub/rafael-pinheiro/24/31/b47

[email protected]