the data warehouse toolkit guia completo para modelagem dimensional capítulos 1 e 2 daniela resende...

25
The Data Warehouse Toolkit Guia completo para modelagem dimensional Capítulos 1 e 2 Daniela Resende Silva Orbolato São Carlos - 2009

Upload: internet

Post on 17-Apr-2015

238 views

Category:

Documents


5 download

TRANSCRIPT

Page 1: The Data Warehouse Toolkit Guia completo para modelagem dimensional Capítulos 1 e 2 Daniela Resende Silva Orbolato São Carlos - 2009

The Data Warehouse Toolkit

Guia completo para modelagem dimensional

Capítulos 1 e 2

Daniela Resende Silva OrbolatoSão Carlos - 2009

Page 2: The Data Warehouse Toolkit Guia completo para modelagem dimensional Capítulos 1 e 2 Daniela Resende Silva Orbolato São Carlos - 2009

2

Roteiro

• Definição de Data Warehouse

• Objetivos de um DW

• Componentes de um DW

• Modelagem dimensional

• Passos para a criação de um modelo dimensional

• Modelagem do estudo de caso de vendas a varejo

Page 3: The Data Warehouse Toolkit Guia completo para modelagem dimensional Capítulos 1 e 2 Daniela Resende Silva Orbolato São Carlos - 2009

3

Definição de Data Warehouse

• Segundo, Ralph Kimball: Data warehouse é um conjunto de todos os data marts da organização, onde a informação é sempre armazenada em um modelo dimensional.

Page 4: The Data Warehouse Toolkit Guia completo para modelagem dimensional Capítulos 1 e 2 Daniela Resende Silva Orbolato São Carlos - 2009

4

Objetivos de um Data Warehouse

• O DW deve:– permitir o acesso fácil às informações de

uma organização– Apresentar as informações de forma

consistente– Ser adaptável e flexível a mudanças– Proteger as informações de forma segura– Oferecer dados que suportem a tomada de

decisões– Ser aceito pela comunidade de negócio

Page 5: The Data Warehouse Toolkit Guia completo para modelagem dimensional Capítulos 1 e 2 Daniela Resende Silva Orbolato São Carlos - 2009

5

Componentes de um Data Warehouse

Page 6: The Data Warehouse Toolkit Guia completo para modelagem dimensional Capítulos 1 e 2 Daniela Resende Silva Orbolato São Carlos - 2009

6

Componentes de Um Data Warehouse

Page 7: The Data Warehouse Toolkit Guia completo para modelagem dimensional Capítulos 1 e 2 Daniela Resende Silva Orbolato São Carlos - 2009

7

Componentes de Um Data Warehouse

Page 8: The Data Warehouse Toolkit Guia completo para modelagem dimensional Capítulos 1 e 2 Daniela Resende Silva Orbolato São Carlos - 2009

8

Componentes de Um Data Warehouse

Page 9: The Data Warehouse Toolkit Guia completo para modelagem dimensional Capítulos 1 e 2 Daniela Resende Silva Orbolato São Carlos - 2009

9

Componentes de Um Data Warehouse

Page 10: The Data Warehouse Toolkit Guia completo para modelagem dimensional Capítulos 1 e 2 Daniela Resende Silva Orbolato São Carlos - 2009

10

Terminologia da Modelagem Dimensional

• Tabela Fato • 3 Tipos de Fatos– Aditivos– Semi-aditivos– Não-aditivo

• Grão

Page 11: The Data Warehouse Toolkit Guia completo para modelagem dimensional Capítulos 1 e 2 Daniela Resende Silva Orbolato São Carlos - 2009

11

• Tabela Dimensional

Dimensional Modeling Vocabulary

Page 12: The Data Warehouse Toolkit Guia completo para modelagem dimensional Capítulos 1 e 2 Daniela Resende Silva Orbolato São Carlos - 2009

12

Exemplo de Modelo Dimensional

Page 13: The Data Warehouse Toolkit Guia completo para modelagem dimensional Capítulos 1 e 2 Daniela Resende Silva Orbolato São Carlos - 2009

13

Mitos sobre a Modelagem Dimensional

• Modelos dimensionais e data marts são apenas para dados resumidos

• Modelos dimensionais e data marts são soluções departamentais e não corporativas

• Modelos dimensionais e data marts não são escalonáveis

• Modelos dimensionais e data marts são apropriados apenas quando existe um padrão de utilização previsível

• Modelos dimensionais e os data marts não podem ser integrados e, portanto, levam a soluções isoladas

Page 14: The Data Warehouse Toolkit Guia completo para modelagem dimensional Capítulos 1 e 2 Daniela Resende Silva Orbolato São Carlos - 2009

14

Processo de Criação Dimensional em 4 Etapas

1. Selecione o processo do negócio

2. Declare o grão do processo do negócio

3. Escolha as dimensões que aplicam a cada linha da tabela fato

4. Identifique os fatos numéricos que preencherão cada linha da tabela de fatos

Page 15: The Data Warehouse Toolkit Guia completo para modelagem dimensional Capítulos 1 e 2 Daniela Resende Silva Orbolato São Carlos - 2009

15

Estudo de Caso sobre o Varejo

• Empresa do ramo de alimentos

– 100 supermercados em 5 estados

– Todas as lojas têm os mesmos deptos.

– 60.000 produtos individuais, as SKU´s

– 55.000 SKU têm código de barras, os UPC´s

– 5.000 SKU são internas à rede (produtos a granel)

– Coleta de dados no POS e na entrada de mercadorias

Page 16: The Data Warehouse Toolkit Guia completo para modelagem dimensional Capítulos 1 e 2 Daniela Resende Silva Orbolato São Carlos - 2009

16

Modelando esse Caso

1. Selecione o processo do negócio

– POS de vendas a varejo

2. Declare o grão

– Item individual de venda no POS

3. Escolha as dimensões

– Loja, Produto, Data, Promoção, nro. de transação POS

4. Identifique os fatos

– .....

Page 17: The Data Warehouse Toolkit Guia completo para modelagem dimensional Capítulos 1 e 2 Daniela Resende Silva Orbolato São Carlos - 2009

17

Analisando os Fatos

• Porcentagens e proporções são não-aditivas. É possível calculá-las armazenando numerador e denominador, e depois a proporção das somas

Fatos Aditivos

Fato NAO-Aditivo

Margem de lucro

Page 18: The Data Warehouse Toolkit Guia completo para modelagem dimensional Capítulos 1 e 2 Daniela Resende Silva Orbolato São Carlos - 2009

18

Dimensão Data

Page 19: The Data Warehouse Toolkit Guia completo para modelagem dimensional Capítulos 1 e 2 Daniela Resende Silva Orbolato São Carlos - 2009

19

Dimensão Produto

Page 20: The Data Warehouse Toolkit Guia completo para modelagem dimensional Capítulos 1 e 2 Daniela Resende Silva Orbolato São Carlos - 2009

20

Dimensão Loja

Page 21: The Data Warehouse Toolkit Guia completo para modelagem dimensional Capítulos 1 e 2 Daniela Resende Silva Orbolato São Carlos - 2009

21

Dimensão Promoção

• Divisão em 4 dimensões• Prós

– Mais intelegíveis para a comunidade de negócios

– Administração mais simples

• Contras– Tamanho praticamente o

mesmo nos dois casos– Possível ver como os 4

aspectos são correlacionados

Page 22: The Data Warehouse Toolkit Guia completo para modelagem dimensional Capítulos 1 e 2 Daniela Resende Silva Orbolato São Carlos - 2009

22

Extensão do Modelo

Page 23: The Data Warehouse Toolkit Guia completo para modelagem dimensional Capítulos 1 e 2 Daniela Resende Silva Orbolato São Carlos - 2009

23

Normalização das Dimensões

• Snowflaking

X

Page 24: The Data Warehouse Toolkit Guia completo para modelagem dimensional Capítulos 1 e 2 Daniela Resende Silva Orbolato São Carlos - 2009

24

Excesso de Dimensões

X

Page 25: The Data Warehouse Toolkit Guia completo para modelagem dimensional Capítulos 1 e 2 Daniela Resende Silva Orbolato São Carlos - 2009

25

Outras Considerações

• Dimensão de Degeneração – nro. da transação no POS

• Chaves substitutas– Sem “inteligência”– Possivelmente menor que chave operacional– Registram condições para dimensões em que não há

valor operacional– Seu uso evita complicações com as chaves

operacionais reutilizadas– Ao usá-las, evite a composição de chaves unindo

chaves de uma dimensão