sistemas de informação - centro de computação...

209
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data Warehouse, SQL Server Business Intelligence Development Studio. Conceitos de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides. 1 Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/] Sistemas de Informação © Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ] Sistemas de Informação Ricardo Campos ([email protected]) Sistemas de Informação © Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ] Esta apresentação foi desenvolvida por Ricardo Campos, docente do Instituto Politécnico de Tomar. Encontra-se disponível na página web do autor no link Publications ao abrigo da seguinte licença: Mais detalhes em: http://creativecommons.org/licenses/by-nc/3.0/deed.pt O seu uso, de parte ou da totalidade, pressupõe a utilização da seguinte referência: Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data Warehouse, SQL Server Business Intelligence Development Studio. Conceitos de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides. A sua disponibilização em formato PPT pode ser feita mediante solicitação (email: [email protected]) Autoria

Upload: vuonghanh

Post on 14-Dec-2018

219 views

Category:

Documents


0 download

TRANSCRIPT

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

1Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Sistemas de Informação

Ricardo Campos ([email protected])

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Esta apresentação foi desenvolvida por Ricardo Campos, docente do Instituto Politécnico de Tomar. Encontra-se disponível na página web do autor no link Publications ao abrigo da seguinte licença:

Mais detalhes em: http://creativecommons.org/licenses/by-nc/3.0/deed.pt

O seu uso, de parte ou da totalidade, pressupõe a utilização da seguinte referência: Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data Warehouse, SQL Server Business Intelligence Development Studio. Conceitos de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

A sua disponibilização em formato PPT pode ser feita mediante solicitação (email: [email protected])

Autoria

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

2Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Bibliografia

Recursos:

Ralph Kimball, Laura Reeves, Margy Ross, Warren ThornthwaiteThe Data Warehouse Lifecycle Toolkit : Expert Methods for Designing, Developing, and Deploying Data Warehouses Wiley, 1998 ISBN: 0471255475

Ralph Kimball, Margy Ross Data Warehouse Toolkit: The Complete Guide to Dimensional Modeling (Second Edition) Wiley, 2002 ISBN: 0471200247

W. H. Inmon Building the Data Warehouse (4rd Edition) Wiley, 2005 ISBN: 0-7645-9944-5

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Claudia Imhoff, Nicholas Galemmo, Jonathan G. GeigerMastering Data Warehouse Design : Relational and Dimensional Techniques Wiley, 2003 ISBN: 0471324213

Ralph Kimball, Richard MerzThe Data Webhouse Toolkit: Building the Web-Enabled Data Warehouse Wiley, 2000 ISBN: 0471376809

Joe Caserta, Ralph KimballThe Data Warehouse ETL Toolkit: Practical Techniques for Extracting, Cleaning Wiley, 2004 ISBN: 0764567578

Bibliografia

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

3Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

J.L.Pereira“Tecnologia de Bases de Dados”FCA – Editora de InformáticaISBN: 972-722-143-2

A.Silberschatz, H.F.Korth, S.SudarshanDatabase System ConceptsMcGraw-Hill ISBN 0-07-295886-3

Bibliografia

M. Y. Santos, I. Ramos “Business Intelligence”FCA – Editora de InformáticaISBN: 972-722-405-9

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

SQL Server Analysis Tutorial

Bibliografia

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

4Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Bibliografia

Acetatos de João Moura Pires,

UNova – Faculdade de Ciências e Tecnologia

Acetatos de José Lourenço,

Wedo Consulting (www.wedo.pt)

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Bibliografia

Recursos on-line (Bases de Dados e SQL):

Nota: Não é possível garantir a existência futura dos endereços (URL’s), citados nos recursos on-line. Como se sabe, os endereços

são virtuais e a sua vida útil depende única e exclusivamente dos seus autores e proprietários.

SQL Course Interactive, http://www.sqlcourse.com

Tutoriais, http://apostilando.com/sessao.php?cod=18

Linha de Código SQL, http://www.linhadecodigo.com.br/desenvolvimento/sql.asp

Noções da Linguagem SQL, http://www.juliobattisti.com.br/artigos/office/nocoessqlconsultas.asp

SQL for Web Nerds, http://philip.greenspun.com/sql/

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

5Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Sql Server Developer Center, http://msdn2.microsoft.com/en-us/sql/default.aspx

Recursos on-line (SQL Server ):

Newsgroups, http://groups.google.com/groups/dir?lnk=gh&hl=en&sel=33606733

SQL Server Magazine, http://www.sqlmag.com/

SQL Server Database Help, http://www.sswug.org/

Data Generation Tool, http://www.sqledit.com/dg/index.html

SQL Server Central, http://www.sqlservercentral.com/

SQL Server 2005 Books, http://www.microsoft.com/downloads/details.aspx?FamilyId=BE6A2C5D-00DF-4220-B133-29C1E0B6585F&displaylang=en

Nota: Não é possível garantir a existência futura dos endereços (URL’s), citados nos recursos on-line. Como se sabe, os endereços

são virtuais e a sua vida útil depende única e exclusivamente dos seus autores e proprietários.

Bibliografia

http://www.mcdbabrasil.com.br/

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Recursos on-line (SQL Server ):

Bibliografia

http://www.datawarehouses.hpg.com.br/

http://www.datawarehouse.da.ru/

http://www.cio.com/research/data/

http://www.dwinfocenter.org/

http://www.dmreview.com

http://www.intelligententerprise.com/

http://www.rkimball.com/

http://www.balancedscorecard.com

http://www.vldb.org

http://www.sqlmax.com/dataw1.asp

http://www.kimballgroup.com/

http://www.billinmon.com

http://www.kdnuggets.com/

http://www.bettermanagement.com

http://www.dw-institute.com

Nota: Não é possível garantir a existência futura dos endereços (URL’s), citados nos recursos on-line. Como se sabe, os endereços

são virtuais e a sua vida útil depende única e exclusivamente dos seus autores e proprietários.

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

6Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Pivot Table Reports 101, http://office.microsoft.com/en-us/excel/HA010346321033.aspx

Recursos on-line (Excel: Tabelas Dinâmicas):

Bibliografia

25 Easy Pivot Tables, http://office.microsoft.com:80/en-us/excel/HA010346331033.aspx

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Do que trata este curso?

Data Warehouse (DW)

É o armazém onde todos os dados são armazenados e guardados incluindo dados temporais que servirão de suporte futuro à análise de dados e apoio à decisão;

On-Line Analytical Processing (OLAP)�

Resposta a queries analíticas que por natureza são dimensionais. Os dados são provenientes da DW;

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

7Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Do que trata este curso?

Data Mining

É o processo de descoberta de nova e relevante informação a partirde grandes volumes de informação mantidos no DW;

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Porquê estudar Sistemas de Informação?

Os Sistemas de Informação têm um papel fundamental e sempre crescente em todas as organizações de negócios;

Para um entendimento sólido de como as organizações operam, é crucial entender o papel dos sistemas de informação nas organizações;

Os Sistemas de Informação são usados em todas as áreas funcionais:

Nas Finanças e Contabilidade os SI são usados para prever resultados, gerir recursos financeiros, analisar investimentos, etc…

Em Vendas e Marketing os SI são usados para processar pedidos de clientes, desenvolver planos de produção, controlo de stock, monitorizar a qualidade dos produtos, etc…

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

8Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Porquê estudar Sistemas de Informação?

A indústria de aviação usa a Internet para oferecer descontos e aumentar as vendas

Os bancos usam os SI para auxiliar na concessão de créditos;

Nas Finanças e Contabilidade os SI para organizar a entrega de bens;

As empresas de saúde usam os SI para diagnosticar doenças, planear tratamentos médicos, etc…

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Objectivos

Conceito dos Sistemas de Apoio à Decisão;

Conceito de OLTP, DW e OLAP;

Evolução das bases de dados;

Modelo standard de um data warehouse;

Arquitectura dos Sistemas de Informação;

Gestão do Conhecimento;

Operações típicas de slice, drill-down, drill up por via das tabelas dinâmicas do Excel;

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

9Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Objectivos

Data Mining;

CRM;

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Programa

Sistemas de Informação�

Conceito de Sistemas de Informação;

Dados vs Informação;

Noção de Informação;

Funções de um Sistema de Informação;

Gestão de Conhecimento

Arquitectura de Sistemas;

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

10Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Programa

Data Warehouse e OLAP�

Noção de Data Warehouse;

Perspectiva Histórica;

Conceitos de Sistemas de Apoio à Decisão;

Modelo de referência do DW;

Características;

Aplicações;

Modelação dimensional (modelo em estrela);

Diferenças entre OLTP e OLAP;

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Programa

SQL Server Business Intelligence Development Studio;�

Definição de KPIs;

Análise dos dados;

Integração dos dados;

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

11Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Programa

Implementação de um projecto DW para um banco;�

Integração dos dados;

Desenho do esquema em estrela;

Desenho do esquema relacional;

Definição de KPIs;

Análise dos dados;

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Programa

Data Mining�

OLAP vs Data Mining;

Aplicações;

Definição de Data Mining;

Técnicas de Data Mining;

Classificação; Segmentação e Modelação de Dependências;

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

12Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Programa

Microsoft Excel�

O significado das operações típicas de slice, drill-down e drill-up por via das tabelas dinâmicas;

Manipulação básica de tabelas dinâmicas no excel (criação, manipulação e interactividade sobre elas);

Tabelas Dinâmicas;

Outras funcionalidades: sub-totais; cenários e atingir objectivos;

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Sistemas de Informação

Ricardo Campos ([email protected])

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

13Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

“O acesso à informação e a capacidade de integrar e interpretar a

informação que vai estando disponível, interna e externamente às

organizações estão no cerne da conquista de vantagens competitivas

pelas empresas”.

Michael Porter

The Competitive Advantage of Nations

Macmillan Press, London, 1990

Informação

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Informação

Excesso de Informação;

Será que o problema reside no excesso de informação?

O problema não é o excesso…é a qualidade;

Existem muitos dados sem qualidade;

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

14Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Dados vs Informação

Os dados são a matéria prima da informação

A sua recolha, manutenção e armazenamento é extremamente cara, mas apesar disto o seu valor é relativamente baixo;

A informação é resultado do processamento de dados de modo a serem utilizados para suporte a decisão

O processamento pode assumir múltiplas formas: agregação; gráficos; análise; ordenação;

Gestão da Informação

Informação

Dados

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Sistema

Conjunto de elementos ou componentes que interagem para atingir objectivos.

Os sistemas têm entradas, mecanismos de processamento e saídas;

Sistema Entrada Processamento Saída

Estudantes, Professores, Administradores, Livros, etc…

Pesquisa, Ensino, Serviços

Estudantes com conhecimentos, pesquisa significativa, serviços prestados à região

Actores, Directores, Cenários, etc…

Filmagem, Edição, Efeitos Especiais, etc..

Filme nas salas de cinema.

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

15Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Sistema de Informação

Conjunto inter-relacionado de componentes capazes de recolher,

armazenar, processar e disponibilizar informação, com o propósito de

apoiar o planeamento, controlo, coordenação, análise e tomada de

decisão.

PessoasOrganizações

Tecnologia

Sistemas de Informação

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Sistema de Informação

Tecnologia:

Bases de Dados: é uma das partes mais valiosas de um sistema de informação, reunindo uma colecção organizada de dados da organização;

Redes: usadas para conectar computadores e equipamentos;

Internet: a maior rede de computadores do mundo;

Intranet: rede interna baseada em tecnologias de internet que permitem aos colaboradores de uma organização trocar informações;

Extranet: rede baseada em tecnologias de Internet que permitem a terceiros seleccionados (parceiros e clientes de negócios), aceder a recursos autorizados da intranet de uma organização;

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

16Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Funções de um Sistema de Informação

Recolha da Informação;

Armazenamento da Informação;

Processamento da Informação;

Representação da Informação;

Distribuição da Informação;

input processamento output

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Funções de um Sistema de Informação

input processamento output

Input: actividade de capturar dados básicos. Exemplo: quantidade de horas trabalhas por um funcionário;

Processamento: envolve a transformação de dados em informação. O processamento pode envolver cálculos;

Output: envolve a distribuição de informação útil, em geral na forma de documentos ou relatórios. Cheques com os pagamentos para os funcionários;

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

17Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Arquitectura de Sistemas

Registar

Sistemas Operacionais

Recordar

Data Warehouse Aprender

Aprender

CRM

Actuar

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Motivação: Decisões no contexto das Organizações

Decidir a criação de um novo curso universitário;

Analisar os factores que afectam o insucesso escolar dos alunos;

Decidir a concessão de um crédito bancário;

Prever quais os clientes que estão em risco de deixar de o ser;

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

18Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Motivação: Decisões no contexto das Organizações

Data Warehouse

Domínios de Informação

FinanceiroVendas OutrosMarketing

Marketing

Visão integrada do cliente

Programas de retenção dos clientes;

Vendas

Performance

Preços

Financeiro

Custos e Receitas

Outros

Recursos Humanos

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Necessidade e Contexto

A necessidade e contexto de implementação de Sistemas de Suporte à Decisão decorre de:

Forte evolução das Tecnologias de Informação no dominio de tratamento de dados;

Existência e evolução de Sistemas Operacionais sofisticados geradores de informação;

Forte concorrência nos mercados;

Politicas e estratégias de Gestão de Conhecimento;

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

19Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Gestão de Conhecimento

A gestão do conhecimento abrange todo o ambiente das organizações nas funções de:

Recolha de Informação;

Agregação de Informação;

Gestão da Informação;

Distribuição da Informação;

Análise da Informação;

Com a finalidade de suporte e fundamentação de decisões.

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Gestão de Conhecimento

Problemas típicos:

Dificuldades na obtenção da informação necessária;

Existência de múltiplas fontes de informação, diferentes ocorrências para as mesmas informações;

Dificuldades na identificação das fontes da informação;

Acesso à informação, necessidade de recorrer a recursos especializados;

Dificuldades na interpretação da informação;

Documentação associada de fraca qualidade e geralmente pouco objectiva em termos de negócio;

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

20Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Data Warehouses

On-Line Analytical Processing

Data Mining

Tecnologias de Business Intelligence

Os sistemas de BI (Business Intelligence) utilizam os dados disponíveis nas organizações para disponibilizar informação relevante para a tomada de decisão;

Os sistemas de BI estão tradicionalmente associados a 3 tecnologias:

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Tecnologias de Business Intelligence

e de Data Mining (algoritmos de exploração dos dados identificam padrões, relacionamentos, modelos que estão ocultos na grande quantidade de dados armazenados).

Data Warehouses

On-Line Analytical Processing

Data Mining

Um DW é um armazém de dados que permite o armazenamento de informação relevante para a tomada de decisão;

Estes repositórios podem ser analisados utilizando ferramentas OLAP (análise multidimensional que nos permite examinar a informação sob diferentes perspectivas)

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

21Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Termos Chave

Base de dados;

Comércio Electrónico;

Sistemas de Informação;

Extranet;

Intranet;Redes;

Dados;

Informação;

Gestão de Conhecimento;

Sistemas Operacionais;

Data Warehouse;

Data Mining;

Web Mining;

CRM;ERP;

Sistemas de Apoio à Decisão;

Business Intelligence;

OLTP;OLAP;

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Data Warehouse e OLAP

Ricardo Campos ([email protected])

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

22Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Evolução das TIC

Lei de Moore;

Capacidades de Armazenamento;

Suporte a Elevado número de transacções;

Client/Server;

Redes;

Ferramentas de Desenvolvimento (alta produtividade)

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

1960 Ficheiros de Dados

1965 Muitos Ficheiros de Dados

Redundância e Inconsistência dos dados;

Complexidade na manutenção e no desenvolvimento;

Dificuldade na sincronização dos dados;

Não possibilita o acesso concorrentes (diversos utilizadores);

Clientes

Encomendas

Produtos

Evolução dos SAD

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

23Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

1970 Sistemas de Gestão de Bases de Dados

Bases de

Dados

Evolução dos SAD

A abordagem pelos SGBDs tem uma característica fundamental: os dados são organizados num único conjunto (uma única unidade de armazenamento em vez de várias unidades independentes);

Adicionalmente todos os acessos aos dados passam por entidade designada por SGBD que centraliza em si o acesso à base de dados;

Os SGBDs ocultam os detalhes físicos de armazenamento e organização dos dados (a base de dados encontra-se evidentemente num conjunto de ficheiros);

S

G

B

D

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

A meio da década de 70 surgem os primeiros sinais de investigação na área de Sistemas de Apoio à Decisão. É proposta pela 1.º vez uma primeira divisão entre:

Processamento Operacional;

Processamento Analítico;

Através da criação de sistemas específicos com:

armazenamento de dados separados e independentes;

princípios de desenho de dados radicalmente diferentes;

Evolução dos SAD

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

24Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

1975 OnLine Transaction Processing (OLTP)

Bases de

Dados

Dados Operacionais/Transaccionais

High-performance online processing;

1980 Client/Server

Bases de

DadosReports

Construção de Relatórios Pré-Definidos

Evolução dos SAD

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

1985Bases

de Dados

Extracção

DW

Data Warehouse

Dados extraídos através de uma ferramenta de extracção;

Selo temporal;

Evolução dos SAD

Análises Especializadas;

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

25Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

DW

A data warehouse é uma base de dados analítica que é usada como suporte aos sistemas de apoio à decisão

É usada para armazenar grandes volumes de dados

Disponibilizar uma visão de toda a informação de negócio, integrada e consistente,com fácil acesso para os seus utilizadores.

Unifica a informação da organização (elimina as ilhas de informação)

Valoriza os sistemas existentes em vez de os substituir

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

DW

É um ambiente, não é um produto final….

Potencia a implementação de SAD

A Construção de um Data Warehouse é um processo iterativo e continuo, não um projecto fechado.

A participação, na construção do sistema, activa e contínua dos utilizadores de negócio é critica

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

26Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

DW - Aplicações

Análise de risco

Extrapolar conhecimento para poder classificar os novos clientes;

Marketing

Focalizar campanhas publicitárias;

Gestão de inventário

Armazéns: permite tomada de decisões sobre o nível de stock óptimo e frequências de entregas;

Gestão de posicionamento de produtos

Grandes superfícies: optimizar colocação de artigos nas prateleiras, permitindo as melhores vendas;

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

DW - Características

Orientado por assunto: num DW os dados são organizados em torno dos principais assuntos de uma organização, por exemplo, clientes, fornecedores, produtos, lojas,etc…

É um repositório que não está vocacionado para o armazenamento da informação associado às operações do dia a dia da organização e respectivo processamento das transacções, mas visa a análise de dados para o suporte à tomada de decisões;

Integrado: um DW é normalmente construído a partir de diversas fontes heterogéneas de dados

Não volátil: num DW existem apenas duas operações (carregamento inicial dos dados e acesso aos mesmos). Após o carregamento estes não podem ser alterados ou eliminados.

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

27Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

DW - Características

Concebido para tarefas analíticas;

Pequeno número de utilizadores;

Actualizações periódicas;

Dados históricos e coerentes;

Poucas tabelas (mas muito grandes);

Tabelas não normalizadas (informação redundante).

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

DW - Características

A informação deve conter um selo temporal (o objectivo de um DW é fornecer informação sob uma perspectiva histórica);

A informação nunca é actualizada (os dados contidos no DW nunca são alterados, podendo apenas ser consultados);

O DW conserva os dados antigos e as novas alterações, com selos temporais diferentes que permitem assim diferenciar os mesmos;

Um data warehouse está por isso sempre cheio de informação histórica;

Nem todos os dados são suficientemente importantes para guardar, pelo que para a DW só deverá ser passada informação considerada importante;

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

28Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

DW - Características

Bases de Dados Operacionais Data Warehouses

Objectivos operacionais Registo histórico

Acessos de leitura/escrita Acessos só de leitura

Transacções pré-definidas Questões ad-hoc

Acesso a poucos registos de cada vez Acesso a muitos registos de cada vez

Dados actualizados em tempo real Carregamentos periódicos de mais dados

Estrutura optimizada para actualizações Estrutura optimizada para processamento de questões

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Arquitectura DW

Um DW é normalmente composto por:

Motor de Bases de Dados;

Ferramentas de ETL (Extraction, Transformation and Loading) para extrair informação de fontes dispersas e integrá-las na DW;

Ferramentas de BI (Business Intelligence) para analisar os dados;

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

29Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Arquitectura DW

Data WarehouseUtilização

ETL

Datamarts

Data Store

Dados dos sistemas

operacionais

Fontes externas

ETL&

Agregações

Reporting

Data Mining

Ad-hoc Queries

Metadata

Fontes de Dados Data Warehouse Exploração

ETL, Armazenamento,Modelação DimensionalAgregações, Metadata

Ferramentas ReportingData Mining, EIS

Balance Socorecard

Sistemas Operacionais (Facturação, etc)

Fontes de dados Externas

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Data WarehouseUtilização

ETL

Datamarts

Data Store

Dados dos sistemas

operacionais

Fontes externas

ETL&

Agregações

Data Data MiningMining

ReportingReporting

AdAd--hoc hoc QueriesQueries

Metadata

Arquitectura DW

Em muitas organizações já existem aplicações específicas para as operações do dia a dia, tendo estas as suas próprias bases de dados chamadas de “Bases de Dados de Sistemas Operacionais”;

Optimizadas para o trabalho específico que têm de realizar;

Periodicamente (com frequência horária, diária, semanal ou outra - dependendo da organização em causa), toda a informação contida nessas bases de dados é transferida para um Data Warehouse, onde essa informação vai ficar inalterada e disponível para exploração.

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

30Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Arquitectura DW

Fontes externas:

Fazer uma pesquisa por web farming;

Fazer uma pesquisa por web warehouse;

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Data WarehouseUtilização

ETL

Datamarts

Data Store

Dados dos sistemas

operacionais

Fontes externas

ETL&

Agregações

Data Data MiningMining

ReportingReporting

AdAd--hoc hoc QueriesQueries

Metadata

Arquitectura DW

Automatizam o processo de extracção e carregamento de dados

Manutenção de processos facilitada

Gestão de Metadata

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

31Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Arquitectura DW

Data WarehouseUtilização

ETL

Datamarts

Data Store

Dados dos sistemas

operacionais

Fontes externas

ETL&

Agregações

Data Data MiningMining

ReportingReporting

AdAd--hoc hoc QueriesQueries

Metadata

“Extraction Transformation and Loading” são os processos cujo objectivo é o de extrair os dados das diversas fontes (tipicamente sistemas operacionais) e efectuar todos os processos de transformação e normalização necessários

para poder carregar os dados na estrutura da ODS e do DW.

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Transformation

Limpar os dados, corrigir erros, lidar com dados inexistentes e aplicar formatos, normalizar conceitos

LoadingCarregamento de dados

Extraction

Processo associado à fonte de dados (Sistema Operacional, fonte externa ou outra). é o primeiro para incluir dados no ambiente do Data Warehouse.

Data WarehouseUtilização

ETL

Datamarts

Data Store

Dados dos sistemas

operacionais

Fontes externas

ETL&

Agregações

Data Data MiningMining

ReportingReporting

AdAd--hoc hoc QueriesQueries

Metadata

Arquitectura DW

Rejeitar campos vindos dos sistemas operacionais que não têm utilidade

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

32Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Ambiguidade de conceitos;

Necessidade de normalizar e integrar os dados;

Análise baseada em múltiplos data sets;

Dificuldades na transformação dos dados em informação:

� as aplicações não foram construídas pensando na integração de SAD;

� não existem suficientes dados históricos guardados;

Data WarehouseUtilização

ETL

Datamarts

Data Store

Dados dos sistemas

operacionais

Fontes externas

ETL&

Agregações

Data Data MiningMining

ReportingReporting

AdAd--hoc hoc QueriesQueries

Metadata

Problemas em ETL

Arquitectura DW

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Arquitectura DW

Data WarehouseUtilização

ETL

Datamarts

Data Store

Dados dos sistemas

operacionais

Fontes externas

ETL&

Agregações

Data Data MiningMining

ReportingReporting

AdAd--hoc hoc QueriesQueries

Metadata

Armazenamento de Dados, tipicamente em modelos relacionais (em RDBMS)

Tradução de multiplos formatos de dados para uma visão unificada

Data Store

A manutenção de um repositório centralizado de dados do negócio

O objectivo de Data Store é o de criar uma camada prévia ao DW, de modo a extrair (sem pesar nos sistemas operacionais) toda a informação necessária para alimentar o modelo de dados do DW após um processo de normalização dos dados provenientes de diversas fontes;

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

33Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Data WarehouseUtilização

ETL

Datamarts

Data Store

Dados dos sistemas

operacionais

Fontes externas

ETL&

Agregações

Data Data MiningMining

ReportingReporting

AdAd--hoc hoc QueriesQueries

Metadata

Assegurar a limpeza,integridade e coerência dainformação

Constituir uma staging area para Data Marts específicos, disponibilizando umafonte de informação única aos diversos Data Marts.

Arquitectura DW

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Data WarehouseUtilização

ETL

Datamarts

Data Store

Dados dos sistemas

operacionais

Fontes externas

ETL&

Agregações

Data Data MiningMining

ReportingReporting

AdAd--hoc hoc QueriesQueries

Metadata

Modelação (Multi)dimensional nos Data Marts (star schemas) – menor número de entidades

Data Marts

Os Data Marts disponibilizam as funcionalidades analíticas necessárias a cada domínio de informação (Marketing, Vendas, Financeiro, etc…)

Por defeito, as bases de dados normalizadas são excluídas desta fase, aquele deverá compreender obrigatoriamente uma estrutura dimensional

Um modelo dimensional contém a mesma informação que um modelo relacional, mas estruturado de forma a privilegiar a performance e a definição de queries.

Arquitectura DW

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

34Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Data WarehouseUtilização

ETL

Datamarts

Data Store

Dados dos sistemas

operacionais

Fontes externas

ETL&

Agregações

Data Data MiningMining

ReportingReporting

AdAd--hoc hoc QueriesQueries

Metadata

Todos os datamarts devem sem construídos com base em dimensões e em factos

A arquitectura é definida como star schemas (esquemas em estrela)

Arquitectura DW

A construção de um data mart visa responder às necessidades de um departamento ou de um domínio específico de informação

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Atributo Data Warehouse Data Mart

Tipo de modelo de dados Corporativo Departamental

Fontes de dados utilizadas Muitas Poucas

Domínios de informação Muitos Um

Esforço inicial Elevado Baixo

Próximo nível de migração Data Mart Data Warehouse

Competências necessárias Maiores Menores

Arquitectura DW

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

35Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Data WarehouseUtilização

ETL

Datamarts

Data Store

Dados dos sistemas

operacionais

Fontes externas

ETL&

Agregações

Data Data MiningMining

ReportingReporting

AdAd--hoc hoc QueriesQueries

Metadata22

/06/

00

21/0

6/00

20/0

6/00

19/0

6/00

18/0

6/00

17/0

6/00

16/0

6/00

15/0

6/00

14/0

6/00

13/0

6/00

12/0

6/00

11/0

6/00

10/0

6/00

09/0

6/00

08/0

6/00

07/0

6/00

600

500

400

300

200

100

0

Contract Gross Activations Contract Net Activations

07/Jun/2000Data From:

Activations Control Report

Reporting

Arquitectura DW

Auxiliam na tomada de decisões estratégicas;

Maior produtividade dos gestores (a tecnologia fornece informação de gestão, indicadores, etc…);

Acompanhamento da evolução do negócio;

Flexibilidade (permite que os gestores fiquem menos dependentes dosinformáticos);

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Ferramenta que disponibiliza à gestão das organizações, o acesso aos indicadores mais relevantes (fornecimento de Indicadores Macro para Gestores da empresa (n.º clientes activos, KPIs))

Executive Information System

Descobrir padrões que permitam obter vantagens no negócio (procurar e reter os clientes mais rentáveis; segmentação de mercados; prever o futuro e identificar os factores para produzir o efeito desejado)

Data Mining

Data WarehouseUtilização

ETL

Datamarts

Data Store

Dados dos sistemas

operacionais

Fontes externas

ETL&

Agregações

Data Data MiningMining

ReportingReporting

AdAd--hoc hoc QueriesQueries

Metadata

Arquitectura DW

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

36Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Data WarehouseUtilização

ETL

Datamarts

Data Store

Dados dos sistemas

operacionais

Fontes externas

ETL&

Agregações

Data Data MiningMining

ReportingReporting

AdAd--hoc hoc QueriesQueries

Metadata

Metadata

Dados que descrevem dados

Dois tipos de metadata:

Arquitectura DW

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Data WarehouseUtilização

ETL

Datamarts

Data Store

Dados dos sistemas

operacionais

Fontes externas

ETL&

Agregações

Data Data MiningMining

ReportingReporting

AdAd--hoc hoc QueriesQueries

Metadata

Arquitectura DW

Informação do carregamento (ex: frequência, dependências, estado, data/hora, último carregamento)

Regras de negócio;

O nome do programa que realizou o carregamento;

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

37Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Data WarehouseUtilização

ETL

Datamarts

Data Store

Dados dos sistemas

operacionais

Fontes externas

ETL&

Agregações

Data Data MiningMining

ReportingReporting

AdAd--hoc hoc QueriesQueries

Metadata

Arquitectura DW

descrição de cada objecto e campo mantido no DW

Regras de dados para calcular dados

Conversão entre formatos (ex: datas)

Nome do sistema de onde vieram os dados

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

DW

Operacional DW Data Mart

C Bonifácio

Rua Principal

Crédito - AA

C Bonifácio

1986 - 1987

Rua A

Crédito - B

C Bonifácio

1987 - pres

Rua Principal

Crédito - AA

Janeiro - 4101

Fevereiro - 4201

Março - 4167

Abril – 4125

….

….

Data Mining

Utilizadores no

período 1982 – 1983

Com saldo inferior

a 1000€

Qual é o tipo de crédito do C Bonifácio?

Qual é o percurso histórico do C Bonifácio em termos

de créditos?

Estamos a atrair mais ou menos clientes?

Quais são os clientes a quem não se deve conceder crédito?

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

38Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Integração dos Dados

Operacional DW

C Bonifácio

Masculino

casado

20/06/1977

Dados Pessoais

1 acidenteDados relativos ao automóvel

Rua Principal

Tomar

Dados relativos à habitação

DiabetesDados relativos à saúde

C Bonifácio

Masculino

casado

20/06/1977

1 acidente

Rua Principal

Tomar

Diabetes

Cliente

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Os modelos OLAP por oposição aos modelos OLTP têm muito menos entidades, o tipo de cruzamentos são simplificados e as preocupações com a redundância de dados é menor:

OLTP vs OLAP (Operacional vs Analítico)

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

39Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

OLTP vs OLAP (Operacional vs Analítico)

Introduzem novos clientes, registam as queixas, registam as compras, etc…Os utilizadores de um sistema operacional lidam maioritariamente com um registo de cada vez, repetindo a mesma tarefa infinitas vezes.

Utilizadores de um sistema operacional

Contabilizam as compras e comparam-nas com as da semana anterior, questionando-se acerca da evolução, da razão das queixas, etc…Os utilizadores de um sistema analítico, raramente trabalham com uma linha de cada vez. As suas questões exigem que centenas de linhas sejam pesquisas e compactadas numa resposta. Para complicar ainda mais as coisas, os utilizadores alteram constantemente o tipo de questões que colocam.

Utilizadores de um sistema analítico

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

OLTP OLAP

Detalhado Sumarizada

Precisa no momento do acesso Representa evolução (snapshots) ao longo do tempo

Utilizado por operacionais de negócio Utilizado por gestores de negócio

Modelos complexos com muitas tabelas Modelos com menos tabelas (star schema)

Desempenho é crítico e constante Conceito de desempenho variável

Não há lugar à redundância Redundância de informação

Suporta as operações do dia a dia (transacções)

Suporta as necessidades de gestão (análise)

Pequena quantidade de dados processada muitas vezes

Grande quantidade de dados processada poucas vezes

OLTP vs OLAP (Operacional vs Analítico)

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

40Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

OLTP vs OLAP (Operacional vs Analítico)

OLTP OLAP

Gerido como um todo Gerido por áreas

Dados podem ser actualizados Dados não podem ser actualizados

Obrigatoriamente disponível Disponibilidade variável

Grande probabilidade de acesso Pouca probabilidade de acesso

OLTP OLAP

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Muitos utilizadores;

Transacções fixas e programadas;

Transacções muito eficientes com tempos de execução na ordem dos segundos. Milhares de operações por segundo;

Sistemas críticos para o negócio que suportam o dia a dia dos negócios

Repetição de operações (insert; update; remove);

pontos de venda nas lojas

ATMs

Comércio electrónico

OLTP

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

41Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Apenas algumas queries por dia quando comparado com os sistemas OLTP;

É difícil prever as queries que os utilizadores pretendem e em geral elas são mais diversas que nos sistemas OLTP;

Sistemas que disponibilizam aos utilizadores as ferramentas necessárias à análise dos diferentes aspectos da organização

Qual a facturação de um determinado produto numa determinada região? Qual a evolução do mercado desde a sua introdução?

Leitura e processamento dos dados, mas a escrita não é permitida;

Quais são os 10 produtos mais vendidos numa determinada região? E a nível nacional?

OLAP

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Operações OLAP

Agregação de dados;

Filtro, Ordenação e Ranking;

Filtro, Ordenação e Ranking;

Análise e procura de padrões;

Análise de tendência de dados;

O DW mantém os dados;

O OLAP transforma os dados em informação estratégica

Operações OLAP:

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

42Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Modelação Dimensional

Os modelos de dados de num data warehouse são modelos dimensionais ou star schemas. Enquanto que um esquema relacional é concebido para ser eficiente ao armazenamento dos dados provenientes das transacções, evitando a redundância, o esquema em estrela está estruturado de forma a facilitar as consultas.

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Modelação Dimensional

Os sistemas são construídos com base em 3 eixos com dependências directas entre si:

FACTOS

PERÍODOS TEMPORAIS

DIMENSÃO/ HIERARQUIAS

INDICADOR

Os factos / indicadores contêm informação quantitativa (indicadores), e podem ser analisados por diversos tipos de dimensão, sendo que estes cruzamentos deverão estar assignados sempre a um período de referência

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

43Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Modelação Dimensional

Dois tipos de componentes:

Tabela de factos: tabela central com muita informação;

Dimensões: tabelas mais pequenas utilizadas para analisar factos a partir de uma determinada perspectiva

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Modelação Dimensional

é constituída por dados mensuráveis (variáveis numéricas) e um conjunto de chaves estrangeiras que relacionam a tabela de factos com as diversas dimensões que lhe estão associadas;

A tabela de factos:

As variáveis são orientadas por uma ou várias dimensões, constituindo uma estrutura matricial que pode ser analisada por tantos ângulos quantos os permitidos pelo cruzamento das dimensões

Apresenta-se normalizada;

Contém uma grande quantidade de registos, ocupando normalmente mais de 95% do espaço ocupado pelo DW;

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

44Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Chave composta;

Tempo faz parte da chave;

Modelação Dimensional

Tipicamente numérico;

Das tabelas de factos extraem-se os indicadores (métricas)

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Modelação Dimensional

Contêm poucos registos quando comparadas com a tabela de factos, apesar de integrarem muitos atributos;

As tabelas de dimensão fornecem as perspectivas sobre os quais os factos poderão ser analisados (ex: tempo, cliente, produto, etc…).

As tabelas de dimensões:

As tabelas de dimensões são normalmente tabelas não normalizadas, podendo ter embebidas uma ou mais hierarquias, isto é, árvores de agregação construídas sobre os elementos das dimensões com o objectivo de apresentar totais intermédios e globais;

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

45Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Modelação Dimensional

Chave única;

As chaves das dimensões devem ser artificiais (inteiros sequenciais). A ideia é desacoplar as chaves dos OLTPs das chaves do DW

Razões:

As chaves naturais podem ser invalidadas no futuro;

Integrar fontes diversas com sistemas inconsistentes de chaves naturais;

É possível usar chaves artificiais que não teriam significado no OLTP, como por exemplo: “Não Aplicável”

É necessário manter na área de staging tabelas de referências cruzadas entre as chaves do DW e a das fontes, para um adequado carregamento;

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Cada registo tem uma descrição única;

Os atributos mais interessantes são as descrições textuais existentes nas dimensões de análise da actividade

Modelação Dimensional

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

46Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Caso prático:

Modelação Dimensional

Uma empresa tem o seu negócio baseado na venda de produtos em três zonas distintas do país (Norte, Centro e Sul);

As vendas são feitas através de uma força de vendas directas;

A administração necessita de um sistema de informação que lhe permita analisar a evolução do volume de vendas (quantidade e montantes) ao longo do tempo, por vendedor, produto e área geográfica.

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Dimensões de análise:

Modelação Dimensional

Tempo;

Área geográfica;

Vendedor;

Produto;

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

47Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Indicadores:

Montante;

Quantidades;

Modelação Dimensional

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Modelação Dimensional

Modelo final:

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

48Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Modelação Dimensional

Factura

numFactura

data

codPostal

codCliente

Total

Linha Encomenda

numFactura

codProduto

Qtd

Preço

Produto

codProduto

nomeProduto

codtipoProduto

Tipo Produto

codTipoProduto

nomeTipoProdu

Periodo

Data

Mês

Trimestre

Ano

Cliente

codCliente

nomeCliente

codConcelho

codTipoClienteTipo Cliente

codTipoCliente

TipoCliente

Localidade

codPostal

nomeLocalidade

codConcelho

Concelho

codConcelho

nomeConcelho

codDistrito

Distrito

codDistrito

nomeDistrito

Modelo OLTP (Modelo Relacional):

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

As entidades OLTP podem classificar-se numa das seguintes categorias:

Entidades de Transacção;

Modelação Dimensional

Regista detalhes que ocorrem num determinado período de tempo;

Contém medidas ou quantidades que podem ser sumarizadas (preços, volumes, quantidades, etc….);

São a base das tabelas de factos;

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

49Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Entidades de Componentes;

Directamente relacionada a uma entidade de transacção através de uma relação 1 – N;

Estas entidades definem os detalhes dos componentes para cada transacção, respondendo às perguntas de “quem”, “o quê”, “quando”, “onde”, “como” e “porque”;

Cliente: quem fez a compra;

Produto: o que foi vendido;

Localização: onde foi vendido;

Período: quando foi vendido;

Modelação Dimensional

Componente que é a base das tabelas de dimensão

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Entidades de Classificação;

Entidades que estão relacionadas a entidades de componentes através de uma relação 1 – N;

Modelação Dimensional

Estão funcionalmente dependentes de uma entidade de componentes;

Entidades de classificação representam hierarquias, as quais podem ser integradas nas entidades de componentes para formar tabelas de dimensão no contexto do esquema em estrela;

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

50Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Classificação das entidades:

Modelação Dimensional

Factura

numFactura

data

codPostal

codCliente

Total

Linha Factura

numFactura

codProduto

Qtd

Preço

Produto

codProduto

nomeProduto

codtipoProduto

Tipo Produto

codTipoProduto

nomeTipoProdu

Periodo

Data

Mês

Trimestre

Ano

Cliente

codCliente

nomeCliente

codConcelho

codTipoClienteTipo Cliente

codTipoCliente

TipoCliente

Localidade

codPostal

nomeLocalidade

codConcelho

Concelho

codConcelho

nomeConcelho

codDistrito

Distrito

codDistrito

nomeDistrito

Transacção

Componentes

Classificação

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Modelo OLAP (Modelo Multidimensional):

Modelação Dimensional

Factura

data

codPostal

codCliente

codProduto

SumQtd

SumItemPreço

Periodo

Data

Mês

Trimestre

Ano

Localidade

codPostal

nomeLocalidade

codConcelho

nomeConcelho

codDistrito

nomeDistrito

Produto

codProduto

nomeProduto

codtipoProduto

nomeTipoProdu

Cliente

codCliente

nomeCliente

codTipoCliente

TipoCliente

CodConcelho

nomeConcelho

codDistrito

nomeDistrito

Valores numéricos agregados

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

51Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Modelação Dimensional

Hierarquias:

Uma hierarquia é uma sequência de entidades associadas através de um conjunto de relações 1 – N;

Factura

numFactura

data

codPostal

codCliente

Total

Linha Factura

numFactura

codProduto

Qtd

Preço

Localidade

codPostal

nomeLocalidade

codConcelho

Concelho

codConcelho

nomeConcelho

codDistrito

Distrito

codDistrito

nomeDistrito

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Modelação Dimensional

Factura

numFactura

data

codPostal

codCliente

Total

Linha Factura

numFactura

codProduto

Qtd

Preço

Localidade

codPostal

nomeLocalidade

codConcelho

Concelho

codConcelho

nomeConcelho

codDistrito

nomeDistrito

Distrito

codDistrito

nomeDistrito

Roll Up

Factura

numFactura

data

codPostal

codCliente

Total

Linha Factura

numFactura

codProduto

Qtd

Preço

Localidade

codPostal

nomeLocalidade

codConcelho

nomeConcelho

codDistrito

nomeDistrito

Concelho

codConcelho

nomeConcelho

codDistrito

nomeDistrito

Roll Up

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

52Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Modelação Dimensional

Esquema em floco de neve:

Um esquema em floco de neve (snowflake schema) é um esquema em estrela cujas dimensões estão completamente normalizadas

Um esquema em floco de neve acaba por apresentar uma estrutura mais complexa;

A maior desvantagem está associada à perda de desempenho no processamento das interrogações devido à normalização das dimensões;

O esquema evita que a informação redundante seja armazenada, uma vez que as dimensões estão devidamente normalizadas;

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Modelação Dimensional

Dimensão 1

Dimensão 3

Dimensão 4Dimensão 2Sub - Dimensão 2 Tabela de Factos Sub - Dimensão 4

Esquema em floco de neve:

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

53Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Modelação Dimensional

Vendas

Id_data

Id_endereço

Id_produto

Id_cliente

Total_venda

Un_vendidas

Tempo

Id_data

dia

mês

trimestre

ano

Produto

Id_produto

nome

Id_fornecedor

Fornecedor

Id_fornecedor

nome

Endereço

Id_endereço

rua

codPostal

Cidade

codPostal

localidade

Cliente

Id_cliente

nome

Contribuinte

Id_actividade

Actividade

Id_actividade

designação

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Dim

ensã

o 1

Dimensão 2

Modelação Dimensional

Modelo de dados de um cubo multidimensional que permite aos utilizadores a análise da informação de diferentes perspectivas

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

54Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

1.º Trimestre 2645

2125

2435

2345

2325

1989

2012

2188

2439

2024

2223

2339

2434

2122

2234

2312

1645

1125

1435

1345

2.º Trimestre

3.º Trimestre

4.º Trimestre

Tomar

CovilhãSantarém

720 650 713 625

435

950

525700

657

744

413874

625

625

395

CD

Tint

eiro

DV

D

Web

Cam

Dis

co

Tem

po

Produto

Modelação Dimensional

Dimensões:

Tempo;

Produto;

Localização

Indicadores:

Quantidade vendida

395 Discos vendidos em Tomar no 1.º Trimestre

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Modelação Dimensional

Drill - Down;

Permite navegar de dados generalizados para dados mais detalhados. O objectivo é fornecer uma visão mais detalhada dos dados que estão a ser analisados;

912

703

1030

844

756

525

898

734

803

856

718

771

799

657

869

674

642

673

704

621

687

731

689

768

854

712

873

623

689

712

754

646

823

827

689

823

825

695

914

735

612

775

785

595

854

812

634

866

288

205

419

239

185

375

263

201

390

245

193

387

Janeiro

Fevereiro

Março

Abril

Maio

Junho

Julho

Agosto

Setembro

Outubro

Novembro

Dezembro

Covilhã

Santarém

Tomar

Tem

po

Produto

999

600

46

800

900

60

39

200

125

600

400

435

500

500

345

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

55Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Roll - Up;

Representa a operação oposta ao drill-down. Permite agregar os dados visualizados no cubo utilizando uma hierarquia. Cada repetição da análise ocorrerá a um nível mais elevado de agregação

Modelação Dimensional

2645

2125

2435

2345

2325

1989

2012

2188

2439

2024

2223

2339

2434

2122

2234

2312

1645

1125

1435

1345

1385

720 650 713 625 625

1225 1401 1287 1020

CD

Tint

eiro

DV

D

Web

cam

Dis

co

1.º Trimestre

2.º Trimestre

3.º Trimestre

4.º Trimestre

Castelo Branco

Santarém

Tem

po

Produto

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Slice;

O corte (slice) permite seleccionar um subconjunto de dados do cubo, sendo uma das dimensões do cubo limitada aos dados que obedecem a uma determinada condição

Modelação Dimensional

Tempo = 1.º Trimestre

Lo

caliz

ação

Covilhã

Santarém

Tomar 950

435

720

700

525

650

744

657

713

874

413

625

395

625

625

Produto

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

56Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Dice;

Modelação Dimensional

A redução (dice) permite definir um sub-cubo para o qual podem ser especificados critérios de selecção para duas ou mais dimensões;

(Distrito = Santarém) E

(Tempo = 1.º Trimestre) ou (Tempo = 2.º Trimestre) E

(Produto = CD) ou (Produto = DVD)

1385 1401

1385 1401

1092 1213

1.º Trimestre

2.º Trimestre

CD

DV

DSantarém

Produto

Tem

po

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Considere-se o seguinte modelo em estrela:

Valores (por marca) para o 1.º semestre registados em todas as lojas:

Modelação Dimensional

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

57Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Drill Down:

Modelação Dimensional

Desagregação é apenas juntar mais cabeçalhos de linha das tabelas de dimensões (criando mais uma coluna que é um atributo de uma tabela dimensão)

Agregação é apenas retirar cabeçalhos da linha;

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Modelação Dimensional

Uma empresa grossista tem:

100 grandes superfícies de vendas (supermercado), espalhadas geograficamente por 3 distritos;

Departamentos em cada superfície de vendas:

Mercerias;

Carne;

Artigos de limpeza e higiene;

Padaria;

Aproximadamente 60000 produtos individuais nas prateleiras (unidades de stock armazenáveis – USA)

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

58Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Caixas (POS – Point of Sale);

Pontos de entrada de informação no sistema operacional:

Modelação Dimensional

Através dos códigos de barra ou entrada manual para códigos desconhecidos;

Pontos de entrega de fornecedores;

Apenas uma fracção dos armazéns regista as entregas em tempo real;

Departamento de fornecedores e contas a pagar;

O completo conhecimento do material que entrou no supermercado só é possível às vezes, por via dos pagamentos efectuados e inspecção directa;

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Maximizar o lucro em cada supermercado:

Objectivos:

Cobrar o máximo possível em cada produto;

Baixar os custos de aquisição dos produtos;

Atrair o máximo número de clientes;

Preços;

Decisões mais significativas a tomar:

Promoções (reduções temporárias de preços)

Baixas de preços servem para atrair clientes mas a venda é feita com prejuízo e a promoção pode baixar as vendas de outros produtos similares;

Modelação Dimensional

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

59Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Modelação Dimensional

Analisar as compras dos clientes com base na informação recolhida nas caixas registadoras;

Granularidade dos dados:

Analisar que produtos são vendidos, em que lojas, em que dias e qual o efeito das promoções;

Como pretendemos analisar o efeito das promoções e efectuar análises de associação de produtos comprados, é necessário considerar a granularidade mais baixa:

Linha de factura, i.e, quantas unidades são vendidas e a que preço em cada venda;

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

A granularidade escolhida é chave para determinar os factos disponíveis. Numa linha de factura temos:

Qtd: quantidade vendida em termos de unidades;

Valor unitário;

Valor total do item: Qtd * Valor unitário;

Custo dos produtos vendidos. Em alguns sistemas de caixas é possível saber qual foi o preço a que aloja comprou o produto e portanto qual o custo (interno) dos produtos vendidos na transacção;

Modelação Dimensional

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

60Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Modelação Dimensional

Factos aditivos:

Unidades vendidas do produto em questão (soma de todas as Qtd vendidas do produto);

Valor das vendas do produto em questão (soma de todos os valores totais dos itens, apurado através de Qtd * valor unitário);

Custo do produto em questão;

Factos calculados e aditivos. Guardam-se ou calculam-se?

Lucro = valor vendas – custo;

Factos calculados não aditivos. Calculam-se no fim.

Margem de lucro = lucro/valor de venda

Aggregar(Margem de lucro) = soma(lucro)/soma(valor de venda)

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Escolha das dimensões:

Modelação Dimensional

Uma linha de factura corresponde a uma venda de um produto realizada numa data, numa loja;

Encontrar outras dimensões que podem ser associadas:

Muitas vezes o produto é vendido ao abrigo de uma promoção;

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

61Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Dimensão Data:

Modelação Dimensional

Qual a razão pela qual não se usa um atributo data directamente na tabela de factos?

Porque o tamanho gasto para a representação da data (8 bytes) é maior do que o gasto para um inteiro (4 bytes);

Porque queremos incluir atributos relativos ao tempo;

Atributos da dimensão Data:

codData (inteiro);

DiaSemana (Segunda, Terça,….,Domingo);

DiaMês (1,…,31)

Dia da Semana / Mês

Ambos permitem comparar

as compras entre diferentes

dias da semana ou do mês

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Atributos da dimensão Data:

feriadoFlag, diaSemanaFlag, ultimoDiaMesFlag (inteiro);

Época (Natal, Páscoa, etc…);

Evento (Jogo Liga dos Campeões, etc…)

Permite a comparação entre

dias especiais

Modelação Dimensional

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

62Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Atributos da Dimensão Produto:

codProduto

TamanhoEmbalagem

Marca

subCategoria

Categoria

Marca

Modelação Dimensional

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Modelação Dimensional

Atributos da Dimensão Loja:

codLoja

morada

codPostal

localidade

freguesia

concelho

distrito;

numEmpregados;

dimensãoDaLoja;

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

63Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Dimensão Promoção:

Reduções temporárias de preço;

Coupons de desconto;

Campanhas publicitárias;

Modelação Dimensional

Descreve as condições sobre as quais decorreu uma promoção de um produto

Painéis;

Sem promoção;

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Modelação Dimensional

Na dimensão Produção os gestores estão interessados em saber:

Os produtos em promoção aumentaram as vendas durante a promoção?

Depois da promoção houve uma baixa nas vendas que anulou os ganhos?

Outros produtos similares ao produto em promoção, sofreram uma quebra nas vendas?

Os produtos em promoção tiveram um aumento das vendas tendo o período anterior e posterior à promoção?

A promoção foi rentável considerando os custos directos da promoção?

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

64Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Modelação Dimensional

Promoção

codPromoção

nomePromoção

Cobertura Promoção

codPromoção

codProduto

codLoja

codData

Factless Table

Tabelas de factos, sem

factos. Servem para

contagem de eventos

Sempre que um produto é vendido é registado na tabela corberturaPromoção um registo do produto, com

referência à promoção, dia e loja;

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Podem ainda ser consideradas outras dimensionais adicionais:

Cartão Cliente

Modelação Dimensional

Deve existir um registo com uma chave para os que aderiram e outra para os que não aderiram;

Controlo e análise dos operadores de caixas

Juntar uma dimensão Tempo do Dia e Operador de Caixa.

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

65Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Vendas

CodLoja

codProduto

CodTempoDia

CodCliente

CodPromoção

CodOperador

CodData

UnidadesVendidas

ValorVendas

Custo

LucroTempo

codData

atributos

Produto

codProduto

atributos

Loja

codLoja

atributos

Promoção

codPromoção

atributos

CartãoCliente

codCliente

atributos

Operador

codOperador

atributos

TempoDia

codTempoDia

atributos

Cobertura Promoção

codPromoção

codProduto

codLoja

codData

Modelação Dimensional

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

SQL Server Business Intelligence Development Studio

Ricardo Campos ([email protected])

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

66Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

O SQL Server, é um sistema completo de business intelligence, que oferece asfuncionalidades, as ferramentas, e a capacidade para criar aplicações de análisequer clássicas, quer inovadoras.

Report;

Análise, armazenamento e pesquisa dos dados;

Integração e transformação dos dados;

SQL Server BI Development Studio

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

O acesso ao SQL Server Business Intelligence Development Studio é feitoatravés do menu Start – Programs – Microsoft Sql Server 2005;

SQL Server BI Development Studio

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

67Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

SQL Server BI Development Studio

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Criar um package ETL

Criar um package ETL�

Adicionar e configurar uma conexão para um ficheiro;

Criar um novo projecto de integração

Adicionar e configurar uma conexão OLE DB;

Adicionar e configurar o flat file source;

Adicionar e configurar uma transformação lookup

Adicionar e configurar um destino OLE DB

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

68Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Criar um novo projecto de integração�

Criar um package ETL

File � New Project

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Criar um package ETL

Por defeito é criada esta página

No Solution Explorer altere o nome de Package.dtsx para Lesson 1.dtsx

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

69Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Adicionar e configurar uma conexão para um ficheiro;�

Criar um package ETL

Uma conexão para um flat file permite extrair dados de um ficheiro

No ecrã que aparece Seleccionar Flat File

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Criar um package ETL

Seleccione o ficheiro SampleCurrencyData.txt na directoria c:\Program Files\Microsoft SQL Server\90\Samples\Integration Services\Tutorial\Creating a Simple ETL Package\Sample Data folder

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

70Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Criar um package ETL

Carregue em Advanced. Defina os seguintes nomes. Coluna1 (Average Rate); Coluna 2 (CurrencyId), Coluna 3 (CurrencyDate); Coluna 4 (EndOfDayRate)

Integration Services sugere automaticamente tipos de dados (baseado nas 100 primeiras linhas do ficheiro)

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Criar um package ETL

Carregue em Advanced. Defina os seguintes nomes. Coluna1 (Average Rate); Coluna 2 (CurrencyId), Coluna 3 (CurrencyDate); Coluna 4 (EndOfDayRate)

Coluna Flat File Tipo Sugerido Coluna de Destino Tipo de Destino

Average Rate Float [DT_R4] FactCurrencyRate.AverageRate Float

CurrencyID String [DT_STR] DimCurrency,CurrencyAlternateKey nchar(3)

CurrencyDate Date [DT_DATE] DimTime.FullDateAlternateKey datetime

EndOfDayRate Float [DT_R4] FactCurrencyRate.EndOfDayRate Float

Os tipos de dados CurrencyID e CurrencyDate não são compatíveis com os tipos de dados das colunas de destino (as quais serão definidas mais tarde)

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

71Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Criar um package ETL

Uma vez que DimCurrency,CurrencyAlternateKey é nchar(3), CurrencyID precisa ser alterada de String [DT_STR] para [DR_WSTR]

Uma vez que DimTime.FullDateAlternateKey é datetime, CurrencyDate precisa ser alterada de [DT_DATE] para [DT_DBTIMESTAMP]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Criar um package ETL

Adicionar e configurar uma conexão OLE DB;�

Criaremos uma conexão OLE DB que usa o Windows Authentication para se conectar uma instância da base de dados AdventureWorksDW

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

72Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Criar um package ETL

Clique em New

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Criar um package ETL

Defina as propriedades de conexão à AdventureWorksDW

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

73Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Criar um package ETL

Adicionar uma tarefa Data Flow�

Depois de termos criado as conexões para a source e para o destino a próxima tarefa é adicionar um Data Flow. O Data Flow permite transformar, limpar e modificar os dados que são movidos da origem para o destino. Uma tarefa data flow é onde a maior parte do trabalho ETL é feita

Arraste para a área de desenho a Data Flow Task

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Criar um package ETL

Adicionar e configurar o Flat File Source�

Um Flat File source é um componente data flow que usa a metadata definida pela conexão Flat File para especificar o formato e a estrutura dos dados a serem extraídos do flat file por um processo.

Abra o data flow designer, clicando duas vezes em

Ou

Arraste para a área de desenho um Flat File Source

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

74Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Criar um package ETL

Carregue agora duas vezes em:

Clique em colunas e verifique que os nomes das colunas se encontram correctas:

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Adicionar e configurar uma transformação Lookup�

Criar um package ETL

Definir as transformações lookup necessárias à obtenção dos valores para CurrencyKey e TimeKey

Definiremos uma transformação lookup para a coluna CurrencyKey da tabela DimCurrency baseado na coluna CurrencyID do flat file;

Definiremos uma transformação lookup para a coluna TimeKey da tabela DimTime baseado na coluna CurrencyDate do flat file;

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

75Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Arraste para a área de desenho um Lookup e altere o seu nome para Lookup Currency Key

Criar um package ETL

Clique no File Flat Source “Extract Sample Currency Data” e arraste a seta verde para a transformação lookup para ligar os dois componentes;

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Criar um package ETL

Carregue agora duas vezes em:

Certifique-se que a conexão definida diz respeito à AdventureWorksDW

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

76Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Criar um package ETL

Seleccione a tab Columns e arraste CurrencyID para CurrencyAlternateKey. Seleccione CurrencyKey

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Criar um package ETL

Arraste para a área de desenho um Lookup e altere o seu nome para Lookup Data Key

Clique na transformação “Lookup Currency Key” e arraste a seta verde para a transformação “Lookup Data Key” para ligar os dois componentes;

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

77Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Criar um package ETL

Carregue agora duas vezes em:

Certifique-se que a conexão definida diz respeito à AdventureWorksDW

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Criar um package ETL

Seleccione a tab Columns e arraste CurrencyDate para FullDateAlternateKey. Seleccione TimeKey

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

78Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Adicionar e configurar um destino OLE DB�

O sistema pode agora extrair dados do flat file source e transformá-los num formato compatível aceite no destino. O próximo passo é carregar no destino os dados transformados. Para isso adicione-se um OLE DB Destination;

Criar um package ETL

Arraste para a área de desenho um OLE DB Destination e altere o seu nome para Sample OLE DB Destination

Clique na transformação “Lookup Date Key” e arraste a seta verde para o “OLE DB Destination” para ligar os dois componentes;

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Carregue agora duas vezes em:

Criar um package ETL

Certifique-se que a conexão definida diz respeito à AdventureWorksDW

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

79Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Carregue em Mapprings e certifique-se que as colunas estão mapeadas correctamente nas colunas de destino

Criar um package ETL

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Para fazer o carregamento, basta ir ao menu Debug � Start Debugging e o sistema coloca na FactCurrency table da base de dados AdventureWorksDW 1097 linhas

Criar um package ETL

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

80Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Definir um Data Source

Definir um Data Source�

Definir um Data Source View

Definir a base de dados Adventure Work DW como Data Source;

Criar um Analysis Service Project;

Modificar os nomes das tabelas

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Definir um Data Source

Criar um Analysis Service Project;�

Feche a Start Page

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

81Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Definir um Data Source

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Definir um Data Source

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

82Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Definir um Data Source

Definir um Data Source�

Vamos considerar uma empresa fictícia, a Adventure Works Cycles que comercializa bicicletas de todo o terreno;

A empresa produz e vende bicicletas para o América do Norte, Europa e Ásia. A sua base de operações situa-se em Bothell (Washinghton) onde trabaham 290 colaboradores;

Em 2000, a Adventure Works Cycles comprou uma pequena empresa (Importadores Neptuno) no México que produzia subcomponentes para a linha de produção da Adventure Works. Em 2001, a Importadores Neptuno, tornou-sea principal produtora e distribuidora de bicicletas do grupo.

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

A empresa pretende expandir o seu mercado, oferecendo descontos aos melhores clientes, reduzir os custos de produção e abrir um novo canal de vendas através do desenvolvimento de um web site;

A empresa tem dois tipos de clientes:

Individuais;

Lojas;

Definir um Data Source

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

83Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Existem duas bases de dados que acompanham o SQL Server:

Adventure Works (base de dados OLTP);

Adventure WorksDW (base de dados Data Warehouse)

Definir um Data Source

Nos passos seguintes vamos definir a AdventureWorksDW como a base de dados do nosso projecto;

Carregue em Next;

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Clique em New

Definir um Data Source

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

84Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Defina as propriedades de conexão à AdventureWorksDW

Definir um Data Source

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Definir as propriedades de acesso:

Definir um Data Source

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

85Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Última janela do assistente:

Definir um Data Source

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Adventure Works Dw

Definir um Data Source

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

86Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Definir um Data Source View�

Depois de definirmos as data sources que alimentam o nosso projecto é importante definir uma data source view para a criação do Data Mart;

Clique em Next. Clique novamente em Next;

Nos passos seguintes vamos definir uma data source view que inclui 5 tabelas da data source AdventureWorksDW

Definir um Data Source

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Definir um Data Source

Neste passo é possível seleccionar tabelas e views pertencentes à Data Source:

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

87Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Definir um Data Source

Seleccione as seguintes tabelas:

DimCustomer;

DimGeography;

DimProduct;

DimTime;

FactInternetSales;

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Definir um Data Source

O Designer contém os seguintes elementos:

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

88Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Na parte centrar é possível carregar no zoom para as tabelas no diagrama a 50%

Definir um Data Source

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Modificar os nomes das tabelas�

É possível alterar o nome das tabelas para nomes para amigáveis. Nos passos seguintes vamos remover os prefixos dim e fact das tabelas:

Definir um Data Source

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

89Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Definir um Data Source

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Definir e Desenvolver um Cubo

Definir e Desenvolver um Cubo�

Desenvolver um projecto Analysis Service;

Rever o cubo e as propriedades da dimensão;

Definir um cubo;

Navegar no Cubo;

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

90Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Definir um cubo�

Definir e Desenvolver um Cubo

No SQL Server é fácil definir um cubo através da definição de medidas e dimensões (baseado nas tabelas de factos e dimensões). Quando se define um cubo baseado numa data source, o assistente conecta à respectiva base de dados;

Nos passos seguintes utilizaremos o assistente de cubos para construir um cubo baseado na AdventureWorksDW. Utilizaremos a opção Auto Build para criar automaticamente atributos e definir hierarquias. Designaremos também uma dimensão Tempo;

Clique em Next.

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Definir e Desenvolver um Cubo

Certifique-se que a opção Auto Build se encontra seleccionada:

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

91Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Definir e Desenvolver um Cubo

Verifique que a AdventureWorksDW se encontra seleccionada:

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Definir e Desenvolver um Cubo

O sistema analisa as relações entre as tabelas para identificar tabelas de factos e dimensões.

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

92Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

O assistente identifica quatro tabelas de dimensões e uma tabela de factos. Cada tabela de dimensão encontra-se ligada à tabela de factos através de uma chave (Start Schema):

Definir e Desenvolver um Cubo

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Seleccione Time e clique Next:

Definir e Desenvolver um Cubo

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

93Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Associe propriedades de tempo às colunas e clique em Next:

Definir e Desenvolver um Cubo

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

O Assistente selecciona como medida todos os valores numéricos da tabela de factos que não estão ligados às dimensões. Vamos retirar as seguintes medidas:

Definir e Desenvolver um Cubo

Promotion Key;

Currency Key;

Sales Key;

Revision Number;

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

94Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Uma vez seleccionado o Auto Build o sistema procurar por hierarquias (relações 1 – N, por exemplo entre cidade e distrito) nas dimensões:

Definir e Desenvolver um Cubo

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Reveja a estrutura e expanda a dimensão Produto, desmarcando a opção de Large Photo que não é útil neste projecto:

Definir e Desenvolver um Cubo

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

95Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Altere o nome do cubo para Analysis Services Tutorial:

Definir e Desenvolver um Cubo

Aparecem 3 dimensões relativas ao tempo (Due Date, Order Date e Ship Date), uma que (recordando) existem 3 relações entre a tabela tempo e a tabela de factos.

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

O Data Source View fica acessível noutra janela:

Definir e Desenvolver um Cubo

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

96Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Rever o cubo e as propriedades da dimensão;�

Definir e Desenvolver um Cubo

Nos próximos passos vamos rever a estrutura do cubo para entender as propriedades das dimensões do cubo. No Designer do Cubo podemos ver e editar as propriedades do cubo:

Modificar a estrutura do cubo;

Definir as relações entre as dimensões e os grupos de medidas e a granularidade de cada dimensão dentro do grupo de medidas;

Definir novos cálculos os quais permitem definir novas medidas baseado em valores existentes;

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Definir e Desenvolver um Cubo

Editar e modificar os KPIs de um cubo. Os KPIs permitem determinar rapidamente informação útil acerca de um valor (ex: o valor definido excede ou falha o objectivo);

Criar ou modificar operações de Drill;

As partições permitem guardar secções de um cubo em diferentes localizações;

Uma perspectiva é um subconjunto de um cubo e é usada para reduzir a complexidade do cubo;

Visualização;

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

97Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Definir e Desenvolver um Cubo

O grupo das medidas chama-se Internet Sales porque a tabela de factos no Data Source View tinha o nome InternetSales;

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Definir e Desenvolver um Cubo

Apesar de apenas 3 dimensões terem sido criadas, há 5 dimensões no cubo, porque a dimensão Tempo da base de dados, é usada como base para 3 dimensões de tempo do cubo. Essas 3 dimensões permitem aos utilizadores dimensionar o cubo por 3 factos separados que estão relacionados com a venda de cada produto: order date; due date e ship date;

Expanda a dimensão Customer e carregue em Edit

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

98Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Definir e Desenvolver um Cubo

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Desenvolver um projecto Analysis Service;�

Definir e Desenvolver um Cubo

Para ver os dados que se encontram no cubo do Analysis Service Tutorial no projecto do Analysis Service Tutorial é necessário desenvolver um projecto para especificar uma instancia do Analysis Services.

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

99Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Definir e Desenvolver um Cubo

Para o caso de retornar um erro acerca da ImpersonationInfo Account….deve clicar-se no datasource “AdventureWorksDW.ds” e seleccionar a tab ImpersionationInformation e a opção “User the service account”

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Uma vez resolvido o problema voltar a executar o comando:

Definir e Desenvolver um Cubo

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

100Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Navegar no Cubo;�

Definir e Desenvolver um Cubo

Nos próximos passos navegaremos no cubo Analysis Services Tutorial e em cada uma das suas dimensões. Edite a dimensão Customer:

Seleccione a tab Browser;

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Observe-se que estamos a analisar os clientes pela hierarquia de Geografia:

Definir e Desenvolver um Cubo

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

101Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Definir e Desenvolver um Cubo

Depois seleccione-se por English Country Region Name:

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Seleccione-se agora a dimensão Time (directamente no Solution Explorer)

Definir e Desenvolver um Cubo

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

102Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Seleccione-se a tab browser e observe os dados com recurso à hierarquia CalendarYear - CalendarSemester - CalendarQuarter - EnglishMonthName –FullDateAlternateKey:

Definir e Desenvolver um Cubo

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Seleccione agora o Analysis Service Cube e a tab Browser

Definir e Desenvolver um Cubo

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

103Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Na área de Metadata expanda Measures � Internet Sales. Arraste a medida Sales Amount para a área de Data (Drop Totals or Detail Fields Here);

Definir e Desenvolver um Cubo

Na área de Metadata expanda Customer. Arraste o atributo English Country Region Name para a área de Data (Drop Row Fields Here)

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Na área de Metadata expanda agora Produto. Arraste o atributo Product Line para a área de Data (Drop Columns Field Here);

Definir e Desenvolver um Cubo

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

104Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Na área de Metadata expanda agora Order Date. Arraste o atributo Order Date.Calendar Quarter para a área de Data (Drop Filter Fields Here);

Definir e Desenvolver um Cubo

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Na área de Metadata expanda agora Order Date.Calendar Year e depois expanda Calendar Year. Seleccione o ano de 2002 e arraste para o filtro.

Definir e Desenvolver um Cubo

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

105Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Modificar medidas, atributos e hierarquias�

Modificar a dimensão tempo;

Modificar a dimensão customer;

Modificar medidas;

Modificar a dimensão produto;

Modificar medidas, atributos e hierarquias

Observar as modificações no Cube Designer;

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Modificar medidas, atributos e hierarquias

Modificar medidas�

É possível tornar a aplicação mais agradável se formatarmos algumas medidas

Na tab Cube Structure do Cube Designer:

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

106Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Modificar medidas, atributos e hierarquias

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Modificar medidas, atributos e hierarquias

Seleccione as seguintes medidas:

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

107Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Seleccione nas propriedades em FormatString o formato Currency

Modificar medidas, atributos e hierarquias

Na lista das propriedades seleccione Unit Price Discount Pct e posteriormente seleccione Percent no FormatString

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Modifique o nome para Unit Price Discount Percentage:

Modificar medidas, atributos e hierarquias

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

108Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Modificar medidas, atributos e hierarquias

No painel das medidas modifique o nome da medida Tax Amt para Tax Amount:

Para voltar ao painel inicial:

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Modificar medidas, atributos e hierarquias

No menu Build, clique Deploy Analysis Service Tutorial.

Seleccione a tab Browser:

Adicione à área de dados a medida Order Quantity

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

109Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Modificar medidas, atributos e hierarquias

Modificar a dimensão customer;�

Nos próximos passos vamos modificar alguns atributos da dimensão customer. Começamos por eliminar os seguintes atributos:

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Modifique os seguintes nomes:

Modificar medidas, atributos e hierarquias

English Country Region Name � Contry-Region;

English Education � Education;

English Occupation � Occupation;

State Province Name � State-Province

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

110Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Modifique o nome da hierarquia State Province Name – Dim Geography para Customer Geography

Modificar medidas, atributos e hierarquias

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Arraste o atributo Country-Region para a hierarquia Customer Geography, para cima do State Province Name. A hierarquia passa agora a ter um nível country-region. Aproveite para modificar na hierarquia o nome para State-Province:

Modificar medidas, atributos e hierarquias

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

111Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Elimine Geography na hierarquia e arraste City para cima de Customer.

Modificar medidas, atributos e hierarquias

Se quisermos fazer um browse na dimensão, convém primeiro fazer um build do projecto e depois na tab de browser fazer um reconnect para a hierarquia ser actualizada.

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Acrescentar agora um campo de cálculo. No designer do Data Source View:

Modificar medidas, atributos e hierarquias

Acrescentar agora um campo de cálculo. No designer do Data Source View:

Os nomes são concatenados numa única coluna que será depois usada na dimensão customer. Na tabela aparece a coluna com este icon:

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

112Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Modificar medidas, atributos e hierarquias

Tente explorar os dados:

Para ver o resultado final:

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Modificar medidas, atributos e hierarquias

Seleccione o atributo Customer:

Nas propriedades seleccione o nome para Full Name:

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

113Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

No ColumnID seleccione FullName:

Da próxima vez que fizermos um browser da dimensão, ao invés de aparecer o email (campo que anteriormente estava como ID), já vai aparecer o nome completo do cliente.

Não esquecer de fazer o Build e processar na dimensão e no browser, bem como refresh;

Modificar medidas, atributos e hierarquias

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

No data Source View arraste da tabela Customer a coluna EmailAddress para a Customer Dimension;

Modificar medidas, atributos e hierarquias

Seleccione os seguintes atributos:

E no AtributeHierarchyDisplayFolder colocar Location:

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

114Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Seleccione Customer Geography e na propriedade Display Folder colocar Location

Modificar medidas, atributos e hierarquias

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Modificar medidas, atributos e hierarquias

Seleccione os seguintes atributos:

E no AtributeHierarchyDisplayFolder colocar Location:

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

115Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Modificar medidas, atributos e hierarquias

Seleccione os seguintes atributos:

E no AtributeHierarchyDisplayFolder colocar Location:

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Modificar medidas, atributos e hierarquias

Se agora formos ao cubo designer, fizermos o process e o reconnect, podemos observar que os atributos estão agrupados em pastas, tornando-se a leitura mais amigável:

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

116Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Modificar medidas, atributos e hierarquias

Modificar a dimensão tempo;�

Seleccione a dimensão Tempo. Em Hierarchies alterar o nome abaixo seleccionado para Calendar Time:

Modifique também os nomes para:

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Modificar medidas, atributos e hierarquias

O script extrai o ano, o mês e o dia da coluna FullDateAlternateKey

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

117Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Modificar medidas, atributos e hierarquias

Eliminar dos atributos o FullDateAlternateKey;

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Modificar medidas, atributos e hierarquias

Faça-se Deploy do projecto e observe-se em browser que o aspecto já é mais amigável:

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

118Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Modificar medidas, atributos e hierarquias

Considerar a criação de um novo campo calculado, que concatene o mês e ano para cada mês da tabela Time:

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Modificar medidas, atributos e hierarquias

Considerar a criação de um novo campo calculado, que concatene o trimestre e ano para cada trimestre da tabela Time:

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

119Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Modificar medidas, atributos e hierarquias

Considerar a criação de um novo campo calculado, que concatene o semestre e ano para cada semestre da tabela Time:

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Modificar medidas, atributos e hierarquias

Seleccione agora a tab Dimension Strucutre do Dimension Designer da dimensão Time

Fazer o mesmo para CalendarQuarter (CalendarQuarterDesc) e CalendarSemester (CalendarSemesterDesc)

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

120Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Modificar medidas, atributos e hierarquias

Build � Deploy. Ir até ao browser e fazer reconnect;

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Modificar medidas, atributos e hierarquias

Modificar a dimensão produto;�

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

121Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Apagar os seguintes atributos:

Modificar medidas, atributos e hierarquias

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Modificar medidas, atributos e hierarquias

Mostra o nome do produto na totalidade:

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

122Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Modificar medidas, atributos e hierarquias

Seleccione o atributo Product Line e altere as suas propriedades:

Seleccione agora o atributo hierárquico Product, altere o seu nome para Product Name e altere também as suas propriedades:

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Modificar medidas, atributos e hierarquias

Arraste o atributo Product Line para as hierarquias. Automaticamente é criada uma nova hierarquia com o nome (por defeito) Hierarchy:

Altere esse nome para Product Model Lines;

Arraste o atributo Model Name para hierarquia, para de baixo de Product Line

Arraste o atributo Product Name para hierarquia, para de baixo do anterior;

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

123Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Modificar medidas, atributos e hierarquias

Seleccione os seguintes atributos:

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Modificar medidas, atributos e hierarquias

Seleccione os seguintes atributos:

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

124Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Modificar medidas, atributos e hierarquias

Seleccione os seguintes atributos:

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Modificar medidas, atributos e hierarquias

Build � Deploy. Ir até ao browser e fazer reconnect;

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

125Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Modificar medidas, atributos e hierarquias

Observar as modificações no Cube Designer;�

Seleccionar o browser no cube designer.

Adicione à área de dados a medida Sales Amount

Na área de metada expanda Product e arraste a hierarquia Product Model Lines para a área de Data (Drop Columns Field Here)

Depois expanda o membro Road:

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Modificar medidas, atributos e hierarquias

Na área de metada expanda Customer e Location. Arraste a hierarquia Customer Geography para a área de Data (Drop Row Fields Here)

Expanda a linha relativa ao Estados Unidos

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

126Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Modificar medidas, atributos e hierarquias

Expanda por Oregon para podermos visualizar os resultados de todas as cidades pertencentes ao estado de Oregon:

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Modificar medidas, atributos e hierarquias

As vendas de internet (Internet Sales) por região e product line para o mês de Fevereiro de 2002 aparecem assim:

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

127Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Definir atributos avançados e propriedades das dimensões�

Agrupar membros de atributos;

Definir propriedades nos atributos, numa dimensão Parent-Child

Usar uma versão modificada do projecto Analysis Service Tutorial

Esconder e desabilitar atributos nas hierarquias;

Definir atributos avançados e propriedades das dimensões

Ordenar atributos baseado em atributos secundários;

Definir membros desconhecidos

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Usar uma versão modificada do projecto Analysis Service Tutorial�

Definir atributos avançados e propriedades das dimensões

Vamos agora fechar o projecto em que temos andado a trabalhar e considerar uma versão mais avançada.

File � Open � Project Solution;

Navegar até C:\Program Files\Microsoft SQL Server\90\Samples\Analysis Services\Tutorials\Lesson4 e seleccionar o Analysis Service Tutorial.sln

Se o tutorial ainda não estiver instalado:

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

128Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Definir atributos avançados e propriedades das dimensões

Depois de o projecto se encontrar aberto, fazer Build e Deploy;

Entender as alterações:

O data source view neste projecto contém mais uma tabela de factos e 4 dimensões provenientes da base de dados AdventureWorksDW

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Definir atributos avançados e propriedades das dimensões

Observe-se que as tabelas (para melhor entendimento) encontram-se organizadas em dois diagramas: Internet Sales e o Reseller Sales;

O diagrama Internet Sales contém as tabelas que estão relacionadas com a venda de produtos da Adventure Works directamente através da Internet. As tabelas são as consideradas anteriormente:

DimGeography

DimCustomer;

DimTime;

DimProduct;

FactInternetSales;

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

129Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

O diagrama Reseller Sales contém as tabelas que estão relacionadas com a venda de produtos da Adventure Works através de revendedores. As tabelas são:

DimReseller;

DimPromotion;

DimSalesTerritory;

DimGeography

DimTime;

DimProduct;

DimEmployee

FactResellerSales;

Definir atributos avançados e propriedades das dimensões

Observe-se que DimGeography, DimTime e DimProduct são as mesmas tabelas usadas no diagrama InternetSales

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

O cubo designer contém agora 2 grupos de medidas baseados na tabela InternetSales e ResellerSales

Definir atributos avançados e propriedades das dimensões

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

130Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Definir propriedades nos atributos, numa dimensão Parent-Child�

Definir atributos avançados e propriedades das dimensões

No solution explorer carregue na dimensão Employee e em browser;

Observe-se que Amy E.Alberts é subordinado de Brian Welckler e que o manager principal é Ken J. Sanchez

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Definir atributos avançados e propriedades das dimensões

No solution explorer seleccione o cubo e posteriormente o browser:

Na metadata expanda Measures � Reseller Sales e adicione à área de Data o atributo Reseller Sales – Sales Amount

Na metadata expanda Employee e arraste a hierarquia Employees para a área de Data (Drop Row Fields Here)

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

131Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Definir atributos avançados e propriedades das dimensões

Expanda os nomes dos empregados até chegar ao nível 5:

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Definir atributos avançados e propriedades das dimensões

Seleccione o atributo hierárquico Employees

Seleccione a propriedade NamingTemplate

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

132Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Definir atributos avançados e propriedades das dimensões

Isto vai permitir renomear os níveis. Ver figura no slide seguinte:

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Definir atributos avançados e propriedades das dimensões

Build � Deploy e ir até ao Cubo Designer (Browser e Reconnect);

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

133Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Agrupar membros de atributos;�

Definir atributos avançados e propriedades das dimensões

No data source view:

Observe-se a gama de valores para a coluna YearlyIncome

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Na dimensão Customer (em customer structure) seleccione o atributo yearly income e considere a seguinte propriedade:

Definir atributos avançados e propriedades das dimensões

Alterando o valor da DiscretizationBucketCount para 5;

A propriedade DiscretizationMethod determina se o Analysis Services forma algum grupo. Por defeito o Analysis Services não o faz. Ao colocarmos automático, ele vai determinar de acordo com o atributo qual o melhor grupo

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

134Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Na dimensão Employee (no data source view) observe agora os valores das colunas SickLeaveHours e VacationHours. Feche esta tab

Definir atributos avançados e propriedades das dimensões

Na dimensão Employee (no designer, dimension structure) seleccione o campo SickLeaveHours e a propriedade DiscretizationMethod para clusters e BucketCount para 5:

Seleccione agora o campo VacationHours e considere as propriedades:

Ao especificarmos Cluster e EqualAreas em vez de automatic, estamos a informar o Analysis Services sobre qual o tipo de agrupamento que pretendemos;

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Build � Deploy. Vá até ao Cubo (browser e reconnect)

Definir atributos avançados e propriedades das dimensões

Arraste para a área de Data a medida Reseller Sales – Sales Amount;

Na metadata expanda a dimensão Product e arraste a hierarquia Product Model Lines para a área de Data (Drop Row Fields Here)

Na metadata expanda a dimensão Customer e a pasta Demographic e arraste Yearly Income para a área de Data (Drop Column Fields Here). Observe-se que os valores se encontram agrupados em 6 grupos:

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

135Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Remova o atributo Yearly Income

Definir atributos avançados e propriedades das dimensões

Na metadata expanda a dimensão Employee, expanda Organization e arraste SickLeaveHours para a área de Data (Drop Columns Fields Here)

Observe-se que as vendas são realizadas por vendedores pertencentes a 2 grupos

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Se quiser ver os 3 grupos que não fizeram vendas, faça botão direito na área de Data:

Definir atributos avançados e propriedades das dimensões

Remova Sick Leave Hours e faça o mesmo para VacationHours;

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

136Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Altere agora a propriedade DiscretizationBucketCount de Vacation Hours para 10 e observe as diferenças. Não se esqueça de fazer build � deploy, etc…

Definir atributos avançados e propriedades das dimensões

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Esconder e desabilitar atributos nas hierarquias;�

Definir atributos avançados e propriedades das dimensões

Por defeito o SQL Server Analysis Server, cria sempre um atributo hierarquia para todos os atributos das dimensões, tornando-os disponíveis para dimensionar a tabela de factos. Acontece que existem alguns atributos que não faz muito sentido estarem disponíveis em termos de análise.

Vá ao Dimension Designer, à dimensão Employee e a browser

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

137Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Definir atributos avançados e propriedades das dimensões

Verifique que os atributos Base Rate, Birth Date, Login ID, Manager SSN e SSN encontram-se disponíveis.

Vá à Dimension Structure tab e seleccione esses atributos;

Defina a seguinte propriedade e observe que os atributos deixam de estar acessíveis

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Definir atributos avançados e propriedades das dimensões

Faça Build � Deploy e observe que os atributos já não estão acessíveis:

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

138Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Ordenar atributos baseado em atributos secundários;�

Definir atributos avançados e propriedades das dimensões

Observe que a propriedade OrderBy da atributo MonthName da dimensão Time tem o valor Key, o que provoca que os meses não apareçam depois ordenados:

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Definir atributos avançados e propriedades das dimensões

Para resolvermos isso, ordenaremos os meses do atributo hierárquico baseado num novo atributo: MonthNumberOfYear, que convenientemente já existe na tabela da dimensão tempo;

NO Dimension Designer no tab Data Source View, seleccione o atributo MonthNumberOfYear:

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

139Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Definir atributos avançados e propriedades das dimensões

Automaticamente o atributo é adicionado. Coloque as propriedades AttributeHierarchyEnabled e AttributeHierarchyOrdered para False

Nos atributos expanda a Data e Month Name

Arraste os atributo Month Number of Year para debaixo do atributo Month Name;

Desta forma definimos uma nova relação entre os dois atributos. Altere a propriedade RelathionShip Type do Month Number of Year para Rigid (mesmo se a dimensão for actualizada, isto não será sobrescrito)

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Definir atributos avançados e propriedades das dimensões

Agora seleccione o atributo Month Name e especifique as propriedades:

Faça Build, etc…e observe-se que os valores já aparecem ordenados em termos de mês

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

140Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Observe outro problema semelhante na dimensão Customer na hierarquia Commute Distance:

Definir atributos avançados e propriedades das dimensões

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

NO Dimension Designer no tab Data Source View, seleccione o atributo CommuteDistanceSort.

Definir atributos avançados e propriedades das dimensões

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

141Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Automaticamente o atributo é adicionado. Coloque as propriedades AttributeHierarchyEnabled e AttributeHierarchyOrdered para False

Definir atributos avançados e propriedades das dimensões

Nos atributos expanda Commute Distance

Arraste o atributo CommuteDistanceSort para debaixo de Commute Distance. Não se esqueça de colocar a Relatioship Type a Rigid

Agora seleccione o atributo Commute Distance e especifique as propriedades:

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Faça Build, etc…e observe-se que os valores já aparecem ordenados:

Definir atributos avançados e propriedades das dimensões

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

142Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Definir membros desconhecidos�

Definir atributos avançados e propriedades das dimensões

Vá até ao Designer Data Source View e seleccione Reseller Sales no Diagram Organizer. Depois vá ao menu Data Source View e seleccione Add/Remove Tables

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Seleccione DimProduct e clique em Add Related Tables;

Definir atributos avançados e propriedades das dimensões

Automaticamente é adicionada a DimProductSubCategory

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

143Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Seleccione agora a DimProductSubCategory e clique em Add Related Tables; Automaticamente é adicionada a DimProductCategory;

Definir atributos avançados e propriedades das dimensões

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Vá até ao Dimension Designer na dimensão Product e com o botão direito do rato em data source view:

Definir atributos avançados e propriedades das dimensões

Na zona dos atributos modifique este atributo para Category;

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

144Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Na propriedade ColumnName carregue em New e especifique:

Definir atributos avançados e propriedades das dimensões

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Na zona dos atributos modifique este atributo para SubCategory;

Definir atributos avançados e propriedades das dimensões

Na propriedade ColumnName carregue em New e especifique:

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

145Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Definir atributos avançados e propriedades das dimensões

Crie uma nova hierarquia nesta ordem Category � SubCategory e Product Name

Especifique a seguinte propriedade:

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Definir atributos avançados e propriedades das dimensões

Por defeito quando fazemos o Build, o SQL Server Analysis Server remove os produtos que não têm valor na coluna ProductSubCategoryKey

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

146Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Definir atributos avançados e propriedades das dimensões

Se formos a browser e clicarmos na lista de hierarquias em Product Model Lines, tem o seguinte efeito:

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Definir atributos avançados e propriedades das dimensões

Para resolver isso, vamos ao Dimension Structure da dimensão Product e defina as seguintes propriedades na dimensão Product

Expanda SubCateogry. Arraste o atributo Category que se encontra dentro de Product Name para dentro de SubCategory

Seleccione agora SubCategory e a propriedade KeyColumns

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

147Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Definir atributos avançados e propriedades das dimensões

Coloque o NullProcessing com o seguinte valor:

Fazer o mesmo para o ModelName. Faça Build, etc…e observem que já não existem nulos;

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Definir relações entre dimensões e grupos de medidas�

Definir uma dimensão de factos;

Definir uma relação referenciada

Definir relações entre dimensões e grupos de medidas

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

148Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Definir uma relação referenciada�

A maioria dos cubos definidos é através de uma relação com a tabela de factos. Na lição 3 e 4 incluímos no entanto atributos de uma tabela que não estavam directamente relacionados com a tabela de factos (chamada de snowflake). Por exemplo na lição 3, adicionamos atributos da tabela DimGeography à dimensão Customer. Os atributos da tabela DimGeograpphy encontram-se ligados à tabela de factos por intermédio da tabela Customer.

Através desta dimensão é possível definir a hierarquia Customer Geography e analisar a dimensão Customer por Geography.

De seguida vamos ligar a dimensão Geography à tabela de factos através da dimensão Reseller

Definir relações entre dimensões e grupos de medidas

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Definir relações entre dimensões e grupos de medidas

No solution Explorer abra o Cubo Designer e vá até browser. Arraste a medida Reseller Sales – Sales Amount e a hierarquia Geography (pertencente a Geography) para a área de data (Drop Row Fields Here)

Abra agora o Data SOurce View para a AdventureWorksDW. Seleccione no Diagram Organizer Reseller Sales. Observe a relação entre DimGeography e FactResellerSales. Não existe nenhuma ligação directa, mas existe uma ligação indirecta através de outras tabelas;

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

149Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Definir relações entre dimensões e grupos de medidas

Observe que a dimensão Geopgraphy não tem actualmente nenhuma relação com o grupo de medidas Internet Sales nem com o Reseller Sales;

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Definir relações entre dimensões e grupos de medidas

Clique:

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

150Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Definir relações entre dimensões e grupos de medidas

Observe-se que a relação é uma relação regular que é feita por intermédio das chaves estrangeiras

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Definir relações entre dimensões e grupos de medidas

Clique:

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

151Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Definir relações entre dimensões e grupos de medidas

Observe-se que não há nenhuma relação definida, nem sequer pode ser definida uma relação regular, uma vez que não existem campos a ligar as tabelas

Seleccione uma relação do tipo Referenced, indicando uma relação intermediária (Reseller) que permite fazer a ligação;

Seleccione a chave Geography Key e tente fazer o mesmo na relação intermediária. Não vai conseguir porque a Geography Key é definida como atributo na dimensão Reseller. Teremos que resolver o problema de outra forma

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Definir relações entre dimensões e grupos de medidas

No DimensionDesigner da dimensão Reseller observe ao campos em data source view e na zona de atributos

Observe que não obstante a tabela ter o atributo GeographyKey o mesmo não existe como atributo na dimensão Reseller;

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

152Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Definir relações entre dimensões e grupos de medidas

Adicione-se o atributo GeographyKey e depois atribua-se as características de AttributeHierarchyOrder (False) e AttributeHierarchyVisible (false)

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Definir relações entre dimensões e grupos de medidas

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

153Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Definir relações entre dimensões e grupos de medidas

Note-se que agora já temos as tabelas ligadas. Altere também o nome (na figura abaixo já se encontra alterado) de Geography para Reseller Geography:

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Definir relações entre dimensões e grupos de medidas

Build, etc….Arraste-se Reseller Sales – Sales Amount para a área de data e o atributo Geography da dimensão Reseller Geography para á area de Data (Row Field). Observe-se a figura que tinhamos anteriormente e a que temos agora em virtude de termos definido a relação:

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

154Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Definir uma dimensão de factos;�

Definir relações entre dimensões e grupos de medidas

Por vezes é necessário que algumas medidas que se encontram na tabela de factos se tornem atributos de dimensão, tal como número de facturas, etc…

Quando se define uma dimensão baseado numa tabela de factos, a dimensão é chamada de dimensão de factos. Dimensões de factos, são úteis para juntar várias linhas que estão relacionadas por exemplo a um número de factura.

Apesar de se poder construir uma tabela de dimensão para esse fim..tal não faz sentido

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

No Cubo Designer na parte das dimensões:

Clicar em Nova Dimensão e clicar depois em Next

Definir relações entre dimensões e grupos de medidas

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

155Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Definir relações entre dimensões e grupos de medidas

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Definir relações entre dimensões e grupos de medidas

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

156Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Definir relações entre dimensões e grupos de medidas

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Definir relações entre dimensões e grupos de medidas

No passo seguinte não seleccione nenhuma tabela e clique next;

No passo seguinte desmarque todas as selecções e considere apenas Customer PO Number:

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

157Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Definir relações entre dimensões e grupos de medidas

Antes de finalizar, alterar o nome para Internet Sales Orders Details;

Depois no Dimension Designer, seleccionar o atributo Internet Sales e alterar a propriedade Name para Item Description;

Na propriedade Name Column, seleccionar Product como source table e EnglishProductName como source column;

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Definir relações entre dimensões e grupos de medidas

Modifique a propriedade Name de Sales Order Number para Order Number

No Cubo Designer na DImension Usage

Indica que é uma dimensão de factos

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

158Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Definir relações entre dimensões e grupos de medidas

Build, etc..Coloque na área de data a medida Internet Sales – Sales Amount;

Expanda Customer � Location � Customer Geography � Members � All Customers � Australia � Queensland � Brisbane � Adam Powel e com o botºao direito do rato seleccione Add to SUbCube area.

Arraste a hierarquia InternetSalesOrder da dimensão Internet Sales Order Detail para a row area:

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Definir KPIs�

Na definição de um KPI atribui-se um nome ao KPI e um grupo de medidas. Os elementos de KPIs são os seguintes:

Definir KPIs

Value Expression

A Value Expression é uma medida (por exemplo total de vendas, lucros, etc…)

Goal Expression

Valor que define o objectivo a ser atingido (este valor pode ser por exemplo o valor que a empresa queira atingir nas vendas).

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

159Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Definir KPIs

Status Expression

Uma expressão que avalia o valor da Value Expression com o valor do Goal Expression, como um valor normalizado numa gama que varia de -1 a +1.

-1 é muito mau

+1 é muito bom

Trend Expression

Uma expressão que avalia o crescimento do valor da Value Expression comparativamente ao valor do Goal Expression. Esta expressão ajuda os gestores a determinarem se a value expression está a crescer ou a decrescer relativamente às expectativas (Goal expression)

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Definir KPIs

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

160Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Definir KPIs

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Definir KPIs

Na Value Expression colocar [Measures].[Sales Amount]

Na Goal Expression colocar [Measures].[Total Product Cost] * 2

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

161Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Definir KPIs

De seguida seleccionar o browsing

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Definir KPIs

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

162Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

SQL Server Business Intelligence Development Studio

Exercício Prático

Ricardo Campos ([email protected])

Instituto Politécnico de Tomar Escola Superior de Gestão de Tomar

Área Interdepartamental de Tecnologias de Informação e Comunicação

Gestão Financeira

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Desenvolva um modelo de Entidade e Relacionamento que permita registar a atribuição de crédito (para aquisição de diversos tipos de bens) por parte de uma dada entidade bancária aos seus clientes. Considere as seguintes informações:

O cliente é identificado por um número e tem como atributos o NIF, o nome, o rendimento bruto, o número de filhos e a idade. Adicionalmente o cliente tem associado um determinado estatuto, estado civil e crédito de habitação.

O cliente pode ter vários empréstimos atribuídos, mas cada empréstimo está apenas associado a um único cliente. Os atributos da entidade empréstimo são o valor do crédito e o valor da prestação. Adicionalmente deveremos considerar o tipo de bem financiado, o tipo de contrato, a duração, o tipo de pagamento e a situação

Enunciado

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

163Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

TipoBemFinanciado

TipoContrato

EmpréstimoClienteTipoEstatuto

TipoEstadoCivil

TipoCréditoHabitação

TipoDuracao

TipoPagamento

TipoSituacao

Modelo E-R

1

NN

N

NN

N

NN

N

1

1

1

1

11

1

1

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

No SQL Server Management Studio implemente a base de dados Banco e defina o modelo Relacional proveniente do modelo Entidade e Relacionamento desenvolvido na pergunta anterior.

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

164Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Modelo Relacional

CodClienteNIF

NomeNumFilhos

IdadeCodEstatuto

CodEstadoCivilCodCreditoHabit

Clientes

TipoEstatuto

CodEstatutoEstatuto

TipoEstadoCivil

CodEstadoCivilEstadoCivil

numEmprestimoValorCredito

ValorPrestacaoCodCliente

CodBemFinanciadoCodTipoContratoCodTipoDuracao

CodTipoPagamentoCodTipoSituacao

Emprestimos

CodCreditoHabitacaoCreditoHabitacao

TipoCreditoHabitacao

CodBemFinanciadoBemFinanciado

TipoBemFinanciado

CodTipoContratoTipoContrato

TipoContrato

CodDuracaoDuracao

TipoDuracao

CodPagamentoPagamento

TipoPagamento

CodTipoSituacaoTipoSituacao

TipoSituacao

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Defina o Database Diagram (não se esqueça de interligar as tabelas entre si)

Insira vários registos em cada uma das tabelas;

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

165Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Pretende-se agora que desenvolva uma estrutura multidimensional (star schema) com base nos seguintes pressupostos:

O processo de negócio a analisar está associado aos financiamentos concedidos pela instituição aos seus clientes;

Pretende-se analisar os financiamentos (valor do crédito), analisar a quem foram concedidos, verificar que bem foi financiado, identificar a regularidade adoptada para o pagamento, verificar que tipo de contrato foi celebrado com o cliente, verificar qual a duração do contrato, identificar a situação do cliente perante a instituição

Enunciado

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Modelo Multidimensional (Start Schema)

Financiamentos

Cliente

TipoBemFinanciado

TipoPagamento

TipoContrato

TipoDuracao

TipoSituacao

1

NN

N

NN

N

1

1

1

1

1

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

166Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

No SQL Server Management Studio implemente a base de dados BancoDW e defina o modelo Relacional proveniente do modelo Entidade e Relacionamento desenvolvido na pergunta anterior.

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

CodCliente

Nome

NumFilhos

Idade

Estatuto

CreditoHabitacao

EstadoCivil

Clientes

CodCliente

CodBemFinanciado

CodTipoContrato

CodDuracao

CodPagamento

CodTipoSituacao

ValorCredito

Financiamentos

CodBemFinanciado

BemFinanciado

TipoBemFinanciado

CodTipoContrato

TipoContrato

TipoContrato

Modelo Relacional

CodDuracao

Duracao

TipoDuracao

CodTipoSituacao

Situacao

TipoSituacao

CodTipoPagamento

Pagamento

TipoPagamento

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

167Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Defina o Database Diagram (não se esqueça de interligar as tabelas entre si)

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

No SQL Server Business Intelligence, desenvolva os processos ETL necessários à integração da informação da base de dados Banco para a base de dados BancoDW.

Criar um novo projecto de integração.

Adicionar duas conexões (uma para a base de dados Banco e outra para a base de dados BancoDW).

Processos ETL

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

168Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Processos ETL

Adicionar ao control flow, um data flow task

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

No data Flow, proceder ao carregamento dos dados da base de dados Banco para a base de dados BancoDW

Processos ETL

Popular a Dimensão Cliente:

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

169Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Processos ETL

Lookup à tabela Estatuto. Join através do campo CodEstatuto e

selecção do atributo Estatuto

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Processos ETL

Lookup à tabela EstadoCivil. Join através do campo CodEstadoCivil e

selecção do atributo EstadoCivil

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

170Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Processos ETL

Lookup à tabela CreditoHabitacao. Join através do campo

CodCreditoHabitacao e selecção do atributo CreditoHabitacao

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Processos ETL

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

171Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Popular a Dimensão Bem Financiado:

Processos ETL

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Popular a Dimensão TipoPagamento:

Processos ETL

Popular a Dimensão TipoPagamento:

Popular a Dimensão TipoDuracao:

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

172Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Popular a Dimensão TipoSituacao:

Processos ETL

Popular a tabela de factos Financiamentos:

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Aspecto final do Data Flow

Processos ETL

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

173Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

OLAP

No SQL Server Business Intelligence, implemente um projecto de Analysis Services, com base no data warehouse BancoDW:

New Data Source

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

OLAP

New Data Source View

Neste passo é possível seleccionar tabelas e views pertencentes à Data Source:

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

174Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Resultado final:

OLAP

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

OLAP

New Cube

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

175Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

OLAP

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

OLAP

Desenvolver um projecto Analysis Service;

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

176Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Expanda a dimensão Cliente e carregue em Edit

OLAP

Crie as seguintes hierarquias:

Seleccione Propriedades

Especifique que deve aparecer o nome do cliente

ao invés do seu número

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

OLAP

Crie as seguintes hierarquias:

Não se esqueça de definir o nome do cliente ao invés do número

Seleccione as propriedades de Idade

E em advanced especifique as propriedades anteriores por forma que sejam feitos grupos relativos à idade

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

177Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

OLAP

Não se esqueça de definir o nome do cliente ao invés do número

Defina grupos (escala) para o rendimento bruto

Não se esqueça de definir para todas as hierarquias um nome adequado para o 1.º nível da hierarquia:

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Faça um Deploy do projecto e navegue no browser

OLAP

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

178Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

No browser do cubo, analise os seus dados de acordo com o seguinte:

OLAP

Montante de crédito total atribuído, desagregado pelo estado civil dos clientes

Estado Civil Valor Crédito

All Cliente 3,982,71

+ Casado 1,022,49

+ Solteiro 1,494,94

+ Outro 1,465,27

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Verificar qual a distribuição do financiamento concedido por estado civil, mas atendendo ao bem financiado;

Estado Civil All TipoBemFinanciado Carro Electrodomésticos Mota Móveis

All Cliente 3,982,71 2,762,63 285,71 277,84 656,52

+ Casado 1,022,49 720,90 44,10 51,72 205,76

+ Solteiro 1,494,94 1,125,23 137,44 106,56 125,70

+ Outro 1,465,27 916,49 104,16 119,56 325,05

OLAP

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

179Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Verificar qual a distribuição do financiamento concedido por estado civil, mas atendendo ao número de filhos e bem financiado;

OLAP

- Estado Civil + Num Filhos All TipoBemFinanciado Carro Electrodomésticos Mota Móveis

All Cliente All Cliente Total 3,982,71 2,762,63 285,71 277,84 656,52

-Casado Casado Total 1,022,49 720,90 44,10 51,72 205,76

+ 0 323,61 224,48 14,78 21,20 63,14

+ 1 348,87 252,64 16,65 9,77 69,80

+ 2 350,00 243,77 12,67 20,74 72,81

-Solteiro Solteiro Total 1,494,94 1,125,23 137,44 106,56 125,70

+ 0 546,75 422,73 47,06 39,35 37,61

+ 1 520,67 403,63 39,91 32,69 44,43

+ 2 427,51 298,86 50,46 34,51 43,66

- Outro Outro Total 1,465,27 916,49 104,16 119,56 325,05

+ 0 1,010,12 647,35 75,88 80,33 206,54

+ 1 455,15 269,14 28,27 39,22 118,50

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Verificar qual a distribuição do financiamento concedido por bem financiado, mas atendendo à idade;

OLAP

Idade All TipoBemFinanciado Carro Electrodomésticos Mota Móveis

All Cliente 3,982,71 2,762,63 285,71 277,84 656,52

25 – 30 1,048,12 736,98 67,99 85,10 157,59

31 – 35 1,041,59 740,84 79,20 64,17 157,32

36 – 40 947,42 631,54 66,46 68,57 181,08

41 – 45 946,01 655,01 72,00 60,00 161,00

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

180Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Verificar o tipo de situação perante o financiamento atendendo ao estado civil e ao bem financiado;

Tipo Situação + Estado Civil All TipoBemFinanciado Carro Electrodomésticos Mota Móveis

All TipoSituação All Cliente 3,982,71 2,762,63 285,71 277,84 656,52

+ Casado 1,022,49 720,90 44,10 51,722 205,76

+ Solteiro 1,494,94 1,125,23 137,44 106,56 125,70

+ Outro 1,465,27 916,49 104,16 119,56 425,05

Cumprimento All Cliente 3,293,94 2,367,06 120,66 149,68 656,52

+ Casado 866,85 618,35 12,61 30,12 205,76

+ Solteiro 968,56 838,96 3,88 125,70

+ Outro 1,458,53 909,75 104,16 119,56 325,05

Incumprimento All Cliente 688,77 395,56 165,05 128,16

+ Casado 155,64 102,55 31,49 21,59

+ Solteiro 526,38 286,26 133,56 106,56

+ Outro 6,74 6,74

OLAP

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Tipo Situação Incumprimento

Idade All TipoBemFinanciado Carro Electrodomésticos Mota Móveis

All Cliente 688,77 395,56 165,05 128,16

25 – 30 91,00 7,00 37,00 46,00

31 – 35 292,00 192,00 41,00 24,00

36 – 40 214,00 151,00 31,00 26,00

41 – 45 82,00 8,00 46,00 22,00

Verificar o tipo de situação incumprimento associado à idade e ao tipo de bem financiado;

OLAP

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

181Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Verificar a distribuição do crédito atendendo ao Cumprimento ou Incumprimento dos clientes e ainda ao tipo de bem financiado (Carro, Electrodoméstico, Mota, Móveis);

OLAP

Bem Financiado All TipoSituação Cumprimento Incumprimento

All Tipo Bem Financiado 3,982,71 3,293,94 688,77

Carro 2,762,63 2,367,06 395,56

Electrodomésticos 285,71 120,66 165,05

Mota 277,84 149,68 128,16

Móveis 656,52 656,52

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Verificar a distribuição do crédito atendendo ao Cumprimento ou Incumprimento dos clientes, ao tipo de bem financiado (Carro, Electrodoméstico, Mota, Móveis) e ao tipo de pagamento;

OLAP

Ver slide seguinte:

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

182Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Pagamento Bem Financiado All Tipo Situação Cumprimento Incumprimento

All Tipo Pagamento All TipoBemFinanciado 3,982,71 3,293,94 688,774

Carro 2,762,63 2,367,06 395,56

Electrodomésticos 285,71 120,66 165,05

Mota 277,84 149,68 128,16

Móveis 656,52 656,52

Mensal All TipoBemFinanciado 3,899,83 3,223,45 676,37

Carro 2,762,63 2,367,06 395,56

Electrodomésticos 267,23 114,58 152,65

Mota 277,84 149,68 128,16

Móveis 592,12 592,12

Trimestral All TipoBemFinanciado 82,88 70,48 12,39

Carro

Electrodomésticos 18,47 6,08 12,39

Mota

Móveis 64,40 64,4’

OLAP

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Verificar a distribuição do financiamento atendendo ao Cumprimento ou Incumprimento dos clientes e ao tipo de contrato;

OLAP

Tipo Contrato All TipoSituação Cumprimento Incumprimento

All TipoCOntrato 3,982,71 3,293,94 688,77

ALD 1383,40 1,004,22 379,17

Leasing 1,370,57 1,354,18 16,39

Outro 1,228,74 935,53 293,21

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

183Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Verificar a distribuição do financiamento atendendo ao Cumprimento ou Incumprimento dos clientes, bem financiado e ao tipo de contrato;

OLAP

Ver slide seguinte:

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Pagamento Bem Financiado All Tipo Situação Cumprimento Incumprimento

All Tipo Pagamento All TipoBemFinanciado 3,982,71 3,293,94 688,774

Carro ……. ……. …….

Electrodomésticos ……. ……. …….

Mota ……. ……. …….

Móveis ……. ……. …….

ALD All TipoBemFinanciado ……. ……. …….

Carro ……. ……. …….

Electrodomésticos ……. ……. …….

Mota ……. ……. …….

Móveis ……. ……. …….

Etc… All TipoBemFinanciado ……. ……. …….

Carro ……. ……. …….

Electrodomésticos ……. ……. …….

Mota ……. ……. …….

Móveis ……. ……. …….

OLAP

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

184Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Verificar a distribuição do financiamento atendendo ao Cumprimento ou Incumprimento dos clientes e à duração do contrato;

OLAP

Duração All TipoSituação Cumprimento Incumprimento

All TipoDuraçao 3,982,71 3,293,94 688,77

6 ……. ……. …….

12 ……. ……. …….

18 ……. ……. …….

24 ……. ……. …….

30 ……. ……. …….

36 ……. ……. …….

42 ……. ……. …….

48 ……. ……. …….

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Verificar a distribuição do financiamento atendendo ao Cumprimento ou Incumprimento dos clientes, ao tipo de bem financiado e ao tipo de contrato;

OLAP

Ver slide seguinte:

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

185Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Bem Financiado Duração All Tipo Situação Cumprimento Incumprimento

All Tipo BemFinanciado

All TipoDuração 3,982,71 3,293,94 688,774

6 ……. ……. …….

12 ……. ……. …….

18 ……. ……. …….

24 ……. ……. …….

30 ……. ……. …….

36 ……. ……. …….

42 ……. ……. …….

48 ……. ……. …….

Etc…. ……. ……. …….

……. ……. …….

……. ……. …….

……. ……. …….

……. ……. …….

OLAP

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Tipo Situação Incumprimento

Duração All TipoBemFinanciado Carro Electrodomésticos Mota Móveis

All TipoDuração 688,77 395,56 165,05 128,16

6 …….. …….. …….. ……..

12 …….. …….. …….. ……..

18 …….. …….. …….. ……..

24 …….. …….. …….. ……..

30 …….. …….. …….. ……..

36 …….. …….. …….. ……..

42 …….. …….. …….. ……..

48 …….. …….. …….. ……..

Verificar o tipo de situação incumprimento associado ao tipo de bem financiado e ao tipo de duração;

OLAP

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

186Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

KPIs

Defina um KPI (Key Performance Indicator) que avalie os resultados relativos à concessão de crédito;

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

CRM

Ricardo Campos ([email protected])

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

187Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

O CRM O CRM é uma estratégia de negócioé uma estratégia de negócio que abrange toda a empresa. Visa a que abrange toda a empresa. Visa a criação de um relacionamento a longo prazo com os clientes e parceiros através criação de um relacionamento a longo prazo com os clientes e parceiros através

da compreensão e satisfação das suas necessidades individuais.da compreensão e satisfação das suas necessidades individuais.

VendasMarketing Serviço

Canais de Interacção

Telefone Fax Web Mail PDA’s

Definição

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

• Construção de Relações

• Reconhecer e tratar os melhores clientes

• Escutar e aprender com os clientes

• Actuar a partir do conhecimento adquirido

ÉÉ Mais do Que

• Montar um serviço ao cliente

• Disponibilizar Produtos de Qualidade

Adopção de Novos Modelos de Negócio

• Foco na Oferta de Produtos

• Venda de Produtos a todos os Potenciais

Clientes.

• Foco na Construção de Relações

Duradouras

• Customizar a base de produtos e serviços

à base de clientes.

Antes Agora

Marketing Tradicional

• Diferenciar produtos.

• Gerir produtos.

• Encontrar Clientes para Produtos.

Marketing 1 To 1

• Diferenciar clientes.

• Gerir clientes.

• Encontrar Produtos para Clientes.

Definição

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

188Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Informação (permite identificar preferências

e necessidades de clientes)

• Gestão de Clientes no Front-Office• Marketing• Vendas• Serviço• Suporte

Interacção (base para a construçãode relações duradouras)

• Vendas Directas• Vendas Indirectas• Telefone• E-mail• Web• Carta• Fax

Vendas

Marketing

Serviço

Suporte

Interacção = Informação

Informação = Conhecimento

Conhecimento = Fidelização

Fidelização = Lucro

Consequentemente Diálogo = Lucro

Factores Críticos na Implementação da Estratégia

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Front - Office

• Front-office aparece como foco central na gestão das relações com clientes.

• Necessidade de dotar organizações de uma base de dados unificada.

• Dar às áreas de front-office a visão do cliente nas vertentes de Serviço, Suporte,

Marketing e Vendas.

Fases do CRM

Know Me

Aquisição de Clientes

Hear Me

Grow Me

Retenção de Clientes

Customer Relationship Management Estratégico

Rentabilidade

Sat

isfa

ção

Clie

ntes

/Fid

eliz

ação

Fases do CRM

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

189Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

• Cliente encarado como Conta

• Empresa foca-se em ter uma ideia do cliente: facturação, número de escritórios

World Wide, ...

• Ofertas comerciais baseadas em preço por volume de aquisição.

• Foco: Oportunidades de Negócio.

• Necessidade de criar valor para o cliente.

• Necessidade de ter informação detalhada de interacções.

• Necessidade de o conhecer quem compra e quem decide.

• Necessidade de escutar o cliente e conhecer as condições que condicionam as

tomadas de decisão e o processo de aquisição.

• Foco: Contactos e Actividades.

• Cross-sell e Up-Sell baseado no verdadeiro conhecimento do cliente

(Oportunidades, Contactos e Actividades).

• Conhecimento é adquirido na Empresa e no Cliente.

• Foco: Relacionamento.

Know Me

Hear Me

Grow Me

Fases do CRM

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Data Mining

Ricardo Campos ([email protected])

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

190Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Data Mining

Processo de exploração e análise de dados a fim de descobrir regras e padrões anteriormente desconhecidos;

é o processo de descoberta de nova e relevante informação a partir de grandes volumes de informação mantidos no DW;

essa informação é tipicamente “conhecimento escondido” obtido pela análise da ocorrência de padrões.

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Comportamento do cliente:

Procurar e reter os clientes mais rentáveis;

Detecção de fraude;

Data Mining - Aplicações

Análise web;

Segmentação de clientes:

Marketing direccionado – receptividade a campanhas;

Análise de rentabilidade:

Aquisição e retenção de clientes;

Análise de risco;

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

191Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Data Mining

OLAP Data Mining

Quantos assinantes se perderam por fraude?

Quais são as características dos clientes com maior propensão para fraude?

Quantos clientes é que estamos a perder? Porque é que estamos a perder clientes? Quais os clientes que estamos em risco de perder?

Quantos clientes cancelaram as contas nos últimos 6 meses comparando com o mesmo período do ano passado?

Quais os clientes que vão passar para a concorrência nos próximos 6 meses?

Que lojas não cumpriram determinados objectivos no último ano?

Qual é o melhor tamanho e localização para a nossa próxima loja?

Quanto perdemos em crédito mal

parado no último ano?

Quais os clientes com possibilidade de

falharem o pagamento dos empréstimos?

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Data Mining

As tarefas de Data Mining incluem:

Classificação;

Segmentação;

Modelação de Dependências;

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

192Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Classificação:

Data Mining

Permite o enquadramento de um conjunto de dados dentro de classes predefinidas;

A classificação é uma tarefa de aprendizagem supervisionada. Isto quer dizer que o atributo e as classes que vão conduzir o processo de classificação dos dados são conhecidos à partida.

Exemplo:

Considere-se um conjunto de 23 registos;

Cada ponto representa uma pessoa a quem o banco concedeu crédito

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

No eixo dos xx temos representado o rendimento bruto (total anual);

No eixo dos yy o montante total da dívida (valor do crédito)

Os dados encontram-se classificados em duas classes:

A existência de duas regiões, que permitem dividir os clientes nas duas classes disponíveis para o atributo de saída: cumpridores e incumpridores;

∆, clientes que não tiveram qualquer atraso no pagamento;

□, clientes que faltaram ao pagamento das suas dívidas;

Data Mining

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

193Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Data Mining

Segmentação:

Conhecida como clustering;

Representa uma tarefa de aprendizagem não supervisionada, uma vez que o utilizador não tem qualquer influência na definição de classes

Os segmentos surgem de agrupamentos que são detectados nos dados e que obedecem a métricas de similaridade;

A representação dos registos é substituída pelo símbolo Οpara todos os registos, indicando que não existe qualquer predefinição de classes para os indivíduos;

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Modelação de Dependências:

Tem como objectivo identificar um modelo que descreve dependências significativas entre variáveis;

Data Mining

Um exemplo de associação pode ser encontrado em conjuntos de bens de consumo que são adquiridos simultaneamente;

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

194Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Técnicas de Data Mining:

Árvores de Decisão;

Regras de Associação;

Data Mining

Existe uma grande diversidade de técnicas de data mining, as quais são concretizadas através de diferentes algoritmos.

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Árvores de Decisão:

São constituídas por estruturas em árvores que representam um conjunto de decisões;

Os algoritmos de árvores de decisão permitem gerar regras de classificação de dados, baseados na informação guardada na base de dados;

Data Mining

Uma árvore de decisão integra nós, ramos e folhas:

Nos nós, encontram-se os atributos a classificar;

Ramos descrevem os valores possíveis para esses atributos;

As folhas da árvore indicam as diversas classes em que cada registo pode ser classificado;

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

195Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Data Mining

As árvores de decisão podem ainda ser representadas por conjuntos de regras. Cada folha da árvore dá origem a uma regra.

Se Bem Financiado = “Electrodoméstico” e Estado Civil = “Casado” e Rendimento Bruto = “5001 – 10000” então “Conceder”

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Regras de Associação:

As regras de associação permitem encontrar relacionamentos entre os atributos existentes numa base de dados, representando-os na forma de uma regra. Se X então Y ou “X � Y”

Data Mining

Número Produto

1101 Pão

1101 Manteiga

1101 Fiambre

1101 Leite

2201 Pão

2201 Queijo

2201 Leite

3101 Leite

3101 Pão

3101 Queijo

4100 Pão

4100 Manteiga

4100 Leite

Produtos agrupados por compra

Número Produtos

1101 Pão, Manteiga, Fiambre, Leite

2201 Pão, Queijo, Leite

3101 Pão, Queijo, Margarina

4100 Pão, Manteiga, Leite

Exemplo de uma regra:

Pão & Manteiga � Leite (2/4=50%, 1)

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

196Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Excel

Ricardo Campos ([email protected])

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

As tabelas dinâmicas (pivot tables) constituem um recurso do Excel para organizar tabelas ou listas de dados.

Permitem resumir a informação obtida a partir de uma fonte de dados, sem a necessidade de usar fórmulas, mostrando a informação num relatório ou numa tabela interactiva.

O nome “tabela dinâmica” advém da facilidade em trocar a disposição dos dados na tabela, obtendo a informação vista de diferentes perspectivas.

As tabelas dinâmicas constituem-se a partir de tabelas ou listas de dados já existentes e permitem reorganizar os dados com grande flexibilidade e de forma diversificada;

Tabelas Dinâmicas

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

197Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

A funcionalidade Pivot Table é das funcionalidades mais potentes do Excel e permite efectuar um tratamento de dados potente e multidimensional.

Tabelas Dinâmicas

Seleccionando as células seleccione-se o menu Dados

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Tabelas Dinâmicas

Seleccionar a origem dos dados e o tipo de relatório:

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

198Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Tabelas Dinâmicas

Seleccionar as células de origem dos dados:

Seleccionar onde se deseja colocar o relatório

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Aqui pode-se escolher o que se pretende ter nas linhas e o que se pretende ter nas colunas.

Tabelas Dinâmicas

Formatar Relatório Assistente de Gráficos

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

199Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Resultado Final

Tabelas Dinâmicas

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Caso Prático

Pretende-se que os alunos se familiarizem com as análises OLAP usando para tal as tabelas pivot do excel. Existe um conjunto de dados, constantes das fichas práticas, que poderão ser usado para esse fim

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

200Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Considere-se a seguinte tabela:

Caso Prático

Livro: CasoPrático.xls, folha1

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Crie uma tabela dinâmica com o seguinte aspecto:

Caso Prático

Carregue duas vezes em cima do nome Janet para ver o que acontece;

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

201Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Considere agora outro exemplo. Na figura abaixo, encontra-se listado parte do ficheiro relativo à classificação (6 disciplinas) de duas alunas (Elisa e Maria) nos meses de Janeiro, Fevereiro e Março.

Caso Prático

Livro: CasoPrático.xls, folha2

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Caso Prático

Construa a seguinte tabela dinâmica (observe que a mesma diz respeito aos dois alunos considerados e que os valores apresentados dizem respeito à média de classificação)

Considere agora apenas a aluna Elisa e o máximo da classificação:

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

202Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Caso Prático

Utilizar filtros (selecção de alunos):

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Alteração da fórmula de cálculo

Caso Prático

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

203Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Crie o seguinte gráfico:

Caso Prático

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Considere agora a seguinte tabela de vendas:

Caso Prático

Livro: CasoPrático.xls, folha3

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

204Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Caso Prático

Pretende-se apurar o total de vendas realizado por cada funcionário:

Pretende-se apurar o total de vendas realizado por cada funcionário, filtrado por país:

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Caso Prático

Pretende-se apurar o total de vendas realizado por cada funcionário, apresentando os resultado ordenados por valor de venda:

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

205Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Caso Prático

Quais são os 5 melhores vendedores?

Seleccione-se o campo “SalesPerson” e no menu tabela dinâmica o menu “Ordenar as 10 Mais”

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Caso Prático

Seleccionar apenas 5 resultados:

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

206Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Caso Prático

Qual foi o desempenho dos vendedores de UK, em cada um dos trimestres:

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Caso Prático

Qual a variação do desempenho dos vendedores de UK de trimestre para trimestre:

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

207Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Caso Prático

Quais são os detalhes de venda de um utilizador:

Tomando-se como partida esta tabela, basta carregar duas vezes em cima de Sum of Order Amount e é criada automaticamente a lista anterior:

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Caso Prático

Quanto é que cada venda representa em termos de percentagem?

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

208Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Caso Prático

Duplo Clique

Seleccionar Opções: Seleccionar % do total:

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Produza o seguinte gráfico:

Caso Prático

Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data

Warehouse, SQL Server Business Intelligence Development Studio. Conceitos

de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.

209Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]

Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]

Sub-Totais;

Cenários

Atingir Objectivos;

Outras Funcionalidades