sistemas de informação - centro de computação...
TRANSCRIPT
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
1Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Sistemas de Informação
Ricardo Campos ([email protected])
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Esta apresentação foi desenvolvida por Ricardo Campos, docente do Instituto Politécnico de Tomar. Encontra-se disponível na página web do autor no link Publications ao abrigo da seguinte licença:
Mais detalhes em: http://creativecommons.org/licenses/by-nc/3.0/deed.pt
O seu uso, de parte ou da totalidade, pressupõe a utilização da seguinte referência: Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data Warehouse, SQL Server Business Intelligence Development Studio. Conceitos de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
A sua disponibilização em formato PPT pode ser feita mediante solicitação (email: [email protected])
Autoria
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
2Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Bibliografia
Recursos:
Ralph Kimball, Laura Reeves, Margy Ross, Warren ThornthwaiteThe Data Warehouse Lifecycle Toolkit : Expert Methods for Designing, Developing, and Deploying Data Warehouses Wiley, 1998 ISBN: 0471255475
Ralph Kimball, Margy Ross Data Warehouse Toolkit: The Complete Guide to Dimensional Modeling (Second Edition) Wiley, 2002 ISBN: 0471200247
W. H. Inmon Building the Data Warehouse (4rd Edition) Wiley, 2005 ISBN: 0-7645-9944-5
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Claudia Imhoff, Nicholas Galemmo, Jonathan G. GeigerMastering Data Warehouse Design : Relational and Dimensional Techniques Wiley, 2003 ISBN: 0471324213
Ralph Kimball, Richard MerzThe Data Webhouse Toolkit: Building the Web-Enabled Data Warehouse Wiley, 2000 ISBN: 0471376809
Joe Caserta, Ralph KimballThe Data Warehouse ETL Toolkit: Practical Techniques for Extracting, Cleaning Wiley, 2004 ISBN: 0764567578
Bibliografia
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
3Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
J.L.Pereira“Tecnologia de Bases de Dados”FCA – Editora de InformáticaISBN: 972-722-143-2
A.Silberschatz, H.F.Korth, S.SudarshanDatabase System ConceptsMcGraw-Hill ISBN 0-07-295886-3
Bibliografia
M. Y. Santos, I. Ramos “Business Intelligence”FCA – Editora de InformáticaISBN: 972-722-405-9
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
SQL Server Analysis Tutorial
Bibliografia
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
4Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Bibliografia
Acetatos de João Moura Pires,
UNova – Faculdade de Ciências e Tecnologia
Acetatos de José Lourenço,
Wedo Consulting (www.wedo.pt)
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Bibliografia
Recursos on-line (Bases de Dados e SQL):
Nota: Não é possível garantir a existência futura dos endereços (URL’s), citados nos recursos on-line. Como se sabe, os endereços
são virtuais e a sua vida útil depende única e exclusivamente dos seus autores e proprietários.
SQL Course Interactive, http://www.sqlcourse.com
Tutoriais, http://apostilando.com/sessao.php?cod=18
Linha de Código SQL, http://www.linhadecodigo.com.br/desenvolvimento/sql.asp
Noções da Linguagem SQL, http://www.juliobattisti.com.br/artigos/office/nocoessqlconsultas.asp
SQL for Web Nerds, http://philip.greenspun.com/sql/
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
5Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Sql Server Developer Center, http://msdn2.microsoft.com/en-us/sql/default.aspx
Recursos on-line (SQL Server ):
Newsgroups, http://groups.google.com/groups/dir?lnk=gh&hl=en&sel=33606733
SQL Server Magazine, http://www.sqlmag.com/
SQL Server Database Help, http://www.sswug.org/
Data Generation Tool, http://www.sqledit.com/dg/index.html
SQL Server Central, http://www.sqlservercentral.com/
SQL Server 2005 Books, http://www.microsoft.com/downloads/details.aspx?FamilyId=BE6A2C5D-00DF-4220-B133-29C1E0B6585F&displaylang=en
Nota: Não é possível garantir a existência futura dos endereços (URL’s), citados nos recursos on-line. Como se sabe, os endereços
são virtuais e a sua vida útil depende única e exclusivamente dos seus autores e proprietários.
Bibliografia
http://www.mcdbabrasil.com.br/
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Recursos on-line (SQL Server ):
Bibliografia
http://www.datawarehouses.hpg.com.br/
http://www.datawarehouse.da.ru/
http://www.cio.com/research/data/
http://www.dwinfocenter.org/
http://www.dmreview.com
http://www.intelligententerprise.com/
http://www.rkimball.com/
http://www.balancedscorecard.com
http://www.vldb.org
http://www.sqlmax.com/dataw1.asp
http://www.kimballgroup.com/
http://www.billinmon.com
http://www.kdnuggets.com/
http://www.bettermanagement.com
http://www.dw-institute.com
Nota: Não é possível garantir a existência futura dos endereços (URL’s), citados nos recursos on-line. Como se sabe, os endereços
são virtuais e a sua vida útil depende única e exclusivamente dos seus autores e proprietários.
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
6Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Pivot Table Reports 101, http://office.microsoft.com/en-us/excel/HA010346321033.aspx
Recursos on-line (Excel: Tabelas Dinâmicas):
Bibliografia
25 Easy Pivot Tables, http://office.microsoft.com:80/en-us/excel/HA010346331033.aspx
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Do que trata este curso?
Data Warehouse (DW)
É o armazém onde todos os dados são armazenados e guardados incluindo dados temporais que servirão de suporte futuro à análise de dados e apoio à decisão;
�
On-Line Analytical Processing (OLAP)�
Resposta a queries analíticas que por natureza são dimensionais. Os dados são provenientes da DW;
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
7Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Do que trata este curso?
Data Mining
É o processo de descoberta de nova e relevante informação a partirde grandes volumes de informação mantidos no DW;
�
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Porquê estudar Sistemas de Informação?
Os Sistemas de Informação têm um papel fundamental e sempre crescente em todas as organizações de negócios;
Para um entendimento sólido de como as organizações operam, é crucial entender o papel dos sistemas de informação nas organizações;
Os Sistemas de Informação são usados em todas as áreas funcionais:
Nas Finanças e Contabilidade os SI são usados para prever resultados, gerir recursos financeiros, analisar investimentos, etc…
Em Vendas e Marketing os SI são usados para processar pedidos de clientes, desenvolver planos de produção, controlo de stock, monitorizar a qualidade dos produtos, etc…
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
8Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Porquê estudar Sistemas de Informação?
A indústria de aviação usa a Internet para oferecer descontos e aumentar as vendas
Os bancos usam os SI para auxiliar na concessão de créditos;
Nas Finanças e Contabilidade os SI para organizar a entrega de bens;
As empresas de saúde usam os SI para diagnosticar doenças, planear tratamentos médicos, etc…
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Objectivos
Conceito dos Sistemas de Apoio à Decisão;
Conceito de OLTP, DW e OLAP;
Evolução das bases de dados;
Modelo standard de um data warehouse;
Arquitectura dos Sistemas de Informação;
Gestão do Conhecimento;
Operações típicas de slice, drill-down, drill up por via das tabelas dinâmicas do Excel;
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
9Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Objectivos
Data Mining;
CRM;
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Programa
Sistemas de Informação�
Conceito de Sistemas de Informação;
Dados vs Informação;
Noção de Informação;
Funções de um Sistema de Informação;
Gestão de Conhecimento
Arquitectura de Sistemas;
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
10Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Programa
Data Warehouse e OLAP�
Noção de Data Warehouse;
Perspectiva Histórica;
Conceitos de Sistemas de Apoio à Decisão;
Modelo de referência do DW;
Características;
Aplicações;
Modelação dimensional (modelo em estrela);
Diferenças entre OLTP e OLAP;
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Programa
SQL Server Business Intelligence Development Studio;�
Definição de KPIs;
Análise dos dados;
Integração dos dados;
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
11Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Programa
Implementação de um projecto DW para um banco;�
Integração dos dados;
Desenho do esquema em estrela;
Desenho do esquema relacional;
Definição de KPIs;
Análise dos dados;
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Programa
Data Mining�
OLAP vs Data Mining;
Aplicações;
Definição de Data Mining;
Técnicas de Data Mining;
Classificação; Segmentação e Modelação de Dependências;
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
12Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Programa
Microsoft Excel�
O significado das operações típicas de slice, drill-down e drill-up por via das tabelas dinâmicas;
Manipulação básica de tabelas dinâmicas no excel (criação, manipulação e interactividade sobre elas);
Tabelas Dinâmicas;
Outras funcionalidades: sub-totais; cenários e atingir objectivos;
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Sistemas de Informação
Ricardo Campos ([email protected])
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
13Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
“O acesso à informação e a capacidade de integrar e interpretar a
informação que vai estando disponível, interna e externamente às
organizações estão no cerne da conquista de vantagens competitivas
pelas empresas”.
Michael Porter
The Competitive Advantage of Nations
Macmillan Press, London, 1990
Informação
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Informação
Excesso de Informação;
Será que o problema reside no excesso de informação?
O problema não é o excesso…é a qualidade;
Existem muitos dados sem qualidade;
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
14Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Dados vs Informação
Os dados são a matéria prima da informação
A sua recolha, manutenção e armazenamento é extremamente cara, mas apesar disto o seu valor é relativamente baixo;
A informação é resultado do processamento de dados de modo a serem utilizados para suporte a decisão
O processamento pode assumir múltiplas formas: agregação; gráficos; análise; ordenação;
Gestão da Informação
Informação
Dados
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Sistema
Conjunto de elementos ou componentes que interagem para atingir objectivos.
Os sistemas têm entradas, mecanismos de processamento e saídas;
Sistema Entrada Processamento Saída
Estudantes, Professores, Administradores, Livros, etc…
Pesquisa, Ensino, Serviços
Estudantes com conhecimentos, pesquisa significativa, serviços prestados à região
Actores, Directores, Cenários, etc…
Filmagem, Edição, Efeitos Especiais, etc..
Filme nas salas de cinema.
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
15Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Sistema de Informação
Conjunto inter-relacionado de componentes capazes de recolher,
armazenar, processar e disponibilizar informação, com o propósito de
apoiar o planeamento, controlo, coordenação, análise e tomada de
decisão.
PessoasOrganizações
Tecnologia
Sistemas de Informação
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Sistema de Informação
Tecnologia:
Bases de Dados: é uma das partes mais valiosas de um sistema de informação, reunindo uma colecção organizada de dados da organização;
Redes: usadas para conectar computadores e equipamentos;
Internet: a maior rede de computadores do mundo;
Intranet: rede interna baseada em tecnologias de internet que permitem aos colaboradores de uma organização trocar informações;
Extranet: rede baseada em tecnologias de Internet que permitem a terceiros seleccionados (parceiros e clientes de negócios), aceder a recursos autorizados da intranet de uma organização;
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
16Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Funções de um Sistema de Informação
Recolha da Informação;
Armazenamento da Informação;
Processamento da Informação;
Representação da Informação;
Distribuição da Informação;
input processamento output
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Funções de um Sistema de Informação
input processamento output
Input: actividade de capturar dados básicos. Exemplo: quantidade de horas trabalhas por um funcionário;
Processamento: envolve a transformação de dados em informação. O processamento pode envolver cálculos;
Output: envolve a distribuição de informação útil, em geral na forma de documentos ou relatórios. Cheques com os pagamentos para os funcionários;
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
17Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Arquitectura de Sistemas
Registar
Sistemas Operacionais
Recordar
Data Warehouse Aprender
Aprender
CRM
Actuar
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Motivação: Decisões no contexto das Organizações
Decidir a criação de um novo curso universitário;
Analisar os factores que afectam o insucesso escolar dos alunos;
Decidir a concessão de um crédito bancário;
Prever quais os clientes que estão em risco de deixar de o ser;
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
18Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Motivação: Decisões no contexto das Organizações
Data Warehouse
Domínios de Informação
FinanceiroVendas OutrosMarketing
Marketing
Visão integrada do cliente
Programas de retenção dos clientes;
Vendas
Performance
Preços
Financeiro
Custos e Receitas
Outros
Recursos Humanos
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Necessidade e Contexto
A necessidade e contexto de implementação de Sistemas de Suporte à Decisão decorre de:
Forte evolução das Tecnologias de Informação no dominio de tratamento de dados;
Existência e evolução de Sistemas Operacionais sofisticados geradores de informação;
Forte concorrência nos mercados;
Politicas e estratégias de Gestão de Conhecimento;
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
19Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Gestão de Conhecimento
A gestão do conhecimento abrange todo o ambiente das organizações nas funções de:
Recolha de Informação;
Agregação de Informação;
Gestão da Informação;
Distribuição da Informação;
Análise da Informação;
Com a finalidade de suporte e fundamentação de decisões.
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Gestão de Conhecimento
Problemas típicos:
Dificuldades na obtenção da informação necessária;
Existência de múltiplas fontes de informação, diferentes ocorrências para as mesmas informações;
Dificuldades na identificação das fontes da informação;
Acesso à informação, necessidade de recorrer a recursos especializados;
Dificuldades na interpretação da informação;
Documentação associada de fraca qualidade e geralmente pouco objectiva em termos de negócio;
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
20Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Data Warehouses
On-Line Analytical Processing
Data Mining
Tecnologias de Business Intelligence
Os sistemas de BI (Business Intelligence) utilizam os dados disponíveis nas organizações para disponibilizar informação relevante para a tomada de decisão;
Os sistemas de BI estão tradicionalmente associados a 3 tecnologias:
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Tecnologias de Business Intelligence
e de Data Mining (algoritmos de exploração dos dados identificam padrões, relacionamentos, modelos que estão ocultos na grande quantidade de dados armazenados).
Data Warehouses
On-Line Analytical Processing
Data Mining
Um DW é um armazém de dados que permite o armazenamento de informação relevante para a tomada de decisão;
Estes repositórios podem ser analisados utilizando ferramentas OLAP (análise multidimensional que nos permite examinar a informação sob diferentes perspectivas)
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
21Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Termos Chave
Base de dados;
Comércio Electrónico;
Sistemas de Informação;
Extranet;
Intranet;Redes;
Dados;
Informação;
Gestão de Conhecimento;
Sistemas Operacionais;
Data Warehouse;
Data Mining;
Web Mining;
CRM;ERP;
Sistemas de Apoio à Decisão;
Business Intelligence;
OLTP;OLAP;
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Data Warehouse e OLAP
Ricardo Campos ([email protected])
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
22Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Evolução das TIC
Lei de Moore;
Capacidades de Armazenamento;
Suporte a Elevado número de transacções;
Client/Server;
Redes;
Ferramentas de Desenvolvimento (alta produtividade)
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
1960 Ficheiros de Dados
1965 Muitos Ficheiros de Dados
Redundância e Inconsistência dos dados;
Complexidade na manutenção e no desenvolvimento;
Dificuldade na sincronização dos dados;
Não possibilita o acesso concorrentes (diversos utilizadores);
Clientes
Encomendas
Produtos
Evolução dos SAD
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
23Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
1970 Sistemas de Gestão de Bases de Dados
Bases de
Dados
Evolução dos SAD
A abordagem pelos SGBDs tem uma característica fundamental: os dados são organizados num único conjunto (uma única unidade de armazenamento em vez de várias unidades independentes);
Adicionalmente todos os acessos aos dados passam por entidade designada por SGBD que centraliza em si o acesso à base de dados;
Os SGBDs ocultam os detalhes físicos de armazenamento e organização dos dados (a base de dados encontra-se evidentemente num conjunto de ficheiros);
S
G
B
D
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
A meio da década de 70 surgem os primeiros sinais de investigação na área de Sistemas de Apoio à Decisão. É proposta pela 1.º vez uma primeira divisão entre:
Processamento Operacional;
Processamento Analítico;
Através da criação de sistemas específicos com:
armazenamento de dados separados e independentes;
princípios de desenho de dados radicalmente diferentes;
Evolução dos SAD
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
24Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
1975 OnLine Transaction Processing (OLTP)
Bases de
Dados
Dados Operacionais/Transaccionais
High-performance online processing;
1980 Client/Server
Bases de
DadosReports
Construção de Relatórios Pré-Definidos
Evolução dos SAD
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
1985Bases
de Dados
Extracção
DW
Data Warehouse
Dados extraídos através de uma ferramenta de extracção;
Selo temporal;
Evolução dos SAD
Análises Especializadas;
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
25Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
DW
A data warehouse é uma base de dados analítica que é usada como suporte aos sistemas de apoio à decisão
É usada para armazenar grandes volumes de dados
Disponibilizar uma visão de toda a informação de negócio, integrada e consistente,com fácil acesso para os seus utilizadores.
Unifica a informação da organização (elimina as ilhas de informação)
Valoriza os sistemas existentes em vez de os substituir
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
DW
É um ambiente, não é um produto final….
Potencia a implementação de SAD
A Construção de um Data Warehouse é um processo iterativo e continuo, não um projecto fechado.
A participação, na construção do sistema, activa e contínua dos utilizadores de negócio é critica
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
26Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
DW - Aplicações
Análise de risco
Extrapolar conhecimento para poder classificar os novos clientes;
Marketing
Focalizar campanhas publicitárias;
Gestão de inventário
Armazéns: permite tomada de decisões sobre o nível de stock óptimo e frequências de entregas;
Gestão de posicionamento de produtos
Grandes superfícies: optimizar colocação de artigos nas prateleiras, permitindo as melhores vendas;
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
DW - Características
Orientado por assunto: num DW os dados são organizados em torno dos principais assuntos de uma organização, por exemplo, clientes, fornecedores, produtos, lojas,etc…
É um repositório que não está vocacionado para o armazenamento da informação associado às operações do dia a dia da organização e respectivo processamento das transacções, mas visa a análise de dados para o suporte à tomada de decisões;
Integrado: um DW é normalmente construído a partir de diversas fontes heterogéneas de dados
Não volátil: num DW existem apenas duas operações (carregamento inicial dos dados e acesso aos mesmos). Após o carregamento estes não podem ser alterados ou eliminados.
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
27Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
DW - Características
Concebido para tarefas analíticas;
Pequeno número de utilizadores;
Actualizações periódicas;
Dados históricos e coerentes;
Poucas tabelas (mas muito grandes);
Tabelas não normalizadas (informação redundante).
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
DW - Características
A informação deve conter um selo temporal (o objectivo de um DW é fornecer informação sob uma perspectiva histórica);
A informação nunca é actualizada (os dados contidos no DW nunca são alterados, podendo apenas ser consultados);
O DW conserva os dados antigos e as novas alterações, com selos temporais diferentes que permitem assim diferenciar os mesmos;
Um data warehouse está por isso sempre cheio de informação histórica;
Nem todos os dados são suficientemente importantes para guardar, pelo que para a DW só deverá ser passada informação considerada importante;
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
28Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
DW - Características
Bases de Dados Operacionais Data Warehouses
Objectivos operacionais Registo histórico
Acessos de leitura/escrita Acessos só de leitura
Transacções pré-definidas Questões ad-hoc
Acesso a poucos registos de cada vez Acesso a muitos registos de cada vez
Dados actualizados em tempo real Carregamentos periódicos de mais dados
Estrutura optimizada para actualizações Estrutura optimizada para processamento de questões
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Arquitectura DW
Um DW é normalmente composto por:
Motor de Bases de Dados;
Ferramentas de ETL (Extraction, Transformation and Loading) para extrair informação de fontes dispersas e integrá-las na DW;
Ferramentas de BI (Business Intelligence) para analisar os dados;
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
29Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Arquitectura DW
Data WarehouseUtilização
ETL
Datamarts
Data Store
Dados dos sistemas
operacionais
Fontes externas
ETL&
Agregações
Reporting
Data Mining
Ad-hoc Queries
Metadata
Fontes de Dados Data Warehouse Exploração
ETL, Armazenamento,Modelação DimensionalAgregações, Metadata
Ferramentas ReportingData Mining, EIS
Balance Socorecard
Sistemas Operacionais (Facturação, etc)
Fontes de dados Externas
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Data WarehouseUtilização
ETL
Datamarts
Data Store
Dados dos sistemas
operacionais
Fontes externas
ETL&
Agregações
Data Data MiningMining
ReportingReporting
AdAd--hoc hoc QueriesQueries
Metadata
Arquitectura DW
Em muitas organizações já existem aplicações específicas para as operações do dia a dia, tendo estas as suas próprias bases de dados chamadas de “Bases de Dados de Sistemas Operacionais”;
Optimizadas para o trabalho específico que têm de realizar;
Periodicamente (com frequência horária, diária, semanal ou outra - dependendo da organização em causa), toda a informação contida nessas bases de dados é transferida para um Data Warehouse, onde essa informação vai ficar inalterada e disponível para exploração.
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
30Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Arquitectura DW
Fontes externas:
Fazer uma pesquisa por web farming;
Fazer uma pesquisa por web warehouse;
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Data WarehouseUtilização
ETL
Datamarts
Data Store
Dados dos sistemas
operacionais
Fontes externas
ETL&
Agregações
Data Data MiningMining
ReportingReporting
AdAd--hoc hoc QueriesQueries
Metadata
Arquitectura DW
Automatizam o processo de extracção e carregamento de dados
Manutenção de processos facilitada
Gestão de Metadata
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
31Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Arquitectura DW
Data WarehouseUtilização
ETL
Datamarts
Data Store
Dados dos sistemas
operacionais
Fontes externas
ETL&
Agregações
Data Data MiningMining
ReportingReporting
AdAd--hoc hoc QueriesQueries
Metadata
“Extraction Transformation and Loading” são os processos cujo objectivo é o de extrair os dados das diversas fontes (tipicamente sistemas operacionais) e efectuar todos os processos de transformação e normalização necessários
para poder carregar os dados na estrutura da ODS e do DW.
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Transformation
Limpar os dados, corrigir erros, lidar com dados inexistentes e aplicar formatos, normalizar conceitos
LoadingCarregamento de dados
Extraction
Processo associado à fonte de dados (Sistema Operacional, fonte externa ou outra). é o primeiro para incluir dados no ambiente do Data Warehouse.
Data WarehouseUtilização
ETL
Datamarts
Data Store
Dados dos sistemas
operacionais
Fontes externas
ETL&
Agregações
Data Data MiningMining
ReportingReporting
AdAd--hoc hoc QueriesQueries
Metadata
Arquitectura DW
Rejeitar campos vindos dos sistemas operacionais que não têm utilidade
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
32Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Ambiguidade de conceitos;
Necessidade de normalizar e integrar os dados;
Análise baseada em múltiplos data sets;
Dificuldades na transformação dos dados em informação:
� as aplicações não foram construídas pensando na integração de SAD;
� não existem suficientes dados históricos guardados;
Data WarehouseUtilização
ETL
Datamarts
Data Store
Dados dos sistemas
operacionais
Fontes externas
ETL&
Agregações
Data Data MiningMining
ReportingReporting
AdAd--hoc hoc QueriesQueries
Metadata
Problemas em ETL
Arquitectura DW
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Arquitectura DW
Data WarehouseUtilização
ETL
Datamarts
Data Store
Dados dos sistemas
operacionais
Fontes externas
ETL&
Agregações
Data Data MiningMining
ReportingReporting
AdAd--hoc hoc QueriesQueries
Metadata
Armazenamento de Dados, tipicamente em modelos relacionais (em RDBMS)
Tradução de multiplos formatos de dados para uma visão unificada
Data Store
A manutenção de um repositório centralizado de dados do negócio
O objectivo de Data Store é o de criar uma camada prévia ao DW, de modo a extrair (sem pesar nos sistemas operacionais) toda a informação necessária para alimentar o modelo de dados do DW após um processo de normalização dos dados provenientes de diversas fontes;
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
33Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Data WarehouseUtilização
ETL
Datamarts
Data Store
Dados dos sistemas
operacionais
Fontes externas
ETL&
Agregações
Data Data MiningMining
ReportingReporting
AdAd--hoc hoc QueriesQueries
Metadata
Assegurar a limpeza,integridade e coerência dainformação
Constituir uma staging area para Data Marts específicos, disponibilizando umafonte de informação única aos diversos Data Marts.
Arquitectura DW
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Data WarehouseUtilização
ETL
Datamarts
Data Store
Dados dos sistemas
operacionais
Fontes externas
ETL&
Agregações
Data Data MiningMining
ReportingReporting
AdAd--hoc hoc QueriesQueries
Metadata
Modelação (Multi)dimensional nos Data Marts (star schemas) – menor número de entidades
Data Marts
Os Data Marts disponibilizam as funcionalidades analíticas necessárias a cada domínio de informação (Marketing, Vendas, Financeiro, etc…)
Por defeito, as bases de dados normalizadas são excluídas desta fase, aquele deverá compreender obrigatoriamente uma estrutura dimensional
Um modelo dimensional contém a mesma informação que um modelo relacional, mas estruturado de forma a privilegiar a performance e a definição de queries.
Arquitectura DW
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
34Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Data WarehouseUtilização
ETL
Datamarts
Data Store
Dados dos sistemas
operacionais
Fontes externas
ETL&
Agregações
Data Data MiningMining
ReportingReporting
AdAd--hoc hoc QueriesQueries
Metadata
Todos os datamarts devem sem construídos com base em dimensões e em factos
A arquitectura é definida como star schemas (esquemas em estrela)
Arquitectura DW
A construção de um data mart visa responder às necessidades de um departamento ou de um domínio específico de informação
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Atributo Data Warehouse Data Mart
Tipo de modelo de dados Corporativo Departamental
Fontes de dados utilizadas Muitas Poucas
Domínios de informação Muitos Um
Esforço inicial Elevado Baixo
Próximo nível de migração Data Mart Data Warehouse
Competências necessárias Maiores Menores
Arquitectura DW
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
35Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Data WarehouseUtilização
ETL
Datamarts
Data Store
Dados dos sistemas
operacionais
Fontes externas
ETL&
Agregações
Data Data MiningMining
ReportingReporting
AdAd--hoc hoc QueriesQueries
Metadata22
/06/
00
21/0
6/00
20/0
6/00
19/0
6/00
18/0
6/00
17/0
6/00
16/0
6/00
15/0
6/00
14/0
6/00
13/0
6/00
12/0
6/00
11/0
6/00
10/0
6/00
09/0
6/00
08/0
6/00
07/0
6/00
600
500
400
300
200
100
0
Contract Gross Activations Contract Net Activations
07/Jun/2000Data From:
Activations Control Report
Reporting
Arquitectura DW
Auxiliam na tomada de decisões estratégicas;
Maior produtividade dos gestores (a tecnologia fornece informação de gestão, indicadores, etc…);
Acompanhamento da evolução do negócio;
Flexibilidade (permite que os gestores fiquem menos dependentes dosinformáticos);
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Ferramenta que disponibiliza à gestão das organizações, o acesso aos indicadores mais relevantes (fornecimento de Indicadores Macro para Gestores da empresa (n.º clientes activos, KPIs))
Executive Information System
Descobrir padrões que permitam obter vantagens no negócio (procurar e reter os clientes mais rentáveis; segmentação de mercados; prever o futuro e identificar os factores para produzir o efeito desejado)
Data Mining
Data WarehouseUtilização
ETL
Datamarts
Data Store
Dados dos sistemas
operacionais
Fontes externas
ETL&
Agregações
Data Data MiningMining
ReportingReporting
AdAd--hoc hoc QueriesQueries
Metadata
Arquitectura DW
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
36Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Data WarehouseUtilização
ETL
Datamarts
Data Store
Dados dos sistemas
operacionais
Fontes externas
ETL&
Agregações
Data Data MiningMining
ReportingReporting
AdAd--hoc hoc QueriesQueries
Metadata
Metadata
Dados que descrevem dados
Dois tipos de metadata:
Arquitectura DW
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Data WarehouseUtilização
ETL
Datamarts
Data Store
Dados dos sistemas
operacionais
Fontes externas
ETL&
Agregações
Data Data MiningMining
ReportingReporting
AdAd--hoc hoc QueriesQueries
Metadata
Arquitectura DW
Informação do carregamento (ex: frequência, dependências, estado, data/hora, último carregamento)
Regras de negócio;
O nome do programa que realizou o carregamento;
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
37Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Data WarehouseUtilização
ETL
Datamarts
Data Store
Dados dos sistemas
operacionais
Fontes externas
ETL&
Agregações
Data Data MiningMining
ReportingReporting
AdAd--hoc hoc QueriesQueries
Metadata
Arquitectura DW
descrição de cada objecto e campo mantido no DW
Regras de dados para calcular dados
Conversão entre formatos (ex: datas)
Nome do sistema de onde vieram os dados
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
DW
Operacional DW Data Mart
C Bonifácio
Rua Principal
Crédito - AA
C Bonifácio
1986 - 1987
Rua A
Crédito - B
C Bonifácio
1987 - pres
Rua Principal
Crédito - AA
Janeiro - 4101
Fevereiro - 4201
Março - 4167
Abril – 4125
….
….
Data Mining
Utilizadores no
período 1982 – 1983
Com saldo inferior
a 1000€
Qual é o tipo de crédito do C Bonifácio?
Qual é o percurso histórico do C Bonifácio em termos
de créditos?
Estamos a atrair mais ou menos clientes?
Quais são os clientes a quem não se deve conceder crédito?
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
38Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Integração dos Dados
Operacional DW
C Bonifácio
Masculino
casado
20/06/1977
Dados Pessoais
1 acidenteDados relativos ao automóvel
Rua Principal
Tomar
Dados relativos à habitação
DiabetesDados relativos à saúde
C Bonifácio
Masculino
casado
20/06/1977
1 acidente
Rua Principal
Tomar
Diabetes
Cliente
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Os modelos OLAP por oposição aos modelos OLTP têm muito menos entidades, o tipo de cruzamentos são simplificados e as preocupações com a redundância de dados é menor:
OLTP vs OLAP (Operacional vs Analítico)
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
39Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
OLTP vs OLAP (Operacional vs Analítico)
Introduzem novos clientes, registam as queixas, registam as compras, etc…Os utilizadores de um sistema operacional lidam maioritariamente com um registo de cada vez, repetindo a mesma tarefa infinitas vezes.
Utilizadores de um sistema operacional
Contabilizam as compras e comparam-nas com as da semana anterior, questionando-se acerca da evolução, da razão das queixas, etc…Os utilizadores de um sistema analítico, raramente trabalham com uma linha de cada vez. As suas questões exigem que centenas de linhas sejam pesquisas e compactadas numa resposta. Para complicar ainda mais as coisas, os utilizadores alteram constantemente o tipo de questões que colocam.
Utilizadores de um sistema analítico
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
OLTP OLAP
Detalhado Sumarizada
Precisa no momento do acesso Representa evolução (snapshots) ao longo do tempo
Utilizado por operacionais de negócio Utilizado por gestores de negócio
Modelos complexos com muitas tabelas Modelos com menos tabelas (star schema)
Desempenho é crítico e constante Conceito de desempenho variável
Não há lugar à redundância Redundância de informação
Suporta as operações do dia a dia (transacções)
Suporta as necessidades de gestão (análise)
Pequena quantidade de dados processada muitas vezes
Grande quantidade de dados processada poucas vezes
OLTP vs OLAP (Operacional vs Analítico)
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
40Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
OLTP vs OLAP (Operacional vs Analítico)
OLTP OLAP
Gerido como um todo Gerido por áreas
Dados podem ser actualizados Dados não podem ser actualizados
Obrigatoriamente disponível Disponibilidade variável
Grande probabilidade de acesso Pouca probabilidade de acesso
OLTP OLAP
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Muitos utilizadores;
Transacções fixas e programadas;
Transacções muito eficientes com tempos de execução na ordem dos segundos. Milhares de operações por segundo;
Sistemas críticos para o negócio que suportam o dia a dia dos negócios
Repetição de operações (insert; update; remove);
pontos de venda nas lojas
ATMs
Comércio electrónico
OLTP
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
41Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Apenas algumas queries por dia quando comparado com os sistemas OLTP;
É difícil prever as queries que os utilizadores pretendem e em geral elas são mais diversas que nos sistemas OLTP;
Sistemas que disponibilizam aos utilizadores as ferramentas necessárias à análise dos diferentes aspectos da organização
Qual a facturação de um determinado produto numa determinada região? Qual a evolução do mercado desde a sua introdução?
Leitura e processamento dos dados, mas a escrita não é permitida;
Quais são os 10 produtos mais vendidos numa determinada região? E a nível nacional?
OLAP
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Operações OLAP
Agregação de dados;
Filtro, Ordenação e Ranking;
Filtro, Ordenação e Ranking;
Análise e procura de padrões;
Análise de tendência de dados;
O DW mantém os dados;
O OLAP transforma os dados em informação estratégica
Operações OLAP:
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
42Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Modelação Dimensional
Os modelos de dados de num data warehouse são modelos dimensionais ou star schemas. Enquanto que um esquema relacional é concebido para ser eficiente ao armazenamento dos dados provenientes das transacções, evitando a redundância, o esquema em estrela está estruturado de forma a facilitar as consultas.
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Modelação Dimensional
Os sistemas são construídos com base em 3 eixos com dependências directas entre si:
FACTOS
PERÍODOS TEMPORAIS
DIMENSÃO/ HIERARQUIAS
INDICADOR
Os factos / indicadores contêm informação quantitativa (indicadores), e podem ser analisados por diversos tipos de dimensão, sendo que estes cruzamentos deverão estar assignados sempre a um período de referência
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
43Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Modelação Dimensional
Dois tipos de componentes:
Tabela de factos: tabela central com muita informação;
Dimensões: tabelas mais pequenas utilizadas para analisar factos a partir de uma determinada perspectiva
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Modelação Dimensional
é constituída por dados mensuráveis (variáveis numéricas) e um conjunto de chaves estrangeiras que relacionam a tabela de factos com as diversas dimensões que lhe estão associadas;
A tabela de factos:
As variáveis são orientadas por uma ou várias dimensões, constituindo uma estrutura matricial que pode ser analisada por tantos ângulos quantos os permitidos pelo cruzamento das dimensões
Apresenta-se normalizada;
Contém uma grande quantidade de registos, ocupando normalmente mais de 95% do espaço ocupado pelo DW;
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
44Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Chave composta;
Tempo faz parte da chave;
Modelação Dimensional
Tipicamente numérico;
Das tabelas de factos extraem-se os indicadores (métricas)
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Modelação Dimensional
Contêm poucos registos quando comparadas com a tabela de factos, apesar de integrarem muitos atributos;
As tabelas de dimensão fornecem as perspectivas sobre os quais os factos poderão ser analisados (ex: tempo, cliente, produto, etc…).
As tabelas de dimensões:
As tabelas de dimensões são normalmente tabelas não normalizadas, podendo ter embebidas uma ou mais hierarquias, isto é, árvores de agregação construídas sobre os elementos das dimensões com o objectivo de apresentar totais intermédios e globais;
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
45Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Modelação Dimensional
Chave única;
As chaves das dimensões devem ser artificiais (inteiros sequenciais). A ideia é desacoplar as chaves dos OLTPs das chaves do DW
Razões:
As chaves naturais podem ser invalidadas no futuro;
Integrar fontes diversas com sistemas inconsistentes de chaves naturais;
É possível usar chaves artificiais que não teriam significado no OLTP, como por exemplo: “Não Aplicável”
É necessário manter na área de staging tabelas de referências cruzadas entre as chaves do DW e a das fontes, para um adequado carregamento;
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Cada registo tem uma descrição única;
Os atributos mais interessantes são as descrições textuais existentes nas dimensões de análise da actividade
Modelação Dimensional
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
46Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Caso prático:
Modelação Dimensional
Uma empresa tem o seu negócio baseado na venda de produtos em três zonas distintas do país (Norte, Centro e Sul);
As vendas são feitas através de uma força de vendas directas;
A administração necessita de um sistema de informação que lhe permita analisar a evolução do volume de vendas (quantidade e montantes) ao longo do tempo, por vendedor, produto e área geográfica.
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Dimensões de análise:
Modelação Dimensional
Tempo;
Área geográfica;
Vendedor;
Produto;
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
47Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Indicadores:
Montante;
Quantidades;
Modelação Dimensional
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Modelação Dimensional
Modelo final:
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
48Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Modelação Dimensional
Factura
numFactura
data
codPostal
codCliente
Total
Linha Encomenda
numFactura
codProduto
Qtd
Preço
Produto
codProduto
nomeProduto
codtipoProduto
Tipo Produto
codTipoProduto
nomeTipoProdu
Periodo
Data
Mês
Trimestre
Ano
Cliente
codCliente
nomeCliente
codConcelho
codTipoClienteTipo Cliente
codTipoCliente
TipoCliente
Localidade
codPostal
nomeLocalidade
codConcelho
Concelho
codConcelho
nomeConcelho
codDistrito
Distrito
codDistrito
nomeDistrito
Modelo OLTP (Modelo Relacional):
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
As entidades OLTP podem classificar-se numa das seguintes categorias:
Entidades de Transacção;
Modelação Dimensional
Regista detalhes que ocorrem num determinado período de tempo;
Contém medidas ou quantidades que podem ser sumarizadas (preços, volumes, quantidades, etc….);
São a base das tabelas de factos;
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
49Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Entidades de Componentes;
Directamente relacionada a uma entidade de transacção através de uma relação 1 – N;
Estas entidades definem os detalhes dos componentes para cada transacção, respondendo às perguntas de “quem”, “o quê”, “quando”, “onde”, “como” e “porque”;
Cliente: quem fez a compra;
Produto: o que foi vendido;
Localização: onde foi vendido;
Período: quando foi vendido;
Modelação Dimensional
Componente que é a base das tabelas de dimensão
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Entidades de Classificação;
Entidades que estão relacionadas a entidades de componentes através de uma relação 1 – N;
Modelação Dimensional
Estão funcionalmente dependentes de uma entidade de componentes;
Entidades de classificação representam hierarquias, as quais podem ser integradas nas entidades de componentes para formar tabelas de dimensão no contexto do esquema em estrela;
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
50Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Classificação das entidades:
Modelação Dimensional
Factura
numFactura
data
codPostal
codCliente
Total
Linha Factura
numFactura
codProduto
Qtd
Preço
Produto
codProduto
nomeProduto
codtipoProduto
Tipo Produto
codTipoProduto
nomeTipoProdu
Periodo
Data
Mês
Trimestre
Ano
Cliente
codCliente
nomeCliente
codConcelho
codTipoClienteTipo Cliente
codTipoCliente
TipoCliente
Localidade
codPostal
nomeLocalidade
codConcelho
Concelho
codConcelho
nomeConcelho
codDistrito
Distrito
codDistrito
nomeDistrito
Transacção
Componentes
Classificação
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Modelo OLAP (Modelo Multidimensional):
Modelação Dimensional
Factura
data
codPostal
codCliente
codProduto
SumQtd
SumItemPreço
Periodo
Data
Mês
Trimestre
Ano
Localidade
codPostal
nomeLocalidade
codConcelho
nomeConcelho
codDistrito
nomeDistrito
Produto
codProduto
nomeProduto
codtipoProduto
nomeTipoProdu
Cliente
codCliente
nomeCliente
codTipoCliente
TipoCliente
CodConcelho
nomeConcelho
codDistrito
nomeDistrito
Valores numéricos agregados
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
51Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Modelação Dimensional
Hierarquias:
Uma hierarquia é uma sequência de entidades associadas através de um conjunto de relações 1 – N;
Factura
numFactura
data
codPostal
codCliente
Total
Linha Factura
numFactura
codProduto
Qtd
Preço
Localidade
codPostal
nomeLocalidade
codConcelho
Concelho
codConcelho
nomeConcelho
codDistrito
Distrito
codDistrito
nomeDistrito
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Modelação Dimensional
Factura
numFactura
data
codPostal
codCliente
Total
Linha Factura
numFactura
codProduto
Qtd
Preço
Localidade
codPostal
nomeLocalidade
codConcelho
Concelho
codConcelho
nomeConcelho
codDistrito
nomeDistrito
Distrito
codDistrito
nomeDistrito
Roll Up
Factura
numFactura
data
codPostal
codCliente
Total
Linha Factura
numFactura
codProduto
Qtd
Preço
Localidade
codPostal
nomeLocalidade
codConcelho
nomeConcelho
codDistrito
nomeDistrito
Concelho
codConcelho
nomeConcelho
codDistrito
nomeDistrito
Roll Up
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
52Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Modelação Dimensional
Esquema em floco de neve:
Um esquema em floco de neve (snowflake schema) é um esquema em estrela cujas dimensões estão completamente normalizadas
Um esquema em floco de neve acaba por apresentar uma estrutura mais complexa;
A maior desvantagem está associada à perda de desempenho no processamento das interrogações devido à normalização das dimensões;
O esquema evita que a informação redundante seja armazenada, uma vez que as dimensões estão devidamente normalizadas;
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Modelação Dimensional
Dimensão 1
Dimensão 3
Dimensão 4Dimensão 2Sub - Dimensão 2 Tabela de Factos Sub - Dimensão 4
Esquema em floco de neve:
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
53Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Modelação Dimensional
Vendas
Id_data
Id_endereço
Id_produto
Id_cliente
Total_venda
Un_vendidas
Tempo
Id_data
dia
mês
trimestre
ano
Produto
Id_produto
nome
Id_fornecedor
Fornecedor
Id_fornecedor
nome
Endereço
Id_endereço
rua
codPostal
Cidade
codPostal
localidade
Cliente
Id_cliente
nome
Contribuinte
Id_actividade
Actividade
Id_actividade
designação
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Dim
ensã
o 1
Dimensão 2
Modelação Dimensional
Modelo de dados de um cubo multidimensional que permite aos utilizadores a análise da informação de diferentes perspectivas
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
54Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
1.º Trimestre 2645
2125
2435
2345
2325
1989
2012
2188
2439
2024
2223
2339
2434
2122
2234
2312
1645
1125
1435
1345
2.º Trimestre
3.º Trimestre
4.º Trimestre
Tomar
CovilhãSantarém
720 650 713 625
435
950
525700
657
744
413874
625
625
395
CD
Tint
eiro
DV
D
Web
Cam
Dis
co
Tem
po
Produto
Modelação Dimensional
Dimensões:
Tempo;
Produto;
Localização
Indicadores:
Quantidade vendida
395 Discos vendidos em Tomar no 1.º Trimestre
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Modelação Dimensional
Drill - Down;
Permite navegar de dados generalizados para dados mais detalhados. O objectivo é fornecer uma visão mais detalhada dos dados que estão a ser analisados;
912
703
1030
844
756
525
898
734
803
856
718
771
799
657
869
674
642
673
704
621
687
731
689
768
854
712
873
623
689
712
754
646
823
827
689
823
825
695
914
735
612
775
785
595
854
812
634
866
288
205
419
239
185
375
263
201
390
245
193
387
Janeiro
Fevereiro
Março
Abril
Maio
Junho
Julho
Agosto
Setembro
Outubro
Novembro
Dezembro
Covilhã
Santarém
Tomar
Tem
po
Produto
999
600
46
800
900
60
39
200
125
600
400
435
500
500
345
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
55Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Roll - Up;
Representa a operação oposta ao drill-down. Permite agregar os dados visualizados no cubo utilizando uma hierarquia. Cada repetição da análise ocorrerá a um nível mais elevado de agregação
Modelação Dimensional
2645
2125
2435
2345
2325
1989
2012
2188
2439
2024
2223
2339
2434
2122
2234
2312
1645
1125
1435
1345
1385
720 650 713 625 625
1225 1401 1287 1020
CD
Tint
eiro
DV
D
Web
cam
Dis
co
1.º Trimestre
2.º Trimestre
3.º Trimestre
4.º Trimestre
Castelo Branco
Santarém
Tem
po
Produto
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Slice;
O corte (slice) permite seleccionar um subconjunto de dados do cubo, sendo uma das dimensões do cubo limitada aos dados que obedecem a uma determinada condição
Modelação Dimensional
Tempo = 1.º Trimestre
Lo
caliz
ação
Covilhã
Santarém
Tomar 950
435
720
700
525
650
744
657
713
874
413
625
395
625
625
Produto
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
56Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Dice;
Modelação Dimensional
A redução (dice) permite definir um sub-cubo para o qual podem ser especificados critérios de selecção para duas ou mais dimensões;
(Distrito = Santarém) E
(Tempo = 1.º Trimestre) ou (Tempo = 2.º Trimestre) E
(Produto = CD) ou (Produto = DVD)
1385 1401
1385 1401
1092 1213
1.º Trimestre
2.º Trimestre
CD
DV
DSantarém
Produto
Tem
po
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Considere-se o seguinte modelo em estrela:
Valores (por marca) para o 1.º semestre registados em todas as lojas:
Modelação Dimensional
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
57Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Drill Down:
Modelação Dimensional
Desagregação é apenas juntar mais cabeçalhos de linha das tabelas de dimensões (criando mais uma coluna que é um atributo de uma tabela dimensão)
Agregação é apenas retirar cabeçalhos da linha;
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Modelação Dimensional
Uma empresa grossista tem:
100 grandes superfícies de vendas (supermercado), espalhadas geograficamente por 3 distritos;
Departamentos em cada superfície de vendas:
Mercerias;
Carne;
Artigos de limpeza e higiene;
Padaria;
Aproximadamente 60000 produtos individuais nas prateleiras (unidades de stock armazenáveis – USA)
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
58Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Caixas (POS – Point of Sale);
Pontos de entrada de informação no sistema operacional:
Modelação Dimensional
Através dos códigos de barra ou entrada manual para códigos desconhecidos;
Pontos de entrega de fornecedores;
Apenas uma fracção dos armazéns regista as entregas em tempo real;
Departamento de fornecedores e contas a pagar;
O completo conhecimento do material que entrou no supermercado só é possível às vezes, por via dos pagamentos efectuados e inspecção directa;
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Maximizar o lucro em cada supermercado:
Objectivos:
Cobrar o máximo possível em cada produto;
Baixar os custos de aquisição dos produtos;
Atrair o máximo número de clientes;
Preços;
Decisões mais significativas a tomar:
Promoções (reduções temporárias de preços)
Baixas de preços servem para atrair clientes mas a venda é feita com prejuízo e a promoção pode baixar as vendas de outros produtos similares;
Modelação Dimensional
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
59Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Modelação Dimensional
Analisar as compras dos clientes com base na informação recolhida nas caixas registadoras;
Granularidade dos dados:
Analisar que produtos são vendidos, em que lojas, em que dias e qual o efeito das promoções;
Como pretendemos analisar o efeito das promoções e efectuar análises de associação de produtos comprados, é necessário considerar a granularidade mais baixa:
Linha de factura, i.e, quantas unidades são vendidas e a que preço em cada venda;
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
A granularidade escolhida é chave para determinar os factos disponíveis. Numa linha de factura temos:
Qtd: quantidade vendida em termos de unidades;
Valor unitário;
Valor total do item: Qtd * Valor unitário;
Custo dos produtos vendidos. Em alguns sistemas de caixas é possível saber qual foi o preço a que aloja comprou o produto e portanto qual o custo (interno) dos produtos vendidos na transacção;
Modelação Dimensional
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
60Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Modelação Dimensional
Factos aditivos:
Unidades vendidas do produto em questão (soma de todas as Qtd vendidas do produto);
Valor das vendas do produto em questão (soma de todos os valores totais dos itens, apurado através de Qtd * valor unitário);
Custo do produto em questão;
Factos calculados e aditivos. Guardam-se ou calculam-se?
Lucro = valor vendas – custo;
Factos calculados não aditivos. Calculam-se no fim.
Margem de lucro = lucro/valor de venda
Aggregar(Margem de lucro) = soma(lucro)/soma(valor de venda)
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Escolha das dimensões:
Modelação Dimensional
Uma linha de factura corresponde a uma venda de um produto realizada numa data, numa loja;
Encontrar outras dimensões que podem ser associadas:
Muitas vezes o produto é vendido ao abrigo de uma promoção;
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
61Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Dimensão Data:
Modelação Dimensional
Qual a razão pela qual não se usa um atributo data directamente na tabela de factos?
Porque o tamanho gasto para a representação da data (8 bytes) é maior do que o gasto para um inteiro (4 bytes);
Porque queremos incluir atributos relativos ao tempo;
Atributos da dimensão Data:
codData (inteiro);
DiaSemana (Segunda, Terça,….,Domingo);
DiaMês (1,…,31)
Dia da Semana / Mês
Ambos permitem comparar
as compras entre diferentes
dias da semana ou do mês
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Atributos da dimensão Data:
feriadoFlag, diaSemanaFlag, ultimoDiaMesFlag (inteiro);
Época (Natal, Páscoa, etc…);
Evento (Jogo Liga dos Campeões, etc…)
Permite a comparação entre
dias especiais
Modelação Dimensional
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
62Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Atributos da Dimensão Produto:
codProduto
TamanhoEmbalagem
Marca
subCategoria
Categoria
Marca
Modelação Dimensional
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Modelação Dimensional
Atributos da Dimensão Loja:
codLoja
morada
codPostal
localidade
freguesia
concelho
distrito;
numEmpregados;
dimensãoDaLoja;
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
63Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Dimensão Promoção:
Reduções temporárias de preço;
Coupons de desconto;
Campanhas publicitárias;
Modelação Dimensional
Descreve as condições sobre as quais decorreu uma promoção de um produto
Painéis;
Sem promoção;
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Modelação Dimensional
Na dimensão Produção os gestores estão interessados em saber:
Os produtos em promoção aumentaram as vendas durante a promoção?
Depois da promoção houve uma baixa nas vendas que anulou os ganhos?
Outros produtos similares ao produto em promoção, sofreram uma quebra nas vendas?
Os produtos em promoção tiveram um aumento das vendas tendo o período anterior e posterior à promoção?
A promoção foi rentável considerando os custos directos da promoção?
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
64Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Modelação Dimensional
Promoção
codPromoção
nomePromoção
Cobertura Promoção
codPromoção
codProduto
codLoja
codData
Factless Table
Tabelas de factos, sem
factos. Servem para
contagem de eventos
Sempre que um produto é vendido é registado na tabela corberturaPromoção um registo do produto, com
referência à promoção, dia e loja;
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Podem ainda ser consideradas outras dimensionais adicionais:
Cartão Cliente
Modelação Dimensional
Deve existir um registo com uma chave para os que aderiram e outra para os que não aderiram;
Controlo e análise dos operadores de caixas
Juntar uma dimensão Tempo do Dia e Operador de Caixa.
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
65Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Vendas
CodLoja
codProduto
CodTempoDia
CodCliente
CodPromoção
CodOperador
CodData
UnidadesVendidas
ValorVendas
Custo
LucroTempo
codData
atributos
Produto
codProduto
atributos
Loja
codLoja
atributos
Promoção
codPromoção
atributos
CartãoCliente
codCliente
atributos
Operador
codOperador
atributos
TempoDia
codTempoDia
atributos
Cobertura Promoção
codPromoção
codProduto
codLoja
codData
Modelação Dimensional
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
SQL Server Business Intelligence Development Studio
Ricardo Campos ([email protected])
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
66Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
O SQL Server, é um sistema completo de business intelligence, que oferece asfuncionalidades, as ferramentas, e a capacidade para criar aplicações de análisequer clássicas, quer inovadoras.
Report;
Análise, armazenamento e pesquisa dos dados;
Integração e transformação dos dados;
SQL Server BI Development Studio
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
O acesso ao SQL Server Business Intelligence Development Studio é feitoatravés do menu Start – Programs – Microsoft Sql Server 2005;
SQL Server BI Development Studio
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
67Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
SQL Server BI Development Studio
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Criar um package ETL
Criar um package ETL�
Adicionar e configurar uma conexão para um ficheiro;
Criar um novo projecto de integração
Adicionar e configurar uma conexão OLE DB;
Adicionar e configurar o flat file source;
Adicionar e configurar uma transformação lookup
Adicionar e configurar um destino OLE DB
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
68Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Criar um novo projecto de integração�
Criar um package ETL
File � New Project
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Criar um package ETL
Por defeito é criada esta página
No Solution Explorer altere o nome de Package.dtsx para Lesson 1.dtsx
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
69Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Adicionar e configurar uma conexão para um ficheiro;�
Criar um package ETL
Uma conexão para um flat file permite extrair dados de um ficheiro
No ecrã que aparece Seleccionar Flat File
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Criar um package ETL
Seleccione o ficheiro SampleCurrencyData.txt na directoria c:\Program Files\Microsoft SQL Server\90\Samples\Integration Services\Tutorial\Creating a Simple ETL Package\Sample Data folder
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
70Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Criar um package ETL
Carregue em Advanced. Defina os seguintes nomes. Coluna1 (Average Rate); Coluna 2 (CurrencyId), Coluna 3 (CurrencyDate); Coluna 4 (EndOfDayRate)
Integration Services sugere automaticamente tipos de dados (baseado nas 100 primeiras linhas do ficheiro)
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Criar um package ETL
Carregue em Advanced. Defina os seguintes nomes. Coluna1 (Average Rate); Coluna 2 (CurrencyId), Coluna 3 (CurrencyDate); Coluna 4 (EndOfDayRate)
Coluna Flat File Tipo Sugerido Coluna de Destino Tipo de Destino
Average Rate Float [DT_R4] FactCurrencyRate.AverageRate Float
CurrencyID String [DT_STR] DimCurrency,CurrencyAlternateKey nchar(3)
CurrencyDate Date [DT_DATE] DimTime.FullDateAlternateKey datetime
EndOfDayRate Float [DT_R4] FactCurrencyRate.EndOfDayRate Float
Os tipos de dados CurrencyID e CurrencyDate não são compatíveis com os tipos de dados das colunas de destino (as quais serão definidas mais tarde)
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
71Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Criar um package ETL
Uma vez que DimCurrency,CurrencyAlternateKey é nchar(3), CurrencyID precisa ser alterada de String [DT_STR] para [DR_WSTR]
Uma vez que DimTime.FullDateAlternateKey é datetime, CurrencyDate precisa ser alterada de [DT_DATE] para [DT_DBTIMESTAMP]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Criar um package ETL
Adicionar e configurar uma conexão OLE DB;�
Criaremos uma conexão OLE DB que usa o Windows Authentication para se conectar uma instância da base de dados AdventureWorksDW
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
72Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Criar um package ETL
Clique em New
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Criar um package ETL
Defina as propriedades de conexão à AdventureWorksDW
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
73Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Criar um package ETL
Adicionar uma tarefa Data Flow�
Depois de termos criado as conexões para a source e para o destino a próxima tarefa é adicionar um Data Flow. O Data Flow permite transformar, limpar e modificar os dados que são movidos da origem para o destino. Uma tarefa data flow é onde a maior parte do trabalho ETL é feita
Arraste para a área de desenho a Data Flow Task
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Criar um package ETL
Adicionar e configurar o Flat File Source�
Um Flat File source é um componente data flow que usa a metadata definida pela conexão Flat File para especificar o formato e a estrutura dos dados a serem extraídos do flat file por um processo.
Abra o data flow designer, clicando duas vezes em
Ou
Arraste para a área de desenho um Flat File Source
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
74Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Criar um package ETL
Carregue agora duas vezes em:
Clique em colunas e verifique que os nomes das colunas se encontram correctas:
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Adicionar e configurar uma transformação Lookup�
Criar um package ETL
Definir as transformações lookup necessárias à obtenção dos valores para CurrencyKey e TimeKey
Definiremos uma transformação lookup para a coluna CurrencyKey da tabela DimCurrency baseado na coluna CurrencyID do flat file;
Definiremos uma transformação lookup para a coluna TimeKey da tabela DimTime baseado na coluna CurrencyDate do flat file;
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
75Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Arraste para a área de desenho um Lookup e altere o seu nome para Lookup Currency Key
Criar um package ETL
Clique no File Flat Source “Extract Sample Currency Data” e arraste a seta verde para a transformação lookup para ligar os dois componentes;
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Criar um package ETL
Carregue agora duas vezes em:
Certifique-se que a conexão definida diz respeito à AdventureWorksDW
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
76Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Criar um package ETL
Seleccione a tab Columns e arraste CurrencyID para CurrencyAlternateKey. Seleccione CurrencyKey
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Criar um package ETL
Arraste para a área de desenho um Lookup e altere o seu nome para Lookup Data Key
Clique na transformação “Lookup Currency Key” e arraste a seta verde para a transformação “Lookup Data Key” para ligar os dois componentes;
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
77Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Criar um package ETL
Carregue agora duas vezes em:
Certifique-se que a conexão definida diz respeito à AdventureWorksDW
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Criar um package ETL
Seleccione a tab Columns e arraste CurrencyDate para FullDateAlternateKey. Seleccione TimeKey
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
78Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Adicionar e configurar um destino OLE DB�
O sistema pode agora extrair dados do flat file source e transformá-los num formato compatível aceite no destino. O próximo passo é carregar no destino os dados transformados. Para isso adicione-se um OLE DB Destination;
Criar um package ETL
Arraste para a área de desenho um OLE DB Destination e altere o seu nome para Sample OLE DB Destination
Clique na transformação “Lookup Date Key” e arraste a seta verde para o “OLE DB Destination” para ligar os dois componentes;
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Carregue agora duas vezes em:
Criar um package ETL
Certifique-se que a conexão definida diz respeito à AdventureWorksDW
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
79Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Carregue em Mapprings e certifique-se que as colunas estão mapeadas correctamente nas colunas de destino
Criar um package ETL
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Para fazer o carregamento, basta ir ao menu Debug � Start Debugging e o sistema coloca na FactCurrency table da base de dados AdventureWorksDW 1097 linhas
Criar um package ETL
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
80Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Definir um Data Source
Definir um Data Source�
Definir um Data Source View
Definir a base de dados Adventure Work DW como Data Source;
Criar um Analysis Service Project;
Modificar os nomes das tabelas
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Definir um Data Source
Criar um Analysis Service Project;�
Feche a Start Page
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
81Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Definir um Data Source
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Definir um Data Source
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
82Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Definir um Data Source
Definir um Data Source�
Vamos considerar uma empresa fictícia, a Adventure Works Cycles que comercializa bicicletas de todo o terreno;
A empresa produz e vende bicicletas para o América do Norte, Europa e Ásia. A sua base de operações situa-se em Bothell (Washinghton) onde trabaham 290 colaboradores;
Em 2000, a Adventure Works Cycles comprou uma pequena empresa (Importadores Neptuno) no México que produzia subcomponentes para a linha de produção da Adventure Works. Em 2001, a Importadores Neptuno, tornou-sea principal produtora e distribuidora de bicicletas do grupo.
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
A empresa pretende expandir o seu mercado, oferecendo descontos aos melhores clientes, reduzir os custos de produção e abrir um novo canal de vendas através do desenvolvimento de um web site;
A empresa tem dois tipos de clientes:
Individuais;
Lojas;
Definir um Data Source
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
83Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Existem duas bases de dados que acompanham o SQL Server:
Adventure Works (base de dados OLTP);
Adventure WorksDW (base de dados Data Warehouse)
Definir um Data Source
Nos passos seguintes vamos definir a AdventureWorksDW como a base de dados do nosso projecto;
Carregue em Next;
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Clique em New
Definir um Data Source
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
84Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Defina as propriedades de conexão à AdventureWorksDW
Definir um Data Source
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Definir as propriedades de acesso:
Definir um Data Source
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
85Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Última janela do assistente:
Definir um Data Source
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Adventure Works Dw
Definir um Data Source
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
86Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Definir um Data Source View�
Depois de definirmos as data sources que alimentam o nosso projecto é importante definir uma data source view para a criação do Data Mart;
Clique em Next. Clique novamente em Next;
Nos passos seguintes vamos definir uma data source view que inclui 5 tabelas da data source AdventureWorksDW
Definir um Data Source
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Definir um Data Source
Neste passo é possível seleccionar tabelas e views pertencentes à Data Source:
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
87Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Definir um Data Source
Seleccione as seguintes tabelas:
DimCustomer;
DimGeography;
DimProduct;
DimTime;
FactInternetSales;
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Definir um Data Source
O Designer contém os seguintes elementos:
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
88Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Na parte centrar é possível carregar no zoom para as tabelas no diagrama a 50%
Definir um Data Source
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Modificar os nomes das tabelas�
É possível alterar o nome das tabelas para nomes para amigáveis. Nos passos seguintes vamos remover os prefixos dim e fact das tabelas:
Definir um Data Source
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
89Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Definir um Data Source
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Definir e Desenvolver um Cubo
Definir e Desenvolver um Cubo�
Desenvolver um projecto Analysis Service;
Rever o cubo e as propriedades da dimensão;
Definir um cubo;
Navegar no Cubo;
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
90Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Definir um cubo�
Definir e Desenvolver um Cubo
No SQL Server é fácil definir um cubo através da definição de medidas e dimensões (baseado nas tabelas de factos e dimensões). Quando se define um cubo baseado numa data source, o assistente conecta à respectiva base de dados;
Nos passos seguintes utilizaremos o assistente de cubos para construir um cubo baseado na AdventureWorksDW. Utilizaremos a opção Auto Build para criar automaticamente atributos e definir hierarquias. Designaremos também uma dimensão Tempo;
Clique em Next.
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Definir e Desenvolver um Cubo
Certifique-se que a opção Auto Build se encontra seleccionada:
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
91Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Definir e Desenvolver um Cubo
Verifique que a AdventureWorksDW se encontra seleccionada:
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Definir e Desenvolver um Cubo
O sistema analisa as relações entre as tabelas para identificar tabelas de factos e dimensões.
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
92Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
O assistente identifica quatro tabelas de dimensões e uma tabela de factos. Cada tabela de dimensão encontra-se ligada à tabela de factos através de uma chave (Start Schema):
Definir e Desenvolver um Cubo
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Seleccione Time e clique Next:
Definir e Desenvolver um Cubo
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
93Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Associe propriedades de tempo às colunas e clique em Next:
Definir e Desenvolver um Cubo
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
O Assistente selecciona como medida todos os valores numéricos da tabela de factos que não estão ligados às dimensões. Vamos retirar as seguintes medidas:
Definir e Desenvolver um Cubo
Promotion Key;
Currency Key;
Sales Key;
Revision Number;
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
94Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Uma vez seleccionado o Auto Build o sistema procurar por hierarquias (relações 1 – N, por exemplo entre cidade e distrito) nas dimensões:
Definir e Desenvolver um Cubo
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Reveja a estrutura e expanda a dimensão Produto, desmarcando a opção de Large Photo que não é útil neste projecto:
Definir e Desenvolver um Cubo
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
95Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Altere o nome do cubo para Analysis Services Tutorial:
Definir e Desenvolver um Cubo
Aparecem 3 dimensões relativas ao tempo (Due Date, Order Date e Ship Date), uma que (recordando) existem 3 relações entre a tabela tempo e a tabela de factos.
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
O Data Source View fica acessível noutra janela:
Definir e Desenvolver um Cubo
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
96Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Rever o cubo e as propriedades da dimensão;�
Definir e Desenvolver um Cubo
Nos próximos passos vamos rever a estrutura do cubo para entender as propriedades das dimensões do cubo. No Designer do Cubo podemos ver e editar as propriedades do cubo:
Modificar a estrutura do cubo;
Definir as relações entre as dimensões e os grupos de medidas e a granularidade de cada dimensão dentro do grupo de medidas;
Definir novos cálculos os quais permitem definir novas medidas baseado em valores existentes;
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Definir e Desenvolver um Cubo
Editar e modificar os KPIs de um cubo. Os KPIs permitem determinar rapidamente informação útil acerca de um valor (ex: o valor definido excede ou falha o objectivo);
Criar ou modificar operações de Drill;
As partições permitem guardar secções de um cubo em diferentes localizações;
Uma perspectiva é um subconjunto de um cubo e é usada para reduzir a complexidade do cubo;
Visualização;
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
97Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Definir e Desenvolver um Cubo
O grupo das medidas chama-se Internet Sales porque a tabela de factos no Data Source View tinha o nome InternetSales;
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Definir e Desenvolver um Cubo
Apesar de apenas 3 dimensões terem sido criadas, há 5 dimensões no cubo, porque a dimensão Tempo da base de dados, é usada como base para 3 dimensões de tempo do cubo. Essas 3 dimensões permitem aos utilizadores dimensionar o cubo por 3 factos separados que estão relacionados com a venda de cada produto: order date; due date e ship date;
Expanda a dimensão Customer e carregue em Edit
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
98Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Definir e Desenvolver um Cubo
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Desenvolver um projecto Analysis Service;�
Definir e Desenvolver um Cubo
Para ver os dados que se encontram no cubo do Analysis Service Tutorial no projecto do Analysis Service Tutorial é necessário desenvolver um projecto para especificar uma instancia do Analysis Services.
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
99Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Definir e Desenvolver um Cubo
Para o caso de retornar um erro acerca da ImpersonationInfo Account….deve clicar-se no datasource “AdventureWorksDW.ds” e seleccionar a tab ImpersionationInformation e a opção “User the service account”
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Uma vez resolvido o problema voltar a executar o comando:
Definir e Desenvolver um Cubo
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
100Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Navegar no Cubo;�
Definir e Desenvolver um Cubo
Nos próximos passos navegaremos no cubo Analysis Services Tutorial e em cada uma das suas dimensões. Edite a dimensão Customer:
Seleccione a tab Browser;
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Observe-se que estamos a analisar os clientes pela hierarquia de Geografia:
Definir e Desenvolver um Cubo
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
101Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Definir e Desenvolver um Cubo
Depois seleccione-se por English Country Region Name:
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Seleccione-se agora a dimensão Time (directamente no Solution Explorer)
Definir e Desenvolver um Cubo
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
102Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Seleccione-se a tab browser e observe os dados com recurso à hierarquia CalendarYear - CalendarSemester - CalendarQuarter - EnglishMonthName –FullDateAlternateKey:
Definir e Desenvolver um Cubo
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Seleccione agora o Analysis Service Cube e a tab Browser
Definir e Desenvolver um Cubo
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
103Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Na área de Metadata expanda Measures � Internet Sales. Arraste a medida Sales Amount para a área de Data (Drop Totals or Detail Fields Here);
Definir e Desenvolver um Cubo
Na área de Metadata expanda Customer. Arraste o atributo English Country Region Name para a área de Data (Drop Row Fields Here)
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Na área de Metadata expanda agora Produto. Arraste o atributo Product Line para a área de Data (Drop Columns Field Here);
Definir e Desenvolver um Cubo
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
104Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Na área de Metadata expanda agora Order Date. Arraste o atributo Order Date.Calendar Quarter para a área de Data (Drop Filter Fields Here);
Definir e Desenvolver um Cubo
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Na área de Metadata expanda agora Order Date.Calendar Year e depois expanda Calendar Year. Seleccione o ano de 2002 e arraste para o filtro.
Definir e Desenvolver um Cubo
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
105Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Modificar medidas, atributos e hierarquias�
Modificar a dimensão tempo;
Modificar a dimensão customer;
Modificar medidas;
Modificar a dimensão produto;
Modificar medidas, atributos e hierarquias
Observar as modificações no Cube Designer;
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Modificar medidas, atributos e hierarquias
Modificar medidas�
É possível tornar a aplicação mais agradável se formatarmos algumas medidas
Na tab Cube Structure do Cube Designer:
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
106Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Modificar medidas, atributos e hierarquias
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Modificar medidas, atributos e hierarquias
Seleccione as seguintes medidas:
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
107Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Seleccione nas propriedades em FormatString o formato Currency
Modificar medidas, atributos e hierarquias
Na lista das propriedades seleccione Unit Price Discount Pct e posteriormente seleccione Percent no FormatString
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Modifique o nome para Unit Price Discount Percentage:
Modificar medidas, atributos e hierarquias
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
108Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Modificar medidas, atributos e hierarquias
No painel das medidas modifique o nome da medida Tax Amt para Tax Amount:
Para voltar ao painel inicial:
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Modificar medidas, atributos e hierarquias
No menu Build, clique Deploy Analysis Service Tutorial.
Seleccione a tab Browser:
Adicione à área de dados a medida Order Quantity
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
109Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Modificar medidas, atributos e hierarquias
Modificar a dimensão customer;�
Nos próximos passos vamos modificar alguns atributos da dimensão customer. Começamos por eliminar os seguintes atributos:
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Modifique os seguintes nomes:
Modificar medidas, atributos e hierarquias
English Country Region Name � Contry-Region;
English Education � Education;
English Occupation � Occupation;
State Province Name � State-Province
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
110Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Modifique o nome da hierarquia State Province Name – Dim Geography para Customer Geography
Modificar medidas, atributos e hierarquias
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Arraste o atributo Country-Region para a hierarquia Customer Geography, para cima do State Province Name. A hierarquia passa agora a ter um nível country-region. Aproveite para modificar na hierarquia o nome para State-Province:
Modificar medidas, atributos e hierarquias
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
111Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Elimine Geography na hierarquia e arraste City para cima de Customer.
Modificar medidas, atributos e hierarquias
Se quisermos fazer um browse na dimensão, convém primeiro fazer um build do projecto e depois na tab de browser fazer um reconnect para a hierarquia ser actualizada.
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Acrescentar agora um campo de cálculo. No designer do Data Source View:
Modificar medidas, atributos e hierarquias
Acrescentar agora um campo de cálculo. No designer do Data Source View:
Os nomes são concatenados numa única coluna que será depois usada na dimensão customer. Na tabela aparece a coluna com este icon:
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
112Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Modificar medidas, atributos e hierarquias
Tente explorar os dados:
Para ver o resultado final:
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Modificar medidas, atributos e hierarquias
Seleccione o atributo Customer:
Nas propriedades seleccione o nome para Full Name:
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
113Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
No ColumnID seleccione FullName:
Da próxima vez que fizermos um browser da dimensão, ao invés de aparecer o email (campo que anteriormente estava como ID), já vai aparecer o nome completo do cliente.
Não esquecer de fazer o Build e processar na dimensão e no browser, bem como refresh;
Modificar medidas, atributos e hierarquias
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
No data Source View arraste da tabela Customer a coluna EmailAddress para a Customer Dimension;
Modificar medidas, atributos e hierarquias
Seleccione os seguintes atributos:
E no AtributeHierarchyDisplayFolder colocar Location:
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
114Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Seleccione Customer Geography e na propriedade Display Folder colocar Location
Modificar medidas, atributos e hierarquias
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Modificar medidas, atributos e hierarquias
Seleccione os seguintes atributos:
E no AtributeHierarchyDisplayFolder colocar Location:
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
115Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Modificar medidas, atributos e hierarquias
Seleccione os seguintes atributos:
E no AtributeHierarchyDisplayFolder colocar Location:
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Modificar medidas, atributos e hierarquias
Se agora formos ao cubo designer, fizermos o process e o reconnect, podemos observar que os atributos estão agrupados em pastas, tornando-se a leitura mais amigável:
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
116Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Modificar medidas, atributos e hierarquias
Modificar a dimensão tempo;�
Seleccione a dimensão Tempo. Em Hierarchies alterar o nome abaixo seleccionado para Calendar Time:
Modifique também os nomes para:
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Modificar medidas, atributos e hierarquias
O script extrai o ano, o mês e o dia da coluna FullDateAlternateKey
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
117Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Modificar medidas, atributos e hierarquias
Eliminar dos atributos o FullDateAlternateKey;
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Modificar medidas, atributos e hierarquias
Faça-se Deploy do projecto e observe-se em browser que o aspecto já é mais amigável:
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
118Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Modificar medidas, atributos e hierarquias
Considerar a criação de um novo campo calculado, que concatene o mês e ano para cada mês da tabela Time:
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Modificar medidas, atributos e hierarquias
Considerar a criação de um novo campo calculado, que concatene o trimestre e ano para cada trimestre da tabela Time:
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
119Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Modificar medidas, atributos e hierarquias
Considerar a criação de um novo campo calculado, que concatene o semestre e ano para cada semestre da tabela Time:
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Modificar medidas, atributos e hierarquias
Seleccione agora a tab Dimension Strucutre do Dimension Designer da dimensão Time
Fazer o mesmo para CalendarQuarter (CalendarQuarterDesc) e CalendarSemester (CalendarSemesterDesc)
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
120Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Modificar medidas, atributos e hierarquias
Build � Deploy. Ir até ao browser e fazer reconnect;
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Modificar medidas, atributos e hierarquias
Modificar a dimensão produto;�
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
121Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Apagar os seguintes atributos:
Modificar medidas, atributos e hierarquias
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Modificar medidas, atributos e hierarquias
Mostra o nome do produto na totalidade:
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
122Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Modificar medidas, atributos e hierarquias
Seleccione o atributo Product Line e altere as suas propriedades:
Seleccione agora o atributo hierárquico Product, altere o seu nome para Product Name e altere também as suas propriedades:
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Modificar medidas, atributos e hierarquias
Arraste o atributo Product Line para as hierarquias. Automaticamente é criada uma nova hierarquia com o nome (por defeito) Hierarchy:
Altere esse nome para Product Model Lines;
Arraste o atributo Model Name para hierarquia, para de baixo de Product Line
Arraste o atributo Product Name para hierarquia, para de baixo do anterior;
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
123Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Modificar medidas, atributos e hierarquias
Seleccione os seguintes atributos:
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Modificar medidas, atributos e hierarquias
Seleccione os seguintes atributos:
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
124Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Modificar medidas, atributos e hierarquias
Seleccione os seguintes atributos:
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Modificar medidas, atributos e hierarquias
Build � Deploy. Ir até ao browser e fazer reconnect;
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
125Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Modificar medidas, atributos e hierarquias
Observar as modificações no Cube Designer;�
Seleccionar o browser no cube designer.
Adicione à área de dados a medida Sales Amount
Na área de metada expanda Product e arraste a hierarquia Product Model Lines para a área de Data (Drop Columns Field Here)
Depois expanda o membro Road:
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Modificar medidas, atributos e hierarquias
Na área de metada expanda Customer e Location. Arraste a hierarquia Customer Geography para a área de Data (Drop Row Fields Here)
Expanda a linha relativa ao Estados Unidos
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
126Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Modificar medidas, atributos e hierarquias
Expanda por Oregon para podermos visualizar os resultados de todas as cidades pertencentes ao estado de Oregon:
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Modificar medidas, atributos e hierarquias
As vendas de internet (Internet Sales) por região e product line para o mês de Fevereiro de 2002 aparecem assim:
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
127Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Definir atributos avançados e propriedades das dimensões�
Agrupar membros de atributos;
Definir propriedades nos atributos, numa dimensão Parent-Child
Usar uma versão modificada do projecto Analysis Service Tutorial
Esconder e desabilitar atributos nas hierarquias;
Definir atributos avançados e propriedades das dimensões
Ordenar atributos baseado em atributos secundários;
Definir membros desconhecidos
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Usar uma versão modificada do projecto Analysis Service Tutorial�
Definir atributos avançados e propriedades das dimensões
Vamos agora fechar o projecto em que temos andado a trabalhar e considerar uma versão mais avançada.
File � Open � Project Solution;
Navegar até C:\Program Files\Microsoft SQL Server\90\Samples\Analysis Services\Tutorials\Lesson4 e seleccionar o Analysis Service Tutorial.sln
Se o tutorial ainda não estiver instalado:
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
128Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Definir atributos avançados e propriedades das dimensões
Depois de o projecto se encontrar aberto, fazer Build e Deploy;
Entender as alterações:
O data source view neste projecto contém mais uma tabela de factos e 4 dimensões provenientes da base de dados AdventureWorksDW
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Definir atributos avançados e propriedades das dimensões
Observe-se que as tabelas (para melhor entendimento) encontram-se organizadas em dois diagramas: Internet Sales e o Reseller Sales;
O diagrama Internet Sales contém as tabelas que estão relacionadas com a venda de produtos da Adventure Works directamente através da Internet. As tabelas são as consideradas anteriormente:
DimGeography
DimCustomer;
DimTime;
DimProduct;
FactInternetSales;
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
129Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
O diagrama Reseller Sales contém as tabelas que estão relacionadas com a venda de produtos da Adventure Works através de revendedores. As tabelas são:
DimReseller;
DimPromotion;
DimSalesTerritory;
DimGeography
DimTime;
DimProduct;
DimEmployee
FactResellerSales;
Definir atributos avançados e propriedades das dimensões
Observe-se que DimGeography, DimTime e DimProduct são as mesmas tabelas usadas no diagrama InternetSales
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
O cubo designer contém agora 2 grupos de medidas baseados na tabela InternetSales e ResellerSales
Definir atributos avançados e propriedades das dimensões
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
130Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Definir propriedades nos atributos, numa dimensão Parent-Child�
Definir atributos avançados e propriedades das dimensões
No solution explorer carregue na dimensão Employee e em browser;
Observe-se que Amy E.Alberts é subordinado de Brian Welckler e que o manager principal é Ken J. Sanchez
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Definir atributos avançados e propriedades das dimensões
No solution explorer seleccione o cubo e posteriormente o browser:
Na metadata expanda Measures � Reseller Sales e adicione à área de Data o atributo Reseller Sales – Sales Amount
Na metadata expanda Employee e arraste a hierarquia Employees para a área de Data (Drop Row Fields Here)
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
131Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Definir atributos avançados e propriedades das dimensões
Expanda os nomes dos empregados até chegar ao nível 5:
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Definir atributos avançados e propriedades das dimensões
Seleccione o atributo hierárquico Employees
Seleccione a propriedade NamingTemplate
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
132Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Definir atributos avançados e propriedades das dimensões
Isto vai permitir renomear os níveis. Ver figura no slide seguinte:
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Definir atributos avançados e propriedades das dimensões
Build � Deploy e ir até ao Cubo Designer (Browser e Reconnect);
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
133Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Agrupar membros de atributos;�
Definir atributos avançados e propriedades das dimensões
No data source view:
Observe-se a gama de valores para a coluna YearlyIncome
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Na dimensão Customer (em customer structure) seleccione o atributo yearly income e considere a seguinte propriedade:
Definir atributos avançados e propriedades das dimensões
Alterando o valor da DiscretizationBucketCount para 5;
A propriedade DiscretizationMethod determina se o Analysis Services forma algum grupo. Por defeito o Analysis Services não o faz. Ao colocarmos automático, ele vai determinar de acordo com o atributo qual o melhor grupo
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
134Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Na dimensão Employee (no data source view) observe agora os valores das colunas SickLeaveHours e VacationHours. Feche esta tab
Definir atributos avançados e propriedades das dimensões
Na dimensão Employee (no designer, dimension structure) seleccione o campo SickLeaveHours e a propriedade DiscretizationMethod para clusters e BucketCount para 5:
Seleccione agora o campo VacationHours e considere as propriedades:
Ao especificarmos Cluster e EqualAreas em vez de automatic, estamos a informar o Analysis Services sobre qual o tipo de agrupamento que pretendemos;
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Build � Deploy. Vá até ao Cubo (browser e reconnect)
Definir atributos avançados e propriedades das dimensões
Arraste para a área de Data a medida Reseller Sales – Sales Amount;
Na metadata expanda a dimensão Product e arraste a hierarquia Product Model Lines para a área de Data (Drop Row Fields Here)
Na metadata expanda a dimensão Customer e a pasta Demographic e arraste Yearly Income para a área de Data (Drop Column Fields Here). Observe-se que os valores se encontram agrupados em 6 grupos:
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
135Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Remova o atributo Yearly Income
Definir atributos avançados e propriedades das dimensões
Na metadata expanda a dimensão Employee, expanda Organization e arraste SickLeaveHours para a área de Data (Drop Columns Fields Here)
Observe-se que as vendas são realizadas por vendedores pertencentes a 2 grupos
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Se quiser ver os 3 grupos que não fizeram vendas, faça botão direito na área de Data:
Definir atributos avançados e propriedades das dimensões
Remova Sick Leave Hours e faça o mesmo para VacationHours;
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
136Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Altere agora a propriedade DiscretizationBucketCount de Vacation Hours para 10 e observe as diferenças. Não se esqueça de fazer build � deploy, etc…
Definir atributos avançados e propriedades das dimensões
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Esconder e desabilitar atributos nas hierarquias;�
Definir atributos avançados e propriedades das dimensões
Por defeito o SQL Server Analysis Server, cria sempre um atributo hierarquia para todos os atributos das dimensões, tornando-os disponíveis para dimensionar a tabela de factos. Acontece que existem alguns atributos que não faz muito sentido estarem disponíveis em termos de análise.
Vá ao Dimension Designer, à dimensão Employee e a browser
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
137Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Definir atributos avançados e propriedades das dimensões
Verifique que os atributos Base Rate, Birth Date, Login ID, Manager SSN e SSN encontram-se disponíveis.
Vá à Dimension Structure tab e seleccione esses atributos;
Defina a seguinte propriedade e observe que os atributos deixam de estar acessíveis
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Definir atributos avançados e propriedades das dimensões
Faça Build � Deploy e observe que os atributos já não estão acessíveis:
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
138Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Ordenar atributos baseado em atributos secundários;�
Definir atributos avançados e propriedades das dimensões
Observe que a propriedade OrderBy da atributo MonthName da dimensão Time tem o valor Key, o que provoca que os meses não apareçam depois ordenados:
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Definir atributos avançados e propriedades das dimensões
Para resolvermos isso, ordenaremos os meses do atributo hierárquico baseado num novo atributo: MonthNumberOfYear, que convenientemente já existe na tabela da dimensão tempo;
NO Dimension Designer no tab Data Source View, seleccione o atributo MonthNumberOfYear:
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
139Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Definir atributos avançados e propriedades das dimensões
Automaticamente o atributo é adicionado. Coloque as propriedades AttributeHierarchyEnabled e AttributeHierarchyOrdered para False
Nos atributos expanda a Data e Month Name
Arraste os atributo Month Number of Year para debaixo do atributo Month Name;
Desta forma definimos uma nova relação entre os dois atributos. Altere a propriedade RelathionShip Type do Month Number of Year para Rigid (mesmo se a dimensão for actualizada, isto não será sobrescrito)
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Definir atributos avançados e propriedades das dimensões
Agora seleccione o atributo Month Name e especifique as propriedades:
Faça Build, etc…e observe-se que os valores já aparecem ordenados em termos de mês
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
140Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Observe outro problema semelhante na dimensão Customer na hierarquia Commute Distance:
Definir atributos avançados e propriedades das dimensões
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
NO Dimension Designer no tab Data Source View, seleccione o atributo CommuteDistanceSort.
Definir atributos avançados e propriedades das dimensões
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
141Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Automaticamente o atributo é adicionado. Coloque as propriedades AttributeHierarchyEnabled e AttributeHierarchyOrdered para False
Definir atributos avançados e propriedades das dimensões
Nos atributos expanda Commute Distance
Arraste o atributo CommuteDistanceSort para debaixo de Commute Distance. Não se esqueça de colocar a Relatioship Type a Rigid
Agora seleccione o atributo Commute Distance e especifique as propriedades:
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Faça Build, etc…e observe-se que os valores já aparecem ordenados:
Definir atributos avançados e propriedades das dimensões
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
142Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Definir membros desconhecidos�
Definir atributos avançados e propriedades das dimensões
Vá até ao Designer Data Source View e seleccione Reseller Sales no Diagram Organizer. Depois vá ao menu Data Source View e seleccione Add/Remove Tables
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Seleccione DimProduct e clique em Add Related Tables;
Definir atributos avançados e propriedades das dimensões
Automaticamente é adicionada a DimProductSubCategory
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
143Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Seleccione agora a DimProductSubCategory e clique em Add Related Tables; Automaticamente é adicionada a DimProductCategory;
Definir atributos avançados e propriedades das dimensões
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Vá até ao Dimension Designer na dimensão Product e com o botão direito do rato em data source view:
Definir atributos avançados e propriedades das dimensões
Na zona dos atributos modifique este atributo para Category;
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
144Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Na propriedade ColumnName carregue em New e especifique:
Definir atributos avançados e propriedades das dimensões
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Na zona dos atributos modifique este atributo para SubCategory;
Definir atributos avançados e propriedades das dimensões
Na propriedade ColumnName carregue em New e especifique:
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
145Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Definir atributos avançados e propriedades das dimensões
Crie uma nova hierarquia nesta ordem Category � SubCategory e Product Name
Especifique a seguinte propriedade:
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Definir atributos avançados e propriedades das dimensões
Por defeito quando fazemos o Build, o SQL Server Analysis Server remove os produtos que não têm valor na coluna ProductSubCategoryKey
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
146Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Definir atributos avançados e propriedades das dimensões
Se formos a browser e clicarmos na lista de hierarquias em Product Model Lines, tem o seguinte efeito:
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Definir atributos avançados e propriedades das dimensões
Para resolver isso, vamos ao Dimension Structure da dimensão Product e defina as seguintes propriedades na dimensão Product
Expanda SubCateogry. Arraste o atributo Category que se encontra dentro de Product Name para dentro de SubCategory
Seleccione agora SubCategory e a propriedade KeyColumns
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
147Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Definir atributos avançados e propriedades das dimensões
Coloque o NullProcessing com o seguinte valor:
Fazer o mesmo para o ModelName. Faça Build, etc…e observem que já não existem nulos;
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Definir relações entre dimensões e grupos de medidas�
Definir uma dimensão de factos;
Definir uma relação referenciada
Definir relações entre dimensões e grupos de medidas
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
148Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Definir uma relação referenciada�
A maioria dos cubos definidos é através de uma relação com a tabela de factos. Na lição 3 e 4 incluímos no entanto atributos de uma tabela que não estavam directamente relacionados com a tabela de factos (chamada de snowflake). Por exemplo na lição 3, adicionamos atributos da tabela DimGeography à dimensão Customer. Os atributos da tabela DimGeograpphy encontram-se ligados à tabela de factos por intermédio da tabela Customer.
Através desta dimensão é possível definir a hierarquia Customer Geography e analisar a dimensão Customer por Geography.
De seguida vamos ligar a dimensão Geography à tabela de factos através da dimensão Reseller
Definir relações entre dimensões e grupos de medidas
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Definir relações entre dimensões e grupos de medidas
No solution Explorer abra o Cubo Designer e vá até browser. Arraste a medida Reseller Sales – Sales Amount e a hierarquia Geography (pertencente a Geography) para a área de data (Drop Row Fields Here)
Abra agora o Data SOurce View para a AdventureWorksDW. Seleccione no Diagram Organizer Reseller Sales. Observe a relação entre DimGeography e FactResellerSales. Não existe nenhuma ligação directa, mas existe uma ligação indirecta através de outras tabelas;
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
149Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Definir relações entre dimensões e grupos de medidas
Observe que a dimensão Geopgraphy não tem actualmente nenhuma relação com o grupo de medidas Internet Sales nem com o Reseller Sales;
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Definir relações entre dimensões e grupos de medidas
Clique:
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
150Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Definir relações entre dimensões e grupos de medidas
Observe-se que a relação é uma relação regular que é feita por intermédio das chaves estrangeiras
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Definir relações entre dimensões e grupos de medidas
Clique:
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
151Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Definir relações entre dimensões e grupos de medidas
Observe-se que não há nenhuma relação definida, nem sequer pode ser definida uma relação regular, uma vez que não existem campos a ligar as tabelas
Seleccione uma relação do tipo Referenced, indicando uma relação intermediária (Reseller) que permite fazer a ligação;
Seleccione a chave Geography Key e tente fazer o mesmo na relação intermediária. Não vai conseguir porque a Geography Key é definida como atributo na dimensão Reseller. Teremos que resolver o problema de outra forma
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Definir relações entre dimensões e grupos de medidas
No DimensionDesigner da dimensão Reseller observe ao campos em data source view e na zona de atributos
Observe que não obstante a tabela ter o atributo GeographyKey o mesmo não existe como atributo na dimensão Reseller;
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
152Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Definir relações entre dimensões e grupos de medidas
Adicione-se o atributo GeographyKey e depois atribua-se as características de AttributeHierarchyOrder (False) e AttributeHierarchyVisible (false)
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Definir relações entre dimensões e grupos de medidas
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
153Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Definir relações entre dimensões e grupos de medidas
Note-se que agora já temos as tabelas ligadas. Altere também o nome (na figura abaixo já se encontra alterado) de Geography para Reseller Geography:
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Definir relações entre dimensões e grupos de medidas
Build, etc….Arraste-se Reseller Sales – Sales Amount para a área de data e o atributo Geography da dimensão Reseller Geography para á area de Data (Row Field). Observe-se a figura que tinhamos anteriormente e a que temos agora em virtude de termos definido a relação:
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
154Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Definir uma dimensão de factos;�
Definir relações entre dimensões e grupos de medidas
Por vezes é necessário que algumas medidas que se encontram na tabela de factos se tornem atributos de dimensão, tal como número de facturas, etc…
Quando se define uma dimensão baseado numa tabela de factos, a dimensão é chamada de dimensão de factos. Dimensões de factos, são úteis para juntar várias linhas que estão relacionadas por exemplo a um número de factura.
Apesar de se poder construir uma tabela de dimensão para esse fim..tal não faz sentido
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
No Cubo Designer na parte das dimensões:
Clicar em Nova Dimensão e clicar depois em Next
Definir relações entre dimensões e grupos de medidas
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
155Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Definir relações entre dimensões e grupos de medidas
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Definir relações entre dimensões e grupos de medidas
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
156Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Definir relações entre dimensões e grupos de medidas
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Definir relações entre dimensões e grupos de medidas
No passo seguinte não seleccione nenhuma tabela e clique next;
No passo seguinte desmarque todas as selecções e considere apenas Customer PO Number:
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
157Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Definir relações entre dimensões e grupos de medidas
Antes de finalizar, alterar o nome para Internet Sales Orders Details;
Depois no Dimension Designer, seleccionar o atributo Internet Sales e alterar a propriedade Name para Item Description;
Na propriedade Name Column, seleccionar Product como source table e EnglishProductName como source column;
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Definir relações entre dimensões e grupos de medidas
Modifique a propriedade Name de Sales Order Number para Order Number
No Cubo Designer na DImension Usage
Indica que é uma dimensão de factos
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
158Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Definir relações entre dimensões e grupos de medidas
Build, etc..Coloque na área de data a medida Internet Sales – Sales Amount;
Expanda Customer � Location � Customer Geography � Members � All Customers � Australia � Queensland � Brisbane � Adam Powel e com o botºao direito do rato seleccione Add to SUbCube area.
Arraste a hierarquia InternetSalesOrder da dimensão Internet Sales Order Detail para a row area:
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Definir KPIs�
Na definição de um KPI atribui-se um nome ao KPI e um grupo de medidas. Os elementos de KPIs são os seguintes:
Definir KPIs
Value Expression
A Value Expression é uma medida (por exemplo total de vendas, lucros, etc…)
Goal Expression
Valor que define o objectivo a ser atingido (este valor pode ser por exemplo o valor que a empresa queira atingir nas vendas).
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
159Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Definir KPIs
Status Expression
Uma expressão que avalia o valor da Value Expression com o valor do Goal Expression, como um valor normalizado numa gama que varia de -1 a +1.
-1 é muito mau
+1 é muito bom
Trend Expression
Uma expressão que avalia o crescimento do valor da Value Expression comparativamente ao valor do Goal Expression. Esta expressão ajuda os gestores a determinarem se a value expression está a crescer ou a decrescer relativamente às expectativas (Goal expression)
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Definir KPIs
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
160Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Definir KPIs
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Definir KPIs
Na Value Expression colocar [Measures].[Sales Amount]
Na Goal Expression colocar [Measures].[Total Product Cost] * 2
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
161Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Definir KPIs
De seguida seleccionar o browsing
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Definir KPIs
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
162Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
SQL Server Business Intelligence Development Studio
Exercício Prático
Ricardo Campos ([email protected])
Instituto Politécnico de Tomar Escola Superior de Gestão de Tomar
Área Interdepartamental de Tecnologias de Informação e Comunicação
Gestão Financeira
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Desenvolva um modelo de Entidade e Relacionamento que permita registar a atribuição de crédito (para aquisição de diversos tipos de bens) por parte de uma dada entidade bancária aos seus clientes. Considere as seguintes informações:
O cliente é identificado por um número e tem como atributos o NIF, o nome, o rendimento bruto, o número de filhos e a idade. Adicionalmente o cliente tem associado um determinado estatuto, estado civil e crédito de habitação.
O cliente pode ter vários empréstimos atribuídos, mas cada empréstimo está apenas associado a um único cliente. Os atributos da entidade empréstimo são o valor do crédito e o valor da prestação. Adicionalmente deveremos considerar o tipo de bem financiado, o tipo de contrato, a duração, o tipo de pagamento e a situação
Enunciado
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
163Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
TipoBemFinanciado
TipoContrato
EmpréstimoClienteTipoEstatuto
TipoEstadoCivil
TipoCréditoHabitação
TipoDuracao
TipoPagamento
TipoSituacao
Modelo E-R
1
NN
N
NN
N
NN
N
1
1
1
1
11
1
1
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
No SQL Server Management Studio implemente a base de dados Banco e defina o modelo Relacional proveniente do modelo Entidade e Relacionamento desenvolvido na pergunta anterior.
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
164Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Modelo Relacional
CodClienteNIF
NomeNumFilhos
IdadeCodEstatuto
CodEstadoCivilCodCreditoHabit
Clientes
TipoEstatuto
CodEstatutoEstatuto
TipoEstadoCivil
CodEstadoCivilEstadoCivil
numEmprestimoValorCredito
ValorPrestacaoCodCliente
CodBemFinanciadoCodTipoContratoCodTipoDuracao
CodTipoPagamentoCodTipoSituacao
Emprestimos
CodCreditoHabitacaoCreditoHabitacao
TipoCreditoHabitacao
CodBemFinanciadoBemFinanciado
TipoBemFinanciado
CodTipoContratoTipoContrato
TipoContrato
CodDuracaoDuracao
TipoDuracao
CodPagamentoPagamento
TipoPagamento
CodTipoSituacaoTipoSituacao
TipoSituacao
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Defina o Database Diagram (não se esqueça de interligar as tabelas entre si)
Insira vários registos em cada uma das tabelas;
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
165Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Pretende-se agora que desenvolva uma estrutura multidimensional (star schema) com base nos seguintes pressupostos:
O processo de negócio a analisar está associado aos financiamentos concedidos pela instituição aos seus clientes;
Pretende-se analisar os financiamentos (valor do crédito), analisar a quem foram concedidos, verificar que bem foi financiado, identificar a regularidade adoptada para o pagamento, verificar que tipo de contrato foi celebrado com o cliente, verificar qual a duração do contrato, identificar a situação do cliente perante a instituição
Enunciado
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Modelo Multidimensional (Start Schema)
Financiamentos
Cliente
TipoBemFinanciado
TipoPagamento
TipoContrato
TipoDuracao
TipoSituacao
1
NN
N
NN
N
1
1
1
1
1
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
166Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
No SQL Server Management Studio implemente a base de dados BancoDW e defina o modelo Relacional proveniente do modelo Entidade e Relacionamento desenvolvido na pergunta anterior.
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
CodCliente
Nome
NumFilhos
Idade
Estatuto
CreditoHabitacao
EstadoCivil
Clientes
CodCliente
CodBemFinanciado
CodTipoContrato
CodDuracao
CodPagamento
CodTipoSituacao
ValorCredito
Financiamentos
CodBemFinanciado
BemFinanciado
TipoBemFinanciado
CodTipoContrato
TipoContrato
TipoContrato
Modelo Relacional
CodDuracao
Duracao
TipoDuracao
CodTipoSituacao
Situacao
TipoSituacao
CodTipoPagamento
Pagamento
TipoPagamento
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
167Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Defina o Database Diagram (não se esqueça de interligar as tabelas entre si)
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
No SQL Server Business Intelligence, desenvolva os processos ETL necessários à integração da informação da base de dados Banco para a base de dados BancoDW.
Criar um novo projecto de integração.
Adicionar duas conexões (uma para a base de dados Banco e outra para a base de dados BancoDW).
Processos ETL
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
168Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Processos ETL
Adicionar ao control flow, um data flow task
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
No data Flow, proceder ao carregamento dos dados da base de dados Banco para a base de dados BancoDW
Processos ETL
Popular a Dimensão Cliente:
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
169Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Processos ETL
Lookup à tabela Estatuto. Join através do campo CodEstatuto e
selecção do atributo Estatuto
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Processos ETL
Lookup à tabela EstadoCivil. Join através do campo CodEstadoCivil e
selecção do atributo EstadoCivil
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
170Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Processos ETL
Lookup à tabela CreditoHabitacao. Join através do campo
CodCreditoHabitacao e selecção do atributo CreditoHabitacao
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Processos ETL
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
171Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Popular a Dimensão Bem Financiado:
Processos ETL
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Popular a Dimensão TipoPagamento:
Processos ETL
Popular a Dimensão TipoPagamento:
Popular a Dimensão TipoDuracao:
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
172Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Popular a Dimensão TipoSituacao:
Processos ETL
Popular a tabela de factos Financiamentos:
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Aspecto final do Data Flow
Processos ETL
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
173Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
OLAP
No SQL Server Business Intelligence, implemente um projecto de Analysis Services, com base no data warehouse BancoDW:
New Data Source
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
OLAP
New Data Source View
Neste passo é possível seleccionar tabelas e views pertencentes à Data Source:
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
174Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Resultado final:
OLAP
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
OLAP
New Cube
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
175Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
OLAP
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
OLAP
Desenvolver um projecto Analysis Service;
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
176Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Expanda a dimensão Cliente e carregue em Edit
OLAP
Crie as seguintes hierarquias:
Seleccione Propriedades
Especifique que deve aparecer o nome do cliente
ao invés do seu número
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
OLAP
Crie as seguintes hierarquias:
Não se esqueça de definir o nome do cliente ao invés do número
Seleccione as propriedades de Idade
E em advanced especifique as propriedades anteriores por forma que sejam feitos grupos relativos à idade
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
177Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
OLAP
Não se esqueça de definir o nome do cliente ao invés do número
Defina grupos (escala) para o rendimento bruto
Não se esqueça de definir para todas as hierarquias um nome adequado para o 1.º nível da hierarquia:
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Faça um Deploy do projecto e navegue no browser
OLAP
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
178Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
No browser do cubo, analise os seus dados de acordo com o seguinte:
OLAP
Montante de crédito total atribuído, desagregado pelo estado civil dos clientes
Estado Civil Valor Crédito
All Cliente 3,982,71
+ Casado 1,022,49
+ Solteiro 1,494,94
+ Outro 1,465,27
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Verificar qual a distribuição do financiamento concedido por estado civil, mas atendendo ao bem financiado;
Estado Civil All TipoBemFinanciado Carro Electrodomésticos Mota Móveis
All Cliente 3,982,71 2,762,63 285,71 277,84 656,52
+ Casado 1,022,49 720,90 44,10 51,72 205,76
+ Solteiro 1,494,94 1,125,23 137,44 106,56 125,70
+ Outro 1,465,27 916,49 104,16 119,56 325,05
OLAP
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
179Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Verificar qual a distribuição do financiamento concedido por estado civil, mas atendendo ao número de filhos e bem financiado;
OLAP
- Estado Civil + Num Filhos All TipoBemFinanciado Carro Electrodomésticos Mota Móveis
All Cliente All Cliente Total 3,982,71 2,762,63 285,71 277,84 656,52
-Casado Casado Total 1,022,49 720,90 44,10 51,72 205,76
+ 0 323,61 224,48 14,78 21,20 63,14
+ 1 348,87 252,64 16,65 9,77 69,80
+ 2 350,00 243,77 12,67 20,74 72,81
-Solteiro Solteiro Total 1,494,94 1,125,23 137,44 106,56 125,70
+ 0 546,75 422,73 47,06 39,35 37,61
+ 1 520,67 403,63 39,91 32,69 44,43
+ 2 427,51 298,86 50,46 34,51 43,66
- Outro Outro Total 1,465,27 916,49 104,16 119,56 325,05
+ 0 1,010,12 647,35 75,88 80,33 206,54
+ 1 455,15 269,14 28,27 39,22 118,50
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Verificar qual a distribuição do financiamento concedido por bem financiado, mas atendendo à idade;
OLAP
Idade All TipoBemFinanciado Carro Electrodomésticos Mota Móveis
All Cliente 3,982,71 2,762,63 285,71 277,84 656,52
25 – 30 1,048,12 736,98 67,99 85,10 157,59
31 – 35 1,041,59 740,84 79,20 64,17 157,32
36 – 40 947,42 631,54 66,46 68,57 181,08
41 – 45 946,01 655,01 72,00 60,00 161,00
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
180Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Verificar o tipo de situação perante o financiamento atendendo ao estado civil e ao bem financiado;
Tipo Situação + Estado Civil All TipoBemFinanciado Carro Electrodomésticos Mota Móveis
All TipoSituação All Cliente 3,982,71 2,762,63 285,71 277,84 656,52
+ Casado 1,022,49 720,90 44,10 51,722 205,76
+ Solteiro 1,494,94 1,125,23 137,44 106,56 125,70
+ Outro 1,465,27 916,49 104,16 119,56 425,05
Cumprimento All Cliente 3,293,94 2,367,06 120,66 149,68 656,52
+ Casado 866,85 618,35 12,61 30,12 205,76
+ Solteiro 968,56 838,96 3,88 125,70
+ Outro 1,458,53 909,75 104,16 119,56 325,05
Incumprimento All Cliente 688,77 395,56 165,05 128,16
+ Casado 155,64 102,55 31,49 21,59
+ Solteiro 526,38 286,26 133,56 106,56
+ Outro 6,74 6,74
OLAP
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Tipo Situação Incumprimento
Idade All TipoBemFinanciado Carro Electrodomésticos Mota Móveis
All Cliente 688,77 395,56 165,05 128,16
25 – 30 91,00 7,00 37,00 46,00
31 – 35 292,00 192,00 41,00 24,00
36 – 40 214,00 151,00 31,00 26,00
41 – 45 82,00 8,00 46,00 22,00
Verificar o tipo de situação incumprimento associado à idade e ao tipo de bem financiado;
OLAP
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
181Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Verificar a distribuição do crédito atendendo ao Cumprimento ou Incumprimento dos clientes e ainda ao tipo de bem financiado (Carro, Electrodoméstico, Mota, Móveis);
OLAP
Bem Financiado All TipoSituação Cumprimento Incumprimento
All Tipo Bem Financiado 3,982,71 3,293,94 688,77
Carro 2,762,63 2,367,06 395,56
Electrodomésticos 285,71 120,66 165,05
Mota 277,84 149,68 128,16
Móveis 656,52 656,52
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Verificar a distribuição do crédito atendendo ao Cumprimento ou Incumprimento dos clientes, ao tipo de bem financiado (Carro, Electrodoméstico, Mota, Móveis) e ao tipo de pagamento;
OLAP
Ver slide seguinte:
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
182Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Pagamento Bem Financiado All Tipo Situação Cumprimento Incumprimento
All Tipo Pagamento All TipoBemFinanciado 3,982,71 3,293,94 688,774
Carro 2,762,63 2,367,06 395,56
Electrodomésticos 285,71 120,66 165,05
Mota 277,84 149,68 128,16
Móveis 656,52 656,52
Mensal All TipoBemFinanciado 3,899,83 3,223,45 676,37
Carro 2,762,63 2,367,06 395,56
Electrodomésticos 267,23 114,58 152,65
Mota 277,84 149,68 128,16
Móveis 592,12 592,12
Trimestral All TipoBemFinanciado 82,88 70,48 12,39
Carro
Electrodomésticos 18,47 6,08 12,39
Mota
Móveis 64,40 64,4’
OLAP
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Verificar a distribuição do financiamento atendendo ao Cumprimento ou Incumprimento dos clientes e ao tipo de contrato;
OLAP
Tipo Contrato All TipoSituação Cumprimento Incumprimento
All TipoCOntrato 3,982,71 3,293,94 688,77
ALD 1383,40 1,004,22 379,17
Leasing 1,370,57 1,354,18 16,39
Outro 1,228,74 935,53 293,21
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
183Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Verificar a distribuição do financiamento atendendo ao Cumprimento ou Incumprimento dos clientes, bem financiado e ao tipo de contrato;
OLAP
Ver slide seguinte:
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Pagamento Bem Financiado All Tipo Situação Cumprimento Incumprimento
All Tipo Pagamento All TipoBemFinanciado 3,982,71 3,293,94 688,774
Carro ……. ……. …….
Electrodomésticos ……. ……. …….
Mota ……. ……. …….
Móveis ……. ……. …….
ALD All TipoBemFinanciado ……. ……. …….
Carro ……. ……. …….
Electrodomésticos ……. ……. …….
Mota ……. ……. …….
Móveis ……. ……. …….
Etc… All TipoBemFinanciado ……. ……. …….
Carro ……. ……. …….
Electrodomésticos ……. ……. …….
Mota ……. ……. …….
Móveis ……. ……. …….
OLAP
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
184Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Verificar a distribuição do financiamento atendendo ao Cumprimento ou Incumprimento dos clientes e à duração do contrato;
OLAP
Duração All TipoSituação Cumprimento Incumprimento
All TipoDuraçao 3,982,71 3,293,94 688,77
6 ……. ……. …….
12 ……. ……. …….
18 ……. ……. …….
24 ……. ……. …….
30 ……. ……. …….
36 ……. ……. …….
42 ……. ……. …….
48 ……. ……. …….
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Verificar a distribuição do financiamento atendendo ao Cumprimento ou Incumprimento dos clientes, ao tipo de bem financiado e ao tipo de contrato;
OLAP
Ver slide seguinte:
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
185Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Bem Financiado Duração All Tipo Situação Cumprimento Incumprimento
All Tipo BemFinanciado
All TipoDuração 3,982,71 3,293,94 688,774
6 ……. ……. …….
12 ……. ……. …….
18 ……. ……. …….
24 ……. ……. …….
30 ……. ……. …….
36 ……. ……. …….
42 ……. ……. …….
48 ……. ……. …….
Etc…. ……. ……. …….
……. ……. …….
……. ……. …….
……. ……. …….
……. ……. …….
OLAP
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Tipo Situação Incumprimento
Duração All TipoBemFinanciado Carro Electrodomésticos Mota Móveis
All TipoDuração 688,77 395,56 165,05 128,16
6 …….. …….. …….. ……..
12 …….. …….. …….. ……..
18 …….. …….. …….. ……..
24 …….. …….. …….. ……..
30 …….. …….. …….. ……..
36 …….. …….. …….. ……..
42 …….. …….. …….. ……..
48 …….. …….. …….. ……..
Verificar o tipo de situação incumprimento associado ao tipo de bem financiado e ao tipo de duração;
OLAP
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
186Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
KPIs
Defina um KPI (Key Performance Indicator) que avalie os resultados relativos à concessão de crédito;
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
CRM
Ricardo Campos ([email protected])
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
187Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
O CRM O CRM é uma estratégia de negócioé uma estratégia de negócio que abrange toda a empresa. Visa a que abrange toda a empresa. Visa a criação de um relacionamento a longo prazo com os clientes e parceiros através criação de um relacionamento a longo prazo com os clientes e parceiros através
da compreensão e satisfação das suas necessidades individuais.da compreensão e satisfação das suas necessidades individuais.
VendasMarketing Serviço
Canais de Interacção
Telefone Fax Web Mail PDA’s
Definição
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
• Construção de Relações
• Reconhecer e tratar os melhores clientes
• Escutar e aprender com os clientes
• Actuar a partir do conhecimento adquirido
ÉÉ Mais do Que
• Montar um serviço ao cliente
• Disponibilizar Produtos de Qualidade
Adopção de Novos Modelos de Negócio
• Foco na Oferta de Produtos
• Venda de Produtos a todos os Potenciais
Clientes.
• Foco na Construção de Relações
Duradouras
• Customizar a base de produtos e serviços
à base de clientes.
Antes Agora
Marketing Tradicional
• Diferenciar produtos.
• Gerir produtos.
• Encontrar Clientes para Produtos.
Marketing 1 To 1
• Diferenciar clientes.
• Gerir clientes.
• Encontrar Produtos para Clientes.
Definição
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
188Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Informação (permite identificar preferências
e necessidades de clientes)
• Gestão de Clientes no Front-Office• Marketing• Vendas• Serviço• Suporte
Interacção (base para a construçãode relações duradouras)
• Vendas Directas• Vendas Indirectas• Telefone• E-mail• Web• Carta• Fax
Vendas
Marketing
Serviço
Suporte
Interacção = Informação
Informação = Conhecimento
Conhecimento = Fidelização
Fidelização = Lucro
Consequentemente Diálogo = Lucro
Factores Críticos na Implementação da Estratégia
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Front - Office
• Front-office aparece como foco central na gestão das relações com clientes.
• Necessidade de dotar organizações de uma base de dados unificada.
• Dar às áreas de front-office a visão do cliente nas vertentes de Serviço, Suporte,
Marketing e Vendas.
Fases do CRM
Know Me
Aquisição de Clientes
Hear Me
Grow Me
Retenção de Clientes
Customer Relationship Management Estratégico
Rentabilidade
Sat
isfa
ção
Clie
ntes
/Fid
eliz
ação
Fases do CRM
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
189Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
• Cliente encarado como Conta
• Empresa foca-se em ter uma ideia do cliente: facturação, número de escritórios
World Wide, ...
• Ofertas comerciais baseadas em preço por volume de aquisição.
• Foco: Oportunidades de Negócio.
• Necessidade de criar valor para o cliente.
• Necessidade de ter informação detalhada de interacções.
• Necessidade de o conhecer quem compra e quem decide.
• Necessidade de escutar o cliente e conhecer as condições que condicionam as
tomadas de decisão e o processo de aquisição.
• Foco: Contactos e Actividades.
• Cross-sell e Up-Sell baseado no verdadeiro conhecimento do cliente
(Oportunidades, Contactos e Actividades).
• Conhecimento é adquirido na Empresa e no Cliente.
• Foco: Relacionamento.
Know Me
Hear Me
Grow Me
Fases do CRM
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Data Mining
Ricardo Campos ([email protected])
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
190Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Data Mining
Processo de exploração e análise de dados a fim de descobrir regras e padrões anteriormente desconhecidos;
é o processo de descoberta de nova e relevante informação a partir de grandes volumes de informação mantidos no DW;
essa informação é tipicamente “conhecimento escondido” obtido pela análise da ocorrência de padrões.
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Comportamento do cliente:
Procurar e reter os clientes mais rentáveis;
Detecção de fraude;
Data Mining - Aplicações
Análise web;
Segmentação de clientes:
Marketing direccionado – receptividade a campanhas;
Análise de rentabilidade:
Aquisição e retenção de clientes;
Análise de risco;
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
191Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Data Mining
OLAP Data Mining
Quantos assinantes se perderam por fraude?
Quais são as características dos clientes com maior propensão para fraude?
Quantos clientes é que estamos a perder? Porque é que estamos a perder clientes? Quais os clientes que estamos em risco de perder?
Quantos clientes cancelaram as contas nos últimos 6 meses comparando com o mesmo período do ano passado?
Quais os clientes que vão passar para a concorrência nos próximos 6 meses?
Que lojas não cumpriram determinados objectivos no último ano?
Qual é o melhor tamanho e localização para a nossa próxima loja?
Quanto perdemos em crédito mal
parado no último ano?
Quais os clientes com possibilidade de
falharem o pagamento dos empréstimos?
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Data Mining
As tarefas de Data Mining incluem:
Classificação;
Segmentação;
Modelação de Dependências;
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
192Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Classificação:
Data Mining
Permite o enquadramento de um conjunto de dados dentro de classes predefinidas;
A classificação é uma tarefa de aprendizagem supervisionada. Isto quer dizer que o atributo e as classes que vão conduzir o processo de classificação dos dados são conhecidos à partida.
Exemplo:
Considere-se um conjunto de 23 registos;
Cada ponto representa uma pessoa a quem o banco concedeu crédito
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
No eixo dos xx temos representado o rendimento bruto (total anual);
No eixo dos yy o montante total da dívida (valor do crédito)
Os dados encontram-se classificados em duas classes:
A existência de duas regiões, que permitem dividir os clientes nas duas classes disponíveis para o atributo de saída: cumpridores e incumpridores;
∆, clientes que não tiveram qualquer atraso no pagamento;
□, clientes que faltaram ao pagamento das suas dívidas;
Data Mining
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
193Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Data Mining
Segmentação:
Conhecida como clustering;
Representa uma tarefa de aprendizagem não supervisionada, uma vez que o utilizador não tem qualquer influência na definição de classes
Os segmentos surgem de agrupamentos que são detectados nos dados e que obedecem a métricas de similaridade;
A representação dos registos é substituída pelo símbolo Οpara todos os registos, indicando que não existe qualquer predefinição de classes para os indivíduos;
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Modelação de Dependências:
Tem como objectivo identificar um modelo que descreve dependências significativas entre variáveis;
Data Mining
Um exemplo de associação pode ser encontrado em conjuntos de bens de consumo que são adquiridos simultaneamente;
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
194Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Técnicas de Data Mining:
Árvores de Decisão;
Regras de Associação;
Data Mining
Existe uma grande diversidade de técnicas de data mining, as quais são concretizadas através de diferentes algoritmos.
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Árvores de Decisão:
São constituídas por estruturas em árvores que representam um conjunto de decisões;
Os algoritmos de árvores de decisão permitem gerar regras de classificação de dados, baseados na informação guardada na base de dados;
Data Mining
Uma árvore de decisão integra nós, ramos e folhas:
Nos nós, encontram-se os atributos a classificar;
Ramos descrevem os valores possíveis para esses atributos;
As folhas da árvore indicam as diversas classes em que cada registo pode ser classificado;
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
195Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Data Mining
As árvores de decisão podem ainda ser representadas por conjuntos de regras. Cada folha da árvore dá origem a uma regra.
Se Bem Financiado = “Electrodoméstico” e Estado Civil = “Casado” e Rendimento Bruto = “5001 – 10000” então “Conceder”
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Regras de Associação:
As regras de associação permitem encontrar relacionamentos entre os atributos existentes numa base de dados, representando-os na forma de uma regra. Se X então Y ou “X � Y”
Data Mining
Número Produto
1101 Pão
1101 Manteiga
1101 Fiambre
1101 Leite
2201 Pão
2201 Queijo
2201 Leite
3101 Leite
3101 Pão
3101 Queijo
4100 Pão
4100 Manteiga
4100 Leite
Produtos agrupados por compra
Número Produtos
1101 Pão, Manteiga, Fiambre, Leite
2201 Pão, Queijo, Leite
3101 Pão, Queijo, Margarina
4100 Pão, Manteiga, Leite
Exemplo de uma regra:
Pão & Manteiga � Leite (2/4=50%, 1)
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
196Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Excel
Ricardo Campos ([email protected])
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
As tabelas dinâmicas (pivot tables) constituem um recurso do Excel para organizar tabelas ou listas de dados.
Permitem resumir a informação obtida a partir de uma fonte de dados, sem a necessidade de usar fórmulas, mostrando a informação num relatório ou numa tabela interactiva.
O nome “tabela dinâmica” advém da facilidade em trocar a disposição dos dados na tabela, obtendo a informação vista de diferentes perspectivas.
As tabelas dinâmicas constituem-se a partir de tabelas ou listas de dados já existentes e permitem reorganizar os dados com grande flexibilidade e de forma diversificada;
Tabelas Dinâmicas
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
197Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
A funcionalidade Pivot Table é das funcionalidades mais potentes do Excel e permite efectuar um tratamento de dados potente e multidimensional.
Tabelas Dinâmicas
Seleccionando as células seleccione-se o menu Dados
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Tabelas Dinâmicas
Seleccionar a origem dos dados e o tipo de relatório:
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
198Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Tabelas Dinâmicas
Seleccionar as células de origem dos dados:
Seleccionar onde se deseja colocar o relatório
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Aqui pode-se escolher o que se pretende ter nas linhas e o que se pretende ter nas colunas.
Tabelas Dinâmicas
Formatar Relatório Assistente de Gráficos
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
199Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Resultado Final
Tabelas Dinâmicas
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Caso Prático
Pretende-se que os alunos se familiarizem com as análises OLAP usando para tal as tabelas pivot do excel. Existe um conjunto de dados, constantes das fichas práticas, que poderão ser usado para esse fim
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
200Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Considere-se a seguinte tabela:
Caso Prático
Livro: CasoPrático.xls, folha1
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Crie uma tabela dinâmica com o seguinte aspecto:
Caso Prático
Carregue duas vezes em cima do nome Janet para ver o que acontece;
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
201Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Considere agora outro exemplo. Na figura abaixo, encontra-se listado parte do ficheiro relativo à classificação (6 disciplinas) de duas alunas (Elisa e Maria) nos meses de Janeiro, Fevereiro e Março.
Caso Prático
Livro: CasoPrático.xls, folha2
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Caso Prático
Construa a seguinte tabela dinâmica (observe que a mesma diz respeito aos dois alunos considerados e que os valores apresentados dizem respeito à média de classificação)
Considere agora apenas a aluna Elisa e o máximo da classificação:
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
202Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Caso Prático
Utilizar filtros (selecção de alunos):
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Alteração da fórmula de cálculo
Caso Prático
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
203Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Crie o seguinte gráfico:
Caso Prático
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Considere agora a seguinte tabela de vendas:
Caso Prático
Livro: CasoPrático.xls, folha3
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
204Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Caso Prático
Pretende-se apurar o total de vendas realizado por cada funcionário:
Pretende-se apurar o total de vendas realizado por cada funcionário, filtrado por país:
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Caso Prático
Pretende-se apurar o total de vendas realizado por cada funcionário, apresentando os resultado ordenados por valor de venda:
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
205Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Caso Prático
Quais são os 5 melhores vendedores?
Seleccione-se o campo “SalesPerson” e no menu tabela dinâmica o menu “Ordenar as 10 Mais”
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Caso Prático
Seleccionar apenas 5 resultados:
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
206Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Caso Prático
Qual foi o desempenho dos vendedores de UK, em cada um dos trimestres:
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Caso Prático
Qual a variação do desempenho dos vendedores de UK de trimestre para trimestre:
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
207Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Caso Prático
Quais são os detalhes de venda de um utilizador:
Tomando-se como partida esta tabela, basta carregar duas vezes em cima de Sum of Order Amount e é criada automaticamente a lista anterior:
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Caso Prático
Quanto é que cada venda representa em termos de percentagem?
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
208Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Caso Prático
Duplo Clique
Seleccionar Opções: Seleccionar % do total:
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Produza o seguinte gráfico:
Caso Prático
Campos, Ricardo. (2008). Apresentação de Sistemas de Informação. Data
Warehouse, SQL Server Business Intelligence Development Studio. Conceitos
de CRM e Data Mining. Tabelas Dinâmicas no MS Excel. 417 slides.
209Ricardo Campos [http://www.ccc.ipt.pt/~ricardo/]
Sistemas de Informação© Ricardo Campos [ h t t p : / / w w w . c c c . i p t . p t / ~ r i c a r d o ]
Sub-Totais;
Cenários
Atingir Objectivos;
Outras Funcionalidades