pÓs-graduaÇÃo lato sensu gestÃo e tecnologia … · ietec – instituto de educaÇÃo...

36
IETEC – INSTITUTO DE EDUCAÇÃO TECNÓLOGICA PÓS-GRADUAÇÃO LATO SENSU GESTÃO E TECNOLOGIA DA INFORMAÇÃO Business Inteligence: O Papel do Data Warehouse no Processo de Suporte a Tomada de Decisão Alexandre Antônio de Vasconcelos, André Caribé Pinheiro, Ivani Aparecida Alves, Rafael Tardelli Pacheco dos Santos, Wantuil Silva Belo Horizonte, Setembro de 2010

Upload: vanphuc

Post on 02-Dec-2018

217 views

Category:

Documents


0 download

TRANSCRIPT

IETEC – INSTITUTO DE EDUCAÇÃO TECNÓLOGICA

PÓS-GRADUAÇÃO LATO SENSU

GESTÃO E TECNOLOGIA DA INFORMAÇÃO

Business Inteligence: O Papel do Data Warehouse no Processo de

Suporte a Tomada de Decisão

Alexandre Antônio de Vasconcelos,

André Caribé Pinheiro,

Ivani Aparecida Alves,

Rafael Tardelli Pacheco dos Santos,

Wantuil Silva

Belo Horizonte, Setembro de 2010

2

Informações sobre os autores:

Nome: Alexandre Antônio de Vasconcelos.

Titulação Acadêmica: Tecnólogo em Análise de Redes.

Empresa/Instituição: Grupo NC.

E-mail: [email protected]

Nome: André Caribé Pinheiro.

Titulação Acadêmica: Engenheiro Eletricista.

Empresa/Instituição: FIDENS Engenharia SA

E-mail: [email protected] ou [email protected]

Nome: Ivani Aparecida Alves.

Titulação Acadêmica: Administradora de Empresas.

Empresa/Instituição: Maxis Informática Ltda.

E-mail: [email protected]

Nome: Rafael Tardelli Pacheco dos Santos.

Titulação Acadêmica: Bacharel em Ciência da Computação

Empresa/Instituição: Teradata

E-mail: [email protected]

Nome: Wantuil Silva.

Titulação Acadêmica: Tecnólogo em Redes.

Empresa/Instituição: Consite Tecnologia.

E-mail: [email protected]

3

Lista de Figuras

Figura 1: Estrutura do BI ............................................................................................. 8

Figura 2: Exemplo esquema estrela .......................................................................... 13

Figura 3: Exemplo esquema floco de neve ............................................................... 14

Figura 4: Exemplos de tabelas padronizadas e não padronizadas ........................... 15

Figura 5: Valor pontual .............................................................................................. 17

Figura 6: Plano .......................................................................................................... 17

Figura 7: Cubo ........................................................................................................... 18

Figura 8: Representação dos principais conjuntos dimensionais – Modelo

dimensional hierarquizado. ....................................................................................... 19

Figura 9: Representação dos principais conjuntos dimensionais – drill-down, drill-up,

drill-across e drill-through .......................................................................................... 20

Figura 10: Estágios de um Active Data Warehousing ............................................... 21

Figura 11: Janelas ..................................................................................................... 28

Figura 12: Sistemas fonte. ........................................................................................ 29

Figura 13: Sistemas fonte. ........................................................................................ 31

Figura 14: Quadro de evolução do ambiente. ........................................................... 32

4

Sumário

1. Resumo ................................................................................................................ 6

2. Introdução ............................................................................................................ 7

3. Referencial Teórico .............................................................................................. 8

3.1. Business Intelligence (BI) ............................................................................... 8

3.2. Sistema Transacional (OLTP – On-line Transaction Processing) .................. 9

3.3. ETL – Extração, Transformação e Carga (Load) de Dados ......................... 10

3.4. Data Warehouse (DW) ................................................................................. 11

3.5. Data Marts (DM) ........................................................................................... 11

3.6. Modelagem Dimensional de Dados ............................................................. 12

3.7. Sistema OLAP (OLAP – On-line Analytical Processing) .............................. 15

3.8. Operadores Dimensionais ............................................................................ 16

3.8.1. Valor Pontual (Ponto) ............................................................................ 16

3.8.2. Plano (Slicing)........................................................................................ 17

3.8.3. Cubo (Dicing) ......................................................................................... 18

3.8.4. Pivoteamento (Rotação) ........................................................................ 18

3.8.5. Drill-Down e Drill-Up (Roll-up)................................................................ 19

3.8.6. Drill-Across ............................................................................................ 19

3.8.7. Drill-Through .......................................................................................... 20

3.9. Evolução dos Data Warehouses .................................................................. 20

3.9.1. Estágio 1: Reportando ........................................................................... 21

3.9.2. Estágio 2: Analizando ............................................................................ 22

3.9.3. Estágio 3: Predizendo ............................................................................ 22

3.9.4. Estágio 4: Operacionalizando ................................................................ 22

5

3.9.5. Estágio 5: Active Data Warehousing (ADW) .......................................... 23

4. Pesquisa ............................................................................................................ 25

4.1. Entendendo a natureza dos negócios .......................................................... 25

4.2. Motivações para o projeto Inicial .................................................................. 26

4.3. Implementação ............................................................................................. 27

4.4. Active Data Warehousing ............................................................................. 30

4.5. Retorno sobre Investimento ......................................................................... 32

5. Conclusões ........................................................................................................ 34

6. Referências Bibliográficas .................................................................................. 35

6

1. RESUMO

Com a globalização atual do mercado e a aplicação de metódos cada vez mais

agressivos para redução de custos, como terceirização e procura de fornecedores

externos, as empresas vêm encontrando uma concorrência cada vez mais acirrada,

e neste cenário não é possível ficar imóvel as mudanças, é preciso sempre inovar, e

para isto o conhecimento e a análise da informação se transformaram em

ferramentas chave. Utilizada cada dia mais pelas empresas para auxiliar a este fim

está a tecnologia de Business Inteligenge ou Inteligência de Negócios, que se

baseia no processo analítico de informações históricas oriundas de diversas fontes

que são armazenadas em um Data Warehouse (DW). Este, podendo ser

considerado o coração da tecnologia, precisa ter seus conceitos bem entendidos

para que seus processos sejam bem desenvolvidos e implementados. Um projeto de

DW bem realizado é a chave para o sucesso do processo de suporte a tomada de

decisão. Para mostrar o valor do DW neste processo serão apresentados seus

conceitos chave e um estudo de caso bem sucedido, em que a qualidade alcançada

na execução dos processos da empresa e o retorno sobre o investimento puderam

ser mensurados e apresentados.

Palavras chave: Análise da Informação, Tomada de Decisão, Business Inteligence,

Data Warehouse.

7

2. INTRODUÇÃO

A utilização de processos de Business Inteligence, cujo conceito segundo Barbieri

(2001) “é a utilização de várias fontes de informação para se definir estratégias de

competitividade nos negócios da empresa”, vem se tornando cada vez mais comum.

Fazendo uma analogia simples pode-se considerar o Data Warehouse (DW), ou

Armazém de Dados, que é um sistema gerenciador de banco de dados (SGBD)

destinado a sistemas de apoio a decisão, como o coração deste processo. E nele

onde serão armazenadas os dados oriundos de fontes heterogêneas em estruturas

lógicas dimensionais, o que possibilita o seu processamento analítico por

ferramentas especiais (BARBIERI, 2001). É a análise destes dados que agregará

valor a informação e guiará os negócios, portanto o cuidado no tratamento dos

dados, o objetivo que se pretende alcançar com isto e a própria análise em si devem

ser rápidas e bem realizadas.

Para isto é preciso contar com um sistema que exerça a função de suportar a

tomada de decisões. Que forneça uma resposta rápida, com informação precisa

para que a empresa aproveite as oportunidades estando no lugar correto, no

momento oportuno e com a informação correta. Para alcançar este patamar não

pode-se contar apenas com a tecnologia, mas também com técnicas de modelagem

bem realizadas, juntamente com um projeto e objetivos bem estruturados.

Como objetivos deste trabalho serão apresentadas os conceitos da tecnologia de

Data Warehousing, como modelo dimensional, processamento transacional e

analítico, operadores dimensionais e a evolução da tecnologia de DW, ou seja, todos

os elementos que devem ser estudados, projetados e bem implementados para que

seja possível alcançar o sucesso de um projeto de Busines Inteligence. Também

será apresentado um estudo de caso de uma empresa real que mostra como uma

implementação bem realizada de um Data Warehouse pode melhorar os processos

de tomada de decisão e também o retorno sobre o investimento realizado.

8

3. REFERENCIAL TEÓRICO

3.1. BUSINESS INTELLIGENCE (BI)

A história do Business Intelligence que conhecemos hoje, começa na década de 70,

quando alguns produtos de BI foram disponibilizados para os analistas de negócio.

“O grande problema era que esses produtos exigiam intensa e exaustiva

programação, não disponibilizavam informação em tempo hábil nem de forma

flexível, e além de tudo tinham alto custo de implantação” (SERAIN, 2010). Com o

surgimento dos bancos de dados relacionais, dos PC's e das interfaces gráficas

como o Windows, aliados ao aumento da complexidade dos negócios, começaram a

surgir os primeiros produtos realmente direcionados aos analistas de negócios, que

possibilitavam rapidez e uma maior flexibilidade de análise.

- Planejamento

- Estratégia Corporativa

- Scorecards

- Relatórios

- Análise e Datamining

- Data Warehouse

- Data Marts

- Cubos

- Integração de Dados

- ETL

- Dados Transacionais

- Outras Fontes de Dados

Figura 1: Estrutura do BI

Fonte: do autor

9

Business Intelligence, cujo conceito de forma geral “é a utilização de varias fontes de

informação para se definir estratégias de competitividade nos negócios da empresa”

(BARBIERI, 2001). Atualmente várias empresas possuem muitos dados, mas

poucas informações. Devido ao volume sempre crescente desses dados e da forma

que eles se encontram distribuídos na empresa, a dificuldade de se extrair

informações gerenciais para a tomada de decisões é muito grande. Para Microsoft

Business Intelligence “é uma disciplina que, junto com suas ferramentas

correspondentes, são o centro da análise da informação para a correta tomada de

decisões, permitindo que a empresa atinja seus objetivos de negócio” (MICROSOFT,

2010).

3.2. SISTEMA TRANSACIONAL (OLTP – ON-LINE TRANSACTION

PROCESSING)

A Microsoft define os sistemas OLTP como “os sistemas que capturam as

transações de um negócio e as mantêm em estruturas relacionais chamadas Banco

de Dados” (MICROSOFT, 2010). As principais características desses sistemas são

de realizar transações em tempo real, serem responsáveis pela manutenção dos

dados (acrescentando, atualizando e excluindo), serem otimizados de forma a

validar a entrada dos dados rejeitando-os caso não atendam às regras de negócio e

possuem capacidade limitada na busca de informações para tomada de decisões.

Normalmente, para o desenho de um sistema OLTP é definido um modelo de

Diagrama de Relação de Entidades (DRE). Um DRE é uma representação da

realidade através de um esquema gráfico que contém os seguintes elementos:

• Entidades: Uma Entidade é um tipo de objeto que pode ser identificado de

forma única por algum meio. Este objeto é traduzido para a estrutura física de

um banco de dados como uma tabela;

• Atributos: As características particulares que diferenciam as Entidades são

denominadas Atributos;

10

• Relações (ou Relacionamentos): vínculos existentes entre as tabelas que

servem para garantir a integridade referencial;

Para conseguir esquematizar um DRE, deve ser realizado um processo de

normalização baseado nas Formas Normais, que também garante uma otimização

do espaço utilizado no disco.

3.3. ETL – EXTRAÇÃO, TRANSFORMAÇÃO E CARGA (LOAD) DE

DADOS

Os dados que alimentam um Data Warehouse são resultantes de diferentes fontes;

estas fontes são diferentes sistemas OLTP que a empresa possui, geralmente não

homogêneos e não concordando necessariamente com o que é necessário, sendo

necessário realizar todas as adaptações pertinentes (MICROSOFT, 2010).

Ao reunir dados dos diferentes sistemas deve ser definida uma norma única para o

Data Warehouse e realizar as transformações necessárias em cada caso.

Basicamente devem ser realizadas as tarefas de estabelecer as regras que serão

utilizadas para realizar a transformação, detectar as inconsistências que podem

ocorrer ao extrair dados de diferentes fontes e planejar cuidadosamente e com

detalhes a transformação dos dados, que ofereçam como resultado final conjuntos

de dados consistentes. Nas transformações devem-se criar convenções únicas para

codificações (exemplo: sexo M/F ou 0/1 ou “masculino”/”feminino”), unidade de

medida dos atributos (exemplo: litros ou metros cúbicos ou decilitros) e formatos

(exemplo: datas nos formatos “dd/mm/aaaa” ou “mm/dd/aaaa” ou “aaaa/mm/dd”).

Pode ser necessário também armazenar o conteúdo de várias colunas de uma

tabela em uma única coluna (Exemplo: endereço ou nome e sobrenome) ou

armazenar o conteúdo de uma coluna em varias outras colunas (Exemplo: sistemas

mais antigos costumavam colocar o tipo e número de documento no mesmo campo

da tabela).

11

3.4. DATA WAREHOUSE (DW)

Carlos Barbieri define o Data Warehouse (DW) “como um banco de dados,

destinados a sistemas de apoio à decisão e cujos dados foram armazenados em

estrutura lógica dimensionais, possibilitando o seu processamento analítico por

ferramentas especiais (OLAP e Mining)” (BARBIERI, 2001). O Data Warehouse

possibilita a análise de grandes volumes de dados, coletados dos sistemas

transacionais. Por definição, os dados em um Data Warehouse não são voláteis, ou

seja, eles não mudam, exceto quando é necessário fazer correções de dados

previamente carregados. Os dados então são somente para leitura e não podem ser

alterados. As informações são armazenadas em estruturas multidimensionais,

calculando previamente todas as combinações de todos os níveis de todas as

aberturas de análise. É de forma simples, um produto cartesiano que armazena

todas as combinações.

3.5. DATA MARTS (DM)

O termo Data Mart significa “depósitos de dados que atende a certas áreas

específicas da empresa e voltados (também) para o processo decisório gerencial.

Ambos podem ser definidos como espécies do mesmo tipo, ficando a diferença entre

os dois centrada no escopo do projeto e nos limites de suas abrangências”

(BARBIERI, 2001).

A Microsoft define Data Mart como “armazéns de dados com informações de

interesse particular para um determinado setor da empresa” e Data Warehouse

como “o conjunto de armazéns de dados particulares (Data Mart) com informação de

interesse para a empresa em geral” (MICROSOFT, 2010).

12

Data Marts podem ser lógicos, quando represntam visões dentro de uma fonte única

de dados, ou físicos, quando são independentes de outros Data Marts da

corporação.

3.6. MODELAGEM DIMENSIONAL DE DADOS

O alvo das técnicas de Business Intelligence está exatamente na definição de regras

e técnicas para determinar os aspectos adequados destes pacotes de dados,

objetivando agrupá-los em depósitos estruturados de informações. A modelagem de

dados foi um artefato de verdadeira importância no desenvolvimento de estruturas

capazes de serem implantadas e entendidas pelos gerenciadores de bancos de

dados. Mas com a necessidade que surge do aspecto competitivo e busca de

diferenciais de negócio fez com que este método se tornasse inadequado. As suas

características de campos por tabelas normalizadas se mostram imperfeitas para os

processamentos das visões dimensionais.

A estrutura dimensional modifica a ordem da distribuição de campos das tabelas,

possibilitando uma estrutura voltada para os diversos pontos de entradas as

chamadas dimensões. Com isso os dados estarão em uma forma quase estrelar,

onde varias dimensões estão relacionadas com algumas poucas tabelas, criando

uma notação mais objetiva. O produto da modelagem Dimensional é um modelo

conceitual dimensional, formado por tabelas Fato e tabelas Dimensão.

“As tabelas Fato servem para armazenar medidas numéricas associadas a eventos

de negócio. Uma tabela Fato contém vários fatos, correspondentes a cada uma de

suas linhas. Cada fato pode armazenar um ou mais medidas numéricas, que

constituem os valores objetos da análise dimensional. Possuem como chave-

primária, normalmente um campo multi-key, formado pelas chaves-primárias das

dimensões que com ela se relacionam. Normalmente armazenam muito mais linhas

que as tabelas Dimensão, e merecem cuidado especial em função ao seu alto

volume. Contém dados normalmente aditivos (manipulados por soma, média, etc.) e

relativamente estáticos. As tabelas Dimensão representam entidades de negócios e

constituem as estruturas de entradas que servem para armazenar informações como

13

tempo, geografia, produto, cliente, etc. As tabelas Dimensão têm uma relação 1:N

com a tabela Fato, e possuem um número significativamente menor de linhas do que

as tabelas Fato. Possuem múltiplas colunas de informação, algumas das quais

representam sua hierarquia. Apresentam sempre uma chave primária, que lhes

confere unicidade, chave essa que participa das tabelas Fato, como parte da sua

chave múltipla. Devem ser entendidas como as tabelas que realizam os filtros de

valores aplicados na manipulação dos fatos e por onde as consultas entram no

ambiente do DW/DM.” (BARBIERI, 2001).

Para facilitar a análise, o DW/DM tem seus dados organizados em uma estrutura

chamada estrutura estrela. Essa estrutura é formada por uma tabela central (tabela

de Fatos) e um conjunto de tabelas organizadas ao seu redor (tabelas de

Dimensões). São características desse esquema:

• O centro da estrela é a tabela de Fatos;

• As pontas da estrela são as tabelas de Dimensões;

• Cada esquema está formado por apenas uma tabela de Fatos;

• Geralmente é um esquema totalmente não normalizado e pode estar

parcialmente normalizado nas tabelas de Dimensões.

Na Figura 2 é apresentada uma estrutura estrela considerando a necessidade de

analisar como evolui a Admissão de Pacientes (Fato) por serviço, pacientes e região

geográfica (Dimensões) ao longo do tempo.

Figura 2: Exemplo esquema estrela

Fonte: do autor

14

A estrutura floco de neve é uma variação da estrutura estrela onde alguma ponta da

estrela explode em mais tabelas. Nesta estrutura, as tabelas de Dimensão floco de

neve estão normalizadas para eliminar redundância de dados.

Diferente da estrutura estrela, nesta estrutura os dados das dimensões são

distribuídos em múltiplas tabelas. Como vantagem destaca-se a economia de

espaço no armazenamento em disco, porém com um aumento na quantidade de

tabelas.

As características a seguir são parte de uma estrutura floco de neve:

• A Dimensão é normalizada;

• Os diferentes níveis estão armazenados em tabelas separadas;

• Verifica-se economia de espaço.

Na Figura 3Figura 2 é apresentado um exemplo onde a dimensão “Região

Geográfica” apresenta uma estrutura floco de neve.

Figura 3: Exemplo esquema floco de neve

Fonte: do autor

15

Na Figura 4 é apresentado um exemplo de tabela normalizada e tabela não

normalizada. Na tabela normalizada os dados “nome do país” e “nome do estado”

aparecerão apenas uma vez nas tabelas “País” e “Estado”, respectivamente,

enquanto na tabela não normalizada, ocorrerão redundâncias de informações, pois

os dados de País e Estado serão repetidos para cada Cidade.

Cidade

ID_Cidade

ID_Estado

CidadeEstado

ID_Estado

Estado

ID_Pais Estado1

ID_Pais

Pais

Cidade1

ID_Pais

Pais

ID_Estado

Estado

ID_Cidade

Cidade

Tabela Padronizada Tabela não Padronizada

Figura 4: Exemplos de tabelas padronizadas e não padronizadas

Fonte: do autor

3.7. SISTEMA OLAP (OLAP – ON-LINE ANALYTICAL

PROCESSING)

Os sistemas OLAP (On-Line Analytical Processing, ou Processamento Analítico On-

line) oferecem uma alternativa aos sistemas transacionais, proporcionando uma

visão dos dados orientada à análise, além de uma navegação rápida e flexível

(MICROSOFT, 2010).

As principais características da tecnologia OLAP são:

16

• Bancos de dados com um esquema otimizado para que os resultados das

consultas sejam entregues rapidamente;

• Os cubos OLAP armazenam vários níveis de dados formados por estruturas

altamente otimizadas que atendem às expectativas de negócio da empresa;

• Um sistema OLAP está preparado para realizar relatórios complexos de uma

forma simples;

• O OLAP proporciona uma visão multidimensional dos dados. Os cubos

oferecem uma visão multidimensional dos dados que vai além da análise de

duas dimensões, oferecida por uma simples planilha de cálculo utilizada como

tal;

• Os usuários podem modificar facilmente as filas, as colunas e as páginas nos

relatórios do OLAP, sendo possível visualizar a informação da forma que seja

mais conveniente para análise;

3.8. OPERADORES DIMENSIONAIS

Após ter apresentado as técnicas de modelagem dimensional e o conceito inicial de

OLAP, é importante realizar uma pequena introdução ao conceito de Operadores

Dimensionais, que são técnicas de manuseio dos dados dimensionais que serão

usualmente utilizadas em consultas OLAP.

3.8.1. VALOR PONTUAL (PONTO)

Este valor apresenta a interseção de valores da tabela fato em relação aos três

eixos, ou dimensões.

17

Figura 5: Valor pontual

Fonte: do autor

3.8.2. PLANO (SLICING)

O plano representa uma fatia do Cubo, em que duas dimensões variam com uma

outra dimensão fixa.

Figura 6: Plano

18

Fonte: do autor

3.8.3. CUBO (DICING)

O conceito de Dicing apresenta os valores com todas as dimensões variando.

Figura 7: Cubo

Fonte: do autor

3.8.4. PIVOTEAMENTO (ROTAÇÃO)

No pivoteamento, ou rotação, ocorre a mudança dos eixos das dimensões para fins

de visualização. Deve-se lembrar que para fins de representação só foram

mostradas trê dimensões, mas um modelo real pode possuir n dimensões.

19

3.8.5. DRILL-DOWN E DRILL-UP (ROLL-UP).

O conceito de Drill-Down está relacionado com a ação de sair do topo de uma

hierarquia em direção ao dado mais detalhado, como por exemplo mudar a consulta

do total de vendas de determinado produto por mês para o total de vendas por dia.

Drill-Up representa o caminho inverso (Figura 8).

Figura 8: Representação dos principais conjuntos dimensionais – Modelo dimensional hierarquizado.

Fonte: Barbieri, 2001, p. 42.

3.8.6. DRILL-ACROSS

Trata da iteração entre diferentes tabelas fato. Isso só será possível se ambos

possuírem alguma dimensão em comum.

20

Figura 9: Representação dos principais conjuntos dimensionais – drill-down, drill-up, drill-across e drill-through

Fonte: Barbieri, 2001, p. 43, 44.

3.8.7. DRILL-THROUGH

Referente à necessidade de obter informações em um nível de detalhes menor do

que o expressado na tabela fato. Normalmente obtido com consultas diretas nas

tabelas do modelo relacional, quando estas também são carregadas do DW (Figura

9).

3.9. EVOLUÇÃO DOS DATA WAREHOUSES

Atualmente está acontecendo uma evolução da informação nos ambientes de DW.

Mudanças nos requerimentos de negócios demandam que as tecnologias de DW

realizem terefas mais rapidamente. Data Warehouses estão passando de sistemas

que processam consultas analíticas para sistemas que realizam processos

operacionais críticos para os negócios, suportando CRMs, operações de marketing e

decisões em tempo real. A Teratada (2008), líder no mercado de DW, define um

21

Active Data Warehouse como um “conjunto integrado e logicamente consistente de

dados atualizados detalhados disponibilizados para o suporte a decisão estratégico,

tático e guiado por eventos.” Também define estas decisões tomadas no

gerenciamento do dia-a-dia como Suporte a Decisão Tática, e apresenta os estágios

que devem ser alcançados para se atingir o nível de um Active Data Warehouse, ou

seja, um DW que suporta a tomada de decisão em tempo real (Figura 10).

Figura 10: Estágios de um Active Data Warehousing

Fonte: Adaptação de TERADATA (2008)

3.9.1. ESTÁGIO 1: REPORTANDO

O estágio inicial tipicamente foca em relatórios de uma única fonte para guiar o

suporte à decisão através das fronteiras funcionais ou de produtos/serviços.

Questões normalmente são conhecidas antecipadamente, como por exemplo um

relatório de vendas semanal.

22

3.9.2. ESTÁGIO 2: ANALIZANDO

O foco está no porque algo aconteceu, como por exemplo, na resposta do por que

as vendas foram baixas ou no descobrimento de padrões dos hábitos de compra dos

clientes. Usuários realizam análises Ad Hoc, Slicing e Dicing em dados detalhados.

Questões não são conhecidas antecipadamente como a soma das vendas de

determinada semana por exemplo.

3.9.3. ESTÁGIO 3: PREDIZENDO

Análises pesadas e sofisticadas são realizadas no ambiente para trazer informações

preditivas sobre o que acontecerá em seguida nos negócios. Este tipo de informação

irá auxiliar o gerenciamento pró-ativo da estratégia da organização. Este estágio

requer ferramentas de Data Mining e a construção de modelos preditivos usando

informações históricas detalhadas. Como exemplo os analistas podem criar um

modelo da geografia dos clientes para realizar marketing estratégico.

3.9.4. ESTÁGIO 4: OPERACIONALIZANDO

Este estágio provê acesso imediato à informação para os tomadores de decisão da

empresa. Estágios de 1 a 3 focam em decisões estratégicas dentro da organização.

O estágio 4 foca no suporte a decisão tático. Suporte a decisão tática não é focada

no desenvolvimento da estratégia corporativa, mas sim no suporte as pessoas nos

campos que a executam. Exemplo:

• Gerenciamento de inventório com substituições just-in-time;

• Agendamento e roteamento de entrega de pacotes;

• Alteração de campanhas com base em resultados correntes.

23

3.9.5. ESTÁGIO 5: ACTIVE DATA WAREHOUSING (ADW)

Quanto maior o papel do ADW nos aspectos operacionais de suporte a decisão,

maior é o incentivo dos negócios para a automação de processos decisórios. Pode-

se automatizar a tomada de decisão quando um cliente interage com um site web.

CRM interativo em um site disponibilizado para o cliente ou iterações com um caixa

eletrônico podem disparar decisões para otimizar o relacionamento com o cliente

através de oferta de produtos, preços especiais, entrega de envio de informações

específicas e assim por diante. Com o desenvolvimento da tecnologia, mais e mais

decisões são tomadas pelo acionamento de gatilhos (triggers) baseados em

eventos, como por exemplo, determinar a melhor oferta para um cliente específico

baseada num evento em tempo real, como um depósito significante em um caixa

eletrônico.

Para suportar este novo tipo de decisão dos negócios de hoje em dia, é preciso mais

do que apenas uma abordagem estratégica na implementação de um Data

Warehouse. É necessário um uso mais efetivo da informação para decisões que

podem ser tomadas centenas de vezes durante o dia

O conceito de Active Data Warehouse surgiu com a necessidade do

armazenamaneto e disponibilização em tempo quase real de dados detalhados para

análise do negócio e tomada de decisião (TERADATA, 2008). Estes processos são

suplementares as funcionalidades típicas de um DW. Por exemplo, o mix típico de

trabalho processado em um ambiente de DW continua contendo consultas analíticas

(OLAP), mas é expandido para processar consultas táticas curtas, carga de dados

em segundo-plano (background) e possivelmente atualizações baseadas em

eventos, tudo ao mesmo tempo. O volume de dados e a concorrência de usuários no

ambiente pode com isto crescer muito acima das expectativas. Isto faz com que o

SGBD tenha que possuir recursos tecnológicos para realizar uma administração

eficiente dos processos em execução já que consultas curtas em dados detalhados,

apesar de não serem importantes em uma análise analítica agora podem ser muito

importantes, pois podem disparar um evento de compra de ações na bolsa de

24

valores por exemplo. Com isto os SGBDs utilizados para processos de Data

Warehouse no mercado têm que estar cada vez mais preparados para lidar com os

seguintes itens:

• Cargas de trabalho mistas (consultas táticas e estratégicas) para aplicativos

de missão crítica;

• Grandes volumes de dados detalhados;

• Grande número de usuários concorrentes.

25

4. PESQUISA

Para mostrar o valor que um projeto de BI pode agregar aos negócios pelo seu

poder de suporte a decisão, será apresentado um estudo de caso real de

implementação de um Data Warehouse em uma compania aérea de grande porte, e

o retorno obtido com este projeto (TERADATA, 2010).

A compania em questão é a Continental Airlines. A quinta maior compania aérea

americana e uma das maiores do mundo, que no ano de 2010 anunciou fusão com

outra grande compania aérea americada, a United Airlines. A continental opera vôos

para localidades nas Américas, Europa, Ásia e Oceania, transportando mais de 50

milhões de passageiros por ano.

4.1. ENTENDENDO A NATUREZA DOS NEGÓCIOS

A Continental, hoje uma empresa conceituada com mais de 49.000 empregados,

passou por sérias dificuldades nos anos 80, o que levou a uma completa

reformulação de suas estratégias de negócios. Como ponto chave desta nova

estratégia, criou um plano divido em 4 partes interrelacionadas que lidam com

produtos, finanças, mercado, pessoas e que guiam a empresa até os dias de hoje:

• Voar para vencer.

• Entender quais produtos os clientes desejam e quanto desejam pagar por

eles.

• Financiar o Futuro

• Gerenciar custos e caixa para que a compania continue a operar

• Fazer da rentabilidade uma realidade

• Levar os clientes em seus destinos com segurança, no tempo esperado e

com sua bagagem.

• Trabalhar Juntos

26

• Criar uma cultura em que pessoas tenham satisfação com o trabalho.

Em meados dos anos 90 a empresa já estava num patamar muito diferente do

passado, mas para continuar se transformando e se adaptando as mudanças de

mercado, assim como outras empresas, o suporte da área de TI se tornou

fundamental.

Em 1995 a empresa possuia apenas um relatório de performance diário, fornecido

por empresa terceirizada, sem detalhes financeiros e com dados detalhados

históricos inacessíveis. Cada área possuia seu próprio gerenciamento dos dados, o

que os tornava inconcistentes, e não existia estrutura corporativa que permitisse a

usuários importantes, acesso rápido as informações chave dos negócios da

empresa. Com a visão de que a compania deveria disponibilizar acesso rápido a

toda a informação de que os funcionários necessitavam, e acreditando que com a

informação certa, as pessoas não apenas tomariam melhores decisões mas também

descobririam novas oportunidades, a direção da empresa decidiu investir num Data

Warehouse corporativo (EDW – Enterprise Data Warehouse), construído e

administrado internamente.

4.2. MOTIVAÇÕES PARA O PROJETO INICIAL

A etapa incial da implementação, partiu da área de Gestão da Receita (Revenue

Assurance). A Análise da receita de um vôo era restrita a demanda de apenas um

trecho, os seja, a empresa não conseguia rastrear um itenerário da origem ao

destino se houvesse mais de uma escala. Isto ocorria por não haver acesso à

informação integrada detalhada como agendamento, reservas, dados do cliente,

inventório, tabelas de valor de mercado, etc. Os dados históricos eram inferiores a

um ano, portanto análises de tendências eram ineficazes. Devido a estas

particularidades esta área foi implementada no DW como o primeiro Data Mart da

companhia.

Um item importante na continuidade da expansão do Data Warehouse, foi a criação

de uma equipe de Marketing de Relacionamento com os Clientes (Customer

Relationship Marketing). Até a implementação do DW, não era possível determinar

27

quão valiosos os clientes eram e como predizer ou influenciar seu comportamento.

Quando um cliente entrava em contato com o setor de vendas de passagens, não

havia como os atendentes saberem se era um cliente ocasional ou um cliente

especial, nem mesmo informações sobre agendamentos ou histórico da bagagem. A

informação era limitada e muitas vezes incorreta.

A implementação da gestão da receita juntamente com o relacionamento do cliente

começaram a mostrar o valor do EDW, valores que dependendo do planejamento e

implementação do projeto podem ser difíceis de serem percebidos, portanto como

era de se esperar o projeto começou a crescer

4.3. IMPLEMENTAÇÃO

Para suportar o ambiente do Data Warehouse foi escolhido o SGBD Teradata, líder

de mercado neste segmento. Um ambiente inical de 8TB, suportando 1292 usuários

que acessam 42 áreas e 29 aplicações.

O primeiro Data Mart implementado, como visto anteriormente, foi o de gestão da

receita. Para este trabalho, após um grande esforço de melhoria na qualidade dos

dados, como o tratamento da entrada de informações nos aplicativos, as principais

tabelas dos sistemas fonte foram mapeadas e carregadas no DW em sua forma

normalizada. O modelo dimensional era criado e mantido carregado para algumas

consultas frequentes, para fins de desempenho, ou apenas criado e carregado

dinamicamente por meio de tabelas temporárias para análises Ad Hoc. Este tipo de

recurso economiza tempo devido aos dados normalizados estarem carregados no

DW.

Após a implementação do primeiro Data Mart e dos ganhos percebidos, o ambiente

começou a evoluir.

Dados de 25 sistemas operacionais internos e de duas fontes externas passaram a

ser carregados no ambiente. Para utilizar estes dados um grande projeto de ETL

teve de ser realizado. Mais uma vez os dados foram avaliados a fim de garantir sua

qualidade ao serem carregados do DW.

28

Algumas fontes disponibilizavam os dados para serem carregados quase em tempo

real, funcionalidade permitida pelo software Tpump do Teradata, que permite que se

estipule uma letência no carregamento, colocando assim o mínimo de travas

necessários nas tabelas alvo, a fim de permitirem que análises possam rodar sem

impactos durante as cargas. Já alguns sistemas disponibilizavam os dados para

serem carregados no modo Batch. Estas abordagens foram baseadas nas

capacidades dos sistema fonte para disponibilização dos dados e nos requerimentos

dos negócios para atendimentos de metas de tempo. Para separar os dados Batch

das consultas de usuários, foram criadas duas janelas, a de consulta (User Window)

e de carga (Batch Window). O SGBD utilizado pode gerênciar os pesos e restrições

a serem aplicados de acordo com a janela.

Janela

Usuário

(User)

Batch

(Carga)

Período

08:00 -

20:00

20:01 -

07:59

Figura 11: Janelas

Fonte: dados da pesquisa

29

Alguns dos principais sistemas fonte podem ser vistos na figura a seguir.

Sistemas fonte

Schedules

Inventory

Reservations

Airline tickets

Airline revenue flown information

SOCC(Systems Operation

Coordination Center)

One Pass (frequent flyer program)

Customer profiles and demographics

Aircraft maintenance

Alliance data

Employee and crew payroll

Customer care

Figura 12: Sistemas fonte.

Fonte : dados da pesquisa

Com a inclusão de mais Data Marts, mais aplicações foram desenvolvidas, entre

elas:

• Gerenciamento de Receita: Provê projeções de receita em tempo real para

qualquer vôo baseado em dados detalhados. Com isto decisões de preço e

agendamento podem ser tomadas e a associação entre rotas e aeronaves

pode ser otimizada.

30

• Customer Relationship Management: Provê uma visão única e integrada de

cada cliente, apresentando com isto uma visualização apurada e atualizada

da importância de cada cliente.

• Flight Management Dashboard: Rastreamento de cada vôo e mapeamento

dos vôos atrasados, informação base para decisões que influenciam

diretamente na satisfação dos clientes e no rendimento da compania.

• Detecção de Fraude: Identifica reservas não tarifadas e comprimento de

contratos, assim como reservas suspeitas e transações de bilhetes.

4.4. ACTIVE DATA WAREHOUSING

Disponibilizar a informação em tempo real foi uma peça chave na estratégia dos

negócios da empresa. Esta decisão veio do fato de que a Continental percebeu que

se os dados operacionais tivessem mesmo que um dia de “idade”, situações críticas

não poderiam ser analizadas e encaminhadas para as áreas responsáveis no

decorrer do dia. Clientes especiais não poderiam ser identificados e tratados como

deveriam para que continuassem leais a compania e aos negócios. Respostas a

atrasos e novas reservas de vôos de conexão não poderiam ser feitas rápido o

suficiente. Aviões com muitos lugares vagos poderiam decolar enquando

passageiros poderiam ser impedidos de embarcar devido à overbooking. Com

informações atualizadas (quase) em tempo real, muitos destes problemas logísticos

e operacionais poderiam ser resolvidos a tempo.

Graças a esta visão a arquitetura de demanda do ambiente de DW foi planejada

desde as primeiras fases de design na introdução do ambiente. Processos de ETL

foram planejados, automatizados e monitorados por uma equipe de 15 pessoas

especialistas em TI.

Em meados de 2001 os dados em tempo real foram finalmente disponibilizados ao

DW para todas as aplicações vistas anteriormente. Enquanto isto consultas

estratégicas utilizando dados históricos também eram utilizadas. Na Figura 13 pode-

se observar uma visão macro do ambiente de DW.

31

Figura 13: Sistemas fonte.

Fonte: dados da pesquisa

Devido à importância que o DW passou a ter para a empresa foi decidido que o

ambiente passasse a operar na escala 24x7 (24 horas, 7 dias da semana) com

recursos de alta disponibilidade como redundância de servidores para evitar

paradas. Na Figura 14 pode-se visualizar a evolução do ambiente.

32

Ano 1998 2001 2010

Usuários 45 968 1292

Tabelas 754 5851 16226

Áreas (Data

Marts) 11 33 42

Aplicações 0 12 29

Equipe DW 9 15 15

Figura 14: Quadro de evolução do ambiente.

Fonte: dados da pesquisa

4.5. RETORNO SOBRE INVESTIMENTO

Uma das terafas mais complicadas em projetos de TI é a parte de avaliação do

Retorno sobre o Investimento realizado (ROI – Return Over Investment). Muitas

vezes é possível obter uma percepção de melhoria com determinada

implementação, seja ela na velocidade com que os processos são executados ou na

própria organização dos mesmos, mas dependendo de sua natureza, a tarefa de

mensurar esta percepção em valores exatos é árdua e muitas vezes até impossível.

Isto se deve ao fato de normalmente não possuirmos um cenário bem controlado

antes da implementação ou até mesmo devido ao fato da própria empresa não

realizar este levantamentamento após a implementação.

Esta dificuldade torna-se um pouco menos árdua, ou pelo menos um pouco mais

precisa quanto a implementação do projeto de BI na emresa desta pesquisa, devido

ao fato das informações táticas ou estratégicas, afetarem em tempo real os

processos da empresa, como por exemplo, na distribuição de passageiros entre as

aeronaves.

33

Devido a esta característica, e também ao esforço realizado para isto, foi possível

mapear e estipular na Continental Airlines, o retorno sobre o investimento realizado

no projeto de BI, com destaque especial para os itens apresentados a seguir:

• Economia de U$ 20 milhões em capital e de U$ 15 milhões em utilização de

Data Centers.

• Economia anual de U$ 31 milhões em operações do negócio como resultado

direto da utilização do EDW.

• Aumento de receita estimado em U$ 40 milhões em 2002 devido as novas

aplicações de Gerenciamento de Receita, Detecção de Fraude, Folha de

pagamento da tripulação e CRM.

• U$ 5 milhões de incremento de receita com o mapeamento e previsão de

demanda conforme origem e destino.

• Economia anual de U$ 10 milhões como resultado do aperfeiçoamento da

habilidade de medir o impacto da venda de tarifas.

• Economia de U$ 20 milhões devido a mellhoria do suporte a decisão e

sistemas de agendamento baseados em demanda e overbooking.

• U$ 30 milhões economizados em 3 anos devido a prevenção de fraudes e 7

milhões reembolsados.

• De U$ 15 a U$ 18 milhões economizados e de aumento de receita como

resultado de promoções melhor planejadas.

Nos primeiros cinco anos de operação, conforme informado pela empresa, o EDW

alcançou um ROI de mais de 1000% em relação aos U$ 25 milhões investidos

inicialmente. A empresa não só obteve um substâncial retorno quantitativo direto

sobre seu investimento como também obteve reconhecimento do mercado por meio

de prémios e ótimas avaliações.

Estes foram alguns valores possíveis de se mensurar e que mostram diretamento o

benefício de um projeto bem realizado de Busines Inteligence. É necessário manter

em mente que também são agregados valores qualitativos difíceis de mensurar mas

34

muito importantes para os negócios, como melhoria na qualidade do atendimento,

aumento da satisfação dos clientes e dos próprios funcionários entre outros.

5. CONCLUSÕES

Este trabalho apresentou os conceitos de BI e de Data Warehouse, coração desta

tecnologia. Foi mostrado a importância de um bom planejamento, do correto

entendimento dos negócios da empresa juntamente com um estudo de caso bem

sucedido no qual foi possível mensurar o retorno sobre o investimento da

implementação. Devido ao tempo necessário para o projeto, implementação e

avaliação dos resultados obtidos com um DW, não foi possível apresentar na parte

de pesquisa deste trabalho um estudo de caso de implementação realizado pelos

autores, tendo os mesmos que optar pela apresentação de um estudo de caso de

uma grande empresa do ramo de Data Warehouse.

Para que implementações de BI sejam bem sucedidas como a apresentada, é

importante que todos os fatores vistos sejam bem avaliados e planejados, assim

como o objetivo que se pretende alcançar com a implementação em si.

Valores agregados com a implementação, como satisfação e qualidade são por

vezes difíceis de mensurar e isso torna difícil a afirmação de que a implementação

foi bem sucedida quando estes são os únicos valores adquiridos.

A integração da tecnologia de BI com outros sistemas, como o CRM, é vista como

muito benéfica e é cada vez mais adotada pelas empresas que querem melhorar

seus processos de tomada de decisão.

Um projeto de BI demanda recursos financeiros e de mão de obra qualificada e

também tempo razoável entre o estágio de levantamento de requisitos até o estágio

de elaboração de relatórios gerenciais e de um Active Data Warehouse, tornando o

apoio da alta direção um dos fatores fundamentais para o sucesso.

35

6. REFERÊNCIAS BIBLIOGRÁFICAS

BARBIERI, Carlos. BI – Business Intelligence: Modelagem & Tecnologia. Rio de

Janeiro: Editora Axcel Books, 2001.

Microsoft. Academia Microsoft Technet - Business Intelligence. Disponível em:

<http://www.technetbrasil.com.br/academia2007/bi/Secure/Mod1.aspx>. Acesso em:

14 de julho de 2010.

SERAIN, João Sidemar. Por que Business Intelligence? Disponível em:

<http://imasters.uol.com.br/artigo/5415/bi/por_que_business_intelligence>. Acesso

em: 14 de julho de 2010.

TERADATA. Introduction to the Teradata Database. Disponível em:

<http://www.teradatau.courses.teradata.com/learning/BLADE%5FMS/legacy/18109%

5FIntrotoTeradata/wbt-printmod00.htm>. Acesso (restrito) em: 10 de março de 2008.

TERADATA. Case Study > Data Warehousing: Continental Airlines. Disponível em:

<http://www.teradata.com/t/case-studies/Continental-Airlines-Case-Study-

eb4349/?type=CS>. Acesso em: 01 de setembro de 2010.

36

Autorização de Divulgação de Trabalho Técnico

AUTORIZAÇÃO DE PUBLICAÇÃO

AUTORIZAMOS A PUBLICAÇÃO DE NOSSO TRABALHO NA

INTERNET, JORNAIS E REVISTAS TÉCNICAS DO IETEC.

NÃO AUTORIZAMOS A PUBLICAÇÃO OU DIVULGAÇÃO DO

NOSSO TRABALHO.

BELO HORIZONTE, 16/09/2010

CURSO: GESTÃO E TECNOLOGIA DA INFORMAÇÃO

SEMESTRE/ANO: 1º DE 2010

TURMA: 15

TÍTULO DO TRABALHO: BUSINESS INTELIGENCE: O PAPEL DO

DATA WAREHOUSE NO PROCESSO DE SUPORTE A TOMADA DE

DECISÃO

NOME DOS PARTICIPANTES ASSINATURA

Alexandre Antônio de Vasconcelos

André Caribé Pinheiro

Ivani Aparecida Alves

Rafael Tardelli Pacheco dos Santos

Wantuil Silva