extraÇÃo de conhecimento no sistema de comÉrcio …

152
EXTRAÇÃO DE CONHECIMENTO NO SISTEMA DE COMÉRCIO ELETRÔNICO DA LIVRARIA EMBRAPA Natália Santos Fois Dissertação de Mestrado apresentada ao Programa de Pós-graduação em Engenharia Civil, COPPE, da Universidade Federal do Rio de Janeiro, como parte dos requisitos necessários à obtenção do título de Mestre em Engenharia Civil. Orientador: Nelson Francisco Favilla Ebecken Rio de Janeiro Setembro de 2011

Upload: others

Post on 13-Jan-2022

1 views

Category:

Documents


0 download

TRANSCRIPT

EXTRAÇÃO DE CONHECIMENTO NO SISTEMA DE COMÉRCIO ELETRÔNICO DA

LIVRARIA EMBRAPA

Natália Santos Fois

Dissertação de Mestrado apresentada ao Programa

de Pós-graduação em Engenharia Civil, COPPE, da

Universidade Federal do Rio de Janeiro, como parte

dos requisitos necessários à obtenção do título de

Mestre em Engenharia Civil.

Orientador: Nelson Francisco Favilla Ebecken

Rio de Janeiro

Setembro de 2011

EXTRAÇÃO DE CONHECIMENTO NO SISTEMA DE COMÉRCIO ELETRÔNICO DA

LIVRARIA EMBRAPA

Natália Santos Fois

DISSERTAÇÃO SUBMETIDA AO CORPO DOCENTE DO INSTITUTO ALBERTO

LUIZ COIMBRA DE PÓS-GRADUAÇÃO E PESQUISA DE ENGENHARIA (COPPE)

DA UNIVERSIDADE FEDERAL DO RIO DE JANEIRO COMO PARTE DOS

REQUISITOS NECESSÁRIOS PARA A OBTENÇÃO DO GRAU DE MESTRE EM

CIÊNCIAS EM ENGENHARIA CIVIL.

Examinada por:

________________________________________________

Prof. Nelson Francisco Favilla Ebecken, D.Sc.

________________________________________________

Profª Beatriz de Souza Leite Pires de Lima, D.Sc.

________________________________________________

Prof. Elton Fernandes, Ph.D.

RIO DE JANEIRO, RJ - BRASIL

SETEMBRO DE 2011

iii

Fois, Natália Santos

Extração de Conhecimento no Sistema de Comércio

Eletrônico da Livraria Embrapa / Natália Santos Fois. –

Rio de Janeiro: UFRJ/COPPE, 2011.

XIII, 139 p.: il.; 29,7 cm.

Orientador: Nelson Francisco Favilla Ebecken.

Dissertação (mestrado) – UFRJ/ COPPE/ Programa de

Engenharia Civil, 2011.

Referências Bibliográficas: p. 85-88.

1. Business Intelligence. 2. Regras de Associação 3.

Metodologia CRISP-DM. I. Ebecken, Nelson Francisco

Favilla. II. Universidade Federal do Rio de Janeiro,

COPPE, Programa de Engenharia Civil. III. Título.

iv

Dedico este trabalho à minha filha Lívia que, com seus três meses de vida, sorri, e faz

tudo valer a pena...

v

AGRADECIMENTOS

Agradeço ao meu marido, Virgílio, pela paciência em momentos impacientes.

Aos meus pais, Antônio e Vera, por tudo o que já fizeram e ainda fazem por

mim. Um agradecimento especial à minha mãe Vera, pela grande e fundamental ajuda

nesses meses de incertezas.

Ao meu amigo Valmir dos Santos Sobral, um dos responsáveis e incentivador

constante deste Mestrado.

À gerência da Embrapa Informação Tecnológica, pelo apoio sem restrições

dado ao projeto.

Aos colegas da Embrapa, pelo trabalho em equipe e pela amizade.

Aos colegas do Mestrado, especialmente, à amiga Ângela Moulin, pelo

incentivo e horas de estudo.

Ao meu orientador, Nelson Francisco Favilla Ebecken, pelo apoio.

Acima de tudo, a Deus, que me presenteia a cada dia com o que eu jamais

imaginei poder ter.

E, finalmente, meus agradecimentos a todos os que colaboraram, direta ou

indiretamente, para a realização deste trabalho.

vi

Resumo da Dissertação apresentada à COPPE/UFRJ como parte dos requisitos

necessários para a obtenção do grau de Mestre em Ciências (M.Sc.)

EXTRAÇÃO DE CONHECIMENTO NO SISTEMA DE COMÉRCIO ELETRÔNICO DA

LIVRARIA EMBRAPA

Natália Santos Fois

Setembro/2011

Orientador: Nelson Francisco Favilla Ebecken

Programa: Engenharia Civil

Este trabalho descreve a implementação de um sistema de Inteligência de

Negócios, envolvendo a construção de um repositório de dados e a aplicação de

ferramentas OLAP (On-Line Analytical Processing), para o processo de negócio da

Livraria Embrapa, operacionalizado por seu sistema de comércio eletrônico. O estudo

é complementado pela aplicação de regras de associação para a análise da cesta de

compras da Livraria. O objetivo é obter, ao final, informações e conhecimento úteis ao

negócio e aos seus complexos processos de tomada de decisão.

Além disso, o presente estudo baseia-se na metodologia CRISP-DM (Cross-

Industry Standard Process for Data Mining) como orientadora e direcionadora do

trabalho, e demonstra como esta metodologia, criada originalmente para os processos

de mineração de dados, pode ser customizada para ser utilizada na implementação de

sistemas de inteligência de negócios.

Os resultados mostraram que a aplicação conjunta das técnicas de mineração

de dados e de inteligência de negócios amplia, de forma significativa, a gama de

possibilidades de análises, contribuindo para a melhoria do negócio e sua evolução da

fase de controles quantitativos para a análise qualitativa da gestão, em tempo hábil

para a tomada de decisão.

vii

Abstract of Dissertation presented to COPPE/UFRJ as a partial fulfillment of the

requirements for the degree of Master of Science (M.Sc.)

KNOWLEDGE EXTRACTION FOR ELECTRONIC COMMERCE SYSTEM OF

EMBRAPA BOOKSTORE

Natália Santos Fois

September/2011

Advisor: Nelson Francisco Favilla Ebecken

Department: Civil Engineering

This paper describes the implementation of a Business Intelligence system,

involving a data warehouse construction and the application of OLAP (On-Line

Analytical Processing) tools, to the Embrapa Bookstore’s business processes operated

by its e-commerce system. The study is complemented by the application of

association rules in the market-basket analysis. The aim is to get, in the end, useful

information and knowledge to the business and its complex decision-making

processes.

Furthermore, this study is based on the CRISP-DM (Cross-Industry Standard

Process for Data Mining) methodology to guide and direct the work, and demonstrates

how this methodology, originally developed for data mining processes, can be

customized to be used in the implementation of business intelligence systems.

The results showed that the joint application of data mining and business

intelligence’s techniques expands, in a significant way, the range of possibilities for

analysis, helping to improve the business and its evolution from quantitative control

analysis phase to the management qualitative analysis phase, in a timely manner for

decision-making.

viii

SUMÁRIO

RESUMO........................................................................................................................vi

ABSTRACT...................................................................................................................vii

LISTA DE FIGURAS.......................................................................................................x

LISTA DE TABELAS....................................................................................................xii

LISTA DE SÍMBOLOS OU NOMENCLATURA...........................................................xiii

CAPÍTULO 1. INTRODUÇÃO ......................................................................................1

1.1. Motivação......................................................................................................2 1.2. Metodologia e Recursos Tecnológicos ..........................................................3 1.3. Organização do Trabalho ..............................................................................3

CAPÍTULO 2. A LIVRARIA EMBRAPA .......................................................................4

CAPÍTULO 3. METODOLOGIA....................................................................................6

3.1. A Metodologia CRISP-DM.............................................................................6 3.1.1. Entendimento do Negócio......................................................................7 3.1.2. Entendimento dos Dados.......................................................................8 3.1.3. Preparação dos Dados ..........................................................................9 3.1.4. Modelagem............................................................................................9 3.1.5. Avaliação............................................................................................. 10 3.1.6. Disponibilização................................................................................... 10

CAPÍTULO 4. APLICAÇÃO NA LIVRARIA EMBRAPA............................................. 12

4.1. Entendimento do Negócio ........................................................................... 12 4.1.1. Determinar os objetivos do negócio..................................................... 12 4.1.1.1. A Estrutura Organizacional .................................................................. 12 4.1.1.2. O Problema e a Solução Atual............................................................. 13 4.1.1.3. Os Objetivos do Negócio ..................................................................... 14 4.1.1.4. A Proposta do Estudo de Caso............................................................ 15 4.1.2. Avaliar a situação atual........................................................................ 15 4.1.2.1. Avaliação dos Recursos Computacionais e Sistemas.......................... 15 4.1.2.2. Avaliação dos Recursos Humanos ...................................................... 16 4.1.3. Determinar as metas do projeto........................................................... 17 4.1.3.1. Objetivos específicos do Sistema de BI ............................................... 17 4.1.3.2. Objetivos específicos da Mineração de Dados .................................... 18 4.1.4. Produzir o Plano de Projeto ................................................................. 19 4.1.4.1. Escrever o Plano de Projeto ................................................................ 19 4.1.4.2. Avaliar Técnicas .................................................................................. 20 4.1.4.3. Avaliar Ferramentas ............................................................................ 22

4.2. Entendimento dos Dados ............................................................................ 23 4.2.1. Coletar dados iniciais........................................................................... 23 4.2.2. Explorar os dados................................................................................ 26 4.2.3. Verificar a qualidade dos dados........................................................... 26

4.3. BI Livraria Embrapa – Preparação dos Dados............................................. 27 4.3.1. Selecionar os dados ............................................................................ 28

ix

4.3.2. Limpar os dados .................................................................................. 29 4.4. BI Livraria Embrapa – Modelagem .............................................................. 30

4.4.1. Selecionar a técnica de modelagem .................................................... 30 4.4.2. Construir o modelo .............................................................................. 31 4.4.2.1. Construção do Modelo Dimensional .................................................... 31 4.4.2.1.1. FATO VENDA DIÁRIA ......................................................................... 31 4.4.2.1.2. FATO PEDIDO DIÁRIO ....................................................................... 34 4.4.2.1.3. FATO VENDA DIREITO AUTORAL DIÁRIA ........................................ 36 4.4.2.2. Implementação do Modelo Dimensional .............................................. 39 4.4.2.3. Criação dos Universos......................................................................... 43

4.5. BI Livraria Embrapa – Avaliação ................................................................. 44 4.5.1. Avaliar os resultados ........................................................................... 44 4.5.1.1. Gerar os resultados ............................................................................. 44 4.5.1.2. Avaliar os resultados e revisar o processo........................................... 51

4.6. Regras de Associação – Preparação dos Dados......................................... 53 4.6.1. Selecionar os dados ............................................................................ 53 4.6.2. Formatar os dados............................................................................... 58

4.7. Regras de Associação – Modelagem .......................................................... 61 4.7.1. Selecionar a técnica de modelagem .................................................... 61 4.7.2. Construir o modelo .............................................................................. 61 4.7.2.1. Análise PRODUTO x PRODUTO......................................................... 61 4.7.2.2. Análise REGIÃO x PRODUTO............................................................. 65 4.7.2.3. Análise UF x PRODUTO...................................................................... 68 4.7.2.4. Análise LINHA PRODUTO x PRODUTO ............................................. 70 4.7.2.5. Análise LINHA PRODUTO x LINHA PRODUTO .................................. 73 4.7.2.6. Análise REGIÃO x LINHA PRODUTO ................................................. 74

4.8. Regras de Associação – Avaliação ............................................................. 77 4.9. Disponibilização .......................................................................................... 81

4.9.1. Revisar o projeto.................................................................................. 81

CAPÍTULO 5. CONSIDERAÇÕES FINAIS ................................................................ 82

5.1. Conclusão ................................................................................................... 82 5.2. Trabalhos Futuros ....................................................................................... 84

REFERÊNCIAS BIBLIOGRÁFICAS ........................................................................... 85

ANEXO 01 – ARTEFATOS DO PROJETO ................................................................ 89 ANEXO 02 – ESTATÍSTICAS BÁSICAS .................................................................... 91 ANEXO 03 – SCRIPTS LIMPEZA DOS DADOS ...................................................... 117 ANEXO 04 – PROCESSAMENTO REGRAS DE ASSOCIAÇÃO ............................. 119 ANEXO 05 – DICIONÁRIO DE DADOS ................................................................... 126

x

LISTA DE FIGURAS

Figura 2.1: Organograma da Embrapa Informação Tecnológica. Fonte: Website SCT

<http://www.sct.embrapa.br> ........................................................................................4

Figura 2.2: Website Livraria Embrapa. Fonte: <http://vendasliv.sct.embrapa.br/liv3/>...5

Figura 3.1: Fases do modelo de referência CRISP-DM. Fonte: IBM, 1994, 2011..........6

Figura 3.2: Tarefas genéricas e as saídas do modelo de referência do CRISP-DM.

Fonte: IBM, 1994, 2011. ...............................................................................................7

Figura 4.1: Organograma Embrapa Informação Tecnológica: destaque para os setores

impactados pela Livraria Embrapa. Fonte: Website SCT <http://www.sct.embrapa.br>.

................................................................................................................................... 12

Figura 4.2: Modelo Entidade-Relacionamento Livraria Embrapa: domínio de dados a

ser explorado. ............................................................................................................. 25

Figura 4.3: ETL origem (SQL Server) – destino (Repositório), usando a ferramenta

SAP BO Data Services Designer. ............................................................................... 29

Figura 4.4: Modelo Dimensional: Fato Venda Diária. .................................................. 34

Figura 4.5: Modelo Dimensional: Fato Pedido Diário. ................................................. 36

Figura 4.6: Modelo Dimensional: Fato Venda Direito Autoral Diária............................ 39

Figura 4.7: ETL dimensão “Nota_Fiscal_Pedido”, utilizando a ferramenta SAP BO Data

Services Designer....................................................................................................... 40

Figura 4.8: SQL de extração dados origem para dimensão “Nota_Fiscal_Pedido”,

utilizando a ferramenta SAP BO Data Services Designer. .......................................... 41

Figura 4.9: ETL “Fato Venda Diária”, utilizando a ferramenta SAP BO Data Services

Designer. .................................................................................................................... 42

Figura 4.10: SQL de criação “Fato Venda Diária”, utilizando a ferramenta SAP BO Data

Services Designer....................................................................................................... 42

Figura 4.11: Cálculo de medida para “Fato Venda Diária”, utilizando a ferramenta SAP

BO Data Services Designer. ....................................................................................... 43

Figura 4.12: Universo “Venda Direito Autoral Diária” no ambiente de desenvolvimento

da ferramenta SAP BO Universe Designer. ................................................................ 44

Figura 4.13: Ambiente de desenvolvimento da ferramenta SAP BO Web Intelligence.45

Figura 4.14: Relatório: Análise Mensal das Vendas no Período.................................. 46

Figura 4.15: Relatório: Análise das Vendas por Tema no Período. ............................. 46

Figura 4.16: Gráfico de barras verticais: Análise das Vendas por Tema no Período. .. 47

Figura 4.17: Relatório: Pedidos realizados no Período por Tipo de Origem. ............... 47

Figura 4.18: Relatório: Produtos mais vendidos no Período........................................ 48

Figura 4.19: Relatório: Ranking de Vendas por Tema no Ano. ................................... 49

xi

Figura 4.20: Relatório: Vendas por País no Período. .................................................. 49

Figura 4.21: Relatório: Vendas por Localidade no Período (Drill Down País-Região). 50

Figura 4.22: Relatório: Vendas por UF no Período. .................................................... 50

Figura 4.23: Relatório: Vendas por Tipo de Pagamento no Período. .......................... 51

Figura 4.24: Exemplo arquivo Formato ARFF para a relação Produto x Produto. ....... 60

Figura 4.25: Ferramenta WEKA: Análise Produto x Produto. ...................................... 61

Figura 4.26: Ferramenta WEKA: Algoritmo Apriori (Parâmetros padrão). ................... 62

Figura 4.27: Ferramenta WEKA: Análise Região x Produto. ....................................... 66

Figura 4.28: Ferramenta WEKA: Análise UF x Produto............................................... 69

Figura 4.29: Ferramenta WEKA: Análise Linha Produto x Produto. ............................ 71

Figura 4.30 Ferramenta WEKA: Análise Linha Produto x Linha Produto..................... 73

Figura 4.31 Ferramenta WEKA: Análise Região x Linha Produto................................ 75

Figura 4.32 Ferramenta WEKA: Visualização gráfica Região x demais atributos........ 77

xii

LISTA DE TABELAS

Tabela 4.1: Matriz de Responsabilidades ................................................................... 16

Tabela 4.2: Estrutura da consulta: Transações de vendas da Livraria Embrapa. ........ 57

Tabela 4.3: Intervalo de dados do atributo “Ano de Edição” do Produto. .................... 59

Tabela 4.4: Intervalo de dados do atributo “Preço” do Produto. .................................. 59

Tabela 4.5: Estrutura da consulta Produto x Produto. ................................................. 60

Tabela 4.6: Resumo dos Resultados: Análise Produto x Produto (Modelo 2). ............ 63

Tabela 4.7: Resumo dos Resultados: Análise Produto x Produto (Modelo 3). ............ 64

Tabela 4.8: Resumo dos Resultados: Análise Região x Produto (Modelo 2)............... 66

Tabela 4.9: Resumo dos Resultados: Análise Região x Produto (Modelo 3)............... 68

Tabela 4.10: Resumo dos Resultados: Análise UF x Produto (Modelo 2). .................. 70

Tabela 4.11: Resumo dos Resultados: Análise Linha Produto x Produto (Modelo 2). . 72

Tabela 4.12: Resumo dos Resultados: Análise Linha Produto x Linha Produto .......... 74

(Modelo 2). ................................................................................................................. 74

Tabela 4.13: Resumo dos Resultados: Análise Região x Linha Produto (Modelo 1). .. 76

xiii

LISTA DE SÍMBOLOS OU NOMENCLATURA

BI Business Intelligence (Inteligência de Negócios);

BO Business Objects;

CRISP-DM Cross-Industry Standard Process for Data Mining;

CSV Comma-Separated Values (Valores separados por vírgulas);

DSS Decision Support Systems (Sistemas de Apoio à Decisão);

DW Data Warehouse (Repositório de Dados);

EMBRAPA Empresa Brasileira de Pesquisa Agropecuária;

ETL Extract, Transform, Load (Extração, Transformação, Carga);

OLAP On-Line Analytical Processing;

PDE Plano Diretor Embrapa;

PD&I Pesquisa, Desenvolvimento e Inovação;

PDTI Plano Diretor de Tecnologia da Informação;

PDU Plano Diretor da Unidade;

SGV Sistema de Gerenciamento de Vendas;

SQL Structured Query Language;

WEKA Waikato Environment for Knowledge Analysis.

1

CAPÍTULO 1. INTRODUÇÃO

Existem grandes forças em jogo que estão mudando a forma como as

empresas operam: os processos de negócio estão se tornando mais integrados e

complexos, pressões econômicas estão forçando as organizações a fazerem mais

com menos, e a quantidade de informação disponível cresce de forma exponencial

(FORRESTER CONSULTING, 2009).

Com a popularização da Internet, transações comerciais baseadas na Web tem

se tornado o centro do atual impulso ao desenvolvimento do comércio eletrônico.

Enquanto novos ambientes de negócios oferecem novas oportunidades de negócios

para as empresas, eles trazem também novos desafios (GE, 2009).

Neste cenário de rápida evolução e complexidade, ter informação é ter poder.

Segundo TAPSCOTT & BARTER (2009), se você tem a vantagem das informações

pode obter vantagens de mercado. Isso é verdadeiro principalmente quando se trata

de identificar novas e diferentes oportunidades no mercado e responder a elas.

As empresas de comércio eletrônico acumulam um grande número de usuários

e dados sobre seus comportamentos ao longo da operação. Entretanto, elas se

deparam com uma constrangedora situação de riqueza de dados e pobreza de

conhecimento (QU & LIANG, 2009).

Segundo VERCELLIS (2009), as empresas que forem capazes de transformar

dados em informação e conhecimento podem usá-los para tomar decisões mais

rápidas e mais efetivas e ainda adquirir vantagem competitiva.

Para isso, um grande esforço tem sido feito na busca por técnicas,

metodologias analíticas e modelos matemáticos que auxiliem a extração de

conhecimento em grandes bases de dados, evitando, assim, uma abordagem

puramente intuitiva no tratamento dos complexos processos de tomada de decisão.

Neste sentido, inteligência de negócios (Business Intelligence), definida por

LARSON (2009) como “a entrega de informação precisa e útil aos tomadores de

decisão apropriados, no tempo necessário para auxiliar a efetiva tomada de decisão”,

2

envolve tecnologias como data warehouse (repositório de dados) e ferramentas OLAP

(On-Line Analytical Processing), as quais, aliadas às técnicas de mineração de dados

(Data Mining), constituem um poderoso sistema capaz de transformar dados em

conhecimentos úteis aos processos de negócios das organizações.

1.1. Motivação

A motivação para este trabalho ocorre em dois contextos distintos.

Em um contexto local, focado nos processos de negócios da Livraria Embrapa,

observa-se que, nos últimos anos, o volume de clientes e de vendas da Livraria tem

crescido consideravelmente, devido à sua popularização, às participações em feiras e

eventos diversos, bem como ao aumento das parcerias e consignações. Junto com

esse crescimento vem a necessidade de uma gestão pró-ativa e, portanto, mais

efetiva da Livraria. Ambos os sistemas que, hoje, atendem a Livraria, foram

concebidos com foco operacional, assim como tantos sistemas de informação

existentes no Mercado. Apesar de prover informações consolidadas aos seus usuários

internos, estas ainda são insuficientes quando se pensa em níveis estratégicos e de

gestão, que requerem informações mais trabalhadas, que alterem o perfil da demanda

por informações.

Em um contexto mais amplo, dentre as tendências e implicações estratégicas

de PD&I (Pesquisa, Desenvolvimento e Inovação) para a Agricultura, citadas pela

Embrapa em seu V Plano Diretor (EMBRAPA, 2008), está prevista a crescente

incorporação de informação, conhecimento e tecnologia. Segundo este estudo, o

conhecimento e a capacidade de inovar e operar com a informação serão cada vez

mais determinantes para a geração de riqueza, para a capacidade de estabelecer

relações de poder e para a criação de novos códigos culturais. Assim, as tecnologias

que facilitam o acesso à informação e aceleram a sua disseminação serão

amplamente incorporadas de modo que contribuam para o desenvolvimento dos

países (EMBRAPA, 2008).

Diante destes contextos, o presente estudo tem como desafios a transformação

de informação em conhecimento e sua disponibilização aos usuários finais, auxiliando

o processo de tomada de decisão, direcionando as ações estratégicas e contribuindo

3

para uma gestão mais efetiva da Livraria Embrapa, visando, em última instância, o

alcance das metas e objetivos estratégicos da organização.

1.2. Metodologia e Recursos Tecnológicos

Este estudo se baseia na metodologia CRISP-DM, que direcionará o trabalho

de extração de conhecimento para o sistema de comércio eletrônico da Livraria

Embrapa.

O estudo utilizou como recursos tecnológicos: Microsoft SQL Server 2008

Management Studio para a obtenção e limpeza dos dados; SAP BusinessObjects Data

Services Designer para o processo de ETL (extração, transformação e carga); SAP

BusinessObjects Universe Designer para a criação dos Universos; SAP

BusinessObjects Web Intelligence para consulta, análise e construção de relatórios

pelos usuários finais; Microsoft Excel 2003 para avaliação estatística dos dados; e a

ferramenta WEKA 3.6 para a mineração de dados.

1.3. Organização do Trabalho

O presente trabalho está dividido em 05 capítulos.

Este primeiro capítulo contextualiza o estudo e descreve a motivação para sua

realização, bem como a metodologia e os recursos tecnológicos utilizados no projeto.

O Capítulo 02 apresenta a Livraria Embrapa e a Embrapa Informação

Tecnológica.

O Capítulo 03 descreve a metodologia CRISP-DM e suas etapas.

O Capítulo 04 descreve a aplicação da metodologia CRISP-DM na

implementação do sistema de BI da Livraria Embrapa e na geração das regras de

associação para as transações de venda da Livraria. A execução dos modelos, os

resultados obtidos e sua avaliação também são descritos neste capítulo.

O Capítulo 05 descreve as considerações finais e os trabalhos futuros previstos

para o projeto.

4

CAPÍTULO 2. A LIVRARIA EMBRAPA

O processo de negócio da Livraria Embrapa é uma das principais

responsabilidades do Setor de Marketing e Comercialização da Embrapa Informação

Tecnológica, uma Unidade Descentralizada de Serviço da EMBRAPA (Empresa

Brasileira de Pesquisa Agropecuária). A figura 2.1 ilustra o organograma da Unidade.

Figura 2.1: Organograma da Embrapa Informação Tecnológica. Fonte: Website SCT

<http://www.sct.embrapa.br>

A princípio chamada de Serviço de Produção de Informação e, mais tarde, em

2001, de Embrapa Comunicação para Transferência de Tecnologia, esta Unidade,

criada em 1991 e hoje denominada Embrapa Informação Tecnológica, responsabiliza-

se pela gestão, pelo tratamento editorial, pela disponibilização e pela publicação -

impressa e eletrônica - de informações e de dados tecnológicos, científicos e

socioeconômicos obtidos em pesquisa; incumbe-se da coordenação de tais atividades

no âmbito da Embrapa e busca também integrar as demais Unidades da Empresa.

Dada a sua diversificada produção: programas televisivo e radiofônico (Dia de

Campo na TV e Prosa Rural, respectivamente), vídeos, periódicos, cartazes, etc.,

utiliza modernos instrumentos de tecnologia da informação e da comunicação; dispõe

de gráfica e de estúdios de vídeo e de áudio; e possui a Livraria Embrapa para a

venda de produtos.

Além de organizar e de construir bases de dados técnico-científicas e

socioeconômicas, supervisiona o trabalho de gestão dos arquivos e do Sistema

Embrapa de Bibliotecas e apoia a transferência de tecnologia mediante realização e

coordenação de eventos técnicos (Website EMBRAPA INFORMAÇÃO

TECNOLÓGICA <http://www.sct.embrapa.br>).

5

Desde sua criação em 1991, a Unidade tem como um dos objetivos

institucionais a comercialização como um meio para a disseminação das novas

tecnologias geradas pela Embrapa, transformadas em produtos por meio de

periódicos, livros e mídias eletrônicas. Na época, existiam apenas alguns pontos de

venda nas próprias Unidades da Embrapa, para atender a um público formado por:

agricultores; pecuaristas; grandes e pequenos produtores rurais; estudantes;

instituições públicas e particulares de ensino fundamental, médio e superior; órgãos

governamentais e não-governamentais; empregados e Unidades da Embrapa;

Administração superior e demais Gestores da Embrapa; autores; consignatários

fornecedores e prestadores de serviços; e demais pessoas físicas e jurídicas

interessadas nos produtos e serviços da Empresa.

Vislumbrando uma forma de melhorar o atendimento e disseminar de forma

mais efetiva e irrestrita esse conhecimento ao seu público-alvo, foi criado, em 1997, o

site da Livraria Virtual da Embrapa, ilustrado na Figura 2.2.

Figura 2.2: Website Livraria Embrapa. Fonte: <http://vendasliv.sct.embrapa.br/liv3/>

Em 2007, o site passou por um processo de reformulação e reestruturação, a

fim de atender às novas diretrizes do governo eletrônico (e-gov), a evolução do

mercado de e-business, bem como as novas exigências do mercado mundial

referentes às Editoras de Livros.

A Livraria Embrapa, atualmente, é operacionalizada pelo seu site, para

atendimento ao cliente externo, e pelo sistema de informação SGV (Sistema de

Gerenciamento de Vendas) que trata de toda a parte administrativa e financeira do

negócio.

6

CAPÍTULO 3. METODOLOGIA

3.1. A Metodologia CRISP-DM

CRISP-DM (Cross-Industry Standard Process for Data Mining) é uma

metodologia padrão, não-proprietária, criada no final de 1996 por três veteranos do

mercado de mineração de dados: DaimlerChrysler AG (Alemanha), SPSS Inc. (EUA)

e NCR Systems Engineering Copenhagen (EUA e Dinamarca). A metodologia CRISP-

DM é uma forma comprovada de guiar os esforços de mineração de dados.

Como uma metodologia, inclui descrições das fases típicas de um projeto, das

tarefas envolvidas em cada fase e dos relacionamentos entre elas. Como um modelo

de processo, CRISP-DM fornece uma visão geral do ciclo de vida da mineração de

dados. O ciclo de vida de um projeto de mineração de dados consiste em seis fases,

com setas indicando as dependências mais importantes e frequentes entre as fases,

conforme ilustrado na Figura 3.1 (IBM, 1994, 2011).

Figura 3.1: Fases do modelo de referência CRISP-DM. Fonte: IBM, 1994, 2011.

A sequência de fases não é rígida. A metodologia CRISP-DM é flexível e pode

ser facilmente customizada, conforme a necessidade do projeto. A figura 3.2

7

apresenta um esboço das fases acompanhadas pelas tarefas genéricas (em negrito) e

saídas (em itálico).

Figura 3.2: Tarefas genéricas e as saídas do modelo de referência do CRISP-DM.

Fonte: IBM, 1994, 2011.

3.1.1. Entendimento do Negócio

Esta fase inicial visa o entendimento dos objetivos e requisitos do projeto a

partir da perspectiva do negócio.

Nesta fase as seguintes tarefas serão realizadas:

• Determinar os objetivos do negócio a partir da visão dos tomadores de

decisão, dos patrocinadores do projeto e de outras unidades de negócio

impactadas pelo projeto. É importante, neste momento, entender a

situação do negócio da organização, sua estrutura e recursos, bem

como descrever o problema e determinar os requisitos de negócios

necessários;

• Avaliar a situação atual, observando os dados disponíveis para o

projeto, os recursos humanos existentes, bem como os riscos

8

envolvidos e contingências previstas e, finalmente, as premissas e

restrições existentes;

• Determinar as metas do projeto, com base nos objetivos de negócio

predeterminados;

• Produzir um Plano de Projeto a fim de documentar os objetivos,

recursos, riscos e prazos para todas as fases do trabalho a ser

realizado.

3.1.2. Entendimento dos Dados

A fase de entendimento dos dados sugere uma visão mais detalhada sobre os

dados disponíveis para o projeto. O entendimento dos dados envolve acessar os

dados e explorá-los para determinar sua qualidade e documentar os resultados.

Nesta fase as seguintes tarefas serão realizadas:

• Coletar os dados iniciais, os quais podem originar de uma variedade de

fontes distintas. Devem ser analisados, por exemplo, quais atributos

(colunas) podem ser aproveitados, quais são irrelevantes e podem ser

excluídos, se eles são suficientes para gerar previsões confiáveis e

como serão tratados os valores ausentes;

• Descrever os dados, focando na quantidade e na qualidade dos dados

disponíveis;

• Explorar os dados, gerando gráficos e estatísticas sobre os dados

disponíveis, visando formar hipóteses sobre como os dados podem

responder aos objetivos técnicos e de negócio;

• Verificar a qualidade dos dados antes de realizar a modelagem.

Verificar valores ausentes ou nulos, dados com valores incorretos e

inconsistentes.

9

3.1.3. Preparação dos Dados

A fase de preparação dos dados é uma das mais importantes e a que

geralmente consome maior tempo e esforço do projeto, em torno de 50 a 70%. Esta

fase envolve unir dados e registros, selecionar uma amostra do subconjunto de dados,

agregar registros, derivar novos atributos, ordenar os dados, excluir ou substituir

valores ausentes, brancos ou nulos (IBM, 1994, 2011).

Nesta fase as seguintes tarefas serão realizadas:

• Selecionar os dados considerados relevantes para os objetivos

predeterminados. Geralmente as formas de selecionar dados envolve

selecionar itens ou linhas, como por exemplo quais clientes incluir, e

selecionar atributos ou colunas;

• Limpar os dados que foram selecionados para serem incluídos na

análise. Valores ausentes, dados com erros ou inconsistentes podem

ser excluídos ou substituídos por valores estimados ou considerados

corretos;

• Construir novos dados a partir de dados já existentes. Há duas formas

de se fazer isso: derivando atributos (colunas) e/ou gerando registros

(linhas);

• Integrar os dados realizando a união (merge) ou a adição (appending)

de dois ou mais conjuntos de dados. A união envolve unir dois

conjuntos de dados contendo registros similares, mas atributos

distintos, usando a mesma chave identificadora de cada registro. A

adição envolve integrar dois ou mais conjuntos de dados com atributos

similares e registros distintos;

• Formatar ou ordenar os dados disponíveis antes de modelar.

3.1.4. Modelagem

A fase de modelagem geralmente é conduzida em múltiplas iterações.

10

Nesta fase as seguintes tarefas serão realizadas:

• Selecionar, dentre as técnicas de modelagem existentes, a mais

apropriada para as necessidades da organização;

• Gerar um plano de teste, descrevendo os critérios para um modelo ser

considerado bom e definindo os dados nos quais os critérios serão

testados;

• Construir os modelos previstos;

• Avaliar os modelos e determinar qual será o modelo final. Considere,

neste momento, fazer uma revisão dos resultados com base no seu

entendimento dos problemas de negócio, consultar analistas de dados

ou outros especialistas que consigam perceber a relevância de

resultados particulares, e avaliar se os resultados obtidos vão ao

encontro dos objetivos de negócios estabelecidos durante a fase de

entendimento do negócio. O modelo poderá passar por várias iterações

sofrendo ajustes até que atenda aos requisitos predeterminados.

3.1.5. Avaliação

Nesta fase as seguintes tarefas serão realizadas:

• Avaliar os resultados, verificando se eles estão claros e se alcançaram

ou não os objetivos do negócio;

• Revisar o processo, verificando as possíveis falhas e erros de cada

fase, a fim de evitá-las em futuros projetos.

3.1.6. Disponibilização

É importante, neste momento, unir-se aos especialistas para realizar a

avaliação do projeto.

11

Nesta fase as seguintes tarefas serão realizadas:

• Planejar a implantação, sumarizando os resultados do projeto (modelos

e descobertas). Desta forma será possível determinar, por exemplo,

quais modelos podem ser integrados aos sistemas da organização e

quais descobertas devem ser apresentadas às pessoas certas das

organizações;

• Planejar o monitoramento e manutenção dos modelos e descobertas

geradas pelo projeto;

• Realizar uma revisão final do projeto, coletando as impressões finais e

registrando as lições aprendidas.

12

CAPÍTULO 4. APLICAÇÃO NA LIVRARIA EMBRAPA

Neste capítulo é apresentado o estudo de caso aplicado ao sistema de

comércio eletrônico da Livraria Embrapa, orientado pela metodologia CRISP-DM.

4.1. Entendimento do Negócio

Durante esta etapa de entendimento do negócio serão realizadas as seguintes

tarefas: determinar os objetivos do negócio; avaliar a situação atual; determinar as

metas do projeto; e produzir o plano do projeto.

4.1.1. Determinar os objetivos do negócio

Para melhor contextualizar os objetivos do negócio estabelecidos para este

estudo de caso, é importante entender a situação atual da estrutura organizacional,

seus recursos, problemas e atuais soluções.

4.1.1.1. A Estrutura Organizacional

O Setor de Marketing e Comercialização da Embrapa Informação Tecnológica

é o principal responsável pela Livraria Embrapa. No entanto, o processo de negócio da

Livraria transita e impacta diversos setores da Unidade, destacados na figura 4.1.

Figura 4.1: Organograma Embrapa Informação Tecnológica: destaque para os setores

impactados pela Livraria Embrapa. Fonte: Website SCT <http://www.sct.embrapa.br>.

13

Cada setor impactado tem suas responsabilidades e cumpre um papel

específico no processo de venda de um produto pela Livraria Embrapa:

• Setor de Marketing e Comercialização: responsável pela gestão da

Livraria Embrapa. Realiza o atendimento ao cliente, promoções e

publicidades dos produtos da Livraria, sua comercialização

diretamente no balcão ou pelo site, em feiras e eventos, vendas

para consignatárias, vendas para consignantes e vendas por

assinatura;

• Setor de Orçamento e Finanças: responsável pelo

acompanhamento e controle dos recebimentos e pagamentos

efetuados no processo de compra na Livraria;

• Setor de Patrimônio e Material: responsável pelo controle do

estoque, pelo tratamento do pedido do cliente para despacho da

mercadoria;

• Setor da Gráfica: responsável pela confecção de novos produtos

(livros, periódicos, etc.) ou de produtos para reposição em estoque;

• Setor de Mídia Eletrônica: responsável pela confecção de novos

produtos de mídia eletrônica (CDs, DVDs, etc.), ou de produtos de

mídia para reposição em estoque;

• Gerências: responsáveis pela gestão dos setores que controlam e

realizam todo o processo de venda e pela gestão em níveis

estratégicos da Livraria Embrapa.

4.1.1.2. O Problema e a Solução Atual

A Embrapa Informação Tecnológica, assim como grande parte das

organizações, tem passado por mudanças em seus processos de negócio e

observado, nos últimos anos, um aumento exponencial no volume dos dados,

principalmente no que diz respeito à Livraria Embrapa.

14

O negócio, com o passar do tempo, tem se tornado cada vez mais complexo,

envolvendo pedidos feitos na Internet pelo site da Livraria, controle de consignações e

assinaturas. O volume de clientes e de vendas da Livraria tem crescido

consideravelmente, devido à sua popularização, às participações em feiras e eventos

diversos, bem como ao aumento das parcerias e consignações. Junto com esse

crescimento vem a necessidade de uma gestão pró-ativa e, portanto, mais efetiva da

Livraria.

Os sistemas de informação que, atualmente, operam a Livraria Embrapa, foram

concebidos com foco operacional, assim como tantos sistemas de informação

existentes no mercado. Apesar de prover informações consolidadas aos seus usuários

internos, estas ainda são insuficientes quando se pensa em níveis estratégicos e de

gestão, que requerem informações mais trabalhadas.

O setor de Marketing e Comercialização é o maior demandante desse tipo de

informação, e seus especialistas, juntamente com os gestores tem, cada vez mais,

procurado obter informação e conhecimento que possam contribuir para uma gestão

mais efetiva da Livraria.

4.1.1.3. Os Objetivos do Negócio

Os objetivos gerais levantados para este projeto a partir da perspectiva do

negócio são:

1. Prover, aos usuários, ferramentas que os possibilitem: construir suas

próprias consultas, respondendo a abordagens sobre assuntos diversos;

fazer análises estatísticas e cruzar informações, em formatos e sob

perspectivas distintas; e evoluir da fase de controles quantitativos para a

análise qualitativa da gestão, em tempo hábil para a tomada de decisão;

2. Permitir o acesso às informações corporativas relacionadas à Livraria, por

meio da integração dos sistemas de informação;

3. Identificar oportunidades de vendas cruzadas por meio de melhores

recomendações e/ou aplicando ações de marketing a partir do

conhecimento adquirido;

15

4. Promover o aperfeiçoamento das atividades de gestão e de difusão da

informação.

4.1.1.4. A Proposta do Estudo de Caso

O presente estudo pretende:

a. Demonstrar a implementação de um sistema de Business

Intelligence envolvendo a construção de um repositório de dados, e

a aplicação de ferramentas OLAP (On-Line Analytical Processing)

para o processo de negócio da Livraria Embrapa, com foco em

comercialização e marketing;

b. Demonstrar uma aplicação do processo de descoberta de

conhecimento, utilizando técnicas de mineração de dados sobre a

base de dados da Livraria Embrapa.

4.1.2. Avaliar a situação atual

Nesta fase avaliaremos a situação atual da organização em termos dos

recursos (sistemas, pessoas) existentes e disponibilizados para o projeto, ou que

possam influenciar, de alguma forma, o alcance dos objetivos do projeto.

4.1.2.1. Avaliação dos Recursos Computacionais e Sistemas

A Livraria Embrapa, atualmente, é operacionalizada por meio dos seguintes

sistemas e recursos computacionais da Embrapa Informação Tecnológica:

• O site da Livraria Virtual da Embrapa, desenvolvido em Java e

disponibilizado no servidor de aplicações da Unidade;

• O Sistema de Gerenciamento de Vendas (SGV), desenvolvido em

Delphi;

16

Os dados estão armazenados no banco de dados Microsoft SQL Server 2005,

em um servidor de banco de dados da Unidade. O acesso aos dados, sistemas e

servidores é disponibilizado pelo supervisor do setor de Informática da Embrapa

Informação Tecnológica.

Dados corporativos que podem ser integrados à Livraria Embrapa como, por

exemplo, dados dos autores dos livros que são funcionários da Embrapa, estão

armazenados em um Data Warehouse corporativo, no setor de Informática da

Embrapa Sede.

A ferramenta de BI adotada pela Sede é a suíte de ferramentas da SAP

BusinessObjects (BO). O acesso aos dados corporativos é disponibilizado pelo

supervisor de BI (Business Intelligence) da Embrapa Sede.

4.1.2.2. Avaliação dos Recursos Humanos

As áreas e pessoas envolvidas e disponibilizadas para o estudo de caso estão

resumidas na matriz de responsabilidades apresentada na tabela 4.1:

Tabela 4.1: Matriz de Responsabilidades

Unidade Setor Pessoas Responsabilidades

Embrapa

Informação

Tecnológica

Marketing e

Comercialização

Supervisor do

Setor

• Definir nível de segurança de

acesso aos dados do universo

analítico.

• Garantir o comprometimento

dos usuários com a demanda.

• Garantir disponibilidade dos

usuários para homologação do

produto.

• Informar a origem dos dados.

• Informar as regras que serão

aplicadas.

• Homologar o trabalho.

Embrapa

Informação

Tecnológica

Marketing e

Comercialização

Atendentes e

gestores da

Livraria

• Informar a origem dos dados.

• Informar as regras que serão

aplicadas.

17

Embrapa • Homologar o trabalho.

Embrapa

Informação

Tecnológica

Informática Analista de BI

• Elaborar os modelos

dimensionais.

• Criar os Universos.

• Treinar usuários.

• Homologar o trabalho.

Embrapa

Sede Informática

Administrador

de Banco de

Dados

• Validar, criar e manter os

Universos fisicamente.

4.1.3. Determinar as metas do projeto1

Visando atender aos objetivos de negócio pré-determinados, objetivos

específicos serão estabelecidos para o projeto. Os objetivos serão divididos em dois

grupos: objetivos do sistema de BI da Livraria Embrapa; e objetivos da mineração de

dados aplicada sobre a base de dados da Livraria Embrapa.

4.1.3.1. Objetivos específicos do Sistema de BI

Os seguintes objetivos foram determinados para o Sistema de BI proposto para

a Livraria Embrapa:

1. Apurar as vendas e estornos/ devoluções de vendas de produtos:

• Quantidades e valores líquidos arrecadados ou estornados/

devolvidos;

• Por período (dia, semana, mês, ano), por localidade (país, região,

estado, cidade), por categoria ou tema, por produto, por tipo de

cliente (consignatário, consignante), por cliente, por tipo de produto,

por unidade autora, por forma de pagamento (boleto bancário; cartão

1 A metodologia CRISP-DM denomina esta tarefa como “Deterninar as metas da mineração de dados”. No entanto, este estudo pretende utilizar esta metodologia em um contexto mais amplo, adaptando-a de forma que seja utilizada não só para a mineração de dados mas, também, para a construção de um sistema de Business Intelligence para a Livraria Embrapa. Por este motivo, especificamente para este estudo de caso, alteramos para “determinar as metas do projeto” o que na metodologia está como “determinar as metas da mineração de dados”.

18

de crédito), por tipo de venda (venda direta; venda por evento; venda

por consignatária; venda por consignante; venda por assinatura).

2. Apurar os pedidos (efetivados em compras ou não) de publicações da

Livraria:

• Quantidades e valores líquidos;

• Por período (dia, semana, mês, ano), por localidade (país, região,

estado, cidade), por categoria ou tema, por produto, por cliente, por

unidade autora, por tipo de produto, por forma de pagamento, por

origem do pedido.

3. Apurar as vendas de publicações da Livraria para as quais incidem o

pagamento de direitos autorais:

• Quantidades e valores líquidos arrecadados;

• Por período (dia, mês, trimestre, semestre, ano), por localidade

(país, região, estado, cidade), por produto, por cliente.

4. Apurar os valores a pagar de direitos autorais:

• Calcular a comissão autoral a pagar;

• Por período (ano), por autor, por produto.

4.1.3.2. Objetivos específicos da Mineração de Dados

A essência da mineração de dados é a capacidade de antecipar o mercado,

alcançando uma oportunidade de mercado. Por meio do uso de correlações, o analista

de negócios utiliza a correlação, de forma criativa, para posicionar produtos e pacotes

de forma a tirar vantagem da informação sobre hábitos dos consumidores (INMON,

TECH TOPIC 6, 1997).

A aplicação da mineração de dados na Livraria Embrapa tem como objetivo:

19

1. Utilizar informação histórica sobre transações de compras realizadas

para gerar um modelo que associe itens relacionados (análise da cesta

de compras) de forma que:

a. Seja possível entender melhor o comportamento de compras do

consumidor, para tentar direcionar as oportunidades de venda;

b. Quando usuários acessarem um determinado item, possam ser

disponibilizados links para outros itens relacionados;

c. Possam ser criados novos pacotes e novos produtos a partir de

itens já existentes e relacionados;

d. Possam ser criadas promoções de vendas para itens relacionados.

4.1.4. Produzir o Plano de Projeto

Esta fase envolve a elaboração de documentos formais que servirão de

orientação para todo o projeto. Nesta fase serão realizadas as seguintes tarefas:

escrever o Plano de Projeto; avaliar técnicas e ferramentas.

4.1.4.1. Escrever o Plano de Projeto

Para a realização do estudo de caso proposto, foi necessária a criação de

documentos formais (memorandos) justificando o projeto e solicitando sua aprovação

junto às Gerências da Embrapa Sede e da Embrapa Informação Tecnológica.

Além disso, todo o planejamento e detalhes do projeto foram descritos em

documentos padrão da organização, tais como o “Termo de Abertura” e o documento

de “Especificação de Requisitos”. Estes documentos foram analisados, revisados e

aprovados pelos responsáveis, visando a viabilização do projeto na Embrapa.

O Anexo 01 apresenta apenas algumas partes de alguns desses documentos,

a fim de preservar a confidencialidade dos dados da empresa.

20

4.1.4.2. Avaliar Técnicas

1. Técnica analisada para a Mineração de Dados:

A mineração de dados prevista para a Livraria Embrapa envolve a análise da

cesta de compras (market basket analysis), pressupondo o uso da técnica de regras

de associação, que permite a descoberta de padrões locais interessantes nos dados.

As regras de associação, também conhecidas como grupos de afinidade, são

usadas para identificar associações interessantes e recorrentes entre grupos de

registros de um conjunto de dados. Por exemplo, é possível determinar quais produtos

são adquiridos juntos em uma única transação e com que freqüência. (...) Os

agrupamentos por elementos relacionados são também utilizados para promover a

venda cruzada ou para criar e promover combinações de produtos e serviços

(VERCELLIS, 2009).

A análise de afinidade é o estudo de atributos ou características que “ocorrem

juntos”. Os métodos para análise de afinidade, também conhecidos como análise do

cesto de compras (market basket analysis), procuram descobrir associações entre

estes atributos; ou seja, eles procuram descobrir regras para quantificar o

relacionamento entre dois ou mais atributos. As regras de associação assumem a

forma de “Se antecendente, então conseqüente”, junto com uma medida de suporte e

confiança associados à regra. Por exemplo, um determinado supermercado pode

achar que dos 1000 clientes que fazem compras em uma noite de quinta-feira, 200

compraram fraldas e, desses 200, 50 compraram cerveja. Assim, a regra de

associação seria: “Se comprou fraldas, então comprou cerveja”, com um suporte de

50/1000 = 5% e uma confiança de 50/200 = 25%.

Seja D um conjunto de transações, onde cada transação T em D representa

um conjunto de itens contidos em I. Suponha que tenhamos um conjunto particular de

itens A (por exemplo, feijão e abóbora), e um outro conjunto de itens B (por exemplo,

aspargos). Então a regra de associação assume a forma se A, então B (isto é, A ⇒ B),

onde o antecedente A e o conseqüente B são subconjuntos de I, e A e B são

mutuamente exclusivos. Esta definição excluiria, por exemplo, regras triviais tais como:

se feijão e abóbora, então feijão.

21

O suporte s para uma determinada regra de associação A ⇒ B é a proporção

de transações em D que contém ambos A e B. Isto é,

suporte = P(A∩B) = nº de transações contendo ambos A e B / nº total de transações

A confiança c da regra de associação A ⇒ B é a medida de acurácia da regra,

determinada pelo percentual de transações em D contendo A que também contém B.

Em outras palavras,

confiança = P(B | A) = P(A∩B) / P(A)

= nº de transações contendo ambos A e B / nº de transações contendo A.

Os analistas podem preferir regras que tenham um alto suporte ou uma alta

confiança, e geralmente ambos. Regras fortes são aquelas que atendem ou superam

os critérios de suporte e confiança mínimos (LAROSE, 2005).

O algoritmo Apriori é um método mais eficiente de extrair regras fortes contidas

em um conjunto de transações. Durante a primeira fase o algoritmo gera os conjuntos

de dados (itemsets) mais freqüentes de uma forma sistemática, sem explorar o espaço

de todos os candidatos, enquanto que na segunda fase ele extrai as regras fortes.

O pressuposto teórico em que o algoritmo Apriori se baseia consiste em uma

propriedade chamada princípio Apriori: Se um itemset é freqüente, então todos os

seus subconjuntos (subsets) também serão freqüentes (VERCELLIS, 2009).

A mineração de regras de associação para grandes bases de dados é um

processo de dois passos:

1. Encontre todos os conjuntos de itens (itemsets) mais freqüentes; isto é,

procure todos os itemsets com freqüência >= φ.

2. A partir dos itemsets mais freqüentes, gere regras de associação que

satisfaçam as condições de suporte mínimo e confiança mínima.

O algoritmo Apriori tira vantagem do princípio Apriori de reduzir o espaço de

busca. Este princípio ajuda a reduzir significativamente o espaço de busca para o

algoritmo Apriori (LAROSE, 2005).

22

4.1.4.3. Avaliar Ferramentas

De acordo com as necessidades do negócio predeterminadas, a estrutura da

organização, seus recursos disponíveis, bem como os objetivos específicos

levantados para o projeto, as seguintes ferramentas foram consideradas mais

apropriadas para este estudo de caso:

3. Ferramentas selecionadas para o sistema BI da Livraria Embrapa:

A oportunidade de aproveitamento de recursos já existentes foi uma das

estratégias adotadas para a viabilidade do projeto dentro da organização. A existência

de um Data Warehouse (DW) corporativo utilizando uma ferramenta robusta, como a

suíte de ferramentas SAP BusinessObjects, de licença corporativa mantida pela

Embrapa Sede, foi sem dúvida a opção mais apropriada para o estudo de caso

proposto.

Esta escolha implica em uma parceria entre Embrapa Sede e Embrapa

Informação Tecnológica para a realização do projeto.

Dentre as ferramentas disponibilizadas pela suíte SAP BO, serão utilizadas:

o SAP BusinessObjects Data Services: fornece os processos de

integração dos dados e de qualidade dos dados em tempo de

execução, entregando desempenho e escalabilidade. Os processos de

integração dos dados facilitam a exploração, extração, transformação, e

entrega de qualquer tipo de dado em qualquer lugar da rede. (SAP,

2009);

o SAP BusinessObjects Universe Designer: oferece uma representação

de negócios dos dados da organização que auxilia os usuários finais a

terem acesso aos dados de forma autônoma, utilizando os termos de

negócios comuns e isolando os usuários de negócio de detalhes

técnicos das bases de dados onde são armazenados os dados de

origem. Universos são compostos de objetos e classes mapeados para

a fonte de dados no banco de dados e acessados por meio de

consultas e relatórios. (SAP, 2009-2010);

23

o SAP BusinessObjects Web Intelligence é uma ferramenta de análise,

consultas e relatórios ad hoc, voltada para o usuário de negócios. Com

essa ferramenta, os usuários podem ter acesso self-service aos dados

da empresa por meio de uma interface amigável de portal Web

conhecida como InfoView (BROGDEN et al., 2010).

4. Ferramenta selecionada para a Mineração de Dados:

A ferramenta selecionada para aplicação da regra de associação foi a WEKA

(The Waikato Environment for Knowledge Analysis) em sua versão 3.6.

WEKA é um produto da Universidade de Waikato (Nova Zelândia) e foi

implementada pela primeira vez na sua forma atual em 1997. É um software

desenvolvido na linguagem Java™ e com uma interface GUI para interagir com os

arquivos de dados e produzir resultados visuais. (ABERNETHY, 2010). É uma coleção

de algoritmos de aprendizagem para tarefas de mineração de dados. Contém

ferramentas para o pré-processamento dos dados, classificação, regressão,

agrupamento, regras de associação, e visualização (Website WEKA

<http://www.cs.waikato.ac.nz/ml/weka/>).

Apesar da limitação do volume de dados, WEKA foi selecionada para este

estudo de caso por ser uma ferramenta simples de usar, e que implementa o algoritmo

Apriori para a técnica de regras de associação.

4.2. Entendimento dos Dados

Nesta etapa serão realizadas as seguintes tarefas: coletar os dados iniciais;

explorar os dados; e verificar a qualidade dos dados.

4.2.1. Coletar dados iniciais

O estudo de caso será aplicado sobre a base de dados da Livraria Embrapa,

cujo modelo de dados é composto, atualmente, por um total de 94 tabelas.

24

Para efetuar a coleta dos dados iniciais que serão utilizados para o estudo de

caso proposto é necessário resgatar os objetivos de negócio e os objetivos específicos

predeterminados para o projeto.

Levando em conta esses objetivos, observa-se que os dados que devem ser

considerados relevantes para este estudo de caso são aqueles que estiverem

relacionados aos pedidos e às transações de vendas realizadas.

Após análise detalhada do modelo de dados da Livraria, concluímos que, das

94 tabelas que fazem parte deste modelo, somente 34 podem ser consideradas

relevantes para este estudo de caso.

O novo modelo lógico, representando o domínio de dados a ser explorado, está

ilustrado na figura 4.2.

25

Figura 4.2: Modelo Entidade-Relacionamento Livraria Embrapa: domínio de dados a ser explorado.

26

4.2.2. Explorar os dados

As principais estatísticas das entidades, apresentadas no modelo de dados da

figura 4.2, estão descritas no Anexo 02.a.

4.2.3. Verificar a qualidade dos dados

A qualidade dos dados da base de dados da Livraria, em alguns casos, está

bastante comprometida. Os seguintes tipos de problemas foram observados:

• Dados ausentes: foram encontrados valores nulos ou em branco para os

seguintes campos:

o O campo “tipo de pessoa” da tabela de Cliente que indica se o

cliente é pessoa física ou jurídica. O correto é que este campo

esteja preenchido com o valor 1 para pessoa física e 2 para jurídica;

o Os campos “código do município”, “código do estado” e “código do

país” da tabela de Cliente. Estes campos foram inseridos

recentemente nesta tabela. Antigamente, o endereço do cliente não

era de preenchimento obrigatório;

o Os campos “profissão”, “sexo” e “data de nascimento” na tabela

Pessoa Física, os quais também não eram de preenchimento

obrigatório.

• Dados com erros: alguns valores com erros ou inconsistentes também

foram observados, tais como:

o Na tabela de Cliente os campos “cidade cliente”, “estado cliente” e

“pais cliente”, por terem sido, durante um tempo, campos de

preenchimento livre, continham informações inconsistentes (Ex.:

cidade cliente = Rio de Janeiro; e estado cliente = DF). Esses

mesmos campos também apresentaram valores escritos de formas

distintas (Ex.: cidade cliente = Belo Horizonte; e cidade cliente =

BH);

27

o Também foram encontrados muitos clientes duplicados, com o

mesmo email, mas nomes escritos de forma distinta (Ex.: nome

cliente = Antônio de Jesus; e nome cliente = Antonio de Jesus). O

correto, nesse caso, é unificar os cadastros desse cliente;

o A duplicação de registros também acontece no cadastro de autores;

o Foram detectados alguns lixos na base de dados, originados de

testes feitos em momentos anteriores. Por exemplo, clientes que só

existem na tabela de clientes e não possuem acesso cadastrado,

não fizeram pedidos ou compras, etc.;

o Clientes que não possuem email cadastrado. Atualmente o email é

obrigatório para um cliente se cadastrar e ter acesso à Livraria;

o Clientes com data de nascimento inválida (Ex.: 01/12/1500);

o Na tabela de Pedidos, os campos “valor do frete”, “valor do pedido”,

“valor da assinatura”, e “desconto” apresentaram valores com

separador de decimal registrados com “,” e outros registrados com

“.”. Também havia registros com “R$”, “$” ou somente “R”.

4.3. BI Livraria Embrapa – Preparação dos Dados

Por apresentarem diferenças relevantes, a tarefa de preparação dos dados

para o sistema de BI será tratada separadamente da tarefa de preparação dos dados

para a mineração de dados.

Neste momento iremos tratar a tarefa de preparação dos dados somente para

o BI da Livraria Embrapa.

Para esta etapa destacaremos as seguintes tarefas: selecionar os dados; e

limpar os dados.

28

4.3.1. Selecionar os dados

A partir do modelo lógico definido na tarefa “4.2.4. Coletar dados iniciais”,

podemos iniciar a criação do sistema de BI para a Livraria Embrapa.

O primeiro passo é efetuar a importação desses dados para dentro do

repositório de dados corporativo (data warehouse), em uma área intermediária

chamada de data staging area.

Essa área de preparação dos dados do data warehouse é uma área de

armazenamento e de execução de um conjunto de processos chamado ETL (Extract,

Transform, Load) (KIMBALL & ROSS, 2002).

Para isso, foi necessário configurar a ferramenta SAP BusinessObjects Data

Services para realizar o processo de extração, transfomação e carga dos dados da

base origem, armazenada no Microsoft SQL Server, para o repositório de dados

destino da Livraria.

Uma vez configurada, a ferramenta se encarrega de:

• Estabelecer a conexão com a base de dados origem, no caso com a

base da Livraria no Microsoft SQL Server;

• Extrair os dados selecionados da base de dados da Livraria.

• Efetuar a transformação e limpeza dos dados, aplicando regras

automáticas e pré-configuradas para corrigir erros recorrentes;

• Efetuar a carga dos dados no repositório de dados destino.

A figura 4.3 ilustra parte do processo de ETL (Extract, Transform, Load) para o

repositório de dados destino, utilizando a ferramenta SAP BO Data Services Designer.

29

Figura 4.3: ETL origem (SQL Server) – destino (Repositório), usando a ferramenta

SAP BO Data Services Designer.

4.3.2. Limpar os dados

Geralmente, os dados armazenados em um Data Warehouse são processados

em tempo de carga, de forma a remover quaisquer inconsistências sintáticas, como já

foi dito anteriormente.

No entanto, para este estudo de caso, ocorreu também um processo de

limpeza anterior a este, realizado diretamente na base de dados original da Livraria,

armazenada no SGBD Microsoft SQL Server. A limpeza dos dados foi feita via script

desenvolvido em linguagem SQL, visando solucionar alguns dos problemas

identificados durante a fase de entendimento dos dados, na tarefa “4.2.7. Verificar a

qualidade dos dados”.

A limpeza foi realizada para os seguintes casos:

• Para dados nulos, incorretos ou inconsistentes, e considerados críticos

para o bom funcionamento dos sistemas de informação atuais. Por

exemplo, o campo “tipo de pessoa” nulo na tabela de clientes estava

gerando erro no site da Livraria.

30

• Para casos considerados de maior complexidade, gerando um trabalho

quase que manual de análise dos dados anterior à limpeza. Por

exemplo, o campo “código município” preenchido de forma incorreta no

cadastro de clientes.

É relevante observar que, a partir desta análise, os sistemas de informação da

Livraria foram alterados para contemplar funções consideradas críticas ao processo de

negócio da Livraria. Por exemplo, alguns campos que anteriormente eram de livre

preenchimento pelos usuários, agora passaram a mostrar listas de opção para

seleção.

O Anexo 03 ilustra alguns scripts SQL utilizados para a limpeza dos dados

diretamente na base de dados da Livraria.

4.4. BI Livraria Embrapa – Modelagem

Para a fase de Modelagem, destacaremos as seguintes tarefas: selecionar a

técnica de modelagem; construir o modelo; e avaliar o modelo.

4.4.1. Selecionar a técnica de modelagem

O tipo de modelo multidimensional utilizado para a modelagem do repositório

de dados da Livraria Embrapa é o modelo estrela. Neste modelo, todas as tabelas se

relacionam diretamente com a tabela Fato, por meio de uma chave única de

identificação.

O benefício de criar o esquema estrela é agilizar o processamento de dados

dos sistemas de suporte à decisão (DSS). Pela união prévia dos dados e pela criação

de redundância seletiva, o acesso e a análise dos dados são amplamente

simplificados e otimizados (INMON, 2002).

Outro aspecto muito importante no projeto é a questão da granularidade.

A granularidade se refere ao nível de detalhe ou de resumo das unidades de

dados no data warehouse (INMON, 2002).

31

Para este estudo de caso, o modelo dimensional foi desenvolvido com a

informação diária, ou seja, com um maior nível de detalhe e, portanto, baixa

granularidade.

A granularidade é o problema de projeto mais importante no ambiente do data

warehouse porque ele afeta profundamente o volume dos dados que residem no

repositório e o tipo de consulta que pode ser respondida. (INMON, 2002)

4.4.2. Construir o modelo

Uma vez definido o esquema e a granularidade a ser aplicada ao modelo, a

etapa de construção inicia com a identificação das tabelas fato, suas dimensões e

medidas.

4.4.2.1. Construção do Modelo Dimensional

4.4.2.1.1. FATO VENDA DIÁRIA

Esta tabela tem como objetivo a manipulação de dados referentes às

transações de vendas diárias realizadas na Livraria Embrapa.

• Medidas (ou fatos)

As principais medidas criadas para a tabela Fato Venda Diária são:

o Quantidade item: corresponde à quantidade vendida do item

naquela transação de venda;

o Valor bruto item: corresponde ao valor bruto de venda do item

naquela transação de venda;

o Valor líquido item: é igual ao valor líquido de venda do item menos o

valor do desconto aplicado ao item naquela transação de venda;

32

o Quantidade vendida item Venda Direta2: corresponde à quantidade

vendida do item para a transação de venda direta;

o Valor bruto vendido item Venda Direta: corresponde ao valor bruto

de venda do item para a transação de venda direta;

o Valor líquido vendido item Venda Direta: é igual ao valor bruto de

venda direta do item menos o valor do desconto aplicado ao item

para a transação de venda direta;

o Quantidade estorno item Venda Direta: corresponde à quantidade

estornada / devolvida do item para a transação de venda direta;

o Valor bruto estorno item Venda Direta: corresponde ao valor bruto

estornado / devolvido do item para a transação de venda direta;

o Valor líquido estorno item Venda Direta: é igual ao valor bruto

estornado / devolvido do item menos o valor do desconto aplicado

ao item para a transação de venda direta;

o Quantidade apurada item Venda Direta: é igual à quantidade

vendida do item menos a quantidade estornada / devolvida do item

para a transação de venda direta;

o Valor bruto apurado item Venda Direta: é igual ao valor bruto

vendido do item menos o valor bruto estornado / devolvido do item

para a transação de venda direta;

o Valor líquido apurado item Venda Direta: é igual ao valor líquido

vendido do item menos o valor líquido estornado / devolvido do item

para a transação de venda direta.

Outras medidas similares às medidas definidas para Venda Direta foram

definidas também para Vendas por Evento3, Vendas por Consignatária4, Vendas por

Consignante5 e Vendas por Assinatura6.

2 É considerada “Venda Direta” qualquer venda realizada via site da Livraria ou em ambiente interno da Embrapa.

33

• Dimensões

As dimensões que se relacionam com a Fato Venda Diária são:

o Tempo_Diário: Esta dimensão pertence ao Data Warehouse

corporativo da Embrapa e foi integrada ao repositório de dados da

Livraria Embrapa. Ela permite visualizar as vendas realizadas por

dia, semana, quinzena, mês, bimestre, trimestre, semestre e ano;

o Localidade: Esta dimensão permite visualizar as vendas realizadas

por município, estado, região e país;

o Produto_Categoria_Pacote: Esta dimensão corresponde a uma

agregação das entidades Produto, Categoria e Pacote do modelo

original da Livraria. Ela permite visualizar as informações do

produto, as categorias (ou temas) às quais ele pertence, e se ele faz

parte de algum pacote de venda da Livraria.

o Nota_Fiscal_Pedido: Esta dimensão corresponde a uma agregação

de um conjunto de entidades do modelo original da Livraria, tais

como: Pedido, Nota Fiscal, Meio de Transporte, Forma de

Pagamento, Tipo de Remessa, Origem do Pedido, Tipo de

Movimento. Ela permite visualizar os dados do pedido e as

informações das notas fiscais geradas para a solicitação de venda.

o Cliente: Esta dimensão permite a visualização dos dados do cliente

que realizou a compra.

o Tipo_Pagamento: Esta dimensão descreve os tipos de pagamento

possíveis para uma transação de compra na Livraria, tais como

depósito bancário, cartão de crédito, e outros.

3 É considerada “Venda por Evento” a venda realizada em feiras ou eventos externos ao ambiente da Embrapa. 4 É considerada “Venda por Consignatária” a venda realizada em consignação por Consignatária. 5 É considerada “Venda por Consignante” a venda realizada em consignação por Consignante. 6 É considerada “Venda por Assinatura” a venda realizada por meio de assinatura de periódicos, revistas e demais produtos da Livraria vendidos nesta modalidade.

34

A figura 4.4 ilustra o modelo dimensional para a tabela fato Venda Diária.

Figura 4.4: Modelo Dimensional: Fato Venda Diária.

4.4.2.1.2. FATO PEDIDO DIÁRIO

Esta tabela fato tem como objetivo a manipulação de dados referentes às

transações de pedidos diários, efetivados em compras ou não, realizados na Livraria

Embrapa.

• Medidas (ou fatos)

As principais medidas criadas para a tabela Fato Pedido Diário são:

35

o Quantidade item: corresponde à quantidade solicitada do item

naquela transação de pedido de compra;

o Valor bruto item: corresponde ao valor bruto do item naquela

transação de pedido de compra;

o Valor líquido item: é igual ao valor líquido do item menos o valor do

desconto aplicado ao item naquela transação de pedido de compra;

• Dimensões

As dimensões que se relacionam com a Fato Pedido Diário são:

o Tempo_Diário: Esta dimensão pertence ao Data Warehouse

corporativo da Embrapa e foi integrada ao repositório de dados da

Livraria Embrapa. Ela permite visualizar os pedidos realizados por

dia, semana, quinzena, mês, bimestre, trimestre, semestre e ano;

o Localidade: Esta dimensão permite visualizar os pedidos realizados

por município, estado, região e país;

o Produto_Categoria_Pacote: Esta dimensão corresponde a uma

agregação das entidades Produto, Categoria e Pacote do modelo

original da Livraria. Ela permite visualizar as informações do

produto, as categorias (ou temas) às quais ele pertence, e se ele faz

parte de algum pacote de venda da Livraria.

o Pedido: Esta dimensão permite visualizar os detalhes do pedido de

compra realizado.

o Cliente: Esta dimensão permite a visualização dos dados do cliente

que realizou o pedido de compra.

A figura 4.5 ilustra o modelo dimensional para a tabela fato Pedido Diário.

36

Figura 4.5: Modelo Dimensional: Fato Pedido Diário.

4.4.2.1.3. FATO VENDA DIREITO AUTORAL DIÁRIA

Esta tabela fato tem como objetivo a manipulação de dados referentes às

transações de vendas diárias realizados na Livraria Embrapa, sobre as quais incidem

o pagamento de direitos autorais.

• Medidas (ou fatos)

As principais medidas criadas para a tabela Fato Venda Direito Autoral Diária

são:

37

o Quantidade vendida item Direito Autoral: corresponde à quantidade

vendida do item para a transação de venda sobre a qual incidem

direitos autorais;

o Valor bruto vendido item Direito Autoral: corresponde ao valor bruto

de venda do item para a transação de venda sobre a qual incidem

direitos autorais;

o Valor líquido vendido item Direito Autoral: é igual ao valor bruto de

venda do item menos o valor do desconto aplicado ao item para a

transação de venda sobre a qual incidem direitos autorais;

o Quantidade estorno item Direito Autoral: corresponde à quantidade

estornada / devolvida do item para a transação de venda sobre a

qual incidem direitos autorais;

o Valor bruto estorno item Direito Autoral: corresponde ao valor bruto

estornado / devolvido do item para a transação de venda sobre a

qual incidem direitos autorais;

o Valor líquido estorno item Direito Autoral: é igual ao valor bruto

estornado / devolvido do item menos o valor do desconto aplicado

ao item para a transação de venda sobre a qual incidem direitos

autorais;

o Quantidade apurada item Direito Autoral: é igual à quantidade

vendida do item menos a quantidade estornada / devolvida do item

para a transação de venda sobre a qual incidem direitos autorais;

o Valor bruto apurado item Direito Autoral: é igual ao valor bruto

vendido do item menos o valor bruto estornado / devolvido do item

para a transação de venda sobre a qual incidem direitos autorais;

o Valor líquido apurado item Direito Autoral: é igual ao valor líquido

vendido do item menos o valor líquido estornado / devolvido do item

para a transação de venda sobre a qual incidem direitos autorais;

38

o Valor da Comissão Autoral: equivale ao valor a ser pago ao autor,

calculado a partir da taxa percentual do autor aplicada sobre o valor

líquido apurado do item vendido.

• Dimensões

As dimensões que se relacionam com a Fato Venda Direito Autoral Diária são:

o Tempo_Diário: Esta dimensão pertence ao Data Warehouse

corporativo da Embrapa e foi integrada ao repositório de dados da

Livraria Embrapa. Ela permite visualizar as vendas sobre as quais

incidem direitos autorais realizadas por dia, semana, quinzena, mês,

bimestre, trimestre, semestre e ano;

o Localidade: Esta dimensão permite visualizar as vendas sobre as

quais incidem direitos autorais realizadas por município, estado,

região e país;

o Produto_Autoria_Consignataria: Esta dimensão corresponde a uma

agregação das entidades Produto, Autoria, Autor e Produto

Consignado do modelo original da Livraria. Ela permite visualizar as

informações do produto, detalhes dos seus autores, e detalhes da

venda em consignação do produto.

o Nota_Fiscal_Pedido Esta dimensão corresponde a uma agregação

de um conjunto de entidades do modelo original da Livraria, tais

como: Pedido, Nota Fiscal, Meio de Transporte, Forma de

Pagamento, Tipo de Remessa, Origem do Pedido, Tipo de

Movimento. Ela permite visualizar os dados do pedido e as

informações das notas fiscais geradas para a venda sobre a qual

incidem direitos autorais.

o Cliente: Esta dimensão permite a visualização dos dados do cliente

que realizou a compra sobre a qual incidem direitos autorais.

A figura 4.6 ilustra o modelo dimensional para a tabela fato Venda Direito

Autoral Diária.

39

Figura 4.6: Modelo Dimensional: Fato Venda Direito Autoral Diária.

4.4.2.2. Implementação do Modelo Dimensional

Para a implementação do modelo dimensional foi utilizada a ferramenta SAP

BO Data Services Designer, ou seja, todo o trabalho de definição dos atributos,

extração dos dados a partir das tabelas origem, transformação e carga para cada uma

das tabelas Fato e dimensões descritas anteriormente, foram implementados por meio

desta ferramenta.

Para ilustrar o ambiente de desenvolvimento da ferramenta, utilizaremos como

exemplo alguns detalhes da construção da dimensão Nota_Fiscal_Pedido e da tabela

Fato Venda Diária.

• Dimensão Nota_Fiscal_Pedido

40

A figura 4.7 mostra a criação da dimensão Nota_Fiscal_Pedido utilizando a

ferramenta, que executa o ETL das tabelas de origem para a dimensão destino. Note

que esta dimensão é criada a partir de diversas tabelas do modelo relacional origem.

Figura 4.7: ETL dimensão “Nota_Fiscal_Pedido”, utilizando a ferramenta SAP BO Data

Services Designer.

Os detalhes do SQL de extração dos dados das tabelas origem para esta

dimensão destino são mostrados na figura 4.8.

.

41

Figura 4.8: SQL de extração dados origem para dimensão “Nota_Fiscal_Pedido”,

utilizando a ferramenta SAP BO Data Services Designer.

• Fato Venda Diária

A configuração da ferramenta para implementação do ETL de criação da tabela

Fato Venda Diária é ilustrado na figura 4.9.

42

Figura 4.9: ETL “Fato Venda Diária”, utilizando a ferramenta SAP BO Data Services

Designer.

A figura 4.10 mostra o exemplo de um dos SQL’s criados para o ETL da Fato

Venda Diária.

Figura 4.10: SQL de criação “Fato Venda Diária”, utilizando a ferramenta SAP BO Data

Services Designer.

Detalhes do cálculo de uma das medidas da Fato Venda Diária são ilustrados

na figura 4.11.

43

Figura 4.11: Cálculo de medida para “Fato Venda Diária”, utilizando a ferramenta SAP

BO Data Services Designer.

4.4.2.3. Criação dos Universos

Para tornar os modelos criados acessíveis aos usuários finais, é necessário

construir os Universos na chamada área de apresentação dos dados.

A área de apresentação dos dados (data presentation area) é o local onde os

dados são organizados, armazenados, e disponibilizados para serem consultados por

usuários e outras aplicações analíticas (KIMBALL & ROSS, 2002).

Para a criação dos Universos foi utilizada a ferramenta SAP BO Universe

Designer. Foram criados três Universos distintos, um para cada tabela fato: o Universo

“Venda Diária”; o Universo “Pedido Diário”; e o Universo “Venda Direito Autoral Diária”.

Todos os três Universos são interligados, o que significa que os usuários conseguem

fazer cruzamentos entre suas tabelas.

Para ilustrar o ambiente de desenvolvimento da ferramenta, utilizaremos, como

exemplo, detalhes da construção do Universo “Venda Direito Autoral Diária”,

apresentado na figura 4.12.

44

Figura 4.12: Universo “Venda Direito Autoral Diária” no ambiente de desenvolvimento

da ferramenta SAP BO Universe Designer.

4.5. BI Livraria Embrapa – Avaliação

Esta etapa tem como objetivo avaliar se os resultados que podem ser obtidos,

a partir da implementação do sistema de BI, alcançam os objetivos de negócio e os

objetivos específicos estabelecidos em “4.1.1.3 Os Objetivos do Negócio” e “4.1.3.1.

Objetivos Específicos do Sistema de BI” respectivamente.

4.5.1. Avaliar os resultados

4.5.1.1. Gerar os resultados

Esta etapa inicia pela disponibilização de uma ferramenta OLAP aos usuários

de negócio da Livraria Embrapa, de forma que eles consigam acessar os dados

disponíveis no repositório de dados criado para a Livraria, e construir suas próprias

consultas e relatórios. Dessa forma, é possível verificar se suas necessidades estão

sendo atendidas pelo sistema de BI implementado.

45

Como já foi dito anteriormente, a ferramenta selecionada é a SAP

BusinessObjects Web Intelligence, a qual disponibiliza, aos usuários autorizados, os

Universos criados para a Livraria Embrapa, descritos em “4.4.2.3. Criação dos

Universos”.

A figura 4.13 ilustra o ambiente de desenvolvimento da ferramenta Web

Intelligence, com uma lista de relatórios criados com base nos Universos

implementados para a Livraria Embrapa.

Figura 4.13: Ambiente de desenvolvimento da ferramenta SAP BO Web Intelligence.

Esta ferramenta possibilita aos usuários realizar análises variadas em formatos

e sob perspectivas diversas.

Em uma das consultas realizadas, foi solicitada a seguinte pergunta: “Como

está a evolução mensal das vendas no período de 2008 a 2010?”.

A consulta, ilustrada na figura 4.14, retornou as quantidades e valores das

vendas de cada mês dos anos solicitados, em formato de tabela de referência cruzada

e no formato gráfico de linhas.

46

Figura 4.14: Relatório: Análise Mensal das Vendas no Período.

Em outra consulta foi solicitada a pergunta: “Qual o percentual de variação das

vendas por categoria de produto (ou tema) da Livraria entre 2009 e 2010?”.

A consulta, ilustrada na figura 4.15, retornou as taxas percentuais de

crescimento e de faturamento para cada uma das categorias de produtos da Livraria,

além dos detalhes das quantidades e valores das vendas, em formato de tabela de

referência cruzada e no formato gráfico de barras verticais (figura 4.16).

Figura 4.15: Relatório: Análise das Vendas por Tema no Período.

47

Figura 4.16: Gráfico de barras verticais: Análise das Vendas por Tema no Período.

Para a próxima consulta foi solicitada a pergunta: “Quais foram as principais

fontes de origem dos pedidos de vendas em 2010?”.

A consulta, ilustrada na figura 4.17, retornou a distribuição dos pedidos de

vendas entre as fontes de origem existentes, ordenando da fonte mais rentável para a

menos rentável, em formato de tabela vertical e no formato gráfico de pizza.

Figura 4.17: Relatório: Pedidos realizados no Período por Tipo de Origem.

48

Em mais uma consulta foi solicitada a pergunta: “Quais foram os 10 produtos

campeões de venda em 2010?”.

A consulta, ilustrada na figura 4.18, retornou, no formato de tabela vertical, o

ranking dos 10 produtos que tiveram mais exemplares vendidos em 2010. Além disso,

demonstrou a distribuição das vendas para esses produtos em dois gráficos de pizza:

o da esquerda mostrando a distribuição em termos da quantidade vendida; e o da

direita mostrando a distribuição em termos de faturamento dos produtos.

Figura 4.18: Relatório: Produtos mais vendidos no Período.

A próxima consulta foi solicitada uma pergunta parecida com a anterior, mas

com foco nas categorias de produtos: “Quais as categorias de produtos (ou temas)

que mais venderam em 2010?”.

A consulta, ilustrada na figura 4.19, retornou as quantidades vendidas para

cada tema, em ordem dos mais vendidos para os menos vendidos, no forma de tabela

vertical. O gráfico de pizza mostra como ficou a distribuição das vendas entre os

temas.

49

Figura 4.19: Relatório: Ranking de Vendas por Tema no Ano.

Para a consulta abaixo (figura 4.20) foi solicitada a pergunta “Quanto foi

vendido por país no período de 2010 a 2011 ?”.

Figura 4.20: Relatório: Vendas por País no Período.

A partir da consulta retornada anteriormente (figura 4.20) foi possível utilizar o

recurso drill down, que permite a visualização em diferentes níveis de detalhe. Neste

caso, partimos do nível mais alto (por país) para um nível inferior (por região), gerando

a próxima consulta, conforme mostra a figura 4.21.

50

Figura 4.21: Relatório: Vendas por Localidade no Período (Drill Down País-Região).

Para a consulta abaixo (figura 4.22) foi solicitada a pergunta “Quanto foi

vendido por UF e Região em 2010 ?”.

Esta consulta retornou as quantidades e valores vendidos por UF, agrupando e

totalizando por Região, em formato de tabela vertical. Os resultados para cada UF são

mostrados também no formato de gráfico de barras horizontal.

Figura 4.22: Relatório: Vendas por UF no Período.

51

E, como último exemplo, foi solicitada a pergunta “Qual foi a forma de

pagamento mais utilizada pelos clientes da Livraria em 2010 ?”.

Esta consulta, ilustrada na figura 4.23, retornou as quantidades e valores

vendidos por tipo de pagamento no período, em formato de tabela vertical, e a

distribuição da quantidade vendida no formato gráfico de pizza.

Figura 4.23: Relatório: Vendas por Tipo de Pagamento no Período.

4.5.1.2. Avaliar os resultados e revisar o processo

Durante o processo de geração e validação dos resultados, através das

consultas criadas na ferramenta Web Intelligence, alguns problemas surgiram

originados da fase de modelagem do BI, tais como: erros nos SQLs gerados; métricas

calculadas de forma incorreta; nomes de medidas que não estavam tão claras para os

usuários finais. Por esse motivo e, por ser um processo iterativo, foi possível retornar

às fases anteriores para correção das falhas e ajuste dos erros.

Os exemplos de consulta, apresentados anteriormente, mostraram como o

sistema de BI da Livraria Embrapa ampliou, para o usuário final, as possibilidades de

acesso e consulta aos dados, anteriormente restritos à área de informática e aos

poucos relatórios fixos disponibilizados pelos sistemas de informação atuais da

Livraria. Dessa forma, a informação tornou-se facilmente acessível, permitindo o

cruzamento de informações e sua apresentação em formatos e sob perspectivas

52

diversas, atendendo, portanto, ao primeiro objetivo de negócio pré-estabelecido para o

projeto.

Além disso, utilizando os dados dos atributos e métricas geradas para os

Universos da Livraria, os usuários do negócio poderão responder a cada um dos

objetivos específicos pré-determinados para este projeto, e a outros que surgirem

durante o processo de tomada de decisão.

Por ser integrado ao Data Warehouse corporativo, usuários autorizados

poderão, ainda, ter acesso e realizar cruzamentos de informações entre os Universos

criados para a Livraria Embrapa e os demais Universos corporativos, atendendo ao

segundo objetivo de negócio deste estudo.

E, finalmente, a opção por utilizar uma ferramenta acessível pela Web faz toda

a diferença quando se trata de ter a informação disponível a qualquer hora e em

qualquer lugar, em tempo hábil para a tomada de decisão, seja ela improvisada ou

não, atendendo, portanto, ao último objetivo de negócio pré-estabelecido para este

projeto.

53

4.6. Regras de Associação – Preparação dos Dados

Neste momento iniciaremos a etapa de mineração de dados, utilizando a

técnica de Regras de Associação para a análise da cesta de compras da Livraria.

Dentre as tarefas que fazem parte desta etapa, destacamos: selecionar os

dados; e formatar os dados.

4.6.1. Selecionar os dados

Os dados necessários à aplicação das regras de associação para a Livraria

Embrapa foram selecionados por meio de consulta às transações de vendas

armazenadas no repositório de dados já existente para a Livraria.

Existem alguns benefícios reais se seus dados já fazem parte de um data

warehouse. (...) Se os dados já foram limpos para um data warehouse, então,

provavelmente não será necessária sua limpeza para ser minerado. Além disso, você

já terá solucionado muitos dos problemas de consolidação dos dados e colocado no

lugar procedimentos de manutenção (EDELSTEIN, 1999).

Devido ao volume e diversidade de produtos vendidos pela Livraria, conforme

demonstrado nas estatísticas básicas (Anexo 02.a), a aplicação das regras de

associação em toda a base de dados com a utilização da ferramenta WEKA tornou-se

inviável.

A alternativa para este estudo foi tentar gerar uma amostra menos volumosa,

porém, significativa para a análise, pelo estabelecimento de alguns critérios de

seleção:

• Deverão ser selecionados apenas os dados de transações de venda

direta, ou seja, vendas realizadas pelo site da Livraria ou internamente

na Embrapa (balcão);

54

• A Livraria contempla transações de vendas registradas desde o ano de

2002. Para este estudo a seleção deverá considerar somente os dados

mais recentes, no caso, transações de vendas realizadas em 2011;

• A seleção deverá contemplar apenas transações que tenham, pelo

menos, mais de um item vendido;

• E, finalmente, deverão ser selecionados apenas itens que não façam

parte de pacotes.

Para todas as amostras a seguir descritas foram aplicados os critérios de

seleção pré-determinados.

� Primeira amostra: transações de vendas do 1º bimestre de 2011.

A abordagem inicial foi selecionar dados de transações de vendas realizadas

no 1º bimestre de 2011 para analisar a relação existente entre os títulos vendidos

neste período.

Esta seleção retornou os seguintes números:

• 1.600 itens foram vendidos em 404 transações de venda direta no 1º

bimestre de 2011;

• Média de aproximadamente 4 itens por transação;

• 574 títulos distintos (entre livros, CDs, DVDs, periódicos, etc.).

A partir desses números, observa-se que:

• Sendo 1.536 o total de títulos disponíveis para venda na Livraria em

2011, conforme estatísticas básicas descritas no Anexo 02.a, para esta

amostra (1º bimestre de 2011) apenas 37% (574) de todos os títulos

disponíveis para venda na Livraria despertaram interesse de compra

pelos clientes, em transações de venda direta;

55

• Além disso, a diversidade de títulos vendidos (574) gera um alto

número de atributos para o arquivo de entrada usado pela ferramenta

WEKA, aumentando a complexidade de execução do algoritmo Apriori

e inviabilizando a execução do modelo;

• E, finalmente, a diversidade de títulos vendidos (574) é muito grande

em relação ao total de itens vendidos no período (1.600), gerando uma

relação de 1 para 3 (1 título diferente a cada 3 transações de venda),

como se pode notar no Anexo 02.b. A fragmentação de títulos entre as

transações de venda gera uma baixa freqüência, diminuindo,

consequentemente, a probabilidade de se conseguir extrair

associações relevantes.

Por esses motivos optou-se por desconsiderar esta amostra inicial para

execução dos modelos e partir para uma nova amostragem, que tivesse uma melhor

representatividade no universo de dados a ser explorado.

� Segunda amostra: transações de vendas do 1º semestre de 2011.

Para esta amostragem foram selecionados dados de transações de vendas

realizadas no 1º semestre de 2011, aumentando, portanto, o universo da amostra,

para analisar a relação existente entre os títulos vendidos neste período.

Os seguintes números foram retornados:

• 5.095 itens foram vendidos em 1.210 transações de venda direta no 1º

semestre de 2011;

• Média de aproximadamente 4 itens por transação;

• 959 títulos distintos (entre livros, CDs, DVDs, periódicos, etc.).

A partir desses números, observa-se que:

56

• Nesta amostra (1º semestre de 2011) 62% (959) de todos os títulos

disponíveis para venda na Livraria (1.536) despertaram interesse de

compra pelos clientes, em transações de venda direta.

• A diversidade de títulos vendidos (959), para esta amostra, gera um

número de atributos ainda maior que o da primeira amostra para o

arquivo de entrada usado pela ferramenta WEKA, aumentando ainda

mais a complexidade de execução do algoritmo Apriori e inviabilizando

a execução do modelo;

• A relação entre títulos distintos vendidos (959) e o total de itens

vendidos (5.095) é de 1 para 5 (1 título diferente a cada 5 transações

de venda), como se pode notar no Anexo 02.c, resultando ainda em

uma baixa probabilidade de se conseguir extrair associações

relevantes.

Para refinar a seleção dos dados e viabilizar a execução dos modelos das

regras de associação, visando, ao final, obter melhores resultados, o estudo foi

direcionado para tentar reduzir o tamanho da amostra em termos de títulos a serem

analisados, o que será feito para a próxima amostragem proposta.

� Terceira amostra: transações de vendas do 1º semestre de 2011 – títulos

mais solicitados.

Neste caso foi feito um corte na amostra anterior, reduzindo-a em 50%,

considerando os títulos mais solicitados. O Anexo 02.d ilustra a nova amostra

resultante deste corte.

Os seguintes números foram retornados:

• 2.564 itens vendidos em 948 transações de venda direta no 1º

semestre de 2011;

• Média de aproximadamente 3 itens por transação;

• 110 títulos distintos (entre livros, CDs, DVDs, periódicos, etc.).

57

Esses números mostram que:

• Reduzimos a diversidade de títulos, optando por fazer a análise

somente entre os títulos mais solicitados para compra. Esta redução

viabilizará a execução do modelo na ferramenta WEKA;

• Neste caso houve uma melhora na relação entre o número de títulos

(110) e o total de itens vendidos (2.564), gerando uma relação de 1

para 23 (1 título diferente a cada 23 transações de venda), o que

aumenta um pouco a freqüência de um mesmo título entre as

transações de venda, podendo trazer melhores resultados para os

modelos.

A partir desta última amostra selecionada, o estudo realizará análises do tipo:

a. Produto x Produto

b. Região x Produto

c. UF x Produto

d. Produto x Linha Produto

e. Linha Produto x Linha Produto

f. Região x Linha Produto

A tabela 4.2 ilustra a estrutura dos dados selecionados da amostra para esta

abordagem.

Tabela 4.2: Estrutura da consulta: Transações de vendas da Livraria Embrapa.

Nº Pedido UF Região Código

Produto Nome Produto Ano Edição Preço Tipo Linha

Produto

166645 SP Sudeste 00013710

Coleção 500 Perguntas 500 Respostas: Gado de Corte, 1ª Edição

2003 10,00 Livro Criações Diversas

161676 DF Centro-Oeste

00063300

Coleção 500 Perguntas 500 Respostas: Suínos, 2ª Edição

2007 20,00 Livro Produção

Animal

58

4.6.2. Formatar os dados

A ferramenta WEKA trabalha com arquivos de entrada no formato ARFF

(Attribute-Relation File Format), que corresponde a um arquivo texto ASCII que

descreve uma lista de instâncias compartilhando um conjunto de atributos

(BOUCKAERT et al., 2010).

Para trabalhar com regras de associação foi necessária uma adaptação da

estrutura do arquivo demonstrado na tabela 4.2, de forma que as regras sejam

binárias e assimétricas.

Binárias, já que irão se referir à presença ou à ausência de cada objeto nas

transações que fazem parte do conjunto de dados. Assimétricas, uma vez que

implicitamente assumimos, como é costume na análise do cesto de compras, que a

presença de um objeto em uma única transação, correspondendo a uma aquisição

real, é muito mais relevante que sua ausência, correspondendo a uma não-aquisição

(VERCELLIS, 2009).

Portanto, as seguintes formatações foram realizadas no conjunto de dados:

• Transformação das linhas (registros dos itens vendidos) em colunas;

• Indicação de itens presentes e itens ausentes: os itens ausentes são

representados com “?”. Se o “?” não for utilizado, a ferramenta WEKA

acaba minerando regras envolvendo itens ausentes, o que não é relevante

para o processamento, como dito anteriormente. Para os itens presentes,

ou seja, produtos que foram adquiridos naquela transação (pedido), foi

inserido o valor “Y”.

• Transformação dos atributos contínuos em intervalos de dados, levando em

consideração o valor mínimo e máximo de cada atributo. Segundo

VERCELLIS (2009) o objetivo dos métodos de redução dos dados é obter

um decréscimo no número de valores distintos assumidos por um ou mais

atributos. A discretização dos dados é o primeiro método de redução (...)

ela reduz atributos contínuos em atributos categóricos caracterizados por

um número limitado de valores distintos.

59

o Atributo Ano de Edição: apresentou valores entre 1993 e 2011 para a

amostra selecionada.

Tabela 4.3: Intervalo de dados do atributo “Ano de Edição” do Produto.

Faixas do Ano de Edição

1993 – 1996

1997 – 2000

2001 – 2004

2005 – 2008

2009 – 2011

o Atributo Preço: apresentou valores entre R$ 3,00 e R$ 96,00 para a

amostra selecionada.

Tabela 4.4: Intervalo de dados do atributo “Preço” do Produto.

Faixas de Preço

0,00 – 20,00

21,00 – 40,00

41,00 – 60,00

61,00 – 80,00

81,00 – 100,00

A tabela 4.5 mostra, como exemplo, a nova estrutura da consulta às transações

de vendas, adaptada para executar a regra de associação binária e assimétrica para a

análise PRODUTO x PRODUTO.

60

Tabela 4.5: Estrutura da consulta Produto x Produto.

Transações de vendas

Produto1 (00013710)

Produto 2 (00063300) ... Produto n

1 (166645) Y ? ... ?

2 (161676) ? Y ... ?

O próximo passo foi a exportação de cada arquivo de dados para o formato

CSV (separado por vírgulas). E, finalmente, foi realizada a formatação do arquivo

ARFF da seguinte forma:

• Especificação dos itens do domínio no cabeçalho do arquivo ARFF: cada

item foi tratado como um atributo distinto e configurado como sendo do tipo

categórico, suportando apenas dois valores {Y,N}. Maiores detalhes sobre a

formatação do arquivo ARFF está disponível em

<http://www.cs.waikato.ac.nz/~ml/weka/arff.html>

• Inserção dos dados do arquivo CSV para o arquivo ARFF. A figura 4.24

ilustra um dos arquivos ARFF gerados.

Figura 4.24: Exemplo arquivo Formato ARFF para a relação Produto x Produto.

61

4.7. Regras de Associação – Modelagem

Nesta fase destacaremos as seguintes tarefas: selecionar a técnica de

modelagem; e construir o modelo.

4.7.1. Selecionar a técnica de modelagem

Para gerar a regra de associação utilizando a ferramenta WEKA, o algoritmo

selecionado foi o Apriori.

4.7.2. Construir o modelo

A modelagem geralmente é conduzida em múltiplas iterações. Neste momento

serão definidos os parâmetros para a execução dos modelos.

4.7.2.1. Análise PRODUTO x PRODUTO

O objetivo desta análise é tentar compreender o comportamento do

consumidor, verificando quais produtos eles costumam comprar juntos em uma

mesma transação.

A figura 4.25 ilustra os atributos utilizados e um dos histogramas gerados para

o arquivo ARFF da análise Produto x Produto, carregado na ferramenta WEKA.

Figura 4.25: Ferramenta WEKA: Análise Produto x Produto.

62

• Modelo 1: Parâmetros padrão da ferramenta

Primeiramente, os modelos foram executados com os parâmetros padrão da

ferramenta (figura 4.26):

o Suporte Mínimo: 0.1 (10%)

o Confiança Mínima: 0.9 (90%)

o Número de regras: máximo de 10 regras

Figura 4.26: Ferramenta WEKA: Algoritmo Apriori (Parâmetros padrão).

Este modelo não retornou nenhuma regra (Anexo 04.a.1), o que já era

esperado, uma vez que sabemos que o título mais vendido corresponde a apenas 3%

do total da amostra (Anexo 02.d), devido à grande diversidade de títulos vendidos. Isto

significa que o suporte da regra deve ser, pelo menos, menor do que esse percentual,

para que seja retornada alguma regra.

Por esse motivo, foi necessário ajustar os parâmetros do algoritmo Apriori,

utilizando um baixo valor de suporte.

• Modelo 2: Parâmetros ajustados.

o Suporte Mínimo: 0.01 (1%)

o Confiança Mínima: 0.6 (60%)

o Número de regras: máximo de 20 regras

63

Este modelo retornou um total de 15 regras (ver Anexo 04.a.2). A tabela 4.6

ilustra o resumo com as principais regras:

Tabela 4.6: Resumo dos Resultados: Análise Produto x Produto (Modelo 2).

1 Quem

comprou 00082120

Cerrado: Ecologia e Flora,

Vol. 2 Suporte 1,16%

Também

comprou 00082110

Cerrado: Ecologia e Flora,

Vol. 1 Confiança 85%

2 Quem

comprou 00070530

Coleção Plantar - A Cultura

da Cebola, 1ª Edição Suporte 1,05%

Também

comprou 00013220

Coleção Plantar - A Cultura

do Tomateiro (para mesa), 1ª

Edição

Confiança 71%

3 Quem

comprou 00051850

Metodologia para análise de

mosto e suco de uva Suporte 1,05%

Também

comprou 00051950

Metodologia para análise de

vinho Confiança 71%

00013740 Coleção Criar - Confinamento

de Bovinos, 1ª Edição 4

Quem

comprou 00013690

Coleção Criar - Cruzamento

em Gado de Corte, 1ª Edição

Suporte 1,16%

Também

comprou 00013710

Coleção 500 Perguntas 500

Respostas: Gado de Corte, 1ª

Edição

Confiança 69%

5 Quem

comprou 00071520

Criação de ovinos a pasto no

Semi-árido Nordestino Suporte 1,47%

Também

comprou 00081710

ABC da Agricultura Familiar:

Criação de Caprinos e Ovinos Confiança 67%

6 Quem

comprou 00079120

ABC da Agricultura Familiar:

Como plantar caju Suporte 1,05%

Também

comprou 00078730

ABC da Agricultura Familiar:

Como cultivar a bananeira Confiança 67%

64

7 Quem

comprou 00064520

Capim-Gramão: Uma Opção

para o Nordeste Brasileiro Suporte 0,95%

Também

comprou 00081710

ABC da Agricultura Familiar:

Criação de Caprinos e Ovinos Confiança 64%

8 Quem

comprou 00078100

Manual de Identificação de

Insetos e Outros

Invertebrados da Cultura da

Soja

Suporte 1,47%

Também

comprou 00077440

Manual de Identificação de

Doenças de Soja, 2ª Edição Confiança 64%

Notamos que os títulos mais populares nas transações de venda da amostra

selecionada (ver Anexo 02.d), praticamente não apareceram nas regras obtidas do

resultado anterior. Isto porque, são títulos mais freqüentes na amostra, mas com

poucas associações, o que diminui o fator de confiança.

Por esse motivo, e para analisar as associações existentes entre os títulos

mais populares e os demais títulos, ajustamos novamente os parâmetros para um

novo modelo, aumentando um pouco o suporte e diminuindo a confiança.

• Modelo 3: Novo ajuste de parâmetros.

o Suporte Mínimo: 0.02 (2%)

o Confiança Mínima: 0.2 (20%)

o Número de regras: máximo de 20 regras

Este modelo retornou um total de 8 regras (ver Anexo 04.a.3). A tabela 4.7

ilustra o resumo com as principais regras:

Tabela 4.7: Resumo dos Resultados: Análise Produto x Produto (Modelo 3).

1 Quem

comprou 00013690

Coleção Criar - Cruzamento

em Gado de Corte, 1ª Edição Suporte 2,1%

Também

comprou 00013710

Coleção 500 Perguntas 500

Respostas: Gado de Corte, 1ª

Edição

Confiança 67%

2 Quem

comprou 00013220

Coleção Plantar - A Cultura

do Tomateiro (para mesa), 1ª Suporte 2%

65

Edição

Também

comprou 00013210

Coleção Plantar - O Cultivo

de Hortaliças, 1ª Edição Confiança 49%

3 Quem

comprou 00013210

Coleção Plantar - O Cultivo

de Hortaliças, 1ª Edição Suporte 2,32%

Também

comprou 00081600

ABC da Agricultura Familiar:

Criação de galinhas caipiras Confiança 31%

4 Quem

comprou 00081600

ABC da Agricultura Familiar:

Criação de galinhas caipiras Suporte 2,42%

Também

comprou 00081710

ABC da Agricultura Familiar:

Criação de Caprinos e Ovinos Confiança 31%

4.7.2.2. Análise REGIÃO x PRODUTO

O objetivo desta análise é verificar quais produtos possuem associações

relevantes com quais regiões do país.

A figura 4.27 ilustra os atributos utilizados e um dos histogramas gerados para

o arquivo ARFF da análise REGIÃO x PRODUTO, carregado na ferramenta WEKA.

O gráfico mostra a distribuição das transações de vendas entre as regiões,

para a amostra selecionada, e indica que a região Sudeste é onde ocorre a maior

parte das vendas (321), seguida da região Centro-Oeste (248).

66

Figura 4.27: Ferramenta WEKA: Análise Região x Produto.

• Modelo 1: Parâmetros padrão da ferramenta

o Suporte Mínimo: 0.1 (10%)

o Confiança Mínima: 0.9 (90%)

o Número de regras: máximo de 10 regras

Novamente nenhuma regra foi encontrada (ver Anexo 04.b.1), devido ao

mesmo motivo do modelo anterior. Por isso os parâmetros tiveram que ser ajustados.

• Modelo 2: Parâmetros ajustados.

o Suporte Mínimo: 0.01 (1%)

o Confiança Mínima: 0.6 (60%)

o Número de regras: máximo de 20 regras

Este modelo retornou um total de 20 regras (ver Anexo 04.b.2). A tabela 4.8

ilustra o resumo com as regras relevantes:

Tabela 4.8: Resumo dos Resultados: Análise Região x Produto (Modelo 2).

1 Quem

comprou 00064520

Capim-Gramão: Uma Opção

para o Nordeste Brasileiro Suporte 1,05%

Está na

Região Nordeste Confiança 71%

67

Centro-Oeste

2

Quem está

na região

e comprou 00013220

Coleção Plantar - A Cultura

do Tomateiro (para mesa), 1ª

Edição

Suporte 1,05%

Também

comprou 00013210

Coleção Plantar - O Cultivo

de Hortaliças, 1ª Edição Confiança 71%

3 Quem

comprou 00071520

Criação de ovinos a pasto no

Semi-árido Nordestino Suporte 1,47%

Está na

Região Nordeste Confiança 67%

4 Quem

comprou 00083800

Frutas Nativas da Região

Centro-Oeste do Brasil Suporte 1, 37%

Está na

Região Centro-Oeste Confiança 65%

5 Quem

comprou 00078160

Boas Práticas na Colheita,

Extração e Beneficiamento do

Mel

Suporte 0,95%

Está na

Região Sudeste Confiança 60%

6 Quem

comprou 00051950

Metodologia para análise de

vinho Suporte 0,95%

Está na

Região Sudeste Confiança 60%

7 Quem

comprou 00065490

Reflorestamento de

Propriedades Rurais para fins

Produtivos e Ambientais

Suporte 0,95%

Está na

Região Sudeste Confiança 60%

Para analisar as associações mais freqüentes, ainda que a confiança seja

menor, ajustamos novamente os parâmetros, aumentando um pouco o suporte e

reduzindo a confiança, a fim de encontrar novas regras.

68

• Modelo 3: Novo ajuste de parâmetros.

o Suporte Mínimo: 0.02 (2%)

o Confiança Mínima: 0.4 (40%)

o Número de regras: máximo de 20 regras

Este modelo retornou um total de 5 regras (ver Anexo 04.b.3). A tabela 4.9

ilustra o resumo com as regras relevantes:

Tabela 4.9: Resumo dos Resultados: Análise Região x Produto (Modelo 3).

1 Quem

comprou 00084000

Coleção Plantar - A Cultura

da Goiaba, 2ª Edição Suporte 2,11%

Está na

Região Sudeste Confiança 56%

2 Quem

comprou 00080660

Coleção Plantar - A Cultura

do Maracujá, 3ª Edição Suporte 2,95%

Está na

Região Sudeste Confiança 41%

3 Quem

comprou 00083690

ABC da Agricultura Familiar:

Minhocultura - produção de

húmus

Suporte 2,21%

Está na

Região Centro-Oeste Confiança 40%

4.7.2.3. Análise UF x PRODUTO

O objetivo desta análise é verificar quais produtos possuem associações

relevantes com quais estados do país.

A figura 4.28 ilustra os atributos utilizados e um dos histogramas gerados para

o arquivo ARFF da análise UF x PRODUTO, carregado na ferramenta WEKA.

O gráfico mostra a distribuição das transações de vendas entre os Estados,

para a amostra selecionada, e indica que o estado de São Paulo (164 transações de

venda) é onde ocorre a maior parte das vendas, seguido pelo Distrito Federal (133

transações de venda) e Minas Gerais (101 transações de venda).

69

Figura 4.28: Ferramenta WEKA: Análise UF x Produto.

• Modelo 1: Parâmetros padrão da ferramenta

o Suporte Mínimo: 0.1 (10%)

o Confiança Mínima: 0.9 (90%)

o Número de regras: máximo de 10 regras

Novamente nenhuma regra foi retornada (ver Anexo 04.c.1), pelo mesmo

motivo do modelo anterior. Por isso, os parâmetros tiveram que ser ajustados.

• Modelo 2: Parâmetros ajustados.

o Suporte Mínimo: 0.01 (1%)

o Confiança Mínima: 0.3 (30%)

o Número de regras: máximo de 70 regras

Este modelo retornou um total de 67 regras (ver Anexo 04.c.2). Pela forma

binária como o arquivo ARFF foi disponibilizado, a grande maioria das regras

encontradas mostrou associações existentes somente entre os produtos. Por esse

motivo, desconsideramos essas regras, uma vez que já analisamos a relação entre

produtos, e levamos em conta somente aquelas que apresentam o atributo UF na

associação, que é o objetivo desta análise. A tabela 4.10 ilustra o resumo com as

principais regras:

70

Tabela 4.10: Resumo dos Resultados: Análise UF x Produto (Modelo 2).

1 Quem está

na UF PE Suporte 1,05%

Comprou 00081710 ABC da Agricultura Familiar:

Criação de Caprinos e Ovinos Confiança 48%

2 Quem

comprou 00083690

ABC da Agricultura Familiar:

Minhocultura - produção de

húmus

Suporte 1,9%

Está na UF DF Confiança 35%

3 Quem

comprou 00050580

Criação de abelhas indígenas

sem ferrão, 2ª Edição Suporte 1,16%

Está na UF SP Confiança 32%

4 Quem

comprou 00081610

ABC da Agricultura Familiar:

Criação de abelhas

(Apicultura)

Suporte 1,05%

Está na UF SP Confiança 31%

5 Quem

comprou 00083920

ABC da Agricultura Familiar:

Como Instalar Colméias Suporte 1,05%

Está na UF SP Confiança 31%

6 Quem

comprou 00013220

Coleção Plantar - A Cultura

do Tomateiro (para mesa), 1ª

Edição

Suporte 1,26%

Está na UF DF Confiança 31%

4.7.2.4. Análise LINHA PRODUTO x PRODUTO

O objetivo desta análise é verificar quais produtos são vendidos em conjunto

com quais linhas de produto.

A figura 4.29 mostra os atributos utilizados e um dos histogramas gerados para

o arquivo ARFF da análise LINHA PRODUTO x PRODUTO, carregado na ferramenta

WEKA.

71

Figura 4.29: Ferramenta WEKA: Análise Linha Produto x Produto.

• Modelo 1: Parâmetros padrão da ferramenta

o Suporte Mínimo: 0.1 (10%)

o Confiança Mínima: 0.9 (90%)

o Número de regras: máximo de 10 regras

Novamente nenhuma regra foi retornada (ver Anexo 04.d.1), pelo mesmo

motivo do modelo anterior. Por isso, os parâmetros tiveram que ser ajustados.

• Modelo 2: Parâmetros ajustados.

o Suporte Mínimo: 0.03 (3%)

o Confiança Mínima: 0.6 (60%)

o Número de regras: máximo de 100 regras

Este modelo retornou um total de 51 regras (ver Anexo 04.d.2). Neste caso

específico, ignoramos as regras com confiança = 100%, uma vez que estas dizem

respeito a produtos associados à sua própria linha de produto. O que procuramos são

produtos associados a linhas de produtos diferentes das deles.

A tabela 4.11 ilustra o resumo das principais regras para esta análise:

72

Tabela 4.11: Resumo dos Resultados: Análise Linha Produto x Produto (Modelo 2).

1 Quem

comprou 00081600

ABC da Agricultura Familiar:

Criação de galinhas caipiras Suporte 6,33%

Também

comprou

produto

da Linha

Agricultura Confiança 81%

2 Quem

comprou 00013710

Coleção 500 Perguntas 500

Respostas: Gado de Corte, 1ª

Edição

Suporte 4,32%

Também

comprou

produto

da Linha

Produção Animal Confiança 79%

3 Quem

comprou 00078800

ABC da Agricultura Familiar:

Cultivo de peixes Suporte 3,69%

Também

comprou

produto

da Linha

Agricultura Confiança 74%

Agricultura

4

Quem

comprou

produto

da Linha e

comprou

00081710 ABC da Agricultura Familiar:

Criação de Caprinos e Ovinos

Suporte 3,27%

Também

comprou

produto

da Linha

Criações Confiança 70%

73

4.7.2.5. Análise LINHA PRODUTO x LINHA PRODUTO

O objetivo desta análise é verificar quais linhas de produtos são vendidas em

conjunto na mesma transação.

A figura 4.30 ilustra os atributos utilizados e um dos histogramas gerados para

o arquivo ARFF da análise LINHA PRODUTO x LINHA PRODUTO, carregado na

ferramenta WEKA.

Figura 4.30 Ferramenta WEKA: Análise Linha Produto x Linha Produto.

• Modelo 1: Parâmetros padrão da ferramenta

o Suporte Mínimo: 0.1 (10%)

o Confiança Mínima: 0.9 (90%)

o Número de regras: máximo de 10 regras

Novamente nenhuma regra foi retornada (ver Anexo 04.e.1), pelo mesmo

motivo do modelo anterior. Por isso, os parâmetros tiveram que ser ajustados.

• Modelo 2: Parâmetros ajustados.

o Suporte Mínimo: 0.05 (5%)

o Confiança Mínima: 0.5 (50%)

o Número de regras: máximo de 10 regras

74

Este modelo retornou um total de 6 regras (ver Anexo 04.e.2). A tabela 4.12

ilustra o resumo com as principais regras:

Tabela 4.12: Resumo dos Resultados: Análise Linha Produto x Linha Produto

(Modelo 2).

1 Quem

comprou Solos, Microbiologia e Clima Suporte 7,17%

Também

comprou Agricultura Confiança 65%

Agricultura 2

Quem

comprou Produção Animal Suporte 5,38%

Também

comprou Criações Confiança 55%

3 Quem

comprou

Meio Ambiente, Recursos Genéticos,

Recursos Naturais Suporte 10,5%

Também

comprou Agricultura Confiança 53%

4 Quem

comprou Criações Suporte 13,5%

Também

comprou Agricultura Confiança 52%

5 Quem

comprou Produção Animal Suporte 12,87%

Também

comprou Criações Confiança 51%

4.7.2.6. Análise REGIÃO x LINHA PRODUTO

O objetivo desta análise é verificar quais linhas de produtos possuem

associações relevantes com quais regiões do país. Esta análise mostra também

algumas características dos produtos envolvidos.

75

A figura 4.31 ilustra os atributos utilizados e um dos histogramas gerados para

o arquivo ARFF desta análise, carregado na ferramenta WEKA.

Figura 4.31 Ferramenta WEKA: Análise Região x Linha Produto.

Para esta análise, optamos por um valor de suporte um pouco abaixo do

padrão, que é de 10%, visando identificar determinadas regras que, embora não

ocorram frequentemente, possam ter fator de confiança alto.

• Modelo 1: Parâmetros ajustados.

o Suporte Mínimo: 0.05 (5%)

o Confiança Mínima: 0.9 (90%)

o Número de regras: máximo de 200 regras

Este modelo retornou um total de 120 regras (ver Anexo 04.f.1). Dentre essas

regras, foram consideradas interessantes somente as que demonstravam associações

entre os atributos Região e Linha Produto (tabela 4.13), que atende ao objetivo desta

análise.

76

Tabela 4.13: Resumo dos Resultados: Análise Região x Linha Produto (Modelo 1).

REGIÃO NORDESTE

1 Antecedente Ano de Edição entre 2005 e 2008, e

Linha Produção Animal Suporte 5,38%

Conseqüente Preço até R$ 20,00 Confiança 100%

2 Antecedente Linha Criações Suporte 5,06%

Conseqüente Preço até R$ 20,00 Confiança 96%

REGIÃO SUDESTE

3 Antecedente Ano de Edição entre 2005 e 2008, e

Linha Criações Suporte 7%

Conseqüente Preço até R$ 20,00 Confiança 99%

4 Antecedente Ano de Edição entre 2009 e 2011, e

Linha Agricultura Suporte 12,55%

Conseqüente Preço até R$ 20,00 Confiança 93%

5 Antecedente Ano de Edição entre 2005 e 2008, e

Linha Agricultura Suporte 15,19%

Conseqüente Preço até R$ 20,00 Confiança 92%

REGIÃO CENTRO-OESTE

6 Antecedente Ano de Edição entre 2005 e 2008, e

Linha Criações Suporte 5,38%

Conseqüente Preço até R$ 20,00 Confiança 96%

7 Antecedente

Ano de Edição entre 2005 e 2008, e

Ano de Edição entre 2009 e 2011, e

Linha Agricultura

Suporte 6,01%

Conseqüente Preço até R$ 20,00 Confiança 93%

REGIÃO SUL

8 Antecedente Ano de Edição entre 2005 e 2008, e

Linha Agricultura Suporte 6,22%

Conseqüente Preço até R$ 20,00 Confiança 95%

As regiões Norte e Exterior não apareceram entre as regras retornadas, devido

à sua baixa freqüência entre as transações de vendas.

77

Para complementar esta análise, visualizamos os gráficos gerados que ilustram

a frequência de cada atributo nas transações de vendas, quebrando por região (figura

4.32).

As regiões estão representadas por cores em cada gráfico, sendo: rosa

(Sudeste); azul-escuro (Centro-Oeste); verde (Sul); azul-claro (Nordeste); cinza

(Norte); vermelho (Exterior).

Figura 4.32 Ferramenta WEKA: Visualização gráfica Região x demais atributos.

4.8. Regras de Associação – Avaliação

Nesta fase será realizada a avaliação dos resultados gerados pela etapa

anterior de modelagem.

Para iniciar esta avaliação e compreender melhor o contexto da amostra

selecionada para este estudo, seguem algumas observações referentes às estatísticas

básicas desta amostragem (Anexo 02.e):

78

• Para a amostra selecionada, a maior parte das vendas é atribuída aos

clientes do estado de São Paulo (17% do total), seguido pelo estado do

Distrito Federal (15,24%) e por Minas Gerais (9,75%);

• Portanto, a maior parte das vendas é realizada para clientes da região

Sudeste (32,5%), seguida pela região Centro-Oeste (26,36%);

• O tipo de produto mais vendido é o Livro (87%);

• A maioria dos produtos vendidos custa até R$ 20,00 (75,7%);

• Os títulos mais solicitados são os da linha de produto “Agricultura”

(53%), seguida pelas linhas “Produção Animal” (17%) e “Criações”

(13%).

Analisando os modelos gerados, observamos que:

• A análise Produto x Produto mostra uma tendência dos consumidores

em adquirir produtos de uma mesma coleção. Mostra também a

aquisição em conjunto de produtos sobre um mesmo assunto ou sobre

assuntos bem similares (Ex.: “Metodologia para análise de mosto e

suco de uva” e “Metodologia para análise de vinho”);

• A análise Região x Produto confirma a predominância dos

consumidores da região Sudeste nas transações de venda. Identifica,

ainda, livros que foram feitos para uma determinada região, muito bem

aceitos pelos consumidores desta região (Ex.: Capim-Gramão: Uma

Opção para o Nordeste Brasileiro).

• A análise UF x Produto mostra uma preferência dos clientes de SP pelo

assunto “abelhas”, identificada em três títulos distintos, porém com

baixo fator de confiança (em torno de 30%).

• Na análise entre Linhas de Produto, a linha “Agricultura” está presente

em 80% das regras de associação identificadas como relevantes.

79

• A análise Região x Linha de Produto mostra a linha de produto

“Agricultura” como preferencial entre clientes das regiões Sudeste,

Centro-Oeste e Sul. A linha de produto “Criações” como preferencial

dos clientes das regiões Nordeste, Sudeste e Centro-Oeste. E a linha

“Produção Animal” como preferencial dos clientes da região Nordeste.

• Além disso, esta última análise confirma a estatística de que a maioria

dos produtos vendidos custa até R$ 20,00, o que ocorre em 100% das

regras relevantes geradas.

• E, finalmente, esta última análise confirma a estatística de que a maioria

dos produtos vendidos tem ano de edição entre 2005 e 2008.

Para complementar a avaliação, seguem algumas observações sobre os

gráficos da figura 4.32:

• Clientes da região Sudeste estão presentes em todas as linhas de

produtos que tiveram vendas, e predominam, principalmente, nas linhas

de produto “Agricultura”, “Meio Ambiente” e “Criações”;

• Clientes da região Nordeste predominam nas aquisições de produtos da

linha “Outras Publicações” e dividem, com os clientes da região

Sudeste, a preferência pelos produtos da linha “Produção Animal”;

• Clientes da região Sul dividem, com os da região Sudeste, a preferência

pela linha de produto “Agroindústria e Tecnologia de Alimentos”;

• Clientes da região Centro-Oeste também estão presentes em todas as

linhas de produtos que tiveram vendas, e dividem, com os da região

Sudeste, a preferência pela linha de produto “Solo, Microbiologia e

Clima”;

• E, finalmente, os clientes da região Norte, apesar de pouca

representatividade nesta amostra, demonstram algum interesse pela

linha “Solo, Microbiologia e Clima”.

80

A tendência mostrada de aquisição de títulos de uma mesma coleção ou de

assuntos similares em uma mesma transação de venda sugere a montagem, por

exemplo, de pacotes destes produtos com melhores preços de venda.

Além disso, as regras geradas podem ser aproveitadas para a criação de

campanhas de marketing de um determinado produto, ou para mostrar ao cliente o

que outros clientes costumam comprar junto com o produto que ele está adquirindo,

sugerindo novos produtos a ele.

A partir deste conhecimento, o site poderá ser alterado, por exemplo, para

ofertar títulos de forma personalizada aos clientes, através da identificação da região

ou UF deste cliente, e busca dos possíveis títulos que possam ser de seu interesse.

É importante ressaltar que os baixos valores de suporte, utilizados como

parâmetros para a maioria dos modelos executados, não necessariamente implicam

em regras de baixa qualidade. No caso da amostra utilizada, a grande diversidade de

títulos existentes gera uma fragmentação entre as transações de venda, o que

prejudica de certa forma a análise, obrigando o uso de valores baixos de suporte para

se encontrar regras relevantes.

Neste sentido, talvez seja interessante pensar, neste momento, no custo de

manutenção (fabricação, estoque, logística, administração) de toda essa diversidade

de títulos à disposição dos clientes para compra. Até que ponto títulos pouco ou quase

nunca vendidos podem ser unidos a outros títulos, em pacotes promocionais, ou até

mesmo virar um único produto? A venda conjunta de títulos poderia reduzir este custo,

facilitar os processos de negócio da Livraria, e possibilitar maior foco nas vendas.

Os modelos executados mostram um exemplo de como as regras de

associação podem ser utilizadas para extrair conhecimento útil, que possa contribuir

tanto para o processo de tomada de decisão, como para a realização de ações de

marketing e de comercialização, resultando, ao final, em um melhor desempenho dos

processos de negócios da Livraria Embrapa.

81

4.9. Disponibilização

Nesta etapa será realizada a revisão do projeto com informações sobre as

impressões finais e lições aprendidas durante este estudo de caso.

4.9.1. Revisar o projeto

A partir deste projeto, podemos registrar as seguintes impressões e/ou lições

aprendidas:

• A maior dificuldade de um projeto como este, feito em parceria com outras

Unidades, é a disponibilidade de tempos das pessoas envolvidas. O

cronograma deve ser estar sempre bem alinhado com cada um dos

integrantes do projeto e, ainda assim, podem ocorrer atrasos, por conta da

mudança de prioridades ao longo do tempo.

• O processo de limpeza dos dados foi um dos mais custosos deste estudo,

em termos de tempo e esforço. A análise antecipada da situação dos dados

da base de dados a ser explorada poderá evitar problemas que só serão

percebidos em uma fase já adiantada do processo.

82

CAPÍTULO 5. CONSIDERAÇÕES FINAIS

5.1. Conclusão

O presente estudo apresentou a implementação de um sistema de inteligência

de negócios (Business Intelligence – BI), e a aplicação de técnicas de mineração de

dados sobre a base de dados do sistema de comércio eletrônico da Livraria Embrapa,

visando extrair informação e conhecimento úteis aos processos de negócio da

organização.

Para alcançar os objetivos propostos, este estudo se baseou na metodologia

CRISP-DM (Cross Industry Standard Process for Data Mining), que teve papel

fundamental como direcionadora dos passos a serem seguidos durante toda a

execução do trabalho. Esta metodologia foi criada, originalmente, para atender,

especificamente, aos processos de mineração de dados. Este estudo mostrou como

adaptar a metodologia para ser utilizada, também, como direcionadora do processo de

implementação do sistema de inteligência de negócios, que envolveu a construção de

um repositório de dados e a aplicação de ferramentas OLAP (On-Line Analytical

Processing), para a Livraria Embrapa.

Logo no início do estudo, foi observada uma baixa qualidade dos dados

disponíveis, que apresentavam valores ausentes, redundantes e muitas vezes

inconsistentes. O processo de limpeza, transformação e carga dos dados foi, sem

dúvida, o mais custoso de todo o trabalho e, ao mesmo tempo, uma das ações de

maior contribuição para análises futuras dos dados da Livraria.

Este trabalho tornou a base de dados da Livraria mais consistente,

principalmente em relação aos dados dos clientes, e foi um fator de motivação para

que os sistemas de informação, que atualmente operacionalizam a Livraria, fossem

alterados para o preenchimento e gravação correta dos dados, evitando, assim,

valores ausentes ou inconsistentes na base. Dessa forma, em um futuro próximo, será

possível recuperar dados mais completos dos clientes e realizar novos cruzamentos e

análises, permitindo traçar um perfil do consumidor da Livraria e direcionar melhor as

vendas.

83

A ampla possibilidade de acesso aos dados e de cruzamento das informações,

sejam elas locais ou corporativas, obtida, a partir deste estudo com a implementação

do BI da Livraria, agregou ao negócio a capacidade de acompanhamento constante

das movimentações da Livraria, de disseminação da informação em formatos diversos

e em tempo hábil aos interessados e, finalmente, de melhoria do complexo processo

de tomada de decisão baseado em fatos, alcançando, portanto, os objetivos

previamente estabelecidos.

A mineração de dados aplicada sobre a base de dados da Livraria Embrapa

utilizou a técnica de Regras de Associação para realizar a análise da cesta de

compras (market-basket-analysis). Vários modelos foram parametrizados e

executados na etapa de Modelagem das Regras de Associação. No entanto, a grande

diversidade de títulos disponibilizados pela Livraria tornou árdua a tarefa de encontrar

padrões bem definidos, uma vez que a alta fragmentação desses títulos entre as

transações de vendas sugeria baixos valores de suporte.

Ainda assim, a partir das análises realizadas em uma pequena amostragem da

cesta de compras, foram visualizadas oportunidades de sugerir produtos associados

aos clientes da Livraria, visando a venda cruzada, de criar pacotes promocionais ou

campanhas de marketing com esses produtos associados, para clientes de

determinadas regiões, ou até mesmo de controlar o estoque desses produtos em

conjunto, ou fabricá-los em conjunto, gerando, assim, uma melhor organização e

desempenho dos processos da Livraria Embrapa.

Por fim, os resultados mostraram que a aplicação conjunta das técnicas de

mineração de dados e de inteligência de negócios amplia, de forma significativa, as

possibilidades de análises dos usuários, contribuindo para uma gestão mais efetiva da

Livraria e um melhor desempenho do negócio como um todo. No entanto, é importante

reconhecer que as técnicas aplicadas e as ferramentas utilizadas apóiam, mas não

substituem a experiência do especialista do negócio na interpretação dos resultados

obtidos.

84

5.2. Trabalhos Futuros

Como trabalhos futuros, podemos destacar:

• A idéia inicial do presente estudo era segmentar os clientes da Livraria,

no intuito de traçar um perfil e, dessa forma, tentar direcionar as

compras a determinados grupos de clientes. No entanto, essa

alternativa foi descartada, quando se percebeu que a grande maioria

dos clientes registrados na base de dados possuía muitos valores

ausentes para atributos importantes, tais como: sexo, profissão e data

de nascimento. Isso aconteceu porque o site da Livraria Embrapa não

solicitava o preenchimento desses dados como obrigatórios. Como

trabalhos futuros, sugerimos que, com dados mais completos dos

clientes obtidos a partir deste estudo, seja realizada a técnica de

segmentação, visando complementar e gerar melhores resultados para

a análise.

• Por ser um processo iterativo, o trabalho de mineração de dados deve

ser reavaliado constantemente. Por isso, como trabalhos futuros,

sugerimos que uma ferramenta mais robusta, como o SQL Server, por

exemplo, seja utilizada para a mineração de toda a base de dados e

não só de uma amostragem como foi feita neste estudo. Sugerimos,

ainda, a reavaliação dos modelos gerados para este estudo e, se for o

caso, a aplicação de novas estratégias, visando sempre a busca por

melhores resultados.

• Este trabalho implementou um sistema de BI para os processos de

negócios da Livraria Embrapa, com foco no Setor de Marketing e

Comercialização. No entanto, a figura 4.1 demonstra, no organograma

da Unidade, os vários setores impactados pela Livraria. Sugerimos,

portanto, como trabalhos futuros, a implementação de repositórios de

dados complementares, visando atender aos demais setores e

processos de negócios impactados pela Livraria.

85

REFERÊNCIAS BIBLIOGRÁFICAS

• ABERNETHY, M., Data Mining with WEKA, Part 1: Introduction and

Regression . IBM Corporation, abril 2010. Disponível em:

<http://www.ibm.com/developerworks/opensource/library/os-weka1/index.html>.

Acesso em: 27/04/2011, 14:51:00.

• ALENCAR, R.S., Aplicação de Técnicas de Data Mining e Ferramentas OLAP

na Base de Dados Integrada PIATAM . Tese de D.Sc., COPPE/UFRJ, Rio de

Janeiro, RJ, Brasil, junho 2009.

• BARAGOIN, C., CHAN, R., GOTTSCHALK, H. et al. – Enhance Your Business

Applications: Simple Integration of Advanced Data Mining Functions . 1 ed.,

USA, IBM RedBooks, dezembro 2002.

• BOUCKAERT, R. R., FRANK, E., HALL, M. et al., WEKA Manual for Version 3-6-

4. University of Waikato, Hamilton, New Zeland, dezembro 2010. Disponível em:

<http://ufpr.dl.sourceforge.net/project/weka/documentation/3.6.x/WekaManual-3-6-

4.pdf>. Acesso em: 28/07/2011, 15:14:00.

• BROGDEN, J., SINKWITZ, H., HOLDEN, M., SAP BusinessObjects Web

Intelligence . 1ed., Boston, Galileo Press, 2010.

• CARVALHO, L.S., Mineração de Dados Aplicada ao Entendimento do

Comportamento do Consumidor para dar Suporte ao Processo de Tomada

de Decisões . Tese de D.Sc., COPPE/UFRJ, Rio de Janeiro, RJ, Brasil, fevereiro

2009.

• CZERNICKI, B., Next-Generation Business Intelligence Software with

Silverlight 3 . 1ed., USA, APress, 2009.

86

• EDELSTEIN, H. A., Introduction to Data Mining and Knowledge Discovery , 3

ed., USA, Two Cross Corporation, 1999.

• EMBRAPA, I Plano Diretor de Tecnologia da Informação (PDTI) da Embrapa

2010-2011. 1 ed., Brasília, DF, 2010.

• EMBRAPA, V Plano Diretor (PDE) da Embrapa 2008-2011-2023 . 5 ed., Brasília,

DF, 2008.

• EMBRAPA INFORMAÇÃO TECNOLÓGICA, III Plano Diretor (PDU) da Embrapa

Informação Tecnológica 2008-2011 . 3 ed., Brasília, DF, 2008.

• FORRESTER CONSULTING, Lean Business Intelligence: Why and How

Entreprises are Moving to Self-Service Business Intelligence . USA, Forrester

Research, Inc., outubro 2009. Disponível em:

<http://www.computerweekly.com/Articles/2011/05/24/241074/White-paper-Lean-

Business-Intelligence-Why-And-How-Enterprises-Are-Moving-To-Self-

Service.htm>. Acesso em: 27/04/2011, 16:10:00.

• FREITAS, A.A., Data Mining and Knowledge Discovery with Evolutionary

Algorithms . 1 ed., Germany, Springer, 2002.

• GE, Y., “Consumer’s Behavior on Web Based on Data Mining”. In: Proceedings of

the 2nd IEEE International Conference on Computer Science and Information

Technology , pp. 43-46, Beijing, 2009.

• GONÇALVES, E. C., Mineração de Regras de Associação com a Ferramenta

de Data Mining Weka . Brasil, novembro 2011. Disponível em

<http://www.devmedia.com.br/post-20478-Mineracao-de-Regras-de-Associacao-

com-a-Ferramenta-de-Data-Mining-Weka.html>. Acesso em: 02/05/2011.

87

• HALL, M., FRANK, E., HOLMES, G. et al., “The WEKA Data Mining Software: An

Update”. In: ACM SIGKDD Explorations Newsletter , v. 11, Issue 1, ACM New

York, pp. 10-18, junho 2009. Disponível em:

<http://www.kdd.org/explorations/issues/11-1-2009-07/p2V11n1.pdf>. Acesso em:

02/05/2011.

• HOWSON, C., Successful Business Intelligence: Secrets to Making BI a Killer

App . 1ed., USA, McGraw-Hill, 2008.

• IBM, CRISP-DM 1.0. Step-by-step data mining guide . USA, IBM Corporation,

maio 2010. Disponível em: <http://www.crisp-dm.org>. Acesso em: 20/06/2011.

• IBM, IBM SPSS Modeler CRISP-DM Guide . USA, IBM Corporation 1994, 2011.

Disponível em: <http://www.crisp-dm.org>. Acesso em: 20/06/2011.

• INMON, W.H., Building the Data Warehouse . 3 ed., USA, John Wiley & Sons,

Inc., 2002.

• INMON, W.H., Tech Topic 5. Data Mining: An Architecture. Part 1 . Pine Cone

Systems, Inc., 1997. Disponível em: <http://inethub.olvi.net.ua/ftp/Library/DVD-

015/Inmon_W.H._Data_Mining[c]_an_Architecture_(Part_1)_(1997)(en)(30s).pdf>.

Acesso em: 20/06/2011.

• INMON, W.H., Tech Topic 6. Data Mining: Exploring the Data. Part 2 . Pine

Cone Systems, Inc., 1997. Disponível em:

<http://inethub.olvi.net.ua/ftp/Library/DVD-015/Inmon_W.H._Data_Mining[c]_

Exploring_the_Data_(Part_2)_(1997)(en)(22s).pdf>. Acesso em: 20/06/2011.

• KIMBALL, R., ROSS, M., The Data Warehouse Toolkit: The Complete Guide to

Dimensional Modeling . 2 ed., USA, John Wiley & Sons, Inc., 2002.

88

• LAROSE, D.T., Discovering Knowledge in Data: An Introduction to Data

Mining . 1 ed., Hoboken, New Jersey, USA, John Wiley & Sons, Inc., 2005.

• LARSON, B., Delivering Business Intelligence with Microsoft SQL Server

2008. 1 ed., USA, McGraw-Hill, 2009.

• QU, Z., LIANG, X., “Application of Grey Relational Clustering and Data Mining in

Data Flow of E-Commerce”. In: Proceedings of the International Conference on

Computational Intelligence and Natural Computing , pp. 237-240, China, 2009.

• SAP, SAP BusinessObjects Data Services Designer Guide . SAP AG, 2009.

Disponível em: <http://help.sap.com/businessobject/product_guides/boexir32SP1/

en/xi321_ds_designer_en.pdf>. Acesso em: 20/05/2011.

• SAP, SAP BO Universe Design Tutorial . SAP BusinessObjects Information

Portal, 2009-2010. Disponível em: <http://www.sap-businessobjects.info/universe-

design.htm>. Acesso em 20/05/2011.

• SCHNEIDER, L.F., Aplicação do Processo de Descoberta de Conhecimento

em Dados do Poder Judiciário do Estado do Rio Grande do Sul . Tese de

D.Sc., Universidade Federal do Rio Grande do Sul, Porto Alegre, RS, Brasil,

dezembro 2003.

• TAPSCOTT, D., BARTER, P., A Estratégia na Prática . nGenera Corporation,

julho 2009. Disponível em: <http://www.sap.com/brazil/solutions/

executiveview/it/consolidate-and-govern-it/index.epx>. Acesso em: 20/05/2011.

• VERCELLIS, C., Business Intelligence: Data Mining and Optimization for

Decision Making . 1 ed., Politecnico di Milano, Italy, John Wiley & Sons Ltd., 2009.

89

ANEXO 01 – ARTEFATOS DO PROJETO

a. Documento “Termo de Abertura do Projeto”

90

b. Documento “Especificação de Requisitos”

91

ANEXO 02 – ESTATÍSTICAS BÁSICAS

a. Estatísticas básicas das principais tabelas da base de dados da Livraria:

Nome da

Tabela Descrição

Quantidade de

registros

Cliente Tabela de Clientes da Livraria 166.644

Pessoa Física Tabela de Clientes Pessoa Física da

Livraria 158.919

Pessoa Jurídica Tabela de Clientes Pessoa Jurídica da

Livraria 7.721

País Tabela de Países 243

Região Tabela de Regiões 6

Estados Tabela de Estados 28

Municípios Tabela de Municípios 5.564

Autor Tabela de Autores 6.524

Produto Tabela de Produtos 1.536

Tipo Produto Tabela de Tipos de Produtos (Ex.: Livro;

DVD; Periódico; etc.) 20

Linha Produto Tabela de Linhas de Produtos

(Ex.: Agricultura; Infanto-Juvenis; etc.) 9

Produto Consignado Tabela de Produtos Consignados 2.584

Pedido Tabela de Pedidos 161.136

Itens Pedido Tabela de Itens do Pedido 702.414

Origem Pedido Tabela de Origem do Pedido (Ex.:

Livraria Virtual; Interno; Globo Rural; etc.) 18

Movimento Financeiro Tabela de Movimentação financeira 63.738

Meio Transporte Tabela de Meios de Transporte (Ex.:

Sedex; PAC; etc.) 5

Tipo Pagamento Tabela de Tipos de Pagamento (Ex.:

boleto bancário; cartão de crédito; etc.) 13

Nota Fiscal Tabela de Notas Fiscais 117.310

Itens Nota Fiscal Tabela de Itens da Nota Fiscal 558.470

Tipo Movimento Tabela de Tipos de Movimento (Ex.:

Venda Direta; Estorno Venda Direta; etc.) 113

92

b. Curva ABC – Amostra: Transações de vendas do 1º Bimestre de 2011

ID Codigo Produto

Qtde Pedidos

% (Pedido/ Total)

Acumu lado

% acumulado

1 81600 36 2,25% 36 2,3%

2 81710 27 1,69% 63 3,9%

3 80660 25 1,56% 88 5,5%

4 78790 20 1,25% 108 6,8%

5 13210 17 1,06% 125 7,8%

6 78100 17 1,06% 142 8,9%

7 83690 17 1,06% 159 9,9%

8 77440 16 1,00% 175 10,9%

9 78800 16 1,00% 191 11,9%

10 13710 15 0,94% 206 12,9%

11 50580 14 0,88% 220 13,8%

12 80760 14 0,88% 234 14,6%

13 81610 14 0,88% 248 15,5%

14 84000 14 0,88% 262 16,4%

15 13690 13 0,81% 275 17,2%

16 75440 13 0,81% 288 18,0%

17 78730 13 0,81% 301 18,8%

18 82570 13 0,81% 314 19,6%

19 51710 12 0,75% 326 20,4%

20 83800 12 0,75% 338 21,1%

21 51780 11 0,69% 349 21,8%

22 78770 11 0,69% 360 22,5%

23 83750 11 0,69% 371 23,2%

24 13220 10 0,63% 381 23,8%

25 51120 10 0,63% 391 24,4%

26 60790 10 0,63% 401 25,1%

27 63830 10 0,63% 411 25,7%

28 64490 10 0,63% 421 26,3%

ID Codigo Produto

Qtde Pedidos

% (Pedido/ Total)

Acumu lado

% acumulado

29 69640 10 0,63% 431 26,9%

30 75960 10 0,63% 441 27,6%

31 78780 10 0,63% 451 28,2%

32 83540 10 0,63% 461 28,8%

33 83710 10 0,63% 471 29,4%

34 50740 9 0,56% 480 30,0%

35 79140 9 0,56% 489 30,6%

36 81830 9 0,56% 498 31,1%

37 83840 9 0,56% 507 31,7%

38 83860 9 0,56% 516 32,3%

39 71650 8 0,50% 524 32,8%

40 81030 8 0,50% 532 33,3%

41 82790 8 0,50% 540 33,8%

42 13550 7 0,44% 547 34,2%

43 13740 7 0,44% 554 34,6%

44 51580 7 0,44% 561 35,1%

45 51700 7 0,44% 568 35,5%

46 60630 7 0,44% 575 35,9%

47 67030 7 0,44% 582 36,4%

48 71520 7 0,44% 589 36,8%

49 76790 7 0,44% 596 37,3%

50 77120 7 0,44% 603 37,7%

51 81320 7 0,44% 610 38,1%

52 81750 7 0,44% 617 38,6%

53 83134 7 0,44% 624 39,0%

54 83143 7 0,44% 631 39,4%

55 83230 7 0,44% 638 39,9%

56 83810 7 0,44% 645 40,3%

ID Codigo Produto

Qtde Pedidos

% (Pedido/ Total)

Acumu lado

% acumulado

57 83910 7 0,44% 652 40,8%

58 63300 6 0,38% 658 41,1%

59 64820 6 0,38% 664 41,5%

60 73400 6 0,38% 670 41,9%

61 74640 6 0,38% 676 42,3%

62 79120 6 0,38% 682 42,6%

63 81440 6 0,38% 688 43,0%

64 82150 6 0,38% 694 43,4%

65 83155 6 0,38% 700 43,8%

66 83780 6 0,38% 706 44,1%

67 83920 6 0,38% 712 44,5%

68 84010 6 0,38% 718 44,9%

69 13620 5 0,31% 723 45,2%

70 13660 5 0,31% 728 45,5%

71 63330 5 0,31% 733 45,8%

72 65370 5 0,31% 738 46,1%

73 65490 5 0,31% 743 46,4%

74 65720 5 0,31% 748 46,8%

75 69660 5 0,31% 753 47,1%

76 71370 5 0,31% 758 47,4%

77 73700 5 0,31% 763 47,7%

78 74450 5 0,31% 768 48,0%

79 78700 5 0,31% 773 48,3%

80 78760 5 0,31% 778 48,6%

81 78900 5 0,31% 783 48,9%

82 81360 5 0,31% 788 49,3%

83 82390 5 0,31% 793 49,6%

84 83136 5 0,31% 798 49,9%

93

ID Codigo Produto

Qtde Pedidos

% (Pedido/ Total)

Acumu lado

% acumulado

85 83940 5 0,31% 803 50,2%

86 13420 4 0,25% 807 50,4%

87 13670 4 0,25% 811 50,7%

88 63200 4 0,25% 815 50,9%

89 64290 4 0,25% 819 51,2%

90 64520 4 0,25% 823 51,4%

91 70080 4 0,25% 827 51,7%

92 76260 4 0,25% 831 51,9%

93 76450 4 0,25% 835 52,2%

94 76490 4 0,25% 839 52,4%

95 76520 4 0,25% 843 52,7%

96 78160 4 0,25% 847 52,9%

97 78470 4 0,25% 851 53,2%

98 78740 4 0,25% 855 53,4%

99 79060 4 0,25% 859 53,7%

100 79160 4 0,25% 863 53,9%

101 80010 4 0,25% 867 54,2%

102 80860 4 0,25% 871 54,4%

103 81070 4 0,25% 875 54,7%

104 81370 4 0,25% 879 54,9%

105 81400 4 0,25% 883 55,2%

106 81860 4 0,25% 887 55,4%

107 82110 4 0,25% 891 55,7%

108 82120 4 0,25% 895 55,9%

109 83660 4 0,25% 899 56,2%

110 83790 4 0,25% 903 56,4%

111 13440 3 0,19% 906 56,6%

112 13500 3 0,19% 909 56,8%

113 13530 3 0,19% 912 57,0%

114 13790 3 0,19% 915 57,2%

115 50540 3 0,19% 918 57,4%

ID Codigo Produto

Qtde Pedidos

% (Pedido/ Total)

Acumu lado

% acumulado

116 60710 3 0,19% 921 57,6%

117 60720 3 0,19% 924 57,8%

118 61020 3 0,19% 927 57,9%

119 63080 3 0,19% 930 58,1%

120 63220 3 0,19% 933 58,3%

121 63520 3 0,19% 936 58,5%

122 64040 3 0,19% 939 58,7%

123 65270 3 0,19% 942 58,9%

124 65600 3 0,19% 945 59,1%

125 65610 3 0,19% 948 59,3%

126 65690 3 0,19% 951 59,4%

127 66910 3 0,19% 954 59,6%

128 67780 3 0,19% 957 59,8%

129 68280 3 0,19% 960 60,0%

130 69540 3 0,19% 963 60,2%

131 70390 3 0,19% 966 60,4%

132 70490 3 0,19% 969 60,6%

133 71680 3 0,19% 972 60,8%

134 72340 3 0,19% 975 60,9%

135 74750 3 0,19% 978 61,1%

136 75030 3 0,19% 981 61,3%

137 76050 3 0,19% 984 61,5%

138 76120 3 0,19% 987 61,7%

139 76190 3 0,19% 990 61,9%

140 76310 3 0,19% 993 62,1%

141 76320 3 0,19% 996 62,3%

142 76350 3 0,19% 999 62,4%

143 77660 3 0,19% 1002 62,6%

144 78710 3 0,19% 1005 62,8%

145 78750 3 0,19% 1008 63,0%

146 79040 3 0,19% 1011 63,2%

ID Codigo Produto

Qtde Pedidos

% (Pedido/ Total)

Acumu lado

% acumulado

147 79180 3 0,19% 1014 63,4%

148 79280 3 0,19% 1017 63,6%

149 79330 3 0,19% 1020 63,8%

150 80250 3 0,19% 1023 63,9%

151 80720 3 0,19% 1026 64,1%

152 80840 3 0,19% 1029 64,3%

153 81080 3 0,19% 1032 64,5%

154 81380 3 0,19% 1035 64,7%

155 81700 3 0,19% 1038 64,9%

156 81740 3 0,19% 1041 65,1%

157 81780 3 0,19% 1044 65,3%

158 82410 3 0,19% 1047 65,4%

159 82580 3 0,19% 1050 65,6%

160 82720 3 0,19% 1053 65,8%

161 82840 3 0,19% 1056 66,0%

162 83040 3 0,19% 1059 66,2%

163 83090 3 0,19% 1062 66,4%

164 83097 3 0,19% 1065 66,6%

165 83480 3 0,19% 1068 66,8%

166 83510 3 0,19% 1071 66,9%

167 83680 3 0,19% 1074 67,1%

168 83830 3 0,19% 1077 67,3%

169 13270 2 0,13% 1079 67,4%

170 13700 2 0,13% 1081 67,6%

171 13720 2 0,13% 1083 67,7%

172 13800 2 0,13% 1085 67,8%

173 50230 2 0,13% 1087 67,9%

174 50550 2 0,13% 1089 68,1%

175 50570 2 0,13% 1091 68,2%

176 51210 2 0,13% 1093 68,3%

177 51230 2 0,13% 1095 68,4%

94

ID Codigo Produto

Qtde Pedidos

% (Pedido/ Total)

Acumu lado

% acumulado

178 51340 2 0,13% 1097 68,6%

179 51400 2 0,13% 1099 68,7%

180 51530 2 0,13% 1101 68,8%

181 51540 2 0,13% 1103 68,9%

182 51550 2 0,13% 1105 69,1%

183 51610 2 0,13% 1107 69,2%

184 51640 2 0,13% 1109 69,3%

185 60550 2 0,13% 1111 69,4%

186 60650 2 0,13% 1113 69,6%

187 60690 2 0,13% 1115 69,7%

188 60700 2 0,13% 1117 69,8%

189 61170 2 0,13% 1119 69,9%

190 61180 2 0,13% 1121 70,1%

191 61190 2 0,13% 1123 70,2%

192 61350 2 0,13% 1125 70,3%

193 61880 2 0,13% 1127 70,4%

194 62740 2 0,13% 1129 70,6%

195 62750 2 0,13% 1131 70,7%

196 63720 2 0,13% 1133 70,8%

197 64140 2 0,13% 1135 70,9%

198 64250 2 0,13% 1137 71,1%

199 64500 2 0,13% 1139 71,2%

200 64720 2 0,13% 1141 71,3%

201 64850 2 0,13% 1143 71,4%

202 65780 2 0,13% 1145 71,6%

203 66010 2 0,13% 1147 71,7%

204 66150 2 0,13% 1149 71,8%

205 67770 2 0,13% 1151 71,9%

206 68360 2 0,13% 1153 72,1%

207 68400 2 0,13% 1155 72,2%

208 68470 2 0,13% 1157 72,3%

ID Codigo Produto

Qtde Pedidos

% (Pedido/ Total)

Acumu lado

% acumulado

209 68920 2 0,13% 1159 72,4%

210 69180 2 0,13% 1161 72,6%

211 69830 2 0,13% 1163 72,7%

212 70300 2 0,13% 1165 72,8%

213 70530 2 0,13% 1167 72,9%

214 71050 2 0,13% 1169 73,1%

215 71460 2 0,13% 1171 73,2%

216 71720 2 0,13% 1173 73,3%

217 72280 2 0,13% 1175 73,4%

218 73220 2 0,13% 1177 73,6%

219 73270 2 0,13% 1179 73,7%

220 74010 2 0,13% 1181 73,8%

221 74290 2 0,13% 1183 73,9%

222 74310 2 0,13% 1185 74,1%

223 74440 2 0,13% 1187 74,2%

224 74800 2 0,13% 1189 74,3%

225 75610 2 0,13% 1191 74,4%

226 75630 2 0,13% 1193 74,6%

227 75650 2 0,13% 1195 74,7%

228 75950 2 0,13% 1197 74,8%

229 76090 2 0,13% 1199 74,9%

230 76180 2 0,13% 1201 75,1%

231 76200 2 0,13% 1203 75,2%

232 76210 2 0,13% 1205 75,3%

233 76220 2 0,13% 1207 75,4%

234 76230 2 0,13% 1209 75,6%

235 76250 2 0,13% 1211 75,7%

236 76920 2 0,13% 1213 75,8%

237 77110 2 0,13% 1215 75,9%

238 77210 2 0,13% 1217 76,1%

239 77350 2 0,13% 1219 76,2%

ID Codigo Produto

Qtde Pedidos

% (Pedido/ Total)

Acumu lado

% acumulado

240 77430 2 0,13% 1221 76,3%

241 77490 2 0,13% 1223 76,4%

242 78190 2 0,13% 1225 76,6%

243 78460 2 0,13% 1227 76,7%

244 78970 2 0,13% 1229 76,8%

245 79050 2 0,13% 1231 76,9%

246 79080 2 0,13% 1233 77,1%

247 79220 2 0,13% 1235 77,2%

248 79370 2 0,13% 1237 77,3%

249 79430 2 0,13% 1239 77,4%

250 79590 2 0,13% 1241 77,6%

251 79630 2 0,13% 1243 77,7%

252 79790 2 0,13% 1245 77,8%

253 80070 2 0,13% 1247 77,9%

254 80300 2 0,13% 1249 78,1%

255 80580 2 0,13% 1251 78,2%

256 80980 2 0,13% 1253 78,3%

257 80990 2 0,13% 1255 78,4%

258 81190 2 0,13% 1257 78,6%

259 81230 2 0,13% 1259 78,7%

260 81250 2 0,13% 1261 78,8%

261 81270 2 0,13% 1263 78,9%

262 81650 2 0,13% 1265 79,1%

263 81790 2 0,13% 1267 79,2%

264 81800 2 0,13% 1269 79,3%

265 81820 2 0,13% 1271 79,4%

266 81960 2 0,13% 1273 79,6%

267 81980 2 0,13% 1275 79,7%

268 81990 2 0,13% 1277 79,8%

269 82090 2 0,13% 1279 79,9%

270 82260 2 0,13% 1281 80,1%

95

ID Codigo Produto

Qtde Pedidos

% (Pedido/ Total)

Acumu lado

% acumulado

271 82400 2 0,13% 1283 80,2%

272 82420 2 0,13% 1285 80,3%

273 82750 2 0,13% 1287 80,4%

274 82880 2 0,13% 1289 80,6%

275 82980 2 0,13% 1291 80,7%

276 82990 2 0,13% 1293 80,8%

277 83079 2 0,13% 1295 80,9%

278 83101 2 0,13% 1297 81,1%

279 83142 2 0,13% 1299 81,2%

280 83147 2 0,13% 1301 81,3%

281 83157 2 0,13% 1303 81,4%

282 83190 2 0,13% 1305 81,6%

283 83620 2 0,13% 1307 81,7%

284 83670 2 0,13% 1309 81,8%

285 83700 2 0,13% 1311 81,9%

286 13180 1 0,06% 1312 82,0%

287 13200 1 0,06% 1313 82,1%

288 13290 1 0,06% 1314 82,1%

289 13400 1 0,06% 1315 82,2%

290 13510 1 0,06% 1316 82,3%

291 13570 1 0,06% 1317 82,3%

292 13630 1 0,06% 1318 82,4%

293 50010 1 0,06% 1319 82,4%

294 50050 1 0,06% 1320 82,5%

295 50100 1 0,06% 1321 82,6%

296 50200 1 0,06% 1322 82,6%

297 50240 1 0,06% 1323 82,7%

298 50350 1 0,06% 1324 82,8%

299 50500 1 0,06% 1325 82,8%

300 50510 1 0,06% 1326 82,9%

301 50560 1 0,06% 1327 82,9%

ID Codigo Produto

Qtde Pedidos

% (Pedido/ Total)

Acumu lado

% acumulado

302 50590 1 0,06% 1328 83,0%

303 50630 1 0,06% 1329 83,1%

304 50770 1 0,06% 1330 83,1%

305 50890 1 0,06% 1331 83,2%

306 51160 1 0,06% 1332 83,3%

307 51360 1 0,06% 1333 83,3%

308 51380 1 0,06% 1334 83,4%

309 51420 1 0,06% 1335 83,4%

310 51430 1 0,06% 1336 83,5%

311 51460 1 0,06% 1337 83,6%

312 51490 1 0,06% 1338 83,6%

313 51600 1 0,06% 1339 83,7%

314 51650 1 0,06% 1340 83,8%

315 51840 1 0,06% 1341 83,8%

316 60200 1 0,06% 1342 83,9%

317 60210 1 0,06% 1343 83,9%

318 60670 1 0,06% 1344 84,0%

319 60680 1 0,06% 1345 84,1%

320 61870 1 0,06% 1346 84,1%

321 61990 1 0,06% 1347 84,2%

322 62330 1 0,06% 1348 84,3%

323 62390 1 0,06% 1349 84,3%

324 62400 1 0,06% 1350 84,4%

325 62670 1 0,06% 1351 84,4%

326 62790 1 0,06% 1352 84,5%

327 62800 1 0,06% 1353 84,6%

328 63180 1 0,06% 1354 84,6%

329 63410 1 0,06% 1355 84,7%

330 63430 1 0,06% 1356 84,8%

331 63590 1 0,06% 1357 84,8%

332 63640 1 0,06% 1358 84,9%

ID Codigo Produto

Qtde Pedidos

% (Pedido/ Total)

Acumu lado

% acumulado

333 63710 1 0,06% 1359 84,9%

334 63890 1 0,06% 1360 85,0%

335 63930 1 0,06% 1361 85,1%

336 64080 1 0,06% 1362 85,1%

337 64400 1 0,06% 1363 85,2%

338 64430 1 0,06% 1364 85,3%

339 64550 1 0,06% 1365 85,3%

340 64570 1 0,06% 1366 85,4%

341 64700 1 0,06% 1367 85,4%

342 64770 1 0,06% 1368 85,5%

343 65010 1 0,06% 1369 85,6%

344 65340 1 0,06% 1370 85,6%

345 65350 1 0,06% 1371 85,7%

346 65390 1 0,06% 1372 85,8%

347 65410 1 0,06% 1373 85,8%

348 65560 1 0,06% 1374 85,9%

349 65670 1 0,06% 1375 85,9%

350 65700 1 0,06% 1376 86,0%

351 65860 1 0,06% 1377 86,1%

352 66030 1 0,06% 1378 86,1%

353 66040 1 0,06% 1379 86,2%

354 66170 1 0,06% 1380 86,3%

355 66670 1 0,06% 1381 86,3%

356 66820 1 0,06% 1382 86,4%

357 67500 1 0,06% 1383 86,4%

358 67560 1 0,06% 1384 86,5%

359 68110 1 0,06% 1385 86,6%

360 68170 1 0,06% 1386 86,6%

361 68190 1 0,06% 1387 86,7%

362 68200 1 0,06% 1388 86,8%

363 68220 1 0,06% 1389 86,8%

96

ID Codigo Produto

Qtde Pedidos

% (Pedido/ Total)

Acumu lado

% acumulado

364 68270 1 0,06% 1390 86,9%

365 68550 1 0,06% 1391 86,9%

366 68680 1 0,06% 1392 87,0%

367 69000 1 0,06% 1393 87,1%

368 69210 1 0,06% 1394 87,1%

369 69500 1 0,06% 1395 87,2%

370 69520 1 0,06% 1396 87,3%

371 69550 1 0,06% 1397 87,3%

372 69650 1 0,06% 1398 87,4%

373 69870 1 0,06% 1399 87,4%

374 69990 1 0,06% 1400 87,5%

375 70200 1 0,06% 1401 87,6%

376 70400 1 0,06% 1402 87,6%

377 70620 1 0,06% 1403 87,7%

378 70780 1 0,06% 1404 87,8%

379 71070 1 0,06% 1405 87,8%

380 71130 1 0,06% 1406 87,9%

381 71180 1 0,06% 1407 87,9%

382 71270 1 0,06% 1408 88,0%

383 71340 1 0,06% 1409 88,1%

384 71360 1 0,06% 1410 88,1%

385 71440 1 0,06% 1411 88,2%

386 71490 1 0,06% 1412 88,3%

387 71500 1 0,06% 1413 88,3%

388 71510 1 0,06% 1414 88,4%

389 71550 1 0,06% 1415 88,4%

390 71560 1 0,06% 1416 88,5%

391 71760 1 0,06% 1417 88,6%

392 71770 1 0,06% 1418 88,6%

393 71790 1 0,06% 1419 88,7%

394 71900 1 0,06% 1420 88,8%

ID Codigo Produto

Qtde Pedidos

% (Pedido/ Total)

Acumu lado

% acumulado

395 71980 1 0,06% 1421 88,8%

396 72030 1 0,06% 1422 88,9%

397 72140 1 0,06% 1423 88,9%

398 72180 1 0,06% 1424 89,0%

399 72270 1 0,06% 1425 89,1%

400 72350 1 0,06% 1426 89,1%

401 72570 1 0,06% 1427 89,2%

402 72630 1 0,06% 1428 89,3%

403 72890 1 0,06% 1429 89,3%

404 73190 1 0,06% 1430 89,4%

405 73250 1 0,06% 1431 89,4%

406 73260 1 0,06% 1432 89,5%

407 73290 1 0,06% 1433 89,6%

408 73300 1 0,06% 1434 89,6%

409 73390 1 0,06% 1435 89,7%

410 73470 1 0,06% 1436 89,8%

411 73560 1 0,06% 1437 89,8%

412 74280 1 0,06% 1438 89,9%

413 74360 1 0,06% 1439 89,9%

414 74470 1 0,06% 1440 90,0%

415 74500 1 0,06% 1441 90,1%

416 74650 1 0,06% 1442 90,1%

417 74780 1 0,06% 1443 90,2%

418 74810 1 0,06% 1444 90,3%

419 74920 1 0,06% 1445 90,3%

420 75000 1 0,06% 1446 90,4%

421 75070 1 0,06% 1447 90,4%

422 75230 1 0,06% 1448 90,5%

423 75310 1 0,06% 1449 90,6%

424 75340 1 0,06% 1450 90,6%

425 75400 1 0,06% 1451 90,7%

ID Codigo Produto

Qtde Pedidos

% (Pedido/ Total)

Acumu lado

% acumulado

426 75490 1 0,06% 1452 90,8%

427 75500 1 0,06% 1453 90,8%

428 75770 1 0,06% 1454 90,9%

429 75880 1 0,06% 1455 90,9%

430 75910 1 0,06% 1456 91,0%

431 76010 1 0,06% 1457 91,1%

432 76070 1 0,06% 1458 91,1%

433 76080 1 0,06% 1459 91,2%

434 76150 1 0,06% 1460 91,3%

435 76170 1 0,06% 1461 91,3%

436 76300 1 0,06% 1462 91,4%

437 76500 1 0,06% 1463 91,4%

438 76720 1 0,06% 1464 91,5%

439 76780 1 0,06% 1465 91,6%

440 76810 1 0,06% 1466 91,6%

441 76900 1 0,06% 1467 91,7%

442 77020 1 0,06% 1468 91,8%

443 77040 1 0,06% 1469 91,8%

444 77150 1 0,06% 1470 91,9%

445 77220 1 0,06% 1471 91,9%

446 77250 1 0,06% 1472 92,0%

447 77320 1 0,06% 1473 92,1%

448 77380 1 0,06% 1474 92,1%

449 77390 1 0,06% 1475 92,2%

450 77510 1 0,06% 1476 92,3%

451 77530 1 0,06% 1477 92,3%

452 77540 1 0,06% 1478 92,4%

453 77570 1 0,06% 1479 92,4%

454 77600 1 0,06% 1480 92,5%

455 77610 1 0,06% 1481 92,6%

456 77710 1 0,06% 1482 92,6%

97

ID Codigo Produto

Qtde Pedidos

% (Pedido/ Total)

Acumu lado

% acumulado

457 77740 1 0,06% 1483 92,7%

458 77790 1 0,06% 1484 92,8%

459 77840 1 0,06% 1485 92,8%

460 77970 1 0,06% 1486 92,9%

461 77990 1 0,06% 1487 92,9%

462 78040 1 0,06% 1488 93,0%

463 78170 1 0,06% 1489 93,1%

464 78180 1 0,06% 1490 93,1%

465 78210 1 0,06% 1491 93,2%

466 78230 1 0,06% 1492 93,3%

467 78380 1 0,06% 1493 93,3%

468 78510 1 0,06% 1494 93,4%

469 78580 1 0,06% 1495 93,4%

470 78600 1 0,06% 1496 93,5%

471 78910 1 0,06% 1497 93,6%

472 78950 1 0,06% 1498 93,6%

473 79020 1 0,06% 1499 93,7%

474 79190 1 0,06% 1500 93,8%

475 79240 1 0,06% 1501 93,8%

476 79290 1 0,06% 1502 93,9%

477 79350 1 0,06% 1503 93,9%

478 79420 1 0,06% 1504 94,0%

479 79450 1 0,06% 1505 94,1%

480 79490 1 0,06% 1506 94,1%

481 79500 1 0,06% 1507 94,2%

482 79540 1 0,06% 1508 94,3%

483 79600 1 0,06% 1509 94,3%

484 79670 1 0,06% 1510 94,4%

485 79690 1 0,06% 1511 94,4%

486 79830 1 0,06% 1512 94,5%

487 79950 1 0,06% 1513 94,6%

ID Codigo Produto

Qtde Pedidos

% (Pedido/ Total)

Acumu lado

% acumulado

488 80000 1 0,06% 1514 94,6%

489 80030 1 0,06% 1515 94,7%

490 80090 1 0,06% 1516 94,8%

491 80150 1 0,06% 1517 94,8%

492 80230 1 0,06% 1518 94,9%

493 80320 1 0,06% 1519 94,9%

494 80360 1 0,06% 1520 95,0%

495 80390 1 0,06% 1521 95,1%

496 80490 1 0,06% 1522 95,1%

497 80500 1 0,06% 1523 95,2%

498 80520 1 0,06% 1524 95,3%

499 80530 1 0,06% 1525 95,3%

500 80570 1 0,06% 1526 95,4%

501 80690 1 0,06% 1527 95,4%

502 80750 1 0,06% 1528 95,5%

503 80810 1 0,06% 1529 95,6%

504 80830 1 0,06% 1530 95,6%

505 80910 1 0,06% 1531 95,7%

506 81010 1 0,06% 1532 95,8%

507 81120 1 0,06% 1533 95,8%

508 81140 1 0,06% 1534 95,9%

509 81160 1 0,06% 1535 95,9%

510 81210 1 0,06% 1536 96,0%

511 81300 1 0,06% 1537 96,1%

512 81330 1 0,06% 1538 96,1%

513 81350 1 0,06% 1539 96,2%

514 81390 1 0,06% 1540 96,3%

515 81410 1 0,06% 1541 96,3%

516 81540 1 0,06% 1542 96,4%

517 81550 1 0,06% 1543 96,4%

518 81590 1 0,06% 1544 96,5%

ID Codigo Produto

Qtde Pedidos

% (Pedido/ Total)

Acumu lado

% acumulado

519 81840 1 0,06% 1545 96,6%

520 81900 1 0,06% 1546 96,6%

521 81970 1 0,06% 1547 96,7%

522 82000 1 0,06% 1548 96,8%

523 82100 1 0,06% 1549 96,8%

524 82160 1 0,06% 1550 96,9%

525 82190 1 0,06% 1551 96,9%

526 82250 1 0,06% 1552 97,0%

527 82440 1 0,06% 1553 97,1%

528 82520 1 0,06% 1554 97,1%

529 82530 1 0,06% 1555 97,2%

530 82550 1 0,06% 1556 97,3%

531 82590 1 0,06% 1557 97,3%

532 82600 1 0,06% 1558 97,4%

533 82610 1 0,06% 1559 97,4%

534 82760 1 0,06% 1560 97,5%

535 82770 1 0,06% 1561 97,6%

536 82800 1 0,06% 1562 97,6%

537 82810 1 0,06% 1563 97,7%

538 82830 1 0,06% 1564 97,8%

539 82850 1 0,06% 1565 97,8%

540 82860 1 0,06% 1566 97,9%

541 82910 1 0,06% 1567 97,9%

542 82960 1 0,06% 1568 98,0%

543 83050 1 0,06% 1569 98,1%

544 83078 1 0,06% 1570 98,1%

545 83080 1 0,06% 1571 98,2%

546 83081 1 0,06% 1572 98,3%

547 83087 1 0,06% 1573 98,3%

548 83088 1 0,06% 1574 98,4%

549 83102 1 0,06% 1575 98,4%

98

ID Codigo Produto

Qtde Pedidos

% (Pedido/ Total)

Acumu lado

% acumulado

550 83103 1 0,06% 1576 98,5%

551 83107 1 0,06% 1577 98,6%

552 83111 1 0,06% 1578 98,6%

553 83123 1 0,06% 1579 98,7%

554 83129 1 0,06% 1580 98,8%

555 83135 1 0,06% 1581 98,8%

556 83137 1 0,06% 1582 98,9%

557 83139 1 0,06% 1583 98,9%

558 83146 1 0,06% 1584 99,0%

ID Codigo Produto

Qtde Pedidos

% (Pedido/ Total)

Acumu lado

% acumulado

559 83148 1 0,06% 1585 99,1%

560 83149 1 0,06% 1586 99,1%

561 83151 1 0,06% 1587 99,2%

562 83158 1 0,06% 1588 99,3%

563 83170 1 0,06% 1589 99,3%

564 83200 1 0,06% 1590 99,4%

565 83220 1 0,06% 1591 99,4%

566 83240 1 0,06% 1592 99,5%

567 83290 1 0,06% 1593 99,6%

ID Codigo Produto

Qtde Pedidos

% (Pedido/ Total)

Acumu lado

% acumulado

568 83490 1 0,06% 1594 99,6%

569 83610 1 0,06% 1595 99,7%

570 83720 1 0,06% 1596 99,8%

571 83730 1 0,06% 1597 99,8%

572 83820 1 0,06% 1598 99,9%

573 83880 1 0,06% 1599 99,9%

574 83930 1 0,06% 1600 100,0%

99

c. Curva ABC – Amostra: Transações de vendas do 1º Semestre de 2011

ID Codigo Produto

Qtde Pedidos

% (Pedido/ Total)

Acumu lado

% acumulado

1 81710 80 1,57 80 1,57

2 81600 74 1,45 154 3,02

3 13210 70 1,37 224 4,40

4 80660 69 1,35 293 5,75

5 83690 52 1,02 345 6,77

6 13710 52 1,02 397 7,79

7 78790 49 0,96 446 8,75

8 78800 47 0,92 493 9,68

9 75440 42 0,82 535 10,50

10 13220 39 0,77 574 11,27

11 80760 39 0,77 613 12,03

12 82570 39 0,77 652 12,80

13 78730 37 0,73 689 13,52

14 84000 36 0,71 725 14,23

15 83910 35 0,69 760 14,92

16 78760 35 0,69 795 15,60

17 78780 34 0,67 829 16,27

18 50580 34 0,67 863 16,94

19 13740 32 0,63 895 17,57

20 81610 32 0,63 927 18,19

21 83920 32 0,63 959 18,82

22 13690 31 0,61 990 19,43

23 81360 30 0,59 1020 20,02

24 78770 27 0,53 1047 20,55

25 78280 27 0,53 1074 21,08

26 83540 27 0,53 1101 21,61

27 50740 27 0,53 1128 22,14

28 51990 27 0,53 1155 22,67

ID Codigo Produto

Qtde Pedidos

% (Pedido/ Total)

Acumu lado

% acumulado

29 63830 26 0,51 1181 23,18

30 77440 26 0,51 1207 23,69

31 84010 26 0,51 1233 24,20

32 79140 26 0,51 1259 24,71

33 82790 25 0,49 1284 25,20

34 79200 24 0,47 1308 25,67

35 64490 24 0,47 1332 26,14

36 51710 23 0,45 1355 26,59

37 51840 23 0,45 1378 27,05

38 74640 23 0,45 1401 27,50

39 83710 23 0,45 1424 27,95

40 83860 23 0,45 1447 28,40

41 78700 22 0,43 1469 28,83

42 78100 22 0,43 1491 29,26

43 77120 22 0,43 1513 29,70

44 69640 21 0,41 1534 30,11

45 71520 21 0,41 1555 30,52

46 83230 21 0,41 1576 30,93

47 83840 20 0,39 1596 31,32

48 83800 20 0,39 1616 31,72

49 83780 20 0,39 1636 32,11

50 79220 20 0,39 1656 32,50

51 60790 20 0,39 1676 32,89

52 63300 20 0,39 1696 33,29

53 51970 19 0,37 1715 33,66

54 13620 19 0,37 1734 34,03

55 71650 19 0,37 1753 34,41

56 81030 19 0,37 1772 34,78

ID Codigo Produto

Qtde Pedidos

% (Pedido/ Total)

Acumu lado

% acumulado

57 83136 19 0,37 1791 35,15

58 81400 19 0,37 1810 35,53

59 83750 18 0,35 1828 35,88

60 73400 18 0,35 1846 36,23

61 76790 18 0,35 1864 36,58

62 76190 18 0,35 1882 36,94

63 13550 18 0,35 1900 37,29

64 65720 17 0,33 1917 37,63

65 81320 17 0,33 1934 37,96

66 82110 17 0,33 1951 38,29

67 78900 17 0,33 1968 38,63

68 82390 16 0,31 1984 38,94

69 81830 16 0,31 2000 39,25

70 65280 16 0,31 2016 39,57

71 51120 16 0,31 2032 39,88

72 75960 16 0,31 2048 40,20

73 70080 16 0,31 2064 40,51

74 78160 15 0,29 2079 40,80

75 13440 15 0,29 2094 41,10

76 51950 15 0,29 2109 41,39

77 51700 15 0,29 2124 41,69

78 65490 15 0,29 2139 41,98

79 63330 15 0,29 2154 42,28

80 64820 15 0,29 2169 42,57

81 81750 15 0,29 2184 42,87

82 79060 15 0,29 2199 43,16

83 79120 15 0,29 2214 43,45

84 83830 15 0,29 2229 43,75

100

ID Codigo Produto

Qtde Pedidos

% (Pedido/ Total)

Acumu lado

% acumulado

85 78750 14 0,27 2243 44,02

86 78710 14 0,27 2257 44,30

87 81440 14 0,27 2271 44,57

88 83040 14 0,27 2285 44,85

89 65270 14 0,27 2299 45,12

90 64520 14 0,27 2313 45,40

91 51850 14 0,27 2327 45,67

92 13200 14 0,27 2341 45,95

93 76490 14 0,27 2355 46,22

94 70530 14 0,27 2369 46,50

95 71370 13 0,26 2382 46,75

96 13700 13 0,26 2395 47,01

97 63220 13 0,26 2408 47,26

98 67030 13 0,26 2421 47,52

99 83134 13 0,26 2434 47,77

100 83097 13 0,26 2447 48,03

101 82120 13 0,26 2460 48,28

102 79020 13 0,26 2473 48,54

103 83143 13 0,26 2486 48,79

104 83155 13 0,26 2499 49,05

105 81070 12 0,24 2511 49,28

106 81740 12 0,24 2523 49,52

107 71900 12 0,24 2535 49,75

108 73270 12 0,24 2547 49,99

109 74450 12 0,24 2559 50,23

110 76520 12 0,24 2571 50,46

111 69660 11 0,22 2582 50,68

112 51780 11 0,22 2593 50,89

113 60630 11 0,22 2604 51,11

114 80860 11 0,22 2615 51,32

115 79690 11 0,22 2626 51,54

ID Codigo Produto

Qtde Pedidos

% (Pedido/ Total)

Acumu lado

% acumulado

116 83660 11 0,22 2637 51,76

117 83790 11 0,22 2648 51,97

118 83700 11 0,22 2659 52,19

119 83990 10 0,20 2669 52,38

120 81080 10 0,20 2679 52,58

121 79040 10 0,20 2689 52,78

122 79050 10 0,20 2699 52,97

123 78470 10 0,20 2709 53,17

124 78740 10 0,20 2719 53,37

125 82150 10 0,20 2729 53,56

126 81780 10 0,20 2739 53,76

127 81860 10 0,20 2749 53,95

128 82720 10 0,20 2759 54,15

129 13660 10 0,20 2769 54,35

130 13590 10 0,20 2779 54,54

131 78190 10 0,20 2789 54,74

132 77390 9 0,18 2798 54,92

133 76310 9 0,18 2807 55,09

134 76210 9 0,18 2816 55,27

135 70490 9 0,18 2825 55,45

136 72280 9 0,18 2834 55,62

137 13400 9 0,18 2843 55,80

138 51580 9 0,18 2852 55,98

139 67780 9 0,18 2861 56,15

140 65370 9 0,18 2870 56,33

141 66910 9 0,18 2879 56,51

142 64290 9 0,18 2888 56,68

143 80840 9 0,18 2897 56,86

144 78970 9 0,18 2906 57,04

145 79330 8 0,16 2914 57,19

146 79420 8 0,16 2922 57,35

ID Codigo Produto

Qtde Pedidos

% (Pedido/ Total)

Acumu lado

% acumulado

147 80580 8 0,16 2930 57,51

148 80010 8 0,16 2938 57,66

149 81330 8 0,16 2946 57,82

150 81370 8 0,16 2954 57,98

151 81960 8 0,16 2962 58,14

152 82810 8 0,16 2970 58,29

153 83090 8 0,16 2978 58,45

154 83890 8 0,16 2986 58,61

155 83680 8 0,16 2994 58,76

156 83810 8 0,16 3002 58,92

157 64850 8 0,16 3010 59,08

158 13530 8 0,16 3018 59,23

159 13670 8 0,16 3026 59,39

160 50770 8 0,16 3034 59,55

161 72350 8 0,16 3042 59,71

162 70390 8 0,16 3050 59,86

163 76200 8 0,16 3058 60,02

164 76260 8 0,16 3066 60,18

165 75310 8 0,16 3074 60,33

166 77110 8 0,16 3082 60,49

167 76450 7 0,14 3089 60,63

168 76320 7 0,14 3096 60,77

169 77530 7 0,14 3103 60,90

170 77540 7 0,14 3110 61,04

171 75030 7 0,14 3117 61,18

172 76120 7 0,14 3124 61,32

173 76070 7 0,14 3131 61,45

174 75500 7 0,14 3138 61,59

175 70300 7 0,14 3145 61,73

176 67770 7 0,14 3152 61,86

177 13500 7 0,14 3159 62,00

101

ID Codigo Produto

Qtde Pedidos

% (Pedido/ Total)

Acumu lado

% acumulado

178 13180 7 0,14 3166 62,14

179 13270 7 0,14 3173 62,28

180 51610 7 0,14 3180 62,41

181 51640 7 0,14 3187 62,55

182 62740 7 0,14 3194 62,69

183 62750 7 0,14 3201 62,83

184 63080 7 0,14 3208 62,96

185 63200 7 0,14 3215 63,10

186 66150 7 0,14 3222 63,24

187 65780 7 0,14 3229 63,38

188 65340 7 0,14 3236 63,51

189 68280 7 0,14 3243 63,65

190 83620 7 0,14 3250 63,79

191 83940 7 0,14 3257 63,93

192 83101 7 0,14 3264 64,06

193 82840 7 0,14 3271 64,20

194 82860 7 0,14 3278 64,34

195 82880 7 0,14 3285 64,47

196 82400 7 0,14 3292 64,61

197 81270 7 0,14 3299 64,75

198 80070 7 0,14 3306 64,89

199 80300 7 0,14 3313 65,02

200 79280 7 0,14 3320 65,16

201 79160 6 0,12 3326 65,28

202 79500 6 0,12 3332 65,40

203 79520 6 0,12 3338 65,52

204 79630 6 0,12 3344 65,63

205 78460 6 0,12 3350 65,75

206 81300 6 0,12 3356 65,87

207 81410 6 0,12 3362 65,99

208 81550 6 0,12 3368 66,10

ID Codigo Produto

Qtde Pedidos

% (Pedido/ Total)

Acumu lado

% acumulado

209 81650 6 0,12 3374 66,22

210 82770 6 0,12 3380 66,34

211 83850 6 0,12 3386 66,46

212 83610 6 0,12 3392 66,58

213 83200 6 0,12 3398 66,69

214 83480 6 0,12 3404 66,81

215 83142 6 0,12 3410 66,93

216 68920 6 0,12 3416 67,05

217 69180 6 0,12 3422 67,16

218 65390 6 0,12 3428 67,28

219 65810 6 0,12 3434 67,40

220 66030 6 0,12 3440 67,52

221 66670 6 0,12 3446 67,63

222 63520 6 0,12 3452 67,75

223 65010 6 0,12 3458 67,87

224 60710 6 0,12 3464 67,99

225 13190 6 0,12 3470 68,11

226 13420 6 0,12 3476 68,22

227 13840 6 0,12 3482 68,34

228 51160 6 0,12 3488 68,46

229 50230 6 0,12 3494 68,58

230 69830 6 0,12 3500 68,69

231 75950 6 0,12 3506 68,81

232 76050 6 0,12 3512 68,93

233 76180 6 0,12 3518 69,05

234 75070 6 0,12 3524 69,17

235 74800 6 0,12 3530 69,28

236 75630 6 0,12 3536 69,40

237 77430 6 0,12 3542 69,52

238 77610 6 0,12 3548 69,64

239 77220 6 0,12 3554 69,75

ID Codigo Produto

Qtde Pedidos

% (Pedido/ Total)

Acumu lado

% acumulado

240 77320 5 0,10 3559 69,85

241 76350 5 0,10 3564 69,95

242 77660 5 0,10 3569 70,05

243 77510 5 0,10 3574 70,15

244 77520 5 0,10 3579 70,25

245 76170 5 0,10 3584 70,34

246 76220 5 0,10 3589 70,44

247 76230 5 0,10 3594 70,54

248 69650 5 0,10 3599 70,64

249 69540 5 0,10 3604 70,74

250 69490 5 0,10 3609 70,83

251 69500 5 0,10 3614 70,93

252 71720 5 0,10 3619 71,03

253 71680 5 0,10 3624 71,13

254 71460 5 0,10 3629 71,23

255 72340 5 0,10 3634 71,32

256 72630 5 0,10 3639 71,42

257 74470 5 0,10 3644 71,52

258 74290 5 0,10 3649 71,62

259 74310 5 0,10 3654 71,72

260 73700 5 0,10 3659 71,82

261 50540 5 0,10 3664 71,91

262 50570 5 0,10 3669 72,01

263 13570 5 0,10 3674 72,11

264 13280 5 0,10 3679 72,21

265 60700 5 0,10 3684 72,31

266 51550 5 0,10 3689 72,40

267 64430 5 0,10 3694 72,50

268 64040 5 0,10 3699 72,60

269 63180 5 0,10 3704 72,70

270 66890 5 0,10 3709 72,80

102

ID Codigo Produto

Qtde Pedidos

% (Pedido/ Total)

Acumu lado

% acumulado

271 68550 5 0,10 3714 72,89

272 68680 5 0,10 3719 72,99

273 68360 5 0,10 3724 73,09

274 83148 5 0,10 3729 73,19

275 83149 5 0,10 3734 73,29

276 83157 5 0,10 3739 73,39

277 83290 5 0,10 3744 73,48

278 83240 5 0,10 3749 73,58

279 83510 5 0,10 3754 73,68

280 83870 5 0,10 3759 73,78

281 82580 5 0,10 3764 73,88

282 82260 5 0,10 3769 73,97

283 81700 5 0,10 3774 74,07

284 81590 5 0,10 3779 74,17

285 81530 5 0,10 3784 74,27

286 81540 5 0,10 3789 74,37

287 81980 5 0,10 3794 74,47

288 78720 5 0,10 3799 74,56

289 79080 5 0,10 3804 74,66

290 79180 5 0,10 3809 74,76

291 80230 5 0,10 3814 74,86

292 80330 5 0,10 3819 74,96

293 80720 5 0,10 3824 75,05

294 81190 5 0,10 3829 75,15

295 81230 5 0,10 3834 75,25

296 81040 4 0,08 3838 75,33

297 80690 4 0,08 3842 75,41

298 79950 4 0,08 3846 75,49

299 79590 4 0,08 3850 75,56

300 79430 4 0,08 3854 75,64

301 81970 4 0,08 3858 75,72

ID Codigo Produto

Qtde Pedidos

% (Pedido/ Total)

Acumu lado

% acumulado

302 82410 4 0,08 3862 75,80

303 82190 4 0,08 3866 75,88

304 81560 4 0,08 3870 75,96

305 81570 4 0,08 3874 76,04

306 81580 4 0,08 3878 76,11

307 82960 4 0,08 3882 76,19

308 82980 4 0,08 3886 76,27

309 82990 4 0,08 3890 76,35

310 83135 4 0,08 3894 76,43

311 83139 4 0,08 3898 76,51

312 83720 4 0,08 3902 76,58

313 83930 4 0,08 3906 76,66

314 83670 4 0,08 3910 76,74

315 83147 4 0,08 3914 76,82

316 68400 4 0,08 3918 76,90

317 68470 4 0,08 3922 76,98

318 68080 4 0,08 3926 77,06

319 68110 4 0,08 3930 77,13

320 65410 4 0,08 3934 77,21

321 66170 4 0,08 3938 77,29

322 66010 4 0,08 3942 77,37

323 65600 4 0,08 3946 77,45

324 65610 4 0,08 3950 77,53

325 63590 4 0,08 3954 77,61

326 63430 4 0,08 3958 77,68

327 64140 4 0,08 3962 77,76

328 63930 4 0,08 3966 77,84

329 64250 4 0,08 3970 77,92

330 64500 4 0,08 3974 78,00

331 64730 4 0,08 3978 78,08

332 51530 4 0,08 3982 78,16

ID Codigo Produto

Qtde Pedidos

% (Pedido/ Total)

Acumu lado

% acumulado

333 51540 4 0,08 3986 78,23

334 51430 4 0,08 3990 78,31

335 61020 4 0,08 3994 78,39

336 60650 4 0,08 3998 78,47

337 60550 4 0,08 4002 78,55

338 13480 4 0,08 4006 78,63

339 50550 4 0,08 4010 78,70

340 50560 4 0,08 4014 78,78

341 73560 4 0,08 4018 78,86

342 74360 4 0,08 4022 78,94

343 74440 4 0,08 4026 79,02

344 71440 4 0,08 4030 79,10

345 71500 4 0,08 4034 79,18

346 71790 4 0,08 4038 79,25

347 70030 4 0,08 4042 79,33

348 76280 4 0,08 4046 79,41

349 76140 4 0,08 4050 79,49

350 75590 4 0,08 4054 79,57

351 75610 4 0,08 4058 79,65

352 75380 4 0,08 4062 79,73

353 74810 4 0,08 4066 79,80

354 74820 4 0,08 4070 79,88

355 74920 4 0,08 4074 79,96

356 74930 4 0,08 4078 80,04

357 78030 4 0,08 4082 80,12

358 76500 4 0,08 4086 80,20

359 77350 4 0,08 4090 80,27

360 77020 3 0,06 4093 80,33

361 77040 3 0,06 4096 80,39

362 76380 3 0,06 4099 80,45

363 76710 3 0,06 4102 80,51

103

ID Codigo Produto

Qtde Pedidos

% (Pedido/ Total)

Acumu lado

% acumulado

364 76720 3 0,06 4105 80,57

365 78170 3 0,06 4108 80,63

366 77760 3 0,06 4111 80,69

367 77920 3 0,06 4114 80,75

368 77600 3 0,06 4117 80,80

369 77570 3 0,06 4120 80,86

370 74750 3 0,06 4123 80,92

371 75400 3 0,06 4126 80,98

372 75110 3 0,06 4129 81,04

373 75650 3 0,06 4132 81,10

374 75900 3 0,06 4135 81,16

375 76150 3 0,06 4138 81,22

376 76090 3 0,06 4141 81,28

377 69470 3 0,06 4144 81,33

378 70500 3 0,06 4147 81,39

379 69510 3 0,06 4150 81,45

380 69870 3 0,06 4153 81,51

381 71760 3 0,06 4156 81,57

382 71340 3 0,06 4159 81,63

383 71470 3 0,06 4162 81,69

384 71180 3 0,06 4165 81,75

385 74280 3 0,06 4168 81,81

386 74010 3 0,06 4171 81,86

387 73260 3 0,06 4174 81,92

388 72820 3 0,06 4177 81,98

389 73220 3 0,06 4180 82,04

390 72420 3 0,06 4183 82,10

391 71780 3 0,06 4186 82,16

392 72140 3 0,06 4189 82,22

393 72180 3 0,06 4192 82,28

394 13510 3 0,06 4195 82,34

ID Codigo Produto

Qtde Pedidos

% (Pedido/ Total)

Acumu lado

% acumulado

395 13290 3 0,06 4198 82,39

396 13790 3 0,06 4201 82,45

397 13800 3 0,06 4204 82,51

398 60280 3 0,06 4207 82,57

399 60720 3 0,06 4210 82,63

400 60690 3 0,06 4213 82,69

401 62670 3 0,06 4216 82,75

402 62790 3 0,06 4219 82,81

403 61170 3 0,06 4222 82,87

404 61180 3 0,06 4225 82,92

405 61190 3 0,06 4228 82,98

406 61350 3 0,06 4231 83,04

407 61880 3 0,06 4234 83,10

408 61990 3 0,06 4237 83,16

409 51860 3 0,06 4240 83,22

410 51870 3 0,06 4243 83,28

411 51910 3 0,06 4246 83,34

412 64770 3 0,06 4249 83,40

413 64720 3 0,06 4252 83,45

414 65220 3 0,06 4255 83,51

415 63940 3 0,06 4258 83,57

416 63980 3 0,06 4261 83,63

417 63640 3 0,06 4264 83,69

418 63720 3 0,06 4267 83,75

419 63280 3 0,06 4270 83,81

420 62920 3 0,06 4273 83,87

421 62940 3 0,06 4276 83,93

422 62950 3 0,06 4279 83,98

423 62960 3 0,06 4282 84,04

424 65670 3 0,06 4285 84,10

425 65690 3 0,06 4288 84,16

ID Codigo Produto

Qtde Pedidos

% (Pedido/ Total)

Acumu lado

% acumulado

426 65540 3 0,06 4291 84,22

427 66940 3 0,06 4294 84,28

428 68170 3 0,06 4297 84,34

429 83170 3 0,06 4300 84,40

430 83190 3 0,06 4303 84,46

431 83145 3 0,06 4306 84,51

432 83500 3 0,06 4309 84,57

433 83730 3 0,06 4312 84,63

434 83820 3 0,06 4315 84,69

435 83107 3 0,06 4318 84,75

436 83111 3 0,06 4321 84,81

437 83123 3 0,06 4324 84,87

438 83078 3 0,06 4327 84,93

439 83079 3 0,06 4330 84,99

440 83088 3 0,06 4333 85,04

441 82850 3 0,06 4336 85,10

442 82750 3 0,06 4339 85,16

443 82800 3 0,06 4342 85,22

444 81660 3 0,06 4345 85,28

445 81350 3 0,06 4348 85,34

446 81450 3 0,06 4351 85,40

447 81280 3 0,06 4354 85,46

448 81380 3 0,06 4357 85,52

449 82090 3 0,06 4360 85,57

450 82420 3 0,06 4363 85,63

451 81900 3 0,06 4366 85,69

452 81790 3 0,06 4369 85,75

453 81800 3 0,06 4372 85,81

454 79350 3 0,06 4375 85,87

455 79370 3 0,06 4378 85,93

456 79450 3 0,06 4381 85,99

104

ID Codigo Produto

Qtde Pedidos

% (Pedido/ Total)

Acumu lado

% acumulado

457 79290 3 0,06 4384 86,05

458 79100 3 0,06 4387 86,10

459 78590 3 0,06 4390 86,16

460 78380 3 0,06 4393 86,22

461 79960 3 0,06 4396 86,28

462 79790 3 0,06 4399 86,34

463 79750 3 0,06 4402 86,40

464 79680 3 0,06 4405 86,46

465 80250 3 0,06 4408 86,52

466 80750 3 0,06 4411 86,58

467 80530 3 0,06 4414 86,63

468 80980 3 0,06 4417 86,69

469 80990 3 0,06 4420 86,75

470 81120 3 0,06 4423 86,81

471 81140 3 0,06 4426 86,87

472 81160 2 0,04 4428 86,91

473 81170 2 0,04 4430 86,95

474 81250 2 0,04 4432 86,99

475 81010 2 0,04 4434 87,03

476 80500 2 0,04 4436 87,07

477 80320 2 0,04 4438 87,11

478 80680 2 0,04 4440 87,14

479 80290 2 0,04 4442 87,18

480 80090 2 0,04 4444 87,22

481 80150 2 0,04 4446 87,26

482 80340 2 0,04 4448 87,30

483 80400 2 0,04 4450 87,34

484 79770 2 0,04 4452 87,38

485 79700 2 0,04 4454 87,42

486 79810 2 0,04 4456 87,46

487 79820 2 0,04 4458 87,50

ID Codigo Produto

Qtde Pedidos

% (Pedido/ Total)

Acumu lado

% acumulado

488 79830 2 0,04 4460 87,54

489 80030 2 0,04 4462 87,58

490 80050 2 0,04 4464 87,62

491 78270 2 0,04 4466 87,65

492 78600 2 0,04 4468 87,69

493 78650 2 0,04 4470 87,73

494 78560 2 0,04 4472 87,77

495 78580 2 0,04 4474 87,81

496 78910 2 0,04 4476 87,85

497 79210 2 0,04 4478 87,89

498 79190 2 0,04 4480 87,93

499 79490 2 0,04 4482 87,97

500 79540 2 0,04 4484 88,01

501 79440 2 0,04 4486 88,05

502 79610 2 0,04 4488 88,09

503 81820 2 0,04 4490 88,13

504 81990 2 0,04 4492 88,16

505 82440 2 0,04 4494 88,20

506 81310 2 0,04 4496 88,24

507 81420 2 0,04 4498 88,28

508 81430 2 0,04 4500 88,32

509 81680 2 0,04 4502 88,36

510 82760 2 0,04 4504 88,40

511 82590 2 0,04 4506 88,44

512 82600 2 0,04 4508 88,48

513 82080 2 0,04 4510 88,52

514 82250 2 0,04 4512 88,56

515 82830 2 0,04 4514 88,60

516 82920 2 0,04 4516 88,64

517 82930 2 0,04 4518 88,68

518 83081 2 0,04 4520 88,71

ID Codigo Produto

Qtde Pedidos

% (Pedido/ Total)

Acumu lado

% acumulado

519 83094 2 0,04 4522 88,75

520 83129 2 0,04 4524 88,79

521 83132 2 0,04 4526 88,83

522 83880 2 0,04 4528 88,87

523 83280 2 0,04 4530 88,91

524 83560 2 0,04 4532 88,95

525 83590 2 0,04 4534 88,99

526 83146 2 0,04 4536 89,03

527 83073 2 0,04 4538 89,07

528 83160 2 0,04 4540 89,11

529 83151 2 0,04 4542 89,15

530 68190 2 0,04 4544 89,19

531 68220 2 0,04 4546 89,22

532 68270 2 0,04 4548 89,26

533 67000 2 0,04 4550 89,30

534 68130 2 0,04 4552 89,34

535 65550 2 0,04 4554 89,38

536 65350 2 0,04 4556 89,42

537 65700 2 0,04 4558 89,46

538 66020 2 0,04 4560 89,50

539 66040 2 0,04 4562 89,54

540 66140 2 0,04 4564 89,58

541 65860 2 0,04 4566 89,62

542 66190 2 0,04 4568 89,66

543 62970 2 0,04 4570 89,70

544 62980 2 0,04 4572 89,74

545 62990 2 0,04 4574 89,77

546 63000 2 0,04 4576 89,81

547 63010 2 0,04 4578 89,85

548 63290 2 0,04 4580 89,89

549 63270 2 0,04 4582 89,93

105

ID Codigo Produto

Qtde Pedidos

% (Pedido/ Total)

Acumu lado

% acumulado

550 63910 2 0,04 4584 89,97

551 63920 2 0,04 4586 90,01

552 63450 2 0,04 4588 90,05

553 64230 2 0,04 4590 90,09

554 64080 2 0,04 4592 90,13

555 64130 2 0,04 4594 90,17

556 64420 2 0,04 4596 90,21

557 64860 2 0,04 4598 90,25

558 64790 2 0,04 4600 90,28

559 64570 2 0,04 4602 90,32

560 64640 2 0,04 4604 90,36

561 64690 2 0,04 4606 90,40

562 64700 2 0,04 4608 90,44

563 60020 2 0,04 4610 90,48

564 60200 2 0,04 4612 90,52

565 51380 2 0,04 4614 90,56

566 51400 2 0,04 4616 90,60

567 61870 2 0,04 4618 90,64

568 62390 2 0,04 4620 90,68

569 62400 2 0,04 4622 90,72

570 60260 2 0,04 4624 90,76

571 61080 2 0,04 4626 90,79

572 60300 2 0,04 4628 90,83

573 60580 2 0,04 4630 90,87

574 50010 2 0,04 4632 90,91

575 13320 2 0,04 4634 90,95

576 13560 2 0,04 4636 90,99

577 50340 2 0,04 4638 91,03

578 50240 2 0,04 4640 91,07

579 50250 2 0,04 4642 91,11

580 13720 2 0,04 4644 91,15

ID Codigo Produto

Qtde Pedidos

% (Pedido/ Total)

Acumu lado

% acumulado

581 50100 2 0,04 4646 91,19

582 51000 2 0,04 4648 91,23

583 50750 2 0,04 4650 91,27

584 50780 2 0,04 4652 91,31

585 51210 2 0,04 4654 91,34

586 51230 2 0,04 4656 91,38

587 51340 2 0,04 4658 91,42

588 51360 2 0,04 4660 91,46

589 72080 2 0,04 4662 91,50

590 72040 2 0,04 4664 91,54

591 72270 2 0,04 4666 91,58

592 72290 2 0,04 4668 91,62

593 73240 2 0,04 4670 91,66

594 73250 2 0,04 4672 91,70

595 73180 2 0,04 4674 91,74

596 73190 2 0,04 4676 91,78

597 72950 2 0,04 4678 91,82

598 72990 2 0,04 4680 91,85

599 73020 2 0,04 4682 91,89

600 72550 2 0,04 4684 91,93

601 72570 2 0,04 4686 91,97

602 72620 2 0,04 4688 92,01

603 72760 2 0,04 4690 92,05

604 73470 2 0,04 4692 92,09

605 73840 2 0,04 4694 92,13

606 73850 2 0,04 4696 92,17

607 74410 2 0,04 4698 92,21

608 74520 2 0,04 4700 92,25

609 74540 2 0,04 4702 92,29

610 71250 2 0,04 4704 92,33

611 71270 2 0,04 4706 92,37

ID Codigo Produto

Qtde Pedidos

% (Pedido/ Total)

Acumu lado

% acumulado

612 70780 2 0,04 4708 92,40

613 70830 2 0,04 4710 92,44

614 71040 2 0,04 4712 92,48

615 71050 2 0,04 4714 92,52

616 71480 2 0,04 4716 92,56

617 71360 2 0,04 4718 92,60

618 71770 2 0,04 4720 92,64

619 71510 2 0,04 4722 92,68

620 71150 2 0,04 4724 92,72

621 71700 2 0,04 4726 92,76

622 69520 2 0,04 4728 92,80

623 69090 2 0,04 4730 92,84

624 70400 2 0,04 4732 92,88

625 70020 2 0,04 4734 92,91

626 76300 2 0,04 4736 92,95

627 76250 2 0,04 4738 92,99

628 75910 2 0,04 4740 93,03

629 75880 2 0,04 4742 93,07

630 76040 2 0,04 4744 93,11

631 76000 2 0,04 4746 93,15

632 75770 2 0,04 4748 93,19

633 75230 2 0,04 4750 93,23

634 75340 2 0,04 4752 93,27

635 75000 2 0,04 4754 93,31

636 74650 2 0,04 4756 93,35

637 74660 2 0,04 4758 93,39

638 77740 2 0,04 4760 93,42

639 77490 2 0,04 4762 93,46

640 78180 2 0,04 4764 93,50

641 78210 2 0,04 4766 93,54

642 78140 2 0,04 4768 93,58

106

ID Codigo Produto

Qtde Pedidos

% (Pedido/ Total)

Acumu lado

% acumulado

643 76740 2 0,04 4770 93,62

644 76810 2 0,04 4772 93,66

645 76820 2 0,04 4774 93,70

646 76920 2 0,04 4776 93,74

647 76940 2 0,04 4778 93,78

648 77140 2 0,04 4780 93,82

649 77150 2 0,04 4782 93,86

650 77190 2 0,04 4784 93,90

651 77210 2 0,04 4786 93,94

652 77250 2 0,04 4788 93,97

653 77240 1 0,02 4789 93,99

654 77380 1 0,02 4790 94,01

655 77340 1 0,02 4791 94,03

656 76930 1 0,02 4792 94,05

657 76900 1 0,02 4793 94,07

658 76800 1 0,02 4794 94,09

659 76780 1 0,02 4795 94,11

660 78040 1 0,02 4796 94,13

661 78230 1 0,02 4797 94,15

662 77930 1 0,02 4798 94,17

663 77970 1 0,02 4799 94,19

664 77990 1 0,02 4800 94,21

665 77790 1 0,02 4801 94,23

666 77830 1 0,02 4802 94,25

667 77840 1 0,02 4803 94,27

668 77880 1 0,02 4804 94,29

669 77910 1 0,02 4805 94,31

670 77500 1 0,02 4806 94,33

671 77410 1 0,02 4807 94,35

672 77550 1 0,02 4808 94,37

673 77750 1 0,02 4809 94,39

ID Codigo Produto

Qtde Pedidos

% (Pedido/ Total)

Acumu lado

% acumulado

674 77710 1 0,02 4810 94,41

675 77580 1 0,02 4811 94,43

676 74670 1 0,02 4812 94,45

677 74880 1 0,02 4813 94,47

678 74780 1 0,02 4814 94,48

679 75090 1 0,02 4815 94,50

680 75050 1 0,02 4816 94,52

681 75170 1 0,02 4817 94,54

682 75180 1 0,02 4818 94,56

683 75330 1 0,02 4819 94,58

684 75780 1 0,02 4820 94,60

685 75790 1 0,02 4821 94,62

686 75800 1 0,02 4822 94,64

687 75810 1 0,02 4823 94,66

688 75820 1 0,02 4824 94,68

689 75830 1 0,02 4825 94,70

690 75840 1 0,02 4826 94,72

691 75850 1 0,02 4827 94,74

692 75860 1 0,02 4828 94,76

693 75870 1 0,02 4829 94,78

694 76010 1 0,02 4830 94,80

695 76030 1 0,02 4831 94,82

696 75980 1 0,02 4832 94,84

697 76080 1 0,02 4833 94,86

698 75940 1 0,02 4834 94,88

699 75490 1 0,02 4835 94,90

700 76100 1 0,02 4836 94,92

701 76130 1 0,02 4837 94,94

702 76160 1 0,02 4838 94,96

703 70070 1 0,02 4839 94,98

704 70320 1 0,02 4840 95,00

ID Codigo Produto

Qtde Pedidos

% (Pedido/ Total)

Acumu lado

% acumulado

705 70380 1 0,02 4841 95,01

706 70200 1 0,02 4842 95,03

707 70410 1 0,02 4843 95,05

708 70620 1 0,02 4844 95,07

709 70680 1 0,02 4845 95,09

710 70690 1 0,02 4846 95,11

711 69550 1 0,02 4847 95,13

712 69880 1 0,02 4848 95,15

713 69990 1 0,02 4849 95,17

714 70000 1 0,02 4850 95,19

715 69740 1 0,02 4851 95,21

716 71690 1 0,02 4852 95,23

717 71550 1 0,02 4853 95,25

718 71560 1 0,02 4854 95,27

719 71860 1 0,02 4855 95,29

720 71980 1 0,02 4856 95,31

721 72000 1 0,02 4857 95,33

722 72030 1 0,02 4858 95,35

723 71490 1 0,02 4859 95,37

724 71060 1 0,02 4860 95,39

725 71070 1 0,02 4861 95,41

726 71130 1 0,02 4862 95,43

727 71010 1 0,02 4863 95,45

728 74570 1 0,02 4864 95,47

729 74530 1 0,02 4865 95,49

730 74500 1 0,02 4866 95,51

731 74330 1 0,02 4867 95,53

732 74050 1 0,02 4868 95,54

733 74080 1 0,02 4869 95,56

734 74120 1 0,02 4870 95,58

735 74210 1 0,02 4871 95,60

107

ID Codigo Produto

Qtde Pedidos

% (Pedido/ Total)

Acumu lado

% acumulado

736 73990 1 0,02 4872 95,62

737 73670 1 0,02 4873 95,64

738 73720 1 0,02 4874 95,66

739 73750 1 0,02 4875 95,68

740 73780 1 0,02 4876 95,70

741 73810 1 0,02 4877 95,72

742 73290 1 0,02 4878 95,74

743 73300 1 0,02 4879 95,76

744 73320 1 0,02 4880 95,78

745 73390 1 0,02 4881 95,80

746 72660 1 0,02 4882 95,82

747 72730 1 0,02 4883 95,84

748 72830 1 0,02 4884 95,86

749 72890 1 0,02 4885 95,88

750 72920 1 0,02 4886 95,90

751 73040 1 0,02 4887 95,92

752 73090 1 0,02 4888 95,94

753 73130 1 0,02 4889 95,96

754 72470 1 0,02 4890 95,98

755 72360 1 0,02 4891 96,00

756 72390 1 0,02 4892 96,02

757 72070 1 0,02 4893 96,04

758 72250 1 0,02 4894 96,05

759 72150 1 0,02 4895 96,07

760 51370 1 0,02 4896 96,09

761 51280 1 0,02 4897 96,11

762 51330 1 0,02 4898 96,13

763 51220 1 0,02 4899 96,15

764 51130 1 0,02 4900 96,17

765 50880 1 0,02 4901 96,19

766 50890 1 0,02 4902 96,21

ID Codigo Produto

Qtde Pedidos

% (Pedido/ Total)

Acumu lado

% acumulado

767 50160 1 0,02 4903 96,23

768 50200 1 0,02 4904 96,25

769 50280 1 0,02 4905 96,27

770 50350 1 0,02 4906 96,29

771 50500 1 0,02 4907 96,31

772 50510 1 0,02 4908 96,33

773 50530 1 0,02 4909 96,35

774 50590 1 0,02 4910 96,37

775 50630 1 0,02 4911 96,39

776 50030 1 0,02 4912 96,41

777 50050 1 0,02 4913 96,43

778 13830 1 0,02 4914 96,45

779 13630 1 0,02 4915 96,47

780 60530 1 0,02 4916 96,49

781 60670 1 0,02 4917 96,51

782 60680 1 0,02 4918 96,53

783 61010 1 0,02 4919 96,55

784 60770 1 0,02 4920 96,57

785 62800 1 0,02 4921 96,58

786 62830 1 0,02 4922 96,60

787 62880 1 0,02 4923 96,62

788 62910 1 0,02 4924 96,64

789 62300 1 0,02 4925 96,66

790 62330 1 0,02 4926 96,68

791 62340 1 0,02 4927 96,70

792 51420 1 0,02 4928 96,72

793 51390 1 0,02 4929 96,74

794 51460 1 0,02 4930 96,76

795 51470 1 0,02 4931 96,78

796 51490 1 0,02 4932 96,80

797 51600 1 0,02 4933 96,82

ID Codigo Produto

Qtde Pedidos

% (Pedido/ Total)

Acumu lado

% acumulado

798 51650 1 0,02 4934 96,84

799 51670 1 0,02 4935 96,86

800 60210 1 0,02 4936 96,88

801 60140 1 0,02 4937 96,90

802 51830 1 0,02 4938 96,92

803 51720 1 0,02 4939 96,94

804 51750 1 0,02 4940 96,96

805 64610 1 0,02 4941 96,98

806 64920 1 0,02 4942 97,00

807 65180 1 0,02 4943 97,02

808 64400 1 0,02 4944 97,04

809 64540 1 0,02 4945 97,06

810 64550 1 0,02 4946 97,08

811 64010 1 0,02 4947 97,10

812 63440 1 0,02 4948 97,11

813 63700 1 0,02 4949 97,13

814 63710 1 0,02 4950 97,15

815 63890 1 0,02 4951 97,17

816 63730 1 0,02 4952 97,19

817 63740 1 0,02 4953 97,21

818 63760 1 0,02 4954 97,23

819 63410 1 0,02 4955 97,25

820 63020 1 0,02 4956 97,27

821 66780 1 0,02 4957 97,29

822 66820 1 0,02 4958 97,31

823 66900 1 0,02 4959 97,33

824 66920 1 0,02 4960 97,35

825 65870 1 0,02 4961 97,37

826 65510 1 0,02 4962 97,39

827 65770 1 0,02 4963 97,41

828 65400 1 0,02 4964 97,43

108

ID Codigo Produto

Qtde Pedidos

% (Pedido/ Total)

Acumu lado

% acumulado

829 65560 1 0,02 4965 97,45

830 65590 1 0,02 4966 97,47

831 68160 1 0,02 4967 97,49

832 67790 1 0,02 4968 97,51

833 67800 1 0,02 4969 97,53

834 67810 1 0,02 4970 97,55

835 67850 1 0,02 4971 97,57

836 66980 1 0,02 4972 97,59

837 67060 1 0,02 4973 97,61

838 67160 1 0,02 4974 97,63

839 67500 1 0,02 4975 97,64

840 67560 1 0,02 4976 97,66

841 68200 1 0,02 4977 97,68

842 68480 1 0,02 4978 97,70

843 68890 1 0,02 4979 97,72

844 69000 1 0,02 4980 97,74

845 69200 1 0,02 4981 97,76

846 69210 1 0,02 4982 97,78

847 69390 1 0,02 4983 97,80

848 69460 1 0,02 4984 97,82

849 83153 1 0,02 4985 97,84

850 83158 1 0,02 4986 97,86

851 83144 1 0,02 4987 97,88

852 83150 1 0,02 4988 97,90

853 83600 1 0,02 4989 97,92

854 83220 1 0,02 4990 97,94

855 83490 1 0,02 4991 97,96

856 83960 1 0,02 4992 97,98

857 83970 1 0,02 4993 98,00

858 83133 1 0,02 4994 98,02

859 83140 1 0,02 4995 98,04

ID Codigo Produto

Qtde Pedidos

% (Pedido/ Total)

Acumu lado

% acumulado

860 83137 1 0,02 4996 98,06

861 83138 1 0,02 4997 98,08

862 83131 1 0,02 4998 98,10

863 83126 1 0,02 4999 98,12

864 83110 1 0,02 5000 98,14

865 83099 1 0,02 5001 98,16

866 83100 1 0,02 5002 98,17

867 83095 1 0,02 5003 98,19

868 83092 1 0,02 5004 98,21

869 83102 1 0,02 5005 98,23

870 83103 1 0,02 5006 98,25

871 83104 1 0,02 5007 98,27

872 83105 1 0,02 5008 98,29

873 83087 1 0,02 5009 98,31

874 83089 1 0,02 5010 98,33

875 83080 1 0,02 5011 98,35

876 83050 1 0,02 5012 98,37

877 83060 1 0,02 5013 98,39

878 82940 1 0,02 5014 98,41

879 82950 1 0,02 5015 98,43

880 83000 1 0,02 5016 98,45

881 82970 1 0,02 5017 98,47

882 82900 1 0,02 5018 98,49

883 82910 1 0,02 5019 98,51

884 82870 1 0,02 5020 98,53

885 82730 1 0,02 5021 98,55

886 82610 1 0,02 5022 98,57

887 82670 1 0,02 5023 98,59

888 82780 1 0,02 5024 98,61

889 82820 1 0,02 5025 98,63

890 81670 1 0,02 5026 98,65

ID Codigo Produto

Qtde Pedidos

% (Pedido/ Total)

Acumu lado

% acumulado

891 81630 1 0,02 5027 98,67

892 81500 1 0,02 5028 98,68

893 81390 1 0,02 5029 98,70

894 82520 1 0,02 5030 98,72

895 82530 1 0,02 5031 98,74

896 82550 1 0,02 5032 98,76

897 82430 1 0,02 5033 98,78

898 82100 1 0,02 5034 98,80

899 82210 1 0,02 5035 98,82

900 82220 1 0,02 5036 98,84

901 82160 1 0,02 5037 98,86

902 82000 1 0,02 5038 98,88

903 81910 1 0,02 5039 98,90

904 81930 1 0,02 5040 98,92

905 81940 1 0,02 5041 98,94

906 81950 1 0,02 5042 98,96

907 81890 1 0,02 5043 98,98

908 81840 1 0,02 5044 99,00

909 81850 1 0,02 5045 99,02

910 79620 1 0,02 5046 99,04

911 79600 1 0,02 5047 99,06

912 79650 1 0,02 5048 99,08

913 79660 1 0,02 5049 99,10

914 79670 1 0,02 5050 99,12

915 79230 1 0,02 5051 99,14

916 79240 1 0,02 5052 99,16

917 79270 1 0,02 5053 99,18

918 78920 1 0,02 5054 99,20

919 78950 1 0,02 5055 99,21

920 79110 1 0,02 5056 99,23

921 79000 1 0,02 5057 99,25

109

ID Codigo Produto

Qtde Pedidos

% (Pedido/ Total)

Acumu lado

% acumulado

922 78570 1 0,02 5058 99,27

923 78670 1 0,02 5059 99,29

924 78510 1 0,02 5060 99,31

925 78400 1 0,02 5061 99,33

926 78410 1 0,02 5062 99,35

927 78420 1 0,02 5063 99,37

928 80000 1 0,02 5064 99,39

929 79850 1 0,02 5065 99,41

930 79910 1 0,02 5066 99,43

931 79720 1 0,02 5067 99,45

932 79730 1 0,02 5068 99,47

933 79760 1 0,02 5069 99,49

934 80420 1 0,02 5070 99,51

935 80460 1 0,02 5071 99,53

936 80490 1 0,02 5072 99,55

937 80350 1 0,02 5073 99,57

938 80360 1 0,02 5074 99,59

939 80380 1 0,02 5075 99,61

940 80390 1 0,02 5076 99,63

941 80170 1 0,02 5077 99,65

942 80210 1 0,02 5078 99,67

943 80140 1 0,02 5079 99,69

944 80310 1 0,02 5080 99,71

945 80510 1 0,02 5081 99,73

946 80520 1 0,02 5082 99,74

947 80550 1 0,02 5083 99,76

948 80570 1 0,02 5084 99,78

949 80740 1 0,02 5085 99,80

950 80910 1 0,02 5086 99,82

951 80940 1 0,02 5087 99,84

952 80960 1 0,02 5088 99,86

ID Codigo Produto

Qtde Pedidos

% (Pedido/ Total)

Acumu lado

% acumulado

953 80810 1 0,02 5089 99,88

954 80830 1 0,02 5090 99,90

955 81050 1 0,02 5091 99,92

956 81110 1 0,02 5092 99,94

957 81210 1 0,02 5093 99,96

958 81180 1 0,02 5094 99,98

959 81150 1 0,02 5095 100,00

110

d. Curva ABC – Amostra reduzida: Transações de vendas do 1º Semestre de 2011 (títulos mais solicitados).

ID Codigo Produto

Qtde Pedidos

% (Pedido/ Total)

Acumu lado

% acumulado

1 81710 80 3,12% 80 3,12%

2 81600 74 2,89% 154 6,01%

3 13210 70 2,73% 224 8,74%

4 80660 68 2,65% 292 11,39%

5 83690 52 2,03% 344 13,42%

6 13710 52 2,03% 396 15,44%

7 78790 49 1,91% 445 17,36%

8 78800 47 1,83% 492 19,19%

9 75440 42 1,64% 534 20,83%

10 13220 39 1,52% 573 22,35%

11 80760 39 1,52% 612 23,87%

12 82570 39 1,52% 651 25,39%

13 78730 37 1,44% 688 26,83%

14 84000 36 1,40% 724 28,24%

15 83910 34 1,33% 758 29,56%

16 78760 35 1,37% 793 30,93%

17 78780 34 1,33% 827 32,25%

18 50580 34 1,33% 861 33,58%

19 13740 32 1,25% 893 34,83%

20 81610 32 1,25% 925 36,08%

21 83920 32 1,25% 957 37,32%

22 13690 30 1,17% 987 38,49%

23 81360 30 1,17% 1017 39,66%

24 78770 27 1,05% 1044 40,72%

25 78280 27 1,05% 1071 41,77%

26 83540 27 1,05% 1098 42,82%

27 50740 27 1,05% 1125 43,88%

28 51990 27 1,05% 1152 44,93%

ID Codigo Produto

Qtde Pedidos

% (Pedido/ Total)

Acumu lado

% acumulado

29 63830 26 1,01% 1178 45,94%

30 77440 26 1,01% 1204 46,96%

31 84010 26 1,01% 1230 47,97%

32 79140 25 0,98% 1255 48,95%

33 82790 25 0,98% 1280 49,92%

34 79200 24 0,94% 1304 50,86%

35 64490 24 0,94% 1328 51,79%

36 51710 23 0,90% 1351 52,69%

37 51840 23 0,90% 1374 53,59%

38 74640 23 0,90% 1397 54,49%

39 83710 23 0,90% 1420 55,38%

40 83860 23 0,90% 1443 56,28%

41 78700 22 0,86% 1465 57,14%

42 78100 22 0,86% 1487 58,00%

43 77120 22 0,86% 1509 58,85%

44 69640 21 0,82% 1530 59,67%

45 71520 21 0,82% 1551 60,49%

46 83230 21 0,82% 1572 61,31%

47 83840 20 0,78% 1592 62,09%

48 83800 20 0,78% 1612 62,87%

49 83780 19 0,74% 1631 63,61%

50 79220 20 0,78% 1651 64,39%

51 60790 20 0,78% 1671 65,17%

52 63300 20 0,78% 1691 65,95%

53 51970 19 0,74% 1710 66,69%

54 13620 19 0,74% 1729 67,43%

55 71650 19 0,74% 1748 68,17%

56 81030 19 0,74% 1767 68,92%

ID Codigo Produto

Qtde Pedidos

% (Pedido/ Total)

Acumu lado

% acumulado

57 83136 18 0,70% 1785 69,62%

58 81400 18 0,70% 1803 70,32%

59 83750 18 0,70% 1821 71,02%

60 73400 18 0,70% 1839 71,72%

61 76790 18 0,70% 1857 72,43%

62 76190 18 0,70% 1875 73,13%

63 13550 18 0,70% 1893 73,83%

64 65720 17 0,66% 1910 74,49%

65 81320 17 0,66% 1927 75,16%

66 82110 17 0,66% 1944 75,82%

67 78900 17 0,66% 1961 76,48%

68 82390 16 0,62% 1977 77,11%

69 81830 16 0,62% 1993 77,73%

70 65280 16 0,62% 2009 78,35%

71 51120 16 0,62% 2025 78,98%

72 75960 16 0,62% 2041 79,60%

73 70080 16 0,62% 2057 80,23%

74 78160 15 0,59% 2072 80,81%

75 13440 15 0,59% 2087 81,40%

76 51950 15 0,59% 2102 81,98%

77 51700 15 0,59% 2117 82,57%

78 65490 15 0,59% 2132 83,15%

79 63330 15 0,59% 2147 83,74%

80 64820 15 0,59% 2162 84,32%

81 81750 15 0,59% 2177 84,91%

82 79060 15 0,59% 2192 85,49%

83 79120 15 0,59% 2207 86,08%

84 83830 15 0,59% 2222 86,66%

111

ID Codigo Produto

Qtde Pedidos

% (Pedido/ Total)

Acumu lado

% acumulado

85 78750 14 0,55% 2236 87,21%

86 78710 14 0,55% 2250 87,75%

87 81440 14 0,55% 2264 88,30%

88 83040 14 0,55% 2278 88,85%

89 65270 14 0,55% 2292 89,39%

90 64520 14 0,55% 2306 89,94%

91 51850 14 0,55% 2320 90,48%

92 13200 14 0,55% 2334 91,03%

93 76490 14 0,55% 2348 91,58%

ID Codigo Produto

Qtde Pedidos

% (Pedido/ Total)

Acumu lado

% acumulado

94 70530 14 0,55% 2362 92,12%

95 71370 13 0,51% 2375 92,63%

96 13700 13 0,51% 2388 93,14%

97 63220 13 0,51% 2401 93,64%

98 67030 13 0,51% 2414 94,15%

99 83134 13 0,51% 2427 94,66%

100 83097 13 0,51% 2440 95,16%

101 82120 13 0,51% 2453 95,67%

102 79020 13 0,51% 2466 96,18%

ID Codigo Produto

Qtde Pedidos

% (Pedido/ Total)

Acumu lado

% acumulado

103 83143 13 0,51% 2479 96,68%

104 83155 13 0,51% 2492 97,19%

105 81070 12 0,47% 2504 97,66%

106 81740 12 0,47% 2516 98,13%

107 71900 12 0,47% 2528 98,60%

108 73270 12 0,47% 2540 99,06%

109 74450 12 0,47% 2552 99,53%

110 76520 12 0,47% 2564 100,00%

112

e. Estatísticas Básicas – Amostra reduzida: Transações de vendas do 1º Semestre

de 2011 (títulos mais solicitados)

e.1. Distribuição das vendas por UF

UF Qtde

AC 8

AL 13

AM 7

AP 10

BA 137

CE 41

DF 391

ES 25

EX 17

GO 165

UF Qtde

MA 33

MG 250

MS 43

MT 77

PA 47

PB 68

PE 81

PI 42

PR 179

RJ 125

UF Qtde

RN 40

RO 23

RR 4

RS 172

SC 86

SE 12

SP 433

TO 35

113

e.2. Distribuição das vendas por Região

Região Qtde

Centro-Oeste 676

Exterior 17

Nordeste 434

Norte 167

Sudeste 833

Sul 437

e.3. Distribuição das vendas por Produto e Região

Ver tabela contendo os valores deste gráfico em Anexo 02.d.

114

e.4. Distribuição das vendas por Faixa do Ano de Edição do Produto

Faixa

Ano Edição Qtde

1993-1996 307

1997-2000 285

2001-2004 194

2005-2008 1179

2009-2011 599

115

e.5. Distribuição das vendas por Faixa de Preço do Produto

Faixa Preço Qtde

0-20 1941

21-40 511

41-60 41

61-80 48

81-100 23

e.6. Distribuição das vendas por Tipo do Produto

Tipo Qtde

Livro 2229

Circular Técnica 73

Documentos 226

Sistema de Produção 23

DVD 13

116

e.7. Distribuição das vendas por Linha do Produto

Linha Qtde

Agricultura 1358

Produção Animal 439

Meio Ambiente, Recursos Genéticos, Recursos Naturais 265

Agroindústria e Tecnologia de Alimentos 38

Solos, Microbiologia e Clima 109

Outras Publicações 14

Periódicos Científicos 0

Criações Diversas 341

Infanto-Juvenis 0

117

ANEXO 03 – SCRIPTS LIMPEZA DOS DADOS /* ATUALIZA TODOS OS CAMPOS "CODIGO MUNICIPIO" E "CODIGO ESTADO" DA TABELA DE

CLIENTE, CUJOS CAMPOS "NOME MUNICIPIO" E "NOME ESTADO" EXISTAM NAS TABELAS DE

MUNICIPIOS E DE ESTADOS RESPECTIVAMENTE */

UPDATE cliente

SET

cliente.codigomunicipio = m.codigomunicipio, cliente.codigoestado = m.codigoestado,

cliente.paiscliente = 'Brasil', cliente.codigopais = 8

FROM

(select mun.codigomunicipio, mun.nomemunicipio, e.codigoestado, e.siglaestado

from municipios mun

inner join estados e on e.codigoestado = mun.codigoestado) AS m

WHERE

upper(cidadecliente) = upper(m.nomemunicipio) and

upper(estadocliente) = upper(m.siglaestado)

and (cliente.codigomunicipio is null or cliente.codigomunicipio <> m.codigomunicipio

or

cliente.codigoestado is null or cliente.codigoestado <> m.codigoestado)

/* ATUALIZA TIPOPESSOA FÍSICA */

update cliente

set tipopessoa = 1

where

(codigocliente in (select codigocliente from pessoafisica))

and (tipopessoa = 0 or tipopessoa is null)

/* ATUALIZA TIPOPESSOA JURÍDICA */

update cliente

set tipopessoa = 2

where

(codigocliente in (select codigocliente from pessoajuridica))

and (tipopessoa = 0 or tipopessoa is null)

/* RETIRA CARACTERES INVÁLIDOS DOS VALORES DA TABELA DE PEDIDO */

UPDATE PEDIDO

SET

valorpedido =

replace(replace(replace(replace(valorpedido,'R',''),'$',''),'R$',''),',','.'),

118

valorfrete =

replace(replace(replace(replace(valorfrete,'R',''),'$',''),'R$',''),',','.'),

valorassinatura =

replace(replace(replace(replace(valorassinatura,'R',''),'$',''),'R$',''),',','.'),

valortotalpedido =

replace(replace(replace(replace(valortotalpedido,'R',''),'$',''),'R$',''),',','.'),

desconto =

replace(replace(replace(replace(desconto,'R',''),'$',''),'R$',''),',','.')

WHERE

(valorpedido is not null and valorpedido <> '' and (valorpedido like '$' or

isnumeric(valorpedido) <> 1 or valorpedido like ',' or valorpedido = '.'))

or (valorfrete is not null and valorfrete <> '' and (valorfrete like '$' or

isnumeric(valorfrete) <> 1 or valorfrete like ',' or valorfrete like '.'))

or (valorassinatura is not null and valorassinatura <> '' and (valorassinatura like

'$' or isnumeric(valorassinatura) <> 1 or valorassinatura like ',' or

valorassinatura like '.'))

or (valortotalpedido is not null and valortotalpedido <> '' and (valortotalpedido

like '$' or isnumeric(valortotalpedido) <> 1 or valortotalpedido like ',' or

valortotalpedido like '.'))

or (desconto is not null and desconto <> '' and (desconto like '$' or

isnumeric(desconto) <> 1 or desconto like ',' or desconto like '.'))

119

ANEXO 04 – PROCESSAMENTO REGRAS DE ASSOCIAÇÃO

a. Análise PRODUTO x PRODUTO

Modelo a.1: Parâmetros para o algoritmo Apriori: valores padrão (suporte: 0.1;

confiança: 0.9; regras: 10). Resultado: nenhuma regra retornada.

Modelo a.2: Parâmetros para o algoritmo Apriori: valores ajustados (suporte: 0.01;

confiança: 0.6; regras: 20). Resultado: 15 regras encontradas.

120

Modelo a.3: Parâmetros para o algoritmo Apriori: valores ajustados (suporte: 0.02;

confiança: 0.2; regras: 20). Resultado: 8 regras encontradas

b. Análise REGIÃO x PRODUTO

Modelo b.1: Parâmetros para o algoritmo Apriori: valores padrão (suporte: 0.1;

confiança: 0.9; regras: 10). Resultado: nenhuma regra retornada.

121

Modelo b.2: Parâmetros para o algoritmo Apriori: valores ajustados (suporte: 0.01;

confiança: 0.6; regras: 20). Resultado: 20 regras encontradas.

Modelo b.3: Parâmetros para o algoritmo Apriori: valores ajustados (suporte: 0.02;

confiança: 0.4; regras: 20). Resultado: 5 regras encontradas.

122

c. Análise UF x PRODUTO

Modelo c.1: Parâmetros para o algoritmo Apriori: valores padrão (suporte: 0.1;

confiança: 0.9; regras: 10). Resultado: nenhuma regra retornada.

Modelo c.2: Parâmetros para o algoritmo Apriori: valores ajustados (suporte: 0.01;

confiança: 0.3; regras: 70). Resultado: 67 regras encontradas.

123

d. Análise LINHA PRODUTO x PRODUTO

Modelo d.1: Parâmetros para o algoritmo Apriori: valores padrão (suporte: 0.1;

confiança: 0.9; regras: 10). Resultado: nenhuma regra retornada.

Modelo d.2: Parâmetros para o algoritmo Apriori: valores ajustados (suporte: 0.03;

confiança: 0.6; regras: 100). Resultado: 51 regras encontradas.

124

e. Análise LINHA PRODUTO x LINHA PRODUTO

Modelo e.1: Parâmetros para o algoritmo Apriori: valores padrão (suporte: 0.1;

confiança: 0.9; regras: 10). Resultado: nenhuma regra retornada.

Modelo e.2: Parâmetros para o algoritmo Apriori: valores ajustados (suporte: 0.05;

confiança: 0.5; regras: 10). Resultado: 6 regras encontradas.

125

f. Análise REGIÃO x LINHA PRODUTO

Modelo f.1: Parâmetros para o algoritmo Apriori: valores ajustados (suporte: 0.05;

confiança: 0.9; regras: 200). Resultado: 120 regras encontradas.

126

ANEXO 05 – DICIONÁRIO DE DADOS a. Fato Venda_Diaria

127

128

129

b. Fato Pedido_Diario

130

c. Fato Venda_Direito_Autoral_Diaria

131

d. Dimensão Cliente

132

e. Dimensão Localidade

133

f. Dimensão Nota_Fiscal_Pedido

134

135

g. Dimensão Pedido

136

h. Dimensão Produto_Autoria_Consignacao

137

i. Dimensão Produto_Categoria_Pacote

138

j. Dimensão Tempo_Diario

139

k. Dimensão Tipo_Pagamento