descriÇÃo do consumo de energia de consumidores
TRANSCRIPT
LUCAS MARIN ROSÁRIO
DESCRIÇÃO DO CONSUMO DE ENERGIA DE CONSUMIDORES INDUSTRIAIS E COMERCIAIS UTILIZANDO DESCOBERTA DE
CONHECIMENTO EM BASE DE DADOS
Itajaí (SC), janeiro de 2014
UNIVERSIDADE DO VALE DO ITAJAÍ
CURSO DE MESTRADO ACADÊMICO EM
COMPUTAÇÃO APLICADA
DESCRIÇÃO DO CONSUMO DE ENERGIA DE CONSUMIDORES INDUSTRIAIS E COMERCIAIS UTILIZANDO DESCOBERTA DE
CONHECIMENTO EM BASE DE DADOS
por
Lucas Marin Rosário Dissertação apresentada como requisito parcial à obtenção do grau de Mestre em Computação Aplicada. Orientador: Raimundo C. G. Teive, Doutor
Itajaí (SC), janeiro de 2014
DESCRIÇÃO DO CONSUMO DE ENERGIA DE CONSUMIDORES INDUSTRIAIS E COMERCIAIS UTILIZANDO DESCOBERTA DE
CONHECIMENTO EM BASE DE DADOS
Lucas Marin Rosário
01 / 2014
Orientador: Raimundo C. G. Teive, Doutor
Área de Concentração: Computação Aplicada
Linha de Pesquisa: Inteligência Artificial
Palavras-chave: previsão de demanda, mineração de dados, KDD, RNA.
Número de páginas: 108
RESUMO
O aumento do consumo de energia elétrica é cada vez maior no Brasil devido principalmente a aspectos econômicos e sociais. O entendimento da dinâmica do comportamento do consumo de energia em função das variáveis climáticas, econômicas e sociais, por exemplo, é fundamental para que as empresas de distribuição possam realizar estudos de previsão do crescimento da demanda com maior acuracidade, melhorando assim o planejamento do seu sistema. Dados de consumo dos clientes da concessionária de distribuição de energia elétrica de Santa Catarina (CELESC Distribuição) apontam que as classes industrial e comercial respondem por aproximadamente 60% do consumo total de energia do estado. O comportamento do consumidor residencial já tem sido foco de pesquisas há muito tempo, sendo bem conhecido. Assim, prever o consumo de energia elétrica para a indústria e o comércio é de vital importância para o estado de Santa Catarina e para o país no que se refere ao planejamento de sua matriz energética. Neste trabalho é proposto um modelo que permite a determinação do perfil de consumo diário de consumidores de energia elétrica e a previsão do montante de energia a ser consumida, tanto no comércio quanto na indústria, considerando de forma desagregada por atividade econômica. Busca-se conhecer os padrões de perfis de curvas de carga diária utilizando-se técnicas de clusterização. Com a aplicação de questionários e busca de regras de associação é possível determinar o perfis de consumidores de energia elétrica bem como as variáveis que influenciam cada perfil. Para uma melhor eficiência no planejamento de uma planta energética, além de conhecer o perfil diário dos consumidores é interessante prever o consumo médio mensal de cada divisão econômica, realizando a previsão do montante de demanda de energia elétrica mensal com o auxílio de redes neurais artificiais (RNA). Resultados preliminares, obtidos a partir dos dados de uma região de Santa Catarina, têm demonstrado a potencialidade desta metodologia para descrever o comportamento do consumo de energia elétrica de consumidores industriais e comerciais.
ENERGY CONSUMPTION DESCRIPTION OF INDUSTRIAL AND COMMERCIAL CONSUMERS USING KNOWLEDGE
DISCOVERY IN DATABASE
Lucas Marin Rosário
01 / 2014
Advisor: Raimundo C. G. Teive, Doutor
Concentration Area: Applied Computing
Reseach Line: Artifical Intelligence
Keywords: Demand Forecasting, Data Mining, KDD, ANN.
Number of Pages: 108
ABSTRACT The electricity consumption is increasing in Brazil mainly due to economic and social aspects. Understand the dynamic behavior of energy consumption due to climatic, economic and social variables, for example, is essential for the distribution companies for conduct studies of the demand growth forecast with greater accuracy, and then improving the planning of your system. Consumption data of customers of the utility distribution of electricity from Santa Catarina (CELESC Distribution) indicate that the industrial and commercial sectors account for approximately 60 % of total energy consumption in the state. The behavior of the residential consumer has already been the focus of much research time and is well known there. Predicting the consumption of electricity for industry and trade is of vital importance to the state of Santa Catarina and the country in relation to the planning of its energy matrix. This paper proposes a model that allows the determination of the daily consumption of electricity consumers and the amount of energy to be consumed, both in trade and in industry forecast profile, considering disaggregated by economic activity. We are looking for the patterns of daily load curves profiles using clustering techniques. Using questionnaires and association rules can determine the profiles of consumers of electricity as well as variables that influence each profile. For better efficiency in the planning of an energy plant and to meet everyday consumer profile is interesting to predict the average monthly consumption of each economic divide, making the prediction of the amount of monthly electricity demand with the aid of artificial neural networks (RNA). Preliminary results from the data of a region of Santa Catarina have demonstrated the potential of this methodology to describe the behavior of the electricity consumption of industrial and commercial consumers.
LISTA DE ILUSTRAÇÕES
Figura 1 - Etapas do processo de KDD .......................................................................................... 20
Figura 2 - Clusterização em espaço 2D. (a) Dados iniciais; (b) três clusters formados; (c) Quatro Clusters formados. ................................................................................................................. 23
Figura 3 -Modelo não linear de neurônio. ...................................................................................... 31
Figura 4 - Representação do Neurônio de Base Radial................................................................... 37
Figura 5 - Passos Para Determinação do Perfil dos Consumidores. ................................................ 56
Figura 6 - Tipologias da Classe Industrial – Joinville e Florianópolis. ........................................... 58
Figura 7 - Tipologias da Classe Comercial – Joinville e Florianópolis. .......................................... 60
Figura 8 – MLP Testada. ............................................................................................................... 71
Figura 9 - Linha Amarela – Tabela 6. ............................................................................................ 73
Figura 10 - Linha Verde – Tabela 6. .............................................................................................. 74
Figura 11 - Linha Verde – Tabela 7. .............................................................................................. 76
Figura 12 - Linha Amarela – Tabela 9. .......................................................................................... 78
Figura 13 - Linha Verde – Tabela 9. .............................................................................................. 79
Figura 14 - Linha Amarela – Tabela 10. ........................................................................................ 81
Figura 15 - Linha vermelha – Tabela 11. ....................................................................................... 82
Figura 16 - Linha amarela – Tabela 11. ......................................................................................... 83
Figura 17 - Linha Verde – Tabela 11. ............................................................................................ 84
Figura 18 - Linha Azul – Tabela 11. .............................................................................................. 84
Figura 19 - Curva de Carga do Empreendimento de Uso Coletivo. ................................................ 86
Figura 20 - Curva diária total ........................................................................................................ 87
Quadro 1 - Tarefas para Descoberta de Conhecimento e suas Aplicações. ..................................... 21
Quadro 2 – Artigos Selecionados .................................................................................................. 44
Quadro 3 - Comparativo dos Artigos ............................................................................................. 44
Quadro 4 – Atividades Consideradas – CNAE Indústra. ................................................................ 48
Quadro 5 – Atividades Consideradas – CNAE Comércio. ............................................................. 49
Quadro 6- Parâmetrização das Respostas do Questionário. ............................................................ 62
Quadro 7 – Conjunto Mínimo de 17 Regras para 7 Tipologias Industriais. .................................... 64
Quadro 8 – Conjunto Mínimo de 24 Regras para 8 Tipologas Comerciais. .................................... 66
LISTA DE TABELAS
Tabela 1 - Número de Amostras da Classe Industrial para 8 Regionais. ......................................... 51
Tabela 2 - Número de Amostras da Classe Comercial para 8 Regionais. ........................................ 51
Tabela 3 - Relação de Consumidores e disponibilidade de dados. .................................................. 53
Tabela 4 - Matriz de Confusão – 7 Tipologias Industriais .............................................................. 65
Tabela 5 – Matriz de Confusão – 8 Tipologias Comerciais. ........................................................... 68
Tabela 6 – Resultados modelo reduzido ....................................................................................... 72
Tabela 7 – Resultados – Todas as variáveis ................................................................................... 75
Tabela 8 - Resultados 7 variáveis A............................................................................................... 77
Tabela 9 - Resultados 7 variáveis B. .............................................................................................. 77
Tabela 10 - Resultados 4 variáveis. ............................................................................................... 80
Tabela 11- Resultados Autoregressivo........................................................................................... 81
LISTA DE ABREVIATURAS E SIGLAS
ANEEL Agência Nacional de Energia Elétrica ANFIS Adaptive Neuro Fuzzy Inference System ANN Artificial Neural Network
API Application Programming Interface
ARIMA Autoregressive Integrated Moving Average CDI Clustering Dispersion Indicator CELESC Centrais Elétricas de Santa Catarina CNAE Cadastro Nacional de atividade econômica ENCOG Advanced Machine Learning Framework
ETL Extração Transformação e Carga GRNN General Regression Neural Network
GWh Gigawatt-hora
IEEE Institute of Electrical and Electronics Engineers
IPCA Índice Nacional de Preços ao Consumidor Amplo KDD knowledge-discovery in databases
kVA Kilovoltampere LMS Least Mean Square
MAPE Mean Absolute Percentage Error MATLAB Matrix Laboratory
MCA Mestrado em Computação Aplicada MIA Mean Index Adequacy MLP Multilayer Perceptron MLR Multiple Linear RegressionMSE Mean Square Error
PHP Hypertext Preprocessor
PIB Produto Interno Bruto PL/SQL Procedural Language/Structured Query Language
RBF Radial Basis Function RNA Redes Neurais artificiais SELIC Sistema Especial de Liquidação e de Custódia SPV Supervised Association Generator
TRAINBR Bayesian regulation backpropagation
TRAINLM Levenberg-Marquardt backpropagation
TR Taxa Referencial de Juros UNIVALI Universidade do Vale do Itajaí VA Valor Agregado da Indústria
7
SUMÁRIO
1 INTRODUÇÃO ...................................................................................... 9
1.1 PROBLEMA DE PESQUISA .......................................................................... 9
1.1.1 Solução Proposta .......................................................................................... 11
1.1.2 Delimitação de Escopo ................................................................................. 12
1.2 OBJETIVOS ................................................................................................... 13
1.2.1 Objetivo Geral .............................................................................................. 14
1.2.2 Objetivos Específicos ................................................................................... 14
1.3 JUSTIFICATIVA ........................................................................................... 14
1.4 METODOLOGIA ........................................................................................... 16
1.4.1 Metodologia da Pesquisa.............................................................................. 16
1.4.2 Procedimentos Metodológicos ..................................................................... 16
2 FUNDAMENTAÇÃO TEÓRICA ...................................................... 19
2.1 DESCOBERTA DE CONHECIMENTOS EM BASE DE DADOS ............ 19
2.1.1 O Processo de Descoberta de Conhecimento .............................................. 19
2.1.2 Tarefas de Mineração de Dados .................................................................. 20
2.1.3 Tarefa de Clusterização ............................................................................... 22
2.1.4 O algoritmo de clusterização K-means ....................................................... 23
2.1.5 Exemplos de Aplicação na Literatura ......................................................... 24
2.1.6 Regras de Associação ................................................................................... 25
2.2 PREVISÃO DE CONSUMO DE ENERGIA ELÉTRICA ........................... 28
2.2.1 O Problema de Previsão............................................................................... 28
2.2.2 Previsão de Séries Temporais ...................................................................... 29
2.2.3 Previsão de Consumo de Energia Elétrica .................................................. 30
2.3 REDES NEURAIS ARTIFICIAIS ................................................................ 30
2.3.1 Conceitos Básicos ......................................................................................... 30
2.3.2 Funcionamento Básico e Principais Topologias de RNA ........................... 32
2.3.3 Rede MLP (Multilayer Perceptron) ............................................................ 33
2.3.4 Rede RBF (Radial Basis function) ............................................................... 37
2.4 CONSIDERAÇÕES FINAIS ......................................................................... 38
3 METODOS DE PREVISÃO PARA SISTEMAS DE ENERGIA ELÉTRICA ............................................................................................... 39
3.1 INTRODUÇÃO .............................................................................................. 39
3.2 PREVISÃO EM SISTEMAS DE ENERGIA ELÉTRICA. .......................... 40
3.3 TRABALHOS UTILIZANDO RNA ............................................................. 41
3.4 ANÁLISE TRABALHOS CORRELATOS .................................................. 44
3.5 CONSIDERAÇÕES FINAIS ......................................................................... 46
4 ABORDAGEM PROPOSTA ............................................................. 47
8
4.1 PRÉ – PROCESSAMENTO DOS DADOS ................................................... 47
4.2 CÁLCULO DA AMOSTRA PARA MEDIÇÃO .......................................... 49
4.3 MEDIÇÃO DA CURVA DE CARGA DE CONSUMIDORES ................... 53
4.4 PESQUISA COM OS CONSUMIDORES VIA QUESTIONÁRIO ............ 53
4.5 CLUSTERIZAÇÃO – IDENTIFICAÇÃO DOS PERFIS DE CARGA DIÁRIA TÍPICOS .................................................................................................. 54
4.6 APLICAÇÃO DA METODOLOGIA PROPOSTA ..................................... 55
4.7 CONSIDERAÇÕES FINAIS ......................................................................... 56
5 RESULTADOS .................................................................................... 58
5.1 RESULTADOS – DETERMINAÇÃO DO PERFIL DE CONSUMIDORES . ................................................................................................................ 58
5.1.1 Clusterização ................................................................................................ 58
5.1.2 Resultados Regras de Associação ................................................................ 61
5.2 RESULTADOS - PREVISÃO PARA A DIVISÃO CNAE 15 ...................... 68
5.2.1 Variáveis de entrada .................................................................................... 68
5.2.2 Topologia ...................................................................................................... 70
5.2.3 Validação do protótipo com matlab ............................................................ 71
5.3 ESPECIFICAÇÃO DO TRANSFORMADOR ............................................. 85
5.4 COMENTÁRIOS FINAIS ............................................................................. 87
6 CONCLUSÃO ...................................................................................... 88
SUGESTÕES PARA TRABALHOS FUTUROS ................................. 90
REFERÊNCIAS ....................................................................................... 91
APÊNDICE A - TRABALHOS CORRELATOS ................................. 95
APÊNDICE B – QUESTIONÁRIO APLICADO ................................. 96
APÊNDICE C – TODAS AS RESPOSTAS DOS QUESTIONÁRIOS APLICADOS ............................................................................................ 97
9
1 INTRODUÇÃO
O aumento da densidade demográfica no Brasil e os aspectos econômicos e sociais afetam
diretamente o consumo de energia elétrica. A melhora no poder aquisitivo da população pode levar
a um aumento na aquisição de equipamentos eletroeletrônicos, elevando não só o consumo
residencial, que está fora do escopo deste trabalho, mas também o consumo comercial e industrial,
segmentos foco deste estudo.
Mudanças nos hábitos de consumo e da tecnologia são fenômenos que ocorrem cada vez
mais e sua influência na determinação da carga a ser atendida é de fundamental importância para as
empresas do setor elétrico. Assim, estabelecer a relação entre o comportamento da população e o
consumo de energia é de fundamental importância para a economia do país e de interesse de
empresas e agentes ligados ao mercado de energia elétrica. Porém, prever a demanda de energia
elétrica é um processo complexo devido às múltiplas variáveis de influência. Variáveis econômicas
e parâmetros do clima são algumas delas (ANDRADE; CAMARGO; TEIVE, 2010).
A diferença entre as demandas máximas e mínimas, consumidas em um mesmo dia,
apresenta grande variação de acordo com o segmento ao qual pertence o consumidor: comercial ou
industrial. Assim, torna-se fundamental o conhecimento das curvas de carga diárias típicas dos
consumidores para as empresas de distribuição de energia elétrica, além da previsão do montante de
energia a ser consumida, com reflexos diretos no planejamento da expansão e no dimensionamento
das suas redes, em especial dos transformadores.
Neste contexto pretende-se desenvolver um modelo computacional, baseado em técnicas de
Mineração de Dados, para descrever o comportamento do consumidor industrial e comercial de
Santa Catarina, estimar os seus perfis dinâmicos de consumo de energia elétrica, divididos por
atividades econômicas dos consumidores (atividades CNAE), levando em consideração também
mudanças de hábito de consumo devido a influência de variáveis econômicas e aos efeitos
climáticos correlacionados. Adicionalmente, pretende-se propor para cada atividade CNAE
selecionada para indústria e para o comércio, uma topologia de RNA que seja mais eficiente para
previsão de curto prazo da demanda de energia elétrica.
1.1 PROBLEMA DE PESQUISA
10
Historicamente pode-se observar o vasto uso de técnicas de previsão de séries temporais na
previsão de carga em sistemas de energia elétrica. Modelos de Suavização Exponencial (CHAN et
al., 2012), modelos auto-regressivos(AR) (HILL et al., 2012) e modelos ARIMA (AREEKUL et al.,
2010) tem sido, dentre as técnicas de previsão de séries temporais, as mais utilizadas. No entanto,
esses modelos não levam em consideração as múltiplas variáveis envolvidas no consumo de energia
elétrica, especialmente áquelas relativas á indústria e ao comércio. Carga instalada, turnos, fatores
econômicos e climáticos, são alguns exemplos de variáveis à serem consideradas no estudo do
comportamento do consumo de energia elétrica na indústria e no comércio
Atualmente, Redes Neurais Artificiais (RNA) têm sido largamente utilizadas para a previsão
de carga em sistemas de energia, particularmente em estudos com horizonte de curto e médio prazo
(até 12 meses). As tipologias mais encontradas nesta pesquisa foram: MLP - multylayer perceptron
(SANTANA et al., 2011), RBF – radial basis functions (Yun et al., 2008) e GRNN – general
regression neural network (NOSE; LOTUFO; MINUSSI, 2011). Nesses exemplos pode-se notar o
uso de diferentes variáveis de entrada, além dos dados históricos de consumo, como dados de
temperatura e preço da energia elétrica.
Porém, apesar do vasto registro de publicações encontrado na literatura, o que ficou
evidenciado pela revisão sistemática da literatura efetuada, utilizando-se RNA na previsão de carga
em sistemas de energia elétrica, observa-se que o foco tem sido a previsão do montante de consumo
de energia. A descoberta do perfil de consumo dos consumidores não é facilmente encontrada. No
trabalho apresentado por Andrade (2013), o perfil de consumo é determinado utilizando-se técnicas
de KDD (knowledge-discovery in databases – Descoberta de conhecimento em base de dados), com
foco na etapa de Mineração de dados; preocupando-se com os efeitos dinâmicos da economia, ou do
clima sobre o comportamento da demanda desagregada, separada por atividade econômica (CNAE).
A partir da determinação do perfil dos consumidores é possível construir um modelo previsor
baseado em RNA para cada grupo de consumidores e as variáveis de maior influência em cada
cluster e prever o montante do consumo de energia elétrica.
Nesse sentido, o foco desta pesquisa consiste em determinar o padrão do perfil de consumo
diário (curvas de carga) dos consumidores industriais e comerciais, separando-os em tipologias
encontradas com uso de técnicas de KDD e realizar a previsão do montante do consumo mensal
com a aplicação de RNA; considerando as atividades CNAE mais relevantes do estado de Santa
Catarina. O conhecimento do perfil de carga de consumidores industriais e comerciais tem
11
fundamental importância para a empresa de distribuição. Em especial, este conhecimento pode ser
utilizado em uma aplicação prática importante, que é a especificação do transformador que vai
alimentar um edifício misto, envolvendo por exemplo unidades comerciais e;ou industriaisNa
prática, como não existe uma metodologia eficiente tem-se observado em muitos casos o
superdimensionamento destes transformadores..
1.1.1 Solução Proposta
Os dados de consumo de energia elétrica de todo o estado de Santa Catarina, divididos por
atividade econômica, foram obtidos junto à empresa distribuidora de energia elétrica (Celesc). Após
o pré-processamento desses dados e com o auxílio de técnicas estatísticas pode-se determinar as
atividades econômicas que apresentem maior representatividade em termos de montante de
consumo e quantidade de consumidores.
Dentre as atividades econômicas obtidas da análise estatística, foi possível selecionar um
percentual de consumidores de cada classe CNAE da região de interesse, onde foi possível ter
acesso aos dados de medição dos consumidores. Como para alguns consumidores de interesse para
este estudo a Celesc não armazena os seus consumos diários, foi necessário também realizar
algumas medições. Questionários foram aplicados aos consumidores com dados de medição
disponível a fim de se idenficar variáveis de influência no consumo de energia elétrica desses
consumidores.
Com os dados de medição e as curvas diárias de consumo foi possível procurar perfis de
consumo utilizando-se algoritmos de clusterização. Neste trabalho foi utilizado o algoritmo k-
means, baseado na análise e comparação de dados, fornecendo uma classificação automática não
supervisionada. Esta técnica é muito utilizada na literatura conforme observado em Prahastono et
al., (2008) e Anuar e Zakaria (2010). Com o auxílio do MATLAB o algoritmo foi executado para
obtenção dos clusters.
Os resultados dos questionários, aplicados nos consumidores medidos ou com medição
disponibilizados pela Celesc, foram utilizados para analisar as variavéis de influência para cada
12
cluster, gerando regras de associação, por meio do levantamento das características funcionais dos
estabelecimentos obtidos com técnicas de mineração de dados, como busca de associações e uma
variante do algoritmo Apriori1, o SPV2.
Redes neurais artificiais são então utilizadas para prever o montante de consumo de energia
elétrica tendo como entrada os dados históricos de consumo e as variáveis econômicas e climáticas.
As hipóteses a serem comprovadas ou refutadas são:
Hipotese 1: É possível agrupar os perfis de carga definindo-se padrões de consumo
diferenciados dos consumidores industriais e comerciais de uma região do estado de Santa Catarina
utilizando técnicas de KDD.
Hipotese 2: É possível prever a variação do consumo de energia elétrica mensal da indústria
e do comércio em uma regiao do estado de Santa Catarina com acuracidade adequada utilizando-se
redes neurais artificiais.
A solução proposta é baseada na construção de um modelo computacional capaz de
descrever o consumo de energia elétrica, de consumidores industriais e comerciais do estado, a
partir da estimativa do perfil das curvas de carga destes consumidores, e da previsão da variação do
montante de energia, integrada às atividades econômicas e variáveis econômicas por meio de
técnicas de KDD e RNA.
1.1.2 Delimitação de Escopo
Os dados de consumo dos clientes da concessionária de distribuição de energia elétrica de
Santa Catarina (Celesc) apontam que as classes Industrial e Comercial respondem por
aproximadamente 60% do consumo total de energia do estado. Neste sentido, é justo imaginar, que
conhecendo-se o comportamento e perfil de consumo destas classes econômicas, associado com o
1 Algoritmo de mineração de dados para busca de regras de associação onde o antecedente leva ao consequente. Só
permite a execução com variáveis binárias, como verdadeiro ou falso. 2 Variação do algoritmo Apriori - permite entradas de variáveis que podem assumir mais de dois valores e não apenas valores binários.
13
perfil de consumo da classe residencial, da qual o comportamento já é mais conhecido por parte da
concessionária, ter-se-ia um panorama bem significativo do consumo de energia elétrica, com mais
de 80% do consumo total do estado. Uma amostra do comércio e indústria com nível de confiança
de 90% e erro amostral de 10% foi extraída a fim de obter resultados representativos na descrição
do consumo. Buscando-se manter uma boa representatividade em termos de consumo de energia e
de número de consumidores, das 16 regionais existentes da Celesc, buscou-se selecionar 8 regionais
que pudessem representar mais da metade do consumo e do número de consumidores das classes
comerciais e industriais do estado.
Além disso, a pesquisa concentrou-se nas divisões do CNAE mais representativas, ou seja,
as divisões selecionadas contemplaram pelo mesmo 75% do consumo dentro de cada uma das duas
classes de consumidores, além de pelo menos 75% do número total de consumidores Assim, foi
possível encontrar 8 regionais que tivessem a representatividade desejada, considerando todas as
divisões CNAE. Estas regionais são: Grande Florianópolis, Blumenau, Concórdia, Chapecó,
Joaçaba, Joinville, Lages e Videira.
A partir da definição das regionais selecionadas foi possível definir as atividades CNAE da
indústria e do comércio, a serem consideradas no cálculo da amostra para definição da coleta dos
dados de medição. Neste caso, manteve-se como parâmetro de referência a representatividade de
consumo e de número de estabecimentos. Assim, considerando as 8 regionais escolhidas,
conseguiu-se representar, com apenas 8 divisões CNAE, mais de 76% do consumo de energia e
cerca de 65% dos consumidores industriais de Santa Catarina. Da mesma forma, foi possível
agregar, com apenas 7 divisões CNAE, quase 75% do consumo de energia e mais de 76% dos
consumidores comerciais resultando em uma elevada representatividade para este tipo de pesquisa.
Neste contexto as regiões de Joinville e Florianópolis foram as regiões selecionadas neste
trabalho por ter o maior número de dados disponíveis. Elas podem ser consideradas as regiões
piloto e o método pode ser replicado nas outras regionais do estado. Para a previsão de demanda foi
utilizada como piloto a divisão CNAE 15, também pelo fato de ser a classe com maior volume de
dados (de 1997 à 2011).
1.2 OBJETIVOS
Os objetivos deste trabalho são descritos a seguir.
14
1.2.1 Objetivo Geral
Desenvolver um modelo computacional capaz de realizar a classificação do perfil do
consumo dividido por atividade econômica e prever a variação do montante do consumo mensal de
energia elétrica de consumidores comerciais e industriais.
1.2.2 Objetivos Específicos
1. Fazer o levantamento do estado da arte sobre previsão de demanda em sistemas de
energia elétrica;
2. Fazer o pré-processamento dos dados de medição de energia disponibilizados pela
concessionária de energia;
3. Aplicar o algoritmo k-means para obter os padrões de perfis de carga (tipologias de
curvas de carga);
4. Gerar um conjunto de regras de associação, envolvendo as respostas dos questionários e
as tipologias de curvas de carga obtidas;
5. Modelar uma RNA para previsão de curto prazo da variação do montante de energia para
o CNAE piloto;
6. Testar e avaliar o modelo proposto.
1.3 JUSTIFICATIVA
O conhecimento do comportamento da demanda ao longo do tempo é muito importante para
empresas de distribuição de gás, água, de serviços de comunicação como internet ou telefonia, além
naturalmente de energia. É um desafio planejar e operar um sistema capaz de atender os picos de
consumo e ainda serem economicamente viáveis com as receitas advindas do consumo efetivo por
parte dos clientes. Particularmente, no caso das distribuidoras de energia elétrica, o conhecimento
da dinâmica do comportamento do consumo de energia é fundamental para balizar o planejamento e
a operação do seu sistema, a partir dos estudos de previsão de carga, por exemplo um mês a frente.
15
Além da previsão do crescimento da demanda de uma determinada atividade CNAE, é
importante que a concessionária conheça também o perfil de consumo de energia diário dos
consumidores industriais e comerciais, pois cada classe de consumidores pode apresentar grande
variação entre as demandas máximas e médias durante um dia. Nesse contexto, torna-se
fundamental o conhecimento das curvas de carga diárias típicas e dos fatores de carga dos
consumidores para as empresas de distribuição de energia elétrica, com reflexos diretos no
planejamento da expansão e no dimensionamento das suas redes.
Na literatura podem ser encontrados diversos trabalhos relacionados ao levantamento dos
perfis típicos para diversas classes de consumidores de energia elétrica. A própria ANEEL
estabelece procedimentos e exige levantamentos de campanhas de medição para identificação
destes perfis. Curvas de carga típicas de consumidores residenciais já são bem conhecidas para
todos os dias das semanas, épocas do ano e em várias regiões do Brasil, e não sofrem grandes
alterações de padrão ao longo dos anos. Por outro lado, devido à dinâmica de suas atividades, as
classes comercial e industrial apresentam uma diversidade maior de perfis de carga diários. Além
disso, a quantidade e profundidade dos trabalhos para essas classes consumidoras ainda não atingiu
o mesmo patamar da classe residencial.
Para o projeto de transformadores de edifícios mistos, a metodologia sugerida pela Celesc
realiza o dimensionamento baseando-se em tabelas de cálculo da demanda estimada de acordo com
a Nota Técnica 03 (CELESC, 2014). As tabelas não são segregadas perfil de carga, mas sim por um
agrupamento de atividades econômicas, como por exemplo, “bancos, lojas e semelhantes”. Esta
metodologia não leva em consideração o fato de que empresas mesmo pertencendo ao mesmo
CNAE podem ter fatores de carga diferenciados, enquanto que empresas de CNAEs diferentes,
podem possuir o mesmo perfil de carga, representado por seu fator de carga.
Neste sentido justifica-se a elaboração de uma proposta de um modelo para descoberta de
conjuntos (clusters) mínimos e significativos dos perfis de carga típicos de consumidores
comerciais e industriais a partir dos dados de consumo diário. Assim, os consumidores individuais,
incluindo os segmentos comerciais e industriais, podem ser descritos por algumas tipologias de
curva de carga, encontradas no processo de clusterização, sendo que consumidores de uma mesma
atividade econômica podem pertencer a diferentes clusters.
16
Da mesma forma, é interessante para o planejamento da rede de distribuição de energia
elétrica o conhecimento da previsão do montante de consumo de energia elétrica mensal. Neste
contexto a previsão do montante do consumo mensal de energia elétrica é segregada por atividade
econômica, divisão CNAE, onde é desenvolvida uma RNA para cada classe CNAE , sendo cada
rede influenciada por diferentes variáveis identificadas a partir de análise estatística e análise das
respostas dos questionários aplicados nos consumidores, além dos dados de medição disponíveis..
1.4 METODOLOGIA
1.4.1 Metodologia da Pesquisa
De acordo com as características do trabalho proposto, pode-se classificá-lo como fazendo
uso do método científico hipotético-dedutivo, uma vez que a partir de hipóteses levantadas busca-se
modelos gerais para clusterização, classificação e previsão para descrever o comportamento do
consumidor de energia industrial e comercial.
Do ponto de vista da natureza da pesquisa, é possível classificar o presente trabalho como
pesquisa aplicada, pois ele consiste na combinação e utilização de diversas técnicas estatísticas e
computacionais, voltadas para a solução de um problema real de uma concessionária de energia
elétrica.
A pesquisa que será desenvolvida no presente trabalho é qualitativa-quantitativa, sob o
ponto de vista da abordagem do problema, e exploratória, no que diz respeito aos seus objetivos,
pois envolve a construção e validação de um modelo, e desta forma, o produto da pesquisa estará
sujeito a avaliações e comparações, com a finalidade de ser validado.
1.4.2 Procedimentos Metodológicos
Os procedimentos metodológicos que serão seguidos para a realização do trabalho podem
ser divididos em duas etapas: Determinação do perfil dos consumidores (classificação) e previsão
da variação do montante de consumo de energia elétrica com auxílio de redes neurais (previsão).
Análise de Trabalhos Correlatos
17
Inicialmente foi realizada uma pesquisa bibliográfica, envolvendo a análise de trabalhos
relacionados principalmente com os temas de previsão de séries temporais e previsão do consumo
de energia elétrica. O foco neste momento foi sobre o problema em si e as técnicas utilizadas para
sua solução. Esta etapa atendeu o objetivo específico 1.
Coleta e Pré-processamento dos Dados
Os dados enviados pela concessionária de energia sofreram um processo de pré-
processamento, inicialmente considerando-se os dados de consumo mensal do ano de 2011 da
indústria e do comércio do estado de Santa Catarina. Os dados estavam divididos por atividade
econômica CNAE; com a finalidade de determinar quais setores da indústria e do comércio são
mais representativos em termos de consumo e número de consumidores. Esta etapa atendeu ao
objetivo específico 2.
Definição e Montagem do Questionário a ser Aplicado aos Consumidores
A partir de uma amostra calculada dos dados gerais, definiu-se uma região piloto no estado
para ser aplicada a metodologia. Inicialmente, buscou-se o levantamento das tipologias de curva de
carga dos consumidores industriais e comerciais. Para isto somente os dados de medição não são
suficientes, sendo necessário também informações envolvendo aspectos comportamentais dos
consumidores, além de questões relativas ao seu negócio. Esta etapa foi necessária para atender o
objetivo específico 4.
Levantamento das Tipologias de Curvas de Carga
Na aplicação do algoritmo k-means obteve-se oito tipologias para os consumidores
industriais e sete tipologias diferentes para os consumidores comerciais da região piloto;
considerando-se todas as atividades CNAE selecionadas. Nesta etapa a preocupação estava na
questão do levantamento dos padrões dos perfis de consumo de energia diários (curvas de carga).
Esta etapa também atendeu o objetivo específico 3.
Definição de Regras de Associação
A partir das tipologias definidas na etapa anterior, foi possível, utilizando-se o algoritmo
SPV existente no software TANAGRA, definir um conjunto de regras de associação, relacionando
as respostas dos questionários e as tipologias levantadas. Com os valores adequados de suporte e
18
confiança foi possível identificar características dos consumidores para cada tipologia de curva de
carga encontrada. Esta metodologia permitirá que no futuro a concessionária possa classificar um
consumidor industrial ou comercial, em termos de sua curva de carga, a partir da aplicação do
questionário neste consumidor, sem precisar realizar novas medições ou adquirir dados do seu
consumo. Esta etapa atendeu o objetivo específico 4.
Modelagem da RNA
A RNA foi modelada para possibilitar a previsão do montante de energia a ser consumido,
em termos, por exemplo, de variação de consumo um mês a frente, considerando as tipologias de
curva de carga encontradas. As topologias de RNA consideradas foram as redes RBF e MLP, e o
CNAE considerados foi o 15 – bebidas e alimentos. Esta etapa satisfez o objetivo específico 5.
Teste e Validação do Modelo
Esta etapa atendeu o objetivo específico 6, sendo a última etapa do trabalho. Neste caso,
buscou-se separar conjuntos adequados de dados de medição para treinamento e testes da RNA
desenvolvida.
19
2 FUNDAMENTAÇÃO TEÓRICA
Neste capítulo são explorados os conteúdos chave para o desenvolvimento deste trabalho,
envolvendo principalmente a teoria de knowledge-discovery in databases, com destaque para a
tarefa de mineração de dados (teoria básica e aplicações na literatura) e a teoria de previsão de
séries temporais. As técnicas de mineração de dados clusterização, classificação e regras de
associação, as quais foram aplicadas neste trabalho, são descritas também, com ênfase para o
algoritmo de clusterização k-means. É abordado também o problema de previsão de consumo
(carga) em sistemas de energia elétrica, destacando-se a técnica de RNA, utilizada para previsão, e
o levantamento do estado da arte deste tema.
2.1 DESCOBERTA DE CONHECIMENTOS EM BASE DE DADOS
2.1.1 O Processo de Descoberta de Conhecimento
Com o desenvolvimento dos sistemas computacionais e o aumento da capacidade de
armazenamento de informação em banco de dados surge a necessidade de novas técnicas e
ferramentas de análise de grandes volumes de dados. As ferramentas para a descoberta de
conhecimento em bases de dados integram a tecnologia e a aprendizagem organizacional em busca
de uma gestão estratégica do conhecimento.
No ano de 1980 é formalizado o termo KDD (knowledge-discovery in databases), em
referência ao amplo conceito de procurar conhecimento a partir de bases de dados (FAYYAD et al,
1996). A técnica é composta de várias etapas, entre as quais destaca-se a etapa de Mineração de
Dados, a qual envolve o processo de construção de modelos, que podem ser baseados em
algoritmos, para determinação de padrões, a partir de dados observados e informações disponíveis.
Os algoritmos para Mineração de Dados adequados realizam o papel de inferir
conhecimento. No entanto, o processo de KDD não se resume somente na etapa de Mineração de
Dados, mas também abrange a preparação dos dados (aquisição dos dados, limpeza, pré-
processamento, seleção, redução e projeção) e a fase de interpretação e a avaliação do modelo
descoberto e um possível retorno a algum passo anterior como também uma possível visualização
20
do modelo extraído. Segundo Fayyad et al., (1996) as etapas do processo KDD são apresentadas na
Figura 1, mostrada a seguir.
Figura 1 - Etapas do processo de KDD Fonte: adapatado de Fayyad et al. (1996).
Conforme pode ser observado na Figura 1, o processo de KDD é composto de várias etapas,
onde diversas técnicas podem ser aplicadas. O primeiro passo é o entendimento do domínio da
aplicação definindo os conhecimentos prévios dos dados e o conhecimento que se deseja adquirir, o
alvo. Na extração retira-se um conjunto de dados, uma amostra, e seleciona-se o conjunto de
variáveis necessárias. Então faz-se a limpeza e pré-processamento (remoção de dados inválidos,
ruídos, dados faltantes, etc.) e a transformação dos dados preparando-os para a próxima etapa. Na
etapa seguinte a geração de padrões é realizada após a escolha da função de Mineração de Dados
(classificação, sumarização, clusterização, regressão, regras de associações) e a escolha do
algoritmo de mineração de dados que será utilizado na descoberta de padrões. Por fim, na avaliação
dos resultados são interpretados os padrões encontrados a fim de identificar conhecimentos reais e
interessantes para a aplicação.
A Mineração de Dados é uma das etapas do processo de KDD, conforme pode ser observado
na Figura 1. Dentro desta etapa pode ser aplicadas várias técnicas e cada uma destas técnicas e
algoritmos executam determinadas tarefas, conforme é descrito a seguir.
2.1.2 Tarefas de Mineração de Dados
As tarefas mais importantes no processo de KDD estão listadas no Quadro 1:
21
Quadro 1 - Tarefas para Descoberta de Conhecimento e suas Aplicações.
Tarefa de KDD Exemplos de Aplicação
Classificação Permite associar a cada registro de um banco de dados, um único rótulo ou classe. Uma comercializadora de energia elétrica pode realizar planos de atendimento diferenciados, conforme a segmentação dos perfis de crédito ou de montante contratual de seus clientes.
Clusterização Possibilita a identificação automática dos registros de uma base de dados na forma de agrupamentos com características similares. Neste caso, ao contrário da tarefa de classificação, não se tem o conhecimento prévio das classes existentes.
Descoberta de Associações
Incremento nas vendas de um determinado segmento comercial a partir do conhecimento das associações freqüentes entre os produtos consumidos pelos clientes.
Descoberta de Seqüências
Permite a descoberta de associações em diferentes transações ao longo do tempo. Essa identificação dos padrões de consumo auxilia na elaboração de estratégias de vendas que acompanhe as sazonalidades.
Detecção de Desvios Detecção de fraudes em cartões de crédito, planos de saúde, arrecadação. Identificação de furtos de energia elétrica.
Previsão de Séries Temporais
Solução de problemas relacionados ao planejamento e a tomada de decisões, reduzindo o nível de incerteza e os riscos do negócio.
Regressão Busca de funções, lineares ou não, que mapeiem ajustadamente os registros de um banco de dados. Pode-se pré-estabelecer a variação na carga num determinado período em função da variação da temperatura.
Sumarização Identificar as características dos consumidores de energia elétrica de determinado segmento industrial em relação à elasticidade-preço.
Fonte: Fayyad et al. (1996).
Os tipos de técnicas e de algoritmos para a mineração de dados mais comuns são: redes
neurais artificiais, lógica-fuzzy, algoritmos genéticos, estatística, econometria, algoritmos
específicos para tarefa de descoberta de regras de associação como o Apriori e variantes, entre
outros (ANDRADE, 2009).
22
Neste trabalho foram aplicadas diversas técnicas de mineração de dados para resolver tarefas
de classificação, clusterização e regras de associação, além da previsão se séries temporais através
de RNA. A tarefa de clusterização, discutida a seguir, foi empregada para realizar, de forma
automática, o agrupamento dos consumidores comerciais e industriais de Joinville e Florianópolis
(regionais definidas no escopo deste trabalho) a partir dos seus perfis de consumo.
2.1.3 Tarefa de Clusterização
Clusterização é uma tarefa de KDD, normalmente confundida com classificação. Enquanto a
classificação seleciona uma entidade baseado em valores pré-definidos de atributos, a clusterização
agrupa dados similares não baseados em valores pré-definidos. Isto é, quando classifica-se um
grupo de pessoas, essencialmente predefini-se classes baseado-se em valores de alguns atributos.
No caso de clusterização não é possível pré-definir classes. Ao invés disto, os clusters
(agrupamentos) são formados analisando-se os dados. Uma vez obtidos os clusters, cada um pode
ser examinado adicionalmente por alguma outra técnica como estimação (ANDRADE et al.,
2013a).
Uma das abordagens mais fundamentais para o entendimento e aprendizagem é a
organização de dados em grupos ou agrupamentos. Análise de Clusters ou Clusterização é um
estudo formal de métodos e algoritmos para um agrupamento natural ou clusterização de objetos de
acordo com suas características mensuradas ou intrínsecas de similaridade. As amostras
para agrupamento são representadas como um vetor de medições, ou mais formalmente, como
um ponto em um espaço multidimensional (KANTARDZIC, 2011). Amostras dentro de um cluster
válido são mais similares entre si do que são para amostras pertencentes a diferentes clusters.
O método de clusterização demonstra ser particularmente mais apropriado para a exploração
de interrelações entre amostras com intuito de realizar uma avaliação prévia da estrutura das
amostras.
A Clusterização é um problema complexo, uma vez que os dados podem revelar clusters
com diferentes formas e dimensões em um espaço n-dimensional de dados. Como complicador, o
número de clusters frequentemente depende da resolução na qual observa-se os dados.
23
A Figura 2 apresenta um exemplo de clusterização de pontos em um espaço Euclidiano de
duas dimensões. Considerando que o número de grupos não é previamente conhecido, a Figura 2b e
2c apresentam duas possíveis formação de clusters, a partir dos dados apresentados na Figura 2a.
Na Figura 2b tem-se três clusters formados, enquanto que na Figura 2c tem–se quatro clusters.
Nota-se que os clusters da Figura 2 podem ser reconhecidos visualmente. Contudo, isto se
torna impossível em um espaço Euclidiano de N-dimensões, havendo necessidade do uso de
algoritmos especiais para esta tarefa.
Figura 2 - Clusterização em espaço 2D. (a) Dados iniciais; (b) três clusters formados; (c) Quatro Clusters formados. Fonte: Kantardzic (2011).
Conforme pode ser observado na Figura 2, dependendo do algoritmo de clusterização
utilizado, ou seja, dependendo da metodologia utilizada para agrupar os dados, , o número de
clusters (agrupamentos) pode variar. No exemplo da Figura, poderia-se ter três ou quatro
agrupamentos diferentes para o mesmo conjunto de dados. Por isso, a escolha do algoritmo de
clusterização é fundamental para que os agrupamentos definidos sejam aderentes ao problema de
interesse.
Dos algoritmos de clusterização existentes na literatura, aplicados ao problema de
determinação de padrões de consumo de energia elétrica, destacam-se os algoritmos k-means e
follow-the-leader. Neste trabalho foram apresentados os resultados da aplicação do algoritmo k-
means nos dados medidos, gerando poucos e coerentes agrupamentos, em função dos perfis de
consumo dos respectivos consumidores.
2.1.4 O algoritmo de clusterização K-means
24
Os principais algoritmos utilizados para realizar a tarefa de clusterização, dentro de um
processo de mineração de dados são: Clusterização Hierárquica, clusterização K-means,
clusterização Fuzzy-Kmeans e Clusterização Follow the Leader. Neste trabalho, os clusters
(agrupamentos) serão formados utilizando o algoritmo K-means e em função dos perfis de consumo
dos consumidores, comerciais e industriais, considerados na amostra calculada. O algoritmo
clusterização particional K-means, ou simplesmente K-means é o algoritmo mais simples e também
o mais comumente utilizado, empregando o critério do erro-quadrático. Inicia-se com uma partição
aleatória e mantém a reatribuição das amostras aos clusters, baseados na similaridade entre amostras
e clusters até atingir o critério de convergência. Normalmente este critério é atingido quando não
ocorre mais atribuição de qualquer amostra de um cluster para outro que possa vir a causar um
decréscimo do erro-quadrático (KANTARDZIC, 2011).
A clusterização K-means agrupa os dados de perfil de carga pela determinação de certo
número de clusters e do ponto central de cada cluster. Após a determinação do ponto central, cada
conjunto de dados deve ser associado ao ponto central mais próximo, recalculando então o novo
ponto central. Isto será feito iterativamente até a estabilidade do ponto central.
A atribuição dos dados ao ponto central, avaliada usando correlação ou métricas como
Distância Euclidiana ou Distância de Hamming; automaticamente cria fronteiras entre cada
conjunto de dados. Cada conjunto de dados irá se tornar membro do cluster mais próximo após a
primeira iteração. A iteração seguinte tem apenas a função de atualizar a posição do ponto central.
Este método não cria uma estrutura em árvore para descrever os agrupamentos de dados,
criando apenas um nível de clusters. A Clusterização K-means utiliza observações reais de objetos
ou dados individuais, portanto é mais adequada para agrupamentos de grandes quantidades de
dados.
2.1.5 Exemplos de Aplicação na Literatura
Aplicações utilizando técnicas de Mineração de Dados e clusterização podem ser
encontradas na literatura, especialmente aquelas relativas à definição de padrões de consumo de
energia elétrica, a partir dos seus perfis de carga. A seguir, são descritos alguns exemplos.
25
Prahastono et al., (2008), demonstraram a utilização de clusterização para agrupamentos de
consumidores por perfis de carga, devido a uma nova legislação, a qual permite que diferentes
regiões tenham possibilidade de aplicar suas próprias regras tarifárias. Até então estas regras eram
desenvolvidas por meio de uso de tabelas com dados coletados ao longo dos anos. Estes dados
agrupavam os consumidores por variações em seu perfil de carga, como industriais, comerciais,
serviços públicos e residenciais. Um método de clusterização pode ser aplicado onde os tipos de
consumidores são conhecidos e, portanto, o número de classes pode ser previsto. Para este caso foi
utilizado o método Fuzzy k-means o qual, segundo os autores, se mostrou mais flexível frente a
outros métodos.
A determinação do perfil de carga de consumidores tem sido motivada pelos mais diversos
fatores, como, por exemplo, o enquadramento de consumidores em novas categorias de consumo.
Anuar e Zakaria (2010) apresentam uma abordagem sobre o tema, analisando validação da
clusterização pelo método Fuzzy k-means. Os autores focam na questão da determinação do número
ótimo de clusters, que é um aspecto importante da tarefa de clusterização de dados. Neste caso,
índices como Non-fuzzy, Xie-Beni e Davies e Bouldin são utilizados como exemplos de índices de
validação de clusters para determinar o número ótimo de clusters e examinar a capacidade da
técnica proposta.
Identificar aspectos que causam aumentos dos picos de consumo, desenvolvimento de
contratos específicos e otimização da oferta de energia elétrica motivaram a busca de técnicas de
mineração de dados para agrupar os consumidores em perfis de carga típicos. Neste sentido, Ramos
e Vale (2008) apresentam uma abordagem para o agrupamento de consumidores de média tensão.
Foram utilizados neste trabalho três diferentes algoritmos de clusterização para obter-se o diagrama
de carga representativo para cada consumidor, e sua performance foi comparada utilizando índices
de adequação MIA (Mean Index Adequacy) e CDI (Clustering Dispersion Indicator). O algoritmo
de clusterização escolhido foi capaz de produzir perfis de carga diferenciados. Neste caso, o
objetivo principal é definir planos tarifários a serem aplicados a cada classe de consumidores, a
partir do conhecimento dos seus padrões de consumo.
2.1.6 Regras de Associação
Uma das técnicas utilizadas para encontrar relacionamentos em bases de dados é a análise de
regras de associação. Esta técnica tem sido intensamente pesquisada e consiste em encontrar
26
correlações entre os dados minerados. Nesse sentido, a equipe de pesquisa do Projeto QUEST da
IBM desenvolveu o algoritmo APRIORI que foi introduzido por Agrawal e Srikant em 1994 dando
origem ao software Intelligent Miner (AGRAWAL & SRIKANT, 1994). O algoritmo APRIORI
analisa as regras de associação em uma base de dados, descobrindo e elegendo padrões verdadeiros
e eliminando padrões que ocorrem simplesmente ao acaso (ANDRADE et. al., 2013b). Utiliza
regras de associação do tipo: X→Y (X leva a Y) onde X e Y são conjuntos mutuamente exclusivos
de itens.
O conjunto de ítens que ocorre em uma transação é chamado de itemset. Os itemsets
utilizados neste caso são as linhas do banco de dados de respostas dos questionários aplicados nos
clientes.
O objetivo inicial do algoritmo APRIORI é encontrar todos os conjuntos de itens (itemsets)
que têm suporte acima do suporte mínimo (MinSup) (PESSANHA; LAURENCEL; SOUZA, 2004).
Dado o suporte mínimo MinSup como parâmetro de entrada, no primeiro passo do algoritmo
são encontrados os itens que aparecem ao menos numa fração das transações igual a Minsup. Este
conjunto é chamado L1, dos itens frequentes. O cálculo do suporte é dado por (1), obtida de
(PESSANHA; LAURENCEL; SOUZA, 2004):
Suporte = ú� ��� � ����������� �
ú� �������� � ������� (1)
Os pares dos itens em L1 se tornam pares candidatos C2 para o segundo passo do algoritmo.
Os pares em C2 cuja contagem alcançar Minsup são os pares frequentes L2.
As trincas candidatas C3 são aqueles conjuntos {A, B, C} tais que todos os {A, B}, {A, C} e
{B, C} estão em L2. No terceiro passo, a ocorrência das trincas em C3 é computada, sendo que
aquelas cuja contagem alcançar Minsup são as trincas frequentes, L3 (PESSANHA; LAURENCEL;
SOUZA, 2004).
O procedimento do passo anterior é repetido para tuplas de ordem mais elevada, até os
conjuntos se tornarem vazios. Li são os conjuntos frequentes de tamanho i; Ci+1 é o conjunto de
tamanho i+1 tal que cada subconjunto de tamanho i está em Li.
27
Após os conjuntos de itens serem encontrados, esses são utilizados para gerar as regras, com
confiança acima da confiança mínima (MinConf). A toda regra de associação X -> Y associamos
um grau de confiança, denotado por conf(X -> Y). Este grau de confiança é simplesmente a
porcentagem das transações que suportam Y dentre todas as transações que suportam X dado por
(2), obtida de (PESSANHA; LAURENCEL; SOUZA, 2004):
Confiança = ú� ��� � ����������� �
ú� ��� � ����������� (2)
A confiança mede a confiabilidade da inferência feita por uma regra. Para uma determinada
regra X→Y, quanto maior a confiança, maior a probabilidade de que Y esteja presente em
transações que contenham X.
No caso particular deste trabalho, os antecedentes das regras de associação são os padrões
observados nos resultados obtidos dos questionários aplicados nos consumidores de interesse;
enquanto que os consequente das regras de associação são as tipologias ou clusters resultantes
obtidos da etapa de clusterização, envolvendo os perfis de cargas dos consumidores industriais.
Para este trabalho utilizou-se o software TANAGRA desenvolvido por Ricco Rakotomalala
da Universidade de Lumière Lyon 2, na França. Com ele é possível trabalhar com diversos
algoritmos para classificação e regras de associação (PESSANHA; LAURENCEL; SOUZA, 2004).
Foi escolhido por ser um de mineração de dados gratuito para fins acadêmicos e de pesquisa.
Propõe um conjunto de métodos de Mineração de Dados a partir da análise exploratória de dados,
aprendizagem estatística, aprendizado de máquina na área de bancos de dados.
Para trabalhar com as regras de associação, a função escolhida foi a SPV (Supervised
Association Generator), uma variação do algoritmo apriori que utiliza regra por indução
supervisionada. A representação das regras segue o mesmo princípio do algortimo apriori: “Se
premissa, então conclusão”.
Dentre os métodos de regras por indução, utilizados pela SPV do Tanagra, o “dividir para
conquistar”, muito utilizado na década de 90, apresenta vantagens se comparado com outros
métodos de acordo com (PESSANHA; LAURENCEL; SOUZA, 2004).
28
Basicamente, o algoritmo dividir para conquistar baseia-se no princípio da cobertura
sequencial: defini-se uma regra que prevê com certa precisão um valor do atributo alvo; retiram-se
então os exemplos que atendam a regra da base de dados e continua-se o processo iterativo até que
toda a base de dados de treinamento seja pesquisada.
No exemplo apresentado em (LI et. al., 2007) é possível verificar o funcionamento do
método utilizado e a comparação com variações dos algoritmos que implementam o método dividir
para conquistar, bem como outros softwares que trabalham com Mineração de Dados.
Neste trabalho, foi implementado técnicas de classificação para as tipologias identificadas na
indústria e comércio de Joinville e Florianópolis. A partir de um conjunto de regras de associação
mínimo e otimizado, foi realizada a tarefa de indução de regras visando a melhor precisão na
previsão das tipologias.
2.2 PREVISÃO DE CONSUMO DE ENERGIA ELÉTRICA
2.2.1 O Problema de Previsão
O conhecimento prévio do valor de uma variável futura é extremamente importante em
muitas áreas de conhecimento. Na meteorologia, por exemplo, a previsão de precipitação, vento,
radiação solar, umidade, etc; exercem um papel importante no planejamento agrícola e prevenção
de desastres naturais. Essa previsão também é importante na política energética e baseada no nível
das bacias hidrográficas que dependem da quantidade de precipitação que irá ocorrer futuramente.
A previsão da temperatura e da radiação solar, por sua vez, pode determinar a capacidade de carga
no cabo condutor (ampacidade) de uma linha de transmissão de energia elétrica. Por outro lado,
técnicas para prever a demanda por produtos e serviços são utilizadas na indústria a fim de realizar
o planejamento e controle da produção.
Neste contexto diversos sistemas de apoio à decisão foram desenvolvidos a fim de realizar a
previsão de fatos e situações futuras. Estes sistemas podem ser classificados em métodos
quantitativos e qualitativos. Os qualitativos são métodos analíticos, chamados de métodos de
predição e são baseados no julgamento, intuição, entrevistas com especialistas a fim de criar
cenários futuros. Já os métodos quantitativos realizam a previsão por meio da extrapolação da
análise do comportamento de dados históricos. Estes últimos são divididos em análise de series
29
temporais (modelos ARMA, ARIMA) e modelos causais como a regressão dinâmica, por exemplo.
Nesse trabalho abordou-se os métodos quantitativos de previsão que incluem análise de séries
temporais e redes neurais artificiais.
2.2.2 Previsão de Séries Temporais
Uma série temporal é definida como sendo um conjunto de observações realizadas durante
um período de tempo. Esse período pode ser horário, diário, mensal, anual, etc. Porém, para realizar
a previsão dos valores futuros de séries temporais não basta apenas obter os dados. É necessário
também a utilização de técnicas estatísticas e algoritmos para a análise de séries temporais, como as
RNA.
O objetivo maior da análise das séries temporais consiste em analisar a evolução de
determinado evento estatístico, variável no tempo, de modo a permitir a criação de modelos
matemáticos simplificados que permitam realizar inferências sobre o comportamento futuro do
evento em análise. Utilizam basicamente dois modelos: análise no domínio do tempo, que tem sua
origem na teoria da correlação o que levou a construção de modelos estruturais ou paramétricos
como o modelo auto-regressivo integrado de média móvel (ARIMA) descrito pelos estatísticos
Geoge Box e Gwilym Jekins em 1976; e análise no domínio da frequência, um método de analise
espectral que é uma extensão dos métodos de análise de Fourier (BOX, 1994).
Alguns exemplos de métodos utilizados na previsão de séries temporais são:
Modelos de Suavização Exponencial: utilizado por Chan et al. (2012) em conjunto com
algoritmo Levenberg-Marquardt para treinamento de uma RNA na previsão de fluxo de tráfico de
uma auto estrada da Austrália;
Modelos auto-regressivos (AR): o modelo auto-regressivo puro é utilizado no trabalho de
Hill et al.(2012), onde é estudado o impacto da força do vento em sistemas de energia elétrica;
Modelos ARIMA: é uma extensão do modelo AR puro. Areekul et al. (2010) faz uso de
ARIMA e RNA para previsão de curto prazo do preço da eletricidade no mercado australiano.
30
Outras tecnologias computacionais como lógica nebulosa (fuzzy) e sistemas neuro-fuzzy têm
sido utilizadas em sistemas de previsão. As RNA, foco deste estudo, são apresentadas na seção 2.3
deste trabalho.
2.2.3 Previsão de Consumo de Energia Elétrica
Pode-se observar, em pesquisas nas principais bases de artigos científicos como IEEE e
Elsevier, o vasto uso de técnicas de previsão de séries temporais na previsão de carga em sistemas
de energia elétrica. Atualmente o uso de redes neurais artificiais tem sido o mais encontrado para a
previsão de carga em sistemas de energia, de acordo com revisão bibliográfica realizada. Nas
últimas décadas, a utilização de técnicas de RNA para previsão de curto prazo da demanda de
energia elétrica tornou-se uma realidade. Essa popularidade é decorrência das redes neurais
possuírem capacidade de aprender com o passado, abstrair o conhecimento e generalizar novos
resultados. O uso das redes MLP ainda é um dos mais encontrados na previsão de carga de curto e
médio prazo, por sua facilidade de implementação e vasta documentação.
A proposta deste trabalho é a construção de uma rede neural por atividade econômica CNAE
selecionada. Os dados de entrada serão variáveis econômicas (variação do dólar, taxa de juros, etc)
e dados históricos de consumo disponibilizados pela Celesc.
Neste trabalho foram estudadas as arquiteturas de rede MLP e RBF e os erros (MAPE) serão
comparados com a finalidade de escolher a configuração de rede neural mais eficiente para atender
aos objetivos de pesquisa.
2.3 REDES NEURAIS ARTIFICIAIS
2.3.1 Conceitos Básicos
As redes neurais artificiais são uma tentativa de representar computacionalmente a
complexidade do cérebro humano que executa o pensamento de forma não linear e paralela. O
cérebro tem a capacidade de organizar suas unidades estruturais, conhecidas como neurônios, de
maneira que esses solucionem problemas muito mais rápido que os computadores atualmente
existentes (HAYKIN, 2001). Esses problemas podem ser reconhecimento de padrões, previsão a
partir de dados históricos, etc.
31
Um dos resultados dos estudos de neurociência foi o levantamento da hipótese de que a
atividade mental é basicamente composta por atividades eletroquímicas em redes de células
cerebrais chamadas neurônios. Inspirados nessa hipótese os primeiros trabalhos em Inteligência
artificial tinham por objetivo a criação de redes neurais artificiais. Nesse contexto, em 1943,
McCullock and Pitts conceberam um modelo matemático simples de neurônio que é “ativado”
quando uma combinação de entradas atinge um certo limiar (threshold) (RUSSEL, NORVIG, 2010)
O neurônio é a unidade de processamento de uma rede neural. O modelo neuronal é
composto dos seguintes elementos: um conjunto de links de conexões (sinapses) caracterizado por
seus pesos, um somador para os sinais de entrada ponderados pelos pesos das sinapses e uma
função de ativação para limitar a amplitude de saída do neurônio. A Figura 3 apresenta o modelo
não linear de neurônio:
Figura 3 -Modelo não linear de neurônio.
Fonte: Adaptado de Haykin (2001).
A saída de um neurônio é geralmente expressa no intervalo entre 0 e 1. O fator bk (Bias)
produz o efeito de aumentar ou diminuir a entrada para a função de ativação.
O neurônio pode ser definido matematicamente por duas expressões:
32
j
m
j
kjk XWu ∑=
=1
(3)
A Equação 3 que representa o somatório das entradas Xj ponderadas pelos seus pesos Wkj, e
a Equação 4:
)( kkk buy += ϕ (4)
Que representa a saída yk da rede.
2.3.2 Funcionamento Básico e Principais Topologias de RNA
Uma rede neural é composta por unidades (nodos ou neurônios) conectadas diretamente por
links. As unidades são compostas por funções de ativação que quando ativadas propagam a ativação
de uma unidade à outra. Cada link tem um peso que determina a força e o sinal da conexão.
De forma simplificada, o funcionamento da rede neural ocorre da seguinte forma: cada
unidade é inicializada com valores para a função de ativação e para o peso. Inicialmente, cada
unidade computa a soma dos pesos de entrada. Então é aplicada uma função de ativação para essas
somas a fim de derivar as saídas.
A principal função de ativação utilizada é a Função sigmoidal. De acordo com Haykin
(2001), essa é a função mais comumente usada nos projetos de neurônios para redes neurais. Ela é
uma função estritamente crescente que representa o equilíbrio do comportamento não linear e
linear. Um exemplo de função sigmoidal é a função logística, definida pela equação 5.
( ))exp(1/1)( υυϕ a−+=
(5)
33
Para a função sigmoidal, α é o parâmetro de declive, que pode acentuar mais ou menos a
inclinação da função. Diferente das funções degrau (threshold functions) que assumem valores de 0
ou 1, as funções sigmoidais podem assumir valores contínuos entre 0 e 1. São funções
diferenciáveis, pois a derivada de uma função sigmoidal é praticamente a mesma da equação
original. Este é um fator importante para as redes neurais artificiais, especialmente na etapa de
treinamento.
A forma como os neurônios estão estruturados está diretamente ligada com o algoritmo de
aprendizado que será usado para treinar a rede. Os algoritmos de treinamento devem ser escolhidos
de acordo com a arquitetura da rede utilizada.
A topologia, a forma como os neurônios se conectam para formar uma rede de neurônios,
pode ser de direta (Feedforward) ou de redes recorrentes (Feedback) (RUSSEL; NORVIG, 2010).
A Singlelayer Feedforward Network é uma rede de apenas uma camada e utiliza conexões
somente em uma direção. A função de ativação do neurônio depende apenas da entrada corrente
tendo como único estado armazenado o peso do neurônio. O sinal de entrada é transmitido da
entrada para a saída. Já na topologia Multilayer Feedforward Network o sinal de entrada é
transmitido camada a camada até atingir a camada de saída.
Redes recorrentes (Recurrent Network) retornam a saída da rede para a sua entrada. A
resposta da rede para uma dada entrada depende do seu estado inicial, que depende das entradas
anteriores. Devido ao retorno dos dados de saída essas ligações suportam memória de curto prazo.
No caso de previsão de séries temporais, basicamente tem-se destacado na literatura dois
tipos de redes neurais: redes MLP e RBF, as quais serão descritas a seguir.
2.3.3 Rede MLP (Multilayer Perceptron)
O Perceptron foi a primeira proposta de rede neural artificial, criada por Frank Rosenblatt na
Universidade de Cornell em 1958. Com relação ao perceptron, em 1969 Marvin Minsky e Seymour
Papert publicaram o livro Perceptrons: na introduction to computational geometry, no qual
analisaram matematicamente o modelo formal do perceptron e demonstraram que as redes de uma
camada, como o perceptron, somente são capazes de resolver problemas que sejam linearmente
34
separáveis. Esta limitação foi contornada posteriormente com a utilização de perceptron multi-
camadas e funções de ativação não lineares (RUSSEL; NORVIG, 2010).
No ano de 1986, Rumelhart, Hinton e Williams desenvolveram o algoritmo de treinamento
de RNA backpropagation e mostraram que é possível e eficiente o treinamento de RNA, utilizando-
se redes com camadas intermediárias, dando origem ao mais utilizado modelo de Rede Neural
Artificial, a rede MulitlayerPercetron (MLP) (RUSSEL; NORVIG, 2010).
O algoritmo backpropagation consiste na retro-propagação do erro a fim de ajustar os pesos
das conexões (pesos sinápticos) das unidades das camadas internas da Rede, utilizando-se a regra
delta generalizada. Este algoritmo pode ser considerado como uma generalização do algoritmo
Least Mean Square (LMS), desenvolvido por Bernard Widrow.
De forma resumida, o algoritmo backpropagation pode ser descrito como (HAYKIN, 2001):
1- Inicialização: inicializar os pesos sinápticos e os bias aleatoriamente, com valores no
intervalo [-1;1];
2- Apresentação dos Exemplos de Treinamento (pares de entrada-saida): treinamento "on-
line": para cada exemplo do conjunto de treinamento, efetuar os passos 3 e 4; treinamento "em
lote": para cada "época" do conjunto de treinamento, efetuar os passos 3 e 4.
3- Computação para Frente (Propagação): Depois de apresentado o exemplo do conjunto de
treinamento T = {(x(n),d(n)}, sendo x(n) a entrada apresentada à rede e d(n) a saída desejada,
calcular o valor da ativação vj e a saída para cada unidade da rede, com a equação 6:
bxwv i
m
i
jij +=∑=1
(6)
para o cálculo do valor da ativação, e equação 7:
( )( )avevf −+= 1/1)( (7)
35
( )jj OO −1
kδ
para o cálculo da saída y da unidade k, utilizando a função sigmoidal, como no exemplo, ou
uma outra função de ativação desejada.
Utilize a saída das unidades de uma camada como entradas para a seguinte, até a última
camada. A saída das unidades da última camada será a resposta da rede.
4- Calcule o Sinal de Erro: Fazendo a saída yj = Oj(n), será Oj(n) a resposta da rede, calcule
o sinal de erro através da equação 8:
( ) ( ) ( )nOndne jjj −= (8)
onde ( )nd j é a saída desejada com resposta para cada unidade na interação (n).
Este sinal de erro será utilizado para computar os valores dos erros das camadas anteriores
e fazer as correções necessárias nos pesos sinápticos.
5- Computação para Trás ( Retropropagação ): calcular os erros locais, d, para cada unidade,
desde a camada de saída até a de entrada. O gradiente local é definido pela equação 9:
( ) ( ) ( ) ( )( )nOnOnen jjjj −= 1δ (9)
para a unidade da camada de saída, ou pela equação 10:
( ) ( ) ( )( )jkkjjj wnOnOn ∑−= δδ 1 (10)
para as unidades das demais camadas.
Onde:
- é a função de ativação diferenciada em função do argumento, i.e., valor de ativação;
- é o erro das unidades da camada anterior conectadas a unidade j;
jkw
36
- são os pesos das conexões com a camada anterior.
Após o cálculo dos erros de cada unidade, calcule o ajuste dos pesos de cada conexão segundo a
regra delta generalizada e atualizar os pesos, conforme equação 11, para o cálculo dos ajustes dos
pesos:
( ) ( ) jjkjkj ynnwnw δα +=+∆ 1 (11)
Faça:
( ) ( ) ( )nwnwnw kj∆+=+1 (12)
para atualizar os pesos sinápticos
Onde:
α - é a constante de momentun, quando a= 0, esta função funciona como a regra delta
comum;
η - é a taxa de aprendizado;
δj - é o erro da unidade;
yj - é a saída produzida pela unidade j;
6- Interação: Refaça os itens 3, 4 e 5 referentes à propagação, cálculo do erro e
retropropagação, apresentando outros estímulos de entrada, até que sejam satisfeitas as condições de
treinamento; as quais podem ser: o erro da rede está baixo, sendo pouco alterado durante o
treinamento (erro estabilizado) ou o número máximo de ciclos de treinamento foi alcançado.
As redes MLP podem apresentar problemas com mínimos locais: pontos na superfície que
apresentam uma solução estável, mas não é a correta. Existem algumas técnicas para correção desse
problema e a mais utilizada é a adição do termo momentum.
37
2.3.4 Rede RBF (Radial Basis function)
Este tipo de rede neural foi idealizada por Broomhed e Lowe em 1988 e sofreu colaborações
no ano de 1989 de Moody e Darken e Renal e no ano de 1990 por Poggio e Girosi (TODESCO,
1995).
Em sua concepção básica, a rede RBF apresenta 3 camadas: a de entrada, uma camada
intermediária e uma camada de saída. Os neurônios da camada intermediária são chamados de
funções de base radial, Diferentemente das redes MLP, a rede RBF utiliza, em geral, funções de
aproximação através de função gaussiana. Porém, pode-se utilizar vários outros tipos de funções,
como a de base multiquadrática, por exemplo.
A camada escondida utiliza funções de base radiais não lineares da distancia entre o vetor de
entrada e um vetor de referencias, o vetor peso w. Na Figura 4 (ANDRADE, 2009), a distancia
entre o vetor de entrada(x) e o vetor de pesos(w) é representado por ||dist||. A multiplicação desse
produto escalar com o bias (b) representa o sinal de saída que será avaliado pela função de
transferência.
Figura 4 - Representação do Neurônio de Base Radial. Fonte: Andrade (2009).
A função de transferência produz uma resposta significativa, diferente de zero, somente
quando o padrão de entrada está dentro de uma região pequena localizada no espaço de entrada.
38
A última camada, a camada de saída, forma uma combinação linear das funções de base
radial calculados pela camada intermediária, transformando o espaço vetorial interno em uma saída
linear.
O treinamento de uma RBF é feito em 2 passos: determinação dos parâmetros da função de
base na procura pelo centro da rede para a unidade da camada escondida. O método de clusterização
k-means é o mais utilizado para o encontro do centro. O segundo passo é o encontro dos pesos da
camada de saída.
2.4 CONSIDERAÇÕES FINAIS
Neste capítulo foram estudadas as técnicas knowledge-discovery in databases, mais
especificamente a tarefa de mineração de dados e a aplicação do algoritmo K-means que foram
aplicados na etapa de clusterização a fim de encontrar os perfis para as curvas diárias dos
consumidores da indústria e comércio.
A revisão das técnicas e aplicação de regras de associação foi importante nas tarefas de
classificação, pois permitiu conhecer mais a fundo o algoritmo SPV que foi utilizado no software
Tanagra em conjunto com as respostas do questionário, determinando assim as regras para novos
clientes que não possuem dados de medição.
Na revisão de redes neurais pode-se observar que a topologia MLP é a mais simples de
implementar e, pela revisão do capítulo 3, a mais utilizada em previsões de curto e médio prazo em
sistemas de energia. A revisão apresenta também um resumo sobre a previsão de séries temporais.
No capítulo 3 é explorada a revisão de aplicações de previsão de séries temporais no
problema de previsão de consumo em sistemas de energia.
39
3 METODOS DE PREVISÃO PARA SISTEMAS DE ENERGIA ELÉTRICA
3.1 INTRODUÇÃO
A dinâmica no aumento do consumo de energia elétrica devido principalmente a aspectos
econômicos e sociais tornaram necessário o uso de técnicas eficientes de previsão de demanda. Para
realizar a previsão dos valores futuros de séries temporais em geral, além da obtenção de dados de
séries passadas é necessário usualmente a utilização de técnicas estatísticas e algoritmos baseados
em Redes Neurais Artificiais (RNA).
Nos anos 50 e 60 as técnicas para previsão de séries temporais mais utilizadas eram técnicas
simples como a extrapolação, por exemplo. Essas técnicas eram eficientes devido a tendência de
aumento na densidade geográfica previsível e a estabilidade dos preços e do consumo (Romero;
Hernandez; Lopez, 2011].
Atualmente, o entendimento da dinâmica do comportamento do consumo de energia em
função das variáveis climáticas, econômicas e sociais é fundamental para que as empresas de
distribuição possam realizar estudos de previsão do crescimento da demanda com maior
acuracidade, melhorando assim o planejamento e a operação do seu sistema.
Modelos estatísticos como regressão linear, regressão multipla linear (MLR) e modelos
auto-regressivos combinados com média móvel (ARIMA) tem sido bastante utilizados. Estes
métodos são focados no uso de dados históricos (Bunnoon; Chalermyanont; Limsakul, 2012).
Recentemente, o uso de lógica fuzzy, algoritmos genéticos e RNA têm sido os mais utilizados na
previsão do consumo de energia elétrica.
Neste contexto realizou-se uma revisão bibliográfica a fim de identificar os estudos
realizados desde 2008, relacionados à previsão de demanda de consumo de energia elétrica, os quais
tenham maior aderência com o trabalho atual. Para a revisão dos anos anteriores à 2008 foram
utilizadas às referências apontadas por (Andrade, 2009). O principal foco será a aplicação RNA
com horizonte de previsão de médio prazo, ou seja, previsão de um a três meses à frente
considerando o consumo médio mensal. Foram pesquisados trabalhos nas bases de conhecimento
40
do IEEE, Elsevier e IET. As palavras chave foram: time series forecasting, load forecasting e
artificial neural network(ANN).
A partir da década de 90 os modelos de previsão utilizando (RNA) tornaram-se mais
populares, devido principalmente à facilidade de trabalhar com modelos não lineares e permitirem a
inserção de variáveis econômicas e climáticas no auxilio á previsão.
3.2 PREVISÃO EM SISTEMAS DE ENERGIA ELÉTRICA.
Para a previsão de consumo de energia elétrica não existe consenso com respeito ao
horizonte de previsão. Alguns autores dividem em previsão de muito curto-prazo (de um minuto a
uma hora), previsão de curto-prazo (de uma hora a três meses), previsão de médio prazo (de três
meses a três anos) e previsão de longo-prazo (de 3 anos a 5 anos) (Amjady; Keynia; Farshid, 2008).
Outros autores adotam a classificação em três tipos: previsão de curto prazo (a partir de um
dia), previsão de médio-prazo (mais de um dia a um ano) e previsão de longo-prazo (de um a mais
de dez anos) (Paparoditis; Sapatinas, 2013) (Amjady; Keynia; Farshid, 2008).
Em (Amjady, 2007) e (Amjady, 2001) a previsão é considerada de curto prazo quando o
passo é de uma fração de hora até uma hora e o horizonte de previsão de até uma semana à frente.
Para previsão de longo prazo é comum encontrarmos autores que consideram a discretização
de um ano e horizonte de previsão de muitos anos à frente, até dez anos (Shakouri; Rastad;
Nazarzadeh, 2006) (Kandil; El-Debeiky; Hasanien, 2002).
Com a previsão de médio prazo, existem na literatura diferentes classificações. Alguns
autores consideram a discretização de um ano e horizonte de poucos anos a frente (Tsekouras;
Hatziargyriou; Dialynas, 2006). Outros consideram a discretização mensal e horizonte de mais de
doze meses à frente (Ghiassi; Zimbra; Saidane, 2006) (Mirasgedis et al., 2006). Em ([Gonzalez-
Romera; Jaramillo-Moran; Carmona-Fernandez, 2006), foi adotado o passo mensal (discretização
mensal) e horizonte de um mês à frente para adotar a classificação de previsão de médio prazo.
No entanto, a maioria dos trabalhos publicados foca na previsão de curtíssimo e curto-prazo,
([Nose-Filho; Lotufo; Minussi, 2011b) (Yun et al., 2008) (Santana et al., 2012) (Tripathi;
41
Upadhyay; Singh, 2008) (Changhao; Jian; McMenemy, 2010) e previsão de longo-prazo (Yona et
al., 2013) (Ghelardoni; Ghio; Anguita, 2013).
3.3 TRABALHOS UTILIZANDO RNA
Conforme já citado anteriormente, a pesquisa foi realizada nas bases de conhecimento do
IEEE, Elsevier e IET, com as palavras chave time series forecast, load forecasting e artificial neural
network(ANN), considerando as publicações de 2008 até data atual e revisão realizada por
Andrade (2009).
O trabalho (Amjady; Keynia; Farshid, 2008) utiliza previsão de consumo de energia elétrica
de médio prazo com horizonte de previsão diário, até um mês à frente com discretização diária
(previsão de pico diário). Foi proposto um método híbrido composto por redes neurais e algoritmos
evolucionários para a previsão de máximo consumo diário de energia obtendo resultados melhores
que comparados com o modelo utilizando somente redes neurais. Foram utilizados apenas dados
históricos como entrada para a rede. Uma etapa antes da previsão foi utilizada para fazer a seleção
das variáveis de entrada (dados de pico de consumo diário) com maior correlação linear com a
saída desejada (pico de carga do próximo dia) e também as variáveis de entrada com maior grau de
independência linear, levando em conta o calendário e dias similares. O algoritmo utilizado para
treinamento foi o levenberg-marquardt e 35 iterações. O resultado obtido foi um MAPE (mean
absolut percentage error) de 1.6% para os dados testados.
No estudo de (Yun et al., 2008), redes RBF e ANFIS (inferência fuzzy adaptativa) foram
aplicadas para previsão de curto prazo do consumo de energia elétrica, levando em consideração a
variação do preço da energia elétrica do mercado australiano. Foram construídas 48 redes neurais,
uma para cada meia hora do dia. Cada rede RBF fez a previsão de carga considerando apenas os
dados históricos de consumo de energia e os dados de temperatura. Ao todo foram utilizadas 12
variáveis de entrada. O horizonte de previsão foi diário, um mês à frente. Foram utilizados os dados
de junho a julho de 2004 para treino e agosto de 2004 para teste.
No ano de 2010 o artigo (Changhao; Jian; McMenemy, 2010) apresenta o uso de redes
neurais com a finalidade de estabelecer uma rede neural artificial estável e precisa utilizando a
técnica de instrumentos virtuais. A técnica consiste na obtenção de múltiplos tipos de resultados de
previsão (figuras, curvas, gráficos) para compor um banco de dados que auxilie o operador na
42
escolha de diferentes períodos de previsão e diferentes variáveis de acordo com o problema,
escolhendo assim a melhor rede. Na previsão de curto prazo foram utilizados dados históricos de
carga e dados de clima como velocidade do vento, precipitação, pressão atmosférica, temperatura
máxima e mínima, umidade e dia da semana.
Neste trabalho, foi adotado como entradas a carga horária de 21 dias e o horizonte de
previsão foi o 22º dia. As redes testadas foram: MLP (multi-layer perceptron), RBF (radial basis
function) e GRNN (general regression neural network). A melhor topologia das redes encontrada
foi de 14 neurônios na entrada, cinco neurônios na camada escondida e um neurônio na saída. Para
MLP o algoritmo de treinamento foi o levenberg-marquardt com função de ativação sigmoidal na
camada intermediária e função linear na saída. Foram utilizadas 50 épocas no treinamento e um erro
de 0,0001 como critério de parada. Para GRNN e RBF o único parâmetro ajustado foi o spread com
valores de 0,4 e 5 respectivamente. Os resultados foram expressos em MAPE com valores de 2,56%
para MLP, 2,38% para GRNN e 2,13% para RBF.
Ainda em 2010 o artigo (Pandey; Singh; Sinha, 2010) apresenta um modelo utilizando
wavelets na fase de pré-processamento e redes RBF na previsão de curto prazo. Os autores fazem
uma comparação com técnicas estatísticas convencionais e redes neurais com lógica fuzzy. Os
resultados com wavelets e RBF foram melhores que nos outros modelos comparados. Os horizontes
de previsão foram de 24 horas e 168 horas à frente. Os MAPEs foram de 1,03 % para a previsão de
24 horas e 0,99 % para previsão de 168 horas.
Em (Romero; Hernandez; Lopez, 2011) é apresentado a previsão de médio-prazo da
demanda máxima mensal de consumo de energia elétrica em uma subestação da comissão federal
de eletricidade da Grécia. Foi utilizada uma rede MLP de cinco camadas, com um neurônio na
entrada, dois neurônios na primeira camada escondida, 16 neurônios na segunda camada escondida,
12 neurônios na terceira camada escondida e um neurônio na camada de saída. As funções de
ativação utilizadas foram: tangente na entrada, sigmoidal nas camadas intermediárias e linear na
saída. O passo utilizado foi mensal e o horizonte de previsão foi os próximos seis meses. Os
resultados foram expressos em erro absoluto no artigo e calculando o MAPE obtive-se o valor de
3,3021%.
Em 2011 foram apresentados 2 artigos dos mesmos autores, um sendo sequência do outro
([Nose-Filho; Lotufo; Minussi, 2011a) e (Nose-Filho; Lotufo; Minussi, 2011b). A rede utilizada foi
43
a GRNN que é adequada para previsão de curto prazo e já apresentou exemplos de aplicações em
(Tripathi; Upadhyay; Singh, 2008) e (Changhao; Jian; McMenemy, 2010]). No artigo (Nose-Filho;
Lotufo; Minussi, 2011a) é realizada uma preparação de dados de entrada com filtros de média
móvel e redes neurais de regressão geral (grnn) para retirada de ruídos dos dados e assim prosseguir
com a previsão de acordo com o trabalho ([Nose-Filho; Lotufo; Minussi, 2011b). Os testes foram
realizados com dados de carga de 9 subestações da Nova Zelândia, de meia em meia hora. Primeiro
utilizou-se para treinamento os dados do ano de 2008 de uma única subestação para depois fazer de
todas. Os autores utilizaram a função NEWGRNN do matlab com os parâmetros de treinamento:
spread=0.1 e erro de tolerância de 30%. As saídas do pré procesamento obtiveram dados filtrados
com uma redução de ruído de 40%.
Dando continuidade ao trabalho (Nose-Filho; Lotufo; Minussi, 2011a), o artigo (Nose-Filho;
Lotufo; Minussi, 2011b) utiliza os dados pré-processados como entrada para a previsão. Foram
utilizadas duas etapas para previsão de uma rede de distribuição de energia. Na primeira etapa a
previsão é feita em cada nó da rede individualmente para, numa segunda etapa, realizar a previsão
da rede toda. A estrutura da GRNN foi de 4 camadas: 1 entrada, 2 intermediárias e 1 saída. Os
dados utilizados foram de janeiro de 2007 à março de 2009 com as informações de: Mês, Dia da
semana, Flag de horário de verão, Flag de final de semana, Média da Carga do dia anterior, Máxima
Carga do dia anterior, Mínima Carga do dia anterior. O horizonte de previsão foi de 1 dia à frente.
Foram testados 9 dias de 2009, incluindo uma semana normal e dois dias de final de semana. Como
resultado foi obtido um MAPE de 3.30% para a previsão global, ou seja, das 9 subestações.
Utilizando transformações wavelets no estágio de pré-processamento dos dados e uma rede
neural, os autores de (Bunnoon; Chalermyanont; Limsakul, 2012) apresentaram um trabalho que
realiza a previsão de médio prazo para previsão de demanda de energia elétrica. As transformações
wavelets foram utilizadas para decompor o sinal original em componentes aproximados e assim
atenuar as variações da série original. Após esse pré-processamento foi utilizada uma RNA do tipo
MLP de três camadas na previsão de demanda. Os dados foram adquiridos do sistema de energia da
Tailândia dos anos de 1997 a 2007. O treinamento foi realizado com os dados de 1997 até 2003 e os
testes com os dados de 2004 a 2007. A discretização foi mensal e o horizonte de previsão foi de
quatro anos, mês a mês. Como entrada, além dos dados históricos utilizou-se um fator de
temperatura e outro econômico, não especificado no artigo. O trabalho obteve um MAPE de 2.25%.
44
3.4 ANÁLISE TRABALHOS CORRELATOS
O Quadro 2 apresenta os artigos encontrados que utilizam RNA como modelo de previsão e
que são mais aderentescom o foco deste estudo:
Quadro 2 – Artigos Selecionados
artigo 1 Amjady, N.; Keynia, Farshid. (2008)
artigo 2 YUN et al., 2008
artigo 3 Changhao, Jian, McMenemy 2010
artigo 4 Pandey, Singh, Sinha 2010
artigo 5 Romero, Hernandez, Lopez 2011
artigo 6 Nose-Filho, Lotufo, Minussi 2011b
artigo 7 Bunnoon, Chalermyanont, Limsakul 2012 Fonte: Elaborado pelo Autor
No Quadro 3 é possível verificar a comparação entre os artigos: Quadro 3 - Comparativo dos Artigos
Método
de Previsão
Quanti-dade
de Dados
Topolo-gia
de Rede
Funções de
Ativação
Variáveis de
Entrada Passo
Horizon-te de
Previsão MAPE
MAE Máximo
artigo 1
MLP 3 anos pico
diário
3 camadas
N/A
consumo máximo diário flag
feriado: 0 ou 1
diário
diário, 1 mês à frente
agosto de 1999
0,016 N/A
artigo 2
RBF
Treina-mento junho e julho
previsão
agosto de 2004
3 camadas
gaussiana
dados históricos
12 variáveis
com diferentes
defasa-gens
diário
diário, 1 mês à frente
agosto de 2004
0,0167 0,0455
45
artigo 3
MLP RBF
GRNN
carga horária de 21 dias
3 camadas 14:5:1
MLP - sigmoidal
RBF - gaussiana GRNN - gaussiana
dados históricos clima (12 variáveis)
dia da semana
diário 22 dias
MLP 2,56% GRNN 2,38% RBF
2,13%
MLP 6,30% GRNN 8,63% RBF
6,44%
artigo 4
RBF
25 à 31 janeiro 17 à 23 maio
19 à 25 julho
3 camadas
gaussiana
Tempera-tura
dados históricos
carga
Horá-rio
24 horas e
168 horas à frente
24 horas - 1.0331
% 168
horas - 0.9895
%
N/A
artigo 5
MLP
janeiro de 1994
à dezemb
ro de 2006
5 camadas 1:2:16:1
2:1
Tangente Sigmoidal
Linear
dados históricos
carga mensal
Men-sal
mensal próximos 6 meses
0,033 0,0426
artigo 6
GRNN
janeiro de 2007
à março
de 2009
4 camadas
N/A
Mês, Dia da
semana, Flag de
horário de verão, Flag de final de semana, Carga do
dia anterior (Média,
máxima e mínima)
diário
1 dia à frente -
9 dias de 2009
0,033 0,0776
artigo 7
MLP
Treina-mento 1997 até
2003 testes 2004 à 2007
3 camadas
N/A dados
históricos mensal
Men-sal
mensal - 4 anos à frente
0,0225 N/A
Fonte: Elaborado pelo Autor.
46
3.5 CONSIDERAÇÕES FINAIS
O foco desta revisão foi a previsão de demanda de consumo de energia elétrica. Os
interesses principais foram: encontrar trabalhos que apresentem uma segregação entre consumidores
industriais, comerciais e residenciais; previsão de montante de consumo mensal; utilização de RNA
na previsão.
Pela tabela comparativa (quadro 3) podemos observar que os artigos 5 e 7 são os que mais se
aproximam do interesse em questão. Possuem discretização mensal e horizonte de previsão mensal
ou anual. O primeiro realiza a previsão para seis meses à frente e o segundo, quatro anos.
Em ambos estudos, é observado que o pré-processamento dos dados é essencial. A maioria
dos modelos híbridos utiliza essa técnica, separando o processo de filtragem dos dados para assim
realizar a previsão. Em geral, para previsões de médio prazo as técnicas para obter séries históricas
de consumo estacionárias são aplicações de filtros, como de média-móvel (Romero; Hernandez;
Lopez, 2011) ou trabalhar com a variação do consumo em relação ao mês anterior.
Para a topologia das redes, observa-se o uso de redes RBF e GRNN em previsões de
curtíssimo e curto prazos. Para previsão de médio e longo prazo a rede utilizada, em geral foi MLP
com algoritmo de treinamento Levenberg-Marquardt (Bunnoon; Chalermyanont; Limsakul, 2012).
Em geral utilizam-se redes de três camadas, no máximo quatro camadas, pois o aumento de
camadas aumenta a complexidade e o tempo de treinamento das redes. Além disso, para a
construção de um método de previsão com redes neurais é comum começar o modelo com MLP
devido a sua flexibilidade com a predição não linear e sua implementação simples (Amjady;
Keynia; Farshid, 2008).
Quanto às variáveis de entrada, não foram consideradas variáveis econômicas como
entradas, pois estas são úteis quando se trabalha com os tipos de consumidores considerados de
forma desagregada. Variáveis de clima também, segundo o autor, apresentam pouca relevância em
previsões de médio prazo e são difíceis de obter as séries históricas. O uso de muitas variáveis de
entrada de diferentes fontes torna a fase de treinamento complicada e demorada, necessitando de
muitos dados para que o treinamento extraia a correlação entre elas. Assim, o uso mínimo de
variáveis de entrada torna o modelo mais rápido no treinamento, necessita de menos dados
históricos e facilita a operação.
47
4 ABORGAGEM PROPOSTA
Neste capítulo é apresentada a proposta de aplicação das técnicas apresentadas no capítulo 2
para resolver o problema de descrição do consumo de energia elétrica, visando o entendimento das
principais variáveis que afetam o crescimento de consumo, envolvendo as classes industrial e
comercial de Santa Catarina. O destaque está na metodologia de Descoberta de Conhecimento em
Base de Dados (KDD) e a etapa de Mineração de Dados. A forma como os dados são trabalhados e
a informações necessárias são obtidas, também é foco deste capítulo.
4.1 PRÉ – PROCESSAMENTO DOS DADOS
A disponibilização dos dados de consumo mensal de todo o estado de Santa Catarina pela
Celesc Distribuição S.A., divididos por atividades econômicas CNAE (cadastro nacional de
atividade econômica) foi importante para selecionar as atividades mais representativas em termos
de número de consumidores de energia elétrica e o montante de energia consumido por estas
classes.
Os dados foram disponibilizados em formato texto (csv), representando o consumo mensal
do ano de 2011 e divididos por CNAE. Foram carregados para o banco de dados PostgresSQL 9.0,
utilizando-se o software Kettle ou Pentaho Data Integration (PDI) que é um componente da suíte
do Pentaho responsável pelos processos de Extração, Transformação e Carga (ETL) de Dados. Uma
transformação foi gerada a fim de ler os arquivos texto e carregá-los no banco de dados, ignorando
nulos e transformando datas e unidades de medidas.
Nas primeiras seleções realizadas no banco de dados após a carga foi observado que o
número de consumidores industriais no estado era de 26.488, abrangendo 29 divisões CNAE
(CNAE 10 a 37 e 40). Com relação aos consumidores comerciais, o número de consumidores no
estado era de 201.098, abrangendo 26 divisões CNAE (entre CNAE 50 e 99).
Agrupando os dados por regionais obteve-se um total de 16 regionais. Desta forma foram
escolhidas 8 regionais que pudessem representar mais da metade do consumo e do número de
consumidores das classes comerciais e industriais do estado.
48
A pesquisa deveria se concentrar nas divisões CNAE mais representativas, ou seja, as
divisões selecionadas deveriam contemplar pelo mesmo 75% do consumo dentro de cada uma das
duas classes de consumidores. Com o desenvolvimento de rotinas escritas na linguagem de banco
de dados PL/SQL (Procedural Language extensions to SQL) foi possível agrupar os valores de
consumo por atividade econômica e auxiliar na análise. Após algumas análises dos dados de
consumo e número de consumidores de todas as regionais foi possível encontrar 8 deles que
tivessem a representatividade desejada, considerando todas as divisões CNAE. Estas regionais são:
Grande Florianópolis, Blumenau, Concórdia, Chapecó, Joaçaba, Joinville, Lages e Videira.
A partir da definição das regionais a serem consideradas no processo de medição foi
possível definir as atividades CNAE, da indústria e do comércio, a serem consideradas no cálculo
da amostra para medição. Neste caso, manteve-se como parâmetro de referência a
representatividade de consumo e de número de consumidores. Assim, considerando as 8 regionais
escolhidas, consegue-se representar, com apenas 8 divisões CNAE, mais de 76% do consumo de
energia e cerca de 65% dos consumidores industriais de Santa Catarina. Da mesma forma, foi
possível agregar, com apenas 7 divisões CNAE, quase 75% do consumo de energia e mais de 76%
dos consumidores comerciais resultando em uma elevada representatividade para este tipo de
pesquisa.
As atividades CNAE definidas para a indústria e para o comércio estão apresentadas nos
Quadros 4 e 5, respectivamente.
Quadro 4 – Atividades Consideradas – CNAE Indústra.
Divisão CNAE
Descrição CNAE Consumo
(%) Num. Cons.
(%)
15 Fabricação de produtos alimentícios e
bebidas 19,28 12,71
17 Fabricação de produtos texteis 14,09 8,14
18 Confecção de artigos de vestuário e
acessórios 2,16 10,92
20 Fabricação de produtos de madeira 4,92 14,63 25 Fabricação de artigos de borracha e plástico 7,3 3,17 27 Metalúrgica básica 12,62 1,83 28 Fabricação de produtos de metal 7,28 10,39 29 Fabricação de máquinas e equipamentos 8,49 3,13
49
Fonte: Elaborado pelo Autor. Quadro 5 – Atividades Consideradas – CNAE Comércio.
Fonte: Elaborado pelo Autor.
4.2 CÁLCULO DA AMOSTRA PARA MEDIÇÃO
A concessionária disponibilizou os dados de medição horo-sazonal de algumas indústrias e
comércio do estado de Santa Catarina. Porém, para atigir o grau de representatividade desejada uma
amostra adequada deve ser respeitada. Para isso houve a necessidade da definição de uma amostra
para medição em campo.
Para o cálculo das amostras de cada divisão, considerou-se os seguintes objetivos:
• Preservar das características das 8 regionais da concessionária no estado.
• Manter todas as divisões CNAE selecionadas com os mesmos erros amostrais.
• Erro amostral fixo de 10%.
• Nível de confiança de 90%.
Total 76,14 64,93
Divisão CNAE
Descrição CNAE Cons. (%)
Num. Cons. (%)
50
Comércio e reparação de veículos automotores e motocicletas
6,64 6,35
51 Comércio por atacado e representantes comerciais 9,61 10,32
52 Comércio varejista e reparação de objetos pessoais e
doméstico 26,36 22,22
55 Alojamento e alimentação 9,86 8,62
70 Atividades imobiliárias 8,4 8,22
74 Prestação de serviços principalmente a empresas 8,66 16,3
85 Saúde e serviços sociais 4,78 4,77
Total 74,33 76,81
50
Conforme já mencionado alguns clientes apresentam medição horo-sazonal e dispensarão
eventuais medições em campo. Levando em conta as 8 regionais selecionadas, 8 divisões CNAE
industriais e 7 divisões CNAE comerciais estabelecidas, o cálculo do tamanho da amostra foi
executado segundoa equação (13), e baseada em (TRIOLA, 2008). Cabe salientar que quando não
se tem conhecimento da proporção populacional p, considera-se o produto p.(1-p) = p.q = 0,25, ou
seja, neste caso considera-se a estimativa de proporção do evento na população de 50%.
n′!"
#$.&(()&)
+$
(13)
Onde:
no’= tamanho de uma amostra aleatória simples;
Z = valor da distribuição normal para o nível de confiança desejado;
p = estimativa de proporção do evento na população;
E0 = erro amostral tolerável.
A amostra, por sua vez, pode ser calculada segundo (14), apresentada abaixo.
Amostra = ./0
1
(2/01 )
(14)
Onde:
N = Número de estabelecimentos.
Aplicando a equação 14 aos dados foi possível chegar a Tabela 1 que apresenta o número de
amostras necessárias para representar estatisticamente cada divisão CNAE selecionada para as
classes do segmento industrial.
51
Tabela 1 - Número de Amostras da Classe Industrial para 8 Regionais.
CNAE 1.0 Número de Consumidores Consumo Médio Mensal (MWh) Amostras
15 1935 93178 65 17 1240 68089 64 18 1663 10422 65 20 2228 23791 66 25 483 35301 59 27 278 61010 54 28 1582 35193 65 29 477 41023 59
total - 8 regionais
9886 368007 497
Total do estado - 16 regionais
15226 483.311
Fonte: Elaborado pelo Autor.
E a Tabela 2 para as classes do segmento comercial:
Tabela 2 - Número de Amostras da Classe Comercial para 8 Regionais.
CNAE 1.0 Número de Consumidores Consumo Médio Mensal (MWh)
Amostras
50 7699 9682 67
51 12510 14008 67
52 26930 38420 67
55 10450 14374 67
70 9966 12248 67
74 19759 12627 67
85 5783 6967 67 total - 8
regionais 93097 108326 469
Total do estado - 16 regionais
121200 145737
Fonte: Elaborado pelo Autor.
Em relação as divisões CNAE da Tabela 2 para a indústria e sua descrição são:
• Divisão 15 - Fabricação de produtos alimentícios e bebidas.
• Divisão 17 - Fabricação de produtos texteis.
• Divisão 18 - Confecção de artigos de vestuário e acessórios.
52
• Divisão 20 - Fabricação de produtos de madeira.
• Divisão 25 - Fabricação de artigos de borracha e plástico.
• Divisão 27 - Metalúrgica básica.
• Divisão 28 - Fabricação de produtos de metal.
• Divisão 29 - Fabricação de máquinas e equipamentos.
Estas divisões CNAE representam um total de 76,14% do consumo e 64,93 % do número de
consumidores do estado.
Para o comércio foram definidas as seguintes atividades:
Divisão 50 - Comércio e reparação de veículos automotores e motocicletas.
Divisão 51 – Comércio por atacado e representantes comerciais.
Divisão 52 - Comércio varejista e reparação de objetos pessoais e doméstico.
Divisão 55 - Alojamento e alimentação.
Divisão 70 - Atividades imobiliárias.
Divisão 74 - Prestação de serviços principalmente a empresas.
Divisão 85 - Saúde e serviços sociais.
As divisões selecionadas do comércio representam 74,33% do consumo e 76,81 % do
número de consumidores de Santa Catarina.
A partir das tabelas 1 e 2 foi possível construir uma proposta de plano de medições por
regionais, definindo-se finalmente o número de medições necessárias para cada regional e cada
subdivisão CNAE, tanto em nível de consumidor industrial quanto comercial.
Para as regionais de Joinville e Florianópolis, regionais escolhidas para o estudo de caso por
apresentar um maior volume de dados e por serem as regiões de maior concentração de
consumidores estudados, foi necessário um total de 148 amostras para a indústria e 245 amostras
53
para o comércio, envolvendo dados de medição disponibilizados pela Celesc Distribuição S.A. e
dados a serem medidos in loco.
4.3 MEDIÇÃO DA CURVA DE CARGA DE CONSUMIDORES
Por meio de informações comerciais repassadas pela concessionária, foi possível verificar
quais consumidores eram horo-sazonais HS (consumidores com maior consumo) e atendiam as
nossas necessidades de representação amostral. Assim, foi possível reduzir o número de medições
em campo a serem realizadas. Na Tabela 3 são apresentadas a quantidade de dados disponíveis e a
necessidade de medição para as regionais de Florianópolis e Joinville, as quais já foram concluídas.
Tabela 3 - Relação de Consumidores e disponibilidade de dados.
FLORIANÓPOLIS JOINVILLE
INDÚSTRIA COMÉRCIO INDÚSTRIA COMÉRCIO
DADOS HS 34 104 29 37
MEDIÇÔES 19 77 66 27 Fonte: Elaborado pelo Autor.
Para construir as curvas de carga típicas de cada consumidor HS da amostra foram utilizados
apenas os três dias centrais da semana (terça-feira, quarta-feira e quinta-feira), formando uma curva
de carga diária média para os dias de semana. Devido a sazonalidade do consumo ao longo do ano
optou-se por considerar apenas as semanas dos meses de maior consumo, e assim, para a maioria
das amostras foram selecionadas apenas semanas do mês de agosto de 2011. Os demais clientes que
necessitavam de medição em campo tiveram seus dados coletados entre janeiro e fevereiro de 2013,
conforme o cronograma de atividades da empresa de medição.
É importante ressaltar que não se espera grandes alterações no perfil de demanda das
indústrias ao longo do ano, ao contrário das variações de montante consumido.
4.4 PESQUISA COM OS CONSUMIDORES VIA QUESTIONÁRIO
Para encontrar regras de associações e determinar o perfil dos consumidores outras
informações são necessárias, além dos dados de medição e construção das curvas de carga. Para
isso elaborou-se um questionário, disponível no apêndice A deste trabalho, a fim de obter algumas
54
informações dos consumidores medidos, para identificação do comportamento destes consumidores
e da atividade econômica correspondente.
De forma geral, o questionário foi dividido em cinco partes, envolvendo identificação da
unidade consumidora, informações sobre a instalação, informações sobre a operação da empresa em
2011, influência da economia e do clima no negócio. Em virtude da maior complexidade e
aplicabilidade, as respostas relacionadas à economia e ao clima foram solicitadas apenas aos
consumidores industriais.
Para a aplicação do questionário foi desenvolvido um site em PHP e banco de dados
MySQL, disponível em (www.seenergia.com.br/questionario) e solicitado o preenchimento do
mesmo pelo responsável da unidade consumidora que estava sendo medida. As respostas
preenchidas no questionário são automaticamente armazenadas no banco de dados do estudo,
possibilitando a realização do processo de mineração de dados das repostas.
As respostas obtidas junto aos consumidores têm basicamente dois objetivos distintos:
• identificar características funcionais indicativas de cada perfil de carga diário
(fundamentais para a descoberta de boas regras de associação);
• prospectar variáveis econômicas e climáticas relacionadas á variação do montante de
energia consumida por cada por cada divisão do CNAE ao longo dos meses, bem como
das respectivas sazonalidades (importante no processo de seleção de melhores séries
históricas para a previsão de demanda).
4.5 CLUSTERIZAÇÃO – IDENTIFICAÇÃO DOS PERFIS DE CARGA DIÁRIA TÍPICOS
O algoritmo de clusterização K-means, apresentado no Capítulo 2 deste trabalho, foi
utilizado para agrupar os dados de perfil de carga para determinação do número de clusters a partir
dos dados de consumo das regionais de Joinville e Florianópolis.
Através de uma rotina escrita em software Matlab foi possível encontrar o número de
centros e o ponto central de cada cluster (centróides). Após a determinação do ponto central, cada
conjunto de dados deve ser associado ao ponto central mais próximo, recalculando então o novo
ponto central. Isto foi realizado iterativamente até que houvesse uma estabilidade do ponto central.
55
Além de realizar a descoberta dos perfis de carga típicos das classes industrial e comercial
do estado, buscou-se nomear/classificar cada tipologia conforme os períodos de maior consumo e as
variações em momentos específicos como o horário de almoço e o período tarifário de ponta.
Os dias úteis de semana, segunda-feira à sexta-feira e sem feriados, apresentam montantes
de consumo maiores em relação aos finais de semana para a maioria das cargas. Além disto, os três
dias centrais da semana (terça, quarta e quinta-feira) tem os maiores consumos. Assim, nesta etapa,
a curva de carga diária para efeitos de clusterização é uma média das curvas de carga dos três dias
dias centrais da semana. No capitulo 5 são apresentados os clusters obtidos com a aplicação do
algoritmo k-mens.
4.6 APLICAÇÃO DA METODOLOGIA PROPOSTA
A metodologia empregada neste trabalho teve como meta atender os objetivos geral e
específicos propostos, bem como responder as hipóteses de pesquisa levantadas. Neste sentido, o
modelo computacional foi concebido de forma a atender todas as atividades necessárias para aplicar
as técnicas escolhidas de mineração ao problema de previsão de consumo de energia (previsão de
montante um mês a frente) e o agrupamento automático dos consumidores por suas curvas de
cargas (consumos diários), em função de respostas de questionários.
As demais etapas, constituindo os objetivos específicos 2, 3 e 4; estão representadas na
Figura 5. Nesta figura fica evidenciado o relacionamento entre as etapas, técnicas e objetivos
propostos nesta dissertação. Nota-se que nesta figura somente apresenta-se etapas referentes a
determinação do perfil dos consumidores e as variáveis de influência no consumo diário de energia
elétrica.
56
Figura 5 - Passos Para Determinação do Perfil dos Consumidores. Fonte: Elaborado pelo Autor.
O que está apresentado na Figura 5 corresponde a primeira etapa da metodologia empregada.
A segunda etapa refere-se a previsão de consumo de energia elétrica usando RNA do tipo MLP.
Nesta etapa busca-se a implementação de uma RNA para a classe CNAE 15, escolhida devido a
disponibilidade de maior volume de dados (de 1997 à 2011), a fim de realizar a previsão do
montante do consumo mensal de energia elétrica para cada novo consumidor. O treinamento será
com as curvas de carga históricas de consumo de energia dos consumidores analisados e medidos,
que possuem o mesmo perfil de carga.
4.7 CONSIDERAÇÕES FINAIS
As etapas de pré-processamento de dados e cálculo da amostra para medição determinou que
as divisões CNAE 15, 17, 18, 20, 25, 27, 28 e 29 representam um total de 76,14% do consumo e
64,93 % do número de consumidores do estado. Para o comércio as atividades 50, 51, 52, 55, 70, 74
e 85 representam 74,33% do consumo e 76,81 % do número de consumidores de Santa Catarina.
Assim foi possível reduzir o número de atividades necessárais, reduzindo o número de amostras
necessárias para medição e consequentemente reduzindo também os custos de medição. Com os
dados horo-sazonais disponibilizados pela concessionária as medições realizadas em campo foram
em 19 indústrias e 77 comérios de Florianópolis e em 66 indústrias e 27 comércios de Joinville.
57
As curvas de carga diária nos permite agrupar os consumidores em tipologias (clusters).
Assim foi utilizado o algortimo k-means para determinar os clusters que, em conjunto com os dados
dos questionários determinam as regras de associção para determinação do perfil de carga diária dos
consumidores.
Alguns resultados relativos às etapas de clusterização, classificação e de aplicação de regras
de associação são apresentados no Capítulo 5, tendo como estudo de caso as regionais de Joinville e
Florianópolis, onde todos os dados necessários e informações referentes às respostas dos
questionários foram obtidos. Após a determinação do perfil, são apresentados os resultados de
previsão de carga mensal da divisão CNAE 15, também escolhida como divisão piloto por possuir
uma série histórica de mais de 10 anos de dados.
58
5 RESULTADOS
Neste capítulo, são apresentados os resultados da aplicação da metodologia proposta nas
regionais de Joinville e Florianópolis, considerando medições de consumo e respostas de
questionários dos consumidores industriais e comerciais. Neste caso, buscou-se a aplicação da
clusterização para determinação dos perfis típicos de curvas de carga e regras de associação,
considerando como premissas as respostas dos questionários e como conclusões os perfis das curvas
de cargas dos consumidores (tipologias encontradas na clusterização)..
5.1 RESULTADOS – DETERMINAÇÃO DO PERFIL DE CONSUMIDORES
5.1.1 Clusterização
Na etapa de clusterização, após a aplicação do algoritmo K-Mens obteve-se sete tipologias
identificadas no conjunto de indústrias de Joinville e Florianópolis. A Figura 6 apresenta os dados
de consumo normalizados para melhor visualização, e por essa razão não apresenta escala vertical.
No momento optou-se por evitar ao máximo a criação de grupos de consumidores atípicos para
beneficiar os algoritmos de busca de associação.
Figura 6 - Tipologias da Classe Industrial – Joinville e Florianópolis. Fonte:Adaptado de Andrade et al., (2013).
59
A nomenclatura dos agrupamentos para a classe industrial foi definida da seguinte forma:
• Tipo i1: demanda praticamente constante ao longo do dia.
• Tipo i2: demandas crescentes nos períodos da madrugada e manhã, mais alta a tarde, e
decrescente a noite.
• Tipo i3: demanda alta no período da manhã com a tarde decrescente.
• Tipo i4: demandas altas nos período da manhã e da tarde, e com baixo recuo de demanda
ao meio-dia.
• Tipo i5: demandas altas nos período da manhã e da tarde, e com alto recuo de demanda
ao meio-dia.
• Tipo i6: demandas crescentes nos períodos da madrugada e manhã, mais alta a tarde e
noite, com um recuo médio no horário de ponta.
• Tipo i7: demandas altas nos períodos manhã, tarde e noite com alto recuo de demanda
no período de ponta.
Para a classe comercial, foram definidos oito clusters que estão apresentados na Figura 7, mostrada
a seguir.
60
Figura 7 - Tipologias da Classe Comercial – Joinville e Florianópolis. Fonte: Adaptado de Andrade et. al., (2013).
A Figura 7 apresenta as oito tipologias identificadas no conjunto de comércios de Joinville e Florianópolis. Para os agrupamentos do comércio a nomenclatura foi definida da seguinte forma:
• Tipo c1: demanda praticamente constante ao longo do dia.
• Tipo c2: demandas crescentes nos períodos da madrugada e manhã e decrescente a noite.
• Tipo c3: demandas crescentes nos períodos da madrugada e manhã e decrescente tarde e
noite.
61
• Tipo c4: demandas altas nos período da manhã e da tarde, e com baixo recuo de
demanda ao meio-dia.
• Tipo c5: demandas altas nos período da manhã e da tarde, e com alto recuo de demanda
ao meio-dia.
• Tipo c6: demandas crescentes no período da manhã, demandas altas próximo do meio
dia e tarde, noite com alto recuo de demanda.
• Tipo c7: demandas crescentes no final da manhã, demandas altas nos períodos manhã e
tarde e noite com alto recuo de demanda.
• Tipo c8: demandas crescentes no final do período da manhã com recuo de demanda no
final da noite e início da madrugada.
Foi possível identificar perfis de carga diária típicos conforme a mediana (preto) e média
(amarelo) dos seus integrantes. O objetivo foi gerar um número reduzido de agrupamentos de
consumidores com perfis de consumo semelhantes.
As linhas pretas e amarelas nos gráficos são a mediana e a média, respectivamente. É
possível observar que o gráfico da mediana apresenta menor variação em relação a média e os
clusters definidos pelo algoritmo k-menos acompanham a mediana. A “poluição” dos clusters é
explicada devido ao número reduzido de clusters, apenas 7 para a indústria, e o número reduzido de
dados utilizado. Se aumentarmos o número de clusters teremos mais curvas de carga próximas da
mediana, porém estaremos nos distanciando cada vez mais do mínimo agrupamento necessário para
reprsentar a curva de carga dos consumidores em estudo.
Com a obtenção de sete tipologias para a indústria e oito para o comércio é necessário
realizar a aplicação de questionários a fim de identificar as regras de associação para cada tipologia.
Essa etapa foi realizada e os resultados são apresentados na próxima seção.
5.1.2 Resultados Regras de Associação
5.1.2.1 Pré-Processamento das Respostas dos Questionários
62
As respostas dos questionários formaram uma Base de Dados com todos os consumidores
entrevistados. Sobre as respostas obtidas foi elaborado um cuidadoso processo de pré-
processamento, cujos resultados foram base para a avaliação e a categorização das informações dos
consumidores:
Para validação das entrevistas de cada empresa, todas as respostas eram reexaminadas em
conjunto para evitar erros de coerência entre os dados de demanda, consumo, porte da empresa,
grupo de tensão, turnos de operação e etc.
A categorização é fundamental para redução do número de respostas possíveis de um
determinado quesito do questionário. Número de funcionários, inicialmente um parâmetro contínuo,
pode ser discretizado em micro, pequena, média e grande empresa, conforme a metodologia
utilizada pelo Sebrae/IBGE. Procedimentos semelhantes foram aplicados para a contratação de
demanda, consumo de energia mensal, relação entre as demanda contratadas na ponta e fora de
ponta, e os horários de início e fim do funcionamento da empresa ao longo do dia.
Os parâmetros e suas respectivas categorias constam no Quadro 6:
Quadro 6- Parâmetrização das Respostas do Questionário.
Parâmetros Cod. nas Regras Opções
Tipologia Tipo i1 ao Tipo i7 (Figura 5) Tipo c1 ao C8 (Figura 6)
Divisão do CNAE Divisão 15 à 29 – indústria 50 à 85 – comércio
Tipo de Tarifa tipo_de_tarifa
Convencional Monômia
Convencional Binômia
Horo-sazonal Verde
Horo-sazonal Azul
Maior Demanda Contratada dem_cont
Baixa (< 150 kW)
Média (150 a 600 kW)
Alta (600 a 2000 kW)
Muito Alta (> 2000 kW)
Redução na ponta: razão entre as Demandas na Ponta e Fora de Ponta
red_ponta
Muito Inferior (< 0,3)
Inferior (0,3 a 0,7)
Pouco Inferior (0,7 a 1,0)
Igual (= 1,0)
Acima (> 1,0)
Porte da Empresa (nº de func.)
porte_da_empresa
Micro (< 20)
Pequena (20 a 100)
Média (100 a 500)
63
Grande (> 500)
Sub-grupo de tensão sub_grupo A1, A2, A3, A3a, A4, AS
B1, B2, B3, B4
Turnos de Trabalho (codificados em 0 ou 1 e concatenados )
Turnos
Manhã
Tarde
Noite
Madrugada
Horários aproximados de funcionamento da empresa: início e fim
hr_fun_inicio hr_fun_fim
ini_madrugada (0h às 2h59m)
fim_madrugada (3h às 5h59m)
ini_manhã (6h às 8h59m)
fim_manhã (9h às 11h59m)
ini_tarde (12h às 14h59m)
fim_tarde (15h às 17h59m)
ini_noite (18h às 20h59m)
fim_noite (21h às 23h59m)
Consumo Médio Mensal CMM
Baixo (< 25000 kWh)
Médio (25000 a 100000 kWh)
Alto (100000 a 500000 kWh)
Muito Alto (> 500000 kWh)
Impacto da Variação do Clima ao Longo do Dia
impacto_var_clima
Alto
Médio
Baixo
Não se aplica / Não sabe (na_ns) Fonte: Elaborado pelo Autor.
O universo de variáveis de interesse para a busca de associações mostrou-se mais eficiente
com a utilização de 10 variáveis de entrada e das tipologias das curvas de carga como variável de
saída. A qualidade dos resultados, tanto da busca de associações quanto da classificação das
tipologias, está intimamente relacionada com a quantidade de clientes analisados. O total de
consumidores considerado foi de apenas 126 industriais e 179 comerciais para as regionais de
Florianópolis e Joinville.
5.1.2.2 Regras de Associação
Para realização da tarefa de Associação, utilizou-se um software livre para exploração de
dados, aprendizado de máquina e mineração de dados, denominado Tanagra, sob o qual é possível
trabalhar com diversos algoritmos para classificação e regras de associação. Para classificação dos
consumidores foi utilizado um algoritmo de indução de regras bseado na rotina de aprendizado
supervisionado. Basicamente, esse algoritmo utiliza o princípio da cobertura sequencial: defini-se
64
uma regra que prevê com certa precisão um valor do atributo alvo; retiram-se então os exemplos
que atendam a regra da base de dados e continua-se o processo iterativo até que toda a base de
dados de treinamento seja pesquisada.
5.1.2.3 Aplicação das Regras de Associação no Segmento Industrial
O processo de classificação da classe industrial considera apenas as respostas obtidas na
etapa de questionário dos 126 consumidores para estimar qual, entre as 7 tipologias, seria esperada
para cada um deles. O Quadro 7 apresenta um conjunto de 17 regras sequenciais que permitem, à
medida que são validados os seus antecedentes, indicar um consequente, ou seja, a tipologia do
consumidor da classe comercial. Pode-se observar que vários aspectos são relevantes para definição
da tipologia: CNAE, turnos e horários de funcionamento, consumo, porte da empresa, além de
questões ligadas à economia e ao clima. Quando nenhuma das 17 regras é validada para um
consumidor ele será considerado com a tipologia “i1”.
Quadro 7 – Conjunto Mínimo de 17 Regras para 7 Tipologias Industriais. Conjunto de 17 Regras de Classificação para 7 Tipologias Industriais
N Condição Decisão 1 SE turnos é [T0000] E dem_cont é [BAIXA] [i7]
2 SE hr_func_inicio é [fim_madrugada] E porte_da_empresa é [PEQUENA] E CMM é [BAIXO] E estacao_ano_maior_consumo é [verao]
[i7]
3 SE hr_func_inicio é [ini_manha] E hr_func_fim é [ini_noite] [i6]
4 SE classe é [classe2842] E hr_func_inicio é [fim_madrugada] [i6]
5 SE hr_func_inicio é [ini_manha] E porte_da_empresa é [MEDIA] E efeito_temperatura é [nao]
[i6]
6 SE hr_func_inicio é [ini_manha] E impacto_importacao é [baixo] E regional é [joinville]
[i6]
7 SE turnos é [T1111] E tipo_de_tarifa é [verde] E efeito_temperatura é [sim] E partic_exportacao_receita é [na_ns]
[i5]
8 SE divisao é [div15] E hr_func_fim é [fim_tarde] E partic_exportacao_receita é [na_ns]
[i4]
9 SE impacto_importacao é [NULL] [i4]
10 SE dem_cont é [MEDIA] E porte_da_empresa é [MEDIA] E hr_func_inicio é [flat]
[i4]
11 SE estacao_ano_maior_consumo é [inverno] E regional é [joinville] [i4]
12 SE hr_func_fim é [fim_noite] E partic_exportacao_receita é [baixo] [i3]
65
13 SE turnos é [T1110] E regional é [joinville] [i3]
14 SE divisao é [div27] E impacto_importacao é [na_ns] E efeito_temperatura é [sim]
[i3]
15 SE hr_func_inicio é [fim_madrugada] E dem_cont é [MEDIA] E regional é [joinville]
[i3]
16 SE classe é [classe2022] [i2]
17 SE hr_func_inicio é [ini_manha] E dem_cont é [BAIXA] E impacto_importacao é [na_ns]
[i2]
REGRA PADRÃO [i1] Fonte: Elaborado pelo Autor.
A Tabela 4 apresenta a matriz de confusão para as 7 tipologias da classe industrial. Destaca-
se o bom desempenho do modelo com uma diagonal principal mais dominante.
Tabela 4 - Matriz de Confusão – 7 Tipologias Industriais
Tipologias Previstas Matriz de Confusão Valor Retorno Precisão
I5 I7 I4 I6 I1 I3 I2 Entrada
i5 55% 67% I5 6 0 1 0 4 0 0 11 i7 63% 100% I7 0 5 0 0 2 1 0 8 i4 69% 82% I4 0 0 9 1 1 0 2 13 i6 70% 70% I6 0 0 0 7 1 0 2 10 i1 78% 62% I1 3 0 1 1 21 0 1 27 i3 73% 85% I3 0 0 0 1 1 11 2 15 i2 74% 67% I2 0 0 0 0 4 1 14 19
Médias 69% 76% Saída 9 5 11 10 34 13 21 103 Fonte: Elaborado pelo Autor.
O retorno é a razão entre a quantidade de registros que são do grupo dado como entrada pela
quantidades de registros previstos neste grupo. Já a precisão é a razão entre a quantidade de
registros previstos para um grupo pela quantidade de registros que efetivamente são desse grupo.
Pode-se verificar um bom desempenho da tarefa de classificação das tipologias para a classe
industrial. Nenhuma tipologia apresentou taxa de retorno abaixo de 55% e a taxa média de precisão
ficou acima de 75%.
Para o cluster i7, de acordo com a Tabela 4 e observando a segunda linha na horizontal,
temos 8 (5+2+1) consumidores do cluster i7 (entrada) e após a classificação obteve-se 5 acertos
(saida) representando 63% de acerto. Já observando a coluna do i7 na vertical podemos interpretar
da seguinte forma: dos 5 consumidores previstos como i7 (saida), todos eram i7, representando
100% de acerto.
66
5.1.2.4 Aplicação das Regras de Associação no Segmento Comercial
O processo de classificação da classe comercial considera apenas as respostas obtidas na
etapa de questionário dos 179 consumidores para estimar qual, entre as 8 tipologias, seria esperada
para cada um deles. O Quadro 8 apresenta um conjunto de 24 regras3 sequenciais que permitem, à
medida que são validados os seus antecedentes, indicar um consequente, ou seja, a tipologia do
consumidor da classe comercial. Pode-se observar que vários aspectos são relevantes para definição
da tipologia: CNAE, turnos e horários de funcionamento, consumo, porte da empresa, e até mesmo
a regional do consumidor. Caso nenhum das 24 regras seja validada para um consumidor ele será
considerado com a tipologia “c1”.
Quadro 8 – Conjunto Mínimo de 24 Regras para 8 Tipologas Comerciais. Conjunto de 24 Regras de Classificação para 8 Tipologias Comerciais
N Condição Decisão 1 SE classe in [classe5521] E red_ponta é [NULL] E CMM é
[BAIXO] [c8]
2 SE classe é [classe5232] [c7] 3 SE classe é [classe7040] E turnos é [T1111] E
porte_da_empresa é [GRANDE] [c7]
4 SE tipo_de_tarifa é [monomia] E turnos é [T0111] E CMM é [MEDIO]
[c7]
5 SE hr_func_fim é [ini_noite] E dem_cont é [MEDIA] [c6] 6 SE porte_da_empresa é [MICRO] E classe é [classe7040] E
hr_func_inicio é [ini_manha] [c6]
7 SE classe é [classe5010] E dem_cont é [BAIXA] E red_ponta é [NULL]
[c6]
8 SE hr_func_fim é [ini_noite] E divisao é [div52] E red_ponta é [NULL]
[c6]
9 SE divisao é [div74] E CMM é [MEDIO] E red_ponta é [NULL]
[c6]
10 SE classe é [classe5030] [c5] 11 SE hr_func_fim é [fim_tarde] E turnos é [T0110] E
tipo_de_tarifa é [verde] E hr_func_inicio é [ini_manha] E [c5]
3 Foram consideradas apenas as regras que apresentaram suporte maior ou igual a 3, possibilitando a abstração dos resultados para aplicação em conjuntos de teste, com novos consumidores ainda desconhecidos. Se fosse utilizado um suporte muito baixo, igual a 1 por exemplo, as regras ficariam extremamente especialistas com taxas de retorno e precisão muito elevadas, porém com pouca ou nenhuma capacidade de abstração para estimação da tipologia de novos clientes.
67
porte_da_empresa é [PEQUENA]
12 SE divisao é [div55] E hr_func_inicio é [flat] E turnos é [T1111]
[c4]
13 SE classe é [classe7032] [c4] 14 SE hr_func_fim é [ini_madrugada] [c3] 15 SE turnos é [T0111] E hr_func_inicio é [ini_manha] E divisao
é [div52] E CMM é [MEDIO] E porte_da_empresa é [GRANDE]
[c3]
16 SE dem_cont é [ALTA] E red_ponta é [NULL] [c3] 17 SE classe é [classe5511] E regional é [florianopolis] E CMM é
[MEDIO] [c3]
18 SE turnos é [T0111] E dem_cont é [MEDIA] E CMM é [ALTO]
[c3]
19 SE divisao é [div85] E regional é [florianopolis] E turnos é [T1111]
[c2]
20 SE classe é [classe5522] [c2] 21 SE classe é [classe8514] E regional é [florianop.] [c2] 22 SE tipo_de_tarifa é [monomia] E porte_da_empresa é
[MEDIA] E hr_func_inicio é [ini_manha] [c2]
23 SE classe é [classe5521] E regional é [florianopolis] E porte_da_empresa é [PEQUENA]
[c2]
24 SE classe é [classe7040] E porte_da_empresa é [NULL] [c2] REGRA PADRÃO [c1] Fonte: Elaborado pelo Autor.
O resultado da classificação pode ser mais bem compreendido por meio da matriz de
confusão4 (ou de erros) apresentada na Tabela 5. Considerando que todos os consumidores serão
avaliados na entrada do algoritmo são definidas as saídas, ou estimativas de tipologias de cada
cliente, conforme o resultado da aplicação do conjunto de regras estabelecido. Assim, têm-se dois
objetivos:
- Uma elevada taxa de retorno, dada pela razão entre as estimativas corretas para as
tipologias (diagonal principal destacada) e as verdadeiras tipologias dos clientes (coluna das
entradas).
4 A soma das linhas indicam as quantidades verdadeiras de consumidores em cada tipologia e a soma das colunas indicam as quantidades previstas de consumidores em cada tipologia. A diagonal principal cheia e os demais termos zerados seria uma solução ideal.
68
- Uma elevada taxa de precisão, dada pela razão entre as estimativas corretas para as
tipologias (diagonal principal destacada) e o total das estimativas de cada tipologia (linha das
saídas).
Tabela 5 – Matriz de Confusão – 8 Tipologias Comerciais.
Tipologias Previstas Matriz de Confusão
Valor Retorno Precisão
C8 C4 C2 C6 C1 C5 C3 C7 Entrada c8 14% 100% C8 1 0 0 0 5 1 0 0 7 c4 50% 64% C4 0 9 1 0 8 0 0 0 18 c2 71% 68% C2 0 2 17 0 5 0 0 0 24 c6 88% 74% C6 0 0 0 14 2 0 0 0 16 c1 43% 29% C1 0 0 6 3 12 6 1 0 28 c5 59% 56% C5 0 1 0 1 4 10 1 0 17 c3 53% 83% C3 0 2 0 1 5 1 10 0 19 c7 78% 100% C7 0 0 1 0 1 0 0 7 9
Médias 57% 72% Saída 1 14 25 19 42 18 12 7 138 Fonte: Elaborado pelo Autor.
Apenas uma das tipologias (C8) não apresentou uma taxa de retorno aceitável com a
aplicação da mineração de dados, influenciada também pelo baixo número de representantes na
amostra (apenas sete), e pela dificuldade de identificação de características funcionais que
apontassem tal comportamento da demanda.
De forma semelhante à interpretação da matriz de confusão para a indústria podemos
interpretar a matriz de confusão para o comércio. Para o cluster c7, de acordo com a Tabela 5 e
observando a oitava linha na horizontal sem os cabeçalhos, temos 9 (1+1+7) consumidores do
cluster c7 (entrada) e após a classificação obteve-se 7 acertos (saida) representando 78% de acerto.
Já observando a coluna do c7 na vertical podemos interpretar da seguinte forma: dos 7
consumidores previstos como c7 (saida), todos eram c7, representando 100% de acerto.
5.2 RESULTADOS - PREVISÃO PARA A DIVISÃO CNAE 15
5.2.1 Variáveis de entrada
A escolha das variáveis explicativas do comportamento da demanda é uma das etapas
cruciais da elaboração de um modelo econométrico. Focado na divisão CNAE 15 (alimentos e
bebidas), optou-se pela seleção de variáveis predominantemente macroeconômicas. Pôde-se utilizar
69
as respostas obtidas junto aos consumidores industriais da divisão 15 quando da aplicação do
Questionário de Caracterização Funcional da etapa anterior. Por meio daquele questionário, os
empresários e gestores já puderam indicar quais as variáveis de maior influência para seus negócios.
Após consultar diversas bases de dados, a saber: Banco Central do Brasil, IBGE, Fundação
Getúlio Vargas e Confederação Nacional da Indústria, foi possível obter 18 variáveis econômicas:
PIB (cinco variantes), valor agregado, imposto, consumo das famílias, consumo da administração
pública, valor da formação bruta do capital fixo, exportação e importação, TCER, IGPM, TJLP,
Selic, TR e IPCA. Foi possível então construir 18séries históricas estacionárias para o exemplo de
aplicação a partir das variáveis econômicas analisadas.
Como não se tem conhecimento prévio sobre os intervalos de tempo em que ocorrem os
impactos das variáveis explicativas (econômicas) sobre a variável dependente (consumo de energia
elétrica), todas as 18 variáveis explicativas foram correlacionados com a série histórica de
V12m_CEE_MM6 para defasagens de 0, 1, 2, 3... até 12 meses. Esse procedimento permite
identificar os efeitos de políticas econômicas cuja constante de tempo encontra-se no médio prazo.
A redução da taxa de juros ou o aumento da renda, por exemplo, poderiam impactar positivamente
na cadeia produtiva da divisão 15, porém o impacto no consumo de energia elétrica pode não ser
imediato.
Conforme resultados do modelo econométrico as variáveis testadas neste modelo foram:
• V12m_CEE_MM6_12 – variação da média móvel do consumo de energia dos últimos 6 meses, 12 meses antes do mês de previsão.
• V12m_CEE_MM6_9 – variação da média móvel do consumo de energia dos últimos 6 meses, 9 meses antes do mês de previsão.
• V12m_CEE_MM6_6 – variação da média móvel do consumo de energia dos últimos 6 meses, 6 meses antes do mês de previsão.
• V12m_CEE_MM6_3 – variação da média móvel do consumo de energia dos últimos 6 meses, 3 meses antes do mês de previsão.
• Pib_Ind_Trans (t-5) – variação do percentual do PIB 6 meses antes do mês de previsão.
• Taxa_Exportação(t-3) – variação do percentual de exportação 3 meses antes do mês de previsão.
70
O comportamento do consumo médio mensal da divisão 15 desde 1998 até 2011 não
apresenta uma curva estacionária além de não exister um padrão de variação do consumo de um
mês para outro e, pelo contrário, as variações são rápidas e difíceis de ser previstas ou
correlacionadas com outras variáveis explicativas. Portanto, foram realizadas simulações
considerando não o CMM (consumo médio mensal) de cada mês individualmente mas sim as
médias móveis de 6 (MM6) meses. A série construída MM6, por não ser uma janela tão longa
consegue reagir relativamente bem às variações da economia ou do clima ao mesmo tempo em que
apresenta boas correlações parciais com as suas variações explicadas. Médias móveis mais curtas
são difíceis de correlacionar e as mais logas demoram muito para carregar os efeitos de variações da
economia, mesmo as mais intensas.
A MM6 não é estacionária e, portanto não pode ser diretamente inserida como variável
dependente do modelo econométrico. Para torná-la estacionária, optou-se pelo cálculo da variação
percentual em relação ao mesmo período do ano anterior. Denominada aqui de variação 12 meses
ou V12m esta operação consegue extrair as mudanças no ritmo de crescimento ou decrescimento do
consumo de um ano para outro.
Na análise de regressão que envolve séries temporais existem modelos que incluem não
apenas os valores correntes das variáveis explanatórias (MM6) mas também valores defasados
dessas variáveis. Quando um modelo inclui um ou mais valores defasados ele é chamado de modelo
auto-regressivo.
5.2.2 Topologia
A Figura 8 apresenta a topologia da rede neural artificial utilizada. Após vários testes
obtou-se por uma topologia com 6 neurônios na camada escondida. A saída é sempre a variação da
média móvel dos últimos 6 meses de consumo para o mês de previsão.
71
Figura 8 – MLP Testada. Fonte: Elaborado pelo Autor.
A rede foi treinada não somente com a apresentação de todas as variáveis consideradas,
conforme Figura 8, mas também com as entradas, V12MM6M (t-11), V12MM6M (t) e
Pib_Ind_Trans (t-5) e finalmente com apenas 2 entradas, V12MM6M (t-11) e V12MM6M (t).
Para o treinamento foram utilizados os dados de 2000 à 2010 e para validação os dados de
2011. Os resultados são apresentados a seguir.
5.2.3 Validação do protótipo com matlab
A fim de validar os resultados obtidos pelo sistema desenvolvido foi utilizado o software
matlab para obtenção dos resultados. Alguns resultados foram confrontados com os resultados do
protótipo.
Na busca de melhores resultados e na tentativa de utilizar dados de previsão mais distantes
do mês de previsão foram inseridas aos poucos variáveis econômicas e o modelo auto-regressivo
utilizado foi o reduzido, ou seja, 4 entradas mm6m de 3, 6, 9 e 12 meses anteriores. Foi inserida a
variável o pib_agro (pib da indústria agropecuária) de 3, 6, 9 e 12 meses anteriores. Os resultados
são apresentados na tabela 6.
72
Tabela 6 – Resultados modelo reduzido
Entradas Algoritmo
NI épocas
mape treinamento
mape teste
mínimo mape treinamento
mínimo mape teste
máximo mape treinamento
máximo mape teste
mm6m 3,6,9,12 pib_agro 3,6,9,12 trainlm 8 1000 5,26% 8,15% 0,05% 2,39% 19,84% 18,46% mm6m 3,6,9,12 pib_agro 3,6,9,12 trainlm 8 2000 4,32%
13,65% 0,03% 5,68% 17,27% 23,90%
mm6m 3,6,9,12 pib_agro 3,6,9,12 trainlm 8 5000 3,22% 8,80% 0,01% 1,21% 15,55% 18,58% mm6m 3,6,9,12 pib_agro 3,6,9,12 trainlm 12 1000 5,04%
12,57% 0,02% 1,43% 19,49% 23,66%
mm6m 3,6,9,12 pib_agro 3,6,9,12 trainlm 12 2000 3,95%
11,28% 0,02% 1,06% 15,88% 23,91%
mm6m 3,6,9,12 pib_agro 3,6,9,12 trainbr 6 100 7,92% 4,37% 0,07% 0,13% 31,06% 11,01% mm6m 3,6,9,12 pib_agro 3,6,9,12 trainbr 6 1000 5,83% 8,35% 0,09% 0,74% 22,15% 16,54% mm6m 3,6,9,12 pib_agro 3,6,9,12 trainbr 8 100 9,32% 7,10% 0,44% 1,05% 33,64% 12,06% mm6m 3,6,9,12 pib_agro 3,6,9,12 trainbr 8 1000 5,63% 8,86% 0,00% 4,00% 21,74% 19,22% Fonte: Elaborado pelo Autor.
Conforme apresentado na tabela 6, os resultados tiveram erros acima do desejado, apesar das
inúmeras tentativas de alteração de número de neurônios na camada intermediária e épocas.
73
O melhor mape de treinamento é o da linha marcada em verde na tabela 6 que foi de 3,22%.
Porém o erro de previsão foi de 8,80% e o mape máximo de mais de 18%. A Figura 9 ilustra este
resultado:
Figura 9 - Linha Amarela – Tabela 6. Fonte: Elaborado pelo Autor.
A linha marcada em verde apresenta o melhor resultado de previsão da tabela 6, no entanto
aparenta ser ao acaso pois apresenta um alto erro de previsão, 7,92%. Porém o erro máximo de
previsão ficou em torno de 11% e o médio de previsão em torno de 4%, de acordo com a Figura 10.
0
20
40
60
80
100
120
140
160
180
CMM(previsto) x CMM(ideal) - LINHA AMARELA - Tabela 6 CMM (GWh) - PREVISTO
CMM (GWh) - REAL
74
Figura 10 - Linha Verde – Tabela 6. Fonte: Elaborado pelo Autor.
Com a finalidade de melhorar os resultados foram testadas configurações e variáveis de
entrada distintas. As variáveis testadas foram:
• mm6m - Média Móvel do Consumo em 6 Meses.
• a12m_selic – Acumulado de 12 Meses da SELIC.
• a12m_tr – Acumulado de 12 Meses da TR.
• a12m_ipca – Acumulado de 12 Meses do IPCA.
• TJLP – Taxa de Juros de Longo Prazo
• Exportação – Taxa de exportação.
• VA – Valor Agregado da Indústria
• pib_ind_trans – Pib da Indústria de Transformação.
• pib_ser – Pib de Serviço.
• pib_ind – Pib da Indústria.
• pib_agro – Pib da Indústria Agropecuária.
• pib – Produto Interno Bruto.
0
20
40
60
80
100
120
140
160
180
CMM(previsto) x CMM(ideal) - LINHA VERDE - Tabela 6 CMM (GWh) - PREVISTO
CMM (GWh) - REAL
75
Foram considerados os atrasos nas correlações de acordo com o modelo econométrico. Para
a variação do consumo, variável 1, as redes foram alimentadas com o valor do mesmo mês do ano
anterior, ou seja, mm6m -12 meses ao da previsão. Esse mesmo deslocamento foi utilizado para as
variáveis 2 (a12m_selic), 3 (a12m_tr), 4 (a12m_ipca) e 5 (tjlp). Para a variável 6 (exportação) o
atraso foi de 3 meses. Para as variáveis 7 (va), 9 (pib_ser) e 12 (pib) o atraso foi de 4 meses. Para as
variáveis 8 (pib_ind_trans), 10 (pib_ind) e 11 (pib_agro) o atraso foi de 6 meses.
Os resultados estão mostrados na tabela 7:
Tabela 7 – Resultados – Todas as variáveis
entradas Algoritmo
NI
Épocas
mape treinamento
mape teste
mínimo mape treinamento
mínimo mape teste
máximo mape treinamento
máximo mape teste
todas variáveis trainbr 12 1000 4,63% 6,32% 0,03% 1,37% 21,97% 14,00% todas variáveis trainbr 20 1000 3,91% 14,23% 0,05% 3,90% 17,44% 28,15% todas variáveis trainbr 15 1000 4,06% 9,48% 0,05% 0,11% 19,27% 27,75% todas variáveis trainbr 15 5000 2,58% 15,83% 0,00% 7,32% 10,97% 30,55% todas variáveis trainbr 15 10000 1,73% 9,13% 0,01% 1,66% 7,74% 18,96% todas variáveis trainbr 15 5000 2,42% 34,30% 0,03% 2,11% 10,15% 60,21% todas variáveis trainbr 4 5000 3,90% 10,49% 0,01% 1,51% 23,80% 17,87% todas variáveis trainbr 4 100 11,77% 7,18% 0,04% 0,35% 49,17% 13,46% todas variáveis trainbr 6 1000 5,39% 10,06% 0,02% 1,11% 20,73% 31,39% todas variáveis
Trainlm 12 1000 4,39% 5,80% 0,04% 0,36% 23,80% 14,02%
todas variáveis
Trainlm 15 5000 2,37% 10,66% 0,00% 0,45% 10,57% 29,60%
todas variáveis
Trainlm 20 5000 2,21% 24,55% 0,01% 1,86% 9,38% 45,76%
todas variáveis
Trainlm 12 5000 2,4786%
13,4270% 0,01% 1,20% 11,85% 27,19%
Fonte: Elaborado pelo Autor.
O algoritmo trainbr apresentou os melhores resultados na validação do treinamento,
apresentando um mape de 1,73% no melhor caso onde foram utilizados 15 neurônios na camada
76
intermediária e 10000 épocas (linha verde – tabela 15). No entanto, a capacidade de generalização
da rede foi comprometida apresentando um mape no teste de 9,73%. É um exemplo de uma rede
super treinada. A Figura 11 apresenta o resultado do treinamento e validação dessa rede:
Figura 11 - Linha Verde – Tabela 7. Fonte: Elaborado pelo Autor.
A rede super treinada da Figura 11 mostra o acerto com os dados de treinamento em quase
toda a curva até o ano de 2010. Para o ano de 2011, dados de teste, o resultado foi ruim pois a rede
super treinada apresenta pouca capacidade de generalização com dados nunca apresentados à rede.
O melhor resultado para essa configuração foi um mape de 5,80% no teste com 12
neurônios na camada intermediária e 1000 épocas. No entanto o erro máximo foi de mais de 14%,
de acordo com a linha amarela da tabela 7.O menor erro máximo de teste aparece na linha em azul
da tabela 7, porém com alto valor de mape no teste.
Os resultados com todas as variáveis não foram satisfatórios. Decidiu-se então retirar do
modelo as variáveis relacionadas com o pib. E os resultados estão mostrados naa tabela 8:
As entradas da rede foram:
• mm6m
• a12m_selic
020
40
60
80100
120
140160
180
jan
-00
jul-
00
jan
-01
jul-
01
jan
-02
jul-
02
jan
-03
jul-
03
jan
-04
jul-
04
jan
-05
jul-
05
jan
-06
jul-
06
jan
-07
jul-
07
jan
-08
jul-
08
jan
-09
jul-
09
jan
-10
jul-
10
jan
-11
jul-
11
CMM(previsto) x CMM(ideal) - LINHA VERDE - Tabela 7 CMM (GWh) - PREVISTO
CMM (GWh) - REAL
77
• a12m_tr
• a12m_ipca – acumulado de 12 meses do IPCA
• TJLP
• Exportação
• VA
Tabela 8 - Resultados 7 variáveis A.
entradas Algoritmo
NI
Épocas
mape treinamento
mape teste
mínimo mape treinamento
mínimo mape teste
máximo mape treinamento
máximo mape teste
1,2,3,4,5,6,7 trainlm
12 2000 6,03%
54,09% 0,03%
20,06% 24,28%
68,70%
1,2,3,4,5,6,7 trainlm
12 1000 7,27%
30,17% 0,01% 1,20% 11,85%
27,19%
Fonte: Elaborado pelo Autor.
Novamente não obteve-se resultados satisfatórios.Então foi retirada a variável tjlp e
acrescentado ao modelo o pib_ind_trans que apresentou melhor correlação linear no modelo
econométrico. Obteve-se os resultados apresentados na tabela 9:
Tabela 9 - Resultados 7 variáveis B.
entradas Algoritmo
NI
época é
mape treinamento
mape teste
mínimo mape treinamento
mínimo mape teste
máximo mape treinamento
máximo mape teste
1,2,3,4,6,7,8 trainlm
12 5000 3,42% 9,59% 0,01% 1,84% 14,44%
17,54%
1,2,3,4,6,7,8 trainlm
20 5000 2,82% 13,30% 0,01% 3,72% 14,07%
23,66%
1,2,3,4,6,7,8 trainlm
20
10000 1,82% 16,51% 0,03% 3,81% 13,35%
31,81%
1,2,3,4,6,7,8 trainlm
20 5000 3,54% 14,87% 0,01% 0,48% 16,87%
43,14%
1,2,3,4,6,7,8 trainbr 6 100 12,55% 5,20% 0,01% 0,49% 45,78%
10,07%
1,2,3,4,6,7,8 trainbr 8 100 12,97% 6,98% 0,11% 0,09% 47,56%
14,57%
1,2,3,4,6,7,8 trainbr
12 100 10,67% 8,02% 0,14% 0,55% 42,17%
16,50%
78
1,2,3,4,6,7,8 trainbr
12 200 11,14% 6,24% 0,07% 0,73% 46,38%
11,62%
1,2,3,4,6,7,8 trainbr
15 200 9,4079%
5,4089% 0,05% 0,17% 41,09%
14,52%
1,2,3,4,6,7,8 trainbr
15 300 9,52% 5,06% 0,19% 0,05% 42,24%
10,47%
1,2,3,4,6,7,8 trainbr 6 100 12,78% 7,39% 0,17% 1,27% 45,01%
13,10%
1,2,3,4,6,7,8 trainbr 8 100 13,42% 4,93% 0,33% 0,55% 46,09% 8,99% Fonte: Elaborado pelo Autor.
Neste caso o melhor resultado foi a rede com regularização bayesiana, algoritmo trainbr, 8
neurônios na camada escondida e apenas 100 épocas, com um mape de 4,93% para os dados de
teste e um mape máximo de 8,99% para o teste, de acordo com a linha amarela da tabela 9. A
Figura 12 apresenta o resultado do treinamento e teste:
Figura 12 - Linha Amarela – Tabela 9. Fonte: Elaborado pelo Autor.
Os resultados da Figura 12 apresentam uma rede com uma boa capacidade de generalização.
Porém os resultados parecem ao acaso, uma vez que a rede não apresenta bons resultados no
treinamento.
É possível perceber que a capacidade de generalização fica comprometida conforme o
número de épocas vai aumentando. Por esse motivo o número ideal de épocas foi de 100 na tabela
9.
0
20
4060
80
100120
140
160
180
jan
-00
jul-
00
jan
-01
jul-
01
jan
-02
jul-
02
jan
-03
jul-
03
jan
-04
jul-
04
jan
-05
jul-
05
jan
-06
jul-
06
jan
-07
jul-
07
jan
-08
jul-
08
jan
-09
jul-
09
jan
-10
jul-
10
jan
-11
jul-
11
CMM(previsto) x CMM(ideal) - LINHA AMARELA - Tabela 9 CMM (GWh) - PREVISTO
CMM (GWh) - REAL
79
O algoritmo de treinamento levenber-marquardt (trainlm) apresentou uma boa capacidade de
aprendizado, tendo um mape com os dados de treinamento de 1,82%. Porém a capacidade de
generalização da rede com essa mesma configuração não foi boa, com um mape de 16,51%. Essa
rede também está super treinada e a Figura 13 mostra os resultados do treinamento e teste dessa
configuração:
Figura 13 - Linha Verde – Tabela 9. Fonte: Elaborado pelo Autor.
Pela Figura 13 é possível perceber a baixa capacidade de generalização da rede.
Por fim, foram realizados testes com as variáveis:
• mm6m – 3 - média móvel do consumo em 6 meses 3 meses antes da previsão
• mm6m – 6 - média móvel do consumo em 6 meses 6 meses antes da previsão
• mm6m – 9 - média móvel do consumo em 6 meses 9 meses antes da previsão
• mm6m – 12 - média móvel do consumo em 6 meses 12 meses antes da previsão
• a12m_ipca
• Exportação
0
20
40
60
80
100
120
140
160
180
jan
-00
jul-
00
jan
-01
jul-
01
jan
-02
jul-
02
jan
-03
jul-
03
jan
-04
jul-
04
jan
-05
jul-
05
jan
-06
jul-
06
jan
-07
jul-
07
jan
-08
jul-
08
jan
-09
jul-
09
jan
-10
jul-
10
jan
-11
jul-
11
CMM(previsto) x CMM(ideal) - LINHA VERDE - Tabela 9 CMM (GWh) - PREVISTO
CMM (GWh) - REAL
80
• pib_ind_trans
A estratégia foi unir o modelo auto-regressivo reduzido (quartos de ano) com as variáveis
que apresentaram melhor correlação linear no modelo econometrico. Os resultados são apresentados
na tabela 10:
Tabela 10 - Resultados 4 variáveis.
Entradas algoritmo NI épocas mape treinamento
mape teste
mínimo mape treinamento
mínimo mape teste
máximo mape treinamento
máximo mape teste
cmm6m(3,6,9) 1,4,6,8 trainlm 8 1000 6,27% 5,25% 0,04% 0,98% 23,37% 12,95% cmm6m(3,6,9) 1,4,6,8 trainlm 8 2000 5,51% 5,86% 0,05% 0,86% 21,31% 12,18% cmm6m(3,6,9) 1,4,6,8 trainlm 8 1500 5,7334% 8,4507% 0,17% 0,22% 21,91% 17,85% cmm6m(3,6,9) 1,4,6,8 trainlm 10 1000 6,32% 4,34% 0,03% 0,50% 22,84% 11,81% cmm6m(3,6,9) 1,4,6,8 trainlm 10 2000 4,94% 6,41% 0,06% 0,21% 20,82% 16,76% Fonte: Elaborado pelo Autor.
A Figura 14 apresenta pouca variação do erro da linha amarela da tabela 10:
81
Figura 14 - Linha Amarela – Tabela 10. Fonte: Elaborado pelo Autor.
Os resultados ficaram piores que os anteriores apresentando apenas 1 situação em que o
mape de teste foi menor que 5%, na linha amarela da tabela 10.
O último teste realizado foi com o modelo auto-regressivo. Foram utilizados dados de 1 ano
antes ao de previsão, mês a mês. Ou seja, foram utilizados 12 meses antes ao da previsão para
prever o mês subsequente. Foram testados 2 algoritmos, o levenberg-marquardt (trainlm) e a
regularização bayesiana (trainbr).
Os resultados obtidos com alguns testes estão na tabela 11:
Tabela 11- Resultados Auto-regressivo
Entradas Algoritmo
NI Épocas
mape treinamento
mape teste
mínimo mape treinamento
mínimo mape teste
máximo mape treinamento
máximo mape teste
auto-regressivo Trainlm 8 1000 4,19% 4,26% 0,21% 0,81% 21,50% 12,54% auto-regressivo Trainlm 8 2000 3,95% 4,69% 0,04% 0,14% 17,79% 10,51% auto- Trainlm 8 5000 3,09% 7,66% 0,00% 2,62% 14,72% 13,86%
0
20
40
60
80
100
120
140
160
180
CMM(previsto) x CMM(ideal) LINHA AMARELA - Tabela 10 CMM (GWh) - PREVISTO
CMM (GWh) - REAL
82
regressivo
auto-regressivo Trainlm 10 1000 4,30% 3,94% 0,14% 0,58% 20,93% 13,53% auto-regressivo Trainlm 12 1000 3,91% 4,33% 0,05% 0,60% 19,91% 10,27% auto-regressivo Trainlm 12 2000 3,76% 5,83% 0,03% 1,73% 17,35% 11,82% auto-regressivo Trainbr 6 100 5,77% 4,31% 0,16% 0,29% 27,12% 15,53% auto-regressivo Trainbr 6 1000 4,48% 3,66% 0,12% 0,30% 21,68% 11,73% auto-regressivo Trainbr 8 100 4,94% 4,83% 0,02% 0,95% 26,81% 14,55% auto-regressivo Trainbr 8 1000 4,22% 3,99% 0,01% 0,24% 23,09% 12,43%
Fonte: Elaborado pelo Autor.
Nesse modelo é possível observar que a rede obteve bons resultados com o algoritmo
trainlm, 10 neurônios na camada intermediária e 1000 épocas, apresentando um mape com os dados
treinados de 4,30% e mape com os dados de teste (previsão) de 3,94%, linha marcada em vermelho
na tabela 11. A Figura 15 apresenta o gráfico da diferença entre a curva real e a prevista, em GWh.
Figura 15 - Linha vermelha – Tabela 11. Fonte: Elaborado pelo Autor.
0
20
40
60
80
100
120
140
160
180
CMM(previsto) x CMM(ideal) LINHA Vermelha - tabela 11 CMM (GWh) - PREVISTO
CMM (GWh) - REAL
83
Percebe-se também que o erro no treinamento diminui com o aumento do número de épocas
para mais de 1000. Para 5000 épocas com 8 neurônios na camada intermediária o erro de
treinamento foi de 3.09%, porém o erro de previsão foi de 7,66%, de acordo com a linha marcada
em amarelo na tabela 11 e Figura 16.
Figura 16 - Linha amarela – Tabela 11. Fonte: Elaborado pelo Autor.
A regularização baysiana apresentou os melhores resultados (linha verde, tabela 11) no
modelo auto-regressivo apresentando o menor erro de previsão de 3,66%, em uma rede com apenas
6 neurônios na camada escondida e 1000 épocas. A Figura 17 apresenta os resultados:
0
20
40
60
80
100
120
140
160
180
CMM(previsto) x CMM(ideal) - LINHA AMARELA - Tabela 11 CMM (GWh) - PREVISTO
CMM (GWh) - REAL
84
Figura 17 - Linha Verde – Tabela 11. Fonte: Elaborado pelo Autor.
A linha marcada em azul na Tabela 11 apresenta o menor mape máximo de previsão, igual a
10,27%. O mape geral de previsão foi de 4,33%. A Figura 18 apresenta os resultados:
Figura 18 - Linha Azul – Tabela 11. Fonte: Elaborado pelo Autor.
0
20
40
60
80
100
120
140
160
180
CMM(previsto) x CMM(ideal) - LINHA Verde - tabela 11 CMM (GWh) - PREVISTO
CMM (GWh) - REAL
0
20
40
60
80
100
120
140
160
180
CMM(previsto) x CMM(ideal) - LINHA AZUL - Tabela 11 CMM (GWh) - PREVISTO
CMM (GWh) - REAL
85
5.3 ESPECIFICAÇÃO DO TRANSFORMADOR
Tomando como exemplo de aplicação desta metodologia a construção de um
empreendimento de uso coletivo, pode-se estabelecer a provável curva de carga diária dos dias de
semana a partir das técnicas desenvolvidas neste projeto, a qual deverá influenciar a definição dos
condutores da rede e do transformador de distribuição. Tem-se como exemplo os seguintes
consumidores:
1º) uma clínica médica (500kVA) da regional de Florianópolis, pertencente ao CNAE 8514,
opera em todos os seus turnos [T1111], cuja tipologia pela regra 19 do Quadro 8, seria a C2;
2º) um restaurante (300kVA) que pertence ao CNAE 5521, seu horário de funcionamento é
flat e opera em todos os seus turnos [T1111], cuja tipologia pela regra 12 da Tabela 11, seria a C4;
3º) uma loja de informática (60kVA) pertencente ao CNAE 5129, que contrata a tarifa
monômia, opera pela manhã à noite [T0111] e seu consumo mensal (CMM) é médio, cuja tipologia
pela regra 4 do Quadro 8, seria a C7.
A partir da carga instalada declarada de cada um dos consumidores, podemos estimar a
curva de carga individual a partir do fator de demanda típico do CNAE de cada consumidor, que
pode ser estimado respectivamente em 0,235; 0,200 e 0,251.
Considerando o pico de demanda das três tipologias C2, C4 e C7, obtém-se as curvas de
carga diárias individuais, mostrada na Figura 19 e a curva de carga total das três tipologias na
Figura 20.
86
Figura 19 - Curva de Carga do Empreendimento de Uso Coletivo. Fonte:Adaptado de Andrade et al., (2013).
A caracterização do comportamento da demanda, inserida no processo de planejamento da
distribuição, é um problema complexo e relevante para uma concessionária de energia. De um
modo geral, o processo de mineração aqui apresentado conseguiu inovar, agregando conhecimento
novo e útil sobre o comportamento da demanda de consumidores comerciais e industriais em Santa
Catarina.
0
20
40
60
80
100
120
00:00 03:00 06:00 09:00 12:00 15:00 18:00 21:00
Curva de Carga Diária (kVA)
Clínica Médica Restaurante Loja de Informática
87
Figura 20 - Curva diária total Fonte: Elaborado pelo autor.
Assim, para atender a máxima demanda do conjunto que, como podemos observar na Figura
20 é de um pouco maior que 180 kVA, sendo suficiente um transformador de 225 kVA.
5.4 COMENTÁRIOS FINAIS
Neste capítulo foram explorados os resultados da etapa de clusterização que obtiveram sete
tipologias para a indústria e oito para o comércio. Os questionários foram aplicados nos
consumidores medidos e com medição disponibilizada pela concessionária. Assim foi possível
determinar 17 regras mínimas de associação para a indústria e 24 para o comércio com o auxílio do
Tanagra.
Com os resultados obtidos, ficou demonstrado que o modelo proposto possibilita que um
novo consumidor (pertencente a um novo empreendimento, por exemplo) possa ter classificado o
seu perfil de curva de carga, bastando realizar a aplicação do questionário desenvolvido e aplicação
das regras de associação identificadas.
Para um melhor dimensionamento da rede a previsão de montante foi executada para a
divisão CNAE 15 com o auxílio do matlab. Os resultados demonstram que é possível prever o
montante consumido com baixo erro.
0
50
100
150
200
00:00 03:00 06:00 09:00 12:00 15:00 18:00 21:00
Curva de Carga Diária (kVA)Somatório 51, 55 e 85Total_CNAEs
88
6 CONCLUSÃO
A partir da revisão da literatura pode-se observar que a determinação do perfil da curva de
carga de consumidores e previsão de montante de consumo de forma segregada para a indústria e
para o comércio, não é o foco da maioria dos estudos da área.
A aplicação do algoritmo de clusterização k-means sobre os dados de medição dos
consumidores industriais e comerciais selecionados do estado, permitiu encontrar sete tipologias
típicas de curva de carga para a indústria e oito tipologias para o comércio.. Com o uso do Tanagra
foi possível definir as regras de associação encontrando as variáveis de influência para cada
tipologia. Com definições aplicação desta metodologia será possível aplicar o questionário em
novos consumidores e assim classificá-lo em uma das quinze tipologias definidas (indústria +
comércio), sem a necessidade de novas medições.
Para melhor entendimento do valor agregado pela descoberta de associações no âmbito da
pesquisa, a aplicação dos questionários somente nas regiões de Florianópolis e Joinville já garantiu
uma taxa de acerto de 57% com uma precisão de 72%. Tais resultados demonstram a viabilidade da
estimação do perfil de carga para consumidores industriais e comerciais em todas as regionais do
estado. Com o aumento do número de questionários respondidos é possível conseguir uma taxa de
retorno e precisão ainda maiores. Mesmo com estes resultados parciais, já foi possível identificar
algumas relações interessantes obtidas dos atributos dos questionários respondidos pelos
consumidores medidos. Com relação à previsão de montante de energia, os melhores
resultados foram com o modelo auto-regressivo, considerando o CNAE 15. A rede obteve bons
resultados com um mape com os dados treinamento de 4,30% e mape com os dados de teste
(previsão) de 3,94% com o algoritmo levenberg-marquardt. Para o levenberg-marquardt com
regularização bayesiana os resultados apresentados foram ainda melhores, com erro de previsão de
3,66%.
Conforme foi se acrescentando variáveis econônomicas na entrada da rede neural, os
resultados foram ficando piores. Muitas vezes a rede apresentou bons resultados no treinamento,
ficando muitas vezes super treinada. Porém, os resultados com os dados de teste, muitas vezes
apresentaram erros muito maiores que o modelo auto-regressivo.
89
Devido a complexidade do estudo com o modelo econométrico e dificuldade em definir as
variáveis de influência para cada tipo de rede, chegou-se a conclusão que o modelo auto-regressivo
é o mais indicado para a divisão CNAE 15, indústria de bebidas e alimentos. Uma vez que os
resultados de previsão com variáveis econômicas piora o modelo torna-se sem sentido o uso dessas
variáveis nessa atividade econômica.
Os resultados da previsão da divisão CNAE 15 foram bons em termos d MAPE, porém
ainda podem ser melhorarados, considerando o histórico de dados de treinamento maior..
Para outras atividades da indústria é interessante fazer o mesmo estudo com variáveis de
influência a fim de verificar se os resultados melhoram em relação ao modelo auto-regressivo. Se o
modelo auto-regressivo também apresentar melhores resultados não háverá necessidade de utilizar
outras variáveis.
Nesse sentido concluí-se que é possível agrupar os perfis de carga definindo-se padrões de
consumo diferenciados dos consumidores industriais e comerciais de uma região do estado de Santa
Catarina utilizando técnicas de KDD. Além disto, demonstrou-se que é possível prever a variação
do consumo de energia elétrica mensal da indústria e do comércio em uma regiao do estado de
Santa Catarina com acuracidade adequada utilizando-se redes neurais artificiais. Assim as duas
hipóteses formuladas foram comprovadas neste trabalho. Da mesma forma, todos os objetivos
específicos foram cumpridos.
Com a combinação das técnicas propostas, classificação de consumidores novos nas quinze
tipologias de curva de carga definidas para a indústria e o comércio, e previsão de montante de
energia via redes neurais artificiais com o modelo autoregressivo será possível planejar melhor as
instalações de distribuição, em especial a especificação de transformadores de edifícios mistos
novos.
90
SUGESTÕES PARATRABALHOS FUTUROS
• Gerar novas regras de associação via TANAGRA, considerando informações dos questionários
respondidos das outras seis regionais. Com isto pretende-se aumentar os valores de retorno e
precisão para estas regras, aumentando assim a confiança no modelo.
• Aumentar a base de dados de medição para o treinamento das redes neurais artificiais,
considerando pelo menos mais cinco anos de dados de medição para todos os CNAEs
estudados.
• Para a previsão de montante, uma sugestão de trabalho futuro é realizar o estudo de APIs que
implementam as principais redes neurais. A Biblioteca do projeto ENCOG (Encog Machine
Learning Framework) do instituto de pesquisa Heaton tem sido testada com algumas curvas de
carga mensal disponibilizadas pela distribuidora e apresentou resultados iguais aos realizados
com o Matlab. A diferença do uso de bibliotecas é que a implementação dos algoritmos de
treinamento e previsão são de código fonte aberto e podem ser alterados a fim de obter melhores
resultados. Assim, configurações de parâmetros como o Bias e Momentum podem alterar as
saídas das redes produzindo melhores resultados.
91
REFERÊNCIAS
AGRAWAL, R.; SRIKANT, R. Fast Algorithms for Mining Association Rules. 20th VLDB Conference, 487-498, Santiago, Chile, 1994. AMJADY, N. Short-Term Bus Load Forecasting of Power Systems by a New Hybrid Method. IEEE Transactions on Power Syst., vol. 22, no. 1, pp. 333-341, 2007.
AMJADY, N.; KEYNIA, FARSHID. Mid-term load forecasting of power systems by a new prediction method. Energy Conversion and Management, Volume 49, Issue 10, pp. 2678-2687, 2008.
ANDRADE, F. F. . Um Modelo para Descrição e Previsão da Demanda dos Consumidores Industriais de Energia Elétrica. Tese de Doutorado. PGEEL. UFSC. 2009.
ANDRADE, F. F. ; CAMARGO, C. C. DE B. ; TEIVE, R. C. G. . Previsão da Demanda de Consumidores Industriais de Energia Elétrica no Médio Prazo baseada em Variáveis Econômicas e Climáticas. CBA, 2010.
ANDRADE, F.F.D. TEIVE, R.C.G. ARANHA NETO, E.A.C. CAMARGO, C.C.D.B. COELHO, J. ROSARIO, L.M. BETTIO, J.A.D. Metodologia para Descoberta de Clusters Mínimos e Significativos dos Perfis de Carga Típicos de Consumidores Industriais e Comerciais de uma Distribuidora de Energia Elétrica. XV ERIAC - XV Encontro Regional Ibero-Americano do CIGRÉ. Foz do Iguaçu, 2013.
ANUAR, N.; ZAKARIA, Z.. Cluster Validity Analysis for Electricity Load Profiling. Electrical Engineering, p.35-38. 2010.
AREEKUL, P.; SENJYU, T.; TOYAMA, H.; YONA, A.. A Hybrid ARIMA and Neural Net-work Model for Short-Term Price Forecasting in Deregulated Market, IEEE Transactions on Power Systems, vol.25, no.1, pp.524-530, 2010.
BOX, GEORGE E.; JENKINS, GWILYM M.; REINSEL, GREGORY C.. Time series analysis: forecasting and control, 3.ed. Englewood Cliffs: Prentice Hall. 1994.
BUNNOON, PITUK; CHALERMYANONT, KUSUMAL; LIMSAKUL, CHUSAK. Mid-Term Load Forecasting: Level Suitably of Wavelet and Neural Network based on Factor Selection. Energy Procedia, vol. 14, pp. 438-444. 2012.
CHAN, K. Y.; DILLON, T.S.; SINGH, J.; CHANG, E.. Neural-Network-Based Models for Short-Term Traffic Flow Forecasting Using a Hybrid Exponential Smoothing and Levenberg–Marquardt Algorithm. IEEE Transactions on Intelligent Transportation Systems , vol.13, no.2, pp.644-654. 2012.
CELESC Norma de Entrada de Instalações Consumidoras em Alta Tensão, Nota Técnica n.03, disponível em: <http://novoportal.celesc.com.br/portal/images/arquivos/normas/Nt03.pdf>. Acesso em: 26 fev. 2014.
92
CHANGHAO, XIA; JIAN, WANG; MCMENEMY, KAREN. Short, medium and long term load forecasting model and virtual load forecaster based on radial basis function neural networks. International Journal of Electrical Power & Energy Systems, vol. 32, Issue 7, pp. 743-750. 2010.
FAYYAD, U.; PIATETSKY-SHAPIRO, G.; SMYTH, P.. The KDD Process for extracting useful knowledge from volumes of data. Communications of the Association for Computing Machinery. V. 39. N. 11. P. 27-34. Nov. 1996.
GHELARDONI, L.; GHIO, A.; ANGUITA, D. . Energy Load Forecasting Using Empirical Mode Decomposition and Support Vector Regression Smart Grid. IEEE Transactions on , vol.4, no.1, pp.549,556. 2013.
GHIASSI, M.; ZIMBRA, D.K.; SAIDANE, H.. Medium term system load forecasting with a dynamic artificial neural network model. Electric Power Syst., vol. 76, pp. 302–316. 2006.
GONZALEZ-ROMERA, E.; JARAMILLO-MORAN, MA.; CARMONA-FERNANDEZ, D.. Monthly electric energy demand forecasting based on trend extraction. IEEE Trans Power Syst., vol. 21, pp. 1946–1953. 2006.
HAYKIN, S.. “Redes Neurais: princípios e prática”, 2. ed. Porto Alegre: Bookman. 2001.
HILL, D.C.; MCMILLAN, D.; BELL, K.R.W.; INFIELD, D.. Application of Auto-Regressive Models to U.K. Wind Speed Data for Power System Impact Studies. IEEE Transactions on Sustainable Energy, vol.3, no.1, pp.134-141. 2012.
KANDIL MS, EL-DEBEIKY SM, HASANIEN NE.. Long-term load forecasting for fast developing utility using a knowledge-based expert system. IEEE Trans Power Syst., vo. 17, pp. 491–496. 2002.
KANTARDZIC, M.. Data Mining: Concepts, Models, Methods, and Algorithms. 2nd ed. Wiley-IEEE Press. 2011.
LI, W.; ZHOU, J.; XIONG, X.; LU, J.. A Statistic-Fuzzy Technique for Clustering Load Curves. IEEE Trans. Power Systems, v.22, n.2, p.890-891. 2007.
MIRASGEDIS S, SARAFIDIS Y, GEORGOPOULOU E, LALAS DP, MOSCHOVITS M, KARAGIANNIS F. . Models for mid-term electricity demand forecasting incorporating weather influences. Energy and Buildings, vol. 31, pp. 208–227. 2006.
NOSE-FILHO, K.; LOTUFO, A. D. P.; MINUSSI, C. R.. Preprocessing data for short-term load fore-casting with a general regression neural network and a moving average filter. IEEE Trondheim PowerTech 2011, p. 19-23, Trondheim, Norway. June, 2011.
NOSE-FILHO, K.; LOTUFO, A. D. P.; MINUSSI, C. R.. Short-Term Multinodal Load Forecasting in Distribution Systems using General Regression Neural Networks, IEEE Trondheim PowerTech 2011, p. 19-23, Trondheim, Norway. June, 2011.
PANDEY, A.S.; SINGH, D.; SINHA, S.K. . Intelligent Hybrid Wavelet Models for Short-Term Load Forecasting. Power Systems, IEEE Transactions on, vol.25, no.3, pp.1266,1273. 2010.
93
PAPARODITIS, E.; SAPATINAS, T. . Short-Term Load Forecasting: The Similar Shape Functional Time-Series Predictor. Power Systems, IEEE Transactions on , vol.28, no.4, pp.3818,3825. 2013.
PESSANHA, J. F. M; LAURENCEL, L. C.; SOUZA, R. C.. Mapa de Kohonen na Construção de Tipologias de Curvas de Carga. XXXVI SBPO - Simpósio Brasileiro de Pesquisa Operacional, São João del Rei, 2004.
PRAHASTONO, I., KING, D. J., OZVEREN, C. S., & BRADLEY, D. A.. Electricity load profile classification using Fuzzy C-Means method. Simulation. Institute of Electrical and Electronics Engineers. P. 1-5. 2008.
RAMOS, S., & VALE, Z.. Data Mining techniques to support the classification of MV electricity customers. IEEE Power and Energy Society General Meeting Conversion and Delivery of Electrical Energy in the 21st Century. p. 1-7. 2008.
ROMERO, F.T.; HERNANDEZ, J.C.J.; LOPEZ, W.G.. Predicting Electricity Consumption Using Neural Networks. Latin America Transactions, IEEE (Revista IEEE America Latina) , vol.9, no.7, p.1066-1072. 2011.
RAKOTOMALALA, R. “Tanagra”. Disponível em: <http://eric.univ-lyon2.fr/~ricco/tanagra/fichiers/en_Tanagra_Rule_Induction.pdf>. Acesso em: 10 jan. 2013.
SANTANA, A. L.; CONDE, G. B.; REGO, L. P.; ROCHA, C. A.; CARDOSO, D. L.; COSTA, J. C. W.; BEZERRA, U. H.; FRANCES, C. R. L.. PREDICT – Decision support system for load forecasting and inference: A new undertaking for Brazilian power suppliers. International Journal of Electrical Power & Energy Systems, vol. 38, pp. 33-45. 2012.
SHAKOURI H, RASTAD M, NAZARZADEH J. .A hybrid nonlinear model for the annual maximum simultaneous electric power demand. IEEE Trans Power Syst., vol. 2, pp. 1069–1078. 2006.
TEIVE, R. C. G ANDRADE, F. F. ; ARANHA NETO, E.A.C.; CAMARGO C. C. DE B. ;., COELHO J.; ROSARIO, L.M.; BETTIO, J.A.D. Aplicação de Técnicas de Mineração de Dados para Previsão de Mercado de Energia Elétrica – Apresentação de Metodologia e Estudo de Caso de uma Concessionária de Energia. XXII SNPTEE - Seminário Nacional de Produção e Transmissão de Energia Elétrica. Brasilia, 2013.
TODESCO, J. L.. Reconhecimento de Padrões Usando Rede Neuronal Artificial Com Uma Função de Base Radial: Uma Aplicação na Classificação de Cromossomos Humanos. Tese de Doutorado. EPS. Universidade Federal de Santa Catarina. 1995.
TSEKOURAS GJ, HATZIARGYRIOU ND, DIALYNAS EN. . An optimized adaptive neural network for annual midterm energy forecasting. IEEE Trans Power Syst., vol. 21, pp. 385–391. 2006.
TRIOLA, M. F.. Introdução à Estatística. Editora LTC. RJ: 2008.
94
TRIPATHI, M. M.; UPADHYAY, K. G.; SINGH, S. N. . Short-term load forecasting using generalized regression and probabilistic neural networks in the electricity market. The Electricity Journal, vol.21, pp24-34. 2008.
XIA, C.; WNAG, J.; MCMENEMY K.. Short, medium and long term load forecasting model and virtual load forecaster based on radial basis function neural networks. Electrical Power and Energy Systems, New York, v. 32, p. 743-750, 2010.
YONA, A.; SENJYU, T.; FUNABASHI, T.; CHUL-HWAN KIM. Determination Method of Insolation Prediction With Fuzzy and Applying Neural Network for Long-Term Ahead PV Power Output Correction. Sustainable Energy, IEEE Transactions on, vol.4, no.2, p.527,533. 2013.
YUN, Z.; QUAN, Z.; CAIXIN, S.; SHAOLAN, L.; YUMING, L.; YANG, S. . RBF neural network and ANFIS-based short-term load forecasting approach in real-time price environment. IEEE Trans. Power Syst., vol. 23, no. 3, pp.853–858. 2008.
95
APÊNDICE A - TRABALHOS CORRELATOS
Para obter o estado da arte na previsão de demanda de energia elétrica foi realizada uma
revisão sistemática da literatura. A revisão ocorreu nas bases do IEEE, Elsevier e IET, filtrando-se
trabalhos de 2008 à 2013. No caso da busca nas bases do IEEE e IET os artigos de jornais e revistas
(Journals & Magazines) foram priorizados sobre os artigos de conferências. As string de busca
utilizadas foram:
• time series forecast, load forecast e artificial neural network(ANN)
• mid-term load forecast
Na base do IEE foram encontrados 45 artigos, na Elsevier 25 e no IET 2 artigos. Foram
selecionados os trabalhos mais adequados ao problema proposto: os trabalhos mais recentes, os que
usam redes neurais na previsão de carga com horizonte de previsão mensal, os que fazem a previsão
de médio prazo (horizonte de previsão maior que 1 semana e menor que 1 ano) e demais trabalhos.
A arquitetura de rede mais encontrada é a MLP, seguido pelas redes RBF e GRNN. Foram
encontrados muitos trabalhos para previsão de carga de energia elétrica em horizonte de curto
prazo. No entanto, para previsão de médio prazo são poucas as referências. Os trabalhos mais
revelevantes serão apresentados a seguir.
96
APÊNDICE B – QUESTIONÁRIO APLICADO
1.IDENTIFICAÇÃO DO CONSUMIDOR
Nome: CNPJ: Código da UC: Ramo de Atividade: Código CNAE: Tipo de Tarifa: Horário de Ponta:
2.INSTALAÇÕES
2.1 Qual a área construída? 2.2 Qual o número de funcionários? 2.3 Qual a tensão de entrada e o sub-grupo registrado? 2.4 Potência do transformador de entrada? 2.5 Qual a carga instalada total? 2.6 Qual o equipamento instalado de maior potência?
3. OPERAÇÃO EM 2011
3.1 Qual a Demanda Média? 3.2 Qual a Demanda Máxima? 3.3 Qual o Consumo Médio Mensal? 3.4 Qual o Consumo Máximo Mensal? 3.5 Quais os Turnos de Trabalho? 3.6 Sazonalidade da Produção? 3.7 Qual o período de férias coletivas?
4. INFLUÊNCIA DA ECONOMIA
4.1 Qual o impacto da importação na matriz de custos? 4.2 Qual a participação da exportação na receita? 4.3 Determine o nível de influência sobre a produção para cada variável
5. INFLUÊNCIA DO CLIMA
5.1 Qual o impacto das variações do clima ao longo do dia sobre o consumo de energia 5.2 Os efeitos climáticos mais relevantes ao longo do dia são: 5.3 Qual o impacto das variações do clima ao longo do ano sobre o consumo de energia 5.4 Em qual estação do ano ocorre o maior consumo de energia elétrica
97
APÊNDICE C – TODAS AS RESPOSTAS DOS QUESTIONÁRIOS APLICADOS
uc
div
isa
o
tipo_de_
tarifa
dem_c
ont
red_p
onta
porte_da
_empres
a
su
b_
gr
up
o
turn
os
CM
M
hr_func_i
nicio
hr_func_fi
m
impac
to_var
_clima
_dia
comercia
l_industr
ial
regio
nal
3156
5863
div
15 binomia BAIXA NULL MICRO A4
T011
0
BAI
XO
fim_madr
ugada fim_tarde alto industrial
joinvil
le
3246
9523
div
15 verde MEDIA NULL PEQUENA A4
T011
0
ME
DIO
fim_madr
ugada ini_noite medio industrial
joinvil
le
3064
8137
div
15 verde BAIXA NULL MICRO A4
T011
0
BAI
XO ini_manha fim_tarde alto industrial
joinvil
le
3181
6564
div
15 verde MEDIA NULL MEDIA A4
T011
0
ALT
O ini_manha fim_tarde alto industrial
joinvil
le
1952
9185
div
17 verde MEDIA NULL MEDIA A4
T111
1
ME
DIO flat flat medio industrial
joinvil
le
2866
5849
div
17 azul
MUITO
_ALTA
POUC
O_INF
ERIOR
GRANDE A2 T111
1
NUL
L flat flat medio industrial
joinvil
le
2572
2779
div
17 verde BAIXA NULL PEQUENA A4
T011
1
BAI
XO
fim_madr
ugada fim_noite alto industrial
joinvil
le
1932
9470
div
17 verde BAIXA NULL PEQUENA A4
T011
0
BAI
XO ini_manha fim_tarde na_ns industrial
joinvil
le
3117
3655
div
18
monomi
a NULL NULL MEDIA
NU
LL
T011
1
BAI
XO
fim_madr
ugada fim_noite alto industrial
joinvil
le
2613
4161
div
18 verde BAIXA NULL MEDIA A4
T111
1
ME
DIO flat flat baixo industrial
joinvil
le
2198
1800
div
18 binomia BAIXA NULL MICRO A4
T111
1
BAI
XO flat flat na_ns industrial
joinvil
le
2530
1269
div
20 verde BAIXA NULL PEQUENA A4
T011
0
BAI
XO ini_manha fim_tarde na_ns industrial
joinvil
le
2976
2988
div
20 verde BAIXA NULL MICRO A4
T011
1
BAI
XO ini_manha ini_noite na_ns industrial
joinvil
le
2851
0446
div
20 verde MEDIA NULL PEQUENA A4
T011
0
BAI
XO ini_manha fim_tarde baixo industrial
joinvil
le
2851
0446
div
20 verde MEDIA NULL PEQUENA A4
T011
0
BAI
XO ini_manha fim_tarde baixo industrial
joinvil
le
2885
8574
div
20 verde MEDIA NULL MEDIA A4
T011
0
ALT
O ini_manha fim_tarde na_ns industrial
joinvil
le
2823
1261
div
20 binomia BAIXA NULL PEQUENA A4
T111
1
BAI
XO flat flat medio industrial
joinvil
le
4170
4535
div
25 verde MEDIA NULL PEQUENA A4
T111
1
ME
DIO flat flat alto industrial
joinvil
le
3212
6251
div
25 verde MEDIA NULL PEQUENA A4
T111
0
ME
DIO fim_noite fim_tarde medio industrial
joinvil
le
1235
2050
div
25 verde ALTA NULL MEDIA A4
T011
1
ALT
O
fim_madr
ugada fim_noite alto industrial
joinvil
le
3234
7428
div
25 verde MEDIA NULL MICRO A4
T011
0
ME
DIO ini_manha fim_tarde alto industrial
joinvil
le
2641
9514
div
25 verde MEDIA NULL MICRO A4
T111
1
ME
DIO flat flat medio industrial
joinvil
le
1235
2190
div
25 azul
MUITO
_ALTA
MUIT
O_INF
ERIOR
GRANDE A2 T111
1
NUL
L fim_noite fim_noite baixo industrial
joinvil
le
98
4033
7954
div
25 verde MEDIA NULL PEQUENA A4
T111
0
ME
DIO fim_noite fim_tarde baixo industrial
joinvil
le
2980
5407
div
25 verde MEDIA NULL PEQUENA A4
T111
1
ME
DIO flat flat na_ns industrial
joinvil
le
4469
6215
div
25 azul MEDIA IGUAL MEDIA A4
T111
1
ME
DIO flat flat baixo industrial
joinvil
le
2168
9980
div
25 azul BAIXA IGUAL GRANDE A4
T111
1
NUL
L flat flat medio industrial
joinvil
le
2019
6181
div
25 verde ALTA NULL MEDIA A4
T111
1
ALT
O fim_noite fim_noite medio industrial
joinvil
le
3183
6140
div
25 verde ALTA NULL MEDIA A4
T111
1
ALT
O flat flat baixo industrial
joinvil
le
2596
2052
div
25 verde ALTA NULL MEDIA A4
T111
1
ALT
O flat flat baixo industrial
joinvil
le
2391
9010
div
27 azul ALTA IGUAL MEDIA A4
T111
1
NUL
L fim_noite fim_noite na_ns industrial
joinvil
le
4381
8554
div
27 verde
MUITO
_ALTA NULL PEQUENA A4
T111
1
ALT
O flat flat medio industrial
joinvil
le
1232
5746
div
27 verde MEDIA IGUAL PEQUENA A4
T011
0
ME
DIO ini_manha fim_tarde baixo industrial
joinvil
le
4377
3577
div
27 azul ALTA
POUC
O_INF
ERIOR
MEDIA A4 T011
1
ALT
O flat flat medio industrial
joinvil
le
2391
8790
div
27 verde ALTA NULL PEQUENA A4
T011
1
ALT
O
fim_madr
ugada fim_noite alto industrial
joinvil
le
4272
5536
div
27 verde BAIXA NULL PEQUENA A4
T111
1
ME
DIO flat flat medio industrial
joinvil
le
3225
9570
div
27 verde BAIXA NULL PEQUENA A4
T111
1
ME
DIO flat flat baixo industrial
joinvil
le
2864
5180
div
28 verde BAIXA NULL PEQUENA A4
T011
0
BAI
XO ini_manha fim_tarde medio industrial
joinvil
le
2864
5236
div
28 verde BAIXA NULL PEQUENA A4
T000
0
BAI
XO ini_manha fim_tarde medio industrial
joinvil
le
2809
7069
div
28 verde BAIXA NULL MICRO A4
T011
1
BAI
XO NULL NULL alto industrial
joinvil
le
1971
3563
div
28 verde ALTA NULL PEQUENA A4
T111
1
NUL
L flat flat na_ns industrial
joinvil
le
1235
2310
div
28 azul
MUITO
_ALTA
POUC
O_INF
ERIOR
GRANDE A4 T111
1
NUL
L flat flat na_ns industrial
joinvil
le
3200
8720
div
28 azul
MUITO
_ALTA
POUC
O_INF
ERIOR
MEDIA NU
LL
T011
1
NUL
L flat flat alto industrial
joinvil
le
2131
6989
div
28 azul
MUITO
_ALTA
POUC
O_INF
ERIOR
GRANDE A4 T011
1
NUL
L
fim_madr
ugada fim_noite medio industrial
joinvil
le
1232
5754
div
28 verde MEDIA NULL PEQUENA A4
T011
0
ME
DIO
fim_madr
ugada fim_noite alto industrial
joinvil
le
4045
0530
div
28 verde BAIXA NULL PEQUENA A4
T111
0
BAI
XO
fim_madr
ugada fim_noite na_ns industrial
joinvil
le
2575
5901
div
28 verde MEDIA NULL PEQUENA A4
T011
0
ME
DIO
fim_madr
ugada fim_tarde na_ns industrial
joinvil
le
2801
9327
div
28 verde BAIXA NULL MICRO A4
T011
0
BAI
XO ini_manha fim_tarde medio industrial
joinvil
le
1235
2239
div
28 verde MEDIA NULL PEQUENA A4
T111
1
ME
DIO flat flat na_ns industrial
joinvil
le
1836
9516
div
28 verde BAIXA NULL PEQUENA A4
T011
1
BAI
XO ini_manha fim_noite na_ns industrial
joinvil
le
2845
8380
div
28 verde BAIXA NULL PEQUENA A4
T000
0
BAI
XO
fim_madr
ugada fim_tarde alto industrial
joinvil
le
99
4477
6243
div
28 verde ALTA NULL PEQUENA A4
T011
1
ALT
O
fim_madr
ugada fim_noite medio industrial
joinvil
le
2056
6574
div
28 verde BAIXA NULL MICRO A4
T011
0
BAI
XO ini_manha fim_tarde baixo industrial
joinvil
le
1235
2131
div
28 azul ALTA
POUC
O_INF
ERIOR
GRANDE A4 T011
1
ALT
O
fim_madr
ugada fim_noite medio industrial
joinvil
le
1232
5177
div
29 verde BAIXA NULL PEQUENA A4
T011
1
BAI
XO
fim_madr
ugada fim_noite baixo industrial
joinvil
le
2470
2847
div
29 verde BAIXA NULL MEDIA A4
T011
0
BAI
XO ini_manha fim_tarde medio industrial
joinvil
le
4406
5185
div
29 verde BAIXA NULL MICRO A4
T011
1
BAI
XO
fim_madr
ugada fim_noite baixo industrial
joinvil
le
2963
0801
div
29 verde BAIXA NULL PEQUENA A4
T011
0
BAI
XO ini_manha fim_tarde medio industrial
joinvil
le
3139
4007
div
29 verde BAIXA NULL MICRO A4
T011
1
BAI
XO
fim_madr
ugada fim_noite na_ns industrial
joinvil
le
3235
9566
div
29 binomia MEDIA NULL PEQUENA A4
T111
1
ME
DIO flat flat na_ns industrial
joinvil
le
4121
2608
div
29 verde MEDIA NULL PEQUENA A4
T011
1
NUL
L
fim_madr
ugada fim_noite alto industrial
joinvil
le
4285
4603
div
29 verde BAIXA NULL PEQUENA A4
T011
1
BAI
XO
fim_madr
ugada fim_noite alto industrial
joinvil
le
1232
3891
div
29 verde BAIXA NULL MICRO A4
T011
0
BAI
XO ini_manha fim_tarde na_ns industrial
joinvil
le
4506
5650
div
29 verde MEDIA NULL MEDIA A4
T011
0
ME
DIO ini_manha fim_tarde medio industrial
joinvil
le
3124
6091
div
29 verde BAIXA NULL PEQUENA A4
T011
0
BAI
XO ini_manha fim_tarde medio industrial
joinvil
le
1919
1478
div
29 verde BAIXA NULL MICRO A4
T011
0
BAI
XO ini_manha fim_tarde na_ns industrial
joinvil
le
3176
320
div
50
monomi
a NULL NULL PEQUENA
NU
LL
T000
0
NUL
L NULL NULL medio comercial
joinvil
le
1232
4944
div
50 verde BAIXA NULL GRANDE A4
T000
0
BAI
XO NULL NULL NULL comercial
joinvil
le
3064
0950
div
50 verde
MUITO
_ALTA NULL GRANDE A4
T011
0
ME
DIO ini_manha fim_tarde NULL comercial
joinvil
le
3235
1590
div
50 verde BAIXA NULL MICRO A4
T011
0
BAI
XO ini_manha fim_tarde NULL comercial
joinvil
le
2303
7017
div
50 verde BAIXA NULL PEQUENA A4
T011
0
BAI
XO ini_manha fim_tarde NULL comercial
joinvil
le
3085
8549
div
51 verde BAIXA NULL PEQUENA A4
T011
0
BAI
XO ini_manha fim_tarde NULL comercial
joinvil
le
4515
9248
div
51 verde BAIXA NULL PEQUENA A4
T011
0
BAI
XO ini_manha fim_tarde NULL comercial
joinvil
le
3129
2158
div
52 verde BAIXA NULL GRANDE A4
T011
1
ME
DIO ini_manha fim_noite NULL comercial
joinvil
le
2597
6134
div
52 verde BAIXA NULL GRANDE A4
T011
0
ME
DIO ini_manha fim_tarde NULL comercial
joinvil
le
2140
6538
div
52 azul ALTA IGUAL GRANDE A4
T011
1
ME
DIO ini_manha fim_noite NULL comercial
joinvil
le
3064
2902
div
52 verde MEDIA NULL MEDIA A4
T011
0
NUL
L ini_manha ini_noite NULL comercial
joinvil
le
2343
8151
div
52 binomia BAIXA NULL PEQUENA A4
T011
0
BAI
XO ini_manha ini_noite NULL comercial
joinvil
le
4247
7206
div
55 verde BAIXA NULL PEQUENA A4
T101
0
NUL
L fim_noite
fim_madru
gada NULL comercial
joinvil
le
4023
9944
div
55 verde BAIXA NULL PEQUENA A4
T011
0
BAI
XO ini_manha fim_tarde NULL comercial
joinvil
le
100
2805
7997
div
55 binomia MEDIA NULL MEDIA A4
T111
0
ME
DIO flat flat NULL comercial
joinvil
le
2769
9227
div
55 verde MEDIA NULL MEDIA A4
T111
1
ME
DIO flat flat NULL comercial
joinvil
le
1161
7522
div
55 binomia BAIXA NULL PEQUENA A4
T011
0
BAI
XO
fim_madr
ugada fim_noite NULL comercial
joinvil
le
2807
1922
div
55 verde BAIXA NULL PEQUENA A4
T111
1
ME
DIO flat flat NULL comercial
joinvil
le
2573
1824
div
70 verde BAIXA NULL MICRO A4
T011
0
ME
DIO ini_manha fim_tarde NULL comercial
joinvil
le
1938
1986
div
70 azul
MUITO
_ALTA
POUC
O_INF
ERIOR
GRANDE A4 T011
1
NUL
L
fim_manh
a fim_noite NULL comercial
joinvil
le
1848
6644
div
70 binomia BAIXA NULL MICRO A4
T011
0
BAI
XO ini_manha fim_tarde NULL comercial
joinvil
le
1232
4251
div
70 binomia BAIXA NULL MICRO A4
T111
1
BAI
XO flat flat NULL comercial
joinvil
le
4111
5351
div
70 verde BAIXA NULL PEQUENA A4
T111
1
BAI
XO flat flat NULL comercial
joinvil
le
2613
2860
div
74 verde BAIXA NULL PEQUENA A4
T011
0
BAI
XO ini_manha fim_tarde NULL comercial
joinvil
le
2181
9220
div
74 verde MEDIA NULL GRANDE A4
T011
0
ME
DIO ini_manha fim_tarde NULL comercial
joinvil
le
2602
2940
div
74 binomia BAIXA NULL MEDIA A4
T011
0
BAI
XO
fim_madr
ugada fim_tarde NULL comercial
joinvil
le
2233
6991
div
74 binomia BAIXA NULL MEDIA
NU
LL
T011
0
BAI
XO ini_manha fim_tarde NULL comercial
joinvil
le
2597
9770
div
85 verde BAIXA NULL MEDIA A4
T111
1
BAI
XO flat flat NULL comercial
joinvil
le
3241
6047
div
85 verde BAIXA NULL PEQUENA
NU
LL
T011
0
BAI
XO ini_manha fim_tarde NULL comercial
joinvil
le
4403
5758
div
85 verde BAIXA NULL PEQUENA A4
T011
0
BAI
XO ini_manha fim_tarde NULL comercial
joinvil
le
2537
5777
div
85 verde ALTA NULL GRANDE
NU
LL
T111
1
ALT
O fim_noite fim_noite NULL comercial
joinvil
le
1231
2784
div
15 verde MEDIA NULL PEQUENA A4
T011
0
ALT
O ini_manha fim_tarde alto industrial
floria
nopol
is
1231
3659
div
15 verde BAIXA IGUAL PEQUENA A4
T011
0
BAI
XO
fim_madr
ugada ini_tarde medio industrial
floria
nopol
is
2080
5455
div
15 verde BAIXA IGUAL MICRO A4
T011
0
BAI
XO ini_manha fim_tarde alto industrial
floria
nopol
is
2239
6498
div
15 verde BAIXA IGUAL PEQUENA A4
T011
0
ME
DIO ini_manha fim_tarde baixo industrial
floria
nopol
is
2363
0044
div
15
monomi
a NULL NULL MICRO
NU
LL
T011
0
BAI
XO ini_manha ini_noite alto industrial
floria
nopol
is
2772
5899
div
15 verde BAIXA IGUAL PEQUENA A4
T011
0
BAI
XO ini_manha fim_tarde NULL industrial
floria
nopol
is
2839
7879
div
15 verde BAIXA IGUAL NULL A4
T011
1
BAI
XO
fim_madr
ugada ini_noite NULL industrial
floria
nopol
is
2997
7313
div
15 verde BAIXA IGUAL PEQUENA A4
T111
1
BAI
XO fim_noite fim_noite medio industrial
floria
nopol
is
2421
6055
div
17 verde ALTA IGUAL MEDIA A4
T111
1
ALT
O fim_noite fim_noite na_ns industrial
floria
nopol
is
101
3171
6136
div
17 verde MEDIA IGUAL PEQUENA A4
T111
1
ALT
O fim_noite fim_noite na_ns industrial
floria
nopol
is
2908
0356
div
18 verde BAIXA NULL PEQUENA
NU
LL
T011
0
BAI
XO ini_manha fim_tarde medio industrial
floria
nopol
is
3030
3210
div
18 verde BAIXA NULL MICRO A4
T011
0
ME
DIO ini_manha fim_tarde baixo industrial
floria
nopol
is
1231
4302
div
20 verde BAIXA NULL NULL A4
T011
0
BAI
XO ini_manha fim_tarde NULL industrial
floria
nopol
is
2180
4576
div
20 verde BAIXA IGUAL MICRO A4
T011
0
BAI
XO ini_manha fim_tarde na_ns industrial
floria
nopol
is
2203
7080
div
20 binomia BAIXA IGUAL PEQUENA A4
T011
0
BAI
XO ini_manha fim_tarde medio industrial
floria
nopol
is
2361
1210
div
20 verde BAIXA IGUAL PEQUENA A4
T011
1
ME
DIO fim_noite ini_noite medio industrial
floria
nopol
is
2415
1883
div
20 binomia BAIXA IGUAL MICRO A4
T011
0
BAI
XO ini_manha ini_noite medio industrial
floria
nopol
is
2991
0189
div
20 verde BAIXA IGUAL MICRO A4
T011
0
BAI
XO ini_manha fim_tarde alto industrial
floria
nopol
is
3051
5943
div
20 verde BAIXA IGUAL MICRO A4
T011
0
BAI
XO ini_manha fim_tarde medio industrial
floria
nopol
is
3169
5155
div
20 verde BAIXA NULL MICRO A4
T011
0
BAI
XO ini_manha fim_tarde baixo industrial
floria
nopol
is
3231
4058
div
20 verde MEDIA IGUAL PEQUENA A4
T000
0
BAI
XO ini_manha fim_tarde medio industrial
floria
nopol
is
4004
4493
div
20 verde BAIXA IGUAL MICRO A4
T111
0
BAI
XO
fim_madr
ugada fim_tarde na_ns industrial
floria
nopol
is
4149
0225
div
20 verde BAIXA IGUAL PEQUENA A4
T011
0
BAI
XO ini_manha fim_tarde na_ns industrial
floria
nopol
is
2137
5144
div
25 verde MEDIA IGUAL MICRO A4
T111
1
ME
DIO fim_noite ini_noite medio industrial
floria
nopol
is
2644
2699
div
25
monomi
a NULL NULL MICRO A4
T111
1
BAI
XO fim_noite fim_noite na_ns industrial
floria
nopol
is
2876
4898
div
25 verde ALTA IGUAL PEQUENA A4
T111
1
ALT
O fim_noite fim_tarde baixo industrial
floria
nopol
is
2881
6421
div
25
monomi
a NULL NULL PEQUENA A4
T111
1
ME
DIO fim_noite fim_noite na_ns industrial
floria
nopol
is
3047
2888
div
25
monomi
a NULL NULL PEQUENA A4
T111
1
ME
DIO fim_noite fim_noite na_ns industrial
floria
nopol
is
3060
9417
div
25 verde MEDIA IGUAL PEQUENA A4
T111
1
ALT
O fim_noite fim_noite na_ns industrial
floria
nopol
is
4027
5630
div
25
monomi
a NULL NULL PEQUENA A4
T111
1
ME
DIO fim_noite fim_noite alto industrial
floria
nopol
is
4167
2226
div
25
monomi
a NULL NULL PEQUENA A4
T111
1
ME
DIO fim_noite fim_noite baixo industrial
floria
nopol
is
102
4239
8861
div
25 verde BAIXA IGUAL NULL A4
T000
0
BAI
XO NULL NULL NULL industrial
floria
nopol
is
2215
4435
div
27 verde BAIXA NULL MICRO A4
T011
1
BAI
XO ini_manha fim_noite medio industrial
floria
nopol
is
2725
8964
div
27
monomi
a NULL NULL MICRO A4
T011
0
BAI
XO ini_manha fim_tarde medio industrial
floria
nopol
is
2971
3111
div
27 verde MEDIA IGUAL MEDIA A4
T111
1
ME
DIO ini_manha
fim_madru
gada medio industrial
floria
nopol
is
3176
4815
div
27 verde BAIXA IGUAL PEQUENA A4
T011
0
BAI
XO ini_manha fim_tarde alto industrial
floria
nopol
is
4106
2029
div
27 verde MEDIA NULL MEDIA A4
T111
1
ME
DIO fim_noite fim_noite baixo industrial
floria
nopol
is
4230
7637
div
27 verde BAIXA NULL PEQUENA A4
T011
0
BAI
XO ini_manha fim_tarde medio industrial
floria
nopol
is
2387
6477
div
28 verde ALTA IGUAL MEDIA A4
T111
1
ALT
O fim_noite fim_noite medio industrial
floria
nopol
is
2848
2531
div
28 verde BAIXA NULL MEDIA A4
T011
1
ME
DIO
fim_madr
ugada fim_noite baixo industrial
floria
nopol
is
2959
2845
div
28 verde MEDIA NULL MEDIA A4
T111
1
ME
DIO
fim_madr
ugada
ini_madrug
ada alto industrial
floria
nopol
is
1932
2246
div
50 verde BAIXA IGUAL GRANDE A4
T011
0
BAI
XO ini_manha ini_noite NULL comercial
floria
nopol
is
1977
9467
div
50 verde MEDIA NULL NULL A4
T011
0
ME
DIO ini_manha fim_tarde NULL comercial
floria
nopol
is
2836
0045
div
50 verde BAIXA IGUAL MEDIA A4
T011
0
BAI
XO ini_manha ini_noite NULL comercial
floria
nopol
is
2840
0438
div
50 verde BAIXA IGUAL PEQUENA A4
T011
0
BAI
XO ini_manha ini_noite NULL comercial
floria
nopol
is
2865
3115
div
50 verde BAIXA NULL NULL A4
T011
0
BAI
XO ini_manha fim_tarde NULL comercial
floria
nopol
is
2969
6543
div
50 verde BAIXA NULL MEDIA A4
T011
0
BAI
XO ini_manha fim_tarde NULL comercial
floria
nopol
is
2998
1728
div
50 verde BAIXA IGUAL PEQUENA A4
T011
1
BAI
XO
fim_madr
ugada fim_noite NULL comercial
floria
nopol
is
3131
9498
div
50 verde BAIXA NULL PEQUENA A4
T011
0
BAI
XO ini_manha fim_tarde NULL comercial
floria
nopol
is
3156
1612
div
50 verde BAIXA IGUAL MEDIA A4
T111
1
BAI
XO fim_noite fim_noite NULL comercial
floria
nopol
is
4162
1982
div
50 verde BAIXA IGUAL MICRO A4
T011
0
BAI
XO ini_manha fim_tarde NULL comercial
floria
nopol
is
1901
2565
div
51 verde BAIXA IGUAL PEQUENA A4
T011
0
BAI
XO ini_manha fim_tarde NULL comercial
floria
nopol
is
2122
3824
div
51
monomi
a NULL NULL PEQUENA A4
T011
0
BAI
XO ini_manha ini_noite NULL comercial
floria
nopol
is
103
2487
2297
div
51 verde MEDIA IGUAL GRANDE A4
T011
1
ALT
O ini_manha fim_noite NULL comercial
floria
nopol
is
2573
7253
div
51 verde BAIXA IGUAL PEQUENA A4
T011
0
BAI
XO ini_manha fim_tarde NULL comercial
floria
nopol
is
2592
7591
div
51 verde BAIXA IGUAL MEDIA A4
T111
1
ME
DIO ini_manha
ini_madrug
ada NULL comercial
floria
nopol
is
4035
9893
div
51 verde MEDIA IGUAL PEQUENA A4
T011
0
BAI
XO ini_manha fim_tarde NULL comercial
floria
nopol
is
4180
6753
div
51 verde BAIXA NULL PEQUENA A4
T000
0
BAI
XO ini_manha fim_tarde NULL comercial
floria
nopol
is
4204
2978
div
51 verde MEDIA IGUAL PEQUENA A4
T011
0
ME
DIO ini_manha fim_tarde NULL comercial
floria
nopol
is
4328
9136
div
51 verde BAIXA IGUAL PEQUENA A4
T011
0
BAI
XO ini_manha fim_tarde NULL comercial
floria
nopol
is
4347
6394
div
51 verde MEDIA IGUAL PEQUENA A4
T011
0
BAI
XO ini_manha ini_noite NULL comercial
floria
nopol
is
1231
0234
div
52 verde BAIXA IGUAL PEQUENA A4
T011
1
BAI
XO ini_manha ini_noite NULL comercial
floria
nopol
is
1231
2938
div
52
monomi
a NULL NULL MEDIA A4
T011
0
BAI
XO ini_manha fim_tarde NULL comercial
floria
nopol
is
1836
8463
div
52 verde BAIXA NULL PEQUENA A4
T011
0
BAI
XO ini_manha fim_tarde NULL comercial
floria
nopol
is
2349
5660
div
52 verde MEDIA IGUAL NULL A4
T011
1
ME
DIO ini_manha ini_noite NULL comercial
floria
nopol
is
2524
7310
div
52 verde MEDIA NULL GRANDE A4
T011
1
ME
DIO ini_manha fim_noite NULL comercial
floria
nopol
is
2537
8806
div
52 verde BAIXA IGUAL PEQUENA A4
T011
1
BAI
XO
fim_madr
ugada fim_noite NULL comercial
floria
nopol
is
2539
1217
div
52
monomi
a NULL NULL GRANDE A4
T011
1
ME
DIO ini_manha fim_noite NULL comercial
floria
nopol
is
2551
7210
div
52 verde MEDIA NULL NULL A4
T011
1
ALT
O ini_manha fim_noite NULL comercial
floria
nopol
is
2553
4808
div
52 verde BAIXA NULL PEQUENA A4
T011
0
BAI
XO ini_manha ini_noite NULL comercial
floria
nopol
is
2568
9801
div
52 verde ALTA NULL GRANDE A4
T011
1
ALT
O ini_manha fim_noite NULL comercial
floria
nopol
is
2596
4985
div
52 verde BAIXA IGUAL PEQUENA A4
T011
1
BAI
XO ini_manha ini_noite NULL comercial
floria
nopol
is
2621
9213
div
52 verde BAIXA NULL PEQUENA A4
T011
0
BAI
XO ini_manha fim_tarde NULL comercial
floria
nopol
is
2736
5043
div
52 verde BAIXA IGUAL PEQUENA A4
T011
1
BAI
XO
fim_madr
ugada ini_noite NULL comercial
floria
nopol
is
2865
5681
div
52 verde MEDIA NULL GRANDE A4
T011
1
ME
DIO ini_manha fim_noite NULL comercial
floria
nopol
is
104
2878
3620
div
52 verde BAIXA NULL PEQUENA A4
T111
0
BAI
XO
fim_madr
ugada fim_tarde NULL comercial
floria
nopol
is
2949
9349
div
52 verde BAIXA IGUAL PEQUENA A4
T011
1
BAI
XO ini_manha ini_noite NULL comercial
floria
nopol
is
2951
7495
div
52 verde BAIXA IGUAL MEDIA A4
T011
1
ME
DIO ini_manha ini_noite NULL comercial
floria
nopol
is
2959
2977
div
52 verde BAIXA IGUAL PEQUENA A4
T011
0
BAI
XO ini_manha fim_tarde NULL comercial
floria
nopol
is
3146
0310
div
52 verde BAIXA IGUAL PEQUENA A4
T011
1
BAI
XO
fim_manh
a fim_noite NULL comercial
floria
nopol
is
3169
7093
div
52 verde MEDIA IGUAL MEDIA A4
T011
1
ME
DIO
fim_manh
a fim_noite NULL comercial
floria
nopol
is
3188
8387
div
52
monomi
a NULL NULL PEQUENA A4
T011
1
ME
DIO
fim_manh
a fim_noite NULL comercial
floria
nopol
is
3226
3305
div
52 verde BAIXA IGUAL PEQUENA A4
T011
0
BAI
XO ini_manha ini_noite NULL comercial
floria
nopol
is
4293
7886
div
52 verde BAIXA IGUAL MICRO A4
T011
0
BAI
XO
fim_madr
ugada ini_tarde NULL comercial
floria
nopol
is
3192
180
div
55 verde BAIXA IGUAL MEDIA A4
T111
1
ME
DIO fim_noite fim_noite NULL comercial
floria
nopol
is
1933
2721
div
55 verde BAIXA IGUAL MEDIA A4
T111
1
BAI
XO fim_noite fim_noite NULL comercial
floria
nopol
is
2141
3208
div
55
monomi
a NULL NULL MEDIA A4
T011
1
BAI
XO ini_manha fim_noite NULL comercial
floria
nopol
is
2442
1066
div
55
monomi
a NULL NULL PEQUENA A4
T111
1
ME
DIO fim_noite fim_noite NULL comercial
floria
nopol
is
2461
1302
div
55
monomi
a NULL NULL MEDIA A4
T111
1
ME
DIO fim_noite fim_noite NULL comercial
floria
nopol
is
2571
0460
div
55 verde MEDIA IGUAL GRANDE A4
T111
1
ME
DIO fim_noite fim_noite NULL comercial
floria
nopol
is
2926
2411
div
55 verde BAIXA NULL NULL A4
T111
1
BAI
XO
fim_manh
a
ini_madrug
ada NULL comercial
floria
nopol
is
2926
8959
div
55 verde BAIXA IGUAL MEDIA A4
T111
1
BAI
XO
fim_manh
a
ini_madrug
ada NULL comercial
floria
nopol
is
2951
9846
div
55 verde MEDIA IGUAL GRANDE A4
T111
1
BAI
XO fim_noite fim_noite NULL comercial
floria
nopol
is
3030
6147
div
55 verde BAIXA IGUAL PEQUENA A4
T011
1
BAI
XO
fim_madr
ugada fim_noite NULL comercial
floria
nopol
is
3182
9070
div
55 verde BAIXA IGUAL PEQUENA A4
T111
1
BAI
XO fim_noite fim_noite NULL comercial
floria
nopol
is
3195
3286
div
55 verde BAIXA NULL PEQUENA A4
T111
1
BAI
XO fim_noite fim_noite NULL comercial
floria
nopol
is
3216
3386
div
55 verde MEDIA NULL MEDIA A4
T111
1
ME
DIO fim_noite fim_noite NULL comercial
floria
nopol
is
105
4021
0342
div
55 verde BAIXA IGUAL PEQUENA A4
T011
1
ME
DIO
fim_madr
ugada fim_noite NULL comercial
floria
nopol
is
4186
3943
div
55 verde BAIXA IGUAL PEQUENA A4
T011
1
ME
DIO
fim_manh
a fim_noite NULL comercial
floria
nopol
is
4328
6684
div
55 verde BAIXA NULL MEDIA A4
T111
1
ME
DIO fim_noite fim_noite NULL comercial
floria
nopol
is
4498
8798
div
55 verde BAIXA IGUAL PEQUENA A4
T011
1
BAI
XO
fim_manh
a fim_noite NULL comercial
floria
nopol
is
1231
0056
div
70
monomi
a NULL NULL MICRO A4
T011
1
BAI
XO ini_manha ini_noite NULL comercial
floria
nopol
is
1849
1648
div
70 verde ALTA IGUAL GRANDE A4
T011
1
NUL
L
fim_manh
a fim_noite NULL comercial
floria
nopol
is
2274
8386
div
70 verde MEDIA NULL GRANDE A4
T011
1
ME
DIO ini_manha ini_noite NULL comercial
floria
nopol
is
2333
6596
div
70 verde ALTA IGUAL GRANDE A4
T111
1
ALT
O fim_noite fim_noite NULL comercial
floria
nopol
is
2343
3575
div
70
monomi
a NULL NULL NULL A4
T111
1
BAI
XO fim_noite fim_noite NULL comercial
floria
nopol
is
2458
1985
div
70
monomi
a NULL NULL PEQUENA A4
T011
1
ME
DIO ini_manha fim_noite NULL comercial
floria
nopol
is
2537
2654
div
70
monomi
a NULL NULL PEQUENA A4
T111
1
BAI
XO fim_noite fim_noite NULL comercial
floria
nopol
is
2537
8644
div
70 verde BAIXA NULL PEQUENA A4
T011
1
ME
DIO
fim_madr
ugada ini_noite NULL comercial
floria
nopol
is
2572
4623
div
70 azul BAIXA
POUC
O_INF
ERIOR
GRANDE A4 T110
0
ME
DIO
ini_madru
gada fim_manha NULL comercial
floria
nopol
is
2601
3208
div
70
monomi
a NULL NULL GRANDE A4
T111
1
ME
DIO fim_noite fim_noite NULL comercial
floria
nopol
is
2660
8988
div
70 verde MEDIA IGUAL MEDIA A4
T111
1
ALT
O fim_noite fim_noite NULL comercial
floria
nopol
is
2691
4884
div
70
monomi
a NULL NULL NULL A4
T111
1
BAI
XO fim_noite fim_noite NULL comercial
floria
nopol
is
2737
3623
div
70 verde MEDIA NULL MICRO A4
T011
0
ME
DIO ini_manha fim_tarde NULL comercial
floria
nopol
is
2879
2921
div
70 verde BAIXA IGUAL MEDIA
NU
LL
T011
0
BAI
XO ini_manha ini_noite NULL comercial
floria
nopol
is
2879
4541
div
70 verde MEDIA IGUAL NULL A4
T111
1
ME
DIO fim_noite fim_noite NULL comercial
floria
nopol
is
2925
1975
div
70 verde BAIXA IGUAL NULL A4
T111
1
ME
DIO fim_noite fim_noite NULL comercial
floria
nopol
is
2939
4636
div
70 verde BAIXA NULL MICRO A4
T011
1
BAI
XO ini_manha fim_noite NULL comercial
floria
nopol
is
2944
4285
div
70
monomi
a NULL NULL MICRO A4
T011
1
BAI
XO ini_manha fim_noite NULL comercial
floria
nopol
is
106
3104
7781
div
70 verde MEDIA IGUAL NULL A4
T000
0
BAI
XO NULL NULL NULL comercial
floria
nopol
is
3183
0133
div
70 verde BAIXA IGUAL MICRO A4
T011
1
BAI
XO ini_manha fim_noite NULL comercial
floria
nopol
is
3227
6229
div
70 azul
MUITO
_ALTA
POUC
O_INF
ERIOR
GRANDE A4 T111
1
NUL
L fim_noite fim_noite NULL comercial
floria
nopol
is
4059
3055
div
70 verde ALTA NULL NULL A4
T011
1
ALT
O ini_manha fim_noite NULL comercial
floria
nopol
is
4238
8750
div
70 verde ALTA IGUAL MEDIA A4
T011
1
ALT
O ini_manha fim_noite NULL comercial
floria
nopol
is
4324
1567
div
70 verde ALTA NULL GRANDE A4
T011
1
ALT
O
fim_manh
a fim_noite NULL comercial
floria
nopol
is
4531
0795
div
70
monomi
a NULL NULL PEQUENA
NU
LL
T111
1
BAI
XO fim_noite fim_noite NULL comercial
floria
nopol
is
7784
546
div
74
monomi
a NULL NULL PEQUENA A4
T011
0
BAI
XO ini_manha fim_tarde NULL comercial
floria
nopol
is
1890
9537
div
74 verde BAIXA IGUAL MEDIA A4
T011
1
BAI
XO ini_manha ini_noite NULL comercial
floria
nopol
is
1965
6403
div
74
monomi
a NULL NULL GRANDE
NU
LL
T011
0
BAI
XO ini_manha fim_tarde NULL comercial
floria
nopol
is
2515
1828
div
74 verde ALTA IGUAL GRANDE A4
T011
0
ALT
O ini_manha fim_tarde NULL comercial
floria
nopol
is
2561
8424
div
74 verde BAIXA IGUAL GRANDE A4
T011
0
BAI
XO ini_manha fim_tarde NULL comercial
floria
nopol
is
2818
3330
div
74 verde BAIXA IGUAL GRANDE A4
T011
0
BAI
XO ini_manha fim_tarde NULL comercial
floria
nopol
is
2907
8548
div
74 verde MEDIA NULL NULL A4
T011
1
ME
DIO ini_manha fim_noite NULL comercial
floria
nopol
is
2923
0900
div
74 verde BAIXA IGUAL PEQUENA A4
T011
0
BAI
XO
fim_madr
ugada fim_tarde NULL comercial
floria
nopol
is
3013
3447
div
74 verde BAIXA IGUAL MEDIA A4
T111
0
ME
DIO
fim_madr
ugada fim_tarde NULL comercial
floria
nopol
is
3095
7121
div
74 verde BAIXA NULL MEDIA A4
T011
1
BAI
XO ini_manha fim_noite NULL comercial
floria
nopol
is
3115
2984
div
74 verde BAIXA IGUAL GRANDE A4
T011
0
BAI
XO ini_manha ini_noite NULL comercial
floria
nopol
is
3169
3900
div
74 verde BAIXA NULL MEDIA A4
T011
0
ME
DIO ini_manha fim_tarde NULL comercial
floria
nopol
is
3182
6578
div
74 verde MEDIA NULL GRANDE A4
T011
1
ME
DIO ini_manha ini_noite NULL comercial
floria
nopol
is
4056
2567
div
74 verde BAIXA NULL MICRO A4
T011
0
BAI
XO ini_manha fim_tarde NULL comercial
floria
nopol
is
4095
5895
div
74 verde BAIXA IGUAL PEQUENA A4
T011
1
BAI
XO ini_manha ini_noite NULL comercial
floria
nopol
is
107
2315
572
div
85 verde BAIXA IGUAL PEQUENA A4
T011
1
BAI
XO ini_manha ini_noite NULL comercial
floria
nopol
is
3116
778
div
85 verde BAIXA NULL PEQUENA A4
T011
0
BAI
XO ini_manha ini_noite NULL comercial
floria
nopol
is
1231
3004
div
85
monomi
a NULL NULL MEDIA A4
T011
0
BAI
XO ini_manha ini_noite NULL comercial
floria
nopol
is
1235
1089
div
85 verde ALTA IGUAL GRANDE A4
T111
1
ME
DIO fim_noite fim_noite NULL comercial
floria
nopol
is
2165
9983
div
85 verde BAIXA NULL MEDIA A4
T011
1
BAI
XO ini_manha fim_noite NULL comercial
floria
nopol
is
2247
3085
div
85 verde MEDIA IGUAL GRANDE A4
T011
1
ALT
O ini_manha fim_noite NULL comercial
floria
nopol
is
2247
9490
div
85
monomi
a NULL NULL NULL A4
T011
0
BAI
XO ini_manha fim_tarde NULL comercial
floria
nopol
is
2543
2169
div
85 verde MEDIA IGUAL MEDIA A4
T111
1
ALT
O fim_noite fim_noite NULL comercial
floria
nopol
is
2582
6663
div
85
monomi
a NULL NULL MEDIA A4
T111
1
BAI
XO fim_noite fim_noite NULL comercial
floria
nopol
is
2604
9857
div
85 verde BAIXA IGUAL PEQUENA A4
T011
0
BAI
XO ini_manha ini_noite NULL comercial
floria
nopol
is
2741
5440
div
85 verde MEDIA NULL GRANDE A4
T111
1
ALT
O fim_noite fim_noite NULL comercial
floria
nopol
is
2814
0266
div
85
monomi
a NULL NULL GRANDE A4
T111
1
BAI
XO fim_noite fim_noite NULL comercial
floria
nopol
is
2979
5487
div
85 verde MEDIA IGUAL NULL A4
T111
1
ME
DIO fim_noite fim_noite NULL comercial
floria
nopol
is
3007
3681
div
85 verde BAIXA IGUAL MEDIA A4
T111
1
BAI
XO fim_noite fim_noite NULL comercial
floria
nopol
is
3040
4688
div
85 verde BAIXA NULL GRANDE A4
T011
1
ME
DIO
fim_madr
ugada fim_noite NULL comercial
floria
nopol
is
3132
9000
div
85 verde MEDIA NULL NULL A4
T011
1
ME
DIO ini_manha ini_noite NULL comercial
floria
nopol
is
3135
3530
div
85 verde MEDIA IGUAL GRANDE A4
T011
0
ME
DIO ini_manha fim_tarde NULL comercial
floria
nopol
is
3169
6259
div
85 verde BAIXA IGUAL NULL A4
T111
1
ME
DIO fim_noite fim_noite NULL comercial
floria
nopol
is
3226
8927
div
85
monomi
a NULL NULL NULL A4
T111
1
BAI
XO fim_noite fim_noite NULL comercial
floria
nopol
is
4006
9160
div
85
monomi
a NULL NULL MEDIA A4
T111
1
ME
DIO fim_noite fim_noite NULL comercial
floria
nopol
is
4094
4630
div
85
monomi
a NULL NULL MEDIA A4
T011
1
ME
DIO ini_manha ini_noite NULL comercial
floria
nopol
is
4124
1950
div
85 verde BAIXA IGUAL PEQUENA A4
T011
1
BAI
XO
fim_madr
ugada fim_noite NULL comercial
floria
nopol
is
108
4334
5621
div
85 verde MEDIA IGUAL GRANDE A4
T111
1
ALT
O fim_noite fim_noite NULL comercial
floria
nopol
is
4360
7928
div
85 verde MEDIA IGUAL NULL A4
T111
1
ME
DIO fim_noite fim_noite NULL comercial
floria
nopol
is