descriÇÃo do consumo de energia de consumidores

LUCAS MARIN ROSÁRIO

DESCRIÇÃO DO CONSUMO DE ENERGIA DE CONSUMIDORES INDUSTRIAIS E COMERCIAIS UTILIZANDO DESCOBERTA DE

CONHECIMENTO EM BASE DE DADOS

Itajaí (SC), janeiro de 2014

UNIVERSIDADE DO VALE DO ITAJAÍ

CURSO DE MESTRADO ACADÊMICO EM

COMPUTAÇÃO APLICADA



por

Lucas Marin Rosário Dissertação apresentada como requisito parcial à obtenção do grau de Mestre em Computação Aplicada. Orientador: Raimundo C. G. Teive, Doutor

Itajaí (SC), janeiro de 2014



Lucas Marin Rosário

01 / 2014

Orientador: Raimundo C. G. Teive, Doutor

Área de Concentração: Computação Aplicada

Linha de Pesquisa: Inteligência Artificial

Palavras-chave: previsão de demanda, mineração de dados, KDD, RNA.

Número de páginas: 108

RESUMO

O aumento do consumo de energia elétrica é cada vez maior no Brasil devido principalmente a aspectos econômicos e sociais. O entendimento da dinâmica do comportamento do consumo de energia em função das variáveis climáticas, econômicas e sociais, por exemplo, é fundamental para que as empresas de distribuição possam realizar estudos de previsão do crescimento da demanda com maior acuracidade, melhorando assim o planejamento do seu sistema. Dados de consumo dos clientes da concessionária de distribuição de energia elétrica de Santa Catarina (CELESC Distribuição) apontam que as classes industrial e comercial respondem por aproximadamente 60% do consumo total de energia do estado. O comportamento do consumidor residencial já tem sido foco de pesquisas há muito tempo, sendo bem conhecido. Assim, prever o consumo de energia elétrica para a indústria e o comércio é de vital importância para o estado de Santa Catarina e para o país no que se refere ao planejamento de sua matriz energética. Neste trabalho é proposto um modelo que permite a determinação do perfil de consumo diário de consumidores de energia elétrica e a previsão do montante de energia a ser consumida, tanto no comércio quanto na indústria, considerando de forma desagregada por atividade econômica. Busca-se conhecer os padrões de perfis de curvas de carga diária utilizando-se técnicas de clusterização. Com a aplicação de questionários e busca de regras de associação é possível determinar o perfis de consumidores de energia elétrica bem como as variáveis que influenciam cada perfil. Para uma melhor eficiência no planejamento de uma planta energética, além de conhecer o perfil diário dos consumidores é interessante prever o consumo médio mensal de cada divisão econômica, realizando a previsão do montante de demanda de energia elétrica mensal com o auxílio de redes neurais artificiais (RNA). Resultados preliminares, obtidos a partir dos dados de uma região de Santa Catarina, têm demonstrado a potencialidade desta metodologia para descrever o comportamento do consumo de energia elétrica de consumidores industriais e comerciais.

ENERGY CONSUMPTION DESCRIPTION OF INDUSTRIAL AND COMMERCIAL CONSUMERS USING KNOWLEDGE

DISCOVERY IN DATABASE

Lucas Marin Rosário

01 / 2014

Advisor: Raimundo C. G. Teive, Doutor

Concentration Area: Applied Computing

Reseach Line: Artifical Intelligence

Keywords: Demand Forecasting, Data Mining, KDD, ANN.

Number of Pages: 108

ABSTRACT The electricity consumption is increasing in Brazil mainly due to economic and social aspects. Understand the dynamic behavior of energy consumption due to climatic, economic and social variables, for example, is essential for the distribution companies for conduct studies of the demand growth forecast with greater accuracy, and then improving the planning of your system. Consumption data of customers of the utility distribution of electricity from Santa Catarina (CELESC Distribution) indicate that the industrial and commercial sectors account for approximately 60 % of total energy consumption in the state. The behavior of the residential consumer has already been the focus of much research time and is well known there. Predicting the consumption of electricity for industry and trade is of vital importance to the state of Santa Catarina and the country in relation to the planning of its energy matrix. This paper proposes a model that allows the determination of the daily consumption of electricity consumers and the amount of energy to be consumed, both in trade and in industry forecast profile, considering disaggregated by economic activity. We are looking for the patterns of daily load curves profiles using clustering techniques. Using questionnaires and association rules can determine the profiles of consumers of electricity as well as variables that influence each profile. For better efficiency in the planning of an energy plant and to meet everyday consumer profile is interesting to predict the average monthly consumption of each economic divide, making the prediction of the amount of monthly electricity demand with the aid of artificial neural networks (RNA). Preliminary results from the data of a region of Santa Catarina have demonstrated the potential of this methodology to describe the behavior of the electricity consumption of industrial and commercial consumers.

LISTA DE ILUSTRAÇÕES

Figura 1 - Etapas do processo de KDD .......................................................................................... 20

Figura 2 - Clusterização em espaço 2D. (a) Dados iniciais; (b) três clusters formados; (c) Quatro Clusters formados. ................................................................................................................. 23

Figura 3 -Modelo não linear de neurônio. ...................................................................................... 31

Figura 4 - Representação do Neurônio de Base Radial................................................................... 37

Figura 5 - Passos Para Determinação do Perfil dos Consumidores. ................................................ 56

Figura 6 - Tipologias da Classe Industrial – Joinville e Florianópolis. ........................................... 58

Figura 7 - Tipologias da Classe Comercial – Joinville e Florianópolis. .......................................... 60

Figura 8 – MLP Testada. ............................................................................................................... 71

Figura 9 - Linha Amarela – Tabela 6. ............................................................................................ 73

Figura 10 - Linha Verde – Tabela 6. .............................................................................................. 74


Figura 12 - Linha Amarela – Tabela 9. .......................................................................................... 78


Figura 14 - Linha Amarela – Tabela 10. ........................................................................................ 81

Figura 15 - Linha vermelha – Tabela 11. ....................................................................................... 82

Figura 16 - Linha amarela – Tabela 11. ......................................................................................... 83

Figura 17 - Linha Verde – Tabela 11. ............................................................................................ 84

Figura 18 - Linha Azul – Tabela 11. .............................................................................................. 84

Figura 19 - Curva de Carga do Empreendimento de Uso Coletivo. ................................................ 86

Figura 20 - Curva diária total ........................................................................................................ 87

Quadro 1 - Tarefas para Descoberta de Conhecimento e suas Aplicações. ..................................... 21

Quadro 2 – Artigos Selecionados .................................................................................................. 44

Quadro 3 - Comparativo dos Artigos ............................................................................................. 44

Quadro 4 – Atividades Consideradas – CNAE Indústra. ................................................................ 48

Quadro 5 – Atividades Consideradas – CNAE Comércio. ............................................................. 49

Quadro 6- Parâmetrização das Respostas do Questionário. ............................................................ 62

Quadro 7 – Conjunto Mínimo de 17 Regras para 7 Tipologias Industriais. .................................... 64

Quadro 8 – Conjunto Mínimo de 24 Regras para 8 Tipologas Comerciais. .................................... 66

LISTA DE TABELAS

Tabela 1 - Número de Amostras da Classe Industrial para 8 Regionais. ......................................... 51

Tabela 2 - Número de Amostras da Classe Comercial para 8 Regionais. ........................................ 51

Tabela 3 - Relação de Consumidores e disponibilidade de dados. .................................................. 53

Tabela 4 - Matriz de Confusão – 7 Tipologias Industriais .............................................................. 65

Tabela 5 – Matriz de Confusão – 8 Tipologias Comerciais. ........................................................... 68

Tabela 6 – Resultados modelo reduzido ....................................................................................... 72

Tabela 7 – Resultados – Todas as variáveis ................................................................................... 75

Tabela 8 - Resultados 7 variáveis A............................................................................................... 77

Tabela 9 - Resultados 7 variáveis B. .............................................................................................. 77

Tabela 10 - Resultados 4 variáveis. ............................................................................................... 80

Tabela 11- Resultados Autoregressivo........................................................................................... 81

LISTA DE ABREVIATURAS E SIGLAS

ANEEL Agência Nacional de Energia Elétrica ANFIS Adaptive Neuro Fuzzy Inference System ANN Artificial Neural Network

API Application Programming Interface

ARIMA Autoregressive Integrated Moving Average CDI Clustering Dispersion Indicator CELESC Centrais Elétricas de Santa Catarina CNAE Cadastro Nacional de atividade econômica ENCOG Advanced Machine Learning Framework

ETL Extração Transformação e Carga GRNN General Regression Neural Network

GWh Gigawatt-hora

IEEE Institute of Electrical and Electronics Engineers

IPCA Índice Nacional de Preços ao Consumidor Amplo KDD knowledge-discovery in databases

kVA Kilovoltampere LMS Least Mean Square

MAPE Mean Absolute Percentage Error MATLAB Matrix Laboratory

MCA Mestrado em Computação Aplicada MIA Mean Index Adequacy MLP Multilayer Perceptron MLR Multiple Linear RegressionMSE Mean Square Error

PHP Hypertext Preprocessor

PIB Produto Interno Bruto PL/SQL Procedural Language/Structured Query Language

RBF Radial Basis Function RNA Redes Neurais artificiais SELIC Sistema Especial de Liquidação e de Custódia SPV Supervised Association Generator

TRAINBR Bayesian regulation backpropagation

TRAINLM Levenberg-Marquardt backpropagation

TR Taxa Referencial de Juros UNIVALI Universidade do Vale do Itajaí VA Valor Agregado da Indústria

7

SUMÁRIO

1 INTRODUÇÃO ...................................................................................... 9

1.1 PROBLEMA DE PESQUISA .......................................................................... 9

1.1.1 Solução Proposta .......................................................................................... 11

1.1.2 Delimitação de Escopo ................................................................................. 12

1.2 OBJETIVOS ................................................................................................... 13

1.2.1 Objetivo Geral .............................................................................................. 14

1.2.2 Objetivos Específicos ................................................................................... 14

1.3 JUSTIFICATIVA ........................................................................................... 14

1.4 METODOLOGIA ........................................................................................... 16

1.4.1 Metodologia da Pesquisa.............................................................................. 16

1.4.2 Procedimentos Metodológicos ..................................................................... 16

2 FUNDAMENTAÇÃO TEÓRICA ...................................................... 19

2.1 DESCOBERTA DE CONHECIMENTOS EM BASE DE DADOS ............ 19

2.1.1 O Processo de Descoberta de Conhecimento .............................................. 19

2.1.2 Tarefas de Mineração de Dados .................................................................. 20

2.1.3 Tarefa de Clusterização ............................................................................... 22

2.1.4 O algoritmo de clusterização K-means ....................................................... 23

2.1.5 Exemplos de Aplicação na Literatura ......................................................... 24

2.1.6 Regras de Associação ................................................................................... 25

2.2 PREVISÃO DE CONSUMO DE ENERGIA ELÉTRICA ........................... 28

2.2.1 O Problema de Previsão............................................................................... 28

2.2.2 Previsão de Séries Temporais ...................................................................... 29

2.2.3 Previsão de Consumo de Energia Elétrica .................................................. 30

2.3 REDES NEURAIS ARTIFICIAIS ................................................................ 30

2.3.1 Conceitos Básicos ......................................................................................... 30

2.3.2 Funcionamento Básico e Principais Topologias de RNA ........................... 32

2.3.3 Rede MLP (Multilayer Perceptron) ............................................................ 33

2.3.4 Rede RBF (Radial Basis function) ............................................................... 37

2.4 CONSIDERAÇÕES FINAIS ......................................................................... 38

3 METODOS DE PREVISÃO PARA SISTEMAS DE ENERGIA ELÉTRICA ............................................................................................... 39

3.1 INTRODUÇÃO .............................................................................................. 39

3.2 PREVISÃO EM SISTEMAS DE ENERGIA ELÉTRICA. .......................... 40

3.3 TRABALHOS UTILIZANDO RNA ............................................................. 41

3.4 ANÁLISE TRABALHOS CORRELATOS .................................................. 44


4 ABORDAGEM PROPOSTA ............................................................. 47

8

4.1 PRÉ – PROCESSAMENTO DOS DADOS ................................................... 47

4.2 CÁLCULO DA AMOSTRA PARA MEDIÇÃO .......................................... 49

4.3 MEDIÇÃO DA CURVA DE CARGA DE CONSUMIDORES ................... 53

4.4 PESQUISA COM OS CONSUMIDORES VIA QUESTIONÁRIO ............ 53

4.5 CLUSTERIZAÇÃO – IDENTIFICAÇÃO DOS PERFIS DE CARGA DIÁRIA TÍPICOS .................................................................................................. 54

4.6 APLICAÇÃO DA METODOLOGIA PROPOSTA ..................................... 55


5 RESULTADOS .................................................................................... 58

5.1 RESULTADOS – DETERMINAÇÃO DO PERFIL DE CONSUMIDORES . ................................................................................................................ 58

5.1.1 Clusterização ................................................................................................ 58

5.1.2 Resultados Regras de Associação ................................................................ 61

5.2 RESULTADOS - PREVISÃO PARA A DIVISÃO CNAE 15 ...................... 68

5.2.1 Variáveis de entrada .................................................................................... 68

5.2.2 Topologia ...................................................................................................... 70

5.2.3 Validação do protótipo com matlab ............................................................ 71

5.3 ESPECIFICAÇÃO DO TRANSFORMADOR ............................................. 85

5.4 COMENTÁRIOS FINAIS ............................................................................. 87

6 CONCLUSÃO ...................................................................................... 88

SUGESTÕES PARA TRABALHOS FUTUROS ................................. 90

REFERÊNCIAS ....................................................................................... 91

APÊNDICE A - TRABALHOS CORRELATOS ................................. 95

APÊNDICE B – QUESTIONÁRIO APLICADO ................................. 96

APÊNDICE C – TODAS AS RESPOSTAS DOS QUESTIONÁRIOS APLICADOS ............................................................................................ 97

9

1 INTRODUÇÃO

O aumento da densidade demográfica no Brasil e os aspectos econômicos e sociais afetam

diretamente o consumo de energia elétrica. A melhora no poder aquisitivo da população pode levar

a um aumento na aquisição de equipamentos eletroeletrônicos, elevando não só o consumo

residencial, que está fora do escopo deste trabalho, mas também o consumo comercial e industrial,

segmentos foco deste estudo.

Mudanças nos hábitos de consumo e da tecnologia são fenômenos que ocorrem cada vez

mais e sua influência na determinação da carga a ser atendida é de fundamental importância para as

empresas do setor elétrico. Assim, estabelecer a relação entre o comportamento da população e o

consumo de energia é de fundamental importância para a economia do país e de interesse de

empresas e agentes ligados ao mercado de energia elétrica. Porém, prever a demanda de energia

elétrica é um processo complexo devido às múltiplas variáveis de influência. Variáveis econômicas

e parâmetros do clima são algumas delas (ANDRADE; CAMARGO; TEIVE, 2010).

A diferença entre as demandas máximas e mínimas, consumidas em um mesmo dia,

apresenta grande variação de acordo com o segmento ao qual pertence o consumidor: comercial ou

industrial. Assim, torna-se fundamental o conhecimento das curvas de carga diárias típicas dos

consumidores para as empresas de distribuição de energia elétrica, além da previsão do montante de

energia a ser consumida, com reflexos diretos no planejamento da expansão e no dimensionamento

das suas redes, em especial dos transformadores.

Neste contexto pretende-se desenvolver um modelo computacional, baseado em técnicas de

Mineração de Dados, para descrever o comportamento do consumidor industrial e comercial de

Santa Catarina, estimar os seus perfis dinâmicos de consumo de energia elétrica, divididos por

atividades econômicas dos consumidores (atividades CNAE), levando em consideração também

mudanças de hábito de consumo devido a influência de variáveis econômicas e aos efeitos

climáticos correlacionados. Adicionalmente, pretende-se propor para cada atividade CNAE

selecionada para indústria e para o comércio, uma topologia de RNA que seja mais eficiente para

previsão de curto prazo da demanda de energia elétrica.

1.1 PROBLEMA DE PESQUISA

10

Historicamente pode-se observar o vasto uso de técnicas de previsão de séries temporais na

previsão de carga em sistemas de energia elétrica. Modelos de Suavização Exponencial (CHAN et

al., 2012), modelos auto-regressivos(AR) (HILL et al., 2012) e modelos ARIMA (AREEKUL et al.,

2010) tem sido, dentre as técnicas de previsão de séries temporais, as mais utilizadas. No entanto,

esses modelos não levam em consideração as múltiplas variáveis envolvidas no consumo de energia

elétrica, especialmente áquelas relativas á indústria e ao comércio. Carga instalada, turnos, fatores

econômicos e climáticos, são alguns exemplos de variáveis à serem consideradas no estudo do

comportamento do consumo de energia elétrica na indústria e no comércio

Atualmente, Redes Neurais Artificiais (RNA) têm sido largamente utilizadas para a previsão

de carga em sistemas de energia, particularmente em estudos com horizonte de curto e médio prazo

(até 12 meses). As tipologias mais encontradas nesta pesquisa foram: MLP - multylayer perceptron

(SANTANA et al., 2011), RBF – radial basis functions (Yun et al., 2008) e GRNN – general

regression neural network (NOSE; LOTUFO; MINUSSI, 2011). Nesses exemplos pode-se notar o

uso de diferentes variáveis de entrada, além dos dados históricos de consumo, como dados de

temperatura e preço da energia elétrica.

Porém, apesar do vasto registro de publicações encontrado na literatura, o que ficou

evidenciado pela revisão sistemática da literatura efetuada, utilizando-se RNA na previsão de carga

em sistemas de energia elétrica, observa-se que o foco tem sido a previsão do montante de consumo

de energia. A descoberta do perfil de consumo dos consumidores não é facilmente encontrada. No

trabalho apresentado por Andrade (2013), o perfil de consumo é determinado utilizando-se técnicas

de KDD (knowledge-discovery in databases – Descoberta de conhecimento em base de dados), com

foco na etapa de Mineração de dados; preocupando-se com os efeitos dinâmicos da economia, ou do

clima sobre o comportamento da demanda desagregada, separada por atividade econômica (CNAE).

A partir da determinação do perfil dos consumidores é possível construir um modelo previsor

baseado em RNA para cada grupo de consumidores e as variáveis de maior influência em cada

cluster e prever o montante do consumo de energia elétrica.

Nesse sentido, o foco desta pesquisa consiste em determinar o padrão do perfil de consumo

diário (curvas de carga) dos consumidores industriais e comerciais, separando-os em tipologias

encontradas com uso de técnicas de KDD e realizar a previsão do montante do consumo mensal

com a aplicação de RNA; considerando as atividades CNAE mais relevantes do estado de Santa

Catarina. O conhecimento do perfil de carga de consumidores industriais e comerciais tem

11

fundamental importância para a empresa de distribuição. Em especial, este conhecimento pode ser

utilizado em uma aplicação prática importante, que é a especificação do transformador que vai

alimentar um edifício misto, envolvendo por exemplo unidades comerciais e;ou industriaisNa

prática, como não existe uma metodologia eficiente tem-se observado em muitos casos o

superdimensionamento destes transformadores..

1.1.1 Solução Proposta

Os dados de consumo de energia elétrica de todo o estado de Santa Catarina, divididos por

atividade econômica, foram obtidos junto à empresa distribuidora de energia elétrica (Celesc). Após

o pré-processamento desses dados e com o auxílio de técnicas estatísticas pode-se determinar as

atividades econômicas que apresentem maior representatividade em termos de montante de

consumo e quantidade de consumidores.

Dentre as atividades econômicas obtidas da análise estatística, foi possível selecionar um

percentual de consumidores de cada classe CNAE da região de interesse, onde foi possível ter

acesso aos dados de medição dos consumidores. Como para alguns consumidores de interesse para

este estudo a Celesc não armazena os seus consumos diários, foi necessário também realizar

algumas medições. Questionários foram aplicados aos consumidores com dados de medição

disponível a fim de se idenficar variáveis de influência no consumo de energia elétrica desses

consumidores.

Com os dados de medição e as curvas diárias de consumo foi possível procurar perfis de

consumo utilizando-se algoritmos de clusterização. Neste trabalho foi utilizado o algoritmo k-

means, baseado na análise e comparação de dados, fornecendo uma classificação automática não

supervisionada. Esta técnica é muito utilizada na literatura conforme observado em Prahastono et

al., (2008) e Anuar e Zakaria (2010). Com o auxílio do MATLAB o algoritmo foi executado para

obtenção dos clusters.

Os resultados dos questionários, aplicados nos consumidores medidos ou com medição

disponibilizados pela Celesc, foram utilizados para analisar as variavéis de influência para cada

12

cluster, gerando regras de associação, por meio do levantamento das características funcionais dos

estabelecimentos obtidos com técnicas de mineração de dados, como busca de associações e uma

variante do algoritmo Apriori1, o SPV2.

Redes neurais artificiais são então utilizadas para prever o montante de consumo de energia

elétrica tendo como entrada os dados históricos de consumo e as variáveis econômicas e climáticas.

As hipóteses a serem comprovadas ou refutadas são:

Hipotese 1: É possível agrupar os perfis de carga definindo-se padrões de consumo

diferenciados dos consumidores industriais e comerciais de uma região do estado de Santa Catarina

utilizando técnicas de KDD.

Hipotese 2: É possível prever a variação do consumo de energia elétrica mensal da indústria

e do comércio em uma regiao do estado de Santa Catarina com acuracidade adequada utilizando-se

redes neurais artificiais.

A solução proposta é baseada na construção de um modelo computacional capaz de

descrever o consumo de energia elétrica, de consumidores industriais e comerciais do estado, a

partir da estimativa do perfil das curvas de carga destes consumidores, e da previsão da variação do

montante de energia, integrada às atividades econômicas e variáveis econômicas por meio de

técnicas de KDD e RNA.

1.1.2 Delimitação de Escopo

Os dados de consumo dos clientes da concessionária de distribuição de energia elétrica de

Santa Catarina (Celesc) apontam que as classes Industrial e Comercial respondem por

aproximadamente 60% do consumo total de energia do estado. Neste sentido, é justo imaginar, que

conhecendo-se o comportamento e perfil de consumo destas classes econômicas, associado com o

1 Algoritmo de mineração de dados para busca de regras de associação onde o antecedente leva ao consequente. Só

permite a execução com variáveis binárias, como verdadeiro ou falso. 2 Variação do algoritmo Apriori - permite entradas de variáveis que podem assumir mais de dois valores e não apenas valores binários.

13

perfil de consumo da classe residencial, da qual o comportamento já é mais conhecido por parte da

concessionária, ter-se-ia um panorama bem significativo do consumo de energia elétrica, com mais

de 80% do consumo total do estado. Uma amostra do comércio e indústria com nível de confiança

de 90% e erro amostral de 10% foi extraída a fim de obter resultados representativos na descrição

do consumo. Buscando-se manter uma boa representatividade em termos de consumo de energia e

de número de consumidores, das 16 regionais existentes da Celesc, buscou-se selecionar 8 regionais

que pudessem representar mais da metade do consumo e do número de consumidores das classes

comerciais e industriais do estado.

Além disso, a pesquisa concentrou-se nas divisões do CNAE mais representativas, ou seja,

as divisões selecionadas contemplaram pelo mesmo 75% do consumo dentro de cada uma das duas

classes de consumidores, além de pelo menos 75% do número total de consumidores Assim, foi

possível encontrar 8 regionais que tivessem a representatividade desejada, considerando todas as

divisões CNAE. Estas regionais são: Grande Florianópolis, Blumenau, Concórdia, Chapecó,

Joaçaba, Joinville, Lages e Videira.

A partir da definição das regionais selecionadas foi possível definir as atividades CNAE da

indústria e do comércio, a serem consideradas no cálculo da amostra para definição da coleta dos

dados de medição. Neste caso, manteve-se como parâmetro de referência a representatividade de

consumo e de número de estabecimentos. Assim, considerando as 8 regionais escolhidas,

conseguiu-se representar, com apenas 8 divisões CNAE, mais de 76% do consumo de energia e

cerca de 65% dos consumidores industriais de Santa Catarina. Da mesma forma, foi possível

agregar, com apenas 7 divisões CNAE, quase 75% do consumo de energia e mais de 76% dos

consumidores comerciais resultando em uma elevada representatividade para este tipo de pesquisa.

Neste contexto as regiões de Joinville e Florianópolis foram as regiões selecionadas neste

trabalho por ter o maior número de dados disponíveis. Elas podem ser consideradas as regiões

piloto e o método pode ser replicado nas outras regionais do estado. Para a previsão de demanda foi

utilizada como piloto a divisão CNAE 15, também pelo fato de ser a classe com maior volume de

dados (de 1997 à 2011).

1.2 OBJETIVOS

Os objetivos deste trabalho são descritos a seguir.

14

1.2.1 Objetivo Geral

Desenvolver um modelo computacional capaz de realizar a classificação do perfil do

consumo dividido por atividade econômica e prever a variação do montante do consumo mensal de

energia elétrica de consumidores comerciais e industriais.

1.2.2 Objetivos Específicos

1. Fazer o levantamento do estado da arte sobre previsão de demanda em sistemas de

energia elétrica;

2. Fazer o pré-processamento dos dados de medição de energia disponibilizados pela

concessionária de energia;

3. Aplicar o algoritmo k-means para obter os padrões de perfis de carga (tipologias de

curvas de carga);

4. Gerar um conjunto de regras de associação, envolvendo as respostas dos questionários e

as tipologias de curvas de carga obtidas;

5. Modelar uma RNA para previsão de curto prazo da variação do montante de energia para

o CNAE piloto;

6. Testar e avaliar o modelo proposto.

1.3 JUSTIFICATIVA

O conhecimento do comportamento da demanda ao longo do tempo é muito importante para

empresas de distribuição de gás, água, de serviços de comunicação como internet ou telefonia, além

naturalmente de energia. É um desafio planejar e operar um sistema capaz de atender os picos de

consumo e ainda serem economicamente viáveis com as receitas advindas do consumo efetivo por

parte dos clientes. Particularmente, no caso das distribuidoras de energia elétrica, o conhecimento

da dinâmica do comportamento do consumo de energia é fundamental para balizar o planejamento e

a operação do seu sistema, a partir dos estudos de previsão de carga, por exemplo um mês a frente.

15

Além da previsão do crescimento da demanda de uma determinada atividade CNAE, é

importante que a concessionária conheça também o perfil de consumo de energia diário dos

consumidores industriais e comerciais, pois cada classe de consumidores pode apresentar grande

variação entre as demandas máximas e médias durante um dia. Nesse contexto, torna-se

fundamental o conhecimento das curvas de carga diárias típicas e dos fatores de carga dos

consumidores para as empresas de distribuição de energia elétrica, com reflexos diretos no

planejamento da expansão e no dimensionamento das suas redes.

Na literatura podem ser encontrados diversos trabalhos relacionados ao levantamento dos

perfis típicos para diversas classes de consumidores de energia elétrica. A própria ANEEL

estabelece procedimentos e exige levantamentos de campanhas de medição para identificação

destes perfis. Curvas de carga típicas de consumidores residenciais já são bem conhecidas para

todos os dias das semanas, épocas do ano e em várias regiões do Brasil, e não sofrem grandes

alterações de padrão ao longo dos anos. Por outro lado, devido à dinâmica de suas atividades, as

classes comercial e industrial apresentam uma diversidade maior de perfis de carga diários. Além

disso, a quantidade e profundidade dos trabalhos para essas classes consumidoras ainda não atingiu

o mesmo patamar da classe residencial.

Para o projeto de transformadores de edifícios mistos, a metodologia sugerida pela Celesc

realiza o dimensionamento baseando-se em tabelas de cálculo da demanda estimada de acordo com

a Nota Técnica 03 (CELESC, 2014). As tabelas não são segregadas perfil de carga, mas sim por um

agrupamento de atividades econômicas, como por exemplo, “bancos, lojas e semelhantes”. Esta

metodologia não leva em consideração o fato de que empresas mesmo pertencendo ao mesmo

CNAE podem ter fatores de carga diferenciados, enquanto que empresas de CNAEs diferentes,

podem possuir o mesmo perfil de carga, representado por seu fator de carga.

Neste sentido justifica-se a elaboração de uma proposta de um modelo para descoberta de

conjuntos (clusters) mínimos e significativos dos perfis de carga típicos de consumidores

comerciais e industriais a partir dos dados de consumo diário. Assim, os consumidores individuais,

incluindo os segmentos comerciais e industriais, podem ser descritos por algumas tipologias de

curva de carga, encontradas no processo de clusterização, sendo que consumidores de uma mesma

atividade econômica podem pertencer a diferentes clusters.

16

Da mesma forma, é interessante para o planejamento da rede de distribuição de energia

elétrica o conhecimento da previsão do montante de consumo de energia elétrica mensal. Neste

contexto a previsão do montante do consumo mensal de energia elétrica é segregada por atividade

econômica, divisão CNAE, onde é desenvolvida uma RNA para cada classe CNAE , sendo cada

rede influenciada por diferentes variáveis identificadas a partir de análise estatística e análise das

respostas dos questionários aplicados nos consumidores, além dos dados de medição disponíveis..

1.4 METODOLOGIA

1.4.1 Metodologia da Pesquisa

De acordo com as características do trabalho proposto, pode-se classificá-lo como fazendo

uso do método científico hipotético-dedutivo, uma vez que a partir de hipóteses levantadas busca-se

modelos gerais para clusterização, classificação e previsão para descrever o comportamento do

consumidor de energia industrial e comercial.

Do ponto de vista da natureza da pesquisa, é possível classificar o presente trabalho como

pesquisa aplicada, pois ele consiste na combinação e utilização de diversas técnicas estatísticas e

computacionais, voltadas para a solução de um problema real de uma concessionária de energia

elétrica.

A pesquisa que será desenvolvida no presente trabalho é qualitativa-quantitativa, sob o

ponto de vista da abordagem do problema, e exploratória, no que diz respeito aos seus objetivos,

pois envolve a construção e validação de um modelo, e desta forma, o produto da pesquisa estará

sujeito a avaliações e comparações, com a finalidade de ser validado.

1.4.2 Procedimentos Metodológicos

Os procedimentos metodológicos que serão seguidos para a realização do trabalho podem

ser divididos em duas etapas: Determinação do perfil dos consumidores (classificação) e previsão

da variação do montante de consumo de energia elétrica com auxílio de redes neurais (previsão).

Análise de Trabalhos Correlatos

17

Inicialmente foi realizada uma pesquisa bibliográfica, envolvendo a análise de trabalhos

relacionados principalmente com os temas de previsão de séries temporais e previsão do consumo

de energia elétrica. O foco neste momento foi sobre o problema em si e as técnicas utilizadas para

sua solução. Esta etapa atendeu o objetivo específico 1.

Coleta e Pré-processamento dos Dados

Os dados enviados pela concessionária de energia sofreram um processo de pré-

processamento, inicialmente considerando-se os dados de consumo mensal do ano de 2011 da

indústria e do comércio do estado de Santa Catarina. Os dados estavam divididos por atividade

econômica CNAE; com a finalidade de determinar quais setores da indústria e do comércio são

mais representativos em termos de consumo e número de consumidores. Esta etapa atendeu ao

objetivo específico 2.

Definição e Montagem do Questionário a ser Aplicado aos Consumidores

A partir de uma amostra calculada dos dados gerais, definiu-se uma região piloto no estado

para ser aplicada a metodologia. Inicialmente, buscou-se o levantamento das tipologias de curva de

carga dos consumidores industriais e comerciais. Para isto somente os dados de medição não são

suficientes, sendo necessário também informações envolvendo aspectos comportamentais dos

consumidores, além de questões relativas ao seu negócio. Esta etapa foi necessária para atender o

objetivo específico 4.

Levantamento das Tipologias de Curvas de Carga

Na aplicação do algoritmo k-means obteve-se oito tipologias para os consumidores

industriais e sete tipologias diferentes para os consumidores comerciais da região piloto;

considerando-se todas as atividades CNAE selecionadas. Nesta etapa a preocupação estava na

questão do levantamento dos padrões dos perfis de consumo de energia diários (curvas de carga).

Esta etapa também atendeu o objetivo específico 3.

Definição de Regras de Associação

A partir das tipologias definidas na etapa anterior, foi possível, utilizando-se o algoritmo

SPV existente no software TANAGRA, definir um conjunto de regras de associação, relacionando

as respostas dos questionários e as tipologias levantadas. Com os valores adequados de suporte e

18

confiança foi possível identificar características dos consumidores para cada tipologia de curva de

carga encontrada. Esta metodologia permitirá que no futuro a concessionária possa classificar um

consumidor industrial ou comercial, em termos de sua curva de carga, a partir da aplicação do

questionário neste consumidor, sem precisar realizar novas medições ou adquirir dados do seu

consumo. Esta etapa atendeu o objetivo específico 4.

Modelagem da RNA

A RNA foi modelada para possibilitar a previsão do montante de energia a ser consumido,

em termos, por exemplo, de variação de consumo um mês a frente, considerando as tipologias de

curva de carga encontradas. As topologias de RNA consideradas foram as redes RBF e MLP, e o

CNAE considerados foi o 15 – bebidas e alimentos. Esta etapa satisfez o objetivo específico 5.

Teste e Validação do Modelo

Esta etapa atendeu o objetivo específico 6, sendo a última etapa do trabalho. Neste caso,

buscou-se separar conjuntos adequados de dados de medição para treinamento e testes da RNA

desenvolvida.

19

2 FUNDAMENTAÇÃO TEÓRICA

Neste capítulo são explorados os conteúdos chave para o desenvolvimento deste trabalho,

envolvendo principalmente a teoria de knowledge-discovery in databases, com destaque para a

tarefa de mineração de dados (teoria básica e aplicações na literatura) e a teoria de previsão de

séries temporais. As técnicas de mineração de dados clusterização, classificação e regras de

associação, as quais foram aplicadas neste trabalho, são descritas também, com ênfase para o

algoritmo de clusterização k-means. É abordado também o problema de previsão de consumo

(carga) em sistemas de energia elétrica, destacando-se a técnica de RNA, utilizada para previsão, e

o levantamento do estado da arte deste tema.

2.1 DESCOBERTA DE CONHECIMENTOS EM BASE DE DADOS

2.1.1 O Processo de Descoberta de Conhecimento

Com o desenvolvimento dos sistemas computacionais e o aumento da capacidade de

armazenamento de informação em banco de dados surge a necessidade de novas técnicas e

ferramentas de análise de grandes volumes de dados. As ferramentas para a descoberta de

conhecimento em bases de dados integram a tecnologia e a aprendizagem organizacional em busca

de uma gestão estratégica do conhecimento.

No ano de 1980 é formalizado o termo KDD (knowledge-discovery in databases), em

referência ao amplo conceito de procurar conhecimento a partir de bases de dados (FAYYAD et al,

1996). A técnica é composta de várias etapas, entre as quais destaca-se a etapa de Mineração de

Dados, a qual envolve o processo de construção de modelos, que podem ser baseados em

algoritmos, para determinação de padrões, a partir de dados observados e informações disponíveis.

Os algoritmos para Mineração de Dados adequados realizam o papel de inferir

conhecimento. No entanto, o processo de KDD não se resume somente na etapa de Mineração de

Dados, mas também abrange a preparação dos dados (aquisição dos dados, limpeza, pré-

processamento, seleção, redução e projeção) e a fase de interpretação e a avaliação do modelo

descoberto e um possível retorno a algum passo anterior como também uma possível visualização

20

do modelo extraído. Segundo Fayyad et al., (1996) as etapas do processo KDD são apresentadas na

Figura 1, mostrada a seguir.

Figura 1 - Etapas do processo de KDD Fonte: adapatado de Fayyad et al. (1996).

Conforme pode ser observado na Figura 1, o processo de KDD é composto de várias etapas,

onde diversas técnicas podem ser aplicadas. O primeiro passo é o entendimento do domínio da

aplicação definindo os conhecimentos prévios dos dados e o conhecimento que se deseja adquirir, o

alvo. Na extração retira-se um conjunto de dados, uma amostra, e seleciona-se o conjunto de

variáveis necessárias. Então faz-se a limpeza e pré-processamento (remoção de dados inválidos,

ruídos, dados faltantes, etc.) e a transformação dos dados preparando-os para a próxima etapa. Na

etapa seguinte a geração de padrões é realizada após a escolha da função de Mineração de Dados

(classificação, sumarização, clusterização, regressão, regras de associações) e a escolha do

algoritmo de mineração de dados que será utilizado na descoberta de padrões. Por fim, na avaliação

dos resultados são interpretados os padrões encontrados a fim de identificar conhecimentos reais e

interessantes para a aplicação.

A Mineração de Dados é uma das etapas do processo de KDD, conforme pode ser observado

na Figura 1. Dentro desta etapa pode ser aplicadas várias técnicas e cada uma destas técnicas e

algoritmos executam determinadas tarefas, conforme é descrito a seguir.

2.1.2 Tarefas de Mineração de Dados

As tarefas mais importantes no processo de KDD estão listadas no Quadro 1:

21

Quadro 1 - Tarefas para Descoberta de Conhecimento e suas Aplicações.

Tarefa de KDD Exemplos de Aplicação

Classificação Permite associar a cada registro de um banco de dados, um único rótulo ou classe. Uma comercializadora de energia elétrica pode realizar planos de atendimento diferenciados, conforme a segmentação dos perfis de crédito ou de montante contratual de seus clientes.

Clusterização Possibilita a identificação automática dos registros de uma base de dados na forma de agrupamentos com características similares. Neste caso, ao contrário da tarefa de classificação, não se tem o conhecimento prévio das classes existentes.

Descoberta de Associações

Incremento nas vendas de um determinado segmento comercial a partir do conhecimento das associações freqüentes entre os produtos consumidos pelos clientes.

Descoberta de Seqüências

Permite a descoberta de associações em diferentes transações ao longo do tempo. Essa identificação dos padrões de consumo auxilia na elaboração de estratégias de vendas que acompanhe as sazonalidades.

Detecção de Desvios Detecção de fraudes em cartões de crédito, planos de saúde, arrecadação. Identificação de furtos de energia elétrica.

Previsão de Séries Temporais

Solução de problemas relacionados ao planejamento e a tomada de decisões, reduzindo o nível de incerteza e os riscos do negócio.

Regressão Busca de funções, lineares ou não, que mapeiem ajustadamente os registros de um banco de dados. Pode-se pré-estabelecer a variação na carga num determinado período em função da variação da temperatura.

Sumarização Identificar as características dos consumidores de energia elétrica de determinado segmento industrial em relação à elasticidade-preço.

Fonte: Fayyad et al. (1996).

Os tipos de técnicas e de algoritmos para a mineração de dados mais comuns são: redes

neurais artificiais, lógica-fuzzy, algoritmos genéticos, estatística, econometria, algoritmos

específicos para tarefa de descoberta de regras de associação como o Apriori e variantes, entre

outros (ANDRADE, 2009).

22

Neste trabalho foram aplicadas diversas técnicas de mineração de dados para resolver tarefas

de classificação, clusterização e regras de associação, além da previsão se séries temporais através

de RNA. A tarefa de clusterização, discutida a seguir, foi empregada para realizar, de forma

automática, o agrupamento dos consumidores comerciais e industriais de Joinville e Florianópolis

(regionais definidas no escopo deste trabalho) a partir dos seus perfis de consumo.

2.1.3 Tarefa de Clusterização

Clusterização é uma tarefa de KDD, normalmente confundida com classificação. Enquanto a

classificação seleciona uma entidade baseado em valores pré-definidos de atributos, a clusterização

agrupa dados similares não baseados em valores pré-definidos. Isto é, quando classifica-se um

grupo de pessoas, essencialmente predefini-se classes baseado-se em valores de alguns atributos.

No caso de clusterização não é possível pré-definir classes. Ao invés disto, os clusters

(agrupamentos) são formados analisando-se os dados. Uma vez obtidos os clusters, cada um pode

ser examinado adicionalmente por alguma outra técnica como estimação (ANDRADE et al.,

2013a).

Uma das abordagens mais fundamentais para o entendimento e aprendizagem é a

organização de dados em grupos ou agrupamentos. Análise de Clusters ou Clusterização é um

estudo formal de métodos e algoritmos para um agrupamento natural ou clusterização de objetos de

acordo com suas características mensuradas ou intrínsecas de similaridade. As amostras

para agrupamento são representadas como um vetor de medições, ou mais formalmente, como

um ponto em um espaço multidimensional (KANTARDZIC, 2011). Amostras dentro de um cluster

válido são mais similares entre si do que são para amostras pertencentes a diferentes clusters.

O método de clusterização demonstra ser particularmente mais apropriado para a exploração

de interrelações entre amostras com intuito de realizar uma avaliação prévia da estrutura das

amostras.

A Clusterização é um problema complexo, uma vez que os dados podem revelar clusters

com diferentes formas e dimensões em um espaço n-dimensional de dados. Como complicador, o

número de clusters frequentemente depende da resolução na qual observa-se os dados.

23

A Figura 2 apresenta um exemplo de clusterização de pontos em um espaço Euclidiano de

duas dimensões. Considerando que o número de grupos não é previamente conhecido, a Figura 2b e

2c apresentam duas possíveis formação de clusters, a partir dos dados apresentados na Figura 2a.

Na Figura 2b tem-se três clusters formados, enquanto que na Figura 2c tem–se quatro clusters.

Nota-se que os clusters da Figura 2 podem ser reconhecidos visualmente. Contudo, isto se

torna impossível em um espaço Euclidiano de N-dimensões, havendo necessidade do uso de

algoritmos especiais para esta tarefa.

Figura 2 - Clusterização em espaço 2D. (a) Dados iniciais; (b) três clusters formados; (c) Quatro Clusters formados. Fonte: Kantardzic (2011).

Conforme pode ser observado na Figura 2, dependendo do algoritmo de clusterização

utilizado, ou seja, dependendo da metodologia utilizada para agrupar os dados, , o número de

clusters (agrupamentos) pode variar. No exemplo da Figura, poderia-se ter três ou quatro

agrupamentos diferentes para o mesmo conjunto de dados. Por isso, a escolha do algoritmo de

clusterização é fundamental para que os agrupamentos definidos sejam aderentes ao problema de

interesse.

Dos algoritmos de clusterização existentes na literatura, aplicados ao problema de

determinação de padrões de consumo de energia elétrica, destacam-se os algoritmos k-means e

follow-the-leader. Neste trabalho foram apresentados os resultados da aplicação do algoritmo k-

means nos dados medidos, gerando poucos e coerentes agrupamentos, em função dos perfis de

consumo dos respectivos consumidores.

2.1.4 O algoritmo de clusterização K-means

24

Os principais algoritmos utilizados para realizar a tarefa de clusterização, dentro de um

processo de mineração de dados são: Clusterização Hierárquica, clusterização K-means,

clusterização Fuzzy-Kmeans e Clusterização Follow the Leader. Neste trabalho, os clusters

(agrupamentos) serão formados utilizando o algoritmo K-means e em função dos perfis de consumo

dos consumidores, comerciais e industriais, considerados na amostra calculada. O algoritmo

clusterização particional K-means, ou simplesmente K-means é o algoritmo mais simples e também

o mais comumente utilizado, empregando o critério do erro-quadrático. Inicia-se com uma partição

aleatória e mantém a reatribuição das amostras aos clusters, baseados na similaridade entre amostras

e clusters até atingir o critério de convergência. Normalmente este critério é atingido quando não

ocorre mais atribuição de qualquer amostra de um cluster para outro que possa vir a causar um

decréscimo do erro-quadrático (KANTARDZIC, 2011).

A clusterização K-means agrupa os dados de perfil de carga pela determinação de certo

número de clusters e do ponto central de cada cluster. Após a determinação do ponto central, cada

conjunto de dados deve ser associado ao ponto central mais próximo, recalculando então o novo

ponto central. Isto será feito iterativamente até a estabilidade do ponto central.

A atribuição dos dados ao ponto central, avaliada usando correlação ou métricas como

Distância Euclidiana ou Distância de Hamming; automaticamente cria fronteiras entre cada

conjunto de dados. Cada conjunto de dados irá se tornar membro do cluster mais próximo após a

primeira iteração. A iteração seguinte tem apenas a função de atualizar a posição do ponto central.

Este método não cria uma estrutura em árvore para descrever os agrupamentos de dados,

criando apenas um nível de clusters. A Clusterização K-means utiliza observações reais de objetos

ou dados individuais, portanto é mais adequada para agrupamentos de grandes quantidades de

dados.

2.1.5 Exemplos de Aplicação na Literatura

Aplicações utilizando técnicas de Mineração de Dados e clusterização podem ser

encontradas na literatura, especialmente aquelas relativas à definição de padrões de consumo de

energia elétrica, a partir dos seus perfis de carga. A seguir, são descritos alguns exemplos.

25

Prahastono et al., (2008), demonstraram a utilização de clusterização para agrupamentos de

consumidores por perfis de carga, devido a uma nova legislação, a qual permite que diferentes

regiões tenham possibilidade de aplicar suas próprias regras tarifárias. Até então estas regras eram

desenvolvidas por meio de uso de tabelas com dados coletados ao longo dos anos. Estes dados

agrupavam os consumidores por variações em seu perfil de carga, como industriais, comerciais,

serviços públicos e residenciais. Um método de clusterização pode ser aplicado onde os tipos de

consumidores são conhecidos e, portanto, o número de classes pode ser previsto. Para este caso foi

utilizado o método Fuzzy k-means o qual, segundo os autores, se mostrou mais flexível frente a

outros métodos.

A determinação do perfil de carga de consumidores tem sido motivada pelos mais diversos

fatores, como, por exemplo, o enquadramento de consumidores em novas categorias de consumo.

Anuar e Zakaria (2010) apresentam uma abordagem sobre o tema, analisando validação da

clusterização pelo método Fuzzy k-means. Os autores focam na questão da determinação do número

ótimo de clusters, que é um aspecto importante da tarefa de clusterização de dados. Neste caso,

índices como Non-fuzzy, Xie-Beni e Davies e Bouldin são utilizados como exemplos de índices de

validação de clusters para determinar o número ótimo de clusters e examinar a capacidade da

técnica proposta.

Identificar aspectos que causam aumentos dos picos de consumo, desenvolvimento de

contratos específicos e otimização da oferta de energia elétrica motivaram a busca de técnicas de

mineração de dados para agrupar os consumidores em perfis de carga típicos. Neste sentido, Ramos

e Vale (2008) apresentam uma abordagem para o agrupamento de consumidores de média tensão.

Foram utilizados neste trabalho três diferentes algoritmos de clusterização para obter-se o diagrama

de carga representativo para cada consumidor, e sua performance foi comparada utilizando índices

de adequação MIA (Mean Index Adequacy) e CDI (Clustering Dispersion Indicator). O algoritmo

de clusterização escolhido foi capaz de produzir perfis de carga diferenciados. Neste caso, o

objetivo principal é definir planos tarifários a serem aplicados a cada classe de consumidores, a

partir do conhecimento dos seus padrões de consumo.

2.1.6 Regras de Associação

Uma das técnicas utilizadas para encontrar relacionamentos em bases de dados é a análise de

regras de associação. Esta técnica tem sido intensamente pesquisada e consiste em encontrar

26

correlações entre os dados minerados. Nesse sentido, a equipe de pesquisa do Projeto QUEST da

IBM desenvolveu o algoritmo APRIORI que foi introduzido por Agrawal e Srikant em 1994 dando

origem ao software Intelligent Miner (AGRAWAL & SRIKANT, 1994). O algoritmo APRIORI

analisa as regras de associação em uma base de dados, descobrindo e elegendo padrões verdadeiros

e eliminando padrões que ocorrem simplesmente ao acaso (ANDRADE et. al., 2013b). Utiliza

regras de associação do tipo: X→Y (X leva a Y) onde X e Y são conjuntos mutuamente exclusivos

de itens.

O conjunto de ítens que ocorre em uma transação é chamado de itemset. Os itemsets

utilizados neste caso são as linhas do banco de dados de respostas dos questionários aplicados nos

clientes.

O objetivo inicial do algoritmo APRIORI é encontrar todos os conjuntos de itens (itemsets)

que têm suporte acima do suporte mínimo (MinSup) (PESSANHA; LAURENCEL; SOUZA, 2004).

Dado o suporte mínimo MinSup como parâmetro de entrada, no primeiro passo do algoritmo

são encontrados os itens que aparecem ao menos numa fração das transações igual a Minsup. Este

conjunto é chamado L1, dos itens frequentes. O cálculo do suporte é dado por (1), obtida de

(PESSANHA; LAURENCEL; SOUZA, 2004):

Suporte = ú� ��

ú� �� (1)

Os pares dos itens em L1 se tornam pares candidatos C2 para o segundo passo do algoritmo.

Os pares em C2 cuja contagem alcançar Minsup são os pares frequentes L2.

As trincas candidatas C3 são aqueles conjuntos {A, B, C} tais que todos os {A, B}, {A, C} e

{B, C} estão em L2. No terceiro passo, a ocorrência das trincas em C3 é computada, sendo que

aquelas cuja contagem alcançar Minsup são as trincas frequentes, L3 (PESSANHA; LAURENCEL;

SOUZA, 2004).

O procedimento do passo anterior é repetido para tuplas de ordem mais elevada, até os

conjuntos se tornarem vazios. Li são os conjuntos frequentes de tamanho i; Ci+1 é o conjunto de

tamanho i+1 tal que cada subconjunto de tamanho i está em Li.

27

Após os conjuntos de itens serem encontrados, esses são utilizados para gerar as regras, com

confiança acima da confiança mínima (MinConf). A toda regra de associação X -> Y associamos

um grau de confiança, denotado por conf(X -> Y). Este grau de confiança é simplesmente a

porcentagem das transações que suportam Y dentre todas as transações que suportam X dado por

(2), obtida de (PESSANHA; LAURENCEL; SOUZA, 2004):

Confiança = ú� ��

ú� �� (2)

A confiança mede a confiabilidade da inferência feita por uma regra. Para uma determinada

regra X→Y, quanto maior a confiança, maior a probabilidade de que Y esteja presente em

transações que contenham X.

No caso particular deste trabalho, os antecedentes das regras de associação são os padrões

observados nos resultados obtidos dos questionários aplicados nos consumidores de interesse;

enquanto que os consequente das regras de associação são as tipologias ou clusters resultantes

obtidos da etapa de clusterização, envolvendo os perfis de cargas dos consumidores industriais.

Para este trabalho utilizou-se o software TANAGRA desenvolvido por Ricco Rakotomalala

da Universidade de Lumière Lyon 2, na França. Com ele é possível trabalhar com diversos

algoritmos para classificação e regras de associação (PESSANHA; LAURENCEL; SOUZA, 2004).

Foi escolhido por ser um de mineração de dados gratuito para fins acadêmicos e de pesquisa.

Propõe um conjunto de métodos de Mineração de Dados a partir da análise exploratória de dados,

aprendizagem estatística, aprendizado de máquina na área de bancos de dados.

Para trabalhar com as regras de associação, a função escolhida foi a SPV (Supervised

Association Generator), uma variação do algoritmo apriori que utiliza regra por indução

supervisionada. A representação das regras segue o mesmo princípio do algortimo apriori: “Se

premissa, então conclusão”.

Dentre os métodos de regras por indução, utilizados pela SPV do Tanagra, o “dividir para

conquistar”, muito utilizado na década de 90, apresenta vantagens se comparado com outros

métodos de acordo com (PESSANHA; LAURENCEL; SOUZA, 2004).

28

Basicamente, o algoritmo dividir para conquistar baseia-se no princípio da cobertura

sequencial: defini-se uma regra que prevê com certa precisão um valor do atributo alvo; retiram-se

então os exemplos que atendam a regra da base de dados e continua-se o processo iterativo até que

toda a base de dados de treinamento seja pesquisada.

No exemplo apresentado em (LI et. al., 2007) é possível verificar o funcionamento do

método utilizado e a comparação com variações dos algoritmos que implementam o método dividir

para conquistar, bem como outros softwares que trabalham com Mineração de Dados.

Neste trabalho, foi implementado técnicas de classificação para as tipologias identificadas na

indústria e comércio de Joinville e Florianópolis. A partir de um conjunto de regras de associação

mínimo e otimizado, foi realizada a tarefa de indução de regras visando a melhor precisão na

previsão das tipologias.

2.2 PREVISÃO DE CONSUMO DE ENERGIA ELÉTRICA

2.2.1 O Problema de Previsão

O conhecimento prévio do valor de uma variável futura é extremamente importante em

muitas áreas de conhecimento. Na meteorologia, por exemplo, a previsão de precipitação, vento,

radiação solar, umidade, etc; exercem um papel importante no planejamento agrícola e prevenção

de desastres naturais. Essa previsão também é importante na política energética e baseada no nível

das bacias hidrográficas que dependem da quantidade de precipitação que irá ocorrer futuramente.

A previsão da temperatura e da radiação solar, por sua vez, pode determinar a capacidade de carga

no cabo condutor (ampacidade) de uma linha de transmissão de energia elétrica. Por outro lado,

técnicas para prever a demanda por produtos e serviços são utilizadas na indústria a fim de realizar

o planejamento e controle da produção.

Neste contexto diversos sistemas de apoio à decisão foram desenvolvidos a fim de realizar a

previsão de fatos e situações futuras. Estes sistemas podem ser classificados em métodos

quantitativos e qualitativos. Os qualitativos são métodos analíticos, chamados de métodos de

predição e são baseados no julgamento, intuição, entrevistas com especialistas a fim de criar

cenários futuros. Já os métodos quantitativos realizam a previsão por meio da extrapolação da

análise do comportamento de dados históricos. Estes últimos são divididos em análise de series

29

temporais (modelos ARMA, ARIMA) e modelos causais como a regressão dinâmica, por exemplo.

Nesse trabalho abordou-se os métodos quantitativos de previsão que incluem análise de séries

temporais e redes neurais artificiais.

2.2.2 Previsão de Séries Temporais

Uma série temporal é definida como sendo um conjunto de observações realizadas durante

um período de tempo. Esse período pode ser horário, diário, mensal, anual, etc. Porém, para realizar

a previsão dos valores futuros de séries temporais não basta apenas obter os dados. É necessário

também a utilização de técnicas estatísticas e algoritmos para a análise de séries temporais, como as

RNA.

O objetivo maior da análise das séries temporais consiste em analisar a evolução de

determinado evento estatístico, variável no tempo, de modo a permitir a criação de modelos

matemáticos simplificados que permitam realizar inferências sobre o comportamento futuro do

evento em análise. Utilizam basicamente dois modelos: análise no domínio do tempo, que tem sua

origem na teoria da correlação o que levou a construção de modelos estruturais ou paramétricos

como o modelo auto-regressivo integrado de média móvel (ARIMA) descrito pelos estatísticos

Geoge Box e Gwilym Jekins em 1976; e análise no domínio da frequência, um método de analise

espectral que é uma extensão dos métodos de análise de Fourier (BOX, 1994).

Alguns exemplos de métodos utilizados na previsão de séries temporais são:

Modelos de Suavização Exponencial: utilizado por Chan et al. (2012) em conjunto com

algoritmo Levenberg-Marquardt para treinamento de uma RNA na previsão de fluxo de tráfico de

uma auto estrada da Austrália;

Modelos auto-regressivos (AR): o modelo auto-regressivo puro é utilizado no trabalho de

Hill et al.(2012), onde é estudado o impacto da força do vento em sistemas de energia elétrica;

Modelos ARIMA: é uma extensão do modelo AR puro. Areekul et al. (2010) faz uso de

ARIMA e RNA para previsão de curto prazo do preço da eletricidade no mercado australiano.

30

Outras tecnologias computacionais como lógica nebulosa (fuzzy) e sistemas neuro-fuzzy têm

sido utilizadas em sistemas de previsão. As RNA, foco deste estudo, são apresentadas na seção 2.3

deste trabalho.

2.2.3 Previsão de Consumo de Energia Elétrica

Pode-se observar, em pesquisas nas principais bases de artigos científicos como IEEE e

Elsevier, o vasto uso de técnicas de previsão de séries temporais na previsão de carga em sistemas

de energia elétrica. Atualmente o uso de redes neurais artificiais tem sido o mais encontrado para a

previsão de carga em sistemas de energia, de acordo com revisão bibliográfica realizada. Nas

últimas décadas, a utilização de técnicas de RNA para previsão de curto prazo da demanda de

energia elétrica tornou-se uma realidade. Essa popularidade é decorrência das redes neurais

possuírem capacidade de aprender com o passado, abstrair o conhecimento e generalizar novos

resultados. O uso das redes MLP ainda é um dos mais encontrados na previsão de carga de curto e

médio prazo, por sua facilidade de implementação e vasta documentação.

A proposta deste trabalho é a construção de uma rede neural por atividade econômica CNAE

selecionada. Os dados de entrada serão variáveis econômicas (variação do dólar, taxa de juros, etc)

e dados históricos de consumo disponibilizados pela Celesc.

Neste trabalho foram estudadas as arquiteturas de rede MLP e RBF e os erros (MAPE) serão

comparados com a finalidade de escolher a configuração de rede neural mais eficiente para atender

aos objetivos de pesquisa.

2.3 REDES NEURAIS ARTIFICIAIS

2.3.1 Conceitos Básicos

As redes neurais artificiais são uma tentativa de representar computacionalmente a

complexidade do cérebro humano que executa o pensamento de forma não linear e paralela. O

cérebro tem a capacidade de organizar suas unidades estruturais, conhecidas como neurônios, de

maneira que esses solucionem problemas muito mais rápido que os computadores atualmente

existentes (HAYKIN, 2001). Esses problemas podem ser reconhecimento de padrões, previsão a

partir de dados históricos, etc.

31

Um dos resultados dos estudos de neurociência foi o levantamento da hipótese de que a

atividade mental é basicamente composta por atividades eletroquímicas em redes de células

cerebrais chamadas neurônios. Inspirados nessa hipótese os primeiros trabalhos em Inteligência

artificial tinham por objetivo a criação de redes neurais artificiais. Nesse contexto, em 1943,

McCullock and Pitts conceberam um modelo matemático simples de neurônio que é “ativado”

quando uma combinação de entradas atinge um certo limiar (threshold) (RUSSEL, NORVIG, 2010)

O neurônio é a unidade de processamento de uma rede neural. O modelo neuronal é

composto dos seguintes elementos: um conjunto de links de conexões (sinapses) caracterizado por

seus pesos, um somador para os sinais de entrada ponderados pelos pesos das sinapses e uma

função de ativação para limitar a amplitude de saída do neurônio. A Figura 3 apresenta o modelo

não linear de neurônio:

Figura 3 -Modelo não linear de neurônio.

Fonte: Adaptado de Haykin (2001).

A saída de um neurônio é geralmente expressa no intervalo entre 0 e 1. O fator bk (Bias)

produz o efeito de aumentar ou diminuir a entrada para a função de ativação.

O neurônio pode ser definido matematicamente por duas expressões:

32

j

m

j

kjk XWu ∑=

=1

(3)

A Equação 3 que representa o somatório das entradas Xj ponderadas pelos seus pesos Wkj, e

a Equação 4:

)( kkk buy += ϕ (4)

Que representa a saída yk da rede.

2.3.2 Funcionamento Básico e Principais Topologias de RNA

Uma rede neural é composta por unidades (nodos ou neurônios) conectadas diretamente por

links. As unidades são compostas por funções de ativação que quando ativadas propagam a ativação

de uma unidade à outra. Cada link tem um peso que determina a força e o sinal da conexão.

De forma simplificada, o funcionamento da rede neural ocorre da seguinte forma: cada

unidade é inicializada com valores para a função de ativação e para o peso. Inicialmente, cada

unidade computa a soma dos pesos de entrada. Então é aplicada uma função de ativação para essas

somas a fim de derivar as saídas.

A principal função de ativação utilizada é a Função sigmoidal. De acordo com Haykin

(2001), essa é a função mais comumente usada nos projetos de neurônios para redes neurais. Ela é

uma função estritamente crescente que representa o equilíbrio do comportamento não linear e

linear. Um exemplo de função sigmoidal é a função logística, definida pela equação 5.

( ))exp(1/1)( υυϕ a−+=

(5)

33

Para a função sigmoidal, α é o parâmetro de declive, que pode acentuar mais ou menos a

inclinação da função. Diferente das funções degrau (threshold functions) que assumem valores de 0

ou 1, as funções sigmoidais podem assumir valores contínuos entre 0 e 1. São funções

diferenciáveis, pois a derivada de uma função sigmoidal é praticamente a mesma da equação

original. Este é um fator importante para as redes neurais artificiais, especialmente na etapa de

treinamento.

A forma como os neurônios estão estruturados está diretamente ligada com o algoritmo de

aprendizado que será usado para treinar a rede. Os algoritmos de treinamento devem ser escolhidos

de acordo com a arquitetura da rede utilizada.

A topologia, a forma como os neurônios se conectam para formar uma rede de neurônios,

pode ser de direta (Feedforward) ou de redes recorrentes (Feedback) (RUSSEL; NORVIG, 2010).

A Singlelayer Feedforward Network é uma rede de apenas uma camada e utiliza conexões

somente em uma direção. A função de ativação do neurônio depende apenas da entrada corrente

tendo como único estado armazenado o peso do neurônio. O sinal de entrada é transmitido da

entrada para a saída. Já na topologia Multilayer Feedforward Network o sinal de entrada é

transmitido camada a camada até atingir a camada de saída.

Redes recorrentes (Recurrent Network) retornam a saída da rede para a sua entrada. A

resposta da rede para uma dada entrada depende do seu estado inicial, que depende das entradas

anteriores. Devido ao retorno dos dados de saída essas ligações suportam memória de curto prazo.

No caso de previsão de séries temporais, basicamente tem-se destacado na literatura dois

tipos de redes neurais: redes MLP e RBF, as quais serão descritas a seguir.

2.3.3 Rede MLP (Multilayer Perceptron)

O Perceptron foi a primeira proposta de rede neural artificial, criada por Frank Rosenblatt na

Universidade de Cornell em 1958. Com relação ao perceptron, em 1969 Marvin Minsky e Seymour

Papert publicaram o livro Perceptrons: na introduction to computational geometry, no qual

analisaram matematicamente o modelo formal do perceptron e demonstraram que as redes de uma

camada, como o perceptron, somente são capazes de resolver problemas que sejam linearmente

34

separáveis. Esta limitação foi contornada posteriormente com a utilização de perceptron multi-

camadas e funções de ativação não lineares (RUSSEL; NORVIG, 2010).

No ano de 1986, Rumelhart, Hinton e Williams desenvolveram o algoritmo de treinamento

de RNA backpropagation e mostraram que é possível e eficiente o treinamento de RNA, utilizando-

se redes com camadas intermediárias, dando origem ao mais utilizado modelo de Rede Neural

Artificial, a rede MulitlayerPercetron (MLP) (RUSSEL; NORVIG, 2010).

O algoritmo backpropagation consiste na retro-propagação do erro a fim de ajustar os pesos

das conexões (pesos sinápticos) das unidades das camadas internas da Rede, utilizando-se a regra

delta generalizada. Este algoritmo pode ser considerado como uma generalização do algoritmo

Least Mean Square (LMS), desenvolvido por Bernard Widrow.

De forma resumida, o algoritmo backpropagation pode ser descrito como (HAYKIN, 2001):

1- Inicialização: inicializar os pesos sinápticos e os bias aleatoriamente, com valores no

intervalo [-1;1];

2- Apresentação dos Exemplos de Treinamento (pares de entrada-saida): treinamento "on-

line": para cada exemplo do conjunto de treinamento, efetuar os passos 3 e 4; treinamento "em

lote": para cada "época" do conjunto de treinamento, efetuar os passos 3 e 4.

3- Computação para Frente (Propagação): Depois de apresentado o exemplo do conjunto de

treinamento T = {(x(n),d(n)}, sendo x(n) a entrada apresentada à rede e d(n) a saída desejada,

calcular o valor da ativação vj e a saída para cada unidade da rede, com a equação 6:

bxwv i

m

i

jij +=∑=1

(6)

para o cálculo do valor da ativação, e equação 7:

( )( )avevf −+= 1/1)( (7)

35

( )jj OO −1

kδ

para o cálculo da saída y da unidade k, utilizando a função sigmoidal, como no exemplo, ou

uma outra função de ativação desejada.

Utilize a saída das unidades de uma camada como entradas para a seguinte, até a última

camada. A saída das unidades da última camada será a resposta da rede.

4- Calcule o Sinal de Erro: Fazendo a saída yj = Oj(n), será Oj(n) a resposta da rede, calcule

o sinal de erro através da equação 8:

( ) ( ) ( )nOndne jjj −= (8)

onde ( )nd j é a saída desejada com resposta para cada unidade na interação (n).

Este sinal de erro será utilizado para computar os valores dos erros das camadas anteriores

e fazer as correções necessárias nos pesos sinápticos.

5- Computação para Trás ( Retropropagação ): calcular os erros locais, d, para cada unidade,

desde a camada de saída até a de entrada. O gradiente local é definido pela equação 9:

( ) ( ) ( ) ( )( )nOnOnen jjjj −= 1δ (9)

para a unidade da camada de saída, ou pela equação 10:

( ) ( ) ( )( )jkkjjj wnOnOn ∑−= δδ 1 (10)

para as unidades das demais camadas.

Onde:

- é a função de ativação diferenciada em função do argumento, i.e., valor de ativação;

- é o erro das unidades da camada anterior conectadas a unidade j;

jkw

36

- são os pesos das conexões com a camada anterior.

Após o cálculo dos erros de cada unidade, calcule o ajuste dos pesos de cada conexão segundo a

regra delta generalizada e atualizar os pesos, conforme equação 11, para o cálculo dos ajustes dos

pesos:

( ) ( ) jjkjkj ynnwnw δα +=+∆ 1 (11)

Faça:

( ) ( ) ( )nwnwnw kj∆+=+1 (12)

para atualizar os pesos sinápticos

Onde:

α - é a constante de momentun, quando a= 0, esta função funciona como a regra delta

comum;

η - é a taxa de aprendizado;

δj - é o erro da unidade;

yj - é a saída produzida pela unidade j;

6- Interação: Refaça os itens 3, 4 e 5 referentes à propagação, cálculo do erro e

retropropagação, apresentando outros estímulos de entrada, até que sejam satisfeitas as condições de

treinamento; as quais podem ser: o erro da rede está baixo, sendo pouco alterado durante o

treinamento (erro estabilizado) ou o número máximo de ciclos de treinamento foi alcançado.

As redes MLP podem apresentar problemas com mínimos locais: pontos na superfície que

apresentam uma solução estável, mas não é a correta. Existem algumas técnicas para correção desse

problema e a mais utilizada é a adição do termo momentum.

37

2.3.4 Rede RBF (Radial Basis function)

Este tipo de rede neural foi idealizada por Broomhed e Lowe em 1988 e sofreu colaborações

no ano de 1989 de Moody e Darken e Renal e no ano de 1990 por Poggio e Girosi (TODESCO,

1995).

Em sua concepção básica, a rede RBF apresenta 3 camadas: a de entrada, uma camada

intermediária e uma camada de saída. Os neurônios da camada intermediária são chamados de

funções de base radial, Diferentemente das redes MLP, a rede RBF utiliza, em geral, funções de

aproximação através de função gaussiana. Porém, pode-se utilizar vários outros tipos de funções,

como a de base multiquadrática, por exemplo.

A camada escondida utiliza funções de base radiais não lineares da distancia entre o vetor de

entrada e um vetor de referencias, o vetor peso w. Na Figura 4 (ANDRADE, 2009), a distancia

entre o vetor de entrada(x) e o vetor de pesos(w) é representado por ||dist||. A multiplicação desse

produto escalar com o bias (b) representa o sinal de saída que será avaliado pela função de

transferência.

Figura 4 - Representação do Neurônio de Base Radial. Fonte: Andrade (2009).

A função de transferência produz uma resposta significativa, diferente de zero, somente

quando o padrão de entrada está dentro de uma região pequena localizada no espaço de entrada.

38

A última camada, a camada de saída, forma uma combinação linear das funções de base

radial calculados pela camada intermediária, transformando o espaço vetorial interno em uma saída

linear.

O treinamento de uma RBF é feito em 2 passos: determinação dos parâmetros da função de

base na procura pelo centro da rede para a unidade da camada escondida. O método de clusterização

k-means é o mais utilizado para o encontro do centro. O segundo passo é o encontro dos pesos da

camada de saída.

2.4 CONSIDERAÇÕES FINAIS

Neste capítulo foram estudadas as técnicas knowledge-discovery in databases, mais

especificamente a tarefa de mineração de dados e a aplicação do algoritmo K-means que foram

aplicados na etapa de clusterização a fim de encontrar os perfis para as curvas diárias dos

consumidores da indústria e comércio.

A revisão das técnicas e aplicação de regras de associação foi importante nas tarefas de

classificação, pois permitiu conhecer mais a fundo o algoritmo SPV que foi utilizado no software

Tanagra em conjunto com as respostas do questionário, determinando assim as regras para novos

clientes que não possuem dados de medição.

Na revisão de redes neurais pode-se observar que a topologia MLP é a mais simples de

implementar e, pela revisão do capítulo 3, a mais utilizada em previsões de curto e médio prazo em

sistemas de energia. A revisão apresenta também um resumo sobre a previsão de séries temporais.

No capítulo 3 é explorada a revisão de aplicações de previsão de séries temporais no

problema de previsão de consumo em sistemas de energia.

39

3 METODOS DE PREVISÃO PARA SISTEMAS DE ENERGIA ELÉTRICA

3.1 INTRODUÇÃO

A dinâmica no aumento do consumo de energia elétrica devido principalmente a aspectos

econômicos e sociais tornaram necessário o uso de técnicas eficientes de previsão de demanda. Para

realizar a previsão dos valores futuros de séries temporais em geral, além da obtenção de dados de

séries passadas é necessário usualmente a utilização de técnicas estatísticas e algoritmos baseados

em Redes Neurais Artificiais (RNA).

Nos anos 50 e 60 as técnicas para previsão de séries temporais mais utilizadas eram técnicas

simples como a extrapolação, por exemplo. Essas técnicas eram eficientes devido a tendência de

aumento na densidade geográfica previsível e a estabilidade dos preços e do consumo (Romero;

Hernandez; Lopez, 2011].

Atualmente, o entendimento da dinâmica do comportamento do consumo de energia em

função das variáveis climáticas, econômicas e sociais é fundamental para que as empresas de

distribuição possam realizar estudos de previsão do crescimento da demanda com maior

acuracidade, melhorando assim o planejamento e a operação do seu sistema.

Modelos estatísticos como regressão linear, regressão multipla linear (MLR) e modelos

auto-regressivos combinados com média móvel (ARIMA) tem sido bastante utilizados. Estes

métodos são focados no uso de dados históricos (Bunnoon; Chalermyanont; Limsakul, 2012).

Recentemente, o uso de lógica fuzzy, algoritmos genéticos e RNA têm sido os mais utilizados na

previsão do consumo de energia elétrica.

Neste contexto realizou-se uma revisão bibliográfica a fim de identificar os estudos

realizados desde 2008, relacionados à previsão de demanda de consumo de energia elétrica, os quais

tenham maior aderência com o trabalho atual. Para a revisão dos anos anteriores à 2008 foram

utilizadas às referências apontadas por (Andrade, 2009). O principal foco será a aplicação RNA

com horizonte de previsão de médio prazo, ou seja, previsão de um a três meses à frente

considerando o consumo médio mensal. Foram pesquisados trabalhos nas bases de conhecimento

40

do IEEE, Elsevier e IET. As palavras chave foram: time series forecasting, load forecasting e

artificial neural network(ANN).

A partir da década de 90 os modelos de previsão utilizando (RNA) tornaram-se mais

populares, devido principalmente à facilidade de trabalhar com modelos não lineares e permitirem a

inserção de variáveis econômicas e climáticas no auxilio á previsão.

3.2 PREVISÃO EM SISTEMAS DE ENERGIA ELÉTRICA.

Para a previsão de consumo de energia elétrica não existe consenso com respeito ao

horizonte de previsão. Alguns autores dividem em previsão de muito curto-prazo (de um minuto a

uma hora), previsão de curto-prazo (de uma hora a três meses), previsão de médio prazo (de três

meses a três anos) e previsão de longo-prazo (de 3 anos a 5 anos) (Amjady; Keynia; Farshid, 2008).

Outros autores adotam a classificação em três tipos: previsão de curto prazo (a partir de um

dia), previsão de médio-prazo (mais de um dia a um ano) e previsão de longo-prazo (de um a mais

de dez anos) (Paparoditis; Sapatinas, 2013) (Amjady; Keynia; Farshid, 2008).

Em (Amjady, 2007) e (Amjady, 2001) a previsão é considerada de curto prazo quando o

passo é de uma fração de hora até uma hora e o horizonte de previsão de até uma semana à frente.

Para previsão de longo prazo é comum encontrarmos autores que consideram a discretização

de um ano e horizonte de previsão de muitos anos à frente, até dez anos (Shakouri; Rastad;

Nazarzadeh, 2006) (Kandil; El-Debeiky; Hasanien, 2002).

Com a previsão de médio prazo, existem na literatura diferentes classificações. Alguns

autores consideram a discretização de um ano e horizonte de poucos anos a frente (Tsekouras;

Hatziargyriou; Dialynas, 2006). Outros consideram a discretização mensal e horizonte de mais de

doze meses à frente (Ghiassi; Zimbra; Saidane, 2006) (Mirasgedis et al., 2006). Em ([Gonzalez-

Romera; Jaramillo-Moran; Carmona-Fernandez, 2006), foi adotado o passo mensal (discretização

mensal) e horizonte de um mês à frente para adotar a classificação de previsão de médio prazo.

No entanto, a maioria dos trabalhos publicados foca na previsão de curtíssimo e curto-prazo,

([Nose-Filho; Lotufo; Minussi, 2011b) (Yun et al., 2008) (Santana et al., 2012) (Tripathi;

41

Upadhyay; Singh, 2008) (Changhao; Jian; McMenemy, 2010) e previsão de longo-prazo (Yona et

al., 2013) (Ghelardoni; Ghio; Anguita, 2013).

3.3 TRABALHOS UTILIZANDO RNA

Conforme já citado anteriormente, a pesquisa foi realizada nas bases de conhecimento do

IEEE, Elsevier e IET, com as palavras chave time series forecast, load forecasting e artificial neural

network(ANN), considerando as publicações de 2008 até data atual e revisão realizada por

Andrade (2009).

O trabalho (Amjady; Keynia; Farshid, 2008) utiliza previsão de consumo de energia elétrica

de médio prazo com horizonte de previsão diário, até um mês à frente com discretização diária

(previsão de pico diário). Foi proposto um método híbrido composto por redes neurais e algoritmos

evolucionários para a previsão de máximo consumo diário de energia obtendo resultados melhores

que comparados com o modelo utilizando somente redes neurais. Foram utilizados apenas dados

históricos como entrada para a rede. Uma etapa antes da previsão foi utilizada para fazer a seleção

das variáveis de entrada (dados de pico de consumo diário) com maior correlação linear com a

saída desejada (pico de carga do próximo dia) e também as variáveis de entrada com maior grau de

independência linear, levando em conta o calendário e dias similares. O algoritmo utilizado para

treinamento foi o levenberg-marquardt e 35 iterações. O resultado obtido foi um MAPE (mean

absolut percentage error) de 1.6% para os dados testados.

No estudo de (Yun et al., 2008), redes RBF e ANFIS (inferência fuzzy adaptativa) foram

aplicadas para previsão de curto prazo do consumo de energia elétrica, levando em consideração a

variação do preço da energia elétrica do mercado australiano. Foram construídas 48 redes neurais,

uma para cada meia hora do dia. Cada rede RBF fez a previsão de carga considerando apenas os

dados históricos de consumo de energia e os dados de temperatura. Ao todo foram utilizadas 12

variáveis de entrada. O horizonte de previsão foi diário, um mês à frente. Foram utilizados os dados

de junho a julho de 2004 para treino e agosto de 2004 para teste.

No ano de 2010 o artigo (Changhao; Jian; McMenemy, 2010) apresenta o uso de redes

neurais com a finalidade de estabelecer uma rede neural artificial estável e precisa utilizando a

técnica de instrumentos virtuais. A técnica consiste na obtenção de múltiplos tipos de resultados de

previsão (figuras, curvas, gráficos) para compor um banco de dados que auxilie o operador na

42

escolha de diferentes períodos de previsão e diferentes variáveis de acordo com o problema,

escolhendo assim a melhor rede. Na previsão de curto prazo foram utilizados dados históricos de

carga e dados de clima como velocidade do vento, precipitação, pressão atmosférica, temperatura

máxima e mínima, umidade e dia da semana.

Neste trabalho, foi adotado como entradas a carga horária de 21 dias e o horizonte de

previsão foi o 22º dia. As redes testadas foram: MLP (multi-layer perceptron), RBF (radial basis

function) e GRNN (general regression neural network). A melhor topologia das redes encontrada

foi de 14 neurônios na entrada, cinco neurônios na camada escondida e um neurônio na saída. Para

MLP o algoritmo de treinamento foi o levenberg-marquardt com função de ativação sigmoidal na

camada intermediária e função linear na saída. Foram utilizadas 50 épocas no treinamento e um erro

de 0,0001 como critério de parada. Para GRNN e RBF o único parâmetro ajustado foi o spread com

valores de 0,4 e 5 respectivamente. Os resultados foram expressos em MAPE com valores de 2,56%

para MLP, 2,38% para GRNN e 2,13% para RBF.

Ainda em 2010 o artigo (Pandey; Singh; Sinha, 2010) apresenta um modelo utilizando

wavelets na fase de pré-processamento e redes RBF na previsão de curto prazo. Os autores fazem

uma comparação com técnicas estatísticas convencionais e redes neurais com lógica fuzzy. Os

resultados com wavelets e RBF foram melhores que nos outros modelos comparados. Os horizontes

de previsão foram de 24 horas e 168 horas à frente. Os MAPEs foram de 1,03 % para a previsão de

24 horas e 0,99 % para previsão de 168 horas.

Em (Romero; Hernandez; Lopez, 2011) é apresentado a previsão de médio-prazo da

demanda máxima mensal de consumo de energia elétrica em uma subestação da comissão federal

de eletricidade da Grécia. Foi utilizada uma rede MLP de cinco camadas, com um neurônio na

entrada, dois neurônios na primeira camada escondida, 16 neurônios na segunda camada escondida,

12 neurônios na terceira camada escondida e um neurônio na camada de saída. As funções de

ativação utilizadas foram: tangente na entrada, sigmoidal nas camadas intermediárias e linear na

saída. O passo utilizado foi mensal e o horizonte de previsão foi os próximos seis meses. Os

resultados foram expressos em erro absoluto no artigo e calculando o MAPE obtive-se o valor de

3,3021%.

Em 2011 foram apresentados 2 artigos dos mesmos autores, um sendo sequência do outro

([Nose-Filho; Lotufo; Minussi, 2011a) e (Nose-Filho; Lotufo; Minussi, 2011b). A rede utilizada foi

43

a GRNN que é adequada para previsão de curto prazo e já apresentou exemplos de aplicações em

(Tripathi; Upadhyay; Singh, 2008) e (Changhao; Jian; McMenemy, 2010]). No artigo (Nose-Filho;

Lotufo; Minussi, 2011a) é realizada uma preparação de dados de entrada com filtros de média

móvel e redes neurais de regressão geral (grnn) para retirada de ruídos dos dados e assim prosseguir

com a previsão de acordo com o trabalho ([Nose-Filho; Lotufo; Minussi, 2011b). Os testes foram

realizados com dados de carga de 9 subestações da Nova Zelândia, de meia em meia hora. Primeiro

utilizou-se para treinamento os dados do ano de 2008 de uma única subestação para depois fazer de

todas. Os autores utilizaram a função NEWGRNN do matlab com os parâmetros de treinamento:

spread=0.1 e erro de tolerância de 30%. As saídas do pré procesamento obtiveram dados filtrados

com uma redução de ruído de 40%.

Dando continuidade ao trabalho (Nose-Filho; Lotufo; Minussi, 2011a), o artigo (Nose-Filho;

Lotufo; Minussi, 2011b) utiliza os dados pré-processados como entrada para a previsão. Foram

utilizadas duas etapas para previsão de uma rede de distribuição de energia. Na primeira etapa a

previsão é feita em cada nó da rede individualmente para, numa segunda etapa, realizar a previsão

da rede toda. A estrutura da GRNN foi de 4 camadas: 1 entrada, 2 intermediárias e 1 saída. Os

dados utilizados foram de janeiro de 2007 à março de 2009 com as informações de: Mês, Dia da

semana, Flag de horário de verão, Flag de final de semana, Média da Carga do dia anterior, Máxima

Carga do dia anterior, Mínima Carga do dia anterior. O horizonte de previsão foi de 1 dia à frente.

Foram testados 9 dias de 2009, incluindo uma semana normal e dois dias de final de semana. Como

resultado foi obtido um MAPE de 3.30% para a previsão global, ou seja, das 9 subestações.

Utilizando transformações wavelets no estágio de pré-processamento dos dados e uma rede

neural, os autores de (Bunnoon; Chalermyanont; Limsakul, 2012) apresentaram um trabalho que

realiza a previsão de médio prazo para previsão de demanda de energia elétrica. As transformações

wavelets foram utilizadas para decompor o sinal original em componentes aproximados e assim

atenuar as variações da série original. Após esse pré-processamento foi utilizada uma RNA do tipo

MLP de três camadas na previsão de demanda. Os dados foram adquiridos do sistema de energia da

Tailândia dos anos de 1997 a 2007. O treinamento foi realizado com os dados de 1997 até 2003 e os

testes com os dados de 2004 a 2007. A discretização foi mensal e o horizonte de previsão foi de

quatro anos, mês a mês. Como entrada, além dos dados históricos utilizou-se um fator de

temperatura e outro econômico, não especificado no artigo. O trabalho obteve um MAPE de 2.25%.

44

3.4 ANÁLISE TRABALHOS CORRELATOS

O Quadro 2 apresenta os artigos encontrados que utilizam RNA como modelo de previsão e

que são mais aderentescom o foco deste estudo:

Quadro 2 – Artigos Selecionados

artigo 1 Amjady, N.; Keynia, Farshid. (2008)

artigo 2 YUN et al., 2008

artigo 3 Changhao, Jian, McMenemy 2010

artigo 4 Pandey, Singh, Sinha 2010

artigo 5 Romero, Hernandez, Lopez 2011

artigo 6 Nose-Filho, Lotufo, Minussi 2011b

artigo 7 Bunnoon, Chalermyanont, Limsakul 2012 Fonte: Elaborado pelo Autor

No Quadro 3 é possível verificar a comparação entre os artigos: Quadro 3 - Comparativo dos Artigos

Método

de Previsão

Quanti-dade

de Dados

Topolo-gia

de Rede

Funções de

Ativação

Variáveis de

Entrada Passo

Horizon-te de

Previsão MAPE

MAE Máximo

artigo 1

MLP 3 anos pico

diário

3 camadas

N/A

consumo máximo diário flag

feriado: 0 ou 1

diário

diário, 1 mês à frente

agosto de 1999

0,016 N/A

artigo 2

RBF

Treina-mento junho e julho

previsão

agosto de 2004

3 camadas

gaussiana

dados históricos

12 variáveis

com diferentes

defasa-gens

diário

diário, 1 mês à frente

agosto de 2004

0,0167 0,0455

45

artigo 3

MLP RBF

GRNN

carga horária de 21 dias

3 camadas 14:5:1

MLP - sigmoidal

RBF - gaussiana GRNN - gaussiana

dados históricos clima (12 variáveis)

dia da semana

diário 22 dias

MLP 2,56% GRNN 2,38% RBF

2,13%

MLP 6,30% GRNN 8,63% RBF

6,44%

artigo 4

RBF

25 à 31 janeiro 17 à 23 maio

19 à 25 julho

3 camadas

gaussiana

Tempera-tura

dados históricos

carga

Horá-rio

24 horas e

168 horas à frente

24 horas - 1.0331

% 168

horas - 0.9895

%

N/A

artigo 5

MLP

janeiro de 1994

à dezemb

ro de 2006

5 camadas 1:2:16:1

2:1

Tangente Sigmoidal

Linear

dados históricos

carga mensal

Men-sal

mensal próximos 6 meses

0,033 0,0426

artigo 6

GRNN

janeiro de 2007

à março

de 2009

4 camadas

N/A

Mês, Dia da

semana, Flag de

horário de verão, Flag de final de semana, Carga do

dia anterior (Média,

máxima e mínima)

diário

1 dia à frente -

9 dias de 2009

0,033 0,0776

artigo 7

MLP

Treina-mento 1997 até

2003 testes 2004 à 2007

3 camadas

N/A dados

históricos mensal

Men-sal

mensal - 4 anos à frente

0,0225 N/A

Fonte: Elaborado pelo Autor.

46


O foco desta revisão foi a previsão de demanda de consumo de energia elétrica. Os

interesses principais foram: encontrar trabalhos que apresentem uma segregação entre consumidores

industriais, comerciais e residenciais; previsão de montante de consumo mensal; utilização de RNA

na previsão.

Pela tabela comparativa (quadro 3) podemos observar que os artigos 5 e 7 são os que mais se

aproximam do interesse em questão. Possuem discretização mensal e horizonte de previsão mensal

ou anual. O primeiro realiza a previsão para seis meses à frente e o segundo, quatro anos.

Em ambos estudos, é observado que o pré-processamento dos dados é essencial. A maioria

dos modelos híbridos utiliza essa técnica, separando o processo de filtragem dos dados para assim

realizar a previsão. Em geral, para previsões de médio prazo as técnicas para obter séries históricas

de consumo estacionárias são aplicações de filtros, como de média-móvel (Romero; Hernandez;

Lopez, 2011) ou trabalhar com a variação do consumo em relação ao mês anterior.

Para a topologia das redes, observa-se o uso de redes RBF e GRNN em previsões de

curtíssimo e curto prazos. Para previsão de médio e longo prazo a rede utilizada, em geral foi MLP

com algoritmo de treinamento Levenberg-Marquardt (Bunnoon; Chalermyanont; Limsakul, 2012).

Em geral utilizam-se redes de três camadas, no máximo quatro camadas, pois o aumento de

camadas aumenta a complexidade e o tempo de treinamento das redes. Além disso, para a

construção de um método de previsão com redes neurais é comum começar o modelo com MLP

devido a sua flexibilidade com a predição não linear e sua implementação simples (Amjady;

Keynia; Farshid, 2008).

Quanto às variáveis de entrada, não foram consideradas variáveis econômicas como

entradas, pois estas são úteis quando se trabalha com os tipos de consumidores considerados de

forma desagregada. Variáveis de clima também, segundo o autor, apresentam pouca relevância em

previsões de médio prazo e são difíceis de obter as séries históricas. O uso de muitas variáveis de

entrada de diferentes fontes torna a fase de treinamento complicada e demorada, necessitando de

muitos dados para que o treinamento extraia a correlação entre elas. Assim, o uso mínimo de

variáveis de entrada torna o modelo mais rápido no treinamento, necessita de menos dados

históricos e facilita a operação.

47

4 ABORGAGEM PROPOSTA

Neste capítulo é apresentada a proposta de aplicação das técnicas apresentadas no capítulo 2

para resolver o problema de descrição do consumo de energia elétrica, visando o entendimento das

principais variáveis que afetam o crescimento de consumo, envolvendo as classes industrial e

comercial de Santa Catarina. O destaque está na metodologia de Descoberta de Conhecimento em

Base de Dados (KDD) e a etapa de Mineração de Dados. A forma como os dados são trabalhados e

a informações necessárias são obtidas, também é foco deste capítulo.

4.1 PRÉ – PROCESSAMENTO DOS DADOS

A disponibilização dos dados de consumo mensal de todo o estado de Santa Catarina pela

Celesc Distribuição S.A., divididos por atividades econômicas CNAE (cadastro nacional de

atividade econômica) foi importante para selecionar as atividades mais representativas em termos

de número de consumidores de energia elétrica e o montante de energia consumido por estas

classes.

Os dados foram disponibilizados em formato texto (csv), representando o consumo mensal

do ano de 2011 e divididos por CNAE. Foram carregados para o banco de dados PostgresSQL 9.0,

utilizando-se o software Kettle ou Pentaho Data Integration (PDI) que é um componente da suíte

do Pentaho responsável pelos processos de Extração, Transformação e Carga (ETL) de Dados. Uma

transformação foi gerada a fim de ler os arquivos texto e carregá-los no banco de dados, ignorando

nulos e transformando datas e unidades de medidas.

Nas primeiras seleções realizadas no banco de dados após a carga foi observado que o

número de consumidores industriais no estado era de 26.488, abrangendo 29 divisões CNAE

(CNAE 10 a 37 e 40). Com relação aos consumidores comerciais, o número de consumidores no

estado era de 201.098, abrangendo 26 divisões CNAE (entre CNAE 50 e 99).

Agrupando os dados por regionais obteve-se um total de 16 regionais. Desta forma foram

escolhidas 8 regionais que pudessem representar mais da metade do consumo e do número de

consumidores das classes comerciais e industriais do estado.

48

A pesquisa deveria se concentrar nas divisões CNAE mais representativas, ou seja, as

divisões selecionadas deveriam contemplar pelo mesmo 75% do consumo dentro de cada uma das

duas classes de consumidores. Com o desenvolvimento de rotinas escritas na linguagem de banco

de dados PL/SQL (Procedural Language extensions to SQL) foi possível agrupar os valores de

consumo por atividade econômica e auxiliar na análise. Após algumas análises dos dados de

consumo e número de consumidores de todas as regionais foi possível encontrar 8 deles que

tivessem a representatividade desejada, considerando todas as divisões CNAE. Estas regionais são:

Grande Florianópolis, Blumenau, Concórdia, Chapecó, Joaçaba, Joinville, Lages e Videira.

A partir da definição das regionais a serem consideradas no processo de medição foi

possível definir as atividades CNAE, da indústria e do comércio, a serem consideradas no cálculo

da amostra para medição. Neste caso, manteve-se como parâmetro de referência a

representatividade de consumo e de número de consumidores. Assim, considerando as 8 regionais

escolhidas, consegue-se representar, com apenas 8 divisões CNAE, mais de 76% do consumo de

energia e cerca de 65% dos consumidores industriais de Santa Catarina. Da mesma forma, foi

possível agregar, com apenas 7 divisões CNAE, quase 75% do consumo de energia e mais de 76%

dos consumidores comerciais resultando em uma elevada representatividade para este tipo de

pesquisa.

As atividades CNAE definidas para a indústria e para o comércio estão apresentadas nos

Quadros 4 e 5, respectivamente.

Quadro 4 – Atividades Consideradas – CNAE Indústra.

Divisão CNAE

Descrição CNAE Consumo

(%) Num. Cons.

(%)

15 Fabricação de produtos alimentícios e

bebidas 19,28 12,71

17 Fabricação de produtos texteis 14,09 8,14

18 Confecção de artigos de vestuário e

acessórios 2,16 10,92

20 Fabricação de produtos de madeira 4,92 14,63 25 Fabricação de artigos de borracha e plástico 7,3 3,17 27 Metalúrgica básica 12,62 1,83 28 Fabricação de produtos de metal 7,28 10,39 29 Fabricação de máquinas e equipamentos 8,49 3,13

49

Fonte: Elaborado pelo Autor. Quadro 5 – Atividades Consideradas – CNAE Comércio.


4.2 CÁLCULO DA AMOSTRA PARA MEDIÇÃO

A concessionária disponibilizou os dados de medição horo-sazonal de algumas indústrias e

comércio do estado de Santa Catarina. Porém, para atigir o grau de representatividade desejada uma

amostra adequada deve ser respeitada. Para isso houve a necessidade da definição de uma amostra

para medição em campo.

Para o cálculo das amostras de cada divisão, considerou-se os seguintes objetivos:

• Preservar das características das 8 regionais da concessionária no estado.

• Manter todas as divisões CNAE selecionadas com os mesmos erros amostrais.

• Erro amostral fixo de 10%.

• Nível de confiança de 90%.

Total 76,14 64,93

Divisão CNAE

Descrição CNAE Cons. (%)

Num. Cons. (%)

50

Comércio e reparação de veículos automotores e motocicletas

6,64 6,35

51 Comércio por atacado e representantes comerciais 9,61 10,32

52 Comércio varejista e reparação de objetos pessoais e

doméstico 26,36 22,22

55 Alojamento e alimentação 9,86 8,62

70 Atividades imobiliárias 8,4 8,22

74 Prestação de serviços principalmente a empresas 8,66 16,3

85 Saúde e serviços sociais 4,78 4,77

Total 74,33 76,81

50

Conforme já mencionado alguns clientes apresentam medição horo-sazonal e dispensarão

eventuais medições em campo. Levando em conta as 8 regionais selecionadas, 8 divisões CNAE

industriais e 7 divisões CNAE comerciais estabelecidas, o cálculo do tamanho da amostra foi

executado segundoa equação (13), e baseada em (TRIOLA, 2008). Cabe salientar que quando não

se tem conhecimento da proporção populacional p, considera-se o produto p.(1-p) = p.q = 0,25, ou

seja, neste caso considera-se a estimativa de proporção do evento na população de 50%.

n′!"

#$.&(()&)

+$

(13)

Onde:

no’= tamanho de uma amostra aleatória simples;

Z = valor da distribuição normal para o nível de confiança desejado;

p = estimativa de proporção do evento na população;

E0 = erro amostral tolerável.

A amostra, por sua vez, pode ser calculada segundo (14), apresentada abaixo.

Amostra = ./0

1

(2/01 )

(14)

Onde:

N = Número de estabelecimentos.

Aplicando a equação 14 aos dados foi possível chegar a Tabela 1 que apresenta o número de

amostras necessárias para representar estatisticamente cada divisão CNAE selecionada para as

classes do segmento industrial.

51

Tabela 1 - Número de Amostras da Classe Industrial para 8 Regionais.

CNAE 1.0 Número de Consumidores Consumo Médio Mensal (MWh) Amostras

15 1935 93178 65 17 1240 68089 64 18 1663 10422 65 20 2228 23791 66 25 483 35301 59 27 278 61010 54 28 1582 35193 65 29 477 41023 59

total - 8 regionais

9886 368007 497

Total do estado - 16 regionais

15226 483.311


E a Tabela 2 para as classes do segmento comercial:

Tabela 2 - Número de Amostras da Classe Comercial para 8 Regionais.

CNAE 1.0 Número de Consumidores Consumo Médio Mensal (MWh)

Amostras

50 7699 9682 67

51 12510 14008 67

52 26930 38420 67

55 10450 14374 67

70 9966 12248 67

74 19759 12627 67

85 5783 6967 67 total - 8

regionais 93097 108326 469

Total do estado - 16 regionais

121200 145737


Em relação as divisões CNAE da Tabela 2 para a indústria e sua descrição são:

• Divisão 15 - Fabricação de produtos alimentícios e bebidas.

• Divisão 17 - Fabricação de produtos texteis.

• Divisão 18 - Confecção de artigos de vestuário e acessórios.

52

• Divisão 20 - Fabricação de produtos de madeira.

• Divisão 25 - Fabricação de artigos de borracha e plástico.

• Divisão 27 - Metalúrgica básica.

• Divisão 28 - Fabricação de produtos de metal.

• Divisão 29 - Fabricação de máquinas e equipamentos.

Estas divisões CNAE representam um total de 76,14% do consumo e 64,93 % do número de

consumidores do estado.

Para o comércio foram definidas as seguintes atividades:

Divisão 50 - Comércio e reparação de veículos automotores e motocicletas.

Divisão 51 – Comércio por atacado e representantes comerciais.

Divisão 52 - Comércio varejista e reparação de objetos pessoais e doméstico.

Divisão 55 - Alojamento e alimentação.

Divisão 70 - Atividades imobiliárias.

Divisão 74 - Prestação de serviços principalmente a empresas.

Divisão 85 - Saúde e serviços sociais.

As divisões selecionadas do comércio representam 74,33% do consumo e 76,81 % do

número de consumidores de Santa Catarina.

A partir das tabelas 1 e 2 foi possível construir uma proposta de plano de medições por

regionais, definindo-se finalmente o número de medições necessárias para cada regional e cada

subdivisão CNAE, tanto em nível de consumidor industrial quanto comercial.

Para as regionais de Joinville e Florianópolis, regionais escolhidas para o estudo de caso por

apresentar um maior volume de dados e por serem as regiões de maior concentração de

consumidores estudados, foi necessário um total de 148 amostras para a indústria e 245 amostras

53

para o comércio, envolvendo dados de medição disponibilizados pela Celesc Distribuição S.A. e

dados a serem medidos in loco.

4.3 MEDIÇÃO DA CURVA DE CARGA DE CONSUMIDORES

Por meio de informações comerciais repassadas pela concessionária, foi possível verificar

quais consumidores eram horo-sazonais HS (consumidores com maior consumo) e atendiam as

nossas necessidades de representação amostral. Assim, foi possível reduzir o número de medições

em campo a serem realizadas. Na Tabela 3 são apresentadas a quantidade de dados disponíveis e a

necessidade de medição para as regionais de Florianópolis e Joinville, as quais já foram concluídas.

Tabela 3 - Relação de Consumidores e disponibilidade de dados.

FLORIANÓPOLIS JOINVILLE

INDÚSTRIA COMÉRCIO INDÚSTRIA COMÉRCIO

DADOS HS 34 104 29 37

MEDIÇÔES 19 77 66 27 Fonte: Elaborado pelo Autor.

Para construir as curvas de carga típicas de cada consumidor HS da amostra foram utilizados

apenas os três dias centrais da semana (terça-feira, quarta-feira e quinta-feira), formando uma curva

de carga diária média para os dias de semana. Devido a sazonalidade do consumo ao longo do ano

optou-se por considerar apenas as semanas dos meses de maior consumo, e assim, para a maioria

das amostras foram selecionadas apenas semanas do mês de agosto de 2011. Os demais clientes que

necessitavam de medição em campo tiveram seus dados coletados entre janeiro e fevereiro de 2013,

conforme o cronograma de atividades da empresa de medição.

É importante ressaltar que não se espera grandes alterações no perfil de demanda das

indústrias ao longo do ano, ao contrário das variações de montante consumido.

4.4 PESQUISA COM OS CONSUMIDORES VIA QUESTIONÁRIO

Para encontrar regras de associações e determinar o perfil dos consumidores outras

informações são necessárias, além dos dados de medição e construção das curvas de carga. Para

isso elaborou-se um questionário, disponível no apêndice A deste trabalho, a fim de obter algumas

54

informações dos consumidores medidos, para identificação do comportamento destes consumidores

e da atividade econômica correspondente.

De forma geral, o questionário foi dividido em cinco partes, envolvendo identificação da

unidade consumidora, informações sobre a instalação, informações sobre a operação da empresa em

2011, influência da economia e do clima no negócio. Em virtude da maior complexidade e

aplicabilidade, as respostas relacionadas à economia e ao clima foram solicitadas apenas aos

consumidores industriais.

Para a aplicação do questionário foi desenvolvido um site em PHP e banco de dados

MySQL, disponível em (www.seenergia.com.br/questionario) e solicitado o preenchimento do

mesmo pelo responsável da unidade consumidora que estava sendo medida. As respostas

preenchidas no questionário são automaticamente armazenadas no banco de dados do estudo,

possibilitando a realização do processo de mineração de dados das repostas.

As respostas obtidas junto aos consumidores têm basicamente dois objetivos distintos:

• identificar características funcionais indicativas de cada perfil de carga diário

(fundamentais para a descoberta de boas regras de associação);

• prospectar variáveis econômicas e climáticas relacionadas á variação do montante de

energia consumida por cada por cada divisão do CNAE ao longo dos meses, bem como

das respectivas sazonalidades (importante no processo de seleção de melhores séries

históricas para a previsão de demanda).

4.5 CLUSTERIZAÇÃO – IDENTIFICAÇÃO DOS PERFIS DE CARGA DIÁRIA TÍPICOS

O algoritmo de clusterização K-means, apresentado no Capítulo 2 deste trabalho, foi

utilizado para agrupar os dados de perfil de carga para determinação do número de clusters a partir

dos dados de consumo das regionais de Joinville e Florianópolis.

Através de uma rotina escrita em software Matlab foi possível encontrar o número de

centros e o ponto central de cada cluster (centróides). Após a determinação do ponto central, cada

conjunto de dados deve ser associado ao ponto central mais próximo, recalculando então o novo

ponto central. Isto foi realizado iterativamente até que houvesse uma estabilidade do ponto central.

55

Além de realizar a descoberta dos perfis de carga típicos das classes industrial e comercial

do estado, buscou-se nomear/classificar cada tipologia conforme os períodos de maior consumo e as

variações em momentos específicos como o horário de almoço e o período tarifário de ponta.

Os dias úteis de semana, segunda-feira à sexta-feira e sem feriados, apresentam montantes

de consumo maiores em relação aos finais de semana para a maioria das cargas. Além disto, os três

dias centrais da semana (terça, quarta e quinta-feira) tem os maiores consumos. Assim, nesta etapa,

a curva de carga diária para efeitos de clusterização é uma média das curvas de carga dos três dias

dias centrais da semana. No capitulo 5 são apresentados os clusters obtidos com a aplicação do

algoritmo k-mens.

4.6 APLICAÇÃO DA METODOLOGIA PROPOSTA

A metodologia empregada neste trabalho teve como meta atender os objetivos geral e

específicos propostos, bem como responder as hipóteses de pesquisa levantadas. Neste sentido, o

modelo computacional foi concebido de forma a atender todas as atividades necessárias para aplicar

as técnicas escolhidas de mineração ao problema de previsão de consumo de energia (previsão de

montante um mês a frente) e o agrupamento automático dos consumidores por suas curvas de

cargas (consumos diários), em função de respostas de questionários.

As demais etapas, constituindo os objetivos específicos 2, 3 e 4; estão representadas na

Figura 5. Nesta figura fica evidenciado o relacionamento entre as etapas, técnicas e objetivos

propostos nesta dissertação. Nota-se que nesta figura somente apresenta-se etapas referentes a

determinação do perfil dos consumidores e as variáveis de influência no consumo diário de energia

elétrica.

56

Figura 5 - Passos Para Determinação do Perfil dos Consumidores. Fonte: Elaborado pelo Autor.

O que está apresentado na Figura 5 corresponde a primeira etapa da metodologia empregada.

A segunda etapa refere-se a previsão de consumo de energia elétrica usando RNA do tipo MLP.

Nesta etapa busca-se a implementação de uma RNA para a classe CNAE 15, escolhida devido a

disponibilidade de maior volume de dados (de 1997 à 2011), a fim de realizar a previsão do

montante do consumo mensal de energia elétrica para cada novo consumidor. O treinamento será

com as curvas de carga históricas de consumo de energia dos consumidores analisados e medidos,

que possuem o mesmo perfil de carga.


As etapas de pré-processamento de dados e cálculo da amostra para medição determinou que

as divisões CNAE 15, 17, 18, 20, 25, 27, 28 e 29 representam um total de 76,14% do consumo e

64,93 % do número de consumidores do estado. Para o comércio as atividades 50, 51, 52, 55, 70, 74

e 85 representam 74,33% do consumo e 76,81 % do número de consumidores de Santa Catarina.

Assim foi possível reduzir o número de atividades necessárais, reduzindo o número de amostras

necessárias para medição e consequentemente reduzindo também os custos de medição. Com os

dados horo-sazonais disponibilizados pela concessionária as medições realizadas em campo foram

em 19 indústrias e 77 comérios de Florianópolis e em 66 indústrias e 27 comércios de Joinville.

57

As curvas de carga diária nos permite agrupar os consumidores em tipologias (clusters).

Assim foi utilizado o algortimo k-means para determinar os clusters que, em conjunto com os dados

dos questionários determinam as regras de associção para determinação do perfil de carga diária dos

consumidores.

Alguns resultados relativos às etapas de clusterização, classificação e de aplicação de regras

de associação são apresentados no Capítulo 5, tendo como estudo de caso as regionais de Joinville e

Florianópolis, onde todos os dados necessários e informações referentes às respostas dos

questionários foram obtidos. Após a determinação do perfil, são apresentados os resultados de

previsão de carga mensal da divisão CNAE 15, também escolhida como divisão piloto por possuir

uma série histórica de mais de 10 anos de dados.

58

5 RESULTADOS

Neste capítulo, são apresentados os resultados da aplicação da metodologia proposta nas

regionais de Joinville e Florianópolis, considerando medições de consumo e respostas de

questionários dos consumidores industriais e comerciais. Neste caso, buscou-se a aplicação da

clusterização para determinação dos perfis típicos de curvas de carga e regras de associação,

considerando como premissas as respostas dos questionários e como conclusões os perfis das curvas

de cargas dos consumidores (tipologias encontradas na clusterização)..

5.1 RESULTADOS – DETERMINAÇÃO DO PERFIL DE CONSUMIDORES

5.1.1 Clusterização

Na etapa de clusterização, após a aplicação do algoritmo K-Mens obteve-se sete tipologias

identificadas no conjunto de indústrias de Joinville e Florianópolis. A Figura 6 apresenta os dados

de consumo normalizados para melhor visualização, e por essa razão não apresenta escala vertical.

No momento optou-se por evitar ao máximo a criação de grupos de consumidores atípicos para

beneficiar os algoritmos de busca de associação.

Figura 6 - Tipologias da Classe Industrial – Joinville e Florianópolis. Fonte:Adaptado de Andrade et al., (2013).

59

A nomenclatura dos agrupamentos para a classe industrial foi definida da seguinte forma:

• Tipo i1: demanda praticamente constante ao longo do dia.

• Tipo i2: demandas crescentes nos períodos da madrugada e manhã, mais alta a tarde, e

decrescente a noite.

• Tipo i3: demanda alta no período da manhã com a tarde decrescente.

• Tipo i4: demandas altas nos período da manhã e da tarde, e com baixo recuo de demanda

ao meio-dia.

• Tipo i5: demandas altas nos período da manhã e da tarde, e com alto recuo de demanda

ao meio-dia.

• Tipo i6: demandas crescentes nos períodos da madrugada e manhã, mais alta a tarde e

noite, com um recuo médio no horário de ponta.

• Tipo i7: demandas altas nos períodos manhã, tarde e noite com alto recuo de demanda

no período de ponta.

Para a classe comercial, foram definidos oito clusters que estão apresentados na Figura 7, mostrada

a seguir.

60

Figura 7 - Tipologias da Classe Comercial – Joinville e Florianópolis. Fonte: Adaptado de Andrade et. al., (2013).

A Figura 7 apresenta as oito tipologias identificadas no conjunto de comércios de Joinville e Florianópolis. Para os agrupamentos do comércio a nomenclatura foi definida da seguinte forma:

• Tipo c1: demanda praticamente constante ao longo do dia.

• Tipo c2: demandas crescentes nos períodos da madrugada e manhã e decrescente a noite.

• Tipo c3: demandas crescentes nos períodos da madrugada e manhã e decrescente tarde e

noite.

61

• Tipo c4: demandas altas nos período da manhã e da tarde, e com baixo recuo de

demanda ao meio-dia.

• Tipo c5: demandas altas nos período da manhã e da tarde, e com alto recuo de demanda

ao meio-dia.

• Tipo c6: demandas crescentes no período da manhã, demandas altas próximo do meio

dia e tarde, noite com alto recuo de demanda.

• Tipo c7: demandas crescentes no final da manhã, demandas altas nos períodos manhã e

tarde e noite com alto recuo de demanda.

• Tipo c8: demandas crescentes no final do período da manhã com recuo de demanda no

final da noite e início da madrugada.

Foi possível identificar perfis de carga diária típicos conforme a mediana (preto) e média

(amarelo) dos seus integrantes. O objetivo foi gerar um número reduzido de agrupamentos de

consumidores com perfis de consumo semelhantes.

As linhas pretas e amarelas nos gráficos são a mediana e a média, respectivamente. É

possível observar que o gráfico da mediana apresenta menor variação em relação a média e os

clusters definidos pelo algoritmo k-menos acompanham a mediana. A “poluição” dos clusters é

explicada devido ao número reduzido de clusters, apenas 7 para a indústria, e o número reduzido de

dados utilizado. Se aumentarmos o número de clusters teremos mais curvas de carga próximas da

mediana, porém estaremos nos distanciando cada vez mais do mínimo agrupamento necessário para

reprsentar a curva de carga dos consumidores em estudo.

Com a obtenção de sete tipologias para a indústria e oito para o comércio é necessário

realizar a aplicação de questionários a fim de identificar as regras de associação para cada tipologia.

Essa etapa foi realizada e os resultados são apresentados na próxima seção.

5.1.2 Resultados Regras de Associação

5.1.2.1 Pré-Processamento das Respostas dos Questionários

62

As respostas dos questionários formaram uma Base de Dados com todos os consumidores

entrevistados. Sobre as respostas obtidas foi elaborado um cuidadoso processo de pré-

processamento, cujos resultados foram base para a avaliação e a categorização das informações dos

consumidores:

Para validação das entrevistas de cada empresa, todas as respostas eram reexaminadas em

conjunto para evitar erros de coerência entre os dados de demanda, consumo, porte da empresa,

grupo de tensão, turnos de operação e etc.

A categorização é fundamental para redução do número de respostas possíveis de um

determinado quesito do questionário. Número de funcionários, inicialmente um parâmetro contínuo,

pode ser discretizado em micro, pequena, média e grande empresa, conforme a metodologia

utilizada pelo Sebrae/IBGE. Procedimentos semelhantes foram aplicados para a contratação de

demanda, consumo de energia mensal, relação entre as demanda contratadas na ponta e fora de

ponta, e os horários de início e fim do funcionamento da empresa ao longo do dia.

Os parâmetros e suas respectivas categorias constam no Quadro 6:

Quadro 6- Parâmetrização das Respostas do Questionário.

Parâmetros Cod. nas Regras Opções

Tipologia Tipo i1 ao Tipo i7 (Figura 5) Tipo c1 ao C8 (Figura 6)

Divisão do CNAE Divisão 15 à 29 – indústria 50 à 85 – comércio

Tipo de Tarifa tipo_de_tarifa

Convencional Monômia

Convencional Binômia

Horo-sazonal Verde

Horo-sazonal Azul

Maior Demanda Contratada dem_cont

Baixa (< 150 kW)

Média (150 a 600 kW)

Alta (600 a 2000 kW)

Muito Alta (> 2000 kW)

Redução na ponta: razão entre as Demandas na Ponta e Fora de Ponta

red_ponta

Muito Inferior (< 0,3)

Inferior (0,3 a 0,7)

Pouco Inferior (0,7 a 1,0)

Igual (= 1,0)

Acima (> 1,0)

Porte da Empresa (nº de func.)

porte_da_empresa

Micro (< 20)

Pequena (20 a 100)

Média (100 a 500)

63

Grande (> 500)

Sub-grupo de tensão sub_grupo A1, A2, A3, A3a, A4, AS

B1, B2, B3, B4

Turnos de Trabalho (codificados em 0 ou 1 e concatenados )

Turnos

Manhã

Tarde

Noite

Madrugada

Horários aproximados de funcionamento da empresa: início e fim

hr_fun_inicio hr_fun_fim

ini_madrugada (0h às 2h59m)

fim_madrugada (3h às 5h59m)

ini_manhã (6h às 8h59m)

fim_manhã (9h às 11h59m)

ini_tarde (12h às 14h59m)

fim_tarde (15h às 17h59m)

ini_noite (18h às 20h59m)

fim_noite (21h às 23h59m)

Consumo Médio Mensal CMM

Baixo (< 25000 kWh)

Médio (25000 a 100000 kWh)

Alto (100000 a 500000 kWh)

Muito Alto (> 500000 kWh)

Impacto da Variação do Clima ao Longo do Dia

impacto_var_clima

Alto

Médio

Baixo

Não se aplica / Não sabe (na_ns) Fonte: Elaborado pelo Autor.

O universo de variáveis de interesse para a busca de associações mostrou-se mais eficiente

com a utilização de 10 variáveis de entrada e das tipologias das curvas de carga como variável de

saída. A qualidade dos resultados, tanto da busca de associações quanto da classificação das

tipologias, está intimamente relacionada com a quantidade de clientes analisados. O total de

consumidores considerado foi de apenas 126 industriais e 179 comerciais para as regionais de

Florianópolis e Joinville.

5.1.2.2 Regras de Associação

Para realização da tarefa de Associação, utilizou-se um software livre para exploração de

dados, aprendizado de máquina e mineração de dados, denominado Tanagra, sob o qual é possível

trabalhar com diversos algoritmos para classificação e regras de associação. Para classificação dos

consumidores foi utilizado um algoritmo de indução de regras bseado na rotina de aprendizado

supervisionado. Basicamente, esse algoritmo utiliza o princípio da cobertura sequencial: defini-se

64

uma regra que prevê com certa precisão um valor do atributo alvo; retiram-se então os exemplos

que atendam a regra da base de dados e continua-se o processo iterativo até que toda a base de

dados de treinamento seja pesquisada.

5.1.2.3 Aplicação das Regras de Associação no Segmento Industrial

O processo de classificação da classe industrial considera apenas as respostas obtidas na

etapa de questionário dos 126 consumidores para estimar qual, entre as 7 tipologias, seria esperada

para cada um deles. O Quadro 7 apresenta um conjunto de 17 regras sequenciais que permitem, à

medida que são validados os seus antecedentes, indicar um consequente, ou seja, a tipologia do

consumidor da classe comercial. Pode-se observar que vários aspectos são relevantes para definição

da tipologia: CNAE, turnos e horários de funcionamento, consumo, porte da empresa, além de

questões ligadas à economia e ao clima. Quando nenhuma das 17 regras é validada para um

consumidor ele será considerado com a tipologia “i1”.

Quadro 7 – Conjunto Mínimo de 17 Regras para 7 Tipologias Industriais. Conjunto de 17 Regras de Classificação para 7 Tipologias Industriais

N Condição Decisão 1 SE turnos é [T0000] E dem_cont é [BAIXA] [i7]

2 SE hr_func_inicio é [fim_madrugada] E porte_da_empresa é [PEQUENA] E CMM é [BAIXO] E estacao_ano_maior_consumo é [verao]

[i7]

3 SE hr_func_inicio é [ini_manha] E hr_func_fim é [ini_noite] [i6]

4 SE classe é [classe2842] E hr_func_inicio é [fim_madrugada] [i6]

5 SE hr_func_inicio é [ini_manha] E porte_da_empresa é [MEDIA] E efeito_temperatura é [nao]

[i6]

6 SE hr_func_inicio é [ini_manha] E impacto_importacao é [baixo] E regional é [joinville]

[i6]

7 SE turnos é [T1111] E tipo_de_tarifa é [verde] E efeito_temperatura é [sim] E partic_exportacao_receita é [na_ns]

[i5]

8 SE divisao é [div15] E hr_func_fim é [fim_tarde] E partic_exportacao_receita é [na_ns]

[i4]

9 SE impacto_importacao é [NULL] [i4]

10 SE dem_cont é [MEDIA] E porte_da_empresa é [MEDIA] E hr_func_inicio é [flat]

[i4]

11 SE estacao_ano_maior_consumo é [inverno] E regional é [joinville] [i4]

12 SE hr_func_fim é [fim_noite] E partic_exportacao_receita é [baixo] [i3]

65

13 SE turnos é [T1110] E regional é [joinville] [i3]

14 SE divisao é [div27] E impacto_importacao é [na_ns] E efeito_temperatura é [sim]

[i3]

15 SE hr_func_inicio é [fim_madrugada] E dem_cont é [MEDIA] E regional é [joinville]

[i3]

16 SE classe é [classe2022] [i2]

17 SE hr_func_inicio é [ini_manha] E dem_cont é [BAIXA] E impacto_importacao é [na_ns]

[i2]

REGRA PADRÃO [i1] Fonte: Elaborado pelo Autor.

A Tabela 4 apresenta a matriz de confusão para as 7 tipologias da classe industrial. Destaca-

se o bom desempenho do modelo com uma diagonal principal mais dominante.

Tabela 4 - Matriz de Confusão – 7 Tipologias Industriais

Tipologias Previstas Matriz de Confusão Valor Retorno Precisão

I5 I7 I4 I6 I1 I3 I2 Entrada

i5 55% 67% I5 6 0 1 0 4 0 0 11 i7 63% 100% I7 0 5 0 0 2 1 0 8 i4 69% 82% I4 0 0 9 1 1 0 2 13 i6 70% 70% I6 0 0 0 7 1 0 2 10 i1 78% 62% I1 3 0 1 1 21 0 1 27 i3 73% 85% I3 0 0 0 1 1 11 2 15 i2 74% 67% I2 0 0 0 0 4 1 14 19

Médias 69% 76% Saída 9 5 11 10 34 13 21 103 Fonte: Elaborado pelo Autor.

O retorno é a razão entre a quantidade de registros que são do grupo dado como entrada pela

quantidades de registros previstos neste grupo. Já a precisão é a razão entre a quantidade de

registros previstos para um grupo pela quantidade de registros que efetivamente são desse grupo.

Pode-se verificar um bom desempenho da tarefa de classificação das tipologias para a classe

industrial. Nenhuma tipologia apresentou taxa de retorno abaixo de 55% e a taxa média de precisão

ficou acima de 75%.

Para o cluster i7, de acordo com a Tabela 4 e observando a segunda linha na horizontal,

temos 8 (5+2+1) consumidores do cluster i7 (entrada) e após a classificação obteve-se 5 acertos

(saida) representando 63% de acerto. Já observando a coluna do i7 na vertical podemos interpretar

da seguinte forma: dos 5 consumidores previstos como i7 (saida), todos eram i7, representando

100% de acerto.

66

5.1.2.4 Aplicação das Regras de Associação no Segmento Comercial

O processo de classificação da classe comercial considera apenas as respostas obtidas na

etapa de questionário dos 179 consumidores para estimar qual, entre as 8 tipologias, seria esperada

para cada um deles. O Quadro 8 apresenta um conjunto de 24 regras3 sequenciais que permitem, à

medida que são validados os seus antecedentes, indicar um consequente, ou seja, a tipologia do

consumidor da classe comercial. Pode-se observar que vários aspectos são relevantes para definição

da tipologia: CNAE, turnos e horários de funcionamento, consumo, porte da empresa, e até mesmo

a regional do consumidor. Caso nenhum das 24 regras seja validada para um consumidor ele será

considerado com a tipologia “c1”.

Quadro 8 – Conjunto Mínimo de 24 Regras para 8 Tipologas Comerciais. Conjunto de 24 Regras de Classificação para 8 Tipologias Comerciais

N Condição Decisão 1 SE classe in [classe5521] E red_ponta é [NULL] E CMM é

[BAIXO] [c8]

2 SE classe é [classe5232] [c7] 3 SE classe é [classe7040] E turnos é [T1111] E

porte_da_empresa é [GRANDE] [c7]

4 SE tipo_de_tarifa é [monomia] E turnos é [T0111] E CMM é [MEDIO]

[c7]

5 SE hr_func_fim é [ini_noite] E dem_cont é [MEDIA] [c6] 6 SE porte_da_empresa é [MICRO] E classe é [classe7040] E

hr_func_inicio é [ini_manha] [c6]

7 SE classe é [classe5010] E dem_cont é [BAIXA] E red_ponta é [NULL]

[c6]

8 SE hr_func_fim é [ini_noite] E divisao é [div52] E red_ponta é [NULL]

[c6]

9 SE divisao é [div74] E CMM é [MEDIO] E red_ponta é [NULL]

[c6]

10 SE classe é [classe5030] [c5] 11 SE hr_func_fim é [fim_tarde] E turnos é [T0110] E

tipo_de_tarifa é [verde] E hr_func_inicio é [ini_manha] E [c5]

3 Foram consideradas apenas as regras que apresentaram suporte maior ou igual a 3, possibilitando a abstração dos resultados para aplicação em conjuntos de teste, com novos consumidores ainda desconhecidos. Se fosse utilizado um suporte muito baixo, igual a 1 por exemplo, as regras ficariam extremamente especialistas com taxas de retorno e precisão muito elevadas, porém com pouca ou nenhuma capacidade de abstração para estimação da tipologia de novos clientes.

67

porte_da_empresa é [PEQUENA]

12 SE divisao é [div55] E hr_func_inicio é [flat] E turnos é [T1111]

[c4]

13 SE classe é [classe7032] [c4] 14 SE hr_func_fim é [ini_madrugada] [c3] 15 SE turnos é [T0111] E hr_func_inicio é [ini_manha] E divisao

é [div52] E CMM é [MEDIO] E porte_da_empresa é [GRANDE]

[c3]

16 SE dem_cont é [ALTA] E red_ponta é [NULL] [c3] 17 SE classe é [classe5511] E regional é [florianopolis] E CMM é

[MEDIO] [c3]

18 SE turnos é [T0111] E dem_cont é [MEDIA] E CMM é [ALTO]

[c3]

19 SE divisao é [div85] E regional é [florianopolis] E turnos é [T1111]

[c2]

20 SE classe é [classe5522] [c2] 21 SE classe é [classe8514] E regional é [florianop.] [c2] 22 SE tipo_de_tarifa é [monomia] E porte_da_empresa é

[MEDIA] E hr_func_inicio é [ini_manha] [c2]

23 SE classe é [classe5521] E regional é [florianopolis] E porte_da_empresa é [PEQUENA]

[c2]

24 SE classe é [classe7040] E porte_da_empresa é [NULL] [c2] REGRA PADRÃO [c1] Fonte: Elaborado pelo Autor.

O resultado da classificação pode ser mais bem compreendido por meio da matriz de

confusão4 (ou de erros) apresentada na Tabela 5. Considerando que todos os consumidores serão

avaliados na entrada do algoritmo são definidas as saídas, ou estimativas de tipologias de cada

cliente, conforme o resultado da aplicação do conjunto de regras estabelecido. Assim, têm-se dois

objetivos:

- Uma elevada taxa de retorno, dada pela razão entre as estimativas corretas para as

tipologias (diagonal principal destacada) e as verdadeiras tipologias dos clientes (coluna das

entradas).

4 A soma das linhas indicam as quantidades verdadeiras de consumidores em cada tipologia e a soma das colunas indicam as quantidades previstas de consumidores em cada tipologia. A diagonal principal cheia e os demais termos zerados seria uma solução ideal.

68

- Uma elevada taxa de precisão, dada pela razão entre as estimativas corretas para as

tipologias (diagonal principal destacada) e o total das estimativas de cada tipologia (linha das

saídas).

Tabela 5 – Matriz de Confusão – 8 Tipologias Comerciais.

Tipologias Previstas Matriz de Confusão

Valor Retorno Precisão

C8 C4 C2 C6 C1 C5 C3 C7 Entrada c8 14% 100% C8 1 0 0 0 5 1 0 0 7 c4 50% 64% C4 0 9 1 0 8 0 0 0 18 c2 71% 68% C2 0 2 17 0 5 0 0 0 24 c6 88% 74% C6 0 0 0 14 2 0 0 0 16 c1 43% 29% C1 0 0 6 3 12 6 1 0 28 c5 59% 56% C5 0 1 0 1 4 10 1 0 17 c3 53% 83% C3 0 2 0 1 5 1 10 0 19 c7 78% 100% C7 0 0 1 0 1 0 0 7 9

Médias 57% 72% Saída 1 14 25 19 42 18 12 7 138 Fonte: Elaborado pelo Autor.

Apenas uma das tipologias (C8) não apresentou uma taxa de retorno aceitável com a

aplicação da mineração de dados, influenciada também pelo baixo número de representantes na

amostra (apenas sete), e pela dificuldade de identificação de características funcionais que

apontassem tal comportamento da demanda.

De forma semelhante à interpretação da matriz de confusão para a indústria podemos

interpretar a matriz de confusão para o comércio. Para o cluster c7, de acordo com a Tabela 5 e

observando a oitava linha na horizontal sem os cabeçalhos, temos 9 (1+1+7) consumidores do

cluster c7 (entrada) e após a classificação obteve-se 7 acertos (saida) representando 78% de acerto.

Já observando a coluna do c7 na vertical podemos interpretar da seguinte forma: dos 7

consumidores previstos como c7 (saida), todos eram c7, representando 100% de acerto.

5.2 RESULTADOS - PREVISÃO PARA A DIVISÃO CNAE 15

5.2.1 Variáveis de entrada

A escolha das variáveis explicativas do comportamento da demanda é uma das etapas

cruciais da elaboração de um modelo econométrico. Focado na divisão CNAE 15 (alimentos e

bebidas), optou-se pela seleção de variáveis predominantemente macroeconômicas. Pôde-se utilizar

69

as respostas obtidas junto aos consumidores industriais da divisão 15 quando da aplicação do

Questionário de Caracterização Funcional da etapa anterior. Por meio daquele questionário, os

empresários e gestores já puderam indicar quais as variáveis de maior influência para seus negócios.

Após consultar diversas bases de dados, a saber: Banco Central do Brasil, IBGE, Fundação

Getúlio Vargas e Confederação Nacional da Indústria, foi possível obter 18 variáveis econômicas:

PIB (cinco variantes), valor agregado, imposto, consumo das famílias, consumo da administração

pública, valor da formação bruta do capital fixo, exportação e importação, TCER, IGPM, TJLP,

Selic, TR e IPCA. Foi possível então construir 18séries históricas estacionárias para o exemplo de

aplicação a partir das variáveis econômicas analisadas.

Como não se tem conhecimento prévio sobre os intervalos de tempo em que ocorrem os

impactos das variáveis explicativas (econômicas) sobre a variável dependente (consumo de energia

elétrica), todas as 18 variáveis explicativas foram correlacionados com a série histórica de

V12m_CEE_MM6 para defasagens de 0, 1, 2, 3... até 12 meses. Esse procedimento permite

identificar os efeitos de políticas econômicas cuja constante de tempo encontra-se no médio prazo.

A redução da taxa de juros ou o aumento da renda, por exemplo, poderiam impactar positivamente

na cadeia produtiva da divisão 15, porém o impacto no consumo de energia elétrica pode não ser

imediato.

Conforme resultados do modelo econométrico as variáveis testadas neste modelo foram:

• V12m_CEE_MM6_12 – variação da média móvel do consumo de energia dos últimos 6 meses, 12 meses antes do mês de previsão.




• Pib_Ind_Trans (t-5) – variação do percentual do PIB 6 meses antes do mês de previsão.

• Taxa_Exportação(t-3) – variação do percentual de exportação 3 meses antes do mês de previsão.

70

O comportamento do consumo médio mensal da divisão 15 desde 1998 até 2011 não

apresenta uma curva estacionária além de não exister um padrão de variação do consumo de um

mês para outro e, pelo contrário, as variações são rápidas e difíceis de ser previstas ou

correlacionadas com outras variáveis explicativas. Portanto, foram realizadas simulações

considerando não o CMM (consumo médio mensal) de cada mês individualmente mas sim as

médias móveis de 6 (MM6) meses. A série construída MM6, por não ser uma janela tão longa

consegue reagir relativamente bem às variações da economia ou do clima ao mesmo tempo em que

apresenta boas correlações parciais com as suas variações explicadas. Médias móveis mais curtas

são difíceis de correlacionar e as mais logas demoram muito para carregar os efeitos de variações da

economia, mesmo as mais intensas.

A MM6 não é estacionária e, portanto não pode ser diretamente inserida como variável

dependente do modelo econométrico. Para torná-la estacionária, optou-se pelo cálculo da variação

percentual em relação ao mesmo período do ano anterior. Denominada aqui de variação 12 meses

ou V12m esta operação consegue extrair as mudanças no ritmo de crescimento ou decrescimento do

consumo de um ano para outro.

Na análise de regressão que envolve séries temporais existem modelos que incluem não

apenas os valores correntes das variáveis explanatórias (MM6) mas também valores defasados

dessas variáveis. Quando um modelo inclui um ou mais valores defasados ele é chamado de modelo

auto-regressivo.

5.2.2 Topologia

A Figura 8 apresenta a topologia da rede neural artificial utilizada. Após vários testes

obtou-se por uma topologia com 6 neurônios na camada escondida. A saída é sempre a variação da

média móvel dos últimos 6 meses de consumo para o mês de previsão.

71

Figura 8 – MLP Testada. Fonte: Elaborado pelo Autor.

A rede foi treinada não somente com a apresentação de todas as variáveis consideradas,

conforme Figura 8, mas também com as entradas, V12MM6M (t-11), V12MM6M (t) e

Pib_Ind_Trans (t-5) e finalmente com apenas 2 entradas, V12MM6M (t-11) e V12MM6M (t).

Para o treinamento foram utilizados os dados de 2000 à 2010 e para validação os dados de

2011. Os resultados são apresentados a seguir.

5.2.3 Validação do protótipo com matlab

A fim de validar os resultados obtidos pelo sistema desenvolvido foi utilizado o software

matlab para obtenção dos resultados. Alguns resultados foram confrontados com os resultados do

protótipo.

Na busca de melhores resultados e na tentativa de utilizar dados de previsão mais distantes

do mês de previsão foram inseridas aos poucos variáveis econômicas e o modelo auto-regressivo

utilizado foi o reduzido, ou seja, 4 entradas mm6m de 3, 6, 9 e 12 meses anteriores. Foi inserida a

variável o pib_agro (pib da indústria agropecuária) de 3, 6, 9 e 12 meses anteriores. Os resultados

são apresentados na tabela 6.

72

Tabela 6 – Resultados modelo reduzido

Entradas Algoritmo

NI épocas

mape treinamento

mape teste

mínimo mape treinamento

mínimo mape teste

máximo mape treinamento

máximo mape teste

mm6m 3,6,9,12 pib_agro 3,6,9,12 trainlm 8 1000 5,26% 8,15% 0,05% 2,39% 19,84% 18,46% mm6m 3,6,9,12 pib_agro 3,6,9,12 trainlm 8 2000 4,32%

13,65% 0,03% 5,68% 17,27% 23,90%

mm6m 3,6,9,12 pib_agro 3,6,9,12 trainlm 8 5000 3,22% 8,80% 0,01% 1,21% 15,55% 18,58% mm6m 3,6,9,12 pib_agro 3,6,9,12 trainlm 12 1000 5,04%

12,57% 0,02% 1,43% 19,49% 23,66%

mm6m 3,6,9,12 pib_agro 3,6,9,12 trainlm 12 2000 3,95%

11,28% 0,02% 1,06% 15,88% 23,91%

mm6m 3,6,9,12 pib_agro 3,6,9,12 trainbr 6 100 7,92% 4,37% 0,07% 0,13% 31,06% 11,01% mm6m 3,6,9,12 pib_agro 3,6,9,12 trainbr 6 1000 5,83% 8,35% 0,09% 0,74% 22,15% 16,54% mm6m 3,6,9,12 pib_agro 3,6,9,12 trainbr 8 100 9,32% 7,10% 0,44% 1,05% 33,64% 12,06% mm6m 3,6,9,12 pib_agro 3,6,9,12 trainbr 8 1000 5,63% 8,86% 0,00% 4,00% 21,74% 19,22% Fonte: Elaborado pelo Autor.

Conforme apresentado na tabela 6, os resultados tiveram erros acima do desejado, apesar das

inúmeras tentativas de alteração de número de neurônios na camada intermediária e épocas.

73

O melhor mape de treinamento é o da linha marcada em verde na tabela 6 que foi de 3,22%.

Porém o erro de previsão foi de 8,80% e o mape máximo de mais de 18%. A Figura 9 ilustra este

resultado:

Figura 9 - Linha Amarela – Tabela 6. Fonte: Elaborado pelo Autor.

A linha marcada em verde apresenta o melhor resultado de previsão da tabela 6, no entanto

aparenta ser ao acaso pois apresenta um alto erro de previsão, 7,92%. Porém o erro máximo de

previsão ficou em torno de 11% e o médio de previsão em torno de 4%, de acordo com a Figura 10.

0

20

40

60

80

100

120

140

160

180

CMM(previsto) x CMM(ideal) - LINHA AMARELA - Tabela 6 CMM (GWh) - PREVISTO

CMM (GWh) - REAL

74

Figura 10 - Linha Verde – Tabela 6. Fonte: Elaborado pelo Autor.

Com a finalidade de melhorar os resultados foram testadas configurações e variáveis de

entrada distintas. As variáveis testadas foram:

• mm6m - Média Móvel do Consumo em 6 Meses.

• a12m_selic – Acumulado de 12 Meses da SELIC.

• a12m_tr – Acumulado de 12 Meses da TR.

• a12m_ipca – Acumulado de 12 Meses do IPCA.

• TJLP – Taxa de Juros de Longo Prazo

• Exportação – Taxa de exportação.

• VA – Valor Agregado da Indústria

• pib_ind_trans – Pib da Indústria de Transformação.

• pib_ser – Pib de Serviço.

• pib_ind – Pib da Indústria.

• pib_agro – Pib da Indústria Agropecuária.

• pib – Produto Interno Bruto.

0

20

40

60

80

100

120

140

160

180

CMM(previsto) x CMM(ideal) - LINHA VERDE - Tabela 6 CMM (GWh) - PREVISTO

CMM (GWh) - REAL

75

Foram considerados os atrasos nas correlações de acordo com o modelo econométrico. Para

a variação do consumo, variável 1, as redes foram alimentadas com o valor do mesmo mês do ano

anterior, ou seja, mm6m -12 meses ao da previsão. Esse mesmo deslocamento foi utilizado para as

variáveis 2 (a12m_selic), 3 (a12m_tr), 4 (a12m_ipca) e 5 (tjlp). Para a variável 6 (exportação) o

atraso foi de 3 meses. Para as variáveis 7 (va), 9 (pib_ser) e 12 (pib) o atraso foi de 4 meses. Para as

variáveis 8 (pib_ind_trans), 10 (pib_ind) e 11 (pib_agro) o atraso foi de 6 meses.

Os resultados estão mostrados na tabela 7:

Tabela 7 – Resultados – Todas as variáveis

entradas Algoritmo

NI

Épocas

mape treinamento

mape teste


mínimo mape teste


máximo mape teste

todas variáveis trainbr 12 1000 4,63% 6,32% 0,03% 1,37% 21,97% 14,00% todas variáveis trainbr 20 1000 3,91% 14,23% 0,05% 3,90% 17,44% 28,15% todas variáveis trainbr 15 1000 4,06% 9,48% 0,05% 0,11% 19,27% 27,75% todas variáveis trainbr 15 5000 2,58% 15,83% 0,00% 7,32% 10,97% 30,55% todas variáveis trainbr 15 10000 1,73% 9,13% 0,01% 1,66% 7,74% 18,96% todas variáveis trainbr 15 5000 2,42% 34,30% 0,03% 2,11% 10,15% 60,21% todas variáveis trainbr 4 5000 3,90% 10,49% 0,01% 1,51% 23,80% 17,87% todas variáveis trainbr 4 100 11,77% 7,18% 0,04% 0,35% 49,17% 13,46% todas variáveis trainbr 6 1000 5,39% 10,06% 0,02% 1,11% 20,73% 31,39% todas variáveis

Trainlm 12 1000 4,39% 5,80% 0,04% 0,36% 23,80% 14,02%

todas variáveis

Trainlm 15 5000 2,37% 10,66% 0,00% 0,45% 10,57% 29,60%

todas variáveis

Trainlm 20 5000 2,21% 24,55% 0,01% 1,86% 9,38% 45,76%

todas variáveis

Trainlm 12 5000 2,4786%

13,4270% 0,01% 1,20% 11,85% 27,19%


O algoritmo trainbr apresentou os melhores resultados na validação do treinamento,

apresentando um mape de 1,73% no melhor caso onde foram utilizados 15 neurônios na camada

76

intermediária e 10000 épocas (linha verde – tabela 15). No entanto, a capacidade de generalização

da rede foi comprometida apresentando um mape no teste de 9,73%. É um exemplo de uma rede

super treinada. A Figura 11 apresenta o resultado do treinamento e validação dessa rede:


A rede super treinada da Figura 11 mostra o acerto com os dados de treinamento em quase

toda a curva até o ano de 2010. Para o ano de 2011, dados de teste, o resultado foi ruim pois a rede

super treinada apresenta pouca capacidade de generalização com dados nunca apresentados à rede.

O melhor resultado para essa configuração foi um mape de 5,80% no teste com 12

neurônios na camada intermediária e 1000 épocas. No entanto o erro máximo foi de mais de 14%,

de acordo com a linha amarela da tabela 7.O menor erro máximo de teste aparece na linha em azul

da tabela 7, porém com alto valor de mape no teste.

Os resultados com todas as variáveis não foram satisfatórios. Decidiu-se então retirar do

modelo as variáveis relacionadas com o pib. E os resultados estão mostrados naa tabela 8:

As entradas da rede foram:

• mm6m

• a12m_selic

020

40

60

80100

120

140160

180

jan

-00

jul-

00

jan

-01

jul-

01

jan

-02

jul-

02

jan

-03

jul-

03

jan

-04

jul-

04

jan

-05

jul-

05

jan

-06

jul-

06

jan

-07

jul-

07

jan

-08

jul-

08

jan

-09

jul-

09

jan

-10

jul-

10

jan

-11

jul-

11


CMM (GWh) - REAL

77

• a12m_tr

• a12m_ipca – acumulado de 12 meses do IPCA

• TJLP

• Exportação

• VA

Tabela 8 - Resultados 7 variáveis A.

entradas Algoritmo

NI

Épocas

mape treinamento

mape teste


mínimo mape teste


máximo mape teste

1,2,3,4,5,6,7 trainlm

12 2000 6,03%

54,09% 0,03%

20,06% 24,28%

68,70%

1,2,3,4,5,6,7 trainlm

12 1000 7,27%

30,17% 0,01% 1,20% 11,85%

27,19%


Novamente não obteve-se resultados satisfatórios.Então foi retirada a variável tjlp e

acrescentado ao modelo o pib_ind_trans que apresentou melhor correlação linear no modelo

econométrico. Obteve-se os resultados apresentados na tabela 9:

Tabela 9 - Resultados 7 variáveis B.

entradas Algoritmo

NI

época é

mape treinamento

mape teste


mínimo mape teste


máximo mape teste

1,2,3,4,6,7,8 trainlm

12 5000 3,42% 9,59% 0,01% 1,84% 14,44%

17,54%

1,2,3,4,6,7,8 trainlm

20 5000 2,82% 13,30% 0,01% 3,72% 14,07%

23,66%

1,2,3,4,6,7,8 trainlm

20

10000 1,82% 16,51% 0,03% 3,81% 13,35%

31,81%

1,2,3,4,6,7,8 trainlm

20 5000 3,54% 14,87% 0,01% 0,48% 16,87%

43,14%

1,2,3,4,6,7,8 trainbr 6 100 12,55% 5,20% 0,01% 0,49% 45,78%

10,07%

1,2,3,4,6,7,8 trainbr 8 100 12,97% 6,98% 0,11% 0,09% 47,56%

14,57%

1,2,3,4,6,7,8 trainbr

12 100 10,67% 8,02% 0,14% 0,55% 42,17%

16,50%

78

1,2,3,4,6,7,8 trainbr

12 200 11,14% 6,24% 0,07% 0,73% 46,38%

11,62%

1,2,3,4,6,7,8 trainbr

15 200 9,4079%

5,4089% 0,05% 0,17% 41,09%

14,52%

1,2,3,4,6,7,8 trainbr

15 300 9,52% 5,06% 0,19% 0,05% 42,24%

10,47%

1,2,3,4,6,7,8 trainbr 6 100 12,78% 7,39% 0,17% 1,27% 45,01%

13,10%

1,2,3,4,6,7,8 trainbr 8 100 13,42% 4,93% 0,33% 0,55% 46,09% 8,99% Fonte: Elaborado pelo Autor.

Neste caso o melhor resultado foi a rede com regularização bayesiana, algoritmo trainbr, 8

neurônios na camada escondida e apenas 100 épocas, com um mape de 4,93% para os dados de

teste e um mape máximo de 8,99% para o teste, de acordo com a linha amarela da tabela 9. A

Figura 12 apresenta o resultado do treinamento e teste:


Os resultados da Figura 12 apresentam uma rede com uma boa capacidade de generalização.

Porém os resultados parecem ao acaso, uma vez que a rede não apresenta bons resultados no

treinamento.

É possível perceber que a capacidade de generalização fica comprometida conforme o

número de épocas vai aumentando. Por esse motivo o número ideal de épocas foi de 100 na tabela

9.

0

20

4060

80

100120

140

160

180

jan

-00

jul-

00

jan

-01

jul-

01

jan

-02

jul-

02

jan

-03

jul-

03

jan

-04

jul-

04

jan

-05

jul-

05

jan

-06

jul-

06

jan

-07

jul-

07

jan

-08

jul-

08

jan

-09

jul-

09

jan

-10

jul-

10

jan

-11

jul-

11


CMM (GWh) - REAL

79

O algoritmo de treinamento levenber-marquardt (trainlm) apresentou uma boa capacidade de

aprendizado, tendo um mape com os dados de treinamento de 1,82%. Porém a capacidade de

generalização da rede com essa mesma configuração não foi boa, com um mape de 16,51%. Essa

rede também está super treinada e a Figura 13 mostra os resultados do treinamento e teste dessa

configuração:


Pela Figura 13 é possível perceber a baixa capacidade de generalização da rede.

Por fim, foram realizados testes com as variáveis:

• mm6m – 3 - média móvel do consumo em 6 meses 3 meses antes da previsão




• a12m_ipca

• Exportação

0

20

40

60

80

100

120

140

160

180

jan

-00

jul-

00

jan

-01

jul-

01

jan

-02

jul-

02

jan

-03

jul-

03

jan

-04

jul-

04

jan

-05

jul-

05

jan

-06

jul-

06

jan

-07

jul-

07

jan

-08

jul-

08

jan

-09

jul-

09

jan

-10

jul-

10

jan

-11

jul-

11


CMM (GWh) - REAL

80

• pib_ind_trans

A estratégia foi unir o modelo auto-regressivo reduzido (quartos de ano) com as variáveis

que apresentaram melhor correlação linear no modelo econometrico. Os resultados são apresentados

na tabela 10:

Tabela 10 - Resultados 4 variáveis.

Entradas algoritmo NI épocas mape treinamento

mape teste


mínimo mape teste


máximo mape teste

cmm6m(3,6,9) 1,4,6,8 trainlm 8 1000 6,27% 5,25% 0,04% 0,98% 23,37% 12,95% cmm6m(3,6,9) 1,4,6,8 trainlm 8 2000 5,51% 5,86% 0,05% 0,86% 21,31% 12,18% cmm6m(3,6,9) 1,4,6,8 trainlm 8 1500 5,7334% 8,4507% 0,17% 0,22% 21,91% 17,85% cmm6m(3,6,9) 1,4,6,8 trainlm 10 1000 6,32% 4,34% 0,03% 0,50% 22,84% 11,81% cmm6m(3,6,9) 1,4,6,8 trainlm 10 2000 4,94% 6,41% 0,06% 0,21% 20,82% 16,76% Fonte: Elaborado pelo Autor.

A Figura 14 apresenta pouca variação do erro da linha amarela da tabela 10:

81


Os resultados ficaram piores que os anteriores apresentando apenas 1 situação em que o

mape de teste foi menor que 5%, na linha amarela da tabela 10.

O último teste realizado foi com o modelo auto-regressivo. Foram utilizados dados de 1 ano

antes ao de previsão, mês a mês. Ou seja, foram utilizados 12 meses antes ao da previsão para

prever o mês subsequente. Foram testados 2 algoritmos, o levenberg-marquardt (trainlm) e a

regularização bayesiana (trainbr).

Os resultados obtidos com alguns testes estão na tabela 11:

Tabela 11- Resultados Auto-regressivo

Entradas Algoritmo

NI Épocas

mape treinamento

mape teste


mínimo mape teste


máximo mape teste

auto-regressivo Trainlm 8 1000 4,19% 4,26% 0,21% 0,81% 21,50% 12,54% auto-regressivo Trainlm 8 2000 3,95% 4,69% 0,04% 0,14% 17,79% 10,51% auto- Trainlm 8 5000 3,09% 7,66% 0,00% 2,62% 14,72% 13,86%

0

20

40

60

80

100

120

140

160

180

CMM(previsto) x CMM(ideal) LINHA AMARELA - Tabela 10 CMM (GWh) - PREVISTO

CMM (GWh) - REAL

82

regressivo

auto-regressivo Trainlm 10 1000 4,30% 3,94% 0,14% 0,58% 20,93% 13,53% auto-regressivo Trainlm 12 1000 3,91% 4,33% 0,05% 0,60% 19,91% 10,27% auto-regressivo Trainlm 12 2000 3,76% 5,83% 0,03% 1,73% 17,35% 11,82% auto-regressivo Trainbr 6 100 5,77% 4,31% 0,16% 0,29% 27,12% 15,53% auto-regressivo Trainbr 6 1000 4,48% 3,66% 0,12% 0,30% 21,68% 11,73% auto-regressivo Trainbr 8 100 4,94% 4,83% 0,02% 0,95% 26,81% 14,55% auto-regressivo Trainbr 8 1000 4,22% 3,99% 0,01% 0,24% 23,09% 12,43%


Nesse modelo é possível observar que a rede obteve bons resultados com o algoritmo

trainlm, 10 neurônios na camada intermediária e 1000 épocas, apresentando um mape com os dados

treinados de 4,30% e mape com os dados de teste (previsão) de 3,94%, linha marcada em vermelho

na tabela 11. A Figura 15 apresenta o gráfico da diferença entre a curva real e a prevista, em GWh.

Figura 15 - Linha vermelha – Tabela 11. Fonte: Elaborado pelo Autor.

0

20

40

60

80

100

120

140

160

180

CMM(previsto) x CMM(ideal) LINHA Vermelha - tabela 11 CMM (GWh) - PREVISTO

CMM (GWh) - REAL

83

Percebe-se também que o erro no treinamento diminui com o aumento do número de épocas

para mais de 1000. Para 5000 épocas com 8 neurônios na camada intermediária o erro de

treinamento foi de 3.09%, porém o erro de previsão foi de 7,66%, de acordo com a linha marcada

em amarelo na tabela 11 e Figura 16.

Figura 16 - Linha amarela – Tabela 11. Fonte: Elaborado pelo Autor.

A regularização baysiana apresentou os melhores resultados (linha verde, tabela 11) no

modelo auto-regressivo apresentando o menor erro de previsão de 3,66%, em uma rede com apenas

6 neurônios na camada escondida e 1000 épocas. A Figura 17 apresenta os resultados:

0

20

40

60

80

100

120

140

160

180


CMM (GWh) - REAL

84


A linha marcada em azul na Tabela 11 apresenta o menor mape máximo de previsão, igual a

10,27%. O mape geral de previsão foi de 4,33%. A Figura 18 apresenta os resultados:

Figura 18 - Linha Azul – Tabela 11. Fonte: Elaborado pelo Autor.

0

20

40

60

80

100

120

140

160

180

CMM(previsto) x CMM(ideal) - LINHA Verde - tabela 11 CMM (GWh) - PREVISTO

CMM (GWh) - REAL

0

20

40

60

80

100

120

140

160

180

CMM(previsto) x CMM(ideal) - LINHA AZUL - Tabela 11 CMM (GWh) - PREVISTO

CMM (GWh) - REAL

85

5.3 ESPECIFICAÇÃO DO TRANSFORMADOR

Tomando como exemplo de aplicação desta metodologia a construção de um

empreendimento de uso coletivo, pode-se estabelecer a provável curva de carga diária dos dias de

semana a partir das técnicas desenvolvidas neste projeto, a qual deverá influenciar a definição dos

condutores da rede e do transformador de distribuição. Tem-se como exemplo os seguintes

consumidores:

1º) uma clínica médica (500kVA) da regional de Florianópolis, pertencente ao CNAE 8514,

opera em todos os seus turnos [T1111], cuja tipologia pela regra 19 do Quadro 8, seria a C2;

2º) um restaurante (300kVA) que pertence ao CNAE 5521, seu horário de funcionamento é

flat e opera em todos os seus turnos [T1111], cuja tipologia pela regra 12 da Tabela 11, seria a C4;

3º) uma loja de informática (60kVA) pertencente ao CNAE 5129, que contrata a tarifa

monômia, opera pela manhã à noite [T0111] e seu consumo mensal (CMM) é médio, cuja tipologia

pela regra 4 do Quadro 8, seria a C7.

A partir da carga instalada declarada de cada um dos consumidores, podemos estimar a

curva de carga individual a partir do fator de demanda típico do CNAE de cada consumidor, que

pode ser estimado respectivamente em 0,235; 0,200 e 0,251.

Considerando o pico de demanda das três tipologias C2, C4 e C7, obtém-se as curvas de

carga diárias individuais, mostrada na Figura 19 e a curva de carga total das três tipologias na

Figura 20.

86

Figura 19 - Curva de Carga do Empreendimento de Uso Coletivo. Fonte:Adaptado de Andrade et al., (2013).

A caracterização do comportamento da demanda, inserida no processo de planejamento da

distribuição, é um problema complexo e relevante para uma concessionária de energia. De um

modo geral, o processo de mineração aqui apresentado conseguiu inovar, agregando conhecimento

novo e útil sobre o comportamento da demanda de consumidores comerciais e industriais em Santa

Catarina.

0

20

40

60

80

100

120

00:00 03:00 06:00 09:00 12:00 15:00 18:00 21:00

Curva de Carga Diária (kVA)

Clínica Médica Restaurante Loja de Informática

87

Figura 20 - Curva diária total Fonte: Elaborado pelo autor.

Assim, para atender a máxima demanda do conjunto que, como podemos observar na Figura

20 é de um pouco maior que 180 kVA, sendo suficiente um transformador de 225 kVA.

5.4 COMENTÁRIOS FINAIS

Neste capítulo foram explorados os resultados da etapa de clusterização que obtiveram sete

tipologias para a indústria e oito para o comércio. Os questionários foram aplicados nos

consumidores medidos e com medição disponibilizada pela concessionária. Assim foi possível

determinar 17 regras mínimas de associação para a indústria e 24 para o comércio com o auxílio do

Tanagra.

Com os resultados obtidos, ficou demonstrado que o modelo proposto possibilita que um

novo consumidor (pertencente a um novo empreendimento, por exemplo) possa ter classificado o

seu perfil de curva de carga, bastando realizar a aplicação do questionário desenvolvido e aplicação

das regras de associação identificadas.

Para um melhor dimensionamento da rede a previsão de montante foi executada para a

divisão CNAE 15 com o auxílio do matlab. Os resultados demonstram que é possível prever o

montante consumido com baixo erro.

0

50

100

150

200

00:00 03:00 06:00 09:00 12:00 15:00 18:00 21:00

Curva de Carga Diária (kVA)Somatório 51, 55 e 85Total_CNAEs

88

6 CONCLUSÃO

A partir da revisão da literatura pode-se observar que a determinação do perfil da curva de

carga de consumidores e previsão de montante de consumo de forma segregada para a indústria e

para o comércio, não é o foco da maioria dos estudos da área.

A aplicação do algoritmo de clusterização k-means sobre os dados de medição dos

consumidores industriais e comerciais selecionados do estado, permitiu encontrar sete tipologias

típicas de curva de carga para a indústria e oito tipologias para o comércio.. Com o uso do Tanagra

foi possível definir as regras de associação encontrando as variáveis de influência para cada

tipologia. Com definições aplicação desta metodologia será possível aplicar o questionário em

novos consumidores e assim classificá-lo em uma das quinze tipologias definidas (indústria +

comércio), sem a necessidade de novas medições.

Para melhor entendimento do valor agregado pela descoberta de associações no âmbito da

pesquisa, a aplicação dos questionários somente nas regiões de Florianópolis e Joinville já garantiu

uma taxa de acerto de 57% com uma precisão de 72%. Tais resultados demonstram a viabilidade da

estimação do perfil de carga para consumidores industriais e comerciais em todas as regionais do

estado. Com o aumento do número de questionários respondidos é possível conseguir uma taxa de

retorno e precisão ainda maiores. Mesmo com estes resultados parciais, já foi possível identificar

algumas relações interessantes obtidas dos atributos dos questionários respondidos pelos

consumidores medidos. Com relação à previsão de montante de energia, os melhores

resultados foram com o modelo auto-regressivo, considerando o CNAE 15. A rede obteve bons

resultados com um mape com os dados treinamento de 4,30% e mape com os dados de teste

(previsão) de 3,94% com o algoritmo levenberg-marquardt. Para o levenberg-marquardt com

regularização bayesiana os resultados apresentados foram ainda melhores, com erro de previsão de

3,66%.

Conforme foi se acrescentando variáveis econônomicas na entrada da rede neural, os

resultados foram ficando piores. Muitas vezes a rede apresentou bons resultados no treinamento,

ficando muitas vezes super treinada. Porém, os resultados com os dados de teste, muitas vezes

apresentaram erros muito maiores que o modelo auto-regressivo.

89

Devido a complexidade do estudo com o modelo econométrico e dificuldade em definir as

variáveis de influência para cada tipo de rede, chegou-se a conclusão que o modelo auto-regressivo

é o mais indicado para a divisão CNAE 15, indústria de bebidas e alimentos. Uma vez que os

resultados de previsão com variáveis econômicas piora o modelo torna-se sem sentido o uso dessas

variáveis nessa atividade econômica.

Os resultados da previsão da divisão CNAE 15 foram bons em termos d MAPE, porém

ainda podem ser melhorarados, considerando o histórico de dados de treinamento maior..

Para outras atividades da indústria é interessante fazer o mesmo estudo com variáveis de

influência a fim de verificar se os resultados melhoram em relação ao modelo auto-regressivo. Se o

modelo auto-regressivo também apresentar melhores resultados não háverá necessidade de utilizar

outras variáveis.

Nesse sentido concluí-se que é possível agrupar os perfis de carga definindo-se padrões de

consumo diferenciados dos consumidores industriais e comerciais de uma região do estado de Santa

Catarina utilizando técnicas de KDD. Além disto, demonstrou-se que é possível prever a variação

do consumo de energia elétrica mensal da indústria e do comércio em uma regiao do estado de

Santa Catarina com acuracidade adequada utilizando-se redes neurais artificiais. Assim as duas

hipóteses formuladas foram comprovadas neste trabalho. Da mesma forma, todos os objetivos

específicos foram cumpridos.

Com a combinação das técnicas propostas, classificação de consumidores novos nas quinze

tipologias de curva de carga definidas para a indústria e o comércio, e previsão de montante de

energia via redes neurais artificiais com o modelo autoregressivo será possível planejar melhor as

instalações de distribuição, em especial a especificação de transformadores de edifícios mistos

novos.

90

SUGESTÕES PARATRABALHOS FUTUROS

• Gerar novas regras de associação via TANAGRA, considerando informações dos questionários

respondidos das outras seis regionais. Com isto pretende-se aumentar os valores de retorno e

precisão para estas regras, aumentando assim a confiança no modelo.

• Aumentar a base de dados de medição para o treinamento das redes neurais artificiais,

considerando pelo menos mais cinco anos de dados de medição para todos os CNAEs

estudados.

• Para a previsão de montante, uma sugestão de trabalho futuro é realizar o estudo de APIs que

implementam as principais redes neurais. A Biblioteca do projeto ENCOG (Encog Machine

Learning Framework) do instituto de pesquisa Heaton tem sido testada com algumas curvas de

carga mensal disponibilizadas pela distribuidora e apresentou resultados iguais aos realizados

com o Matlab. A diferença do uso de bibliotecas é que a implementação dos algoritmos de

treinamento e previsão são de código fonte aberto e podem ser alterados a fim de obter melhores

resultados. Assim, configurações de parâmetros como o Bias e Momentum podem alterar as

saídas das redes produzindo melhores resultados.

91

REFERÊNCIAS

AGRAWAL, R.; SRIKANT, R. Fast Algorithms for Mining Association Rules. 20th VLDB Conference, 487-498, Santiago, Chile, 1994. AMJADY, N. Short-Term Bus Load Forecasting of Power Systems by a New Hybrid Method. IEEE Transactions on Power Syst., vol. 22, no. 1, pp. 333-341, 2007.

AMJADY, N.; KEYNIA, FARSHID. Mid-term load forecasting of power systems by a new prediction method. Energy Conversion and Management, Volume 49, Issue 10, pp. 2678-2687, 2008.

ANDRADE, F. F. . Um Modelo para Descrição e Previsão da Demanda dos Consumidores Industriais de Energia Elétrica. Tese de Doutorado. PGEEL. UFSC. 2009.

ANDRADE, F. F. ; CAMARGO, C. C. DE B. ; TEIVE, R. C. G. . Previsão da Demanda de Consumidores Industriais de Energia Elétrica no Médio Prazo baseada em Variáveis Econômicas e Climáticas. CBA, 2010.

ANDRADE, F.F.D. TEIVE, R.C.G. ARANHA NETO, E.A.C. CAMARGO, C.C.D.B. COELHO, J. ROSARIO, L.M. BETTIO, J.A.D. Metodologia para Descoberta de Clusters Mínimos e Significativos dos Perfis de Carga Típicos de Consumidores Industriais e Comerciais de uma Distribuidora de Energia Elétrica. XV ERIAC - XV Encontro Regional Ibero-Americano do CIGRÉ. Foz do Iguaçu, 2013.

ANUAR, N.; ZAKARIA, Z.. Cluster Validity Analysis for Electricity Load Profiling. Electrical Engineering, p.35-38. 2010.

AREEKUL, P.; SENJYU, T.; TOYAMA, H.; YONA, A.. A Hybrid ARIMA and Neural Net-work Model for Short-Term Price Forecasting in Deregulated Market, IEEE Transactions on Power Systems, vol.25, no.1, pp.524-530, 2010.

BOX, GEORGE E.; JENKINS, GWILYM M.; REINSEL, GREGORY C.. Time series analysis: forecasting and control, 3.ed. Englewood Cliffs: Prentice Hall. 1994.

BUNNOON, PITUK; CHALERMYANONT, KUSUMAL; LIMSAKUL, CHUSAK. Mid-Term Load Forecasting: Level Suitably of Wavelet and Neural Network based on Factor Selection. Energy Procedia, vol. 14, pp. 438-444. 2012.

CHAN, K. Y.; DILLON, T.S.; SINGH, J.; CHANG, E.. Neural-Network-Based Models for Short-Term Traffic Flow Forecasting Using a Hybrid Exponential Smoothing and Levenberg–Marquardt Algorithm. IEEE Transactions on Intelligent Transportation Systems , vol.13, no.2, pp.644-654. 2012.

CELESC Norma de Entrada de Instalações Consumidoras em Alta Tensão, Nota Técnica n.03, disponível em: <http://novoportal.celesc.com.br/portal/images/arquivos/normas/Nt03.pdf>. Acesso em: 26 fev. 2014.

92

CHANGHAO, XIA; JIAN, WANG; MCMENEMY, KAREN. Short, medium and long term load forecasting model and virtual load forecaster based on radial basis function neural networks. International Journal of Electrical Power & Energy Systems, vol. 32, Issue 7, pp. 743-750. 2010.

FAYYAD, U.; PIATETSKY-SHAPIRO, G.; SMYTH, P.. The KDD Process for extracting useful knowledge from volumes of data. Communications of the Association for Computing Machinery. V. 39. N. 11. P. 27-34. Nov. 1996.

GHELARDONI, L.; GHIO, A.; ANGUITA, D. . Energy Load Forecasting Using Empirical Mode Decomposition and Support Vector Regression Smart Grid. IEEE Transactions on , vol.4, no.1, pp.549,556. 2013.

GHIASSI, M.; ZIMBRA, D.K.; SAIDANE, H.. Medium term system load forecasting with a dynamic artificial neural network model. Electric Power Syst., vol. 76, pp. 302–316. 2006.

GONZALEZ-ROMERA, E.; JARAMILLO-MORAN, MA.; CARMONA-FERNANDEZ, D.. Monthly electric energy demand forecasting based on trend extraction. IEEE Trans Power Syst., vol. 21, pp. 1946–1953. 2006.

HAYKIN, S.. “Redes Neurais: princípios e prática”, 2. ed. Porto Alegre: Bookman. 2001.

HILL, D.C.; MCMILLAN, D.; BELL, K.R.W.; INFIELD, D.. Application of Auto-Regressive Models to U.K. Wind Speed Data for Power System Impact Studies. IEEE Transactions on Sustainable Energy, vol.3, no.1, pp.134-141. 2012.

KANDIL MS, EL-DEBEIKY SM, HASANIEN NE.. Long-term load forecasting for fast developing utility using a knowledge-based expert system. IEEE Trans Power Syst., vo. 17, pp. 491–496. 2002.

KANTARDZIC, M.. Data Mining: Concepts, Models, Methods, and Algorithms. 2nd ed. Wiley-IEEE Press. 2011.

LI, W.; ZHOU, J.; XIONG, X.; LU, J.. A Statistic-Fuzzy Technique for Clustering Load Curves. IEEE Trans. Power Systems, v.22, n.2, p.890-891. 2007.

MIRASGEDIS S, SARAFIDIS Y, GEORGOPOULOU E, LALAS DP, MOSCHOVITS M, KARAGIANNIS F. . Models for mid-term electricity demand forecasting incorporating weather influences. Energy and Buildings, vol. 31, pp. 208–227. 2006.

NOSE-FILHO, K.; LOTUFO, A. D. P.; MINUSSI, C. R.. Preprocessing data for short-term load fore-casting with a general regression neural network and a moving average filter. IEEE Trondheim PowerTech 2011, p. 19-23, Trondheim, Norway. June, 2011.

NOSE-FILHO, K.; LOTUFO, A. D. P.; MINUSSI, C. R.. Short-Term Multinodal Load Forecasting in Distribution Systems using General Regression Neural Networks, IEEE Trondheim PowerTech 2011, p. 19-23, Trondheim, Norway. June, 2011.

PANDEY, A.S.; SINGH, D.; SINHA, S.K. . Intelligent Hybrid Wavelet Models for Short-Term Load Forecasting. Power Systems, IEEE Transactions on, vol.25, no.3, pp.1266,1273. 2010.

93

PAPARODITIS, E.; SAPATINAS, T. . Short-Term Load Forecasting: The Similar Shape Functional Time-Series Predictor. Power Systems, IEEE Transactions on , vol.28, no.4, pp.3818,3825. 2013.

PESSANHA, J. F. M; LAURENCEL, L. C.; SOUZA, R. C.. Mapa de Kohonen na Construção de Tipologias de Curvas de Carga. XXXVI SBPO - Simpósio Brasileiro de Pesquisa Operacional, São João del Rei, 2004.

PRAHASTONO, I., KING, D. J., OZVEREN, C. S., & BRADLEY, D. A.. Electricity load profile classification using Fuzzy C-Means method. Simulation. Institute of Electrical and Electronics Engineers. P. 1-5. 2008.

RAMOS, S., & VALE, Z.. Data Mining techniques to support the classification of MV electricity customers. IEEE Power and Energy Society General Meeting Conversion and Delivery of Electrical Energy in the 21st Century. p. 1-7. 2008.

ROMERO, F.T.; HERNANDEZ, J.C.J.; LOPEZ, W.G.. Predicting Electricity Consumption Using Neural Networks. Latin America Transactions, IEEE (Revista IEEE America Latina) , vol.9, no.7, p.1066-1072. 2011.

RAKOTOMALALA, R. “Tanagra”. Disponível em: <http://eric.univ-lyon2.fr/~ricco/tanagra/fichiers/en_Tanagra_Rule_Induction.pdf>. Acesso em: 10 jan. 2013.

SANTANA, A. L.; CONDE, G. B.; REGO, L. P.; ROCHA, C. A.; CARDOSO, D. L.; COSTA, J. C. W.; BEZERRA, U. H.; FRANCES, C. R. L.. PREDICT – Decision support system for load forecasting and inference: A new undertaking for Brazilian power suppliers. International Journal of Electrical Power & Energy Systems, vol. 38, pp. 33-45. 2012.

SHAKOURI H, RASTAD M, NAZARZADEH J. .A hybrid nonlinear model for the annual maximum simultaneous electric power demand. IEEE Trans Power Syst., vol. 2, pp. 1069–1078. 2006.

TEIVE, R. C. G ANDRADE, F. F. ; ARANHA NETO, E.A.C.; CAMARGO C. C. DE B. ;., COELHO J.; ROSARIO, L.M.; BETTIO, J.A.D. Aplicação de Técnicas de Mineração de Dados para Previsão de Mercado de Energia Elétrica – Apresentação de Metodologia e Estudo de Caso de uma Concessionária de Energia. XXII SNPTEE - Seminário Nacional de Produção e Transmissão de Energia Elétrica. Brasilia, 2013.

TODESCO, J. L.. Reconhecimento de Padrões Usando Rede Neuronal Artificial Com Uma Função de Base Radial: Uma Aplicação na Classificação de Cromossomos Humanos. Tese de Doutorado. EPS. Universidade Federal de Santa Catarina. 1995.

TSEKOURAS GJ, HATZIARGYRIOU ND, DIALYNAS EN. . An optimized adaptive neural network for annual midterm energy forecasting. IEEE Trans Power Syst., vol. 21, pp. 385–391. 2006.

TRIOLA, M. F.. Introdução à Estatística. Editora LTC. RJ: 2008.

94

TRIPATHI, M. M.; UPADHYAY, K. G.; SINGH, S. N. . Short-term load forecasting using generalized regression and probabilistic neural networks in the electricity market. The Electricity Journal, vol.21, pp24-34. 2008.

XIA, C.; WNAG, J.; MCMENEMY K.. Short, medium and long term load forecasting model and virtual load forecaster based on radial basis function neural networks. Electrical Power and Energy Systems, New York, v. 32, p. 743-750, 2010.

YONA, A.; SENJYU, T.; FUNABASHI, T.; CHUL-HWAN KIM. Determination Method of Insolation Prediction With Fuzzy and Applying Neural Network for Long-Term Ahead PV Power Output Correction. Sustainable Energy, IEEE Transactions on, vol.4, no.2, p.527,533. 2013.

YUN, Z.; QUAN, Z.; CAIXIN, S.; SHAOLAN, L.; YUMING, L.; YANG, S. . RBF neural network and ANFIS-based short-term load forecasting approach in real-time price environment. IEEE Trans. Power Syst., vol. 23, no. 3, pp.853–858. 2008.

95

APÊNDICE A - TRABALHOS CORRELATOS

Para obter o estado da arte na previsão de demanda de energia elétrica foi realizada uma

revisão sistemática da literatura. A revisão ocorreu nas bases do IEEE, Elsevier e IET, filtrando-se

trabalhos de 2008 à 2013. No caso da busca nas bases do IEEE e IET os artigos de jornais e revistas

(Journals & Magazines) foram priorizados sobre os artigos de conferências. As string de busca

utilizadas foram:

• time series forecast, load forecast e artificial neural network(ANN)

• mid-term load forecast

Na base do IEE foram encontrados 45 artigos, na Elsevier 25 e no IET 2 artigos. Foram

selecionados os trabalhos mais adequados ao problema proposto: os trabalhos mais recentes, os que

usam redes neurais na previsão de carga com horizonte de previsão mensal, os que fazem a previsão

de médio prazo (horizonte de previsão maior que 1 semana e menor que 1 ano) e demais trabalhos.

A arquitetura de rede mais encontrada é a MLP, seguido pelas redes RBF e GRNN. Foram

encontrados muitos trabalhos para previsão de carga de energia elétrica em horizonte de curto

prazo. No entanto, para previsão de médio prazo são poucas as referências. Os trabalhos mais

revelevantes serão apresentados a seguir.

96

APÊNDICE B – QUESTIONÁRIO APLICADO

1.IDENTIFICAÇÃO DO CONSUMIDOR

Nome: CNPJ: Código da UC: Ramo de Atividade: Código CNAE: Tipo de Tarifa: Horário de Ponta:

2.INSTALAÇÕES

2.1 Qual a área construída? 2.2 Qual o número de funcionários? 2.3 Qual a tensão de entrada e o sub-grupo registrado? 2.4 Potência do transformador de entrada? 2.5 Qual a carga instalada total? 2.6 Qual o equipamento instalado de maior potência?

3. OPERAÇÃO EM 2011

3.1 Qual a Demanda Média? 3.2 Qual a Demanda Máxima? 3.3 Qual o Consumo Médio Mensal? 3.4 Qual o Consumo Máximo Mensal? 3.5 Quais os Turnos de Trabalho? 3.6 Sazonalidade da Produção? 3.7 Qual o período de férias coletivas?

4. INFLUÊNCIA DA ECONOMIA

4.1 Qual o impacto da importação na matriz de custos? 4.2 Qual a participação da exportação na receita? 4.3 Determine o nível de influência sobre a produção para cada variável

5. INFLUÊNCIA DO CLIMA

5.1 Qual o impacto das variações do clima ao longo do dia sobre o consumo de energia 5.2 Os efeitos climáticos mais relevantes ao longo do dia são: 5.3 Qual o impacto das variações do clima ao longo do ano sobre o consumo de energia 5.4 Em qual estação do ano ocorre o maior consumo de energia elétrica

97

APÊNDICE C – TODAS AS RESPOSTAS DOS QUESTIONÁRIOS APLICADOS

uc

div

isa

o

tipo_de_

tarifa

dem_c

ont

red_p

onta

porte_da

_empres

a

su

b_

gr

up

o

turn

os

CM

M

hr_func_i

nicio

hr_func_fi

m

impac

to_var

_clima

_dia

comercia

l_industr

ial

regio

nal

3156

5863

div

15 binomia BAIXA NULL MICRO A4

T011

0

BAI

XO

fim_madr

ugada fim_tarde alto industrial

joinvil

le

3246

9523

div

15 verde MEDIA NULL PEQUENA A4

T011

0

ME

DIO

fim_madr

ugada ini_noite medio industrial

joinvil

le

3064

8137

div

15 verde BAIXA NULL MICRO A4

T011

0

BAI

XO ini_manha fim_tarde alto industrial

joinvil

le

3181

6564

div

15 verde MEDIA NULL MEDIA A4

T011

0

ALT

O ini_manha fim_tarde alto industrial

joinvil

le

1952

9185

div


T111

1

ME

DIO flat flat medio industrial

joinvil

le

2866

5849

div

17 azul

MUITO

_ALTA

POUC

O_INF

ERIOR

GRANDE A2 T111

1

NUL

L flat flat medio industrial

joinvil

le

2572

2779

div

17 verde BAIXA NULL PEQUENA A4

T011

1

BAI

XO

fim_madr

ugada fim_noite alto industrial

joinvil

le

1932

9470

div


T011

0

BAI

XO ini_manha fim_tarde na_ns industrial

joinvil

le

3117

3655

div

18

monomi

a NULL NULL MEDIA

NU

LL

T011

1

BAI

XO

fim_madr


joinvil

le

2613

4161

div

18 verde BAIXA NULL MEDIA A4

T111

1

ME

DIO flat flat baixo industrial

joinvil

le

2198

1800

div


T111

1

BAI

XO flat flat na_ns industrial

joinvil

le

2530

1269

div


T011

0

BAI


joinvil

le

2976

2988

div


T011

1

BAI

XO ini_manha ini_noite na_ns industrial

joinvil

le

2851

0446

div


T011

0

BAI

XO ini_manha fim_tarde baixo industrial

joinvil

le

2851

0446

div


T011

0

BAI


joinvil

le

2885

8574

div


T011

0

ALT

O ini_manha fim_tarde na_ns industrial

joinvil

le

2823

1261

div

20 binomia BAIXA NULL PEQUENA A4

T111

1

BAI

XO flat flat medio industrial

joinvil

le

4170

4535

div


T111

1

ME

DIO flat flat alto industrial

joinvil

le

3212

6251

div


T111

0

ME

DIO fim_noite fim_tarde medio industrial

joinvil

le

1235

2050

div

25 verde ALTA NULL MEDIA A4

T011

1

ALT

O

fim_madr


joinvil

le

3234

7428

div

25 verde MEDIA NULL MICRO A4

T011

0

ME

DIO ini_manha fim_tarde alto industrial

joinvil

le

2641

9514

div


T111

1

ME


joinvil

le

1235

2190

div

25 azul

MUITO

_ALTA

MUIT

O_INF

ERIOR

GRANDE A2 T111

1

NUL

L fim_noite fim_noite baixo industrial

joinvil

le

98

4033

7954

div


T111

0

ME

DIO fim_noite fim_tarde baixo industrial

joinvil

le

2980

5407

div


T111

1

ME

DIO flat flat na_ns industrial

joinvil

le

4469

6215

div

25 azul MEDIA IGUAL MEDIA A4

T111

1

ME


joinvil

le

2168

9980

div

25 azul BAIXA IGUAL GRANDE A4

T111

1

NUL

L flat flat medio industrial

joinvil

le

2019

6181

div


T111

1

ALT

O fim_noite fim_noite medio industrial

joinvil

le

3183

6140

div


T111

1

ALT

O flat flat baixo industrial

joinvil

le

2596

2052

div


T111

1

ALT

O flat flat baixo industrial

joinvil

le

2391

9010

div

27 azul ALTA IGUAL MEDIA A4

T111

1

NUL

L fim_noite fim_noite na_ns industrial

joinvil

le

4381

8554

div

27 verde

MUITO

_ALTA NULL PEQUENA A4

T111

1

ALT

O flat flat medio industrial

joinvil

le

1232

5746

div

27 verde MEDIA IGUAL PEQUENA A4

T011

0

ME

DIO ini_manha fim_tarde baixo industrial

joinvil

le

4377

3577

div

27 azul ALTA

POUC

O_INF

ERIOR

MEDIA A4 T011

1

ALT

O flat flat medio industrial

joinvil

le

2391

8790

div

27 verde ALTA NULL PEQUENA A4

T011

1

ALT

O

fim_madr


joinvil

le

4272

5536

div


T111

1

ME


joinvil

le

3225

9570

div


T111

1

ME


joinvil

le

2864

5180

div


T011

0

BAI

XO ini_manha fim_tarde medio industrial

joinvil

le

2864

5236

div


T000

0

BAI


joinvil

le

2809

7069

div


T011

1

BAI

XO NULL NULL alto industrial

joinvil

le

1971

3563

div


T111

1

NUL

L flat flat na_ns industrial

joinvil

le

1235

2310

div

28 azul

MUITO

_ALTA

POUC

O_INF

ERIOR

GRANDE A4 T111

1

NUL

L flat flat na_ns industrial

joinvil

le

3200

8720

div

28 azul

MUITO

_ALTA

POUC

O_INF

ERIOR

MEDIA NU

LL

T011

1

NUL

L flat flat alto industrial

joinvil

le

2131

6989

div

28 azul

MUITO

_ALTA

POUC

O_INF

ERIOR

GRANDE A4 T011

1

NUL

L

fim_madr

ugada fim_noite medio industrial

joinvil

le

1232

5754

div


T011

0

ME

DIO

fim_madr


joinvil

le

4045

0530

div


T111

0

BAI

XO

fim_madr

ugada fim_noite na_ns industrial

joinvil

le

2575

5901

div


T011

0

ME

DIO

fim_madr

ugada fim_tarde na_ns industrial

joinvil

le

2801

9327

div


T011

0

BAI


joinvil

le

1235

2239

div


T111

1

ME


joinvil

le

1836

9516

div


T011

1

BAI

XO ini_manha fim_noite na_ns industrial

joinvil

le

2845

8380

div


T000

0

BAI

XO

fim_madr

ugada fim_tarde alto industrial

joinvil

le

99

4477

6243

div


T011

1

ALT

O

fim_madr


joinvil

le

2056

6574

div


T011

0

BAI


joinvil

le

1235

2131

div

28 azul ALTA

POUC

O_INF

ERIOR

GRANDE A4 T011

1

ALT

O

fim_madr


joinvil

le

1232

5177

div


T011

1

BAI

XO

fim_madr

ugada fim_noite baixo industrial

joinvil

le

2470

2847

div


T011

0

BAI


joinvil

le

4406

5185

div


T011

1

BAI

XO

fim_madr


joinvil

le

2963

0801

div


T011

0

BAI


joinvil

le

3139

4007

div


T011

1

BAI

XO

fim_madr

ugada fim_noite na_ns industrial

joinvil

le

3235

9566

div

29 binomia MEDIA NULL PEQUENA A4

T111

1

ME


joinvil

le

4121

2608

div


T011

1

NUL

L

fim_madr


joinvil

le

4285

4603

div


T011

1

BAI

XO

fim_madr


joinvil

le

1232

3891

div


T011

0

BAI


joinvil

le

4506

5650

div


T011

0

ME

DIO ini_manha fim_tarde medio industrial

joinvil

le

3124

6091

div


T011

0

BAI


joinvil

le

1919

1478

div


T011

0

BAI


joinvil

le

3176

320

div

50

monomi

a NULL NULL PEQUENA

NU

LL

T000

0

NUL

L NULL NULL medio comercial

joinvil

le

1232

4944

div

50 verde BAIXA NULL GRANDE A4

T000

0

BAI

XO NULL NULL NULL comercial

joinvil

le

3064

0950

div

50 verde

MUITO

_ALTA NULL GRANDE A4

T011

0

ME

DIO ini_manha fim_tarde NULL comercial

joinvil

le

3235

1590

div


T011

0

BAI

XO ini_manha fim_tarde NULL comercial

joinvil

le

2303

7017

div


T011

0

BAI


joinvil

le

3085

8549

div


T011

0

BAI


joinvil

le

4515

9248

div


T011

0

BAI


joinvil

le

3129

2158

div


T011

1

ME

DIO ini_manha fim_noite NULL comercial

joinvil

le

2597

6134

div


T011

0

ME


joinvil

le

2140

6538

div

52 azul ALTA IGUAL GRANDE A4

T011

1

ME


joinvil

le

3064

2902

div


T011

0

NUL

L ini_manha ini_noite NULL comercial

joinvil

le

2343

8151

div


T011

0

BAI

XO ini_manha ini_noite NULL comercial

joinvil

le

4247

7206

div


T101

0

NUL

L fim_noite

fim_madru

gada NULL comercial

joinvil

le

4023

9944

div


T011

0

BAI


joinvil

le

100

2805

7997

div

55 binomia MEDIA NULL MEDIA A4

T111

0

ME

DIO flat flat NULL comercial

joinvil

le

2769

9227

div


T111

1

ME


joinvil

le

1161

7522

div


T011

0

BAI

XO

fim_madr

ugada fim_noite NULL comercial

joinvil

le

2807

1922

div


T111

1

ME


joinvil

le

2573

1824

div


T011

0

ME


joinvil

le

1938

1986

div

70 azul

MUITO

_ALTA

POUC

O_INF

ERIOR

GRANDE A4 T011

1

NUL

L

fim_manh

a fim_noite NULL comercial

joinvil

le

1848

6644

div


T011

0

BAI


joinvil

le

1232

4251

div


T111

1

BAI

XO flat flat NULL comercial

joinvil

le

4111

5351

div


T111

1

BAI


joinvil

le

2613

2860

div


T011

0

BAI


joinvil

le

2181

9220

div

74 verde MEDIA NULL GRANDE A4

T011

0

ME


joinvil

le

2602

2940

div

74 binomia BAIXA NULL MEDIA A4

T011

0

BAI

XO

fim_madr

ugada fim_tarde NULL comercial

joinvil

le

2233

6991

div

74 binomia BAIXA NULL MEDIA

NU

LL

T011

0

BAI


joinvil

le

2597

9770

div


T111

1

BAI


joinvil

le

3241

6047

div

85 verde BAIXA NULL PEQUENA

NU

LL

T011

0

BAI


joinvil

le

4403

5758

div


T011

0

BAI


joinvil

le

2537

5777

div

85 verde ALTA NULL GRANDE

NU

LL

T111

1

ALT

O fim_noite fim_noite NULL comercial

joinvil

le

1231

2784

div


T011

0

ALT

O ini_manha fim_tarde alto industrial

floria

nopol

is

1231

3659

div

15 verde BAIXA IGUAL PEQUENA A4

T011

0

BAI

XO

fim_madr

ugada ini_tarde medio industrial

floria

nopol

is

2080

5455

div

15 verde BAIXA IGUAL MICRO A4

T011

0

BAI


floria

nopol

is

2239

6498

div


T011

0

ME


floria

nopol

is

2363

0044

div

15

monomi

a NULL NULL MICRO

NU

LL

T011

0

BAI

XO ini_manha ini_noite alto industrial

floria

nopol

is

2772

5899

div


T011

0

BAI

XO ini_manha fim_tarde NULL industrial

floria

nopol

is

2839

7879

div

15 verde BAIXA IGUAL NULL A4

T011

1

BAI

XO

fim_madr

ugada ini_noite NULL industrial

floria

nopol

is

2997

7313

div


T111

1

BAI

XO fim_noite fim_noite medio industrial

floria

nopol

is

2421

6055

div

17 verde ALTA IGUAL MEDIA A4

T111

1

ALT

O fim_noite fim_noite na_ns industrial

floria

nopol

is

101

3171

6136

div


T111

1

ALT


floria

nopol

is

2908

0356

div

18 verde BAIXA NULL PEQUENA

NU

LL

T011

0

BAI


floria

nopol

is

3030

3210

div


T011

0

ME


floria

nopol

is

1231

4302

div

20 verde BAIXA NULL NULL A4

T011

0

BAI

XO ini_manha fim_tarde NULL industrial

floria

nopol

is

2180

4576

div


T011

0

BAI


floria

nopol

is

2203

7080

div

20 binomia BAIXA IGUAL PEQUENA A4

T011

0

BAI


floria

nopol

is

2361

1210

div


T011

1

ME

DIO fim_noite ini_noite medio industrial

floria

nopol

is

2415

1883

div

20 binomia BAIXA IGUAL MICRO A4

T011

0

BAI

XO ini_manha ini_noite medio industrial

floria

nopol

is

2991

0189

div


T011

0

BAI


floria

nopol

is

3051

5943

div


T011

0

BAI


floria

nopol

is

3169

5155

div


T011

0

BAI


floria

nopol

is

3231

4058

div


T000

0

BAI


floria

nopol

is

4004

4493

div


T111

0

BAI

XO

fim_madr

ugada fim_tarde na_ns industrial

floria

nopol

is

4149

0225

div


T011

0

BAI


floria

nopol

is

2137

5144

div

25 verde MEDIA IGUAL MICRO A4

T111

1

ME

DIO fim_noite ini_noite medio industrial

floria

nopol

is

2644

2699

div

25

monomi

a NULL NULL MICRO A4

T111

1

BAI

XO fim_noite fim_noite na_ns industrial

floria

nopol

is

2876

4898

div

25 verde ALTA IGUAL PEQUENA A4

T111

1

ALT

O fim_noite fim_tarde baixo industrial

floria

nopol

is

2881

6421

div

25

monomi

a NULL NULL PEQUENA A4

T111

1

ME

DIO fim_noite fim_noite na_ns industrial

floria

nopol

is

3047

2888

div

25

monomi


T111

1

ME

DIO fim_noite fim_noite na_ns industrial

floria

nopol

is

3060

9417

div


T111

1

ALT


floria

nopol

is

4027

5630

div

25

monomi


T111

1

ME

DIO fim_noite fim_noite alto industrial

floria

nopol

is

4167

2226

div

25

monomi


T111

1

ME

DIO fim_noite fim_noite baixo industrial

floria

nopol

is

102

4239

8861

div


T000

0

BAI

XO NULL NULL NULL industrial

floria

nopol

is

2215

4435

div


T011

1

BAI

XO ini_manha fim_noite medio industrial

floria

nopol

is

2725

8964

div

27

monomi


T011

0

BAI


floria

nopol

is

2971

3111

div

27 verde MEDIA IGUAL MEDIA A4

T111

1

ME

DIO ini_manha

fim_madru

gada medio industrial

floria

nopol

is

3176

4815

div


T011

0

BAI


floria

nopol

is

4106

2029

div


T111

1

ME

DIO fim_noite fim_noite baixo industrial

floria

nopol

is

4230

7637

div


T011

0

BAI


floria

nopol

is

2387

6477

div


T111

1

ALT

O fim_noite fim_noite medio industrial

floria

nopol

is

2848

2531

div


T011

1

ME

DIO

fim_madr


floria

nopol

is

2959

2845

div


T111

1

ME

DIO

fim_madr

ugada

ini_madrug

ada alto industrial

floria

nopol

is

1932

2246

div

50 verde BAIXA IGUAL GRANDE A4

T011

0

BAI


floria

nopol

is

1977

9467

div

50 verde MEDIA NULL NULL A4

T011

0

ME


floria

nopol

is

2836

0045

div

50 verde BAIXA IGUAL MEDIA A4

T011

0

BAI


floria

nopol

is

2840

0438

div


T011

0

BAI


floria

nopol

is

2865

3115

div


T011

0

BAI


floria

nopol

is

2969

6543

div


T011

0

BAI


floria

nopol

is

2998

1728

div


T011

1

BAI

XO

fim_madr


floria

nopol

is

3131

9498

div


T011

0

BAI


floria

nopol

is

3156

1612

div


T111

1

BAI

XO fim_noite fim_noite NULL comercial

floria

nopol

is

4162

1982

div


T011

0

BAI


floria

nopol

is

1901

2565

div


T011

0

BAI


floria

nopol

is

2122

3824

div

51

monomi


T011

0

BAI


floria

nopol

is

103

2487

2297

div

51 verde MEDIA IGUAL GRANDE A4

T011

1

ALT

O ini_manha fim_noite NULL comercial

floria

nopol

is

2573

7253

div


T011

0

BAI


floria

nopol

is

2592

7591

div


T111

1

ME

DIO ini_manha

ini_madrug

ada NULL comercial

floria

nopol

is

4035

9893

div


T011

0

BAI


floria

nopol

is

4180

6753

div


T000

0

BAI


floria

nopol

is

4204

2978

div


T011

0

ME


floria

nopol

is

4328

9136

div


T011

0

BAI


floria

nopol

is

4347

6394

div


T011

0

BAI


floria

nopol

is

1231

0234

div


T011

1

BAI


floria

nopol

is

1231

2938

div

52

monomi

a NULL NULL MEDIA A4

T011

0

BAI


floria

nopol

is

1836

8463

div


T011

0

BAI


floria

nopol

is

2349

5660

div

52 verde MEDIA IGUAL NULL A4

T011

1

ME

DIO ini_manha ini_noite NULL comercial

floria

nopol

is

2524

7310

div


T011

1

ME


floria

nopol

is

2537

8806

div


T011

1

BAI

XO

fim_madr


floria

nopol

is

2539

1217

div

52

monomi

a NULL NULL GRANDE A4

T011

1

ME


floria

nopol

is

2551

7210

div


T011

1

ALT


floria

nopol

is

2553

4808

div


T011

0

BAI


floria

nopol

is

2568

9801

div

52 verde ALTA NULL GRANDE A4

T011

1

ALT


floria

nopol

is

2596

4985

div


T011

1

BAI


floria

nopol

is

2621

9213

div


T011

0

BAI


floria

nopol

is

2736

5043

div


T011

1

BAI

XO

fim_madr

ugada ini_noite NULL comercial

floria

nopol

is

2865

5681

div


T011

1

ME


floria

nopol

is

104

2878

3620

div


T111

0

BAI

XO

fim_madr


floria

nopol

is

2949

9349

div


T011

1

BAI


floria

nopol

is

2951

7495

div


T011

1

ME


floria

nopol

is

2959

2977

div


T011

0

BAI


floria

nopol

is

3146

0310

div


T011

1

BAI

XO

fim_manh


floria

nopol

is

3169

7093

div


T011

1

ME

DIO

fim_manh


floria

nopol

is

3188

8387

div

52

monomi


T011

1

ME

DIO

fim_manh


floria

nopol

is

3226

3305

div


T011

0

BAI


floria

nopol

is

4293

7886

div


T011

0

BAI

XO

fim_madr

ugada ini_tarde NULL comercial

floria

nopol

is

3192

180

div


T111

1

ME

DIO fim_noite fim_noite NULL comercial

floria

nopol

is

1933

2721

div


T111

1

BAI


floria

nopol

is

2141

3208

div

55

monomi


T011

1

BAI

XO ini_manha fim_noite NULL comercial

floria

nopol

is

2442

1066

div

55

monomi


T111

1

ME


floria

nopol

is

2461

1302

div

55

monomi


T111

1

ME


floria

nopol

is

2571

0460

div


T111

1

ME


floria

nopol

is

2926

2411

div


T111

1

BAI

XO

fim_manh

a

ini_madrug

ada NULL comercial

floria

nopol

is

2926

8959

div


T111

1

BAI

XO

fim_manh

a

ini_madrug

ada NULL comercial

floria

nopol

is

2951

9846

div


T111

1

BAI


floria

nopol

is

3030

6147

div


T011

1

BAI

XO

fim_madr


floria

nopol

is

3182

9070

div


T111

1

BAI


floria

nopol

is

3195

3286

div


T111

1

BAI


floria

nopol

is

3216

3386

div


T111

1

ME


floria

nopol

is

105

4021

0342

div


T011

1

ME

DIO

fim_madr


floria

nopol

is

4186

3943

div


T011

1

ME

DIO

fim_manh


floria

nopol

is

4328

6684

div


T111

1

ME


floria

nopol

is

4498

8798

div


T011

1

BAI

XO

fim_manh


floria

nopol

is

1231

0056

div

70

monomi


T011

1

BAI


floria

nopol

is

1849

1648

div

70 verde ALTA IGUAL GRANDE A4

T011

1

NUL

L

fim_manh


floria

nopol

is

2274

8386

div


T011

1

ME


floria

nopol

is

2333

6596

div


T111

1

ALT


floria

nopol

is

2343

3575

div

70

monomi

a NULL NULL NULL A4

T111

1

BAI


floria

nopol

is

2458

1985

div

70

monomi


T011

1

ME


floria

nopol

is

2537

2654

div

70

monomi


T111

1

BAI


floria

nopol

is

2537

8644

div


T011

1

ME

DIO

fim_madr

ugada ini_noite NULL comercial

floria

nopol

is

2572

4623

div

70 azul BAIXA

POUC

O_INF

ERIOR

GRANDE A4 T110

0

ME

DIO

ini_madru

gada fim_manha NULL comercial

floria

nopol

is

2601

3208

div

70

monomi


T111

1

ME


floria

nopol

is

2660

8988

div


T111

1

ALT


floria

nopol

is

2691

4884

div

70

monomi

a NULL NULL NULL A4

T111

1

BAI


floria

nopol

is

2737

3623

div


T011

0

ME


floria

nopol

is

2879

2921

div

70 verde BAIXA IGUAL MEDIA

NU

LL

T011

0

BAI


floria

nopol

is

2879

4541

div


T111

1

ME


floria

nopol

is

2925

1975

div


T111

1

ME


floria

nopol

is

2939

4636

div


T011

1

BAI


floria

nopol

is

2944

4285

div

70

monomi


T011

1

BAI


floria

nopol

is

106

3104

7781

div


T000

0

BAI

XO NULL NULL NULL comercial

floria

nopol

is

3183

0133

div


T011

1

BAI


floria

nopol

is

3227

6229

div

70 azul

MUITO

_ALTA

POUC

O_INF

ERIOR

GRANDE A4 T111

1

NUL

L fim_noite fim_noite NULL comercial

floria

nopol

is

4059

3055

div

70 verde ALTA NULL NULL A4

T011

1

ALT


floria

nopol

is

4238

8750

div


T011

1

ALT


floria

nopol

is

4324

1567

div

70 verde ALTA NULL GRANDE A4

T011

1

ALT

O

fim_manh


floria

nopol

is

4531

0795

div

70

monomi

a NULL NULL PEQUENA

NU

LL

T111

1

BAI


floria

nopol

is

7784

546

div

74

monomi


T011

0

BAI


floria

nopol

is

1890

9537

div


T011

1

BAI


floria

nopol

is

1965

6403

div

74

monomi

a NULL NULL GRANDE

NU

LL

T011

0

BAI


floria

nopol

is

2515

1828

div


T011

0

ALT

O ini_manha fim_tarde NULL comercial

floria

nopol

is

2561

8424

div


T011

0

BAI


floria

nopol

is

2818

3330

div


T011

0

BAI


floria

nopol

is

2907

8548

div


T011

1

ME


floria

nopol

is

2923

0900

div


T011

0

BAI

XO

fim_madr


floria

nopol

is

3013

3447

div


T111

0

ME

DIO

fim_madr


floria

nopol

is

3095

7121

div


T011

1

BAI


floria

nopol

is

3115

2984

div


T011

0

BAI


floria

nopol

is

3169

3900

div


T011

0

ME


floria

nopol

is

3182

6578

div


T011

1

ME


floria

nopol

is

4056

2567

div


T011

0

BAI


floria

nopol

is

4095

5895

div


T011

1

BAI


floria

nopol

is

107

2315

572

div


T011

1

BAI


floria

nopol

is

3116

778

div


T011

0

BAI


floria

nopol

is

1231

3004

div

85

monomi


T011

0

BAI


floria

nopol

is

1235

1089

div


T111

1

ME


floria

nopol

is

2165

9983

div


T011

1

BAI


floria

nopol

is

2247

3085

div


T011

1

ALT


floria

nopol

is

2247

9490

div

85

monomi

a NULL NULL NULL A4

T011

0

BAI


floria

nopol

is

2543

2169

div


T111

1

ALT


floria

nopol

is

2582

6663

div

85

monomi


T111

1

BAI


floria

nopol

is

2604

9857

div


T011

0

BAI


floria

nopol

is

2741

5440

div


T111

1

ALT


floria

nopol

is

2814

0266

div

85

monomi


T111

1

BAI


floria

nopol

is

2979

5487

div


T111

1

ME


floria

nopol

is

3007

3681

div


T111

1

BAI


floria

nopol

is

3040

4688

div


T011

1

ME

DIO

fim_madr


floria

nopol

is

3132

9000

div


T011

1

ME


floria

nopol

is

3135

3530

div


T011

0

ME


floria

nopol

is

3169

6259

div


T111

1

ME


floria

nopol

is

3226

8927

div

85

monomi

a NULL NULL NULL A4

T111

1

BAI


floria

nopol

is

4006

9160

div

85

monomi


T111

1

ME


floria

nopol

is

4094

4630

div

85

monomi


T011

1

ME


floria

nopol

is

4124

1950

div


T011

1

BAI

XO

fim_madr


floria

nopol

is

108

4334

5621

div


T111

1

ALT


floria

nopol

is

4360

7928

div


T111

1

ME


floria

nopol

is

descriÇÃo do consumo de energia de consumidores

Documents