determinaÇÃo de curvas tÍpicas de carga atravÉs … · dos neurônios confinado entre [0,1] ou...

6
1 DETERMINAÇÃO DE CURVAS TÍPICAS DE CARGA ATRAVÉS DAS TÉCNICAS DE MINERAÇÃO DE DADOS SOM E K-MÉDIAS Fábio Donisete Silva, João Areis Ferreira Barbosa Júnior, Carlos Eduardo Tavares Núcleo de Qualidade de Energia Elétrica (NQEE) Universidade Federal de Uberlândia, Faculdade de Engenharia Elétrica, Uberlândia MG [email protected], [email protected], [email protected] Resumo O presente trabalho dedica-se a determinação de curvas típicas de carga de consumidores alimentados em baixa tensão, fazendo uso da combinação das técnicas de mineração de dados de Mapas Auto- Organizáveis de Kohonen (SOM) e do Algoritmo das K- médias. Para tanto, são apresentadas as principais características da utilização das técnicas de redes neurais para tratamento de dados, e posteriormente, são conduzidos estudos em uma massa de dadosrepresentativa dos perfis de potência de 81 consumidoresatendidos em baixa tensão por uma concessionária do país, informações estas, obtidas através de uma campanha de medição ainda em desenvolvimento. Tais estudos têm por objetivo, entre outros aspectos, a determinação das referidas curvas típicas destes consumidores, sendo estas, de grande importância parasubsidiar informações para as empresas distribuidoras de energia elétrica em suas decisões: quanto a investimentos futuros, planejamento de expansão e estudos de tarifaçãodo setor elétrico. Palavras-Chave Algorítimodas K-médias, Curvas Típicas de Consumidores, Mapas Auto-Organizáveis de Kohonen (SOM), Mineração de Dados. DETERMINATION OF TYPICAL LOAD CURVES THROUGH SOM AND K-MEANS DATA MINING TECHNIQUES Abstract -This paper is dedicated to the determination of the typical load curves of low voltage customers by the combination of data mining techniques as Konohen’s Self Organizing Maps (SOM) and the K-means algorithm. Thus, it is presented the main characteristics of this neural networks used for data processing and then, studies are realized on a representative dataset of power patterns of 81 low voltage consumers attended by a brazilian power utility, which are obtained through a campaign of measures in development. This study aims, among other things, the determination of the typical load curve of these consumers, which are great important in the power utility decisions as future investment, expansion planning and pricing studies of the electricity sector.1 Keywords K-means Algorithm, Typical Consumers Curves, Self-Organizing Maps (SOM), Data Mining. I. INTRODUÇÃO A determinação de curvas típicas de carga de consumidores consiste em uma tarefa de suma importância para o setor elétrico, pois as informações agregadas a estas permitem às concessionárias de energia o conhecimento do perfil de consumo de seus clientes. Estas informações, em curto e médio prazo, influenciam diretamente suas decisões quanto à estrutura tarifária de energia, no dimensionamento do sistema, em alternativas eficazes para gerenciamento da demanda e servem como fonte de dados para a formulação de estratégias de comercialização de energia [1], [2], [3]. Muito embora seja reconhecida a importância das curvas típicas, o processo de determinação das mesmas não se mostra um trabalho tão simples. Ele depende, inicialmente, da realização de uma campanha de medição que consiga abranger a maior diversidade possível de consumidores atendidos pela concessionária [4]. Geralmente, delas resultam volumosas massas de dados com uma infinidade de informações a serem trabalhadas, dificultando assim a capacidade humana de análise manual destes dados, e consequentemente, a obtenção de conclusões relevantes [1]. Assim, surge o interesse tanto da comunidade científica quanto das concessionárias e agências reguladoras no desenvolvimento de metodologias que sirvam como ferramentas para auxiliar na análise de grandes quantidades de dados e informações, técnicas estas também conhecidas como mineração de dados ou data mining. Estas são utilizadas para destacar as características da massa de dados e obter agrupamentos, clusters. Os elementos contidos no mesmo cluster possuem maior similaridade que elementos em clusters diferentes. Desses clusters já se pode visualizar como é o comportamento de vários conjuntos de dados, mas é possível ainda que a partir deles sejam empregados métodos estatísticos para determinar a tipologia de carga de cada classe de consumidores [2]. Os métodos automatizados ou auxiliados por computadores, quando aplicados em um conjunto de dados, conseguem revelar padrões, similaridades e diferenças que inicialmente estavam ocultas na massa de dados [3]. Além disso, permitem ainda o agrupamento e a redução de uma grande quantidade de curvas de consumidores em uma curva típica, que represente todos os consumidores com características semelhantes. Deve-se destacar que esta curva típica mantém as características dos dados iniciais e consegue representar cada classe de consumidores, sejam eles residenciais, comerciais, industriais ou rurais.

Upload: voque

Post on 09-Dec-2018

213 views

Category:

Documents


0 download

TRANSCRIPT

1

DETERMINAÇÃO DE CURVAS TÍPICAS DE CARGA ATRAVÉS DAS

TÉCNICAS DE MINERAÇÃO DE DADOS SOM E K-MÉDIAS

Fábio Donisete Silva, João Areis Ferreira Barbosa Júnior, Carlos Eduardo Tavares Núcleo de Qualidade de Energia Elétrica (NQEE)

Universidade Federal de Uberlândia, Faculdade de Engenharia Elétrica, Uberlândia – MG

[email protected], [email protected], [email protected]

Resumo – O presente trabalho dedica-se a

determinação de curvas típicas de carga de consumidores

alimentados em baixa tensão, fazendo uso da combinação

das técnicas de mineração de dados de Mapas Auto-

Organizáveis de Kohonen (SOM) e do Algoritmo das K-

médias. Para tanto, são apresentadas as principais

características da utilização das técnicas de redes neurais

para tratamento de dados, e posteriormente, são

conduzidos estudos em uma massa de

dadosrepresentativa dos perfis de potência de 81

consumidoresatendidos em baixa tensão por uma

concessionária do país, informações estas, obtidas através

de uma campanha de medição ainda em

desenvolvimento. Tais estudos têm por objetivo, entre

outros aspectos, a determinação das referidas curvas

típicas destes consumidores, sendo estas, de grande

importância parasubsidiar informações para as empresas

distribuidoras de energia elétrica em suas decisões:

quanto a investimentos futuros, planejamento de

expansão e estudos de tarifaçãodo setor elétrico.

Palavras-Chave –Algorítimodas K-médias, Curvas

Típicas de Consumidores, Mapas Auto-Organizáveis de

Kohonen (SOM), Mineração de Dados.

DETERMINATION OF TYPICAL LOAD

CURVES THROUGH SOM AND K-MEANS

DATA MINING TECHNIQUES

Abstract -This paper is dedicated to the determination

of the typical load curves of low voltage customers by the

combination of data mining techniques as Konohen’s Self

Organizing Maps (SOM) and the K-means algorithm.

Thus, it is presented the main characteristics of this

neural networks used for data processing and then,

studies are realized on a representative dataset of power

patterns of 81 low voltage consumers attended by a

brazilian power utility, which are obtained through a

campaign of measures in development. This study aims,

among other things, the determination of the typical load

curve of these consumers, which are great important in

the power utility decisions as future investment,

expansion planning and pricing studies of the electricity

sector.1

Keywords – K-means Algorithm, Typical Consumers

Curves, Self-Organizing Maps (SOM), Data Mining.

I. INTRODUÇÃO

A determinação de curvas típicas de carga de

consumidores consiste em uma tarefa de suma importância

para o setor elétrico, pois as informações agregadas a estas

permitem às concessionárias de energia o conhecimento do

perfil de consumo de seus clientes. Estas informações, em

curto e médio prazo, influenciam diretamente suas decisões

quanto à estrutura tarifária de energia, no dimensionamento

do sistema, em alternativas eficazes para gerenciamento da

demanda e servem como fonte de dados para a formulação de

estratégias de comercialização de energia [1], [2], [3].

Muito embora seja reconhecida a importância das curvas

típicas, o processo de determinação das mesmas não se

mostra um trabalho tão simples. Ele depende, inicialmente,

da realização de uma campanha de medição que consiga

abranger a maior diversidade possível de consumidores

atendidos pela concessionária [4]. Geralmente, delas

resultam volumosas massas de dados com uma infinidade de

informações a serem trabalhadas, dificultando assim a

capacidade humana de análise manual destes dados, e

consequentemente, a obtenção de conclusões relevantes [1].

Assim, surge o interesse tanto da comunidade científica

quanto das concessionárias e agências reguladoras no

desenvolvimento de metodologias que sirvam como

ferramentas para auxiliar na análise de grandes quantidades

de dados e informações, técnicas estas também conhecidas

como mineração de dados ou data mining. Estas são

utilizadas para destacar as características da massa de dados

e obter agrupamentos, clusters. Os elementos contidos no

mesmo cluster possuem maior similaridade que elementos

em clusters diferentes. Desses clusters já se pode visualizar

como é o comportamento de vários conjuntos de dados, mas

é possível ainda que a partir deles sejam empregados

métodos estatísticos para determinar a tipologia de carga de

cada classe de consumidores [2].

Os métodos automatizados ou auxiliados por

computadores, quando aplicados em um conjunto de dados,

conseguem revelar padrões, similaridades e diferenças que

inicialmente estavam ocultas na massa de dados [3]. Além

disso, permitem ainda o agrupamento e a redução de uma

grande quantidade de curvas de consumidores em uma curva

típica, que represente todos os consumidores com

características semelhantes. Deve-se destacar que esta curva

típica mantém as características dos dados iniciais e

consegue representar cada classe de consumidores, sejam

eles residenciais, comerciais, industriais ou rurais.

2

Diante do exposto, a presente propôs por objetivo a

determinação de curvas típicas de carga para consumidores

alimentados em baixa tensão pelo uso da combinação das

técnicas de mineração de dados por redes neurais, ou Mapas

Auto-Organizáveis de Kohonen (SOM), e técnica estatística

do algoritmo das K-médias, em uma massa de dados de 81

consumidores, fruto de uma campanha de medição realizada

por um concessionária nacional. Para tanto, foi utilizado nos

estudos o aplicativo computacional MatLab, bem como a

ferramenta “som_toolbox”, que oferece os recursos

necessários tanto para a execução da técnica SOM quanto do

algoritmo K-médias.

II. MÉTODOS ITERATIVOS PARA

DETERMINAÇÃO DE CURVAS TÍPICAS

Dentre os recursos disponíveis ao processo de

agrupamento almejado nesta do trabalho, necessário para a

determinação das curvas típicas de consumidores, estes

podem ser classificados basicamente em três técnicas

distintas:

Redes Neurais;

Lógica Fuzzy;

Técnicas estatísticas.

A seguir serão abordadas as principais características

associadas com as duas técnicas utilizadas nesta proposta,

quais sejam, SOM e K-médias.

A. Redes Neurais Artificiais (RNAs)

O cérebro humano é capaz de processar informações

complexas em paralelo e em um curtíssimo intervalo de

tempo [5]. A partir de seu estudo foi possível criar um

modelo matemático computacional que se assemelha com a

organização do mesmo, o que facilitou a resolução de

problemas complexos em que os métodos computacionais

mostravam-se ineficientes. Assim, com essa estrutura de

processamento surgiram as Redes Neurais Artificiais. O

modelo do neurônio artificial proposto em 1943 por

McCulloch e Pitts [5] é inspirado no neurônio biológico

humano, atualmente, bastante estudado, conforme esquema

ilustrado através da Figura 1.

Fig. 1. Modelo de um neurônio artificial [6].

Este modelo de neurônio artificial é composto por três

elementos principais:

Conexões de entrada: no neurônio biológico

corresponde aos detritos e aqui cada entrada (xm) é

ponderada por um peso sináptico (wkm).

A junção soma: é responsável pela combinação dos

sinais de entrada ponderada pelos seus respectivos

pesos sinápticos.

Função de ativação: coloca o intervalo de ativação

dos neurônios confinado entre [0,1] ou [-1,1],

restringindo a amplitude de saída do neurônio a um

valor finito.

Onde x0, x1, x2, ..., xm são os sinais de entrada que serão

convertidos em um neurônio de entrada e wk0, wk1, wk2, ...,

wkp são os pesos sinápticos do neurônio k. Com isso, temos

que produz o nível de atividade interna do neurônio,

sendo que se > 0 a conexão sináptica é conhecida como

excitatória e se < 0 ela é chamada de inibitória. O valor

de bias, , serve para aumentar ou diminuir a influência do

valor das entradas. Deve-se submeter essa saída à função de

ativação , que normalmente é um do tipo não

linear e que limita a saída do neurônio onde x ∈ e y(x) ∈ [-

1,1] [1].

A principal característica das RNAs é a capacidade de

aprendizado através de exemplos input/output. Isso é feito

automaticamente ajustando os pesos sinápticos e os níveis de

bias, sendo que existem muitos algoritmos de aprendizagem

para as RNAs que podem ser divididos em: aprendizado

supervisionado e aprendizado não supervisionado [6]. A

diferença básica é que no aprendizado supervisionado existe

um “professor externo” que estimula às entradas da rede por

meio de padrões de entrada e monitora a saída calculada

comparando-a com a desejada. Já o não supervisionado como

não há um professor para acompanhar o aprendizado, isso é

feito utilizando-se somente os padrões de entrada e a rede é

ajustada de acordo com regularidades estatísticas desses

dados. Nesse contexto destaca-se o aprendizado não

supervisionado por competição em que há disputa para

ganhar a camada de saída e somente um neurônio poderá ser

ativado a qualquer momento (winner-takes-all). O neurônio

vencedor terá seus pesos sinápticos atualizados no

treinamento e esse tipo de aprendizado é a base para os

modelos ART de Grosberg e para os Mapas de Kohonen

[1,7].

Uma Rede Neural Artificial é constituída por um conjunto

de neurônios interligados para aumentar a capacidade de

resolução de problemas. Normalmente, é convencionado na

representação das RNAs que os vértices sejam os neurônios,

as arestas as sinapses e as pontas das flechas mostram o

caminho de alimentação [7]. Com isso, a organização da rede

está ligada ao tipo de problema que deve ser solucionado,

sendo possíveis três configurações: Rede Feedforward, Rede

Feedback e a Rede Auto-organizáveis.

As Redes Feedforward, também chamadas de Redes

Alimentadas Adiante, caracterizam-se pela disposição dos

neurônios em forma de camadas e o fluxo de informação

sempre ser levado para frente. Pode haver as Redes de

Camadas Únicas e as Redes de Múltiplas Camadas que se

diferenciam apenas pelo número de camadas.

Enquanto isso, nas redes Feedback, também chamadas de

Redes Recorrentes, há a realimentação, ou seja, a saída de

um neurônio é aplicada como entrada de neurônios anteriores

da rede. Essa organização topológica é muito utilizada em

problemas que envolvem previsões de eventos futuros e para

recuperação de padrões de entrada.

3

Por fim, nas redes auto-organizáveis, os neurônios estão

divididos na camada de entrada e na camada de saída,

chamada de “grade”, na qual cada grupo de neurônios

responde a um estímulo da entrada de dados. A principal

aplicação é sua utilização para o agrupamento e compressão

da massa de dados, sendo o maior exemplo os Mapas Auto-

organizáveis de Kohonen. Um exemplo ilustrativo de uma

rede auto-organizável pode ser observado na Figura 2.

Fig. 2. Esquema de uma Rede Auto-organizável [5].

B. Redes neurais Auto-Organizadas de Kohonen

(SOM, “self-organizing maps”)

O SOM foi desenvolvido pelo finlandês Teuvo Kohonen

em 1982 e é uma Rede Neural Artificial (RNA) com

treinamento competitivo e não supervisionado, ou seja, que é

capaz de estabelecer relações complexas entre os dados sem

a necessidade de fornecer as regras sobre as funções que as

relacionam e ainda, decidir quais critérios usará para agrupar

os dados, processo conhecido como auto-organização [8].

Ele pode realizar uma projeção não linear do espaço de

dados de entrada em para o espaço de dados do arranjo

em , reduzindo a dimensionalidade quando P < D.

Entretanto, costuma-se utilizar um arranjo uni ou

bidimensional, ou seja, P = 1 ou P = 2. Observa-se nesse

arranjo a formação de um mapa topográfico de duas camadas

sendo uma a camada de entrada e a outra a camada de

Kohonen, na qual as localizações dos neurônios seguem

características intrínsecas dos padrões de entrada que

caracteriza a auto-organização como na figura 3 [9].

Fig. 3. Representação do SOM [5].

Aplicando esses conceitos ao agrupamento de curvas de

carga observamos o seguinte diagrama da figura 4.

Fig. 4. Neurônios representando a curva de carga de cada

cliente [9].

Na figura anterior, observar que após a aplicação do SOM

em curvas de carga dos clientes, ele retornou uma grade

bidimensional em que cada neurônio representa as

características de um conjunto de clientes. Temos ainda que

um neurônio apresenta grande similaridade com neurônios

próximos a ele e também uma grande distinção entre

neurônios que estejam mais afastados.

A U-Mat é a matriz de distâncias entre cada neurônio do

mapa e seu vizinho. Por isso, é uma técnica mais eficiente de

detecção de cluster da rede SOM. Em sua análise, há duas

formas de se caracterizar um cluster. Observa-se que valores

mais altos na barra de cores que deve ser mostrada ao lado do

mapa, correspondem às distâncias maiores entre os neurônios

do mapa, e os mais baixos, representado por cores mais

claras mostram a similaridade entre os neurônios adjacentes,

o que caracteriza um cluster [1]. Isso pode ser observado

claramente na figura 5.

Fig. 5. Matriz de Distâncias Unificadas (U-Mat) [10].

Para ajudar na escolha do mapa é possível utilizar duas

métricas computacionais mais simples e menos dependente

de que são o Erro Médio de Quantização (Quantization

Error – QE) e o Erro Topográfico (Topographic Error – TE)

[1].

1) Erro Médio de Quantização

Esse erro corresponde à média das distâncias entre cada

vetor de dados e o correspondente vetor de pesos do

BMU. O QE mostra a resolução do mapa, sendo que se o

valor de QE diminui a resolução do mapa aumenta, mas, para

isso, aumentará também o número de neurônios no mapa.

Devemos, então, nos atentar para um número máximo de

neurônios para que o SOM consiga fazer a generalização dos

dados de entrada. Esse erro é dado por:

Onde N é o número de neurônios.

2) Erro Topográfico

O TE mede a capacidade do mapa de representar a

topologia dos dados de entrada quantitativamente. Para isso,

de cada objeto de é calculado o primeiro BMU e o

segundo BMU , o que define o erro como:

4

Onde N é o número de neurônios e = 1 quando

e não são adjacentes.

C. Considerações sobre os parâmetros do SOM

Devido à ausência de fundamentação teórica sobre o SOM

[1], podem ser propostas heurísticas baseadas na observação

do comportamento do mapa e em medidas estatísticas de

qualidade. Assim, resumidamente temos:

O cálculo do número de neurônios possui mais de

uma heurística, a citar o SOM Toolbox no MatLab

que propõe √ , onde N é a quantidade de

dados de entrada como uma estimativa razoável.

Para facilitar na facilidade de visualização dos

agrupamentos na U-mat é aconselhável a utilização

do arranjo de vizinhança hexagonal com a função de

vizinhança, , que adapta a vizinhança do

neurônio vencedor, baseado na função gaussiana.

Utilizar inicialização linear para o arranjo

hexagonal, no caso, procurando prevenir torções

indesejáveis no arranjo ao longo do treinamento,

embora seja importante lembrar que o SOM não tem

garantia teórica de convergência, sendo essa

“convergência” chamada de estados de absorção.

Utilizar duas fases de treinamento mesmo se houver

inicialização linear do arranjo. Deve-se dar

preferência ao algoritmo batch ao incremental, onde

a taxa de aprendizado η(t) é fixa e vale 0,5 na fase

inicial e 0,05 na fase de convergência.

O raio da função é calculado de acordo com a

fase do treinamento: na fase inicial o raio varia de

, onde md é a maior dimensão do arranjo plano,

largura ou altura, e termina em max(l,

).Já na fase

final de convergência, o raio inicial começa em

e

termina em 1.

O número de épocas de treinamento é estimado em

para a fase inicial e

para a fase de

convergência, sendo Q a quantidade de neurônios

no arranjo e N o número de dados iniciais para o

treinamento.

D. Agrupamento por K-médias

Esse algoritmo foi desenvolvido por J. B. MacQueen em

1967 e é um método clássico para construção K grupos a

partir de uma massa de dados. É caracterizado por ser não

hierárquico, ou seja, uma curva de carga pode ser alocada,

inicialmente, em um grupo e, posteriormente, em outro de

forma que cada curva pertença apenas a um grupo [12].

As informações de entrada para o algoritmo são: a massa

de dados e o número de centróides (K), que deve ser definido

a priori [1, 13, 14]. A partir disso, o algoritmo procura

minimizar a distância euclidiana entre cada curva de carga e

as curvas centróides, curvas de referência, de forma iterativa.

A grande vantagem desta heurística é a simplicidade e a

velocidade com a qual convergem os seus resultados.

Entretanto, observa-se que o método é sensível aos outliers,

que são pontos que não pertencem a nenhum agrupamento.

Assim, existem curvas que não deveriam pertencer a nenhum

agrupamento, mas que podem distorcer os resultados e

diminuir a qualidade das informações obtidas dos clusters.

Outra questão que deve ser analisada é a inicialização dos

centróides iniciais que pode produzir clusters de má

qualidade até mesmo separando clusters naturais [11].

E. Agrupamento por combinação de métodos

Para avaliar e comparar a desempenho dos algoritmos de

clusterização existem seis medidores de adequação, a citar: o

Índice de Davies-Bouldin, o Erro Quadrático Total ou

Função do Erro (J Function), o Mean Index Adequacy

(MIA), o Clustering Dispersion Indicator (CDI), o Similarity

Matrix Indicator (SMI) e o Ratio of within cluster sum of

squares to between cluster variation (WCBCR) [15].

Utilizando o MIA, que mede a compactação dos

agrupamentos, e o CDI, que mede a separação entre os

agrupamentos, nos algoritmos anteriormente descritos, os

melhores resultados desses índices foram observados quando

houve a combinação dos métodos do Mapas Auto-

organizados de Kohonen e o K-means clássico [16].

Devido ao fato do SOM ter uma boa performance

trabalhando com uma grande massa de dados, ele deve ser

utilizado inicialmente para reduzir a massa de curvas iniciais

a um grupo de unidades vencedoras, os neurônios, que são

mostradas em um espaço bidimensional. A partir disso, o K-

means é utilizado no agrupamento dos vetores de saída do

SOM para a obtenção dos clusters e, posteriormente à

realização da média aritmética com esses clusters, a obtenção

da curva típica de determinada classe de consumidores [5].

Assim, combinando o SOM e o K-means, de acordo com os

índices anteriormente citados, é possível resolver as

limitações de cada método e obter uma solução robusta para

o tratamento da massa de dados. Podemos utilizar ainda o

Índice de Davies-Bouldin e a Função de Erro para a

determinação do valor dos K agrupamentos que,

normalmente, não é possível conhecer a priori.

III. DETERMINAÇÃO DE CURVAS TÍPICAS DE

CONSUMIDORES: ESTUDO DE CASO

A massa de dados utilizada para este estudo de caso foi

obtida através de uma campanha de medição realizada por

uma concessionária do setor elétrico nacional. Os medidores

foram instalados no secundário de transformadores de

distribuição, na entrada de residências e na saída de

alimentadores para registrar tensões, correntes, potências

assim como todos os indicadores associados à qualidade de

energia elétrica. Para a realização das medições foram

utilizados os medidores MedCal NT de uso ao tempo (IP-65),

MedCal ST de uso ao tempo (IP-65) ou de uso abrigado,

somando ao todo 50 medidores.

Devido a questões logísticas e buscando uma

compatibilização entre o número de consumidores a serem

avaliados e a quantidade de equipamentos disponíveis para a

5

campanha de medição, optou-se pela realização de medições

pelo período 7 dias de duração, buscando assim a obtenção

do ciclo semanal de carregamento de cada consumidor. Ao

longo deste intervalo, os equipamentos disponibilizam

valores médios a cada 10 minutos e foi obtido um total de

1008 mostras que foram reduzidas, manualmente, escolhendo

o melhor dia para representar esses 7 dias medidos. A

primeira medição se iniciou às 0:00 e a última, de número

144, terminou às 23:50 passaram normalização da potência

ativa com a equação:

[ ]

Onde é a potência normalizada em função da maior

potência observada ao longo do período de medição,

é a potência ativa a cada integralização de 10 minutos e

é a maior potência observada ao longo do período de

medição.

Alguns fatores podem influenciar nas curvas de carga dos

consumidores, dentre eles o período do ano em que foram

feitas as medições, a região do país e a curva escolhida para

ser a representativa, visto que podemos ter uma para os dias

da semana e outra para os finais de semana. Em função disso,

neste estudo de caso, uma atenção especial é dada somente

na curva fornecida pela concessionária de energia e na sua

utilização para a determinação da curva típica do conjunto,

visto que não foram fornecidos muitos dados da campanha

de medição.

A. Obtenção das curvas típicas de consumidores

através de métodos iterativos

A metodologia adotada consiste na combinação dos

métodos SOM e K-means, fazendo uso ainda do Índice de

Davies-Bouldin e a Função de Erro. Vale ressaltar que o

primeiro método responderá pela redução inicial da massa de

dados, enquanto o segundo fará o agrupamento das curvas

em clusters. Enquanto isso, o Índice de Davies-Bouldin e a

Função de Erro auxiliarão na determinação do número ideal

desses agrupamentos.

Muito embora os fundamentos teóricos das metodologias

utilizadas estejam disponíveis em diversos trabalhos de pós-

graduação e artigos científicos, permitindo assim a

reprodução das mesmas através de qualquer linguagem de

programação, por alguns motivos técnicos optou-se pela

utilização dos recursos disponibilizados na “som_toolbox”

pré-existente no programa MatLab. Nesta toolbox,

encontram-se os recursos necessários para a reprodução dos

métodos de Mapas Auto-Organizáveis (SOM) e K-means

que foram adaptados para a determinação das curvas típicas

de carga.

Para ilustrar o processo, pode-se observar na Figura 6 a

massa de dados inicial dos 81 consumidores residenciais de

baixa tensão, denominados por CLB.

Fig. 6. Massa de dados inicial.

B. Análise dos Resultados

A partir de uma rotina desenvolvida no MatLab utilizando

a “somtoolbox” com as técnicas do SOM na redução do

número de curvas, do Índice de Davies-Bouldin e da Função

do Erro para determinação do número ótimo de clusters e,

por fim, do algoritmo das K-médias. Observe as curvas

obtidas do SOM e a U-Mat da mesma na Figura 7.

Fig. 7. Curvas do SOM e o Mapa de Kohonen.

Já a figura 8 mostra o resultado do Índice de Davies-

Bouldin e da Função do Erro.

Fig. 8.Índice de Davies-Bouldin e a Função do Erro.

6

Desses gráficos e utilizando as heurísticas discutidas

anteriormente, observa-se que o número ideal de clusters é 7.

Assim, das 7 curvas que representam esses clusters a curva

típica pode, sem grandes prejuízos, ser obtida fazendo a

média aritmética das curvas dos centróides do Kmeans [8].

Isso é feito com∑

, onde N é o número

máximo de clusters. Portanto, a curva típica de carga dos 81

consumidores baixa tensão da campanha de medição obtidos

da média aritmética dos 7 centróides segue na figura 9

abaixo.

Fig. 9. – Curva típica dos consumidores baixa tensão

IV. CONCLUSÕES

Neste artigo foram apresentados resumidamente os

procedimentos para obtenção da tipologia de curvas de carga

de um estudo de caso de consumidores residenciais de uma

concessionária do país. Essa curva típica obtida é

fundamental no estudo da tarifação dos serviços de

distribuição de energia elétrica.

Pela curva típica de carga obtida, observa-se que

consumidores da distribuidora tendem a aumentar o seu

consumo, principalmente, em dois momentos do dia, a citar

por volta das 8 da manhã e a partir das 5 horas da tarde. Isso

é compatível com o que se esperava a classe residencial de

consumidores, pois é o horário que a maioria da população

mais utiliza a energia em suas casas. Observa-se ainda que

do menor valor de demanda, durante a madrugada, até o

horário com maior utilização que ocorre por volta de meio

dia, há o aumento de cerca de 50% no consumo de energia

passando de 0,5 para quase 0,75 pu.

Portanto, a metodologia proposta neste trabalho

ferramenta eficaz para as distribuidoras de energia elétrica

conhecer o perfil de consumo de seus clientes. Isso foi

possível utilizando dois algoritmos da data mining para

reduzir a massa inicial de dados com o SOM e,

posteriormente, agrupar os dados restantes com o Kmeans.

REFERÊNCIAS

[1] M. H. Zuchini, “Aplicação de Mapas Auto-organizáveis

em Mineração de Dados e Recuperação de Informação”,

Dissertação de Mestrado, Faculdade de Engenharia

Elétrica e de Computação (FEEC), Unicamp, Campinas/

SP, 2003.

[2] S. V. Verdú, M. O. García, C. Senabre, A. G. Marín, F. J.

Franco, “Classification, Filtering, and Identification of

Electrical Customer Load Patterns Through the Use of

Self-Organizing Maps”, IEEE Transactions on Power

Systems, vol. 21, n° 4, Nov. 2006.

[3] U. Fayyad, G. Piatetsky-Shapiro, P. Smyth, Advances in

Knowledge Discovery and Data Mining, 1ª Edição,

American Association for Artificial Intelligence/ MIT

Press, 1996.

[4] H. do N. Alves, Sistemas de Energia Elétrica, Apostila da

disciplina Sistemas de Energia Elétrica, Departamento de

Eletroeletrônica, CEFET-MA, São Luis/ MA.

[5] E. R. Alves, “Mineração de Dados Baseada em

Inteligência Computacional: uma Aplicação à

Determinação da Tipologia de Curvas de Carga”,

Dissertação de Mestrado, UFPA, Belém/ PA, 2011.

[6] A. R. Gonçalves, Redes neurais, disponível em

<http://www.dca.fee.unicamp.br/~andreric/arquivos/pdfs

/redes_neurais.pdf>, acesso em 13 mai. 2013

[7] S. P. Zambiasi, O neurônio artificial. Acedido em 13 de

Maio de 2013 em:

http://www.gsigma.ufsc.br/~popov/aulas/rna/neuronio_a

rtificial/index.html

[8] G. M. de F. Paula, “Curvas típicas de carga para o

planejamento operacional do sistema de distribuição”,

Dissertação de Mestrado, Universidade de São Paulo,

São Paulo/ SP, 2006.

[9] T, Kohonen.The Self-Organizing Map (SOM). Acedido

em 17 de Dezembro de 2012 em:

http://www.cis.hut.fi/projects/somtoolbox/theory/somalg

orithm.shtml.

[10] R. J. Sassi,“Uma Arquitetura Híbrida para Descoberta

de Conhecimento em Base de Dados: Teoria dos Rough

Sets e Redes Neurais Artificiais Mapas Auto-

Organizáveis”, Dissertação de Doutorado, Universidade

de São Paulo, São Paulo/ SP, 2006.

[11] M. Sperandio. “Classificação de Conjuntos de

Consumidores de Energia Elétrica Via Mapas Auto-

Organizáveis e Estatística Multivariada”, Dissertação

de Mestrado, Universidade Federal de Santa Catarina,

Santa Catarina/ SC, 2004

[12] M. M. F.Gemignani.“Proposição e análise comparativa

de métodos alternativos de seleção e classificação de

curvas de carga para definição de tipologias de

estudos tarifários”, Dissertação de Mestrado,

Universidade de São Paulo, São Paulo/ SP, 2009.

[13] R. Linden,Técnicas de Agrupamento,Revista de

Sistemas de Informação FSMA, Rio de Janeiro, p.18-

36, 2009.

[14] L. C. Pinheiro, Método de representação espacial de

clustering, Dissertação de Mestrado, Departamento de

Informática, Universidade Federal do Paraná,

Curitiba/ PR, 2006.

[15] G. J. Tseroukas, I. K. Hatzilau, J. M. Prousalis, “A new

pattern recognition methodology for classification of

load profiles for ships electric consumers”, Journal of

Marine Engineering and Technology, n°. A14, 2009.

[16] V. Figueiredo; F. Rodrigues;Z. Vale; J. B. Gouveia.“An

Electric Energy Consumer Characterization

Framework Based on Data Mining Techniques”,IEEE

Transactions On Power Systems, vol. 20, no. 2, Maio

de 2005.