avaliação preliminar do desempenho de redes neurais...

13
Avaliação preliminar do desempenho de redes neurais feedforward para a previsão de preços de derivados da cana-de-açúcar Amanda Delatorre 1 , Sérgio Okida 1 , Flávio Trojan 1 , José Carlos Alberto de Pontes 2 , Sergio L. Stevan Jr. 1,3 , Hugo Siqueira 1 1 Departamento Acadêmico de Engenharia Eletrônica, e 2 Departamento Acadêmico de Matemática, Universidade Tecnológica Federal do Paraná, Ponta Grossa, Paraná, Brasil, 3 Programa de Pós Graduação em Computação Aplicada, Universidade Estadual de Ponta Grossa, Ponta Grossa, Paraná, Brasil, [email protected], [email protected], [email protected], [email protected], [email protected], [email protected] RESUMO O Brasil é um dos maiores produtores mundiais de cana-de-açúcar o que impacta diretamente a geração de empregos e o produto interno bruto do país. Neste sentido, esta investigação propõe a aplicação de redes neurais feedforward - perceptron de múltiplas camadas (MLP) e máquinas de aprendizado extremo (ELM) - para a previsão preços de derivados de cana: açúcar, etanol hidratado e etanol anidro. As ELMs são caracterizadas por um processo de treinamento simples e eficiência computacional, aliados a bons desempenhos. Os resultados computacionais obtidos mostram que esta arquitetura é um candidato viável para a solução de problemas de previsão. PALAVRAS-CHAVE: Redes Neurais feedforward, MLP, ELM, previsão, Açúcar, Etanol. ABSTRACT Brazil is one of the largest producers of sugarcane which directly impacts job creation and gross national product. In this sense, this research proposes the establishment of feedforward neural network - multilayer perceptron (MLP) and extreme learning machines (ELM) - for the forecast of cane derivatives pricing: sugar, hydrous and anhydrous ethanol. The ELMs are characterized by a simple training process and computational efficiency, combined with good performances. The computational results show that this architecture is a viable candidate for the solution of forecasting problems. KEYWORDS: Feedforward Neural Networks, MLP, ELM, Prediction, Sugar, Etanol.

Upload: nguyendien

Post on 29-Dec-2018

215 views

Category:

Documents


0 download

TRANSCRIPT

Avaliação preliminar do desempenho de redes neurais feedforward para a

previsão de preços de derivados da cana-de-açúcar

Amanda Delatorre1, Sérgio Okida

1, Flávio Trojan

1, José Carlos Alberto de Pontes

2,

Sergio L. Stevan Jr.1,3

, Hugo Siqueira1

1 Departamento Acadêmico de Engenharia Eletrônica, e

2 Departamento Acadêmico de

Matemática, Universidade Tecnológica Federal do Paraná, Ponta Grossa, Paraná, Brasil,

3 Programa de Pós Graduação em Computação Aplicada, Universidade Estadual de Ponta

Grossa, Ponta Grossa, Paraná, Brasil,

[email protected], [email protected], [email protected],

[email protected], [email protected], [email protected]

RESUMO

O Brasil é um dos maiores produtores mundiais de cana-de-açúcar o que impacta diretamente

a geração de empregos e o produto interno bruto do país. Neste sentido, esta investigação

propõe a aplicação de redes neurais feedforward - perceptron de múltiplas camadas (MLP) e

máquinas de aprendizado extremo (ELM) - para a previsão preços de derivados de cana:

açúcar, etanol hidratado e etanol anidro. As ELMs são caracterizadas por um processo de

treinamento simples e eficiência computacional, aliados a bons desempenhos. Os resultados

computacionais obtidos mostram que esta arquitetura é um candidato viável para a solução de

problemas de previsão.

PALAVRAS-CHAVE: Redes Neurais feedforward, MLP, ELM, previsão, Açúcar, Etanol.

ABSTRACT

Brazil is one of the largest producers of sugarcane which directly impacts job creation and

gross national product. In this sense, this research proposes the establishment of feedforward

neural network - multilayer perceptron (MLP) and extreme learning machines (ELM) - for the

forecast of cane derivatives pricing: sugar, hydrous and anhydrous ethanol. The ELMs are

characterized by a simple training process and computational efficiency, combined with good

performances. The computational results show that this architecture is a viable candidate for

the solution of forecasting problems.

KEYWORDS: Feedforward Neural Networks, MLP, ELM, Prediction, Sugar, Etanol.

INTRODUÇÃO

Atualmente, o Brasil é um dos maiores produtores mundiais de açúcar, conforme

Moraes e Bacchi (2014), e sua cadeia produtiva gera milhares de empregos diretos e indiretos,

além de uma quantidade elevada de divisas (Alves e Bacchi, 2004). Isto impacta diretamente

na economia e no produto interno bruto do país. A chamada “Economia do Açúcar” foi

responsável pela consolidação da colonização, através da ocupação de parte da costa

brasileira. Introduzida no Brasil ainda no período colonial, devido ao solo e clima favoráveis,

a produção cana-de açúcar foi o vetor de introdução do país no mercado internacional,

tornando-se durante séculos, o seu principal produto.

O açúcar e o etanol são alguns dos subprodutos mais relevantes da cana. O primeiro

teve, nas últimas décadas, seu consumo acelerado por diversos fatores: mudanças

socioeconômicas e demográficas, tais como a urbanização, composição das famílias e o

aumento da participação da mulher no mercado de trabalho (Souza et al., 2014). Produtos

altamente dependentes dessa matéria prima, como o iogurte, o refrigerante e alimentos

preparados tiveram seu consumo elevado na proporção de 7, 4 e 2 vezes entre 1974 e 2003

(Schlindwein e Kassouf, 2007), atingindo a marca mundial de produção de 155 milhões de

toneladas na safra 2010/11, aproximadamente (Souza et al, 2014). Há, portanto uma relação

direta entre a exportação desse bem com a balança comercial nacional (Alves e Bacchi, 2004),

fato que demonstra a importância do estudo de metodologias acuradas para previsão de seu

preço (Jati, 2013).

O etanol é um dos combustíveis mais utilizados para abastecimento de veículos no

Brasil. O advento do Proálcool em 1975 elevou consideravelmente a produção de cana no

país. Em tempos mais recentes, com a introdução no mercado dos carros flex fuel, esse

crescimento tornou-se ainda mais vertiginoso, chegando a uma produção de 520 milhões de

toneladas em 2007 (Figueira e Bacchi, 2014; Lima e Souza, 2014). Hoje cerca de 32% de toda

energia gerada no Brasil vai para o setor de transporte, sendo que deste montante, em 2013,

14,3% de toda energia gerada para o setor foi proveniente do Etanol, com um total consumido

de 3,67.109 l/dia (EPE, 2014).

O Balanço Energético Nacional de 2014 (EPE, 2014) aponta que, segundo o

Ministério da Agricultura, Pecuária e Abastecimento (MAPA), a produção de cana-de-açúcar

foi de 648,1 milhões de toneladas. Este valor é 9,2% superior ao ano anterior no qual

593,6 milhões de toneladas foram para moagem. De acordo com o documento, em 2013 a

produção nacional de açúcar foi de 37,3 milhões de toneladas. A fabricação de etanol, por sua

vez, atingiu o montante de 27.608,6 mil m³, sendo 56,5% referem-se ao etanol hidratado:

15.603,9 mil m³. Por conseguinte, a produção de etanol anidro, que é misturado à gasolina A

para formar a gasolina C, registrou acréscimo de 25,5%, totalizando 12.004,7 mil m³.

Nesse contexto é possível perceber que o estudo de metodologias de previsão do preço

de derivados de cana torna-se um campo de pesquisa relevante. Tarefas de previsão, em geral,

podem ser tratadas como mapeamento não-linear estático. Assim este trabalho propõe, para o

tratamento do problema abordado, a utilização das redes neurais feedforward (Haykin, 1999).

As arquiteturas de redes neurais artificiais podem ser classificadas quando a existência

ou não de laços de realimentação, que podem reinserir na entrada dos modelos informações de

saída. As redes feedforward não possuem realimentação e são adequadas a mapeamento não-

linear estático, desde que a função a ser aproximada seja contínua, limitada e totalmente

diferenciável (Haykin, 1999; Siqueira et al., 2014).

O principal representante dessa classe é o perceptron de múltiplas camadas (MLP - do

inglês multilayer perceptron), arquitetura que, com o trabalho de Rumelhart et al. (1986) que

reapresenta o algoritmo backpropagation para cálculo do vetor gradiente dos pesos da rede,

ganha destaque na literatura (Haykin, 1999). Esta rede é totalmente treinada e pode aproximar

qualquer mapeamento, sendo adequada a problemas de previsão, clusterização, equalização de

canais, dentre outros (Siqueira et al., 2012; 2014).

Recentemente, Huang et al. (2004) propuseram as máquinas de aprendizado extremo

(ELM – do inglês extreme learning machines). Os autores concluíram que com a inserção de

neurônios totalmente diferenciáveis é possível aproximar qualquer mapeamento com a

inserção de novos neurônios aleatoriamente gerados. Fica claro a relação direta entre as ELMs

e MLPs, sendo a primeira uma versão desorganizada da segunda, na qual a camada

intermediária não sofre nenhum tipo de ajuste (Huang et al., 2006; Siqueira et al., 2014).

O objetivo geral deste trabalho é investigar, comparar e propor uma metodologia para

as previsões do preço do açúcar na Brasil realizadas com a utilização de arquiteturas de redes

neurais do tipo máquinas de aprendizado extremo e perceptron de múltiplas camadas.

REDES NEURAIS ARTIFICIAIS (RNA)

O sistema nervoso dos organismos superiores é composto por neurônios conectados

entre si e por uma rede de sinapses que possuem como funções básicas receber as informações

pelos dendritos, processá-las e enviá-las de forma distribuída (Haykin, 1999).

Estas características qualificam o comportamento neural à capacidade de adaptar-se

aos estímulos desconhecidos a partir de estímulos conhecidos para realizar tarefas inéditas. A

capacidade que o indivíduo tem de modificar seu comportamento em função de experiências

passadas caracteriza o processo de aprendizado (Castro, 2006).

Esta é a inspiração biológica que fez surgir a neurocomputação, ciência que se baseou

nos sistemas neurais biológicos de processamento de informação paralelo, distribuído e

adaptável, que autonomamente desenvolvem capacidade respostas ao ambiente

(Haykin, 1999).

Perceptron de múltiplas camadas

Uma rede neural artificial MLP, por sua vez, é capaz de aproximar qualquer função

não-linear, continua, limitada e diferenciável que possui entradas fixas em um espaço

compacto de precisão arbitrária, o que a torna um aproximador universal. Em uma MLP a

primeira camada transmite o sinal de entrada à camada. As camadas escondidas tem como

função mapear o sinal de entrada de forma não-linear em um outro espaço de acordo com a

particularidades de cada problema. Já a camada de saída recebe o sinal transformado, e

através de combinações lineares, fornece da resposta a rede. Na Figura 1 apresenta-se uma

rede MLP genérica (Haykin, 1999, Castro, 2006).

Na Figura, u representa o vetor de entradas da rede, b é vetor de bias (polarização), w

é o vetor de pesos sinápticos que, combinados com as entradas, formam um vetor do sinal de

saída x. Este passa por uma função de ativação não-linear f, geralmente a tangente

hiperbólica. Os neurônios da camada de saída possuem função de ativação linear fs. A

resposta da rede y será dada pela Equação (1):

K

k

N

n

n

i

kn

s

ks uwfwfy0 0

1 (1)

em que i

knw são os pesos, k=0,1,...,K a variável que referencia o neurônio e n=0,1,...,N a

entrada que chega até o mesmo. Os coeficientes s

kw1 são as conexões do neurônio de saída. As

demais indicações são: “ 1” representa a entrada de polarização, i

kx simboliza a ativação do

k-ésimo neurônio da camada intermediária, f é a função de ativação dos neurônios desta

camada e fs , em geral linear, da camada de saída.

Neurônios de camadas disjuntas se conectam, enquanto neurônios de camadas

coexistentes não se comunicam, o que atribui à rede condição feedforward, ou seja, a rede não

possui nenhum tipo de realimentação. Chama-se de “Treinamento de uma rede MLP” o

processo de ajuste de suas ponderações ou pesos sinápticos (Siqueira et al., 2012). Com base

em alguma métrica que represente o grau de adequação da resposta de cada interação, em

geral alguma métrica de erro, o objetivo é encontrar os pesos da rede neural e, eventualmente,

suas conexões, são alteradas durante o processo com vistas a encontrar o melhor conjunto de

pesos que realize o mapeamento desejado. Este procedimento pode ser visto como uma tarefa

de otimização linear irrestrita (Haykin, 1999).

Figura 1 – Rede Neural MLP.

Independente do modelo de otimização escolhido para realizar o treinamento é

necessário aplicar a RNA o algoritmo de retropropagação (backpropagation), pois é ele que

permite o cálculo do gradiente descendente da função custo formada pela saída da rede e o

sinal desejado. Uma decisão muito importante quando se está na etapa de treinamento de uma

rede neural é detectar quando se deve parar o processo. Um dos critérios mais utilizados é o é

determinar um erro de treinamento mínimo que, ao ser alcançado, interrompe o treinamento.

Aliado a este, a faz-se necessária a determinação do número máximo de iterações, já que há a

possibilidade do algoritmo de treinamento estacionar em um mínimo local. A técnica

conhecida como validação cruzada, na qual um conjunto de amostras desconhecidas da rede é

apresentado à mesma a cada iteração e, é muito utilizada para escolha do conjunto de pesos

ótimos. Na iteração em que o erro de saída de validação é mínimo, adotam-se as ponderações

que levaram a este comportamento como aquelas capazes de maximizar o poder de

generalização da rede (Haykin, 1999). Dessa maneira, a validação cruzada é capaz de auxiliar,

também, na definição da topologia mais adequada a determinado problema.

Máquinas de aprendizado extremo

Recentemente uma nova abordagem de rede feedfrward vem ganhando destaque na

literatura, a qual procura aliar grande simplicidade no processo de treinamento com bons

desempenhos. Trata-se das máquinas de aprendizado extremo (ELM) propostas por Huang et

al. (2004), as quais possuem única camada intermediária. A ELMs são tem seus pesos gerados

de forma aleatória, mas apenas aqueles da camada de saída passam por um processo de ajuste.

Interessantemente, a forma de treinamento proposta resume-se a encontrar a solução para um

problema de mínimos quadrados, tarefa com solução determinística e de custo computacional

bastante reduzido. Além disso, os métodos de treinamento baseados em gradiente –

característicos das MLPs - sempre incorrem no risco de pararem em mínimos locais e podem

apresentar convergência lenta (Huang et al., 2006).

Assim como as MLPs, as ELMs são capazes de aproximar qualquer mapeamento não-

linear, continuo, limitado e diferenciável com precisão arbitrária, fato demonstrado por meio

de uma abordagem construtiva em Huang et al. (2006). A precisão está aliada ao fato de que a

inserção de novos neurônios na camada escondida eleva o potencial de aproximação da rede.

A Figura 2 apresenta esta arquitetura:

Figura 2 – Rede Neural ELM

Os neurônios da camada intermediária possuem ativações dadas pela expressão 2:

)( buWfxhhh

nn (2)

na qual T

11-nnn ][ Kn,...u,u uu é o vetor que contém o sinal de entrada, KNhh

W são os

coeficientes (pesos) da camada intermediária, b o bias de cada unidade da camada escondida

e fh(.) especifica as ativações dos neurônios da camada escondida. As saídas são geradas pela

expressão (3):

hout

xWy n , (3)

onde Wout

são os pesos da camada de saída.

Como mencionado, a principal vantagem das ELMs é que apenas a camada de saída é

treinada de acordo com um sinal de erro, por meio do cálculo de dos parâmetros de um

regressor linear. Um candidato bastante comum para resolver este tipo de tarefa é o operador

generalizado de Moore-Penrose, o qual minimiza a norma do vetor de pesos de saída, de

acordo com a expressão seguinte:

dXXXout

WTT -1

)( hhh (3)

na qual ks NT

hX é a matriz contendo as saídas da camada intermediária, T1T )( hhh XXX é

a pseudo inversa de hX , 1sT

d é o vetor com a resposta desejada e Ts o número de

amostras.

APLICAÇÃO, RESULTADOS E DISCUSSÃO

Nesta seção discute-se a aplicação das redes MLP e ELM para previsão do preço de

três importantes derivados da cana-de-açúcar: açúcar cristal, etanol hidratado e etanol anidro.

Os dados coletados para o estudo estão disponíveis no site do Centro de Estudos Avançados

em Economia Aplicada, da Escola Superior de Agronomia Luiz de Queiróz (ESALQ), da

Universidade de São Paulo (USP) (CEPEA, 2015).

Os dados relativos ao açúcar são referentes ao Indicador Açúcar Diário da

ESALQ/BVMF (bolsa de valores de mercadorias e futuros). O valor unitário, em reais,

corresponde à saca de 50 kg e expressa os preços efetivamente negociados no mercado à vista

do estado de São Paulo. A especificação do produto é: açúcar cristal especial, com mínimo de

99,7 graus de polarização, máximo de 0,08% de umidade, máximo de 150 cor ICUMSA,

máximo de 0,07% de cinzas. No dia de acesso haviam disponíveis amostras de 23 de janeiro

de 2013 a 18 de maio de 2015, totalizando 573 amostras. Os dados do etanol são referentes

ao Indicador Semanal Etanol Anidro/Hidratado CEPEA/ESAL Combustível – Estado de São

Paulo. O levantamento dos preços é diário, porém a sua divulgação é realizada através de uma

média semanal. Os valores coletados referem-se a negócios efetivados na modalidade

spot entre usinas e distribuidoras - preços ao produtor (usina). Cada dado corresponde ao

preço por litro. Os dados do etanol anidro foram coletados desde a semana de 29 de novembro

de 2002 até a de 15 de maio de 2015, totalizando 650 amostras. No caso do etano hidratado há

uma semelhança na forma de coleta, porém o preço apresentado é uma série diária com alguns

poucos valores faltantes. Neste caso, a unidade é Reais por metro cúbico (R$/m3), havendo

1321 amostras.

A metodologia adotada para as previsões consistiu em separar todos os dados em três

conjuntos: treinamento, validação e teste. Os dois últimos foram selecionados com as 100

últimas amostras de cada série, sendo as 50 finais reservadas ao conjunto de testes. O restante

dos dados foi designado como conjunto de treinamento.

Em seguida, para selecionar as melhores variáveis (atrasos) utilizou-se a técnica de

filtragem conhecida como Informação mútua (MI) (Luna e Ballini, 2006). A Figura 3

apresenta o resultado gráfico da aplicação da MI à série etanol semanal.

Figura 3: Atrasos significativos calculados viaMI

É possível observar que até o 6º atraso há uma relação entre as amostras, uma vez que

esta é o último coeficiente que se encontra acima do limiar de confiança representado pelas

linhas horizontais, previamente calculado em ±0,78 por meio da técnica de bootstraping

(Luna e Ballini, 2006). Observa-se ainda que, com a metodologia utilizada, o 4º e 5º atrasos

têm pouca influência na previsão futura, Entretanto, considerou-se aproveitar até o último

atraso significativo, utilizando-os em ambas a redes. Para cada série discutida neste trabalho –

açúcar diário, etanol hidratado diário e etanol anidro semanal, o número de atrasos apontados

pela MI foi:

Tabela 1: Número de atrasos significativos calculados para cada série

De posse disso, a próxima etapa foi realizar a previsão com MLPs e ELMs. O

treinamento da MLP foi realizado por meio do algoritmo gradiente conjugado escalonado

modificado (Santos e Von Zuben, 2008), enquanto a ELM foi treinada pelo operador de

Moore-Penrose. O número de neurônios artificiais foi escolhido de forma empírica e, como

esperado, este número foi bastante variado com um mínimo de 10 e um máximo de 100.

Definida a melhor rede, os horizontes de previsão selecionados foram P = 1, 2 e 3 passos à

frente, com a previsão multipasso feita de forma direta (Sorjamaa et al., 2007). Para cada

caso, as redes foram executadas 50 vezes. As métricas de desempenho escolhidas foram o

erro quadrático médio (MSE) e erro absoluto médio (MAE) (Siqueira et al., 2014).

Os resultados computacionais são mostrados na Tabela 2, os quais apresentam como

medidas de erro a média aritmética dessas execuções. Nela, N. Neuron. denota o número de

neurônios na camada intermediária e MSE trein o erro de treinamento.

Tabela 2: resultados das previsões

Os resultados sumarizados mostram alguns comportamentos interessantes.

Inicialmente, observa-se que o número selecionado de neurônios na camada escondida foi

bastante disperso, sem apresentar um padrão para nenhuma das redes, mas quase sempre

acima de 15 unidades processadoras. Além disso, para a série do etanol hidratado e P=3,

ambas as redes chegaram ao seu número máximo de neurônios, 70 para a ELM e 100 para a

MLP. Tratando-se apenas do conjunto de treinamento, observa-se que a ELM conseguiu

Açúcar diário 4

Etanol hidratado diário 7

Etanol anidro semanal 6

Açúcar diário Etanol hidratado diário Etanol anidro semanal

ELM

Horizonte 1 2 3 1 2 3 1 2 3

N. Neuron. 15 30 50 50 60 70 30 30 10

MSE Trein. 0,0883 0,1496 0,1938 63,414 191,26 386,2577 0,0008 0,0026 0,0095

MSE Teste 0,0382 0,0811 0,1249 31,414 84,043 142,4381 0,0006 0,0016 0,0038

MAE Teste 0,1628 0,2369 0,2970 4,3379 7,4233 9,3117 0,0189 0,0308 0,0456

MLP

Horizonte 1 2 3 1 2 3 1 2 3

N. Neuron. 30 50 15 20 15 100 20 20 50

MSE Trein. 0,0886 0,1686 0,2912 159,053 686,473 1011,07 0,0024 0,0076 0,0133

MSE Teste 0,0395 0,0954 0,1725 39,512 127,239 179,5932 0,0004 0,0010 0,0017

MAE Teste 0,1657 0,2487 0,3238 5,056 8,413 9,9975 0,0154 0,0253 0,0334

aproximar o mapeamento com maior precisão em todos os casos, embora, em termos de

desempenho final, deva-se considerar o erro do conjunto de testes.

Analisando os resultados dos conjuntos de testes arbitrou-se que, para ser considerado

o melhor desempenho, deve-se utilizar o MSE, uma vez que os algoritmos de treinamento

usam esta métrica para cálculo do erro e posterior ajuste dos pesos da rede. Nesse sentido,

nota-se que houve uma coincidência absoluta entre o melhor desempenho e os valores de

MAE e MSE. Outro comportamento verificado, e esperado, é que à medida que o horizonte

de previsão se eleva, o erro final aumenta. Isto ocorre porque a correlação entre as amostras

subsequentes acaba sendo menor do que em caso de dados temporalmente consecutivos. Para

as séries de dados diários, invariavelmente a ELM alcançou os menores erros finais, enquanto

para os dados semanais, o melhor desempenho favoreceu a MLP para todos os horizontes de

previsão propostos. Este resultado reflete um comportamento interessante, já que, neste

último caso, a MLP foi superior em dados com magnitude bastante reduzida em relação as

demais. Todavia, considerando a diferença de desempenho geral, e o esforço computacional

empregado para cada arquitetura ser treinada, é possível afirmar preliminarmente que a ELM,

com toda sua simplicidade tanto de implementação, quanto de ajuste se saiu melhor na

previsão de preços geral.

A Figura 4 apresenta os resultados para uma execução do melhor modelo de predição

utilizando P =1 para cada uma das três séries (ELM, ELM e MLP, respectivamente), com o

resultado sobreposto ao valor observado. Como é observável, os dados previstos conseguem

se aproximar dos valores desejados, apresentando um uma estimativa aceitável do valor real.

CONCLUSÕES

O presente artigo investigou a aplicação de redes neurais feedforward na previsão de

preços de derivados da cana-de-açúcar. As séries de preços selecionadas foram a de açúcar

cristal diário, etanol hidratado diário e etanol anidro semanal. As arquiteturas escolhidas

foram as redes perceptron de múltiplas camadas (MLP) e as recentemente desenvolvidas

máquinas de aprendizado extremo (ELM). As ELMs podem ser vistas como versões

desorganizadas das MLPs, uma vez que sua camada intermediária não passa por nenhum tipo

de ajuste, ficando o treinamento resumido a encontrar os melhores coeficientes de um

combinador linear, tarefa esta com solução determinística e reduzido custo computacional.

Figura 4 – Melhores resultados para P=1: (a) ELM para o açúcar diário, (b) ELM para o etanol hidratado diário e

(c) MLP para o etanol anidro semanal

(a)

(b)

(c)

O estudo foi baseado na previsão dos últimos 50 dados de cada série, com horizontes de 1, 2 e

3 passos à frente. O número de neurônios de cada rede foi determinado de forma empírica e a

seleção dos melhores atrasos foi feita por meio do cálculo da informação mútua entre as

amostras. Os resultados computacionais apresentaram desempenho superior para as ELMs nos

casos de séries diárias (e que possuem dados de maior magnitude), enquanto os dados

semanais foram de desempenho superior para a MLP. Tais resultados apontam que a ELM,

versão desorganizada da MLP, foi capaz de sobrepor a sua arquitetura totalmente treinada e

mostra que esta nova proposta é uma metodologia viável e de baixo custo computacional para

tratar previsões de séries de preços agrícolas e, possivelmente de séries temporais em geral.

Trabalhos futuros podem ser realizados no sentido de envolver outras arquiteturas de

redes neurais, como redes recorrentes e, também a aplicação a novas séries de preços. Além

disso, modelos lineares podem ser aplicados para um estudo comparativo.

REFERÊNCIAS

ALVES, L. R. A. ; BACCHI, M. R. P., Oferta de exportação de açúcar do Brasil. Revista de

Economia e Sociologia Rural, v. 42 (1), 2004.

BOX, G., JENKINS, G. E REINSEL, G. C., Time Series Analysis, Forecasting and Control,

3a. ed., Holden Day, Oakland, California, EUA, 1994.

CASTRO, L. N., Fundamentals of natural computing: basic concepts, algorithms and

applications. Chapman & Hall, 2006.

CEPEL, CENTRO DE ESTUDOS AVANÇADOS EM ECONOMIA APLICADA -

ESALQ/USP - disponível em: <http://cepea.esalq.usp.br>, acesso em: 01 de junho de 2015.

EPE, Empresa de Pesquisa Energética, Balanço energético nacional 2014 (ano base 2013).

Ministério de Minas e Energia, 2014

FIGUEIRA, S. R., BACCHI, M. R. P., BURNQUIST, H. L., Forecasting fuel ethanol

consumption in Brazil by time series models: 2006-2012. Applied Economics (Print), v. 42, p.

865-874, 2010.

HAYKIN, S., Neural Networks: A Comprehensive Foundation, 2a. ed., Prentice-Hall, Upper

Saddle River, NJ, 1999.

HUANG, G.-B., ZHU, Q.-Y., SIEW, C.-K., Extreme learning machine: A new learning

scheme of feedforward neural networks, Proc. Int. Joint Conf. Neural Networks, p. 985–990,

2004.

HUANG, G.-B., ZHU, Q.-Y., SIEW, C.-K., Extreme learning machine: Theory and

applications, Neurocomputing 70(1–3), p. 489–501, 2006.

JATI, K., Sugar Price Analysis in Indonesia International Journal of Social Science and

Humanity, Vol. 3 (4), 2013.

LIMA, N. C., SOUZA, G. H. S., A demanda do etanol e sua caracterização no mercado

brasileiro de combustíveis, Organizações Rurais & Agroindustriais, Lavras, v. 16 (4) (edição

especial), p. 532-544, 2014.

LUNA, I. BALLINI, R., Top-Down Strategies Based on Adaptive Fuzzy Rule-Based Systems

for Daily Time Series Forecasting, International Journal of Forecasting, p. 708-724. 2011.

MORAES, M. L., BACCHI, M. R. P., Etanol: do início às fases finais de produção, Revista

de Politica Agricola, v. 4, p. 5-22, 2014.

RUMELHART, D., G. HINTON, AND R. WILLIAMS, Learning Representations by

Backpropagation Errors, Nature, p. 533–536, 1986.

SANTOS E. P., VON ZUBEN, F. J., Improved second-order training algorithms for globally

and partially recurrent neural networks, in IEEE Proc. Int. Joint Conf. Neural Networks, p.

1501–1506, 1999.

SCHLINDWEIN, M. M. e KASSOUF, A. L., Mudanças no padrão de consumo de alimentos

tempo-intensivos e de alimentos poupadores de tempo, por região no Brasil. In: SILVEIRA,

F. G., SERVO, L. M. S., MENEZES, T. e PIOLA, S. F. (Org.). Gasto e consumo das famílias

brasileiras contemporâneas. Vol. 2. Brasília: IPEA – Instituto de Pesquisa Econômica

Aplicada, p. 423-462, 2007.

SIQUEIRA, H. V., BOCCATO, L., ATTUX, R., LYRA, C., Echo state networks and extreme

learning machines: A comparative study on seasonal streamflowseries prediction, Lecture

Notes in Computer Science 7664(2), p.491–500, 2012.

SIQUEIRA, H. V., BOCCATO, L., ATTUX, R., LYRA, C., Unorgnized Machines for

Seasonal streamflow series forecasting, International Journal of Neural Systems, v. 24, p.

1430009-1430016, 2014.

SORJAMAA, A., HAO, J., REYHANI, N., JI Y., LENDASSE, A., Methodology for long-

term prediction of time series, Neurocomputing 70, p. 2861–2869, 2007.

SOUZA, M. J. P., OLIVEIRA, P. R., BURNQUIST, H. L., Lar 'Doce' Lar: uma análise do

consumo de açúcar e de produtos relacionados no Brasil. Revista de Economia e Sociologia

Rural, v. 51, p. 785-796, 2013.