uma nova metodologia h ibrida inteligente para a … · resumo nestetrabalho...

Pos-graduacao em Ciencia da Computacao

UMA NOVA METODOLOGIA HIBRIDAINTELIGENTE PARA A PREVISAO DE

SERIES TEMPORAIS

Tiago Alessandro Espınola Ferreira

TESE DE DOUTORADO

Universidade Federal de [email protected]

www.cin.ufpe.br/vposgraduacao

Recife, Fevereiro/2006

Universidade Federal de Pernambuco

Centro de Informatica

Tiago Alessandro Espınola Ferreira

UMA NOVA METODOLOGIA HIBRIDA INTELIGENTE PARA APREVISAO DE SERIES TEMPORAIS

Trabalho apresentado ao Programa de Pos-graduacao em

Ciencia da Computacao do Centro de Informatica da Uni-

versidade Federal de Pernambuco como requisito parcial

para obtencao do grau de Doutor em Ciencia da Com-

putacao.

Orientador: Prof. Germano Crispim Vasconcelos

Co-orientador: Prof. Paulo Jorge Leitao Adeodato

Recife, Fevereiro/2006

A minha Famılia.

AGRADECIMENTOS

Gostaria inicialmente de agradecer a Deus e a minha famılia pelo apoio incondicional naoso durante este trabalho, mas por todo o tempo da minha existencia.

Gostaria de agradecer em especial ao Prof. Germano Crispim Vasconcelos pela suasegura orientacao. Sua experiencia e conhecimento foram de fundamental importanciano decorrer deste trabalho.

Ao Prof. Paulo Jorge Leitao Adeodato pelo apoio.

A minha querida e amada Marcia que ao meu lado dividiu minhas tristezas e multi-plicou minhas alegrias.

Aos meus colegas de sala, e acima de tudo amigos: Robson, Sergio, Paulo, Joel, Maurye Vitor. E, tambem, a todos os outros colegas do CIn que fizeram dos dias de interminaveltrabalho um excelente bem estar.

Aos funcionarios do Centro de Informatica: Rosali, Inacia, Edlene, Mario e Rodrigo,pela boa vontade, infra-estrutura e suporte.

Aos orgaos de financiamento, em especial ao CNPq, pela bolsa de estudos.

E a todos aqueles que de forma direta e indireta contribuıram para a execucao destetrabalho.

iv

The best way to predict the future is by creating it.

—PETER DRUCKER

RESUMO

Neste trabalho e realizado um estudo sistematico para a resolucao do problema de previsaode series temporais com a utilizacao de tecnicas de Inteligencia Artificial.

Inicialmente, modelos de Box & Jenkins sao aplicados para a previsao de series tem-porais para a geracao de um padrao de referencia. Sao investigadas entao tecnicas daInteligencia Artificial mais comumente encontradas na literatura, como redes neurais ar-tificiais e algoritmos geneticos, bem como um sistema hıbrido inteligente resultante dauniao destas duas tecnicas.

Observando as deficiencias e os pontos fortes das metodologias estudadas, foi desen-volvido um novo metodo para a previsao de series temporais, the Time-lag Added Evolu-tionary Forecasting (TAEF) Method, combinando redes neurais artificiais, um algoritmogenetico modificado, um mecanismo de busca evolutiva pela dimensionalidade mınimanecessaria para a reconstrucao do espaco de fase gerador da serie, e um procedimento depos-processamento para a determinacao da fase da previsao gerada.

Experimentos extensivos realizados com o Metodo TAEF com series temporais denatureza, complexidade e caracterısticas de comportamento diversificadas, comprovama eficiencia e robustez do metodo proposto. Tendo sido testado em um conjunto deoito series temporais, sendo duas series artificiais (serie do Mapa de Henon e serie Ran-dom Walk), duas de fenomenos naturais (serie das Manchas Solares e serie de Medidasde Brilho de uma Estrela) e quatro series economicas e financeiras (Indice Dow Jones,Indice Nasdaq, Indice S&P500 e Acoes da Petrobras), o metodo TAEF apresenta umdesempenho de previsao comprovadamente superior as demais tecnicas investigadas e avarios outros trabalhos encontrados na literatura. Alem deste experimentos, series artifi-ciais com caracterısticas peculiares tambem foram criadas para a certificacao da robustezdo metodo, como series de Random Walk com Drift e/ou Sazonalidade aditiva, Seriesgeradas a partir de modelos GARCH, SETAR e STAR.

Por fim, simulacoes de um sistema de apoio a decisao para a compra e venda de acoesna bolsa de valores do estado de Sao Paulo (Bovespa) sao montadas, demonstrando apossibilidade de uso pratico do metodo TAEF, consolidando-o como uma nova metodo-logia viavel e de alto desempenho para a resolucao do problema de previsao de seriestemporais.

Palavras-chave: Previsao de Series Temporais, Redes Neurais Artificiais, AlgoritmosGeneticos, Sistemas Hıbridos Inteligentes, Sistemas de Apoio a Decisao.

vi

ABSTRACT

In this work, a systematic study for the solution of the times series Forecasting problemis performed with the artificial Intelligence techniques.

Initially, Box & Jenkins models are employed for the prediction of the time seriesto establish a benchmark for model comparison. Then artificial intelligence techniqueswidely found in the literature, such as artificial neural networks and genetics Algorithmsare studies for the same purpose and a hybrid intelligent system based on the combinationof the two techniques is considered for times series forecasting.

As a result of the investigations conducted, the advantages and weaknesses of eachapproach are identified, giving insights for a more robust combination of the methods.A new methodology is created — the Time-lag Added Evolutionary Method (TAEF) —which combines artificial neural networks with a modified genetic algorithm, performsan evolutionary search for the minimum necessary dimensionality for reconstructing thephase space that generates the times series, and a post-processing procedure that carriesout a statistical test to measure the behavior of the prediction generated.

Extensive experiments conducted with the TAEF method with several time series ofdifferent natures, trends and features showed a superior performance of the proposedapproach when compared to all the other techniques previously examined and with othermethods found in the literature. For the experimental investigations carried out eighttime series were employed: two artificial series (Henon Map and Random Walk), two ofnatural phenomena (Sunspot and Star Brightness), and four financial series (Dow JonesIndustrial Average Index, S&P500 Index, Nasdaq Index and Petrobras Stock Values).

Finally, simulations of a decision support system for stock purchase and sale in the SaoPaulo Stock Market (Bovespa) was considered to demonstrate the capacity of the TAEFmethod to produce real financial returns on real market operations, consolidating theTAEF method as a feasible and high performance new methodology for the forecastingof the times series problem.

Keywords: Times Series Forecasting, Artificial Neural Network, Genetic Algorithms,Intelligent Hybrid Systems, Decision Support Systems.

vii

SUMARIO

Capıtulo 1—Introducao 1

1.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

1.2 Motivacao, Justificativa e Objetivos . . . . . . . . . . . . . . . . . . . . . 5

1.3 Estrutura da Tese . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

Capıtulo 2—O Problema de Previsao de Series Temporais 10

2.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

2.2 Series Temporais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

2.3 Previsao de Series Temporais . . . . . . . . . . . . . . . . . . . . . . . . 11

2.4 Modelos Convencionais para Previsao de Series Temporais . . . . . . . . 13

2.4.1 Modelos de Box & Jenkins . . . . . . . . . . . . . . . . . . . . . . 14

2.4.1.1 Modelos Auto-Regressivos de Ordem p . . . . . . . . . . 16

2.4.1.1.1 Funcao de Auto-Correlacao para o Modelo AR(p). 16

2.4.1.2 Modelos de Medias Moveis de Ordem q . . . . . . . . . . 18

2.4.1.2.1 Funcao de Auto-Correlacao para o Modelo MA(q). 18

2.4.1.3 Modelos Mistos: Auto-Regressivos com Medias Moveis . 20

2.4.1.3.1 Funcao de Auto-Correlacao (FAC). . . . . . . . 20

2.4.1.4 Funcao de Auto-Correlacao Parcial (FACP) . . . . . . . 21

2.4.1.5 Modelos ARIMA . . . . . . . . . . . . . . . . . . . . . . 22

2.4.2 Modelos Nao-Lineares . . . . . . . . . . . . . . . . . . . . . . . . 23

Capıtulo 3—Abordagens da Inteligencia Artificial para Previsao de Series Tem-porais 29

viii

SUMARIO ix

3.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

3.2 Redes Neurais Artificiais . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

3.3 Redes Neurais Artificiais e o Problema de Previsao . . . . . . . . . . . . 31

3.3.1 Redes Neurais Perceptrons Multi-Camadas . . . . . . . . . . . . . 32

3.3.2 Projeto de uma Rede Neural Artificial . . . . . . . . . . . . . . . 35

3.3.2.1 Arquitetura da Rede . . . . . . . . . . . . . . . . . . . . 35

3.3.2.1.1 Quantidade de Entradas e Retardos Temporais. 36

3.3.2.1.2 Quantidade de Camadas Escondidas e Neuronios. 36

3.3.2.1.3 Quantidade de Saıdas. . . . . . . . . . . . . . . 38

3.3.2.2 Funcao de Ativacao . . . . . . . . . . . . . . . . . . . . . 38

3.3.2.3 Conexoes entre Neuronios . . . . . . . . . . . . . . . . . 40

3.3.2.4 Algoritmo de Treinamento . . . . . . . . . . . . . . . . . 40

3.3.2.5 Normalizacao dos Dados . . . . . . . . . . . . . . . . . . 41

3.4 Algoritmos Geneticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

3.4.1 Indivıduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43

3.4.2 Funcao de Custo . . . . . . . . . . . . . . . . . . . . . . . . . . . 44

3.4.3 Escolha de Indivıduos . . . . . . . . . . . . . . . . . . . . . . . . 45

3.4.4 Operadores Geneticos . . . . . . . . . . . . . . . . . . . . . . . . . 46

3.4.5 Algoritmos Geneticos e o Problema de Previsao . . . . . . . . . . 48

3.5 Sistemas Hıbridos Inteligentes . . . . . . . . . . . . . . . . . . . . . . . . 48

3.5.1 Algoritmos Geneticos e Redes Neurais . . . . . . . . . . . . . . . 49

Capıtulo 4—Caracterizacao das Series Temporais Utilizadas 51

4.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51

4.2 Serie do Mapa de Henon . . . . . . . . . . . . . . . . . . . . . . . . . . . 52

4.3 Serie das Manchas Solares (sunspot) . . . . . . . . . . . . . . . . . . . . 54

4.4 Serie de Medidas do Brilho de uma Estrela . . . . . . . . . . . . . . . . . 55

4.5 Serie do Indice Dow Jones Industrial Average (DJIA) . . . . . . . . . . . 57

SUMARIO x

4.6 Serie do Indice Nasdaq . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60

4.7 Serie do Indice S&P500 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61

4.8 Serie do Valor de Fechamento das Acoes da Petrobras . . . . . . . . . . . 63

4.9 Random Walk . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64

4.9.1 O Modelo Random Walk e as Series Financeiras . . . . . . . . . . 65

4.10 Medidas de Desempenho para a Previsao . . . . . . . . . . . . . . . . . . 67

Capıtulo 5—Resultados Experimentais com Metodos Tradicionais 71

5.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71

5.2 Experimentos com os Modelos de Box & Jenkins . . . . . . . . . . . . . . 72

5.2.1 Serie do Mapa de Henon . . . . . . . . . . . . . . . . . . . . . . . 72

5.2.2 Serie das Manchas Solares . . . . . . . . . . . . . . . . . . . . . . 74

5.2.3 Serie de Medidas do Brilho de uma Estrela . . . . . . . . . . . . . 75

5.2.4 Serie do Indice Dow Jones Industrial Average (DJIA) . . . . . . . 77

5.2.5 Serie do Indice Nasdaq . . . . . . . . . . . . . . . . . . . . . . . . 78

5.2.6 Serie do Indice S&P500 . . . . . . . . . . . . . . . . . . . . . . . . 79

5.2.7 Serie do Valor de Fechamento das Acoes da Petrobras . . . . . . . 81

5.2.8 Serie Random Walk . . . . . . . . . . . . . . . . . . . . . . . . . . 82

5.3 Experimentos com Redes Neurais Artificiais do Tipo MLP . . . . . . . . 83


5.3.2 Series das Manchas Solares . . . . . . . . . . . . . . . . . . . . . . 87


5.3.4 Serie do Indice Dow Jones Industrial Average . . . . . . . . . . . 90





SUMARIO xi

Capıtulo 6—Combinacao de Redes Neurais Artificiais e Algoritmos Geneticospara a Previsao de Series Temporais 102

6.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102

6.2 Algoritmo Genetico e Redes Neurais . . . . . . . . . . . . . . . . . . . . 103

6.3 Resultados Experimentais com o Sistema Hıbrido AG+RNA . . . . . . . 110


6.3.2 Serie das Manchas Solares . . . . . . . . . . . . . . . . . . . . . . 113


6.3.4 Serie do Indice Dow Jones Industrial Average . . . . . . . . . . . 115





Capıtulo 7—Um Novo Metodo Hıbrido Inteligente para a Previsao de SeriesTemporais 125

7.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125

7.2 Uma Nova Proposta: Metodo TAEF . . . . . . . . . . . . . . . . . . . . 126

7.2.1 Experimentos Iniciais com o Metodo TAEF . . . . . . . . . . . . 129

7.2.1.1 Experimentos com a Serie do Mapa de Henon . . . . . . 130

7.2.1.2 Experimentos com a Serie das Manchas Solares . . . . . 132

7.2.1.3 Experimentos com a Serie de Medidas do Brilho de umaEstrela . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133

7.2.1.4 Experimentos com a Serie do Indice Dow Jones IndustrialAverage . . . . . . . . . . . . . . . . . . . . . . . . . . . 134

7.2.1.5 Experimentos com a Serie do Indice Nasdaq . . . . . . . 136

7.2.1.6 Experimentos com a Serie do Indice S&P500 . . . . . . . 138

7.2.1.7 Experimentos com a Serie do Valor de Fechamento dasAcoes da Petrobras . . . . . . . . . . . . . . . . . . . . . 139

SUMARIO xii

7.2.1.8 Experimentos com a Serie Random Walk . . . . . . . . . 141

7.2.2 Analise Comportamental das Series Temporais . . . . . . . . . . . 142

7.2.3 Experimentos com a Inclusao da Analise Comportamental ao MetodoTAEF . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146

7.2.3.1 Experimentos com a Serie do Mapa de Henon . . . . . . 147

7.2.3.2 Experimentos com a Serie das Manchas Solares . . . . . 148

7.2.3.3 Experimentos com a Serie de Medidas do Brilho de umaEstrela . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149

7.2.3.4 Experimentos com a Serie do Indice Dow Jones IndustrialAverage . . . . . . . . . . . . . . . . . . . . . . . . . . . 151

7.2.3.5 Experimentos com a Serie do Indice Nasdaq . . . . . . . 153

7.2.3.6 Experimentos com a Serie do Indice S&P500 . . . . . . . 155

7.2.3.7 Experimentos com a Serie do Valor de Fechamento dasAcoes da Petrobras . . . . . . . . . . . . . . . . . . . . . 156

7.2.3.8 Experimentos com a Serie Random Walk . . . . . . . . . 159

7.3 Comparacoes com Outros Trabalhos . . . . . . . . . . . . . . . . . . . . . 159

Capıtulo 8—Investigacoes Complementares ao Metodo TAEF 162

8.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162

8.2 Famılia de Series do Tipo Random Walk . . . . . . . . . . . . . . . . . . 163

8.2.1 Famılia de Series Random Walk com Drift . . . . . . . . . . . . . 163

8.2.2 Famılia de Series Random Walk com Sazonalidade Aditiva . . . . 166

8.2.3 Famılia de Series Random Walk com Drift e Sazonalidade Aditiva 168

8.3 Famılia de Series dos Modelos GARCH . . . . . . . . . . . . . . . . . . . 170

8.4 Famılia de Series dos Modelos SETAR . . . . . . . . . . . . . . . . . . . 172

8.5 Serie Gerada pelo Modelo STAR . . . . . . . . . . . . . . . . . . . . . . . 176

8.6 Comentarios sobre os Resultados . . . . . . . . . . . . . . . . . . . . . . 177

Capıtulo 9—Simulacoes de Compra e Venda de Acoes 179

SUMARIO xiii

9.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 179

9.2 Regras de Compra e Venda . . . . . . . . . . . . . . . . . . . . . . . . . . 180

9.3 Carteira de Tıtulos Utilizada . . . . . . . . . . . . . . . . . . . . . . . . . 181

9.4 Simulacao de Compra e Venda de Acoes . . . . . . . . . . . . . . . . . . 181

9.4.1 Resultados das Simulacoes . . . . . . . . . . . . . . . . . . . . . . 184

Capıtulo 10—Conclusoes 189

10.1 Conclusoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 189

10.1.1 Contribuicoes da Tese . . . . . . . . . . . . . . . . . . . . . . . . 192

10.2 Limitacoes do Trabalho . . . . . . . . . . . . . . . . . . . . . . . . . . . . 194

10.3 Trabalhos Futuros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 195

10.4 Trabalhos Publicados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 196

Apendice A—Enunciado dos Teoremas de F. Takens 198

A.1 Sistema Dinamico com um Observavel . . . . . . . . . . . . . . . . . . . 198

Apendice B—Evolucao da Populacao dos Algoritmos Geneticos 201

B.1 O Teorema dos Esquemas . . . . . . . . . . . . . . . . . . . . . . . . . . 201

Apendice C—Valores dos Coeficientes para os Modelos de Box & Jenkins 204

C.1 Serie do Mapa de Henon . . . . . . . . . . . . . . . . . . . . . . . . . . . 204

C.2 Serie das Manchas Solares . . . . . . . . . . . . . . . . . . . . . . . . . . 204

C.3 Serie de Medidas de Brilho de uma Estrela . . . . . . . . . . . . . . . . . 205

C.4 Serie do Indice Dow Jones Industrial Average . . . . . . . . . . . . . . . 205

C.5 Serie do Indice Nasdaq . . . . . . . . . . . . . . . . . . . . . . . . . . . . 205

C.6 Serie do Indice S&P500 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 206

C.7 Serie do Valor de Fechamento das Acoes da Petrobras . . . . . . . . . . . 206

C.8 Serie Random Walk . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 206

SUMARIO xiv

Apendice D—Resultados Experimentais com as Redes Neurais Artificiais 207

Apendice E—Estruturas de Conexoes para os Melhores Indivıduos do SistemaHıbrido Inteligente — Algoritmo Genetico Modificado com Redes NeuraisArtificiais 216

E.1 Melhores Indivıduos para a Serie do Mapa de Henon . . . . . . . . . . . 217

E.2 Melhores Indivıduos para a Serie das Manchas Solares . . . . . . . . . . . 217

E.3 Melhores Indivıduos para a Serie de Medidas do Brilho de uma Estrela . 217

E.4 Melhores Indivıduos para a Serie do Indice Dow Jones Industrial Average 218

E.5 Melhores Indivıduos para a Serie do Indice Nasdaq . . . . . . . . . . . . 218

E.6 Melhores Indivıduos para a Serie do Indice S&P500 . . . . . . . . . . . . 219

E.7 Melhores Indivıduos para a Serie do Valor de Fechamento das Acoes daPetrobras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 219

E.7.1 Arquitetura 3-10-1 . . . . . . . . . . . . . . . . . . . . . . . . . . 220

E.8 Melhores Indivıduos para a Serie Random Walk . . . . . . . . . . . . . . 220

Referencias Bibliograficas 221

LISTA DE FIGURAS

1.1 Grafico ilustrativo do custo versus o benefıcio na previsao em relacao aoaumento da precisao em um processo de previsao . . . . . . . . . . . . . 2

2.1 Estagios para a construcao de um modelo iterativo de Box e Jenkins. . . 15

2.2 Graficos tıpicos das FACs para um Modelo AR. (a) φ = 0.8 e (b) φ = −0.8. 18

3.1 Rede MLP de tres camadas totalmente conectada. . . . . . . . . . . . . . 33

3.2 Esquema do processo de aprendizagem supervisionada. . . . . . . . . . . 34

3.3 Graficos das funcoes de ativacao mais comuns. (A) Funcao SigmoideLogıstica; (B) Funcao Tangente Hiperbolica; (C) Funcao Seno; (D) FuncaoLinear. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39

3.4 Procedimento padrao de um Algoritmo Genetico tıpico. . . . . . . . . . . 43

3.5 Representacao esquematica da informacao biologica. O indivıduo e ab-straıdo como uma solucao a um problema, seu cromossomo a sua codi-ficacao e os genes aos parametros da solucao. . . . . . . . . . . . . . . . . 44

3.6 Metodo da Roleta aplicado a uma populacao de cinco indivıduos. . . . . 46

3.7 Operadores de cruzamento e mutacao aplicados nos AGs binarios. . . . . 47

4.1 Grafico da serie do Mapa de Henon (500 primeiros pontos). . . . . . . . . 52

4.2 Lagplot para o mapa Henon do lag 1 ao 9. . . . . . . . . . . . . . . . . . 53

4.3 Imagem da superfıcie solar, construıda pela NASA, onde sao apresentadosgrupos de manchas solares, destacados pelos cırculos tracejados. . . . . . 54

4.4 Grafico da serie das Manchas Solares (Sunspot) — medidas anuais. . . . 55

4.5 Lagplot para a serie das Manchas Solares do lag 1 ao 9. . . . . . . . . . . 56

4.6 Grafico da serie de medidas do brilho de uma estrela. . . . . . . . . . . . 56

4.7 Lagplot para a serie de medidas do brilho de uma estrela do lag 1 ao 9. . 57

4.8 Grafico da serie do Indice Dow Jones Industrial Average. . . . . . . . . . 59

xv

LISTA DE FIGURAS xvi

4.9 Lagplot para a serie do Indice Dow Jones Industrial Average do lag 1 ao 9. 59

4.10 Grafico da serie do Indice Nasdaq. . . . . . . . . . . . . . . . . . . . . . . 61

4.11 Lagplot para a serie do Indice Nasdaq do lag 1 ao 9. . . . . . . . . . . . . 61

4.12 Grafico da serie do Indice S&P500. . . . . . . . . . . . . . . . . . . . . . 62

4.13 Lagplot para a serie do Indice S&P500 do lag 1 ao 9. . . . . . . . . . . . 63

4.14 Grafico da serie da Acoes da Petrobras. . . . . . . . . . . . . . . . . . . . 64

4.15 Lagplot para a serie das Acoes da Petrobras do lag 1 ao 9. . . . . . . . . 64

4.16 Grafico da serie artificial gerada pelo modelo de Random Walk referente aEquacao (.). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66

4.17 Lagplot para a serie artificial gerada pelo modelo de Random Walk refe-rente a Equacao (.) do lag 1 ao 9. . . . . . . . . . . . . . . . . . . . . . 66

5.1 Grafico comparativo entre os valores reais (linha solida) e os valores deprevisao (linha tracejada) gerados pelo modelo de Box & Jenkins para osultimos 100 pontos do conjunto de teste da serie de Henon. . . . . . . . . 74

5.2 Grafico comparativo entre os valores reais (linha solida) e os valores deprevisao gerados pelo modelo de Box & Jenkins (linha tracejada) para oconjunto de teste da serie das Manchas Solares. . . . . . . . . . . . . . . 75

5.3 Grafico comparativo entre os valores reais (linha solida) e os valores deprevisao gerados pelo modelo de Box & Jenkins (linha tracejada) para oconjunto de teste da serie de Medidas do Brilho de uma Estrela. . . . . . 76

5.4 Grafico comparativo entre os valores reais (linha solida) e os valores deprevisao gerados pelo modelo de Box & Jenkins (linha tracejada) para oconjunto de teste da serie do Indice Dow Jones Industrial Average (DJIA). 77

5.5 Grafico comparativo entre os valores reais (linha solida) e os valores deprevisao gerados pelo modelo de Box & Jenkins (linha tracejada) para oconjunto de teste da serie do Indice Nasdaq. . . . . . . . . . . . . . . . . 79

5.6 Grafico comparativo entre os valores reais (linha solida) e a previsao ge-rada pelo modelo ARIMA (linha tracejada) para os ultimos 142 pontos doconjunto de teste do Indice Nasdaq. . . . . . . . . . . . . . . . . . . . . . 79

5.7 Grafico comparativo entre os valores reais (linha solida) e os valores deprevisao gerados pelo modelo de Box & Jenkins (linha tracejada) para oconjunto de teste da serie do Indice S&P500. . . . . . . . . . . . . . . . . 80

LISTA DE FIGURAS xvii

5.8 Grafico comparativo entre os valores reais (linha solida) e os valores deprevisao gerados pelo modelo de Box & Jenkins (linha tracejada) para oconjunto de teste da serie do Valor de Fechamento das Acoes da Petrobras. 82

5.9 Grafico comparativo entre os valores reais (linha solida) e os valores deprevisao gerados pelo modelo de Box & Jenkins (linha tracejada) para oconjunto de teste da serie Random Walk. . . . . . . . . . . . . . . . . . . 83

5.10 Serie do Mapa de Henon (linha solida) e a previsao gerada pela rede neural(linha tracejada) para os ultimos 100 pontos do conjunto de teste. . . . . 87

5.11 Grafico comparativo entre os valores reais (linha solida) e os valores pre-vistos pela RNA (linha tracejada) para a serie das Manchas Solares. . . . 88

5.12 Grafico comparativo entre a serie real de medidas do brilho de um estrela(linha solida) e a previsao gerada pela rede neural (linha tracejada). . . . 90

5.13 Serie real do DJIA (linha solida) e a previsao gerada pela rede neural (linhatracejada) para o conjunto de teste. . . . . . . . . . . . . . . . . . . . . . 92

5.14 Serie real do Indice Nasdaq (linha solida) e a previsao gerada pela redeneural (linha tracejada) para o conjunto de teste. . . . . . . . . . . . . . 94

5.15 Grafico comparativo entre a serie real do Indice S&P500 (linha solida) e aprevisao gerada pela rede neural (linha tracejada) para o conjunto de teste. 96

5.16 Serie real do DJIA (linha solida) e a previsao gerada pela rede neural (linhatracejada) para o conjunto de teste. . . . . . . . . . . . . . . . . . . . . . 98

5.17 Grafico comparativo entre a serie real Random Walk (linha solida) e aprevisao gerada pela rede neural (linha tracejada) para o conjunto de teste. 101

6.1 Esquema generico da rede neural artificial codificada como indivıduo dapopulacao do algoritmo genetico descrito. . . . . . . . . . . . . . . . . . . 108

6.2 Serie do Mapa de Henon (linha solida) e os valores previstos (linha tra-cejada) pelo Sistema Hıbrido AG+RNA para os ultimos 100 pontos doconjunto de teste. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112

6.3 Serie das Manchas Solares (linha solida) e os valores previstos (linha tra-cejada) pelo Sistema Hıbrido AG+RNA para o conjunto de teste. . . . . 113

6.4 Serie de Medidas de Brilhos de um Estrela (linha solida) e a previsao (linhatracejada) gerada pelo modelo REDE 2 da arquitetura 3-1-1. . . . . . . . 115

6.5 Serie real do DJIA (linha solida) e a previsao gerada pelo Sistema HıbridoAG+RNA (linha tracejada), REDE 2 da arquitetura 3-10-1, para o con-junto de teste. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116

LISTA DE FIGURAS xviii

6.6 Serie do Indice Nasdaq (linha solida) e a previsao gerada pelo SistemaHıbrido AG+RNA (linha tracejada), REDE 2 da arquitetura 3-5-1, parao conjunto de teste. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118

6.7 Serie S&P500 (linha solida) e a previsao gerada pelo modelo REDE 2 daarquitetura 3-5-1 para o conjunto de teste. . . . . . . . . . . . . . . . . . 120

6.8 Serie do Valor de Fechamento das Acoes da Petrobras (linha solida) e aprevisao gerada pelo Sistema Hıbrido AG+RNA (linha tracejada), REDE2 da arquitetura 3-10-1, para o conjunto de teste. . . . . . . . . . . . . . 121

6.9 Serie Random Walk (linha solida) e a previsao gerada pelo Sistema HıbridoAG+RNA (linha tracejada), REDE 1 da arquitetura 3-1-1, para o conjuntode teste. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123

7.1 Esquema do Metodo TAEF proposto para a solucao do problema de pre-visao de series temporais . . . . . . . . . . . . . . . . . . . . . . . . . . . 128

7.2 Serie do mapa de Henon (linha solida) e a previsao (linha tracejada) geradapelo metodo TAEF para os ultimos 100 pontos do conjunto de teste. . . . 131

7.3 Serie das Manchas Solares (linha solida) e a previsao (linha tracejada)gerada pelo metodo TAEF para o conjunto de teste. . . . . . . . . . . . . 133

7.4 Serie Brilho de uma Estrela (linha solida) e a previsao (linha tracejada)gerada pelo metodo TAEF para o conjunto de teste. . . . . . . . . . . . . 134

7.5 Serie DJIA (linha solida) e a previsao (linha tracejada) gerada pelo metodoTAEF para o conjunto de teste. . . . . . . . . . . . . . . . . . . . . . . . 135

7.6 Serie DJIA (linha solida) e a previsao (linha tracejada) gerada pelo metodoTAEF para os ultimos 100 pontos do conjunto de teste. . . . . . . . . . . 136

7.7 Serie do Indice Nasdaq (linha solida) e a previsao (linha tracejada) geradapelo metodo TAEF para o conjunto de teste. . . . . . . . . . . . . . . . . 137

7.8 Serie do Indice Nasdaq (linha solida) e a previsao (linha tracejada) geradapelo metodo TAEF para os ultimos 100 pontos do conjunto de teste. . . . 137

7.9 Serie do Indice S&P500 (linha solida) e a previsao (linha tracejada) geradapelo metodo TAEF para o conjunto de teste. . . . . . . . . . . . . . . . . 139

7.10 Serie de Valor de Fechamento das Acoes da Petrobras (linha solida) e aprevisao (linha traceja) gerada pelo metodo TAEF para o conjunto de teste.140

7.11 Serie de Valor de Fechamento das Acoes da Petrobras (linha solida) e aprevisao gerada pelo metodo TAEF para os ultimos 100 pontos do conjuntode teste. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140

LISTA DE FIGURAS xix

7.12 Serie Random Walk (linha solida) e a previsao gerada pelo metodo TAEFpara o conjunto de teste. . . . . . . . . . . . . . . . . . . . . . . . . . . . 142

7.13 Procedimento de ajuste da fase da previsao gerada pelo metodo TAEF. . 145

7.14 Esquema do metodo TAEF com a inclusao do teste comportamental paraa determinacao da fase de previsao . . . . . . . . . . . . . . . . . . . . . 147

7.15 Serie do Mapa de Henon (linha solida) e as previsoes (linha tracejada)geradas pelo metodo TAEF para os ultimos 100 pontos do conjunto deteste. O grafico superior e referente a suposicao de previsao em fase e ografico inferior a suposicao de previsao fora de fase. . . . . . . . . . . . . 149

7.16 Serie das Manchas Solares (linha solida) e as previsoes (linha tracejada)geradas pelo metodo TAEF para o conjunto de teste. O grafico superiore referente a suposicao de previsao em fase e o grafico inferior a suposicaode previsao fora de fase. . . . . . . . . . . . . . . . . . . . . . . . . . . . 150

7.17 Serie de Medidas do Brilho de uma Estrela (linha solida) e as previsoes(linha tracejada) geradas pelo metodo TAEF para o conjunto de teste.O grafico superior e referente a suposicao de previsao em fase e o graficoinferior a suposicao de previsao fora de fase. . . . . . . . . . . . . . . . . 151

7.18 Serie do Indice DJIA (linha solida) e as previsoes (linha tracejada) geradaspelo metodo TAEF para o conjunto de teste. O grafico superior e referentea suposicao de previsao em fase e o grafico inferior a suposicao de previsaofora de fase. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152

7.19 Serie do Indice DJIA (linha solida) e as previsoes (linha tracejada) geradaspelo metodo TAEF para os ultimos 100 pontos do conjunto de teste. Ografico superior e referente a suposicao de previsao em fase e o graficoinferior a suposicao de previsao fora de fase. . . . . . . . . . . . . . . . . 153

7.20 Serie do Indice Nasdaq (linha solida) e as previsoes (linha tracejada) ge-radas pelo metodo TAEF para o conjunto de teste. O grafico superior ereferente a suposicao de previsao em fase e o grafico inferior a suposicaode previsao fora de fase. . . . . . . . . . . . . . . . . . . . . . . . . . . . 154

7.21 Serie do Indice Nasdaq (linha solida) e as previsoes (linha tracejada) gera-das pelo metodo TAEF para os ultimos 100 pontos do conjunto de teste.O grafico superior e referente a suposicao de previsao em fase e o graficoinferior a suposicao de previsao fora de fase. . . . . . . . . . . . . . . . . 155

7.22 Serie do Indice S&P500 (linha solida) e as previsoes (linha tracejada) ge-radas pelo metodo TAEF para o conjunto de teste. O grafico superior ereferente a suposicao de previsao em fase, e o grafico inferior referente asuposicao de previsao fora de fase. . . . . . . . . . . . . . . . . . . . . . . 157

LISTA DE FIGURAS xx

7.23 Serie da Petrobras (linha solida) e a previsao gerada pelo metodo TAEF(linha tracejada) para o conjunto de teste. O grafico superior e referente asuposicao de previsao em fase e o grafico inferior a suposicao de previsaofora de fase. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158

7.24 Serie da Petrobras (linha solida) e as previsoes geradas pelo metodo TAEF(linha tracejada) para os ultimos 100 pontos do conjunto de teste. O graficosuperior e referente a suposicao de previsao em fase e o grafico inferior ade previsao fora de fase. . . . . . . . . . . . . . . . . . . . . . . . . . . . 158

7.25 Serie Random Walk (linha solida) e a previsao gerada pelo metodo TAEF(linha tracejada) para o conjunto de teste. O grafico superior e referentea suposicao de previsao em fase e o grafico inferior a suposicao fora de fase. 160

8.1 Series Random Walk com drift. Para todas as figuras, hipoteses de previsaoem fase (grafico superior) e previsao fora de fase (grafico inferior). As linhassolidas sao os dados reais e as linhas tracejadas sao as previsoes. . . . . . 165

8.2 Series Random Walk com Sazonalidade Aditiva. Sao exibidas as hipotesede previsao em fase (grafico superior) e previsao fora de fase (grafico infe-rior) para os conjuntos de teste. As linhas solidas sao os dados reais e aslinhas tracejadas as previsoes. . . . . . . . . . . . . . . . . . . . . . . . . 167

8.3 Series Random Walk com Drift e Sazonalidade Aditiva. Sao exibidosgraficos na hipotese de previsao em fase (grafico superior) e fora de fase(grafico inferior) para os conjuntos de teste. As linhas solidas sao os dadosreais e as linhas tracejadas as previsoes. . . . . . . . . . . . . . . . . . . . 169

8.4 Famılia de Series Temporais geradas com os modelos GARCH. As figurasmostram graficos comparativos entre os dados reais (linhas solidas) e suasrespectivas previsoes (linhas tracejadas) para o conjunto de teste. . . . . 173

8.5 Famılia das Series dos Modelos SETAR. Em todas as figuras sao expostasa comparacao entre os dados reais (linhas solidas) e as previsoes (linhastracejadas) geradas para o conjunto de teste. O graficos superiores repre-sentam a suposicao de previsao em fase e os inferiores a previsao fora defase. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175

8.6 Graficos comparativos entre os valores reais (linha solida) da serie do mo-delo STAR e a previsao (linha tracejada) gerada pelo metodo TAEF. . . 177

9.1 Resultados das simulacoes de compra e venda de acoes com a utilizacaodo metodo TAEF (linha solida com pontos), modelos de Box & Jenkins(asteriscos) e a compra simples das acoes (linhas solida). . . . . . . . . . 185

LISTA DE FIGURAS xxi



9.4 Valor do retorno acumulado percentual versus o Fator de Risco para asoperacoes de compra e venda: metodo TAEF (©) e modelos de Box &Jenkins (∗). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 188

LISTA DE TABELAS

4.1 Valores tıpicos e algumas estatısticas da serie do mapa de Henon utilizada. 53

4.2 Valores tıpicos e algumas estatısticas da serie das Manchas Solares (Sunspots). 55

4.3 Valores tıpicos e algumas estatısticas da serie de Medidas de Brilho de umaEstrela. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57

4.4 Valores tıpicos e algumas estatısticas da serie do Indice Dow Jones Indus-trial Average. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60

4.5 Valores tıpicos e algumas estatısticas da serie do Indice Nasdaq. . . . . . 60

4.6 Valores tıpicos e algumas estatısticas da serie do Indice S&P500. . . . . . 63

4.7 Valores tıpicos e algumas estatısticas da serie do Valor de Fechamento daAcoes da Petrobras. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65

4.8 Valores tıpicos e algumas estatısticas da serie artificial gerada pelo modelode Random Walk referente a Equacao (.). . . . . . . . . . . . . . . . . 67

5.1 Medidas de Desempenho de previsao para o modelo ARIMA(26,0,1) apli-cado a serie de Henon . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73

5.2 Medidas de Desempenho de previsao para o modelo ARIMA(9,0,1) apli-cado a serie das Manchas Solares. . . . . . . . . . . . . . . . . . . . . . . 74

5.3 Medidas de Desempenho de previsao para o modelo ARIMA(88,0,0) apli-cado a serie de Medidas do Brilho de uma Estrela. . . . . . . . . . . . . . 76

5.4 Medidas de Desempenho de previsao para o modelo ARIMA(1,0,1) apli-cado a serie do Indice Dow Jones Industrial Average (DJIA). . . . . . . . 78

5.5 Medidas de desempenho de previsao para o modelo ARIMA(44,0,1) apli-cado a serie do Indice Nasdaq. . . . . . . . . . . . . . . . . . . . . . . . . 78

5.6 Medidas de Desempenho de previsao para o modelo ARIMA(1,0,1) apli-cado a serie do Indice S&P500. . . . . . . . . . . . . . . . . . . . . . . . 80

5.7 Medidas de desempenho de previsao para o modelo ARIMA(2,0,1) aplicadoa serie do Valor de Fechamento das Acoes da Petrobras. . . . . . . . . . . 81

xxii

LISTA DE TABELAS xxiii

5.8 Medidas de desempenho de previsao para o modelo ARIMA(1,0,1) aplicadoa serie Random Walk. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83

5.9 Medias (x) e desvios padroes (σx) das medidas de desempenho relativas asdez inicializacoes das RNAs utilizadas para a previsao da serie do Mapade Henon . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85

5.10 Resultados experimentais (conjunto de teste) com os melhores modelos(Box & Jenkins e RNAs) para a serie de Henon. . . . . . . . . . . . . . . 86

5.11 Medias (x) e desvios padroes (σx) para as medidas de desempenho relativasas dez inicializacoes das RNAs utilizadas para a previsao da serie dasManchas Solares. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88

5.12 Resultados experimentais (conjunto de teste) com os melhores modelos(Box & Jenkins e RNAs) para a serie das Manchas Solares. . . . . . . . . 89

5.13 Medias (x) e desvios padroes (σx) das medidas de desempenho dos expe-rimentos com as RNAs para a previsao da serie de Medidas do Brilho deuma Estrela. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90

5.14 Resultados experimentais (conjunto de teste) com os melhores modelos(Box & Jenkins e RNAs) para a serie de medidas do brilho de uma estrela. 91

5.15 Medias (x) e desvios padroes (σx) para as medidas de desempenho relativasas dez inicializacoes das RNAs utilizadas para a previsao da serie DJIA. . 91

5.16 Resultados experimentais (conjunto de teste) com os melhores modelos(Box & Jenkins e RNAs) para a serie DJIA. . . . . . . . . . . . . . . . . 93

5.17 Medias (x) e desvios padroes (σx) para as medidas de desempenho relativasas dez inicializacoes das RNAs utilizadas para a previsao da serie do IndiceNasdaq. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93

5.18 Resultados experimentais (conjunto de teste) com os melhores modelos(Box & Jenkins e RNAs) para a serie do Indice Nasdaq. . . . . . . . . . . 94

5.19 Medias (x) e desvios padroes (σx) para as medidas de desempenho relativasas dez inicializacoes das RNAs utilizadas para a previsao da serie do IndiceS&P500 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95

5.20 Resultados experimentais (conjunto de teste) com os melhores modelos(Box & Jenkins e RNAs) para a serie do Indice S&P500. . . . . . . . . . 96

5.21 Medias (x) e desvios padroes (σx) das medidas de desempenho para as dezinicializacoes das RNAs utilizadas para a previsao da serie da Petrobras(PetreobrasON). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97

LISTA DE TABELAS xxiv

5.22 Resultados experimentais (conjunto de teste) com os melhores modelos(Box & Jenkins e RNAs) para a serie do Valor de Fechamento das Acoesda Petrobras. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99

5.23 Medias (x) e desvios padroes (σx) para as medidas de desempenho relativasas dez inicializacoes das RNAs para a previsao da serie Random Walk. . . 100

5.24 Resultados experimentais (conjunto de teste) com os melhores modelos(Box & Jenkins e RNAs) para a serie Random Walk. . . . . . . . . . . . 100

6.1 Resultados experimentais obtidos pelo melhor modelo do Sistema HıbridoAG+RNA para a serie do Mapa de Henon (RNA 4-5-1). . . . . . . . . . 111

6.2 Resultados experimentais (conjunto de teste) com os melhores modelos(Box & Jenkins, RNAs e AG+RNA) para a serie de Henon. . . . . . . . 112

6.3 Resultados experimentais obtidos pelo melhor modelo do Sistema HıbridoAG+RNA para a serie das Manchas Solares (RNA 3-1-1). . . . . . . . . 113

6.4 Resultados experimentais (conjunto de teste) com os melhores modelos(Box & Jenkins, RNAs e AG+RNA) para a series das Manchas Solares. . 114

6.5 Resultados experimentais obtidos pelo melhor modelo do Sistema HıbridoAG+RNA para a serie de Medidas de Brilhos de uma Estrela (RNA 3-1-1). 114

6.6 Resultados experimentais (conjunto de teste) com os melhores modelos(Box & Jenkins, RNAs e AG+RNA) para a serie de Medidas do Brilho deuma Estrela. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115

6.7 Resultados experimentais obtidos pelo melhor modelo do Sistema HıbridoAG+RNA para a serie DJIA (RNA 3-10-1). . . . . . . . . . . . . . . . . 116

6.8 Resultados experimentais (conjunto de teste) com os melhores modelos(Box & Jenkins, RNAs e AG+RNA) para a serie DJIA. . . . . . . . . . . 117

6.9 Resultados experimentais obtidos pelo melhor modelo do Sistema HıbridoAG+RNA para a serie do Indice Nasdaq (RNA 3-5-1). . . . . . . . . . . 117

6.10 Resultados experimentais (conjunto de teste) com os melhores modelos(Box & Jenkins, RNAs e AG+RNA) para a serie do Indice Nasdaq. . . . 119

6.11 Resultados experimentais obtidos pelo melhor modelo do Sistema HıbridoAG+RNA para a serie do Indice S&P500 (RNA 3-5-1). . . . . . . . . . . 119

6.12 Resultados experimentais (conjunto de teste) com os melhores modelos(Box & Jenkins, RNAs e AG+RNA) para a serie do Indice S&P500. . . . 120

LISTA DE TABELAS xxv

6.13 Resultados experimentais obtidos pelo melhor modelo do Sistema HıbridoAG+RNA para a serie do Valor de Fechamento das Acoes da Petrobras(RNA 3-10-1). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121

6.14 Resultados experimentais (conjunto de teste) com os melhores modelos(Box & Jenkins, RNAs e AG+RNA) para a serie do Valor de Fechamentodas Acoes da Petrobras. . . . . . . . . . . . . . . . . . . . . . . . . . . . 122

6.15 Resultados experimentais obtidos pelo melhor modelo do Sistema HıbridoAG+RNA para a serie Random Walk (RNA 3-10-1). . . . . . . . . . . . 122

6.16 Resultados experimentais (conjunto de teste) com os melhores modelos(Box & Jenkins, RNAs e AG+RNA) para a serie Random Walk. . . . . . 124

7.1 Resultados experimentais para a serie do Mapa de Henon — metodo TAEF.131

7.2 Resultados experimentais (conjunto de teste) com os melhores modelos(Box & Jenkins, RNAs, AG+RNA e TAEF) para a serie do Mapa de Henon.131

7.3 Resultados experimentais para a serie das Manchas Solares — metodo TAEF.132

7.4 Resultados experimentais (conjunto de teste) com os melhores modelos(Box & Jenkins, RNAs, AG+RNA e TAEF) para a series das ManchasSolares. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132

7.5 Resultados experimentais para a serie de Medidas do Brilho de uma Estrela— metodo TAEF. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133

7.6 Resultados experimentais (conjunto de teste) com os melhores modelos(Box & Jenkins, RNAs, AG+RNA e TAEF) para a serie de medidas dobrilho de uma estrela. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134

7.7 Resultados experimentais para a serie do Indice DJIA — metodo TAEF. 134

7.8 Resultados experimentais (conjunto de teste) com os melhores modelos(Box & Jenkins, RNAs, AG+RNA e TAEF) para a serie do Indice DJIA. 135

7.9 Resultados experimentais para a serie do Indice Nasdaq — o metodo TAEF.136

7.10 Resultados experimentais (conjunto de teste) com os melhores modelos(Box & Jenkins, RNAs, AG+RNA e TAEF) para a serie do Indice Nasdaq. 137

7.11 Resultados experimentais para a serie do Indice S&P500 — o Metodo TAEF.138

7.12 Resultados experimentais (conjunto de teste) com os melhores modelos(Box & Jenkins, RNAs, AG+RNA e TAEF) para a serie do Indice S&P500.138

7.13 Resultados experimentais para a serie do Valor de Fechamento das Acoesda Petrobras — metodo TAEF. . . . . . . . . . . . . . . . . . . . . . . . 139

LISTA DE TABELAS xxvi

7.14 Resultados experimentais (conjunto de teste) com os melhores modelos(Box & Jenkins, RNAs, AG+RNA e TAEF) para a serie do Valor deFechamento das Acoes da Petrobras. . . . . . . . . . . . . . . . . . . . . 140

7.15 Resultados experimentais para a serie Random Walk — metodo TAEF. . 141

7.16 Resultados experimentais (conjunto de teste) com os melhores modelos(Box & Jenkins, RNAs, AG+RNA e TAEF) para a serie Random Walk. . 141

7.17 Metodologias mais adequadas para cada serie temporal estudada. . . . . 142

7.18 Resultados experimentais para a serie do Mapa de Henon com as RNAs eo metodo TAEF na suposicao em fase e fora de fase para o conjunto deteste. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148

7.19 Resultados experimentais para a serie das Manchas Solares com as RNAse o metodo TAEF na suposicao em fase e fora de fase para o conjunto deteste. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149

7.20 Resultados para a serie de Medidas do Brilho de uma Estrela com as RNAse o metodo TAEF na suposicao em fase e fora de fase para o conjunto deteste. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 150

7.21 Resultados experimentais para a serie do Indice DJIA com as RNAs eo metodo TAEF na suposicao de previsao em fase e fora de fase para oconjunto de teste. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152

7.22 Resultados experimentais para a serie do Indice Nasdaq com as RNAs e ometodo TAEF na suposicao em fase e fora de fase fase para o conjunto deteste. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154

7.23 Resultados experimentais para a serie do Indice S&P500 com as RNAs eo metodo TAEF nas suposicoes de previsao em fase e fora de fase para oconjunto de teste. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156

7.24 Resultados experimentais para a serie da Petrobras com as RNAs e ometodo TAEF nas suposicoes de previsao em fase e fora de fase para oconjunto de teste. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157

7.25 Resultados experimentais para a serie Random Walk com as RNAs e ometodo TAEF nas suposicoes de previsao em fase e fora de fase para oconjunto de teste. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159

8.1 Configuracoes escolhidas pelo metodo TAEF para a famılia de series dotipo Random Walk com drift. . . . . . . . . . . . . . . . . . . . . . . . . 164

8.2 Resultados experimentais para as series da famılia de Random Walk comdrift. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164

LISTA DE TABELAS xxvii

8.3 Configuracoes alcancadas pelo metodo TAEF para a famılia de Series Ran-dom Walk com Sazonalidade Aditiva. . . . . . . . . . . . . . . . . . . . . 166

8.4 Resultados obtidos pelo metodo TAEF para a famılia de Series RandomWalk com Sazonalidade Aditiva. . . . . . . . . . . . . . . . . . . . . . . . 166

8.5 Configuracoes alcancadas pelo metodo TAEF para a famılia de Series Ran-dom Walk com Drift (θ = 0.8) e Sazonalidade Aditiva. . . . . . . . . . . 168

8.6 Resultados obtidos pelo metodo TAEF para o conjunto de teste das seriesda famılia Random Walk com Drift e Sazonalidade aditiva. . . . . . . . . 168

8.7 Configuracoes alcancadas pelo metodo TAEF para a famılia de Series dosModelos GARCH. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171

8.8 Resultados para as medidas de desempenho alcancados pelo metodo TAEFpara a famılia de Series dos Modelos GARCH. . . . . . . . . . . . . . . . 172

8.9 Configuracoes alcancadas pelo Metodo TAEF para a famılia de Series dosModelos SETAR. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 174

8.10 Resultados obtidos pelo metodo TAEF para a famılia das Series dos Mo-delos SETAR para os respectivos conjuntos de teste. . . . . . . . . . . . . 175

8.11 Resultados experimentais obtidos pelo metodo TAEF para a Serie do Mo-delo STAR para o conjunto de teste. . . . . . . . . . . . . . . . . . . . . 177

9.1 Quadro das Acoes utilizadas na composicao da Carteira de Tıtulos. . . . 181

9.2 Quadro com os erros MAPE para cada um dos tıtulos utilizados na Carteira.184

C.1 Parametros auto-regressivos selecionados para o modelo ARIMA(26,0,1)referentes a serie do Mapa de Henon, devendo ser lidos da esquerda paraa direita, linha a linha, do coeficiente 1 ao 26. . . . . . . . . . . . . . . . 204

C.2 Parametros auto-regressivos selecionados para o modelo ARIMA(9,0,1) re-ferentes a serie das Manchas Solares, devendo ser lidos da esquerda para adireita, linha a linha, do coeficiente 1 ao 9. . . . . . . . . . . . . . . . . . 205

C.3 Parametros auto-regressivos selecionados para o modelo ARIMA(88,0,0)referentes a serie de Medidas de Brilho de uma Estrela, devendo ser lidosda esquerda para a direita, linha a linha, do coeficiente 1 ao 88. . . . . . 205

C.4 Coeficientes auto-regressivos selecionados para o modelo ARIMA(44,0,1)referentes a serie do Indice Nasdaq, devendo ser lidos da esquerda para adireita, linha a linha, do coeficiente 1 ao 44. . . . . . . . . . . . . . . . . 206

LISTA DE TABELAS xxviii

D.1 Resultados experimentais para a previsao da serie do mapa de Henon utili-zando RNAs. Para todas as medidas de desempenho sao calculadas as suasmedias (x), desvios padroes (σx) e intervalos de confianca com um erro de1% (limite inferior – Conf−; e limite superior – Conf+). Em negrito edestacada a melhor inicializacao. . . . . . . . . . . . . . . . . . . . . . . 208

D.2 Resultados experimentais para a previsao da serie das Manchas Solaresutilizando RNAs. Para todas as medidas de desempenho sao calculadasas suas medias (x), desvios padroes (σx) e intervalos de confianca comum erro de 1% (limite inferior – Conf−; e limite superior – Conf+). Emnegrito e destacada a melhor inicializacao. . . . . . . . . . . . . . . . . . 209

D.3 Resultados experimentais para a previsao da serie de Medidas de Brilhosde uma Estrela utilizando RNAs. Para todas as medidas de desempenhosao calculadas as suas medias (x), desvios padroes (σx) e intervalos deconfianca com um erro de 1% (limite inferior – Conf−; e limite superior –Conf+). Em negrito e destacada a melhor inicializacao. . . . . . . . . . . 210

D.4 Resultados experimentais para a previsao da serie do Indice Dow JonesIndustrial Average utilizando RNAs. Para todas as medidas de desem-penho sao calculadas as suas medias (x), desvios padroes (σx) e intervalosde confianca com um erro de 1% (limite inferior – Conf−; e limite superior– Conf+). Em negrito e destacada a melhor inicializacao. . . . . . . . . . 211

D.5 Resultados experimentais para a previsao da serie do Indice Nasdaq utili-zando RNAs. Para todas as medidas de desempenho sao calculadas as suasmedias (x), desvios padroes (σx) e intervalos de confianca com um erro de1% (limite inferior – Conf−; e limite superior – Conf+). Em negrito edestacada a melhor inicializacao. . . . . . . . . . . . . . . . . . . . . . . 212

D.6 Resultados experimentais para a previsao da serie do Indice S&P500 utili-zando RNAs. Para todas as medidas de desempenho sao calculadas as suasmedias (x), desvios padroes (σx) e intervalos de confianca com um erro de1% (limite inferior – Conf−; e limite superior – Conf+). Em negrito edestacada a melhor inicializacao. . . . . . . . . . . . . . . . . . . . . . . 213

D.7 Resultados experimentais para a previsao da serie do Valor de Fechamentodas Acoes da Petrobras utilizando RNAs. Para todas as medidas de desem-penho sao calculadas as suas medias (x), desvios padroes (σx) e intervalosde confianca com um erro de 1% (limite inferior – Conf−; e limite superior– Conf+). Em negrito e destacada a melhor inicializacao. . . . . . . . . . 214

D.8 Resultados experimentais para a previsao da serie Random Walk utili-zando RNAs. Para todas as medidas de desempenho sao calculadas assuas medias (x), desvios padroes (σx) e intervalos de confianca com umerro de 1% (limite inferior – Conf−; e limite superior – Conf+). Emnegrito e destacada a melhor inicializacao. . . . . . . . . . . . . . . . . . 215

LISTA DE ABREVIATURAS, SIGLAS E SIMBOLOS

Siglas Descricaox Valor medio de xσx Desvio padrao de x∆d Operador de diferencas de ordem dδ(x) Funcao degrauΦ(B) Operador auto-regressivo estacionarioφkk Funcao de Auto-correlacao parcial de ordem k por kγj Auto-Correlacao com atraso jρj Funcao de auto-correlacao normalizada para a ordem jΘ(B) Operador de medias moveis estacionarioAELB Modelo estatıstico de Alisamento Exponencial Biparametrico de HoltAELB Modelo estatıstico de Alisamento Exponencial Linear de BrowAES Modelo estatıstica de Alisamento Exponencial SimplesAIC Akaike Information Criteron — Criterio de informacao de AkaikeAG Algoritmo geneticoAR(p) Autoregressive — Modelo estatıstico auto-regressivo de ordem pARCH(p, q) Autoregressive Conditional Heteroskedasticity — Modelo auto-

regressivo condicional heterocedasticoARIMA(p, d, q) Autoregressive integrated Moving Average — Modelo misto auto-

regressivo integrado de medias moveis de ordem d, p e qARMA(p, q) Autoregressive Moving Average — Modelo misto auto-regressivo de

medias moveis de ordem p e qART Adaptive Resonant Theory — Modelo de redes neurais artificial ba-

seado na teoria ressonante adaptativaARV Average Relative Variance — Variancia relativa mediab1j bias dos neuronios intermediarios de uma rede neural

b2k bias dos neuronios de saıda de uma rede neural

B Operador de translacao para o passadoBIC Baysean Information Criterion — Criterio de informacao bayseanoBovespa Bolsa de Valores do Estado de Sao PauloCi Cromossomo i em um algoritmo geneticoCont Quantidade de iteracoes do metodo TAEFCV Crescimento do erro de Validacaod Dimensao do espaco de fase gerador de uma serie temporal

DJIA Dow Jones Industrial Average — Indice medio Dow Jones IndustrialFA Modelo estatıstico de Filtragem Adaptativa

Continua na proxima pagina

xxix

LISTA DE ABREVIATURAS, SIGLAS E SIMBOLOS xxx

Siglas DescricaoFAC Funcao de auto-correlacaoFACP Funcao de auto-correlacao parcialFitmin Quantidade mınima de fitness a ser alcancada pelo metodo TAEFfitness Funcao de custo ou adaptacao de um algoritmo geneticoGARCH(p, q) General Autoregressive Conditional Heteroskedasticity — Modelo

auto-regressivo condicional heterocedastico geralGGBR4 Codigo da Bovespa para acoes da empresa GerdauIA Inteligencia ArtificialLag Retardo TemporalMA(q) Moving Average — Modelo de medias moveis de ordem qMCj Cromossomo mutacionado j em um algoritmo geneticoMLP Multi-Layer Perceptron — Perceptron de Multi-CamadasMSE Mean Square Error — Erro medio quadraticoMAPE Mean Absolute Percentual Error — Erro medio percentual absolutoMMS Modelo estatıstica de Medias Moveis SimplesNhmax Quantidade maxima de neuronios escondidos em uma rede neuralnin Quantidade de neuronios na camada de entrada da rede neuralnh Quantidade de neuronios na camada escondida da rede neuralnV ar Quantidade de genes que compoem o cromossomo de um indivıduo

pertencente a uma populacao de um algoritmo geneticoNasdaq National Association of Securities Dealers Automated QuotationP Populacao de um algoritmo geneticopi Indivıduo de uma populacao de um algoritmo geneticopi

max Valor maximo assumido por um gene do indivıduo i pertencente auma populacao de um algoritmo genetico

pimin Valor mınimo assumido por um gene do indivıduo i pertencente a

uma populacao de um algoritmo geneticoPETR4 Codigo da Bovespa para acoes da PetrobrasPOCID Prediction On Change In Direction — Erro percentual para a pre-

visao da tendencia instantaneaPT Progresso de Treinamentoqi Probabilidade de selecao de um indivıduo i em um algoritmo geneticoqi Probabilidade acumulada de um indivıduo i em um algoritmo

geneticoRmax Quantidade maxima de retardos temporaisrt Termo de ruıdo no instante tS1

j Chaves das conexoes em uma rede neural dos bias para os neuroniosda camada intermediaria

Continua na proxima pagina

LISTA DE ABREVIATURAS, SIGLAS E SIMBOLOS xxxi

Siglas DescricaoS2

k Chaves das conexoes em uma rede neural do bias para o neuronio dacamada de saıda

S1ij Chaves das conexoes em uma rede neural da camada de entrada para

a camada intermediariaS2

jk Chaves das conexoes em uma rede neural da camada intermediariapara a camada de saıda

S&P500 Standard & Poor 500 — Indice ponderado de valores de mercado das500 acoes mais negociadas no New York Stock Exchange, no AmericanStock Exchange e no Nasdaq National Market System

SETAR Self-Excited Threshold Autoregressive — Modelo estatıstico de limiarauto-regressivo auto-excitado

SHI Sistema Hıbrido InteligenteSig Funcao sigmoide logısticaSTAR Smooth Threshold Autoregressive — Modelo estatıstico de limiar

suave auto-regressivoTAEF Time-lag Added Evolutionary Forecasting Method — Metodo de Pre-

visao com adicao evolutiva de retardos temporaisTamPop Cardinalidade da populacao de um algoritmo geneticoTAR Threshold Autoregressive — Modelo estatıstico de limiar auto-

regressivoTheil Estatıstica U de TheilUNIP6 Codigo da Bovespa para acoes da UniparUSIM5 Codigo da Bovespa para acoes da UsiminasVALE5 Codigo da Bovespa para acoes da Vale do Rio DoceWij Pesos das conexoes de uma rede neural da camada de entrada para

a camada intermediariaWjk Pesos das conexoes de uma rede neural da camada intermediaria para

a camada de saıdayk(t) k-esima saıda de uma rede neural no instante tZt Ponto do instante t da serie temporal discreta Z

Zt Ponto do instante t da serie temporal discreta com media nulaZ(t) Ponto do instante t da serie temporal contınua Z

CAPITULO 1

INTRODUCAO

Neste Capıtulo inicial e realizada uma pequena introducao ao problema abordado: a

previsao de series temporais, com a possibilidade da criacao de um sistema de apoio da

tomada de decisao. Logo apos a introducao e exibida a estrutura dos capıtulos subsequen-

tes desta tese.

1.1 INTRODUCAO

Previsao e um elemento chave na tomada de decisao. Tal afirmativa nao e surpreendente

uma vez que qualquer decisao depende fortemente dos eventos que a antecedem.

A habilidade de prever comportamentos futuros em eventos de interesse tem como

meta apoiar o planejamento de futuras acoes, maximizando os ganhos e minimizando

as perdas. Por essa razao, sistemas de gerenciamento para planejamento e controle de

operacoes tem tipicamente uma funcao de previsao. Pode-se citar algumas situacoes

praticas onde ha a necessidade real de algum tipo de sistema de previsao no suporte aos

processos de tomada de decisao:

1. Planejamento da Producao: Para o bom projeto da manufatura de uma linha

de producao e necessario uma previsao das vendas de cada item para um certo

numero de meses no futuro;

2. Planejamento Financeiro: Um gerenciamento financeiro tem como interesse o

padrao de fluxo monetario que uma companhia experimentara em um certo intervalo

de tempo. Deseja-se, portanto, a previsao do cenario monetario para um futuro

proximo;

3. Gerenciamento de Estoque: O controle de estoque de pecas compradas para a

manutencao de uma aeronave, por exemplo, necessita de uma estimativa da taxa de

uso de cada peca, e em adicao, uma estimativa do erro de previsao sobre o tempo

decorrido para se estabelecer novas compras;

1

1.1 INTRODUCAO 2

4. Escalonamento de Pessoal: O administrador de um ponto dos correios, por

exemplo, necessita de uma previsao horaria do volume e mistura de correspondencias

a serem processadas para executar um escalonamento de pessoal de forma eficiente.

De forma geral, os processos de previsoes sao erroneos e a magnitude desses erros

depende do sistema utilizado para a previsao. Quanto maior a quantidade de recursos

aplicados para o desenvolvimento de modelos de previsao maior e a precisao alcancada,

eliminando perdas, resultantes de incertezas, no processo de tomada de decisao. Entre-

tanto, o ganho alcancado nem sempre cresce na mesma escala dos custos. Na Figura 1.1

e ilustrado o conceito do aumento de precisao em um processo de previsao versos o custo

associado. O custo total do sistema sera a soma de todos os custos, relativos a previsao e

relativos as incertezas (ou erros) da previsao. Esperar-se que em um determinado ponto

da curva de custo total seja identificado um mınimo, produzindo um ponto otimo de

trabalho.

Figura 1.1: Grafico ilustrativo do custo versus o benefıcio na previsao em relacao aoaumento da precisao em um processo de previsao

Devido ao processo de previsao nao eliminar totalmente o risco, e necessario que

a tomada de decisao considere explicitamente a incerteza da previsao, ponderando os

resultados obtidos a partir dos modelos de previsao da seguinte maneira:

Decisao Atual = Decisao assumindo que a previsao esta correta +

Compensacao devido ao erro da previsao.

Este fato implica que um sistema de previsao poderia prover uma descricao para o erro

de previsao tao bem quanto a propria previsao. Idealmente, o processo de previsao poderia

1.1 INTRODUCAO 3

resultar em uma estimativa da distribuicao de probabilidade da variavel de interesse,

permitindo que o risco seja objetivamente incorporado ao processo de tomada de decisao.

Muitos fatores influenciam o nıvel de detalhes da previsao: disponibilidade dos da-

dos, precisao alcancavel, custo de analise, dentre outros. Em situacoes onde a escolha

apropriada das variaveis nao e clara, pode-se tentar algumas combinacoes possıveis a par-

tir de estudos que explicitem quais variaveis apresentam um maior grau de correlacao,

escolhendo aquele conjunto de variaveis que alcance o melhor desempenho1.

Uma segunda classe de decisoes importantes envolve os tres elementos temporais: o

perıodo da previsao, o horizonte da previsao e o intervalo da previsao. O perıodo da

previsao e a unidade basica de tempo na qual as previsoes sao realizadas. Por exemplo,

deseja-se prever a demanda por semana, neste caso o perıodo e uma semana. O horizonte

da previsao corresponde ao numero de perıodos cobertos, no futuro, pela previsao. Desta

forma, pode-se requerer uma previsao para as proximas dez semanas, com uma analise

semanal. Sendo o horizonte da previsao igual a dez semanas e o perıodo da previsao

igual a uma semana. Finalmente o intervalo da previsao e a frequencia com a qual novas

previsoes sao preparadas.

Frequentemente, o intervalo da previsao e igual ao perıodo, desta forma as previsoes

sao revisadas a cada perıodo. Se o horizonte tem sempre o mesmo comprimento, digamos

T perıodos, e a previsao e revisada a cada perıodo, diz-se que a operacao tem uma base

de horizonte movel.

Um terceiro aspecto para a definicao do problema e a forma requerida da previsao. E

conveniente conceber a variavel de interesse como uma variavel aleatoria com uma distri-

buicao de probabilidades desconhecida. O problema da tomada de decisao pode requerer

uma estimativa de alguma caracterıstica desta distribuicao de probabilidades, tal como a

media, mediana ou valor mais provavel, ou ainda, como medida de incerteza, estimativas

do desvio padrao, percentuais, ou um intervalo contendo uma alta probabilidade de um

determinado valor ocorrer.

Um outro aspecto importante a considerar e a disponibilidade de dados historicos

sobre o problema. A precisao e a representatividade estatıstica de tais dados sao essenciais

para o sucesso da previsao.

A partir destas definicoes, com a utilizacao de metodos estatısticos convencionais, os

1Processo tipicamente realizado durante o desenvolvimento de sistemas de previsao atraves de si-mulacoes de dados historicos.

1.1 INTRODUCAO 4

procedimentos de previsao de series temporais podem ser divididos, de forma generica,

em duas grandes categorias:

1. Automaticos, que sao aplicados diretamente aos dados historicos do

fenomeno, a partir do desenvolvimento e a implementacao de programas sim-

ples de computador;

2. Nao-Automaticos, que exigem a intervencao de pessoal especializado,

para serem aplicados, mantidos e analisados.

Tanto os modelos ditos automaticos com os nao-automaticos aplicados ao problema

de previsao se baseiam em dados historicos de algum processo ou fenomeno. Esses dados

historicos sao comumente chamados de series temporais. Uma serie temporal e uma

sequencia de observacoes ordenadas no tempo que descreve o comportamento cronologico

de um determinado fenomeno. De forma pratica, as series temporais sao utilizadas para

o estudo de sistemas dinamicos em quatro grandes areas [1]:

1. Previsao de Series Temporais - a previsao de valores futuros a partir de valores

do presente e do passado;

2. Determinacao de Funcoes de Transferencia - a determinacao da dinamica de

modelos de mapeamento de entrada-saıda, que mostra quais os efeitos na saıda de

um sistema segundo uma serie de entradas aplicadas;

3. Analise de Efeitos Nao-Usuais de Intervencao em Sistemas - uso de variaveis

de entradas indicadoras externas (variaveis exogenas) em modelos de funcoes de

transferencia para a representacao e acesso a eventos de intervencoes nao-usuais no

comportamento de uma serie temporal;

4. Controle de Sistemas - a partir da monitoracao de variaveis chaves de um pro-

cesso, pode-se construir um sistema para a predicao dos seus possıveis comporta-

mentos futuros, determinando-se as condicoes otimas para a realizacao do processo.

O foco desta Tese esta contido no primeiro ıtem da lista apresentada — previsao de

series temporais — com a aplicacao de tecnicas inteligentes para a construcao de modelos

de previsao, que, a partir de valores do passado de um certo fenomeno, tenta construir

os seus valores futuros, dando indıcios de quais decisoes devem ser tomadas no presente.

1.2 MOTIVACAO, JUSTIFICATIVA E OBJETIVOS 5

1.2 MOTIVACAO, JUSTIFICATIVA E OBJETIVOS

Grandes esforcos sao realizados na esperanca da determinacao dos acontecimentos futuros

a partir de dados do presente e passado. De forma generica, a estatıstica e o ramo da

ciencia que vem trabalho sistematicamente na elaboracao de modelos para a previsao

de acontecimentos baseados na analise cronologia de um determinado fenomeno e suas

respectivas interacoes com o meio.

Varios modelos estatısticos ja foram propostos. Dentre todos, os modelos de Box &

Jenkins, conhecidos como modelos ARIMA [1], sao os mais difundidos tanto no meio

academico como no meio pratico, principalmente em aplicacoes economicas e financeiras

(bolsas de valores, mercados financeiros, etc).

Os modelos de Box & Jenkins sao muito bem entendidos, porem sao modelos lineares,

o que pode vir a ser um fator limitante se o fenomeno em estudo for governado por

leis de relacionamentos nao-lineares. Neste sentido, varios outros modelos nao-lineares

tambem estatıstico sao propostos, como por exemplo, os modelos bilineares (bilinear

models) [2], os modelos auto-regressivos exponenciais (exponential autoregressive models)

[3], os modelos de limiar auto-regressivo (threshold autoregressive models) [4], os modelos

de estados dependentes (general state dependent models) [5], os modelos auto-regressivos

de transicao suave [6], os modelos auto-regressivos com coeficientes dependentes do tempo

[6], os modelos heterocedasticos condicionais auto-regressivos (ARCH) [7] e os modelos

heterocedasticos condicionais auto-regressivos gerais (GARCH) [8], dentre outros.

Cada um destes modelos estatısticos nao-lineares citados tem suas vantagens e des-

vantagens, sendo aplicados a determinadas situacoes. Embora o objetivo principal da

inclusao da nao-linearidade nos modelos de previsao seja o aumento da capacidade de

descricao dos fenomenos nao-lineares, os resultados praticos com esses modelos, de forma

geral, ainda sao insatisfatorios, sendo comparaveis aos modelos lineares, como observou

De Gooijer e Kumar [6], que em 1992 com o seu artigo de revisao a respeito dos mode-

los nao-lineares, nao conseguiram evidencias claras em favor dos modelos nao-lineares,

quando comparados aos modelos lineares em termos de desempenho de previsao. Tal

situacao nao mudou de forma significativa ate os dias atuais, como relata Clements et

al [9].

Desta forma, na perspectiva de previsao, existe uma grande motivacao para a pesquisa

de modelos nao-lineares, como destaca a edicao especial do International Journal of Fore-

1.2 MOTIVACAO, JUSTIFICATIVA E OBJETIVOS 6

casting de abril/junho de 2004 – Forecasting Economic and Financial Time Series Using

Nonlinear Methods, onde e esperado que a sofisticacao dos testes, selecao e estimacao de

modelos nao-lineares venha a aperfeicoar o desempenho na previsao.

Neste cenario, a Inteligencia Artificial (IA) e vista como uma alternativa para a pre-

visao de series temporais, com metodos e procedimentos geralmente nao-lineares, e que

em termos praticos atuais nao apresentam tantas dificuldades tecnicas quando compa-

rada aos modelos estatısticos nao-lineares. Muitas tecnicas da IA podem ser aplicadas ao

problema de previsao, destacando-se na literatura as tecnicas [10–14],

• Redes Neurais Artificiais;

• Algoritmos Geneticos;

• Programacao Genetica;

• Sistemas de Logica difusa (fuzzy logic).

Muitos trabalhos atuais tambem exploram a combinacao destas tecnicas para a geracao

de solucoes otimizadas com a criacao de sistemas hıbridos inteligentes [15], compostos pela

combinacao de duas (ou mais) tecnica da IA de tal forma que o ponto forte de uma das

tecnicas compense o ponto fraco da outra.

Desta maneira, grandes esforcos ainda necessitam ser aplicados para o estudo e desen-

volvimento de modelos nao-lineares para a previsao de series temporais do mundo real.

Aliado a esta necessidade, a IA com suas tecnicas e algoritmos inteligentes, adaptativos

e evolucionarios apresenta-se com uma area ainda pouco explorada cientificamente na

analise e previsao de series temporais, gerando um campo a ser desbravado.

Neste sentido, e possıvel enumerar os principais objetivos desta Tese,

1. Estudo e analise dos modelos estatısticos lineares mais utilizados na pratica para a

previsao de series temporais, como os modelos de Box & Jenkins;

2. Criacao de um conjunto diversificado de series temporais artificiais e do mundo real

envolvendo tanto fenomenos naturais como fenomenos economicos-financeiros;

3. Estudo e analise das principais tecnicas da Inteligencia Artificial, em particular as

redes neurais artificiais do tipo MLP e os algoritmos geneticos, para a previsao de

series temporais;

1.3 ESTRUTURA DA TESE 7

4. Combinacao adequada de tecnicas de Inteligencia Artificial para a obtencao de um

sistema hıbrido inteligente aplicado ao problema de previsao;

5. Desenvolvimento de simulacoes de operacao de compra e venda de acoes em uma

bolsa de valores real com a utilizacao do metodo hıbrido desenvolvido visando a

criacao de um sistema de apoio a tomada de decisao baseado em previsao.

1.3 ESTRUTURA DA TESE

A estrutura apresentada nesta Tese e composta por dez capıtulos, sendo:

Capıtulo 1 - Introducao: neste primeiro capıtulo e realizada uma breve introducao

ao problema de previsao de series temporais abordado, com a definicao de alguns

termos e caracterısticas utilizadas em um processo generico de previsao;

Capıtulo 2 - O Problema de Previsao de Series Temporais: neste capıtulo e

definido o problema de previsao de series temporais. A partir desta definicao sao

expostos os modelos estatısticos de Box & Jenkins (modelos lineares) e os modelos

estatısticos nao-lineares mais encontrados na literatura para a previsao de series

temporais;

Capıtulo 3 - Abordagens da Inteligencia Artificial para Previsao de Series

Temporais: neste capıtulo sao exibidas as tecnicas da inteligencia artificial mais

populares para a previsao de series temporais: as Redes Neurais Artificiais (RNAs)

e os Algoritmos Geneticos (AGs), expondo os fundamentos basicos de forma a gerar

condicoes suficientes para o entendimento da utilizacao de cada uma dessas tecnicas

a aplicacoes de previsao. A combinacao de tecnicas inteligentes para a criacao de

sistemas hıbridos inteligentes tambem e discutida;

Capıtulo 4 - Caracterizacao das Series Temporais Utilizadas: neste capıtulo

sao mostradas as series temporais utilizadas como estudos de casos. Para cada uma

das series sao discutidas suas caracterısticas e estruturas de correlacoes entre seus

dados, fornecendo subsıdios para a determinacao dos retardos temporais relevantes

a serem utilizados no processo de previsao;

Capıtulo 5 - Resultados Experimentais com Metodos Tradicionais: neste capı-

tulo sao apresentados os resultados experimentais obtidos com os modelos de Box &


Jenkins e com as Redes Neurais Artificiais do tipo Perceptron Multicamadas (MLP).

A partir destes experimentos e formada uma base de resultados que servirao como

parametros comparativos para os demais metodos propostos neste trabalho;

Capıtulo 6 - Combinacao de Redes Neurais Artificiais e Algoritmos Geneticos

para a Previsao de Series Temporais: neste capıtulo e realizado o desenvol-

vimento de uma primeira tentativa hıbrida inteligente para a geracao de modelos

para a previsao de series temporais;

Capıtulo 7 - Um Novo Metodo Hıbrido Inteligente para a Previsao de Series

Temporais: neste capıtulo e proposta uma nova metodologia a ser aplicada ao

problema de previsao de series temporais — The Time-delay Added Evolutionary

Forecasting Method (Metodo TAEF) — composto por um sistema hıbrido resul-

tante da combinacao de RNAs e o Algoritmo Genetico Modificado, um processo

de treinamento hıbrido, uma busca evolutiva pelos retardos temporais relevantes

para cada series e um procedimento de ajuste de fase para a determinacao com-

portamental das series. Resultados experimentais para esta nova metodologia sao

apresentados;

Capıtulo 8 - Experimentos Adicionais com o Metodo TAEF: os experimentos

realizados no Capıtulo 7 com o Metodo TAEF utilizam as series temporais expostas

no Capıtulo 4. Entretanto, tais series, mesmo sendo no mundo real, nao apresentam

todas as caracterısticas que podem vir a existir em uma serie, tais como: tendencias,

variancia dependente do tempo, estruturas cıclicas nao-lineares, estruturas com

decaimento exponencial, dentre outras. Desta forma, este capıtulo apresenta um

novo grupo de series criadas artificialmente para o estudo mais aprofundado das

propriedades do Metodo TAEF, com uma analise das suas possıveis limitacoes;

Capıtulo 9 - Simulacao de Compra e Venda de Acoes: neste capıtulo e realizada

uma simulacao com a utilizacao do metodo TAEF para o procedimento de compra

e venda de acoes na bolsa de valores de Sao Paulo - Bovespa. Na simulacao, o

Metodo TAEF passa a administrar uma carteira de acoes indicando as intervencoes

de compra e venda baseado na previsao de cada um dos tıtulos contidos na carteira.

As simulacoes apresentadas tentam copiar um procedimento real de compra e venda

de acoes na Bovespa, tambem comparadas com simulacoes que utilizam os modelos

de Box & Jenkins sob as mesmas condicoes;


Capıtulo 10 - Conclusoes: neste capıtulo sao apresentadas as conclusoes dos proce-

dimentos, tecnicas e experimentos realizados. Uma discussao a respeito da nova

metodologia proposta e realizada, limitacoes do trabalho sao relacionadas e dis-

cutidas, e, por fim, propostas de novos trabalhos na mesma linha, com possıveis

ramificacoes do metodo TAEF, sao exibidas.

CAPITULO 2

O PROBLEMA DE PREVISAO DE SERIES

TEMPORAIS

Neste capıtulo e apresentada a descricao do problema de previsao de series temporais,

justificando-se a possibilidade da construcao de um espaco de fase, ou espaco de estados,

que possa reproduzir com fidelidade as estruturas encontradas nos dados das series.

Com a definicao do problema de previsao de series temporais, sao apresentados os

modelos convencionais, basicamente pertencentes ao ramo da estatıstica, tanto lineares

— como os modelos de Box & Jenkins— como varias abordagens nao-lineares encontradas

na literatura.

2.1 INTRODUCAO

Desde tempos remotos o homem tenta prever o futuro na esperanca de melhor se precaver

quanto as dificuldades que lhe esperam. Muitas tecnicas estatısticas tem sido elaboradas

para este fim, em grande maioria baseadas em metodos lineares. Entre os mais populares

encontrados na literatura, destacam-se os modelos de Box-Jenkins (ARIMA) [1] para a

previsao de series temporais.

Nas proximas secoes estara sendo apresentada uma definicao formal do que vem a

ser uma serie temporal e serao descritos alguns dos modelos mais populares aplicados ao

problema de previsao de series temporais desenvolvidos pela estatıstica.

2.2 SERIES TEMPORAIS

Uma serie temporal e uma sequencia de observacoes sobre uma variavel de interesse.

A variavel e observada em pontos temporais discretos, usualmente equidistantes, ou

contınuos. A analise deste comportamento temporal envolve a descricao do processo

ou fenomeno que gera a sequencia de observacoes.

10

2.3 PREVISAO DE SERIES TEMPORAIS 11

Uma serie temporal pode ser definida como,

Zt = {zt ∈ R | t = 1, 2, 3, . . . , N} (.)

onde t e um ındice cronologico (geralmente o tempo, mas nao obrigatoriamente) e N e o

numero total de observacoes.

Desta forma, estara sendo considerado que uma serie temporal Zt e uma sequencia de

observacoes pontuais, igualmente espacadas, ordenadas segundo um ındice cronologico t,

que sera chamado de tempo e definira a granularidade das observacoes.

2.3 PREVISAO DE SERIES TEMPORAIS

A ideia de se aplicar tecnicas de previsao na analise de series temporais tem como intuito

a identificacao de estruturas e padroes existentes em seus dados historicos e a construcao

de um determinado modelo capaz de gerar os proximos padroes temporais da serie.

Os modelos utilizados para a analise de series temporais podem, de forma bastante

generica, abordar o problema em dois domınios: domınio espectral e domınio tempo-

ral. Ambos os casos sao equivalentes. No domınio espectral procura-se pela correta

combinacao de frequencias para a determinacao do espectro da serie, e no domınio tem-

poral, pela escolha correta dos retardos temporais para a determinacao das estruturas

cronologicas da serie.

A abordagem do problema de previsao no domınio temporal e a forma mais popular

encontrada na literatura. A ideia basica e a analise de uma certa janela temporal do

passado e presente para a determinacao dos pontos no futuro. Essa janela temporal e

formada por um conjunto de pontos da serie que trazem consigo informacao suficiente para

a determinacao dos acontecimentos futuros. Estes pontos que compoem a janela temporal

sao chamados de retardos temporais (ou lags), podendo ser a princıpio quaisquer pontos

ja observados na serie.

Neste contexto, um fator primordial para um bom desempenho na previsao e a correta

escolha dos retardos temporais. Desta forma, tais retardos temporais, quando relevantes

a serie, irao gerar estruturas de relacionamento entre os dados historicos de tal maneira

a tornar possıvel a caracterizacao das leis que governam o fenomeno gerador da serie.

Tais estruturas de relacionamento dos dados constituem um espaco de fase d−dimensio-

2.3 PREVISAO DE SERIES TEMPORAIS 12

nal, onde d e a dimensao mınima capaz de representar tais relacionamentos. Desta forma,

um espaco de fase d -dimensional pode ser construıdo de tal modo que contenha toda a

informacao referente a uma serie temporal de interesse. F. Takens [16] no seu trabalho

intitulado “Turbulence in the Chaos” enunciou um conjunto de quatro teoremas que pro-

vam que se d e suficientemente grande, tal espaco de fase e homeomorfico ao espaco de

fase original que gerou a serie temporal.

Assim, os teoremas de Takens [16] sao, primeiramente, a justificativa teorica que

garante a possibilidade da construcao de um espaco de estados com a utilizacao dos

corretos retardos temporais e, de forma secundaria, tambem garante que se o espaco e

corretamente reconstruıdo, a dinamica deste e topologicamente identica a dinamica do

espaco de estados original. Os enunciados dos teoremas de Takens sao encontrados no

Apendice A.

O grande problema na reconstrucao do espaco de estados original e naturalmente a

escolha correta dos retardos temporais necessarios para a caracterizacao da dinamica do

sistema. Para estruturas de relacionamentos lineares entre os dados historicos, pode-se

aplicar as funcoes de auto-correlacao e auto-correlacao parcial [1] para a identificacao

das dependencias relevantes entre os dados. Tais funcoes sao comumente aplicadas em

conjunto com modelos lineares, como na construcao dos modelos de Box & Jenkins.

Entretanto, independentemente do modelo de previsao aplicado, linear ou nao-linear,

muitos outros metodos sao propostos na literatura para a definicao dos retardos temporais

relevantes [17–19]. Tais metodos sao baseados em calculos de probabilidades condicionais,

os quais consideram que a serie temporal e da forma,

Zt = f(zt−1, zt−2, . . . , zt−d) + rt (.)

onde f(zt−1, zt−2, . . . , zt−d) e uma funcao que realiza um possıvel mapeamento entre os

valores do passado e do futuro e rt e um termo de ruıdo. Em geral, rt decresce com o

incremento de d, e se o sistema for totalmente determinıstico, rt tende a zero quando

d excede a dimensao embutida mınima necessaria para a descricao do sistema. Estes

procedimentos almejam a obtencao dos pontos:

1. A dimensao embutida mınima, dmin;

2. A sensibilidade de Zt com respeito aos retardos temporais;

3. A estimativa do tamanho do ruıdo, rt.

2.4 MODELOS CONVENCIONAIS PARA PREVISAO DE SERIES TEMPORAIS 13

E possıvel citar alguns exemplos de teste que utilizam estes procedimentos para a

verificacao e determinacao dos retardos temporais relevantes, como: o BSD Test [17], a

analise de variaveis independentes [1], e o metodo δ-Test [18], dentre outros [19]. Contudo,

de forma geral, tais metodos sao formulados a partir de dependencias primarias entre as

variaveis, descartando-se as dependencias induzidas (ordem superior a 1), ou seja, se

f(Zt−1) = f(f(Zt−2)) (.)

Zt−1 e a dependencia primaria, e a dependencia induzida sobre Zt−2 nao e considerada.

Uma outra metodologia totalmente grafica aplicada a determinacao dos retardos tem-

porais relevantes, chamada por Donald B. Percival e Andrew T. Walden [20] de lagplot

ou de phase portrait por Holger Kantz e Thomas Schreiber [21], consiste simplesmente na

construcao de graficos de dispersao entre os retardos (Zt vs Zt−1, Zt vs Zt−2, Zt vs Zt−3,

. . .). A existencia de alguma relevancia para um dado retardo pode ser observada com o

aparecimento de alguma estrutura nestes graficos. Tal tecnica e bastante limitada uma

vez que depende da interpretacao humana dos graficos. Entretanto, a sua simplicidade e

um forte argumento para sua utilizacao, mesmo que apenas de forma estimativa.

2.4 MODELOS CONVENCIONAIS PARA PREVISAO DE SERIES TEMPORAIS

Para a realizacao de um processo de previsao de series temporais, de forma sistematica e

cientıfica, ha a necessidade de representar as caracterısticas da serie atraves de um modelo

matematico e/ou computacional que possa, de alguma forma, estimar tais caracterısticas

no futuro.

Na maioria dos casos, os modelos convencionais estatısticos sao desenvolvidos para

representarem os seguintes tipos de padroes de informacoes, ou uma combinacao destes [1]:

1. Constantes – Processamentos que permanecem constantes sobre um certo nıvel

todo o tempo, com variacoes de perıodo a perıodo devido a causas aleatorias;

2. Tendencias – Padroes com tendencias no nıvel dos processos, sendo a variacao de

um perıodo a outro atribuıda a uma tendencia mais uma variacao aleatoria;

3. Sazonalidades – Processos que variam ciclicamente no tempo, como em processos

periodicos, por exemplo: o clima;


4. Ciclos – Processos que apresentam um desvio cıclico em torno de sua tendencia

com um frequencia nao muito bem definida.

Embora os padroes descritos acima sejam os mais corriqueiros, algumas variacoes

podem ocorrer, com o aparecimento de padroes de transientes, impulsos, degraus, apare-

cimento subito de tendencias, dentre outras.

De forma geral, os modelos convencionais da estatıstica para a representacao de series

temporais sao baseados em funcoes temporais algebricas ou transcendentais, ou ainda

alguma composicao de ambas [22–24], podendo ser escritos de forma generica como,

Zt = b1f1(t) + b2f2(t) + · · ·+ bkfk(t) + rt (.)

onde bi e fi(t) (i = 1, 2, 3, . . . , k) sao parametros constantes e funcoes matematicas de t

respectivamente, e rt e uma componente aleatoria.

Contudo, ainda existem outras formas de modelagens, como por exemplo a corrente

observacao de Zt descrita como uma funcao das componentes aleatorias ordenadas tem-

poralmente, do presente para o passado: rt, rt−1, rt−2, . . .

Zt = m + y0rt + y1rt−1 + y2rt−2 + · · · + ykrt−k (.)

onde m e {yi} (i = 1, 2, 3, . . .,k) sao constantes. A Equacao (.) e comumente chamada

de “modelos de filtros lineares”.

A previsao de series temporais consiste na estimativa dos parametros desconhecidos

dos modelos apropriados para a sua descricao, com o intuito de projetar os valores futuros

da serie.

2.4.1 Modelos de Box & Jenkins

Na literatura e possıvel encontrar uma grande quantidade de modelos propostos para

a previsao de series temporais. A grande maioria destes modelos sao lineares, onde e

possıvel citar: Medias Moveis Simples (MMS) [23, 24], Alisamento Exponencial Simples

(AES) [23, 24], Alisamento Exponencial Linear de Brow (AELB) [23, 24], Alisamento

Exponencial Biparametrico de Holt (AEBH) [23,24], Filtragem Adaptativa (FA) [23,24],

dentre outros [1,22–24]. Entretanto, dentre estes modelos, uma classe recebe um destaque


especial, os modelos de Box & Jenkins [1], que de forma pratica sao os mais populares.

Box & Jenkins [1] propuseram uma famılia de modelos algebricos (chamados de mo-

delos ARIMA), onde a partir dos quais seleciona-se um modelo que melhor desempenhe a

previsao de uma dada serie temporal. O modelo ARIMA(p, d, q) (Autoregressive Integra-

ted Moving Average) e uma combinacao de outros modelos, o AR(p) (Autoregressive) [1]

e o MA(q) (Moving Average) [1], combinados com uma integracao de ordem d.

Um modelo ARIMA(p, d, q) e um estudo algebrico que mostra como uma variavel

de uma serie temporal (Zt) e relacionada com seus proprios valores passados (Zt−1, . . . ,

Zt−p) e os valores passados dos termos de ruıdo (rt−1, . . . , rt−q), diferenciados d vezes.

Box & Jenkins propuseram um procedimento pratico para encontrar um modelo ade-

quado para uma dada situacao, como esquematizado na Figura 2.1.

Figura 2.1: Estagios para a construcao de um modelo iterativo de Box e Jenkins.

No Estagio 1 da Figura 2.1, identificacao, usam-se dois dispositivos graficos para se

medir a correlacao entre as observacoes dentro de um conjunto de dados da serie temporal.

Estes dispositivos sao: a funcao de auto-correlacao e a funcao de correlacao parcial [1].

A partir destes escolhem-se possıveis modelos candidatos.

No Estagio 2 da Figura 2.1, estimacao, estimam-se os coeficientes do modelo escolhido

no estagio anterior.

No Estagio 3 da Figura 2.1, diagnostico, Box e Jenkins supuseram alguns procedimen-


tos de checagens para determinar se o modelo e estatisticamente adequado. Um modelo

que falhe nestes testes e rejeitado [1, 23].

Em geral, os modelos sao parcimoniosos, pois contem um numero pequeno de parametros

e as previsoes obtidas sao bastantes precisas, comparando-se com outros metodos lineares.

2.4.1.1 Modelos Auto-Regressivos de Ordem p

Um modelo auto-regressivo de ordem p (AR(p)) considera que um determinado ponto no

tempo t da serie e dependente de pontos passados mais um termo aleatorio, dado por,

Zt = φ1Zt−1 + φ2Zt−2 + · · ·+ φpZt−p + rt (.)

onde, sem perda de generalidade, foi subtraıdo o nıvel medio (µ) da serie,

Zk = Zk − µ (.)

e os temos φi (i = 1, 2, . . . , p) sao os coeficientes auto-regressivos.

Definindo o operador auto-regressivo estacionario de ordem p como,

Φ(B) = 1 − φ1B − φ2B2 − · · · − φpB

p (.)

onde a condicao de estacionariedade e |B| ≤ 1 (B e o operador Translacao para o passado

– BmZt = Zt−m), pode-se escrever a Equacao (.) como,

Φ(B)Zt = rt (.)

2.4.1.1.1 Funcao de Auto-Correlacao para o Modelo AR(p). A funcao de auto-correlacao

(FAC) de um processo AR(p) estacionario e encontrada multiplicando-se Zt−j com Zt,

ou seja,

Zt−jZt = φ1Zt−jZt−1 + · · ·+ φpZt−jZt−p + Zt−jrt (.)

Como o termo Zt−k (k = 1, 2, ..., p) so envolve ruıdos ate rt−k, nao correlacionados

com rt, o valor esperado E(Zt−jZt−k) = 0 se j > k. Logo, calculando-se o valor esperado

da Equacao (.),

γj = φ1γj−1 + φ2γj−2 + · · · + φpγj−p (.)


onde γj = E(Zt−jZt

). Dividindo-se todos os termos da equacao Equacao (.) por γ0,

que e a variancia de Z (V ar(Z)), obtem-se

ρj = φ1ρj−1 + φ2ρj−2 + · · · + φpρj−p, para j > 0 (.)

onde ρk = γk

γ0. Desta forma, e possıvel escrever a Equacao (.) (Funcao de Auto-

Correlacao normalizada para um modelo AR(p)) como,

Φ(B)ρj = 0 (.)

onde o operador B age sobre o ındice j. Pode-se mostrar [1] que a solucao geral da

Equacao (.) e escrita como,

ρj = A1Gj1 + A2G

j2 + · · ·+ ApG

jp (.)

Para situacoes estacionarias, ou seja, |Gi| < 1, e se as raızes forem distintas, duas

situacoes podem ocorrer:

1. Se Gi for real, o termo AiGji decai geometricamente para zero (amortecimento

exponencial);

2. Se Gi for complexa, um par de raızes complexas conjugadas contribui com um termo

da forma Adjsen(2πfj +φ) (senoide amortecida), onde f e uma frequencia, φ e uma

fase, e o termo Adj e a amplitude que decresce com o incremento de j (|d| < 1).

Portanto, a forma geral da funcao de auto-correlacao de um processo AR e constituıda

por uma mistura de exponenciais e senoides amortecidas, como mostrado na Figura 2.2.

As funcoes de auto-correlacao podem ser estimadas por,

rj =Cj

C0, j = 1, . . . , p − 1 (.)

onde

Ck =1

N

N−k∑

t=1

(Zt − Z

) (Zt+k − Z

), k = 0, 1, . . . , N − 1 (.)


Figura 2.2: Graficos tıpicos das FACs para um Modelo AR. (a) φ = 0.8 e (b) φ = −0.8.

sendo Ck e a funcao de auto-correlacao amostral e Z e a media amostral.

2.4.1.2 Modelos de Medias Moveis de Ordem q

Um processo de medias moveis de ordem q, chamado de MA(q) (Moving Average), e

caracterizado pela combinacao dos choques aleatorios ocorridos no passado, descrito por,

Zt = µ + rt − θ1rt−1 − · · · − θqrt−q. (.)

Utilizando o fato que Zt = Zt − µ, pode-se escrever,

Z = (1 − θ1B − θ2B2 − · · · − θqB

q)rt = Θ(B)at (.)

onde

Θ(B) = 1 − θ1B − θ2B2 − · · · − θqB

q (.)

e o operador de medias moveis.

2.4.1.2.1 Funcao de Auto-Correlacao para o Modelo MA(q). Da Equacao (.), a

funcao de Auto-correlacao (FAC) e calculada como,


γj = E{ZtZt−j} = E

([rt −

q∑

k=1

θkrt−k

][rt−j −

q∑

l=1

θlrt−j−l

])

= E(rtrt−j) −q∑

k=1

θkE(rt−jrt−k) −q∑

l=1

θlE(rtrt−j−l) +

q∑

k=1

q∑

l=1

θkθlE(rt−krt−j−l)

(.)

Lembrando que,

γr(j) = E(rtrt−j) =

{σ2

r , j = 0

0, j 6= 0(.)

e

γ0 = V ar(Zt) = σ2Z = (1 + θ2

1 + · · ·+ θ2q)σ

2a (.)

Pode-se organizar os ındices da Equacao (.), reescrevendo-a em termos de γr,

resultando em,

γj = γr(j) −q∑

k=1

θkγr(k − j) −q∑

l=1

θlγr(j + l) +

q∑

k=1

q∑

l=1

θkθlγr(j + l − k) (.)

levando a,

γj =

{(−θj +

∑q

l=1 θlθl+j)σ2r = (−θj + θ1θj+1 + θ2θj+2 + · · ·+ θqθq−j)σ

2r , j = 1, . . . , q

0, j > q

(.)

ou simplesmente,

ρj =

{−θj+θ1θj+1+θ2θj+2+···+θqθq−j

1+θ21+···+θ2

q, j = 1, . . . , q

0, j > q(.)

Observe que a funcao FAC de um processo MA(q) e igual a zero para retardos tem-

porais de ordem superior a q.


2.4.1.3 Modelos Mistos: Auto-Regressivos com Medias Moveis

Para muitas series encontradas na pratica, um modelo com o menor numero possıvel

de parametros e desejado (princıpio da parcimonidade). A inclusao de termos auto-

regressivos e de medias moveis em um unico modelo e uma possıvel solucao para a ob-

tencao de uma pequena quantidade de parametros. Desta uniao surgem os modelos

ARMA(p, q), da forma,

Zt = φ1Zt−1 + · · · + φpZt−p + rt − θ1rt−1 − · · · − θqrt−q. (.)

Sendo Φ(B) e Θ(B) os operadores auto-regressivos e de medias moveis, introduzidos

anteriormente, pode-se escrever a Equacao (.) em uma forma compacta,

Φ(B)Zt = Θ(B)rt (.)

2.4.1.3.1 Funcao de Auto-Correlacao (FAC). Multiplicando-se a Equacao (.) por

Zt−j e tomando-se o valor esperado tem-se,

γj = E(ZtZt−j) = E{(

φ1Zt−1 + · · ·+ φpZt−p + rt − θ1rt−1 − · · · − θqrt−q

)Zt−j

}

(.)

ou

γj = φ1γj−1 + φ2γj−2 + · · · + φpγj−p − θ1γZr(j − 1) − · · · − θqγZr(j − q) (.)

onde γZr(j) e a covariancia cruzada entre Zt e rt, definida por,

γZr(j) = E(rtZt−j) (.)

Como Zt−j so depende de choques rt ocorridos ate o instante t-j,

γZr(j) −→{

= 0, j > 0

6= 0, j ≤ 0(.)


de modo que,

γj = φ1γj−1 + φ2γj−2 + · · ·+ φpγj−p, j > q (.)

Desta forma, obtem-se,

ρj = φ1ρj−1 + φ2ρj−2 + · · ·+ φpρj−p, j > q (.)

deduzindo-se que as auto-correlacoes de retardos temporais 1, 2, . . . , q serao afetadas pelos

parametros de medias moveis, ja para j > q as mesmas comportam-se como nos modelos

auto-regressivos. Pode-se verificar [1] que se q < p a funcao de auto-correlacao consiste

de uma mistura de exponenciais e/ou senoides amortecidas, entretanto, se q ≥ p, os

primeiros q-p+1 valores ρ0, ρ1, . . . , ρq−p nao seguirao este padrao.

2.4.1.4 Funcao de Auto-Correlacao Parcial (FACP)

Alem das funcoes de auto-correlacao, Box & Jenkins [1] propuseram a utilizacao de um

outro instrumento para facilitar o procedimento de identificacao: a Funcao de Auto-

Correlacao Parcial (FACP).

Considere um modelo AR(k). Sendo φkj o j-esimo coeficiente auto-regressivo, de tal

modo que φkk seja o ultimo coeficiente, e possıvel escrever,

ρj = φk1ρj−1 + φk2ρj−2 + · · ·+ φkkρj−k, j = 1, . . . , k (.)

A partir da Equacao (.) e possıvel se obter a equacao de Yule-Walker [1],

1 ρ1 · · · ρk−1

ρ1 1 · · · ρk−2

...

ρk−1 ρk−2 · · · 1

φk1

φk2

...

φkk

=

ρ1

ρ2

...

ρk

(.)

Resolvendo este sistema de equacoes para k = 1, 2, . . ., obtem-se de forma geral,


φkk =|P ∗

k ||Pk|

(.)

onde Pk e a matriz de auto-correlacao e P ∗k e a matriz de auto-correlacao com a ultima

coluna substituıda pelo vetor de auto-correlacoes.

A quantidade φkk, encarada como uma funcao de k, e denominada de Funcao de Auto-

Correlacao Parcial (FACP). Pode-se demonstrar [1] que, para os processos ja vistos,

1. Um processo AR(p) tem FACP φkk 6= 0 para k ≤ p, e φkk = 0 para k > p;

2. Um processo MA(q) tem FACP que se comporta de maneira similar as FACs de um

processo AR(p), sao dominadas por exponenciais e/ou senoides amortecidas;

3. Um processo ARMA(p,q) tem FACP que se comporta como a FACP de um processo

MA(p) puro.

2.4.1.5 Modelos ARIMA

Os modelos apresentados ate o momento sao apropriados para a descricao de series esta-

cionarias, isto e, series que se desenvolvem no tempo ao redor de um nıvel constante.

Algumas series, que sao nao estacionarias, quando diferenciadas, tornam-se esta-

cionarias. Por exemplo, Zt na Equacao (.) e uma serie nao estacionaria, mas Wt

e uma serie estacionaria.

Wt = Zt − Zt−1 = (1 − B)Zt = ∆Zt (.)

Os modelos com este tipo de filtro de diferencas sao apropriados para series cujo com-

portamento e nao explosivo, em particular series que apresentam alguma homogeneidade

em seu comportamento nao estacionario [1].

Series Zt tais que, tomando-se um numero finito de diferencas, d, tornam-se esta-

cionarias, sao chamadas “nao estacionarias homogeneas”.

Se

Wt = ∆dZt (.)


e estacionaria, pode-se representar Wt por um modelo ARMA(p, q), ou seja,

Φ(B)Wt = Θ(B)rt (.)

Se Wt e uma diferenca de Zt, entao Zt e uma integral de Wt, daı se diz que Zt e um

modelo Auto-Regressivo-Integrado-Medias-Moveis, ou simplesmente um Modelo ARIMA,

Φ(B)∆dZt = Θ(B)rt (.)

escrevendo-se ARIMA(p, d, q), sendo p e q as ordens de Φ(B) e Θ(B), respectivamente, e

d a ordem das diferencas.

Na grande maioria dos casos d = 1 ou d = 2 e utilizado para a construcao dos modelos

na pratica, correspondendo a dois casos comuns de nao estacionariedade homogeneas [1]:

• Series nao estacionarias quanto ao nıvel: oscilam ao redor de um nıvel du-

rante algum tempo e depois saltam para outro nıvel temporario. Para torna-las

estacionarias e suficiente tomar uma diferenca;

• Series nao estacionarias quanto a inclinacao: oscilam numa direcao por algum

tempo e depois mudam para outra direcao temporaria. Para torna-las estacionarias

e necessario tomar a segunda diferenca.

2.4.2 Modelos Nao-Lineares

A grande maioria da literatura de series temporais nao somente assume que as series

sao estacionarias (ou que podem ser transformadas em series estacionarias atraves de

alguma transformacao simples), mas que estas tambem sao processos lineares, de forma

que podem ser representadas por modelos lineares.

Entretanto, nao ha nenhuma razao que generalize a suposicao de linearidade. Na

realidade, e de se esperar que devido a natureza nao-linear do meio que forma o cenario de

acontecimentos da serie temporal (mundo real), e bem mais natural se supor a existencia

de estruturas nao-lineares [9].

De forma geral, as series temporais podem ser modeladas como,


Zt = h(Zt−1, . . . , Zt−p, rt−1, . . . , rt−q) + rt (.)

onde {rt} e um termo de ruıdo, p e q sao ındices inteiros que determinam as janelas de

dependencia temporal nos termos passados da serie e do ruıdo, respectivamente, e h(·)e uma funcao nao-linear de transferencia, que modela o mapeamento entre os valores do

futuro e os valores do passado.

Varios modelos nao lineares estatısticos tem sido propostos, como os modelos bilinear

(bilinear models) [2], os modelos auto-regressivos exponenciais (exponential autoregressive

models) [3], os modelos de limiar auto-regressivo (threshold autoregressive models) [4], e

os modelos de estados dependentes (general state dependent models) [5], dentre outros.

Expandindo a Equacao (.) em serie de Taylor, em torno de um ponto fixo no

tempo, encontra-se,

Zt +

p∑

i=1

φi(yt−1)Zt−1 = µ(yt−1) + rt +

q∑

j+1

θi(yt−1)rt−j (.)

yt = (rt−q+1, . . . , rt, Zt−p+1, . . . , Zt)′ e o entao chamado vetor de estado, onde o apostrofo

denota o sinal de transposicao. Este modelo, Equacao (.), e chamado de modelo

de estado dependente de ordem (p, q) e pode ser tido como uma linearizacao local da

Equacao (.). Os parametros deste modelo sao φi(x)(i = 1, . . . , p), θj(x)(j = 1, . . . , q)

e µ(x), onde todos dependem do estado do processo sobre o tempo t-1.

Uma classe destes modelos, os modelos bilineares, pode ser resguardada como uma

extensao nao-linear natural de um modelo ARMA. Fazendo µ(x) e φi(x) constantes e

θj(yt−1) = θj +∑Q

v=1 cjvZt−v (sendo j = 1, . . ., e cjv os coeficientes a serem determinados)

no modelo da Equacao (.), tem-se a forma geral para os modelos bilineares, dada pela

Equacao (.) – modelo bilinear de ordem (p,q,P,Q).

Zt +

p∑

i=1

φiZt−i = µ + rt +

q∑

j=1

θjrt−j +

P∑

u=1

Q∑

v=1

cuvZt−vrt−u (.)

Perceba que a Equacao (.) e linear nos termos Zt e rt, e nao-linear em relacao ao

termo cruzado de Z e r (ultimo termo da Equacao (.)). Fazendo todos os cuv = 0 na

Equacao (.), esta se reduz a um modelo ARMA(p,q).


De forma pratica, um modelo bilinear de primeira ordem e montado a partir da

Equacao (.) e e dado por,

Zt = αZt−1 + βrt + γZt−1rt−1 (.)

onde α, β, e γ sao parametros constantes a serem determinados. Note que o ultimo termo

e o nao-linear.

De forma geral, os modelos bilineares tem a vantagem de serem mais gerais, conside-

rando a correlacao entre os pontos da serie temporal propriamente ditos (Zt) e os termos

de ruıdo inerentes (r). Contudo, uma grande dificuldade vem da ardua derivacao das

condicoes suficientes para existencia de solucoes estacionarias [6].

Fazendo-se agora µ(x) uma constante, θj(x) = 0 (∀ x), e φi(yt−1) = φi+πiexp(−γZ2t−1)

na Equacao (.), obtem-se os chamados modelos auto-regressivos exponenciais de or-

dem p (Equacao (.)) onde o parametro γ e um fator de escala para a serie temporal.

Zt +

p∑

i=1

{φi + πiexp(−γZ2

t−1)}

Zt−i = µ + rt (.)

Uma grande vantagem deste tipo do modelo e a possibilidade de pre-estabelecimento

de alguns tipos de comportamento. Por exemplo, fazendo p = 2 na Equacao (.), pode-

se incorporar procedimentos de frequencias dependentes da amplitude e padroes cıclicos.

A grande dificuldade vem do fato que a estimacao dos parametros e essencialmente um

problema de otimizacao nao-linear, envolvendo grandes dificuldades computacionais.

Outra classe de modelos nao-lineares sao os modelos de limiar auto-regressivo (TAR –

Threshold Autoregressive), que sao uma famılia de processos cujos parametros dependem

dos valores passados do proprio processo. Desta forma, os modelos TAR representam um

conjunto finito de possıveis modelos AR que um determinado processo pode vir a obedecer

em qualquer ponto no tempo. Se a passagem relativa entre os modelos e determinada

pela localizacao dos valores dos dados em relacao aos limiares, o modelo TAR e dito ser

auto-excitado (SETAR) [25]. Um modelo TAR de primeira ordem pode ser escrito como,

Zt =

{α1Zt−1 + rt, se Zt−1 < d

α2Zt−1 + rt, se Zt−1 ≥ d(.)


onde a constante d e chamada de limiar.

Fazendo µ(x) = φ(j)0 , θ(x) = 0 (∀ x) e φi(yt−1) = φ

(j)i se Zt−d ∈ R(j) (i = 1, . . . , p;

j = 1, . . . , l), onde d e um inteiro positivo e R(j) e um subconjunto dos numeros reais (os

limiares), a Equacao (.) transforma-se em,

Zt + φ(j)0 +

p∑

i=1

φ(j)i Zt−i = r

(j)t , Se Zt−d ∈ R(j), j = 1, . . . , l (.)

onde este e um modelo SETAR(l, p, . . . , p), sendo {r(j)t } um ruıdo branco, e r

(j)t e inde-

pendente de r(j′)t , com j 6= j ′.

Desta forma, a ideia central dos modelos TAR e SETAR e a modelagem do espaco de

estados de um determinado fenomeno nao-linear por partes ou trechos, de tal forma que

em cada um destes trechos, caracterizados por um valor de limiar, seja possıvel aproximar

o fenomeno por um modelo linear.

Ainda existe uma gama enorme de outros modelos nao lineares, como por exemplo,

modelos auto-regressivos de transicao suave [6], modelos auto-regressivos com coeficien-

tes dependentes do tempo [6], modelos heterocedasticos condicionais auto-regressivos

(ARCH) [7], dentre outros.

Em especial, os modelos do tipo ARCH [7] nao podem ser representados como uma

variacao da Equacao (.). Esta nova classe de modelos foi apresentada por Engle [7]

como uma famılia parametrica especıfica de heteroscedasticidade em um modelo AR.

O modelo ARCH de ordem q e definido como um modelo AR(q) onde {rt} e condi-

cionado a informacao avaliada no tempo t − 1, com variancia,

ht = α0 +

q∑

i+1

αir2t−i (.)

com α0 > 0 e αi ≥ 0. Desta forma, o modelo ARCH e dado pela equacao,

Zt = rt

[α0 +

q∑

i+1

αir2t−i

] 1

2

(.)

Neste modelo a nao-linearidade vem da variancia condicional de {rt}.


Desde o trabalho de Engle [7], muitas variacoes do modelo ARCH tem sido propostas.

Uma importante expansao do modelo ARCH e o modelo heterocedastico condicional auto-

regressivos geral (GARCH), sugerido por Bollerslev [8], onde e permitido que a variancia

condicional ht tambem seja uma funcao de si propria, isto e, uma funcao de ht−1, . . . , ht−p

— modelo GARCH(p, q).

Os modelos ARCH e GARCH ja foram aplicados com sucesso na economia [6], contudo

existem algumas desvantagens do ponto de vista tecnico. Uma destas desvantagens vem

da mistura de operacoes de adicao e multiplicacao na Equacao (.), resultando em

uma parametrizacao pouco natural e nao intuitiva, levando a grandes complicacoes para

se provar algum resultado aplicado a estes modelos. Um segundo ponto vem do fato

de que apenas momentos estatısticos de baixas ordens aparentam existir. De forma

pratica, o quarto momento ja se apresenta como uma grandeza infinita, implicando que

variancias de algumas estatısticas importantes possam ser infinitas ou muito grandes.

Um outro aspecto negativo para estes modelos e que a suposicao que a distribuicao de

{rt} assintota a distribuicao normal e fraca para amostras finitas.

A partir de uma visao geral da literatura, tem-se a sugestao de que o desempenho

de previsao para tais modelos nao-lineares esta abaixo do esperado [9]. Devido ao nıvel

de complexidade adicionado ao problema de previsao com uma abordagem nao-linear,

quando comparado com uma abordagem linear, nao ha um ganho de desempenho signifi-

cativo na previsao como poderia ser esperado [9]. De Gooijer e Kumar [6], em 1992, com

o seu artigo de revisao a respeito dos modelos nao-lineares, nao conseguiram evidencias

claras em favor dos modelos nao-lineares, quando comparados aos modelos lineares em

termos de desempenho de previsao. Tal situacao nao mudou de forma significativa ate os

dias atuais, como relata Clements et al [9].

Entretanto, e um conceito global aceitar que o ambiente gerador das series temporais

e nao-linear de forma geral, e portanto o problema pode ser simplesmente o fato que

os atuais modelos nao-lineares nao consigam descrever a realidade de forma tao me-

lhor que as simples aproximacoes lineares, sugerindo que uma nova abordagem deve ser

desenvolvida.

Observa-se em particular nas ciencias economicas, como nas teorias macroeconomicas

e financeiras, que um grande repositorio de modelos nao-lineares esta em voga. Por

exemplo, a maior parte dos modelos de ciclo real de negocios sao altamente nao-lineares

[9], como tambem os modelos de financas [9]. O uso destes modelos nao-lineares na


economia e financas e totalmente consistente com o uso dos modelos lineares aplicados

na pratica, uma vez que tais modelos podem ser vistos como uma aproximacao dos

fenomenos nao-lineares de interesse.

Desta forma, na perspectiva de previsao, existe uma grande motivacao para a pesquisa

de modelos nao-lineares, como destaca a edicao especial do International Journal of Fore-

casting de abril/junho de 2004 – Forecasting Economic and Financial Time Series Using

Nonlinear Methods, onde e esperado que a sofisticacao dos testes, selecao e estimacao de

modelos nao-lineares venha a aperfeicoar o desempenho na previsao.

Assim, nao e surpreendente que modelos nao-lineares nos ultimos anos tenham tido

grande atencao na literatura, ate mesmo com a inclusao de novos paradigmas aplicados ao

problema de previsao, como e o caso das redes neurais artificiais, dos algoritmos geneticos

e outras tecnicas de inteligencia artificial, que serao abordados no proximo capıtulo.

CAPITULO 3

ABORDAGENS DA INTELIGENCIA ARTIFICIAL PARA

PREVISAO DE SERIES TEMPORAIS

Neste Capıtulo e apresentada uma discussao a respeito dos metodos e tecnicas mais

populares da Inteligencia Artificial encontrados na literatura aplicados ao problema de

previsao de series temporais.

3.1 INTRODUCAO

A estatıstica e o ramo da ciencia que aborda naturalmente o problema de previsao de

series temporais [1,22–24], apresentando genericamente: (a) os modelos lineares, que sao

muito bem entendidos, mas que nem sempre sao aptos para a resolucao do problema; e

(b) os modelos nao-lineares, que tentam suprir as deficiencias dos modelos lineares, mas

que, devido ao alto grau de complexidade, nem sempre sao aplicaveis na pratica.

Neste cenario, e vista como uma alternativa a Inteligencia Artificial (IA), com metodos

e procedimentos geralmente nao-lineares, e que em termos praticos atuais nao apresen-

tam tantas dificuldades tecnicas quando comparada aos modelos estatısticos nao-lineares.

Muitas tecnicas da IA podem ser aplicadas ao problema de previsao, destacando-se na

literatura as tecnicas [10–14]:

• Redes Neurais Artificiais;

• Algoritmos Geneticos;

• Programacao Genetica;

• Sistemas de Logica difusa (fuzzy logic).

Muitos trabalhos atuais tambem exploram a combinacao destas tecnicas para a geracao

de solucoes otimizadas com a criacao de sistemas hıbridos inteligentes [15].

29

3.2 REDES NEURAIS ARTIFICIAIS 30

Neste Capıtulo e apresentada uma visao a respeito das duas primeiras tecnicas da

IA citadas, redes neurais artificiais e algoritmos geneticos, quando aplicadas a solucao

do problema de previsao de series temporais. Estas tecnicas sao as mais utilizadas em

abordagens ao problema de previsao, podendo ser facilmente combinadas [10, 15].

3.2 REDES NEURAIS ARTIFICIAIS

Redes Neurais Artificiais (RNAs) sao algoritmos originalmente baseados no funcionamento

de sistemas neurais biologicos e, em particular, o cerebro humano [26]. As RNAs sao siste-

mas paralelos distribuıdos compostos por unidades de processamento simples, chamadas

de neuronios ou nodos, que calculam funcoes matematicas, normalmente nao-lineares.

Os neuronios ou nodos sao dispostos em um arranjo espacial composto geralmente

por uma ou mais camadas e interligados por um grande numero de conexoes. Na maior

parte dos modelos, estas conexoes estao associadas a pesos, os quais armazenam o conhe-

cimento representado no modelo e servem como ponderadores para os sinais de entrada

dos neuronios da rede.

Cada uma das unidades de uma RNA e condicionada a receber um sinal. Este sinal,

ponderado pelos respectivos pesos das conexoes de entrada da unidade, e processado

por uma funcao matematica, chamada de funcao de ativacao ou funcao de transferencia,

produzindo um novo sinal de saıda que e propagado pela rede.

As RNAs possuem a capacidade de aprender atraves de exemplos, realizar inter-

polacoes dos dados e extrapolacoes das informacoes aprendidas. No processo de apren-

dizado de uma RNA a principal tarefa e a determinacao da intensidade das conexoes

entre os neuronios, sendo os algoritmos de aprendizado utilizados para a adaptacao destes

parametros. Estes algoritmos tem a finalidade de realizar o ajuste dos pesos das conexoes

para a melhor generalizacao possıvel da informacao contida nos exemplos expostos.

Muitos tipos de modelos de RNAs tem sido propostos, dentre os quais, podem-se

destacar os mais populares,

• Redes Multi-Layer Perceptron (MLP) [27];

• Redes Recorrentes [27];

• Redes de Kohonen [28, 29];

3.3 REDES NEURAIS ARTIFICIAIS E O PROBLEMA DE PREVISAO 31

• Redes de Hopfield [30];

• Redes ART [31].

Destes tipos de modelos de RNAs, as rede MLPs sao indubitavelmente as mais po-

pulares devido a sua praticidade, flexibilidade e eficiencia, sendo aplicada a uma vasta

gama de problemas [10, 27, 32, 33].

3.3 REDES NEURAIS ARTIFICIAIS E O PROBLEMA DE PREVISAO

As RNAs constituem uma ferramenta bastante atraente para o problema de previsao

devido as suas caracterısticas intrınsecas de mapeamento de entradas e saıdas. De forma

contraria aos metodos baseados em modelos analıticos, as RNAs sao metodos adaptativos

baseados em dados, com nenhuma (ou quase nenhuma) suposicao a priori do fenomeno

em estudo. As redes aprendem exclusivamente a partir de exemplos e capturam os relacio-

namentos e estruturas que possam vir a existir nos dados, mesmo que tais relacoes e estru-

turas sejam desconhecidas e/ou de difıcil observacao para especialistas humanos. Desta

forma, as RNAs sao adequadas para problemas cujas solucoes requerem um conhecimento

que nao pode ser adquirido de forma simples, mas para os quais ha quantidade de dados

estatisticamente representativa, contendo a informacao desejada. Neste sentido, as RNAs

sao tidas como um metodo estatıstico nao parametrico nao-linear multivariavel [34–36].

Uma desvantagem de modelos dependentes unicamente de dados vem do fato que

regras a respeito do sistema em estudo sao, de forma geral, nao evidentes e as observacoes

sao frequentemente marcadas por ruıdo, o que pode ser um fator primordial para o

fracasso do modelo. Contudo, em algumas situacoes praticas, este tipo de modelagem e

o unico modo plausıvel para a resolucao de problemas do mundo real.

Um segundo ponto importante e o poder de generalizacao das RNAs, ou seja, apos

o processo de aprendizagem com os dados apresentados (amostra de dados de uma po-

pulacao), as RNAs sao capazes, de forma geral, de inferirem corretamente padroes nao

apresentados na fase de treinamento. Como a previsao e basicamente a determinacao do

comportamento futuro (dados nao apresentados) a partir do seu comportamento passado

(dados apresentados), esta torna-se uma aplicacao ideal para as RNAs.

Um terceiro aspecto favoravel para a utilizacao das RNAs ao problema de previsao

baseia-se no fato que as redes sao aproximadores universais de funcoes, aproximam qual-


quer funcao com uma precisao desejada [37–42]. Uma vez que as series temporais podem

ser representadas como uma funcao matematica dependente do tempo, as RNAs podem

ser utilizadas para a determinacao de tais funcoes.

Outro ponto de extrema importancia vem da nao linearidade das RNAs. Os modelos

estatısticos lineares para previsao tem a vantagem de serem entendidos e analisados em

grande detalhe, serem de facil implementacao e explicacao, contudo podem ser totalmente

inadequados se o mecanismo da serie temporal for nao-linear [43].

Dentre os modelos existentes de RNAs, as redes MLPs sao as mais utilizadas na

solucao do problema de previsao. Contudo, tambem se encontra com relativa frequencia

na literatura o relato da utilizacao de outros modelos de redes, como as as redes de funcao

de base radial (RBF) [44–46] e redes wavelets, ou simplesmente wavenets [47, 48].

3.3.1 Redes Neurais Perceptrons Multi-Camadas

As Redes Neurais Perceptrons Multi-Camadas (MLP) sao compostas tipicamente por

algumas camadas de neuronios. A primeira camada e conhecida como camada de entrada,

onde a informacao e apresentada a rede. A ultima camada e chamada de camada de saıda,

onde respostas finais do modelo sao produzidas. A camada de entrada e a camada de

saıda sao separadas por uma ou mais camadas, chamadas de camadas intermediarias,

camadas escondidas ou camadas ocultas.

Os neuronios de uma camada sao conectados a outros neuronios da camada adjacente.

Se cada neuronio de uma determinada camada for conectado a todos os neuronios da

proxima camada tem-se uma rede MLP totalmente conectada, como ilustra a Figura 3.1

Para o problema de previsao, as entradas de uma RNA sao usualmente as variaveis

de predicao. Desta forma, a relacao funcional estimada pela RNA pode ser escrita como,

y = f(x1, x2, . . . , xp) (.)

onde x1, x2, . . . , xp sao p variaveis independentes e y e uma variavel dependente. Portanto,

a RNA funciona de forma equivalente a um modelo de regressao nao-linear.

Por outro lado, encarando o problema como uma extrapolacao, as entradas da rede

sao tipicamente as observacoes passadas da serie e a saıda e o respectivo valor futuro.


Figura 3.1: Rede MLP de tres camadas totalmente conectada.

Entao, a RNA dependera de uma funcao de mapeamento esquematizada como,

yt+1 = f(yt, yt−1, . . . , yt−p) (.)

onde yt e a observacao da serie temporal no tempo t. Analisando sob este angulo, a RNA

e equivalente a um modelo auto-regressivo nao-linear.

Uma RNA pode incorporar tanto variaveis de previsao como retardos temporais (ou

lags) de uma serie temporal, equivalendo-se a um modelo geral de funcao de transferencia.

Antes da RNA desempenhar qualquer tarefa, esta deve passar por um processo de

aprendizagem. Uma rede MLP e treinada de forma supervisionada, para cada padrao de

entrada exibido a rede e exibido um padrao de saıda, forcando a rede a ajustar seus pesos

(aprendizado) de forma a conseguir realizar o mapeamento entre o padrao de entrada e

o padrao de saıda, atraves da minimizacao do erro entre a saıda da rede e a resposta

desejada (ou o padrao de saıda), como esquematizado na Figura 3.2.

O conjunto de dados de entrada utilizado no treinamento da rede geralmente e formado

por varios vetores, correspondendo a cada um dos elementos destes vetores um neuronio

da camada de entrada da rede. Para o problema de previsao, o numero de neuronios da

camada de entrada da RNA e muito bem definido, sendo determinado pelo numero de

variaveis independentes ou pela quantidade de retardos temporais.

A quantidade total de dados historicos disponıveis de uma serie temporal e usualmente

dividida em duas ou tres partes. Se dividida em duas partes, a primeira e utilizada para o


Figura 3.2: Esquema do processo de aprendizagem supervisionada.

treinamento (conjunto de treinamento) do modelo de predicao e a segunda (conjunto de

teste) para realizar testes de desempenho do modelo. Nao existe a priori nenhuma regra

bem estabelecida para determinar a cardinalidade de cada um dos conjuntos, entretanto,

nesta configuracao, de forma geral utiliza-se um conjunto de treinamento bem maior que o

conjunto de teste, representando de 70% a 90% dos dados, sendo o restante utilizado como

conjunto de teste. Ja na segunda configuracao (dados historicos divididos em tres partes),

a primeira parte e novamente utilizada para o treinamento do modelo, a segunda parte

(conjunto de validacao) e utilizada para validar o treinamento (determinando o momento

mais adequado para seu termino), e a terceira parte constitui o conjunto de teste. Nesta

segunda configuracao tambem nao ha nenhuma regra definitiva para a determinacao das

quantidades de elementos por conjuntos. Contudo, existe uma tentativa de padronizacao

dos experimentos com RNAs, descrita no relatorio tecnico Proben1 [49]. Seguindo esta

padronizacao, a divisao dos dados deve ser realizada na proporcao de 50% para o conjunto

de treinamento, 25% para o conjunto de validacao e 25% para o conjunto de teste.

O treinamento de uma RNA do tipo MLP decorre em linhas gerais da seguinte ma-

neira: primeiro, exemplos do conjunto de treinamento sao colocados nas entradas da

RNA. Os valores dos sinais de entrada sao ponderados e somados em cada neuronio da

primeira camada escondida. O resultado desta soma e entao transformado pela funcao

de ativacao do neuronio atual, gerando o sinal de saıda do neuronio, que e propagado

para a proxima camada da rede. Este processo se repete camada a camada ate que, even-

tualmente, os valores de ativacao dos neuronios da camada de saıda sao calculados. Um

algoritmo de treinamento e entao utilizado para encontrar os pesos das conexoes entre

os neuronios de forma a minimizar uma medida de erro global da rede. Tipicamente,

uma funcao objetivo ou funcao custo, geralmente baseada no erro SSE (Sum of Squared


Errors), Equacao (.), deve ser minimizada durante o processo de treinamento,

E =1

2

N∑

i=1

(targeti − outputi)2 (.)

onde targeti e a saıda desejada da rede para o padrao i, outputi e a saıda da rede para o

padrao i, e o fator 12

e apenas utilizado por uma questao de simplificacao nas expressoes

das derivadas da Equacao (.) calculadas intensamente nos algoritmo de treinamento,

como no caso do algoritmo classico Backpropagation [50].

3.3.2 Projeto de uma Rede Neural Artificial

O projeto de uma RNA para uma aplicacao de previsao constitui-se em uma tarefa

delicada. A determinacao dos parametros que afetam o desempenho da rede deve ser

considerada cuidadosamente.

Uma decisao crıtica e a determinacao apropriada da arquitetura da rede, ou seja, a

quantidade de camadas, a quantidade de neuronios em cada camada e a quantidade de

entradas da rede, que para o problema de previsao e determinada pela quantidade de

retardos temporais relevantes ou quantidade de variaveis relevantes da series em estudo.

Em adicao, outros parametros necessitam ser definidos, como a funcao de ativacao dos

neuronios, o algoritmo de treinamento, a definicao de medidas de desempenho, o pre-

processamento da serie temporal com a escolha de transformacoes e normalizacao dos

dados, e a divisao dos dados em conjuntos de treinamento, validacao e teste.

3.3.2.1 Arquitetura da Rede

No projeto da arquitetura de uma rede do tipo MLP, parametros necessitam de definicao:

• A quantidade de entradas;

• O numero de camadas escondidas e a quantidade de neuronios em cada uma delas;

• A quantidade de saıdas.

A selecao destes parametros e dependente do problema em questao. Existem algumas

abordagens que tentam encontrar a configuracao otima para uma RNA, tais como o algo-


ritmo de poda (pruning algorithm) [51–55], o algoritmo de tempo polinomial (polynomial

time algorithm) [56], a tecnica de decomposicao canonica [57], o criterio de informacao da

rede [58], dentre outros. Contudo, de forma geral, estes metodos sao bastante complexos e

difıceis de serem implementados, alem do fato que nenhum destes pode garantir a solucao

otima para o problema. Por esta razao, na grande maioria dos casos, a arquitetura da

rede e definida com base em experimentos preliminares.

3.3.2.1.1 Quantidade de Entradas e Retardos Temporais. O numero de entradas de

uma RNA para o problema de previsao sera a quantidade de variaveis ou elementos

contidos no vetor de entrada, correspondendo aos retardos temporais relevantes (lags) ou

as variaveis relevantes para a serie.

Os lags sao as observacoes passadas utilizadas para a determinacao do proximo valor

futuro da serie. Por exemplo, e possıvel que para uma serie seja necessario observar os

lags 1, 3 e 8, para a determinacao do seu valor no tempo t. Logo, estes serao os valores

da serie nos tempos t-1, t-3 e t-8 respectivamente. Portanto, um ponto bastante crıtico

no problema de previsao e a determinacao correta dos lags para que seja possıvel uma fiel

representacao das estruturas temporais inerentes a serie, como discutido na Secao 2.3.

Assim, o numero de neuronios da camada de entrada, ou equivalentemente os retardos

temporais a serem utilizados, e um dos fatores chave a serem ajustados, sendo altamente

dependente do problema. A escolha dos retardos temporais e uma tarefa complexa, onde

na grande maioria dos casos ha a necessidade da interacao com especialistas humanos da

area, tornando este ajuste um procedimento de difıcil automatizacao.

3.3.2.1.2 Quantidade de Camadas Escondidas e Neuronios. As camadas escondidas

e os neuronios que as compoem sao fatores extremamente importantes para o funcio-

namento de uma RNA. Estes permitem a rede detectar as caracterısticas e padroes exis-

tentes nos dados, desempenhando o mapeamento entre as variaveis de entrada e saıda.

Na grande maioria dos casos, influenciados pelos trabalhos teoricos que mostram a ne-

cessidade de apenas uma unica camada escondida para que uma RNA consiga aproximar

qualquer funcao nao-linear contınua [38,39], os pesquisadores relatam em seus trabalhos

apenas o uso de uma unica camada escondida para aplicacoes de previsao.

Contudo, apenas uma unica camada escondida pode requerer uma grande quantidade


de neuronios, podendo comprometer o tempo de treinamento e o poder de generalizacao

da RNA. Redes com duas camadas escondidas podem trazer benefıcios para alguns tipos

de problemas especıficos e, por isso, alguns pesquisadores utilizam mais de uma camada

escondida (usualmente duas camadas). Srinnivasan et al [59] usam uma RNA com duas

camadas escondidas, resultando em uma rede mais compacta com um maior desempenho

no processo de treinamento, quando comparada a uma rede de uma camada. Em um

outro trabalho, de Zhang et al [10], tambem e mostrado que redes de duas camadas

escondidas tem um melhor desempenho do que redes de uma camada escondida para

uma dada serie.

Resultados sugeridos por Lippman [60] e Lapedes and Farber [61] indicam que nao

sao necessarias mais de duas camadas escondidas para resolver quase todos os problemas,

inclusive problemas de previsao. Contudo, constata-se na literatura que apenas uma

camada escondida e o suficiente para alcancar um desempenho satisfatorio de previsao

[10], sendo o uso de duas camadas uma otimizacao para alguns problemas especıficos.

Determinar a quantidade de neuronios escondidos tambem e uma tarefa complexa.

Em geral, redes com quantidades pequenas de neuronios sao preferidas, pois espera-se

alcancar um maior poder de generalizacao e uma menor probabilidade de super estimacao

(overfitting). Porem, redes com uma quantidade insuficiente de neuronios podem nao ter

o poder suficiente para modelar e aprender as estruturas contidas nos dados em estudo.

A maneira mais popular de se determinar a quantidade de neuronios escondidos e

atraves de experimentos de tentativa e erro com a realizacao de simulacoes diretas com

os dados. Entretanto, existem algumas regras heurısticas que tentam auxiliar a deter-

minacao desta quantidade. Uma destas regras [10] parte do pressuposto que a quanti-

dade de neuronios escondidos depende diretamente do numero de entradas, considerando

tambem que para cada peso existente na rede ha em media necessidade de dez exemplos

para ajusta-lo. Desta forma, a partir do conjunto de dados pode-se estimar um limite

para a quantidade de neuronios da rede. Para redes de uma unica camada escondida exis-

tem algumas regras praticas que assumem a quantidade de neuronios escondidos como

2n + 1 [60], 2n [62], n [63] e n/2 [10], onde n e o numero de entradas da rede.

Tang e Fishwick [63] investigaram o efeito da quantidade de neuronios escondidos

em particular ao problema de previsao de series temporais. Estes encontraram que tal

parametro tem um certo efeito sobre o desempenho de previsao da RNA, contudo nao

muito significativo, podendo ate mesmo ser desprezado para alguns problemas. Nota-se


ainda que alguns dos melhores resultados de previsao sao apresentados em trabalhos onde

o numero de neuronios escondidos e igual a quantidade de entradas da rede [63–66].

3.3.2.1.3 Quantidade de Saıdas. O numero de neuronios da camada de saıda e uma

grandeza facil de ser determinada para o problema de previsao. Existem basicamente

duas formas de previsao que podem ser desempenhadas:

1. Previsao de um passo;

2. Previsao de multiplos passos.

A previsao de um unico passo utiliza apenas um neuronio na saıda da rede, o qual ira

estimar o proximo valor futuro da serie (horizonte de previsao unitario). Ja na previsao

de multiplos passos existem dois esquemas possıveis para sua implementacao. O primeiro,

chamado de previsao iterativa, comumente utilizado nos modelos estatısticos, faz uso de

apenas uma saıda (ou neuronio) para a rede, onde o valor gerado e entao utilizado para

construir de forma iterativa o padrao de entrada para a previsao do proximo passo.

O segundo esquema, chamado de previsao direta, consiste em projetar um RNA com

uma quantidade de neuronios de saıda igual ao horizonte de previsao, onde cada um destes

neuronios e responsavel pela previsao de um determinado passo no futuro. Na literatura

e possıvel encontrar todos os dois esquemas para a previsao de multiplos passos [10].

3.3.2.2 Funcao de Ativacao

A funcao de ativacao determina o relacionamento entre as entradas e saıda de um neuronio

e, em geral, introduz um grau de nao linearidade na maioria das redes.

Qualquer funcao diferenciavel em segunda ordem (Classe C2) pode ser uma funcao

de ativacao, contudo na pratica, apenas um pequeno grupo de funcoes de ativacao “bem

comportadas” sao utilizadas. Pode-se citar as mais comuns:

1. Funcao Sigmoide Logıstica

f(x) =1

1 + exp(−λx)(.)


onde λ e um parametro que determina a sensibilidade na resposta da funcao, ajus-

tado comumente para 1;

2. Funcao Tangente Hiperbolica

f(x) =exp(x) − exp(−x)

exp(x) + exp(−x)(.)

3. Funcao seno ou cosseno

f(x) = sen(x) ou f(x) = cos(x) (.)

4. Funcao Linear

f(x) = αx + β (.)

Na Figura 3.3 sao exibidos os graficos destas funcoes.

−10 −5 0 5 100

0.2

0.4

0.6

0.8

1

X

Sig

moi

de(x

)

−10 −5 0 5 10−1

−0.5

0

0.5

1

X

Tan

gent

e H

iper

bolic

a (x

)

−10 −5 0 5 10−1

−0.5

0

0.5

1

X

Sen

(x)

−10 −5 0 5 10−10

−5

0

5

10

X

f(x)

=x

(A) (B)

(C) (D)

Figura 3.3: Graficos das funcoes de ativacao mais comuns. (A) Funcao SigmoideLogıstica; (B) Funcao Tangente Hiperbolica; (C) Funcao Seno; (D) Funcao Linear.

De forma generica, uma RNA pode ter diferentes funcoes de ativacao para neuronios

de uma mesma camada ou de camadas distintas, contudo a grande maioria das RNAs

tem a mesma funcao de ativacao para todos os neuronios de uma mesma camada.


Na maior parte dos trabalhos da literatura, usa-se a funcao sigmoide logıstica nos

neuronios escondidos, porem, quanto a funcao de ativacao para os neuronios de saıda,

nao ha um consenso formado. Em problemas de previsao que envolvem valores contınuos

e razoavel a utilizacao de uma funcao de ativacao linear na camada de saıda da rede,

contudo e importante notar que RNAs com saıdas lineares tem a limitacao de nao modelar

series com tendencias [55], podendo ser necessario um pre-processamento da serie.

3.3.2.3 Conexoes entre Neuronios

Para a grande maioria dos problemas de previsao relatados na literatura as redes sao

completamente conectadas, ou seja, todos os neuronios de uma camada sao conectados

com todos os outros neuronios da camada seguinte. Alguns trabalhos tambem apresentam

redes com conexoes parciais [67] ou redes com conexoes diretas da camada de entrada

para a camada de saıda [68]. A adicao de conexoes diretas em uma rede pode aumentar

a acuracia de previsao uma vez que estas podem ser utilizadas para a modelagem das

estruturas lineares dos dados (ultima camada da rede com funcao de ativacao linear).

3.3.2.4 Algoritmo de Treinamento

O processo de treinamento de uma RNA e um problema de minimizacao nao-linear no

qual os pesos (ou conexoes) da rede sao iterativamente ajustados para prover um erro

mınimo entre a saıda desejada e a saıda obtida pela rede.

O algoritmo de treinamento mais popular e o Backpropagation [50], que e essencial-

mente um metodo de gradiente descendente. Outros algoritmos, na sua maioria modi-

ficacoes ou variacoes do Backpropagation, tambem sao utilizados com sucesso. Sao exem-

plos os metodos adaptativos [69–71], QuickProp [72,73], RproP [74] e outros metodos de

segunda ordem, como Levenberg-Marquardt [75, 76], gradiente conjugado [77], gradiente

conjugado com um passo de secante [78], dentre tantos outros. A escolha do algoritmo de

treinamento tambem e uma tarefa de difıcil solucao, dependendo fortemente do problema.

3.4 ALGORITMOS GENETICOS 41

3.3.2.5 Normalizacao dos Dados

As funcoes de ativacao nao-lineares sao definidas sobre um domınio, por exemplo, a

sigmoide logıstica e definida para o intervalo [0, 1]. Portanto, todos os dados informados

a rede devem estar normalizados sobre o domınio da funcao de ativacao utilizada.

O processo de normalizacao dos dados e realizado antes do treinamento, no pre-

processamento. As formas de normalizacao comumente utilizadas podem ser sumarizadas

nos seguintes pontos [10]:

• Transformacao linear para o intervalo [0,1]:

Xn =X0 − Xmin

Xmax − Xmin

(.)

• Transformacao linear para o intervalo [a,b]:

Xn = (b − a)X0 − Xmin

Xmax − Xmin

+ a (.)

• Normalizacao estatıstica:

Xn =(X0 − X)

s(.)

• Normalizacao simples:

Xn =X0

Xmax

(.)

onde Xn, X0, Xmax, Xmix, X e s sao os valores normalizados, os valores originais, o valor

maximo, o valor mınimo, o valor medio e o desvio padrao dos dados, respectivamente.

As normalizacoes dos dados de entrada e saıda sao independentes. Contudo, no

problema de previsao, a normalizacao das entradas e saıdas e realizada de forma unica.

3.4 ALGORITMOS GENETICOS

Os Algoritmos Geneticos (AGs) sao metodos de aprendizagem de maquina, busca e oti-

mizacao desenvolvidos por Holland e seu alunos [79–81]. Estes algoritmos fazem parte do

paradigma de computacao evolutiva e sao motivados pela teoria da evolucao de Charles

Darwin, que em 1859 publicou o livro A Origem das Especies, onde postulou:


“As especies evoluem pelo princıpio da selecao natural e sobrevivencia do mais

apto”

Em 1865, Gregor Mendel, considerado o pai da genetica, apresentou os resultados

dos seus experimentos com ervilhas, constatando que a informacao genetica dos pais e

transferida aos seus filhos de forma probabilıstica. Estes experimentos geraram subsıdios

para o entendimento da diversificacao das especies, o que possibilita o aumento do poder

de adaptacao do indivıduo ao seu meio, integrando a genetica com a selecao natural,

consolidando a teoria da evolucao.

A ideia da teoria da evolucao, de forma simplista, pode ser encarada como a trans-

ferencia das informacoes geneticas dos pais para seus filhos. Os filhos que receberem as

informacao adequadas terao um maior poder de adaptacao ao meio com grandes chances

de sobreviver, ja os que nao forem dotados de tais informacoes tenderao a serem extintos.

Como um procedimento tıpico de busca e otimizacao, os AGs irao realizar uma busca

pela melhor solucao para o problema, contudo nao partindo de apenas um unico estado

inicial, mas sim de um certo conjunto de estados iniciais que sao formados por possıveis

solucoes para o problema. Cada uma dessas possıveis solucoes sao chamadas de in-

divıduos, e o grupo de indivıduos de populacao. Heurısticas inspiradas na Teoria da

Evolucao sao iterativamente aplicadas, permitindo a populacao evoluir para uma solucao

aceitavel do problema. Os AGs realizam buscas atraves de multiplas trajetorias simulta-

neamente, sendo estes excelentes para a execucao em computadores paralelos [82].

De forma geral, uma tecnica de otimizacao apresenta:

• Espaco de Busca: onde estao todas as possıveis solucoes do problema;

• Funcao Objetivo: avalia as solucoes produzidas, associando a cada uma delas um

valor numerico de utilidade, ou uma nota, que mede o quao boa e a solucao.

O metodo aplicado pelos AGs e a busca em um espaco de hipotese, ou solucoes

candidatas, constituindo seu espaco de busca. A melhor hipotese e determinada atraves

de uma medida numerica pre-determinada, a funcao objetivo, comumente chamada de

funcao custo ou fitness.

Existem um grande numero de diferentes implementacoes para os AGs que, de forma

geral, sao variacoes do seguinte esquema:


1. Os AGs operam iterativamente sobre um conjunto de solucoes — os indivıduos —

que formam uma populacao;

2. Para cada iteracao, todos os indivıduos da populacao sao avaliados segundo uma

funcao de fitness;

3. Um nova populacao e entao formada atraves de um procedimento probabilıstico a

partir da populacao atual. Alguns indivıduos sao levados da populacao atual para

a nova populacao sem sofrerem nenhuma transformacao (intactos) e alguns outros

indivıduos sao utilizados como base para a geracao de novos indivıduos (pais que

geram filhos) atraves de operadores de cruzamento (crossover) e mutacao.

Um algoritmo representando um AG generico e mostrado na Figura 3.4. A evolucao da

populacao dos AGs pode ser descrita atraves do teorema dos esquemas [81,83], comentado

no Apendice B.

Figura 3.4: Procedimento padrao de um Algoritmo Genetico tıpico.

3.4.1 Indivıduo

Os AGs sao inicializados pela geracao de uma populacao de indivıduos, onde cada um

desses indivıduos iniciais sao solucoes tentativas do problema em estudo. Contudo, o que

vem a ser um indivıduo?

Um indivıduo e formado basicamente por um cromossomo, que em analogia a biologia,

contem toda a informacao necessaria para representar o indivıduo. Em alguns casos, o

cromossomo pode assumir estruturas bem complexas contendo varias hierarquias, mas


Figura 3.5: Representacao esquematica da informacao biologica. O indivıduo e abstraıdocomo uma solucao a um problema, seu cromossomo a sua codificacao e os genes aosparametros da solucao.

na grande maioria das vezes, um cromossomo e apenas um vetor, onde cada um dos seus

elementos e um gen.

Um gen e tipicamente expresso como um caractere, ou uma string de caracteres,

escrito em algum alfabeto, que codifica uma determinada caracterıstica do indivıduo, ou

seja, um parametro da solucao.

Em analogia a um sistema biologico, esquematizado na Figura 3.5, um determinado

indivıduo tem o seu cromossomo formado por varios genes, onde cada um desses genes e

responsavel por uma determinada caracterıstica. Encarando o meio ambiente como “um

problema” e o indivıduo com uma “determinada solucao”, o ajuste dos seus genes ira

gerar um cromossomo, que, por sua vez, gera as caracterısticas do indivıduo (ou uma

solucao tentativa), podendo se adaptar mais ou menos ao meio, destacando-se ou nao

entre os demais indivıduos. E de se esperar que os indivıduos com um maior destaque

tenham maior probabilidade de sobrevivencia.

Portanto, dado um problema, idealiza-se um indivıduo formado por um cromossomo

que contenha todos os parametros para uma possıvel solucao. Para cada um desses

parametros e associado um gen, e para cada gen e definido um intervalo de variacao.

3.4.2 Funcao de Custo

A avaliacao nos AGs e realizada indivıduo a indivıduo, atraves da funcao de custo ou

fitness. O melhor indivıduo ira retornar um menor custo ou o maior valor de fitness,


sendo este o indivıduo mais apto da populacao.

O fitness e uma funcao matematica que gera um ındice de ordenamento por aptidao

para todos os indivıduos da populacao. Esta funcao, por sua vez, e dependente do

problema, e pode ter uma quantidade muito grande de variacoes para uma unica situacao.

Quando a situacao requer a minimizacao de um determinado parametro, como um erro

(como e o caso do problema de previsao), um possıvel fitness e dado por,

fitness =1

1 + erro(.)

3.4.3 Escolha de Indivıduos

Para o processo de criacao da nova populacao, o primeiro passo e selecionar um certo

numero de indivıduos (geralmente dois), chamados de pais. Existem varias formas

possıveis para se realizar esta selecao: selecao baseada em meta, metodo de amostragem

estocastica (metodo da roleta), estrategias elitistas, eleicao de estados ligados, selecao

por torneio, dentre outras [84].

Destes procedimentos para a selecao de indivıduos, existem dois metodos que merecem

uma maior atencao:

• Metodo de selecao por torneio;

• Metodo de selecao por roleta.

No metodo de selecao por torneio, sao escolhidos aleatoriamente uma certa quantidade

de indivıduos da populacao, e a partir destes escolhe-se o mais apto (maior valor de

fitness). Tal procedimento e repetido para a selecao de um par de indivıduos (os pais)

que gerem novos indivıduos (os filhos).

No metodo por roleta, tem-se um procedimento de selecao por amostragem estocastica,

onde o indivıduo mais apto tera uma maior chance de sobreviver. Desta forma, para uma

populacao com P indivıduos, a probabilidade de um indivıduo i ser selecionado e,

Pr(indi) =f(indi)∑P

j=1 f(indj)(.)

onde indi esta representando o indivıduo i e o f(·) e a funcao de custo ou fitness.


Analisando a Equacao (.), a probabilidade de um certo indivıduo ser selecionado

e diretamente proporcional ao seu valor de fitness e inversamente proporcional ao so-

matorio dos valores de fitness de todos os indivıduos da populacao. Graficamente, este

procedimento pode ser representado como uma roleta, sendo representada por um grafico

tipo pizza. Cada indivıduo da populacao e associado a uma fatia do grafico, quanto maior

o seu valor de fitness maior sera a area da fatia, como mostra a Figura 3.6, sendo a selecao

do indivıduo realizada atraves de um sorteio.

Figura 3.6: Metodo da Roleta aplicado a uma populacao de cinco indivıduos.

3.4.4 Operadores Geneticos

Os operadores geneticos, de forma bastante generica, recombinam e modificam os mem-

bros da populacao selecionados.

Tipicamente, um AG tem operadores que manipulam um conjunto de bits, como

ilustrado na Figura 3.7. Estes operadores sao aplicados aos cromossomos escritos em um

alfabeto binario, mas podem ser facilmente generalizados para um alfabeto qualquer.

Os operadores utilizados pelo AG correspondem a versoes abstratas dos operadores

encontrados na evolucao de um sistema biologico. Os dois operadores mais comuns sao

os operadores de cruzamento (crossover) e os operadores de mutacao.

Os operadores de cruzamento sao responsaveis pela geracao dos cromossomos filhos

a partir dos cromossomos pais, misturando os genes dos indivıduos pais para a obtencao

dos novos cromossomos. Por exemplo, o bit na posicao i do cromossomo filho e gerado

a partir de uma copia do bit da posicao i do cromossomo do pai1 ou do cromossomo


Figura 3.7: Operadores de cruzamento e mutacao aplicados nos AGs binarios.

do pai2. A escolha de qual pai ira ser o doador de um certo gene e determinada por

uma string adicional chamada mascara de cruzamento, escrita em binario e de mesmo

comprimento dos cromossomos da populacao. Se o bit da mascara na posicao i for 1,

entao o gene na posicao i do pai1 sera repassado para o filho, e caso o valor do bit seja

0, entao e o pai2 que ira repassar o gene (e vice e versa). Neste tipo de cruzamento sao

gerados dois filhos para cada par de pais, como tambem e o caso para o cruzamento de

um ponto, dois pontos ou multiplos pontos.

Um dos fatores que geram a diversificacao de uma populacao em um sistema biologico

e a chance do aparecimento de indivıduos mutacionados. A possibilidade de mutacao

em um sistema biologico e geralmente baixa e gerada por fatores casuais. Simulando

este procedimento, o operador mutacao em um AG entra com a possibilidade de alterar

um cromossomo de forma aleatoria, modificando o valor dos seus genes, garantido a

diversificacao da populacao.

De forma geral, estes sao os operadores utilizados em praticamente todas as aplicacoes

que usam os AG. Contudo, ainda existem sistemas baseados em AGs que utilizam ou-

tros operadores, especialmente operadores especializados em particularidades do sistema,

como operadores de generalizacao de regras [32].

3.5 SISTEMAS HIBRIDOS INTELIGENTES 48

3.4.5 Algoritmos Geneticos e o Problema de Previsao

Os AGs nao sao utilizados diretamente para a previsao de series temporais, mas no apoio

a outros metodos e tecnicas na busca de uma melhor modelagem e previsao possıvel.

Chan et al. [11] utilizaram um AG para determinar os parametros ideais para um

modelo ARMA a partir dos dados de uma serie temporal real relativa a ındices de precos.

Na mesma linha, Neubauer [12] utilizou um AG tıpico para ajustar filtros nao-lineares,

baseados em modelos biparametricos para a previsao de series de incendios, mostrando

uma forma de ajuste de modelos estatısticos nao-lineares sem a necessidade de uma analise

matematica tao sofisticada como a requerida comumente.

Uma outra abordagem dos AGs utilizada por Povinellie e Feng [13] trata-se do re-

conhecimento de padroes e estruturas existentes em uma dada serie temporal. A ideia

consiste na procura por padroes (ou estruturas) atraves de uma medida de correlacao

entre os pontos da serie. Neste procedimento, a funcao de custo ou fitness e exatamente

o valor da correlacao para as estruturas, quanto maior a correlacao mais apta e a estru-

tura. Tal metodologia e bastante util em sistemas de alarme, como em um sismografo,

identificando certos padroes que antecedem um terremoto.

3.5 SISTEMAS HIBRIDOS INTELIGENTES

Os seres humanos sao um bom exemplo de “maquinas” que possuem informacoes de

forma hıbrida. Nossas atitudes e acoes sao governadas pela combinacao de informacao

genetica e informacao adquirida atraves de aprendizagem.

Este tipo de processamento de informacao hıbrida esta sendo replicada na geracao de

maquinas que se adaptam, onde em seus nucleos estao sistemas de computacao inteli-

gentes, sendo alguns desses inspirados em mecanismos da natureza. Pode-se citar alguns

exemplos: redes neurais, algoritmos geneticos, sistemas fuzzy, sistemas imunologicos ar-

tificiais [85], sistemas especialistas [86] e regras de inducao [87].

Sistemas Hıbridos Inteligentes tambem sao importantes quando se considera a natu-

reza variada do domınio de aplicacoes. Muitos domınios complexos tem muitas compo-

nentes de problemas diferentes, cada qual podendo requerer um tipo de processamento

diferente. Alem do mais, representam nao somente a combinacao de diferentes tecnicas

inteligentes, mas tambem a integracao dessas tecnicas com sistemas convencionais de


computacao.

Pode-se sumarizar tres principais motivos para a criacao de sistemas hıbridos:

• Tecnicas de Intensificacao: integracao de diferentes tecnicas com o intuito de

superar as limitacoes das tecnicas individuais, onde pelo menos duas tecnicas sao

combinadas de tal modo que o ponto fraco de uma seja compensado pelo ponto

forte da outra.

• Multiplicidade de Aplicacoes em Tarefas: um Sistema Hıbrido Inteligente e

criado uma vez que uma unica tecnica nao e capaz de ser aplicavel aos muitos

sub-problemas que uma dada aplicacao possa ter.

• Realizacao de Multipla Funcionalidade: a criacao de sistemas hıbridos que

exibam a capacidade de processamento multiplo de informacoes dentro de uma

arquitetura, ou seja, estes sistemas funcionalmente imitam ou emulam diferentes

tecnicas de processamento.

Muitas sao as combinacoes possıveis entre as varias tecnicas de IA para a criacao de

Sistemas Hıbridos Inteligentes, contudo a discussao aqui exposta estara sendo limitada a

combinacao das tecnicas ja discutidas.

3.5.1 Algoritmos Geneticos e Redes Neurais

Algoritmos Geneticos, como ja discutido, sao algoritmos de busca e otimizacao baseados

em mecanismos de selecao natural e genetica que trabalham com um conjunto de possıveis

solucoes simultaneamente.

As tecnicas de otimizacao e busca geralmente apresentam um espaco de busca onde

estao todas as possıveis solucoes e uma funcao de avaliacao ou custo que estima, geral-

mente atraves de uma nota, cada possıvel solucao. Os Algoritmos Geneticos diferenciam-

se destes metodos tradicionais em quatro aspectos principais:

1. Trabalham com uma codificacao do conjunto de parametros;

2. Trabalham com uma populacao de solucoes candidatas simultaneamente, e nao com

uma unica solucao;


3. Utilizam informacoes de custo ou recompensa, e nao derivadas de funcoes;

4. Utilizam regras de transicao probabilısticas, e nao determinısticas.

Ja em uma Rede Neural, o seu desempenho depende da topologia usada bem como

dos parametros do seu algoritmo de treinamento. Portanto, a determinacao de tais

parametros da rede afeta a velocidade e a eficiencia do processo de aprendizado, a to-

lerancia a falhas a ruıdos e a capacidade de generalizacao. Os Algoritmos Geneticos sao

usados em combinacao com Redes Neurais na transformacao de uma populacao de redes

candidatas, de uma geracao para a outra, diversificando esta populacao e mantendo as

caracterısticas desejaveis adquiridas pelas geracoes anteriores. E, de uma forma evolu-

tiva, tende-se a alcancar uma configuracao de Rede Neural que seja uma solucao quase

otima (senao otima) para o problema em questao.

Neste sentido, o Sistema Hıbrido Inteligente AG+RNA segue a ideia de tecnicas de

intensificacao, onde o ponto forte do AG, a busca por parametros em um espaco de

possibilidades imenso, consegue suprir o ponto fraco das RNAs, o ajuste adequado dos

seus parametros, que por definicao constituem um universo de possibilidades tao grande

que torna-se inviavel uma busca completa direta pelos melhores valores para o ajuste.

Desta forma, um indivıduo da populacao do AG e uma RNA, onde o seu cromossomo

e uma codificacao para os seus parametros (numero de camadas escondidas, quantidade

de neuronios em cada camada, funcoes de ativacao, quantidade de conexoes, algoritmos

de treinamento, dentre outros).

Existem basicamente duas abordagens possıveis com este sistema. Na primeira, as

RNAs entram apenas com o modelo funcional, e o AG ajusta todos os seus parametros,

inclusive o valor dos pesos, executando tanto a tarefa de ajuste da topologia como o

processo de treinamento da rede. Na segunda possibilidade, o AG ajusta apenas os

parametros estaticos a rede, inclusive com a possibilidade de escolha do algoritmo de

treinamento. Este segundo procedimento e considerado como um treinamento hıbrido,

pois a rede e projetada pelo AG, mas e treinada de forma convencional.

CAPITULO 4

CARACTERIZACAO DAS SERIES TEMPORAIS

UTILIZADAS

Neste Capıtulo sao descritas as series temporais utilizadas como conjunto de testes apli-

cado aos experimentos descritos nos proximos capıtulos. Para cada uma das series e

apresentada uma pequena descricao e a motivacao em adota-las.

4.1 INTRODUCAO

O foco principal do trabalho desenvolvido e a apresentacao de uma nova metodologia

na abordagem do problema de previsao de series temporais. Por este motivo, faz-se ne-

cessaria a utilizacao de um conjunto de series temporais que sirva como teste (benchmark)

para comparacoes dos resultados obtidos com as tecnicas distintas investigadas.

Para tal, um conjunto de series artificiais e reais (mundo real), com caracterısticas

particulares e relevantes em termos de complexidade, representatividade, variabilidade e

aplicacao pratica foi eleito para investigacao, compreendendo as series:

• Serie do Mapa de Henon – serie artificial sem ruıdo;

• Serie das Manchas Solares (Sunspot) – serie do mundo real;

• Serie de Medidas do Brilho de uma Estrela – serie do mundo real;

• Serie do Indice Dow Jones Industrial Average (DJIA) – serie do mundo real;

• Serie do Indice Nasdaq – serie do mundo real;

• Serie do Indice S&P500 – serie do mundo real;

• Serie do valor de Fechamento das Acoes da Petrobras (PetrobrasON) – serie do

mundo real;

• Serie Random Walk – serie artificial com ruıdo.

51

4.2 SERIE DO MAPA DE HENON 52

4.2 SERIE DO MAPA DE HENON

A serie do Mapa de Henon e um mapa iterativo e inversıvel em duas dimensoes com

solucoes caoticas proposto pelo astronomo frances Michel Henon em 1976 [88] como um

modelo simplificado para o mapa de Poincare [21] para o modelo de Lorenz de atratores.

O mapa de Henon e comumente estudado em sistemas dinamicos. Nas engenharias,

matematica e fısica, tais sistemas sao constituıdos por processos determinısticos onde

suas funcoes tem seus valores alterados no tempo segundo regras definidas a partir dos

proprios valores atuais destas mesmas funcoes.

A serie do Mapa de Henon utilizada e composta por 10000 pontos, gerados a partir

da Equacao (.) com a = 1.4, b = 0.3 e sem a inclusao de ruıdo (termos em r sao nulos),

como mostra a Figura 4.1. Os valores dos parametros a e b determinam as caracterısticas

do mapa de Henon, onde os valores adotados geram um comportamento caotico.

Zt = 1 − a(Zt−2 − rt−2)2 + b(Zt−4 − rt−4) (.)

0 50 100 150 200 250 300 350 400 450 500−1.5

−1

−0.5

0

0.5

1

1.5

Figura 4.1: Grafico da serie do Mapa de Henon (500 primeiros pontos).

Pode-se notar claramente da Equacao (.) que os retardos temporais relevantes sao

t − 2 e t − 4, tidos como os de relevancia primaria e naturalmente eleitos com os mais

importantes. Metodos de escolha de retardos temporais com dependencias unicamente

primarias, como o δ-Test [18], elegem apenas estes dois lags como importantes. Contudo,

4.2 SERIE DO MAPA DE HENON 53

0 0.5 10

0.5

1

Z(t

)

Z(t−1)0 0.5 1

0

0.5

1

Z(t

)

Z(t−2)0 0.5 1

0

0.5

1

Z(t

)

Z(t−3)

0 0.5 10

0.5

1Z

(t)

Z(t−4)0 0.5 1

0

0.5

1

Z(t

)

Z(t−5)0 0.5 1

0

0.5

1

Z(t

)

Z(t−6)

0 0.5 10

0.5

1

Z(t

)

Z(t−7)0 0.5 1

0

0.5

1

Z(t

)

Z(t−8)0 0.5 1

0

0.5

1

Z(t

)

Z(t−9)

Figura 4.2: Lagplot para o mapa Henon do lag 1 ao 9.

com a utilizacao do metodo de lagplot e possıvel notar a existencia de retardos de alta

ordem que ainda contem informacao a respeito do atrator que governa a dinamica dos

pontos, como mostra a Figura 4.2. Desta forma, tais lags de ordens superiores devem

ser levados em consideracao para um melhor desempenho da previsao. Entretanto, com

o aumento da quantidade de lags, tambem ha um aumento no custo computacional dos

metodos utilizados para a previsao e uma diminuicao efetiva dos pontos que poderao ser

utilizados para o processo de treinamento do preditor. Embora a quantidade de pontos

para o caso do mapa de Henon nao seja crıtica, em outras series tal fator pode ser crucial.

Esta serie do mapa de Henon foi escolhida por ser utilizada em uma grande quantidade

de trabalhos encontrados na literatura [18, 89–93], servindo assim como uma referencia

para comparacoes. Alguns valores tıpicos e estatısticas da serie sao encontrados na Ta-

bela 4.1.

Tabela 4.1: Valores tıpicos e algumas estatısticas da serie do mapa de Henon utilizada.

Estatısticas Valores

Quantidade de Pontos 10000Valor Maximo 1.2729Valor Mınimo -1.2845Valor Medio 0.2538Variancia 0.5231

Desvio Padrao 0.7232

4.3 SERIE DAS MANCHAS SOLARES (SUNSPOT) 54

4.3 SERIE DAS MANCHAS SOLARES (SUNSPOT)

Em 1610, logo apos observar o sol com o seu telescopio, Galileo Galilei realizou a primeira

observacao europeia de manchas solares. As manchas solares sao regioes escuras na

superfıcie do sol, como detalha a imagem construıda pela NASA (National Aeronautics

and Space Administration) atraves da observacao solar, mostrada na Figura 4.3.

Figura 4.3: Imagem da superfıcie solar, construıda pela NASA, onde sao apresentadosgrupos de manchas solares, destacados pelos cırculos tracejados.

A temperatura no centro das regioes escuras chega a cair para 3700oK (a temperatura

da superfıcie do sol e em torno de 5700oK). Estas manchas duram tipicamente alguns

dias, podendo, algumas delas, durar ate algumas semanas.

As manchas solares sao regioes na superfıcie do sol com campos magneticos de magni-

tude milhares de vezes maior do que o campo magnetico da Terra, geralmente apresentando-

se em grupos. De forma sistematica, as observacoes diarias das manchas solares foram

inicializadas no seculo XVIII, mais precisamente em 1746, sendo o numero de manchas

utilizado para a construcao da serie calculado pela contagem do numero de grupos e o

numero de manchas individuais, seguindo a seguinte expressao,

R = k(10G + S) (.)

onde S e o numero de manchas individuais, G e o numero de grupos de manchas e k e

uma fator de qualidade, utilizado depois da comparacao dos resultados das medidas de

varios pontos de observacoes diferentes.

A serie das manchas solares, ou sunspots, utilizada nesta tese sao as totalizacoes anu-

ais das manchas solares entre os anos de 1700 e 1988, compondo 289 pontos. Esta serie e

bastante famosa na literatura de previsao por ter sido uma das primeiras a serem estuda-

das e tambem devido a sua nao linearidade e difıcil previsao. Na Figura 4.4 e mostrado

4.4 SERIE DE MEDIDAS DO BRILHO DE UMA ESTRELA 55

um grafico da serie, onde claramente pode-se notar o seu comportamento nao linear. Na

literatura e possıvel encontrar uma grande quantidade de trabalhos relacionados com a

previsao desta serie [84, 94–96].

1700 1750 1800 1850 1900 1950 20000

20

40

60

80

100

120

140

160

180

200

Anos

Qua

ntid

ade

de M

anch

as S

olar

es

Figura 4.4: Grafico da serie das Manchas Solares (Sunspot) — medidas anuais.

Com a utilizacao do metodo δ-Test [18] sao determinados que os lags 1 e 2 sao os

relevantes. Contudo, analisando tambem o lagplot para esta serie nao fica claro o apare-

cimento de alguma estrutura nos dados, como mostra a Figura 4.5, sendo extremamente

difıcil a confirmacao da relevancia para os lags sugerido pelo δ-Test. Alguns valores de

estatısticas da serie sao encontrados na Tabela 4.2.

Tabela 4.2: Valores tıpicos e algumas estatısticas da serie das Manchas Solares (Sunspots).


Quantidade de Pontos 289Valor Maximo 190.2000Valor Mınimo 0.0000Valor Medio 48.6135Variancia 1558.2000


4.4 SERIE DE MEDIDAS DO BRILHO DE UMA ESTRELA

A serie de medidas do brilho de uma estrela e uma serie natural com observacoes diarias

da intensidade luminosa de uma estrela de brilho oscilante, realizadas sempre no mesmo

4.4 SERIE DE MEDIDAS DO BRILHO DE UMA ESTRELA 56

0 0.5 10

0.5

1

Z(t

)

Z(t−1)0 0.5 1

0

0.5

1

Z(t

)

Z(t−2)0 0.5 1

0

0.5

1

Z(t

)

Z(t−3)

0 0.5 10

0.5

1Z

(t)

Z(t−4)0 0.5 1

0

0.5

1

Z(t

)

Z(t−5)0 0.5 1

0

0.5

1

Z(t

)

Z(t−6)

0 0.5 10

0.5

1

Z(t

)

Z(t−7)0 0.5 1

0

0.5

1

Z(t

)

Z(t−8)0 0.5 1

0

0.5

1

Z(t

)

Z(t−9)

Figura 4.5: Lagplot para a serie das Manchas Solares do lag 1 ao 9.

local e mesma hora.

Esta serie e constituıda por 600 pontos e o seu grafico e mostrado na Figura 4.6.

Utilizando o metodo do δ-Test, sao obtidos como retardos temporais relevantes os lags

1 e 2, contudo analisando o lagplot desta serie, como mostrado na Figura 4.7, todos os

retardos observados (lags 1 ao 9) apresentam uma clara estrutura nao-linear, indicando

que todos estes retardos contem informacoes a respeito da dinamica temporal da serie.

0 100 200 300 400 500 6000

5

10

15

20

25

30

35

Medidas

Val

or d

e B

rilho

(u.

a.)

Figura 4.6: Grafico da serie de medidas do brilho de uma estrela.

4.5 SERIE DO INDICE DOW JONES INDUSTRIAL AVERAGE (DJIA) 57

0 0.5 10

0.5

1

Z(t

)

Z(t−1)0 0.5 1

0

0.5

1

Z(t

)

Z(t−2)0 0.5 1

0

0.5

1

Z(t

)

Z(t−3)

0 0.5 10

0.5

1

Z(t

)

Z(t−4)0 0.5 1

0

0.5

1

Z(t

)

Z(t−5)0 0.5 1

0

0.5

1

Z(t

)

Z(t−6)

0 0.5 10

0.5

1

Z(t

)

Z(t−7)0 0.5 1

0

0.5

1

Z(t

)

Z(t−8)0 0.5 1

0

0.5

1

Z(t

)

Z(t−9)

Figura 4.7: Lagplot para a serie de medidas do brilho de uma estrela do lag 1 ao 9.

Esta serie foi utilizada por Newton [97] como um estudo de caso e testes em modelos

estatısticos, e pode ser encontrada em [98]. Algumas estatısticas para esta serie sao

expostas na Tabela 4.3.

Tabela 4.3: Valores tıpicos e algumas estatısticas da serie de Medidas de Brilho de umaEstrela.




4.5 SERIE DO INDICE DOW JONES INDUSTRIAL AVERAGE (DJIA)

Quando Charles H. Dow mediu e monitorou o valor medio das acoes de industriais em

26 de maio de 1896, procurava na verdade ter o sentimento medio da evolucao e com-

portamento do mercado de valores, que nao estava ainda bem consolidado. Investidores

prudentes para esta epoca negociavam tıtulos que pagassem quantias previsıveis, e que

estivessem voltados a maquinaria real, construcoes de fabrica e outros recursos tangıveis.

Hoje, acoes sao habitualmente consideradas como veıculos de investimento, ate mesmo

por investidores considerados conservadores.


De forma geral, as informacoes que podem guiar grupos de investidores e trabalhado-

res comuns a tomarem suas decisoes de investimento estao abundantemente disponıveis

em varios meios de comunicacao e mıdia. O Indice Dow Jones Industrial Average teve

um papel chave em provocar uma forte mudanca na forma de se encarar o mercado de

acoes. Cem anos atras, ate mesmo investidores experientes em Wall Street achavam ex-

tremamente difıcil discernir a confusao diaria do sobe e desce dos valores dos papeis, nao

sabendo ao certo se uma dada acao estava realmente caindo ou subindo. Charles Dow

inventou um ındice medio para tentar dar algum sentido nesta confusao do sobe e desce.

Ele comecou em 1884 a analisar a media de 11 acoes, a maior parte delas referentes a

vias ferreas, que foram as primeiras grandes corporacoes americanas. Comparou o valor

medio de seu ındice ao procedimento de colocar varas na areia da praia para determinar,

depois de sucessivas ondas, se a mare esta enchendo ou secando. Se a media dos picos e

vales do ındice subiam progressivamente, entao, de forma geral, as empresas estavam se

valorizando; caso contrario estavam se desvalorizando.

O registro da dinamica das primeiras medias das acoes era ditado pela necessidade de

computa-los com papel e lapis: somam-se os precos e divide-se o resultado pelo numero

de acoes. Esta aplicacao de aritmetica elementar, porem criativa, foi apenas utilizada ha

pouco mais de um seculo dando a possibilidade de ter algum sentimento a respeito do

comportamento coletivo de um certo grupo de empresas.

O DJIA (Dow Jones Industrial Average) atual utiliza 30 acoes que representam todos

os importantes fatores industriais, consolidando um ındice capaz de refletir o comporta-

mento medio das acoes relativas ao parque industrial, nao so americano, mas tambem

relativo as grandes empresas multi-nacionais, que segue a tendencia de uma economia

globalizada.

A serie do ındice DJIA aqui utilizada e constituıda por observacoes diarias do ındice a

partir de primeiro de janeiro de 1998 ate 26 de agosto de 2003, totalizando 1420 pontos.

Aplicando o metodo δ-Test para esta serie e encontrado como retardo temporal relevante

apenas o lag 1. Construindo tambem um lagplot e verificado que do lag 1 ao lag 9 existe

um forte relacionamento linear (Figura 4.9) mas a medida que se aumenta o grau do

retardo, ha o aparecimento de uma estrutura, aproximadamente no centro dos graficos.

Esta observacao pode vir a indicar algum relacionamento nao linear ou simplesmente

um aumento na perda de correlacao entre os pontos, visto que tambem e observado um

crescimento na variancia relativa a espessura das “linhas”, a medida que se aumenta

a ordem dos lags. E muito difıcil, simplesmente atraves da analise visual dos graficos


gerados pelo lagplot, definir qual das duas interpretacoes descritas acima e a correta,

contudo com o resultado do δ-Test, a hipotese da perda de correlacao entre os pontos a

medida que se aumenta o grau dos lags e fortalecida, uma vez que o δ-Test, a priori, e

capaz de capturar todas as correlacoes primarias entre os pontos da serie.

Algumas estatısticas basicas para a serie DJIA aqui utilizada podem ser encontradas

na Tabela 4.4.

0 200 400 600 800 1000 1200 14007000

7500

8000

8500

9000

9500

10000

10500

11000

11500

12000

Observaçoes Diarias

Val

or d

o D

JIA

Figura 4.8: Grafico da serie do Indice Dow Jones Industrial Average.

0 0.5 10

0.5

1

Z(t

)

Z(t−1)0 0.5 1

0

0.5

1

Z(t

)

Z(t−2)0 0.5 1

0

0.5

1

Z(t

)

Z(t−3)

0 0.5 10

0.5

1

Z(t

)

Z(t−4)0 0.5 1

0

0.5

1

Z(t

)

Z(t−5)0 0.5 1

0

0.5

1

Z(t

)

Z(t−6)

0 0.5 10

0.5

1

Z(t

)

Z(t−7)0 0.5 1

0

0.5

1

Z(t

)

Z(t−8)0 0.5 1

0

0.5

1

Z(t

)

Z(t−9)

Figura 4.9: Lagplot para a serie do Indice Dow Jones Industrial Average do lag 1 ao 9.

4.6 SERIE DO INDICE NASDAQ 60

Tabela 4.4: Valores tıpicos e algumas estatısticas da serie do Indice Dow Jones IndustrialAverage.




4.6 SERIE DO INDICE NASDAQ

O ındice Nasdaq (National Association of Securities Dealers Automated Quotation) do

Mercado de Valores, fundado em 1971, foi o primeiro mercado de valores eletronico do

mundo. O proposito de sua fundacao foi a popularizacao do OTC (over-the-count) do

mercado, onde ate aquele ponto era relativamente desconhecido e novo para muitos in-

vestidores, consistindo em um ındice calculado a partir de um processo de ponderamento

de capitalizacao.

A serie aqui utilizada do Indice Nasdaq consiste em observacoes diarias desde 2 de

fevereiro de 1971 ate 18 de junho de 2004, totalizando 8428 pontos, onde a Figura 4.10

mostra o grafico da serie.

Aplicando o δ-Test, o unico retardo temporal relevante e o lag 1. Ja pelo metodo

lagplot (Figura 4.11), todos os lags de 1 a 9 tem, a priori, um mesmo comportamento,

aparentemente linear, onde todos podem contribuir para um melhor resultado em pre-

visoes. Algumas estatısticas basicas a respeito da serie sao encontradas na Tabela 4.5.

Tabela 4.5: Valores tıpicos e algumas estatısticas da serie do Indice Nasdaq.




4.7 SERIE DO INDICE S&P500 61

0 1000 2000 3000 4000 5000 6000 7000 80004

4.5

5

5.5

6

6.5

7

7.5

8

8.5

9

Medidas Diarias

Vav

or d

a N

asda

q

Figura 4.10: Grafico da serie do Indice Nasdaq.

0 0.5 10

0.2

0.4

0.6

0.8

Z(t

)

Z(t−1)0 0.5 1

0

0.2

0.4

0.6

0.8

Z(t

)

Z(t−2)0 0.5 1

0

0.2

0.4

0.6

0.8

Z(t

)

Z(t−3)

0 0.5 10

0.2

0.4

0.6

0.8

Z(t

)

Z(t−4)0 0.5 1

0

0.2

0.4

0.6

0.8

Z(t

)

Z(t−5)0 0.5 1

0

0.2

0.4

0.6

0.8

Z(t

)

Z(t−6)

0 0.5 10

0.2

0.4

0.6

0.8

Z(t

)

Z(t−7)0 0.5 1

0

0.2

0.4

0.6

0.8

Z(t

)

Z(t−8)0 0.5 1

0

0.2

0.4

0.6

0.8

Z(t

)

Z(t−9)

Figura 4.11: Lagplot para a serie do Indice Nasdaq do lag 1 ao 9.

4.7 SERIE DO INDICE S&P500

O Indice S&P500 (Standard & Poor 500 ) e um ındice ponderado de valores de mercado

de 500 acoes que sao negociadas no New York Stock Exchange (NYSE), American Stock

Exchange (AMEX), e no Nasdaq National Market System. O ponderamento faz as in-

fluencias de cada companhia sobre a apresentacao do ındice ser diretamente proporcional

ao seu valor de mercado. As companhias selecionadas para compor o Indice S&P500

4.7 SERIE DO INDICE S&P500 62

nao sao escolhidas apenas pelo fato de serem as maiores em termos de valor de mercado,

ou vendas, ou lucros. Ademais, estas companhias incluıdas no ındice tendem a ser de

industrias representativas dentro de importantes ramos da economia norte americana.

Usando este metodo, e possıvel fazer correcoes absolutas para divisoes e mudancas de

capital similares sem afetar a continuidade do ındice ou a importancia relativa da acao

sobre o ındice como um todo. Deste modo, o Padrao “500” evita as distorcoes criadas

pela utilizacao de medias simples com e o caso dos ındices Dow Jones e Nasdaq.

A serie S&P500 utilizada e composta por 369 pontos referentes as observacoes mensais

do ındice de janeiro de 1970 a agosto de 2003. Na Figura 4.12 e mostrado o grafico para

a serie utilizada.

0 50 100 150 200 250 300 3500

500

1000

1500

2000

2500

3000

3500

4000

4500

5000

Observaçoes Mensais

Val

or S

&P

500

Figura 4.12: Grafico da serie do Indice S&P500.

Aplicando-se o metodo do δ-Test para esta serie e encontrado como retardo temporal

relevante apenas o lag 1. Construindo o lagplot para os lags de 1 a 9 (Figura 4.13) ha

o aparecimento de estruturas com uma forte tendencia linear, contudo, a medida que se

aumenta o grau dos lags, nota-se o aparecimento de uma estrutura na parte superior dos

graficos, podendo vir a caracterizar algum relacionamento nao-linear. Entretanto devido

ao resultado do δ-Test assumir apenas a correlacao do primeiro lag, tais estruturas podem

vir a significar apenas um aumento na perda de correlacao entre os pontos.

Algumas estatısticas basicas a respeito da serie S&P500 utilizada podem ser encon-

tradas na Tabela 4.6.

4.8 SERIE DO VALOR DE FECHAMENTO DAS ACOES DA PETROBRAS 63

0 0.2 0.40

0.1

0.2

0.3

0.4

Z(t

)

Z(t−1)0 0.2 0.4

0

0.1

0.2

0.3

0.4

Z(t

)

Z(t−2)0 0.2 0.4

0

0.1

0.2

0.3

0.4

Z(t

)

Z(t−3)

0 0.2 0.40

0.1

0.2

0.3

0.4

Z(t

)

Z(t−4)0 0.2 0.4

0

0.1

0.2

0.3

0.4

Z(t

)

Z(t−5)0 0.2 0.4

0

0.1

0.2

0.3

0.4

Z(t

)

Z(t−6)

0 0.2 0.40

0.1

0.2

0.3

0.4

Z(t

)

Z(t−7)0 0.2 0.4

0

0.1

0.2

0.3

0.4

Z(t

)

Z(t−8)0 0.2 0.4

0

0.1

0.2

0.3

0.4

Z(t

)

Z(t−9)

Figura 4.13: Lagplot para a serie do Indice S&P500 do lag 1 ao 9.

Tabela 4.6: Valores tıpicos e algumas estatısticas da serie do Indice S&P500.




4.8 SERIE DO VALOR DE FECHAMENTO DAS ACOES DA PETROBRAS

A serie da Petrobras e constituıda por registros diarios referentes ao valor de fechamento

das acoes da Petrobras (PetrobrasON - Codigo da Bovespa PETR3) de 2 de janeiro de

1995 ate 3 de julho de 2003, totalizando 2086 pontos.

A Petrobras e uma empresa brasileira de prospeccao, extracao e refino de petroleo

de grande destaque a nıvel internacional, principalmente em tecnologia de extracao de

petroleo em aguas de alta profundidade, sendo tambem uma das maiores empresas bra-

sileiras, merecendo atencao no mercado de valores.

A Figura 4.14 mostra o grafico da serie das acoes da Petrobras. Aplicando o metodo

do δ-Test a esta serie e encontrado como retardo temporal relevante apenas o lag 1,

enquanto com o lagplot para os lags de 1 a 9, Figura 4.15, percebe-se novamente que

existe uma forte componente linear do lag 1 ao 9. Porem, e possıvel perceber a formacao

de uma estrutura nao-linear aproximadamente no centro dos graficos a medida que se

4.9 RANDOM WALK 64

avanca no grau dos lags, vindo novamente a contradizer o resultado obtido pelo δ-Test.

0 200 400 600 800 1000 1200 1400 1600 1800 20000

10

20

30

40

50

60

70

Observaçoes Diarias

Val

or d

a P

etro

bras

ON

Figura 4.14: Grafico da serie da Acoes da Petrobras.

0 0.5 10

0.2

0.4

0.6

0.8

Z(t

)

Z(t−1)0 0.5 1

0

0.2

0.4

0.6

0.8

Z(t

)

Z(t−2)0 0.5 1

0

0.2

0.4

0.6

0.8

Z(t

)

Z(t−3)

0 0.5 10

0.2

0.4

0.6

0.8

Z(t

)

Z(t−4)0 0.5 1

0

0.2

0.4

0.6

0.8

Z(t

)

Z(t−5)0 0.5 1

0

0.2

0.4

0.6

0.8

Z(t

)

Z(t−6)

0 0.5 10

0.2

0.4

0.6

0.8

Z(t

)

Z(t−7)0 0.5 1

0

0.2

0.4

0.6

0.8

Z(t

)

Z(t−8)0 0.5 1

0

0.2

0.4

0.6

0.8

Z(t

)

Z(t−9)

Figura 4.15: Lagplot para a serie das Acoes da Petrobras do lag 1 ao 9.

Na Tabela 4.7 sao mostrados os valores de algumas estatısticas basicas a respeito da

serie dos valores de fechamento da acoes da Petrobras.

4.9 RANDOM WALK

Devido a grande complexidade do sistema associado a dinamica que rege o comporta-

mento de series economicas e financeiras, e comum se considerar como primeira apro-

4.9 RANDOM WALK 65

Tabela 4.7: Valores tıpicos e algumas estatısticas da serie do Valor de Fechamento daAcoes da Petrobras.




ximacao para um dado valor futuro de uma serie, o respectivo valor atual mais ou me-

nos uma pequena flutuacao. Este modelo e exatamente um Random Walk, ou tambem

chamado simplesmente de “caminhada aleatoria”, que pode ser representado como um

modelo mostrado na Equacao (.),

Zt = Zt−1 + rt (.)

onde rt e um termo aleatorio.

Neste sentido, foi gerado artificialmente um conjunto de 1000 pontos (Figura 4.16)

seguindo o modelo da Equacao (.), onde o valor inicial para a serie foi Z0 = 100 e

o termo aleatorio (rt) foi construıdo a partir de uma distribuicao uniforme de numeros

aleatorios no intervalo [-10,10].

A este conjunto de pontos gerados pelo modelo de Random Walk foi aplicado o metodo

δ-Test, que determinou como retardo temporal relevante o lag 1, e o metodo lagplot, para

os lags de 1 a 9 (Figura 4.17), revelou um comportamento linear para todos os nove

lags. Observando os graficos do lagplot, a medida que se aumenta o grau dos lags ha um

aumento na variancia dos pontos (largura das “linhas retas”), o que esta de acordo com

o modelo de um Random Walk onde sua variancia aumenta linearmente com o horizonte

de previsao. Algumas estatısticas basicas para esta serie tipo Random Walk podem ser

encontradas na Tabela 4.8.

4.9.1 O Modelo Random Walk e as Series Financeiras

Pode-se verificar que o comportamento das series economicas e financeiras tratadas (DJIA,

Nasdq, S&P500, Petrobras) assemelha-se a serie artificial gerada pelo modelo de Random

4.9 RANDOM WALK 66

0 100 200 300 400 500 600 700 800 900 100030

40

50

60

70

80

90

100

110

120

130

Pontos

Ran

dom

Wal

k

Figura 4.16: Grafico da serie artificial gerada pelo modelo de Random Walk referente aEquacao (.).

0 0.5 10

0.5

1

Z(t

)

Z(t−1)0 0.5 1

0

0.5

1

Z(t

)

Z(t−2)0 0.5 1

0

0.5

1

Z(t

)

Z(t−3)

0 0.5 10

0.5

1

Z(t

)

Z(t−4)0 0.5 1

0

0.5

1

Z(t

)

Z(t−5)0 0.5 1

0

0.5

1

Z(t

)

Z(t−6)

0 0.5 10

0.5

1

Z(t

)

Z(t−7)0 0.5 1

0

0.5

1

Z(t

)

Z(t−8)0 0.5 1

0

0.5

1

Z(t

)

Z(t−9)

Figura 4.17: Lagplot para a serie artificial gerada pelo modelo de Random Walk referentea Equacao (.) do lag 1 ao 9.

Walk, Equacao (.), segundo os resultados obtidos pelos metodos δ-Test e lagplot. Con-

tudo, ao comparar tais resultados obtidos pelo lagplot, verifica-se tambem que tais series

economicas, exceto a Nasdaq, apresentam um indıcio de aparecimento de uma estrutura

nao-linear de relacionamento entre os pontos a medida que se aumenta o grau dos lags.

Este fato pode vir a indicar que tais series economicas sejam formadas por duas com-

ponentes, uma componente linear, bastante sensıvel a acontecimentos ocorridos em um

4.10 MEDIDAS DE DESEMPENHO PARA A PREVISAO 67

Tabela 4.8: Valores tıpicos e algumas estatısticas da serie artificial gerada pelo modelode Random Walk referente a Equacao (.).




passado extremamente recente, sendo responsavel pelo comportamento aparentemente

aleatorio (Random Walk); e uma componente nao-linear, referente a acontecimentos de

longo prazo, ou de um comportamento medio da serie, que e responsavel pelo apareci-

mento das estruturas nao-lineares nos graficos dos lagplots a medida que se aumenta o

grau dos lags.

Seguindo esta linha de raciocınio, series economicas e financeiras sao dominadas pela

componente linear de Random Walk devido a propria magnitude relativa entre as estrutu-

ras lineares e nao-lineares. Assim, para previsoes de horizontes pequenos um modelo tao

simples apresenta resultados bastante eficientes, que leva as aplicacoes praticas considera-

rem como relevantes apenas um historico pequeno de dados relativos as series, capturando

apenas o comportamento linear do fenomeno. Contudo, segundo estes indıcios apresen-

tados, e possıvel melhorar o grau de desempenho de previsao considerando nao apenas a

componente linear, mas tambem a componente nao-linear com o uso de historicos maio-

res de dados, podendo englobar um comportamento mais geral do fenomeno que governa

a serie, e, aliado a este historico mais completo, um modelo capaz de reconhecer tais

estruturas nao-linear aparentemente tao sutis.

4.10 MEDIDAS DE DESEMPENHO PARA A PREVISAO

Para o problema de previsao, a medida de desempenho natural e a propria previsao

alcancada. Entretanto, nao existe uma forma unica nem universalmente adotada pelos

pesquisadores da area para a avaliacao da previsao.

As medidas de desempenho sao frequentemente definidas em termos do erro de pre-

visao, o qual e formulado como a diferenca entre o valor atual da serie (ou valor dese-

jado — target) e o valor previsto (ou valor de saıda do modelo —output), definido pela


Equacao (.),

et = (targett − outputt) (.)

Da Equacao (.) escreve-se a medida mais popular utilizada para o desempenho de

previsao,

MSE =1

N

N∑

t=1

(et)2 (.)

onde N e a quantidade de pontos da serie temporal.

Embora o erro MSE (Mean Square Error) possa ser utilizado como parametro de

medida de qualidade da previsao realizada, este nao exibe, de forma clara, o comporta-

mento do modelo de previsao, gerando polemica quanto ao seu uso [99]. Desta forma,

para uma melhor compreensao e analise dos modelos de previsao, serao utilizadas outras

medidas de desempenho em conjunto com o MSE, gerando uma base mais consolidada

de resultados.

Dentre as medidas adotadas, tem-se o Erro Medio Percentual (Mean Absolute Per-

centual Error – MAPE),

MAPE =1

N

N∑

t=1

∣∣∣∣et

Zt

∣∣∣∣ (.)

onde N e a quantidade de pontos previstos, et e o erro dado pela Equacao (.) e Zt e o

ponto da serie no instante t.

Outra medida de desempenho e a estatıstica U de Theil (ou NMSE) [100], que se

baseia no MSE do preditor normalizado pelo erro de previsao de um modelo do tipo

Random Walk. Um modelo Random Walk simplesmente assume que o melhor valor de

previsao para o tempo t + 1 e o valor obtido no tempo t. Portanto, a estatıstica U de

Theil e dada por,

Theil =

∑N

t=1(targett − outputt)2

∑N

t=1(outputt − outputt−1)2(.)

onde se Theil = 1 o modelo tem um desempenho igual a um modelo do tipo Random

Walk ; se Theil > 1 o desempenho e inferior a um modelo do tipo Random Walk ; e, se

Theil < 1, o preditor tera um desempenho superior a um modelo do tipo Random Walk.

Em um modelo ideal, a estatıstica U de Theil deve tender a zero.

Outra medida de desempenho e a medida da previsao da alteracao da direcao, ou

seja, se o valor futuro ira subir ou cair em relacao ao valor atual. A medida POCID


(Prediction On Change In Direction) mede o percentual de acerto quanto a tendencia da

serie, definida por,

POCID = 100

∑N

t=1 Dt

N(.)

onde,

Dt =

{1, se (Targett − Targett−1) · (Outputt − Outputt−1) > 0

0, Caso contrario(.)

Uma medida de desempenho relativa bem relevante e a Variancia Relativa Media

(ARV), dada por,

ARV =1

N

∑N

t=1(outputt − targett)2

∑N

t=1(outputt − target)2(.)

onde N e a quantidade de pontos preditos, targett e a saıda desejada para o modelo

preditor no tempo t, outputt e a saıda do modelo de preditor e target e a media da serie

temporal.

A medida ARV ira medir o ganho de desempenho de previsao do modelo relativo a

uma previsao da media da serie, onde se ARV = 1, entao o modelo e equivalente a se

calcular a media da serie e utilizar esta como previsao. Se ARV > 1, entao o modelo e

inferior a previsao realizada pela media da serie, e por fim, se ARV < 1, entao o modelo

tem um desempenho de previsao superior quando comparado a previsao atraves da media

da serie. Em um modelo ideal ARV deve tender a zero.

Contudo, todas estas medidas de desempenho exibidas ate entao nao levam em con-

sideracao a quantidade de graus de liberdade, ou parametros de ajuste, que o modelo

contem. Quanto maior a quantidade de parametros livres, maior a possibilidade de

super-estimacao (ou overfitting).

Os criterios de informacao AIC (Akaike Information criterion) [101,102] e BIC (Bay-

sean Information criterion) [64,102] levam em consideracao a quantidade de parametros

livres do sistema, penalizando o modelo de forma proporcional a sua quantidade de

parametros livres. Estes criterios podem ser definidos de forma aproximada como [102],

AIC = −Nln(MSE) + 2p (.)

BIC = Nln(MSE) + p + pln(N) (.)


Tanto o AIC como o BIC penalizam os parametros livres no modelo, porem o BIC

pune estes parametros de forma mais severa que o AIC, e por essa razao pode ser preferido

como criterio de comparacao e escolha de modelos [102].

CAPITULO 5

RESULTADOS EXPERIMENTAIS COM METODOS

TRADICIONAIS

Neste Capıtulo sao apresentados os resultados experimentais com os metodos ditos con-

vencionais — modelos de Box & Jenkins e a tecnica da Inteligencia Artificial mais popular,

as Redes Neurais Artificiais do tipo MLP.

Os modelos de Box & Jenkins sao as tecnicas mais populares no ramo da estatıstica

para a previsao de series temporais, sendo o ponto de partida para um bom entendimento

das leis que regem um determinado fenomeno temporal. Ja as Redes Neurais Artificiais

do Tipo MLP sao tecnicas relativamente novas (paradigma cognitivo da Inteligencia Arti-

ficial), porem aplicadas ha mais de uma decada a previsao, sendo a forma mais encontrada

na literatura de utilizar a Inteligencia Artificial na resolucao deste problema.

5.1 INTRODUCAO

Dadas as series temporais introduzidas no Capıtulo 4, estarao sendo mostrados nas

proximas secoes deste Capıtulo os experimentos de previsao realizados com os modelos

de Box & Jenkins e com as Redes Neurais do tipo MLP .

Inicialmente, foram realizados experimentos com os modelos lineares de Box & Jen-

kins, construindo uma base de resultados utilizada como ponto de partida para as com-

paracoes de desempenho com os demais metodos investigados. E interessante ressaltar

que os modelos de Box & Jenkins sao, em termos praticos, bastante aplicados como sis-

temas de apoio a decisao baseados na determinacao de acontecimentos futuros. Desta

forma, aliado ao fato da baixa complexidade computacional, os modelos de Box & Jen-

kins geram um limiar de resultados que deverao ser ultrapassados para que uma nova

metodologia adquira interesse em aplicacoes praticas.

Em seguida e apresentada uma serie de experimentos que utilizam unicamente as

RNAs do tipo MLP como preditores, sendo estes resultados analisados e comparados

71

5.2 EXPERIMENTOS COM OS MODELOS DE BOX & JENKINS 72

com os resultados gerados a partir dos experimentos dos modelos de Box & Jenkins.

5.2 EXPERIMENTOS COM OS MODELOS DE BOX & JENKINS

Foram realizados alguns experimentos com os modelos de Box & Jenkins (ARIMA(p, d, q))

para a obtencao de resultados provenientes de modelos estatısticos lineares bem funda-

mentados, servindo como base para comparacoes de desempenho de previsao com os

demais modelos nao-lineares utilizados.

Para a realizacao destes experimentos foi utilizada a ferramenta MatLab, versao 6.5

(R.13), com a toolbox ARMASA. Esta toolbox e de distribuicao livre e pode ser encontrada

para download no endereco eletronico http://www.dcsc.tudelft.nl/Research/Software/. Sua

proposta basica e calcular os coeficientes dos operadores utilizados na construcao dos mo-

delos ARMA(p,q), otimizando-os a partir do desempenho de previsao.

Em todos os experimentos realizados com os modelos de Box & Jenkins, as series

temporais foram divididas em dois conjuntos: o conjunto de treinamento, utilizado para

o ajuste dos parametros do modelo, e o conjunto de teste, utilizado para medir o desem-

penho de previsao do modelo, respeitando sempre a proporcao de 90% e 10% dos dados

historicos das series para os dois conjuntos respectivamente. Tambem foi realizada um

normalizacao das series para o intervalo [0,1], utilizando a Equacao (.), na tentativa de

padronizacao de algumas medidas de desempenho, como o MSE.

5.2.1 Serie do Mapa de Henon

Para a serie de Henon foi selecionado o modelo ARIMA(26,0,1), onde os coeficientes

auto-regressivos e de medias moveis sao expostos no Apendice C.

Na Tabela 5.1 sao apresentados os resultados obtidos atraves das medidas de de-

sempenho de previsao, tanto para o conjunto de treinamento como para o de teste.

Analisando os resultados alcancados com o modelo ARIMA(26,0,1), o Erro MSE por

si so nao apresenta uma boa descricao das caracterısticas do sistema, mas serve como

parametro de medida, indicando um desempenho para o conjunto de teste de 0.3625.

O Erro MAPE da um melhor sentimento quanto ao comportamento da previsao em

relacao ao valor real da serie que para o conjunto de teste apresentou um valor muito alto


(404.53%) demonstrando um fraco desempenho do modelo.

Tabela 5.1: Medidas de Desempenho de previsao para o modelo ARIMA(26,0,1) aplicadoa serie de Henon

Erros Conjunto de Treinamento Conjunto de Teste

MSE 0.3637 0.3625MAPE 446.07% 404.53%

U de Theil 2.2905 2.2709POCID 48.8943% 48.9489%ARV 4.5077 4.2811AIC -5028.9 -5045.4BIC -4923.6 -4940.2

O valor alcancado pela estatıstica U de Theil, que gera um limiar de comparacao com

um modelo do tipo Random Walk, mostra que o modelo aplicado a serie de Henon tem

um desempenho bem pior do que o desempenho de um modelo extremamente simplista

(Random Walk), obtendo um valor de 2.2709 para o conjunto de teste.

A medida POCID, que relata o acerto da direcao (subida ou queda) do ponto previsto

em relacao ao ponto real, tambem mostra resultados muito pobres (conjunto de teste

— 48.9489%), visto que ha uma chance de 50% de acertar a direcao do proximo ponto

utilizando uma suposicao ao acaso (experimento do tipo cara ou coroa).

A medida ARV, que compara o desempenho do modelo com a previsao media da serie,

revela que este modelo e bem inferior a utilizacao do valor medio da serie com previsao.

Os criterios de informacao, AIC e BIC, da mesma forma como o Erro MSE, por si

so nao dao um bom sentimento a respeito da previsao, mas servem como parametros de

comparacao de desempenho entre modelos de forma bem mais robusta que o MSE, uma

vez que levam em consideracao a quantidade de graus de liberdade de cada modelo, como

ja descrito no Capıtulo 4. O AIC teve como resultados para o conjunto de teste -5045.4;

e o BIC para o conjunto de teste -4940.2.

Na Figura 5.1 e mostrado um grafico comparativo para os ultimos 100 pontos do con-

junto de teste entre os valores reais da seria (linha solidas) e a previsao (linha tracejada).


910 920 930 940 950 960 970 980 990 1000−2

−1.5

−1

−0.5

0

0.5

1

1.5

2

Hen

on

Pontos − Conjunto de Teste

Figura 5.1: Grafico comparativo entre os valores reais (linha solida) e os valores deprevisao (linha tracejada) gerados pelo modelo de Box & Jenkins para os ultimos 100pontos do conjunto de teste da serie de Henon.

5.2.2 Serie das Manchas Solares

Para a serie das Manchas Solares foi selecionado o modelo ARIMA(9,0,1), cujos coefi-

cientes auto-regressivos e de medias moveis sao apresentados no Apendice C.

Na Figura 5.2 e mostrado um grafico comparativo para o conjunto de teste entre os

valores reais da serie (linha solida) e a previsao (linha tracejada). As mesmas medidas

de desempenho de previsao utilizadas na serie de Henon tambem foram aplicadas a esta

serie, resumidas na Tabela 5.2. De forma geral, as medidas de desempenho apresentam

resultados superiores quando comparados com a serie de Henon, podendo vir a indicar

que o modelo de Box & Jenkins melhor se ajusta para sua predicao.

Tabela 5.2: Medidas de Desempenho de previsao para o modelo ARIMA(9,0,1) aplicadoa serie das Manchas Solares.


MSE 0.0153 0.0219MAPE 57.03% 42.35%



0 5 10 15 20 25 30−20

0

20

40

60

80

100

120

140

160

Man

chas

Sol

ares


Figura 5.2: Grafico comparativo entre os valores reais (linha solida) e os valores deprevisao gerados pelo modelo de Box & Jenkins (linha tracejada) para o conjunto deteste da serie das Manchas Solares.

Analisando os resultados para o conjunto de teste, pode-se destacar tres medidas de

desempenjo, o POCID, ARV e a estatıstica U de Theil. Para o POCID tem-se resultados

expressivos de 75.0000%, bem superiores em comparacao aos 50% obtidos por uma pre-

visao tipo cara ou coroa. Para a medida do ARV foram alcancados os valores de 0.4007,

demonstrando uma previsao bem superior a suposicao do valor medio. Ja a estatıstica U

de Theil (0.7805), mostra que este modelo alcanca uma melhor generalizacao, tornando-se

mais apto do que um Random Walk. As demais medidas de desempenho foram, MSE –

0.0219; MAPE – 42.35%; AIC – -92.8323; e BIC – -71.5266.

5.2.3 Serie de Medidas do Brilho de uma Estrela

Para a serie de Medidas do Brilho de uma Estrela foi selecionado o modelo ARIMA(88, 0,

0), que apesar da grande quantidade de parametros auto-regressivos, consegue ter um bom

desempenho nas previsoes. Os parametros selecionados sao mostrados no Apendice C.

Na Figura 5.3 e exibido um grafico comparativo para o conjunto de teste entre os valo-

res reais da serie (linha solidas) e a previsao (linha tracejada). As medidas de desempenho

de previsao ja utilizadas nas demais series tambem foram aplicadas, e sao resumidas na

Tabela 5.3. Para esta serie em particular as medidas de desempenho mostram resultados

bem superiores quando comparados de forma relativa as outras, vindo a indicar que, a


despeito da nao-linearidade da serie, os modelos de Box & Jenkins conseguem descrever

relativamente bem o fenomeno.

0 10 20 30 40 50 600

5

10

15

20

25

30

35

Bril

ho d

e um

a E

stre

laV

alor

de

Bril

ho (

u.a.

)


Figura 5.3: Grafico comparativo entre os valores reais (linha solida) e os valores deprevisao gerados pelo modelo de Box & Jenkins (linha tracejada) para o conjunto deteste da serie de Medidas do Brilho de uma Estrela.

Tabela 5.3: Medidas de Desempenho de previsao para o modelo ARIMA(88,0,0) aplicadoa serie de Medidas do Brilho de uma Estrela.

Erros Conjunto de Treino Conjunto de Teste

MSE 2.0484e-4 3.9004e-4MAPE 3.05% 9.36%


Destas medidas para o conjunto de teste, podem-se destacar tres: a estatıstica U

de Theil, POCID e ARV. A estatıstica U de Theil mostra o valor de 0.0679, indicando

um desempenho de uma ordem de grandeza superior a um Random Walk. O POCID

tambem apresenta resultados expressivos de 100.00%, e a medida ARV revela o superior

desempenho de previsao quando comparado a uma previsao baseada na media da serie,

alcancando o valor de 0.0035.

Para as demais medidas, sempre em relacao ao conjunto de teste, o MSE alcancou o

valor de 3.9004e-4; o MAPE, que e um erro absoluto percentual, alcancou um valor de


9.36%, sendo bons resultados, considerando-se a nao-linearidade da serie. O criterio de

informacao AIC alcancou -294.9564, e o criterio de informacao BIC -22.6541.

5.2.4 Serie do Indice Dow Jones Industrial Average (DJIA)

Para a serie do Indice Dow Jones Industrial Average (DJIA) foi selecionado o modelo

de Box & Jenkins ARIMA(1,0,1), onde o coeficiente auto-regressivo e o coeficiente de

medias moveis sao dados no Apendice C.

Um grafico comparativo entre a serie real DJIA (linha solida) e a previsao gerada

pelo modelo ARIMA(1, 0, 1) (linha tracejada) e exibido na Figura 5.4, onde e possıvel

perceber que a previsao nao e capaz de acompanhar as flutuacoes de alta frequencia

da serie, refletindo apenas um comportamento medio. Nota-se tambem que em alguns

pontos a previsao tenta repetir, ou se aproxima, do ponto imediatamente anterior (no

tempo) da serie real, caracterizando um comportamento do tipo Random Walk.

0 20 40 60 80 100 120 1407500

8000

8500

9000

9500

DJI

A


Figura 5.4: Grafico comparativo entre os valores reais (linha solida) e os valores deprevisao gerados pelo modelo de Box & Jenkins (linha tracejada) para o conjunto deteste da serie do Indice Dow Jones Industrial Average (DJIA).

Quanto as medidas de desempenho, exibidas na Tabela 5.4, embora apresentem para

o conjunto de teste um MSE de 5.8033e-4 e um MAPE de 8.32%, exibem um valor para

a estatıstica U de Theil de 1.2649, indicando que o modelo tem um desempenho inferior

a um Random Walk, e um POCID 46.0993%, assemelhando-se a um experimento do tipo

cara ou coroa. Ja a medida ARV apresenta valores que indicam uma previsao superior

quando comparada a media da serie, com valor de 0.0392. Tambem sao apresentados os


Tabela 5.4: Medidas de Desempenho de previsao para o modelo ARIMA(1,0,1) aplicadoa serie do Indice Dow Jones Industrial Average (DJIA).


MSE 0.0011 5.8033e-4MAPE 6.47% 8.32%


resultados para os criterios de informacoes AIC (-1056.2) e BIC (-1052.2).

5.2.5 Serie do Indice Nasdaq

Para a serie do Indice Nasdaq os experimentos com os modelos Box & Jenkins elegeram

o modelo ARIMA(44,0,1), onde os coeficientes auto-regressivos e de medias moveis sao

dados no Apendice C.

Tabela 5.5: Medidas de desempenho de previsao para o modelo ARIMA(44,0,1) aplicadoa serie do Indice Nasdaq.


MSE 8.4070e-6 2.4222e-5MAPE 0.92% 0.50%

U de Theil 1.4558 1.2702POCID 58.6443% 50.4751%ARV 1.5036e-4 0.0162AIC -88542.0 -8871.6BIC -88193.0 -8619.2

Graficos comparativos entre a serie real (linha solida) e a previsao gerada pelo modelo

ARIMA(44,0,1) (linha tracejada) sao mostrados na Figura 5.5 e Figura 5.6. Observando

a Figura 5.5 (grafico comparativo para todo o conjunto de teste — 842 pontos) exibe

um bom ajuste visual da previsao aos valores reais. Entretanto, realizando uma am-

pliacao neste grafico, Figura 5.6, e possıvel perceber que a previsao executa apenas o

comportamento medio da serie, defasada no tempo, assemelhando-se ao comportamento

de um modelo do tipo Random Walk, justificando os resultados obtidos pelas medidas de

desempenho da estatıstica U de Theil e POCID, resumidas na Tabela 5.5.


0 100 200 300 400 500 600 700 8007

7.1

7.2

7.3

7.4

7.5

7.6

7.7

7.8

7.9

8

Nas

daq


Figura 5.5: Grafico comparativo entre os valores reais (linha solida) e os valores deprevisao gerados pelo modelo de Box & Jenkins (linha tracejada) para o conjunto deteste da serie do Indice Nasdaq.

700 720 740 760 780 800 820 8407

7.1

7.2

7.3

7.4

7.5

7.6

7.7

7.8

7.9

8

Nas

daq


Figura 5.6: Grafico comparativo entre os valores reais (linha solida) e a previsao geradapelo modelo ARIMA (linha tracejada) para os ultimos 142 pontos do conjunto de testedo Indice Nasdaq.

5.2.6 Serie do Indice S&P500

Para a serie do Indice S&P500 os experimentos com os modelos de Box & Jenkins elegeram

o modelo ARIMA(1, 0, 1), onde o coeficiente auto-regressivo e o coeficiente de medias

moveis sao dados no Apendice C.


Um grafico comparativo entre a serie real (linha solida) e a previsao do modelo

ARIMA(1, 0, 1) (linha tracejada) e mostrado na Figura 5.7. O modelo de Box & Jenkins

apenas preve o comportamento medio da serie, nao respondendo as flutuacoes de alta

frequencia, apresentando um aparente deslocamento temporal (de um passo) em relacao

aos pontos reais, assemelhando-se a um modelo do tipo Random Walk. Os valores das

medidas de desempenho sao mostrados na Tabela 5.6.

Tabela 5.6: Medidas de Desempenho de previsao para o modelo ARIMA(1,0,1) aplicadoa serie do Indice S&P500.


MSE 1.8430e-4 2.1447e-4MAPE 14.85% 1.24%


0 5 10 15 20 25 30 357.8

7.9

8

8.1

8.2

8.3

8.4

8.5

S&

P50

0


Figura 5.7: Grafico comparativo entre os valores reais (linha solida) e os valores deprevisao gerados pelo modelo de Box & Jenkins (linha tracejada) para o conjunto deteste da serie do Indice S&P500.

Para o conjunto de teste, o erro MSE alcancado foi de 2.1447e-4 e o erro MAPE

obteve 1.24%. Contudo, calculando a estatıstica U de Theil e obtido o valor de 1.4090.

Estes resultados informam que o modelo ARIMA(1,0,1) em questao e bem inferior a

um modelo do tipo Random Walk. O POCID de 47.2222% constata que este modelo

tambem e equivalente a um experimento do tipo cara ou coroa, afirmando ao acaso se o


proximo ponto da serie ira subir ou cair em relacao ao atual. A medida ARV mostra que

embora este modelo se comporte como um Random Walk ainda e superior a uma simples

previsao baseada na media da serie, alcancando o valor de 0.1374. Por fim, os criterios

de informacao AIC e BIC obtiveram respectivamente -310.5510 e -307.9400.

5.2.7 Serie do Valor de Fechamento das Acoes da Petrobras

O modelo eleito nos experimentos de Box & Jenkins para a serie do valor de fechamento

das acoes da Petrobras (PetrobrasON) foi o ARIMA(2, 0, 1), onde os coeficientes auto-

regressivos e de medias moveis sao dados no Apendice C.

Um grafico comparativo entre os valores da serie (linha solida) e os valores de previsao

gerados pelo modelo ARIMA (2, 0, 1) (linha tracejada) e mostrado na Figura 5.8. Nota-

se que o modelo adotado so representa um comportamento medio, nao respondendo as

flutuacoes de alta frequencia, defasado temporalmente (de um passo) em relacao aos

pontos reais, demonstrando um comportamento usual de modelos do tipo Random Walk.

As medidas de desempenho, sumarizadas na Tabela 5.7, mostram para o conjunto de

teste um erro MSE de 2.5532e-4 e um erro MAPE de 1.41%. Ao se calcular a estatıstica

U de Theil, tem-se o valor de 4.0261, indicando que este modelo ARIMA e bem inferior

a um modelo do tipo Random Walk.

A medida POCID obteve 49.0385% para o conjunto de teste, indicando que este

modelo funciona como um experimento do tipo cara ou coroa. A medida ARV obteve

0.2080 e, por fim, os criterios de informacao AIC e BIC alcancaram os valores -1723.1 e

-1710.0 respectivamente.

Tabela 5.7: Medidas de desempenho de previsao para o modelo ARIMA(2,0,1) aplicadoa serie do Valor de Fechamento das Acoes da Petrobras.


MSE 4.9763e-4 2.5532e-4MAPE 4.89% 1.41%



0 20 40 60 80 100 120 140 160 180 2003.5

3.6

3.7

3.8

3.9

4

4.1

Pet

robr

asO

N


Figura 5.8: Grafico comparativo entre os valores reais (linha solida) e os valores deprevisao gerados pelo modelo de Box & Jenkins (linha tracejada) para o conjunto deteste da serie do Valor de Fechamento das Acoes da Petrobras.

5.2.8 Serie Random Walk

Aplicando o procedimento de Box & Jenkins a serie Random Walk, o modelo ARIMA(1, 0,

1) e selecionado como o de melhor desempenho (coeficientes apresentados no Apendice C).

Um grafico comparativo entre os pontos reais da serie (linha solida) e os pontos gerados

pelo modelo ARIMA(1,0,1) (linha tracejada) e exposto na Figura 5.9, onde o modelo em

questao so e capaz de gerar o comportamento medio da serie com um deslocamento

temporal (de um passo).

As medidas de desempenho alcancadas sao expostas na Tabela 5.8. Para o conjunto

de teste, o erro MSE computado foi de 0.0018 e o erro MAPE de 6.70%. A estatıstica

U de Theil alcancou um valor de 1.7633, mostrando que este modelo e inferior a simples

suposicao de que a melhor previsao e o ultimo valor gerado pela serie – suposicao de Ran-

dom Walk. O POCID computado foi de 54.5455%, indicando que este modelo funciona

como um experimento do tipo cara ou coroa. A medida ARV alcancou 0.1921, indicando

um desempenho superior ao da previsao da serie com a utilizacao de seu valor medio.

Por fim, os criterios de informacoes AIC e BIC foram respectivamente de -629.7357 e

-626.1305.

5.3 EXPERIMENTOS COM REDES NEURAIS ARTIFICIAIS DO TIPO MLP 83

0 10 20 30 40 50 60 70 80 90 100−20

0

20

40

60

80

100

120

140

160

Hen

on


Figura 5.9: Grafico comparativo entre os valores reais (linha solida) e os valores deprevisao gerados pelo modelo de Box & Jenkins (linha tracejada) para o conjunto deteste da serie Random Walk.

Tabela 5.8: Medidas de desempenho de previsao para o modelo ARIMA(1,0,1) aplicadoa serie Random Walk.


MSE 0.0014 0.0018MAPE 7.77% 6.70%


5.3 EXPERIMENTOS COM REDES NEURAIS ARTIFICIAIS DO TIPO MLP

As redes neurais artificiais do tipo MLP [27] foram selecionadas para os experimentos

de previsao pela sua popularidade e eficiencia demonstrada na solucao de problemas de

previsao [10]. A arquitetura basica utilizada para todos os experimentos consiste em uma

rede neural MLP de tres camadas (uma camada de entrada, uma camada intermediaria e

uma camada de saıda), descrita com a notacao a-b-c, onde a e a quantidade de entradas,

b e a quantidade de neuronios na camada escondida e c e a quantidade de saıdas da rede.

A quantidade de entradas das redes e definida pela quantidade de retardos tempo-

rais utilizados para a descricao da serie. Para a definicao dos retardos temporais foram

utilizados o metodo δ-Test [18], os graficos de lagplot e alguns experimentos preliminares.


A quantidade de neuronios escondidos foi determinada atraves de uma serie de ex-

perimentos preliminares, a partir dos quais foram eleitas tres configuracoes: 1, 5 e 10

neuronios. Ja a quantidade de saıdas das redes para todos os experimentos foi sempre

unitaria, visto que todos os experimentos com as RNAs objetivaram a previsao de apenas

um passo (horizonte da previsao unitario).

Em todos os experimentos a funcao sigmoide logıstica foi adotada como funcao de

ativacao para a camada intermediaria, Equacao (.). Ja para a camada de saıda foi

adotada a funcao linear, Equacao (.). O algoritmo de treinamento utilizado, para

todos os experimentos, foi o Levenberg-Marquardt [75].

A validacao cruzada foi utilizada em todos os experimentos (Proben1 [49]), com tres

criterios de parada:

1. Quantidade de Epocas no Processo de Treinamento - Quantidade maxima

de epocas realizadas no treinamento. Foi assumido um valor de 500 epocas.

2. Progresso do Treinamento - Desempenho mınimo requerido para a continuidade

do processo de treinamento. Foi assumido um valor de 10−6.

3. Erro de Validacao - Perda de generalizacao, definida pela quantidade maxima

permitida de acrescimo para o erro de validacao em relacao ao seu valor mınimo

durante o processo de treinamento. Foi assumido uma variacao aceitavel de 5%.

Todos os experimentos com as redes neurais foram desenvolvidos e implementados

com a ferramenta MatLab 6.5 (Release 13), com a utilizacao da toolbox de redes neurais

(Artificial Neural Network Toolbox ). Para cada arquitetura utilizada nos experimentos

foram executadas dez inicializacoes distintas, com o objetivo de obter um comportamento

medio do modelo. Os resultados para todos os experimentos e todas as medidas de

desempenho sao exibidos Apendice D, onde sao calculados os respectivos valores medios,

desvios padroes e intervalos de confianca. Todos os intervalos de confianca sao calculados

com a suposicao de distribuicao normal com um grau de certeza de 99% (α = 0.01).

Os experimentos foram realizados com uma constante preocupacao para a obtencao

de redes com um melhor desempenho de previsao possıvel, com o objetivo de garantir

uma comparacao de resultados entre modelos otimizados.

Nas proximas subsecoes sao expostos os resultados medios para as series temporais


apresentadas no Capıtulo 4. Os resultados completos para todas as dez inicializacoes para

cada uma das arquiteturas das RNAs, para todas as series, sao exibidos no Apendice D.


Para a serie do mapa de Henon foram escolhidos como retardos temporais relevantes os

lags 1 ao 4 baseado nos resultados obtidos a partir do metodo δ−Test e da propria equacao

geradora da serie (Equacao (.)), produzindo as arquiteturas 4-1-1, 4-5-1 e 4-10-1.

Na Tabela 5.9 sao mostrados os resultados para as medias (x) e desvios padroes (σx)

das medidas de desempenho para as dez inicializacoes com cada uma das tres arquiteturas

escolhidas. Os resultados completos sao exibidos na Tabela D.1 — Apendice D.

Tabela 5.9: Medias (x) e desvios padroes (σx) das medidas de desempenho relativas asdez inicializacoes das RNAs utilizadas para a previsao da serie do Mapa de Henon

Arq. ErrosTreinamento Validacao Teste

x σx x σx x σx

4-1-1

MSE 0.1918 0.0000 0.2032 3.1e-5 0.1946 0.0000MAPE(%) 26.11 0.0300 75.73 4.8e-3 31.20 0.0000

Theil 0.1847 4.8e-5 0.1946 4.8e-5 0.1863 0.0000POCID(%) 71.03 0.0105 70.82 0.00 70.50 0.0000

ARV 0.3671 0.0000 0.3878 0.0000 0.3717 0.0000AIC -8239.0 0.3178 -3968.1 0.00 -4076.3 0.1434BIC -8186.4 0.3307 -3920.3 0.00 -4076.3 0.1595

4-5-1

MSE 9.9037e-9 8.3072e-9 1.0452e-8 9.0475e-7 1.0170e-6 8.7536e-7MAPE(%) 2.8607e-6 2.0749e-6 4.6503e-6 3.1671e-6 3.1019e-6 1.9392e-6

Theil 9.5346e-9 7.9975e-9 1.0010e-8 8.6654e-9 9.7350e-9 8.3795e-9POCID(%) 100.00 0.0000 100.00 0.0000 100.00 0.0000

ARV 1.9100e-8 1.6000e-8 1.9943e-8 1.7263e-8 1.9425e-8 1.6720e-8AIC -93686.4 4.6190e3 -46712.7 2.3589e3 -46764.8 2.3219e3BIC -93453.4 4.6190e3 -46501.2 2.3589e3 -46553.3 2.3219e3

4-10-1

MSE 8.9144e-8 9.0285e-8 9.2092e-8 9.5720e-8 9.1649e-8 9.3140e-8MAPE(%) 2.4239e-7 2.7756e-7 3.7125e-7 4.7505e-7 2.4369e-7 2.6697e-7

Theil 8.5822e-10 8.6920e-10 8.8202e-10 9.1677e-10 8.7733e-10 8.9160e-10POCID(%) 100.00 0.0000 100.00 0.0000 100.00 0.0000

ARV 1.7061e-9 1.7279e-9 1.7572e-9 1.8264e-9 1.7505e-9 1.7790e-9AIC -106734.5 6.2459e3 -53247.9 -5283.1 -53239.4 3.1190e3BIC -106276.0 6.2459e3 3.1226e3 3.1226e3 -52823.2 3.1190e3

Nos experimentos foram utilizados tres conjuntos, o conjunto de treinamento para o

ajuste dos pesos da RNA, o conjunto de validacao para determinar o momento de parada

do processo de treinamento, e o conjunto de teste para determinar o desempenho de

previsao da rede. Desta forma, a partir dos resultados do conjunto de teste, observa-se


que a arquitetura 4-10-1 (inicializacao 1) alcancou os melhores resultados, sendo estes bem

superiores aos resultados obtidos pelo modelo ARIMA(26,0,1) (Tabela 5.1). A Tabela 5.10

mostra a comparacao entre os resultados alcancados nos experimentos de Box & Jenkins

e das RNAs. Se o valor da medida de desempenho alcancado nos experimentos de Box

& Jenkins estiver abaixo do intervalo de confianca da respectiva medida para as RNAs,

e dito que as RNAs tem um desempenho superior naquela determinada medida. Se, por

outro lado, o valor da medida de desempenho dos modelos de Box & Jenkins estiver acima

do intervalo de confianca para as RNAs, e dito que o modelo de Box & Jenkins tem um

desempenho superior. E por fim, se o valor de desempenho do modelo de Box & Jenkins

estiver contido no intervalo de confianca para a medida de desempenho das RNAs e dito

que ambos os modelos tem desempenhos semelhantes.

O fato de todas as medias das medidas de desempenho para a RNA terem alcancados

baixos valores de desvio padrao implica estabilidade, ou seja, as dez inicializacoes da

RNA 4-10-1 convergiram para resultados proximos.

Tabela 5.10: Resultados experimentais (conjunto de teste) com os melhores modelos (Box& Jenkins e RNAs) para a serie de Henon.

Erros Box & Jenkins RNA Melhor Modelo

MSE 0.3625 4.0840e-9 RNAMAPE 404.53% 1.0349e-8% RNA

U de Theil 2.2709 3.9090e-11 RNAPOCID 48.9489% 100.00% RNAARV 4.2811 7.8006e-11 RNAAIC -5045.4 -59657.5 RNABIC -4940.2 -59241.3 RNA

Um grafico comparativo entre os valores reais da serie (linha solida) e a previsao

gerada pela melhor rede (linha tracejada) para os ultimos 100 pontos do conjunto de

teste e mostrado na Figura 5.10.

Como mostram os proprios resultados, obtidos nas Tabelas 5.9 e D.1, a previsao gerada

pela RNA tem um alto grau de concordancia com a realidade, mostrando-se indistinguıvel

dos pontos reais da serie na Figura 5.10. Nota-se que a rede neural consegue capturar

todas as informacoes necessarias para a correta descricao do processo gerador da serie.


2400 2410 2420 2430 2440 2450 2460 2470 2480 2490 2500−1.5

−1

−0.5

0

0.5

1

1.5

Pontos

Hen

on

Figura 5.10: Serie do Mapa de Henon (linha solida) e a previsao gerada pela rede neural(linha tracejada) para os ultimos 100 pontos do conjunto de teste.

5.3.2 Series das Manchas Solares

Para a serie das manchas solares foram escolhidos os retardos temporais 1 ao 3 como

relevantes, gerando as arquiteturas 3-1-1, 3-5-1 3-10-1 para as redes.

Na Tabela 5.11 sao mostrados os resultados das medias e desvios padroes para as me-

didas de desempenho das dez inicializacoes com cada uma das tres arquiteturas escolhidas

para as RNAs, sendo os resultados completos exibidos na Tabela D.2 (Apendice D).

Comparando-se as inicializacoes para cada uma das arquiteturas das redes, a inicia-

lizacao 1 da arquitetura 3-1-1 e a inicializacao 9 da arquitetura 3-5-1 estao empatadas em

quantidades de medidas de desempenho favoraveis a cada uma. Entretanto, levando-se

em consideracao a estatıstica U de Theil e a Medida de POCID, elege-se o melhor modelo

como a inicializacao 9 da rede 3-5-1.

Um grafico comparativo entre a serie real (linha solida) e a serie prevista (linha trace-

jada) pela rede 3-5-1 (inicializacao 9), para o conjunto de teste, e mostrado na Figura 5.11.

Observando este grafico, nota-se que a rede neural e capaz de capturar o comportamento

global do fenomeno gerador da serie, com um grafico de previsao visualmente mais bem

ajustado quando comparado aos modelos de Box & Jenkins (Figura 5.3).

Comparando-se o melhor modelo das redes neurais e o modelo eleito de Box & Jenkins

e possıvel afirmar que o modelo mais adequado e o baseado em redes neurais. Abstraindo-


Tabela 5.11: Medias (x) e desvios padroes (σx) para as medidas de desempenho relativasas dez inicializacoes das RNAs utilizadas para a previsao da serie das Manchas Solares.


x σx x σx x σx

3-1-1

MSE 0.5570 0.0067 0.5781 0.0125 0.0139 0.0002MAPE(%) 4.30 0.30 4.42 0.34 3.85 0.09

Theil 0.4574 0.0055 0.4806 0.0104 0.5205 0.0073POCID(%) 71.13 0.3320 66.62 0.6803 73.29 0.9642

ARV 0.1659 1.9879e-3 0.1899 4.1011e-3 0.2144 2.9985e-3AIC -730.2 1.7012 -359.0 1.5946 -291.5 9.9605e-1BIC -706.5 1.7012 -339.4 1.5946 -272.0 9.9605e-1

3-5-1

MSE 0.4384 0.0246 0.5072 0.0144 0.1978 0.3921MAPE(%) 3.64 0.31 3.90 0.41 2.94 0.29

Theil 0.3601 0.0202 0.4216 0.0120 0.4244 0.0497POCID(%) 76.97 8.2732 70.85 2.2071 85.71 2.7766

ARV 0.1306 7.3246e-3 0.1666 4.7263e-3 0.1748 2.0484e-2AIC -724.7 8.2732 -328.5 2.0534 -266.5 8.4602BIC -621.6 8.2732 -243.3 2.0534 -181.6 8.4602

3-10-1

MSE 0.4311 0.0179 0.5280 0.0112 0.5595 0.4737MAPE(%) 3.30 0.18 3.79 0.32 2.65 0.15

Theil 0.3541 0.0147 0.4389 0.0094 0.3635 0.0287POCID(%) 76.13 0.8431 70.56 1.9300 84.71 0.0287

ARV 0.1284 5.3066e-3 0.1734 3.7091e-3 0.1497 1.1823e-2AIC -677.0 6.0819 -275.6 1.5216 -227.2 5.5417BIC -474.9 6.0819 -108.5 1.5216 -60.8 5.5417

0 10 20 30 40 50 60 700

20

40

60

80

100

120

140

160

180

200


Man

chas

Sol

ares

Figura 5.11: Grafico comparativo entre os valores reais (linha solida) e os valores previstospela RNA (linha tracejada) para a serie das Manchas Solares.

se do fato das diferentes divisoes entre os conjuntos de dados nos experimentos com as

redes neurais e nos experimentos com Box & Jenkins, utiliza-se o conjunto de teste para

as comparacoes de desempenho. A Tabela 5.12 destaca os resultados para ambos os


modelos e mostra o modelo da RNA com 6 medidas a seu favor contra apenas uma para

os modelos de Box & Jenkins.

Tabela 5.12: Resultados experimentais (conjunto de teste) com os melhores modelos (Box& Jenkins e RNAs) para a serie das Manchas Solares.


MSE 0.0219 0.9205 Box & JenkinsMAPE 42.35% 2.41% RNA

U de Theil 0.7805 0.3443 RNAPOCID 75.000% 90.0000% RNAARV 0.4007 0.1418 RNAAIC -92.8323 -280.9 RNABIC -71.5266 -196.0 RNA


Para a serie de medidas do brilho de uma estrela foram escolhidos os retardos temporais

1 ao 3 como relevantes e as arquiteturas 3-1-1, 3-5-1 e 3-10-1 para as RNAs.

Na Tabela 5.13 sao mostrados os resultados das medias e os respectivos desvios padroes

das medidas de desempenho para as dez inicializacoes das arquiteturas das RNAs. Os

resultados completos sao sumarizados na Tabela D.3 (Apendice D).

Comparando-se os valores medios dos resultados obtidos pelas medidas de desem-

penho, e possıvel observar que as arquiteturas estudadas tem desempenhos semelhantes.

Contudo, analisando-se experimento a experimento (Tabela D.3 – Apendice D), elege-se

a inicializacao 3 da arquitetura 3-5-1 como o melhor modelo dentre os testados.

Um grafico comparativo entre os pontos reais (linha solida) e a previsao (linha tra-

cejada) gerada pelo melhor modelo (inicializacao 3 - arquitetura 3-5-1) e exposto na

Figura 5.12. Pode-se perceber que a rede consegue capturar o comportamento da serie,

realizando uma boa predicao.

Comparando-se os resultados do melhor modelo das RNAs com o modelo de Box &

Jenkins, as RNAs apresentam um desempenho de previsao superior. A Tabela 5.14 exibe

os resultados obtidos tanto pelo modelo ARIMA como para o melhor modelo de RNA.


Tabela 5.13: Medias (x) e desvios padroes (σx) das medidas de desempenho dos experi-mentos com as RNAs para a previsao da serie de Medidas do Brilho de uma Estrela.


x σx x σx x σx

3-1-1

MSE 0.0234 0.0000 0.0256 0.0000 0.0237 0.0000MAPE(%) 0.07 0.00 0.09 0.00 0.09 0.00

Theil 0.0605 0.0000 0.0658 0.0000 0.0640 4.2e-5POCID(%) 76.85 0.0000 73.65 0.0000 73.65 0.0000

ARV 3.3883e-3 2.2336e-7 3.7030e-3 2.1318e-7 3.3777e-3 7.6920e-7AIC -2487.1 0.0000 -1220.5 0.0000 -1232.1 0.0422BIC -2458.9 0.0000 -1196.4 0.0516 -1208.0 0.0422

3-5-1

MSE 0.0231 0.0002 0.0253 0.0002 0.0235 7.9e-5MAPE(%) 0.06 3.2e-3 0.09 0.00 0.10 0.00

Theil 0.0597 0.0004 0.0652 0.0005 0.0636 0.0003POCID(%) 76.85 0.0000 73.78 0.2825 73.17 0.3285


3-10-1

MSE 0.0231 0.0001 0.0253 0.0002 0.0235 9.5e-5MAPE(%) 0.06 3.2e-3 0.09 0.00 0.10 0.00

Theil 0.0597 0.0004 0.0651 0.0005 0.0636 0.0002POCID(%) 76.85 0.0000 73.99 0.3531 73.04 0.2150


0 50 100 1500

5

10

15

20

25

30

35

Pontos − conjunto de Teste

Val

or d

e B

rolh

o (u

.a.)

Figura 5.12: Grafico comparativo entre a serie real de medidas do brilho de um estrela(linha solida) e a previsao gerada pela rede neural (linha tracejada).

5.3.4 Serie do Indice Dow Jones Industrial Average

Para a serie do ındice Dow Jones Industrial Average (DJIA) foram escolhidos os retardos

temporais do 1 ao 3 como relevantes e as arquiteturas 3-1-1, 3-5-1 e 3-10-1 para as RNAs.


Tabela 5.14: Resultados experimentais (conjunto de teste) com os melhores modelos (Box& Jenkins e RNAs) para a serie de medidas do brilho de uma estrela.


MSE 3.9004e-4 0.0234 Box & JenkinsMAPE 9.36% 0.10% RNA

U de Theil 0.0679 0.0632 RNAPOCID 100.00% 72.97% Box & JenkinsARV 0.0035 3.3357e-3 Desempenhos SemelhantesAIC -294.9564 -1193.9 RNABIC -22.6541 -1089.8 RNA

Tabela 5.15: Medias (x) e desvios padroes (σx) para as medidas de desempenho relativasas dez inicializacoes das RNAs utilizadas para a previsao da serie DJIA.


x σx x σx x σx

3-1-1

MSE 0.0677 0.0011 0.0851 0.0003 0.0835 0.0006MAPE(%) 0.19 0.00 0.15 0.00 0.38 0.00

Theil 0.9892 0.0159 0.9975 0.0034 0.9979 0.0072POCID(%) 50.48 0.1787 45.52 0.3789 46.83 0.2687


3-5-1

MSE 0.0674 0.0012 0.0851 0.0004 0.0844 0.0010MAPE(%) 0.19 0.00 0.15 0.00 0.39 0.01

Theil 0.9848 0.0182 0.9975 0.0053 1.0080 0.0122POCID(%) 50.48 0.2326 45.47 0.2407 46.74 0.3271


3-10-1

MSE 0.0667 0.0004 0.0854 0.0004 0.0846 0.0006MAPE(%) 0.19 0.00 0.15 0.00 0.39 0.01

Theil 0.9740 0.0057 1.0004 0.0046 1.0103 0.0074POCID(%) 50.49 0.2132 45.75 0.4062 46.94 0.2332


Na Tabela 5.15 sao apresentados os valores medios e os desvios padroes das medidas

de desempenho para os dez experimentos realizados com cada uma das arquiteturas das

redes, sendo os resultados completos apresentados na Tabela D.4 (Apendice D).

Dentre os modelos investigados, destaca-se a inicializacao 5 da arquitetura 3-1-1,

sendo este o modelo eleito para a previsao da serie DJIA. Um grafico comparativo entre

os valores reais (linha solida) e a previsao gerada por este modelo (linha tracejada) para

o conjunto de teste e mostrado na Figura 5.13a.


0 50 100 150 200 250 300 3507000

7500

8000

8500

9000

9500

10000

10500


DJI

A

(a) Conjunto de teste completo.

250 260 270 280 290 300 310 320 330 340 3507800

8000

8200

8400

8600

8800

9000

9200

9400

9600


DJI

A(b) Ultimos 100 pontos do conjunto de teste.

Figura 5.13: Serie real do DJIA (linha solida) e a previsao gerada pela rede neural (linhatracejada) para o conjunto de teste.

Observando-se a Figura 5.13a e possıvel notar que a rede neural utilizada como predi-

tor e capaz de capturar o comportamento global da serie, conseguindo tambem responder

as flutuacoes de alta frequencia. Contudo, embora o modelo seja capaz de descrever o

comportamento geral da serie, a previsao apresenta-se deslocada temporalmente de um

passo (fora de fase), caracterizando um modelo de previsao do tipo Random Walk (o valor

da serie no tempo t, mais ou menos um ruıdo, e usado para determinar o valor da serie no

tempo t + 1). Este comportamento e confirmado com o valor obtido para a medida da U

de Theil (≈ 1), podendo ser melhor visualizado com a ampliacao da Figura 5.13a, mos-

trada na Figura 5.13b. Nesta Figura sao visualizados os ultimos 104 pontos do conjunto

de teste da serie (linha solida) juntamente com sua previsao (linha tracejada).

Tal comportamento de Random Walk para as redes neurais quando aplicadas a pre-

visao de series economicas e financeiras ja foi observado por Sitte e Sitte [103], sendo

relatado tal efeito tanto para uma rede neural do tipo MLP como para redes recorrentes.

Na Tabela 5.16 sao exibidos os resultados das medidas de desempenho do melhor

modelo para os experimentos de Box & Jenkins e das RNAs. A RNA apresenta um

desempenho superior, com seis medidas a seu favor contra apenas uma em favor do

modelo ARIMA.


Tabela 5.16: Resultados experimentais (conjunto de teste) com os melhores modelos (Box& Jenkins e RNAs) para a serie DJIA.



U de Theil 1.2649 0.9878 RNAPOCID 46.10% 46.74% RNAARV 0.0392 3.4226e-2 RNAAIC -1056.2 -2500.7 RNABIC -1052.2 -2471.5 RNA


Para a serie do ındice Nasdaq foram escolhidos os retardos temporais 1 ao 3 como rele-

vantes, sendo novamente geradas as arquiteturas 3-1-1, 3-5-1 e 3-10-1 para as RNAs.

Na Tabela 5.17 sao exibidos os resultados medios, juntamente com os desvios padroes,

para as medidas de desempenho alcancadas com as RNAs para a serie do Indice Nasdaq.

Os resultados individuais dos experimentos sao sumarizados na Tabela D.5 (Apendice D).

Tabela 5.17: Medias (x) e desvios padroes (σx) para as medidas de desempenho relativasas dez inicializacoes das RNAs utilizadas para a previsao da serie do Indice Nasdaq.


x σx x σx x σx

3-1-1

MSE 0.0002 0.0000 0.0006 0.0004 0.0113 0.0271MAPE(%) 3.1233e-3 1.4067e-3 1.1200e-3 6.9404e-4 0.01 0.03

Theil 0.9273 0.1341 1.2859 0.9686 6.0507 14.4570POCID(%) 60.7932 0.0000 58.8931 0.1052 52.7886 0.0300


3-5-1

MSE 0.0004 0.0004 0.0004 0.0000 0.0074 0.0082MAPE(%) 3.9543e-3 4.0670e-3 9.1610e-4 3.9577e-5 8.5464e-3 9.2480e-3

Theil 1.3154 1.3567 0.9995 0.0567 3.9357 4.3789POCID(%) 60.8074 0.0200 58.7031 0.1778 52.9074 0.1207


3-10-1

MSE 0.0002 0.0000 0.0004 0.0000 0.0028 0.0003MAPE(%) 2.6724e-3 1.9862e-6 9.0370e-4 8.0160e-6 3.4168e-3 3.0909e-4

Theil 0.8846 0.0001 0.9833 0.0114 1.4947 0.1420POCID(%) 60.8169 0.0194 58.8504 0.1775 52.8124 0.1075



A partir da Tabela D.5 (Apendice D) elege-se o melhor modelo dentre os investigados.

Desta forma, a inicializacao 6 da rede 3-5-1 obteve os melhore resultados, sendo esta eleita

como o modelo mais apto para a previsao da serie do Indice Nasdaq.

Um grafico com a serie real (linha solida) e a previsao (linha tracejada) gerada pela

RNA e mostrado na Figura 5.14a. A partir do valores alcancados pela estatıstica U de

Theil e o POCID, a rede corresponde ao funcionado de um modelo do tipo Random Walk,

como evidencia a Figura 5.14b, que mostra os ultimos 106 pontos do conjunto de teste.

0 200 400 600 800 1000 1200 1400 1600 1800 20006.8

7

7.2

7.4

7.6

7.8

8

8.2

8.4

8.6

8.8


Nas

daq


2000 2010 2020 2030 2040 2050 2060 2070 2080 2090 21007.52

7.54

7.56

7.58

7.6

7.62

7.64

7.66

7.68

7.7


Nas

daq

(b) Ultimos 100 pontos do conjunto de teste.

Figura 5.14: Serie real do Indice Nasdaq (linha solida) e a previsao gerada pela redeneural (linha tracejada) para o conjunto de teste.

A partir da Tabela 5.18 e possıvel comparar o desempenho relativo entre os modelos

lineares e as redes neurais, observando-se que as RNAs apresentam um desempenho de

previsao superior.

Tabela 5.18: Resultados experimentais (conjunto de teste) com os melhores modelos (Box& Jenkins e RNAs) para a serie do Indice Nasdaq.


MSE 2.4222e-5 0.0022 Box & JenkinsMAPE 0.50% 2.6988e-3% RNA

U de Theil 1.2702 1.1728 Modelos SemelhantesPOCID 50.4751% 53.06% RNAARV 0.0162 3.4977e-3 Modelos SemelhantesAIC -8871.6 -22536.0 RNABIC -8619.2 -22363.1 RNA



Para a serie do ındice S&P500 foram escolhidos os retardos temporais 1 ao 3 como rele-

vantes e as arquiteturas 3-1-1, 3-5-1 e 3-10-1 para as RNAs.

Na Tabela 5.19 sao mostrados os valores medios e desvios padroes alcancados pelas me-

didas de desempenho para os experimentos com as RNAs para a serie do Indice S&P500.

Os resultados individuais dos experimentos sao exibidos na Tabela D.6 (Apendice D).

Tabela 5.19: Medias (x) e desvios padroes (σx) para as medidas de desempenho relativasas dez inicializacoes das RNAs utilizadas para a previsao da serie do Indice S&P500


x σx x σx x σx

3-1-1

MSE 0.0205 0.0288 0.0553 0.0465 0.2741 0.3384MAPE(%) 0.0063 0.0046 0.0009 0.0008 0.0164 0.0170

Theil 1.7556 2.4623 3.6548 3.0733 143.6136 147.8101POCID(%) 51.9231 0.3885 50.7692 0.6950 50.4444 1.4055

ARV 2.0874e-2 2.9278e-2 1.0563e-1 8.8829e-2 1.1396 1.1729AIC -1609.0 126.97 -703.2 69.547 -432.0 152.54BIC -1583.7 126.97 -682.1 69.547 -411.0 152.54

3-5-1

MSE 0.0394 0.0381 0.0449 0.0275 0.4740 0.3388MAPE(%) 0.0111 0.0086 0.0008 0.0005 0.0107 0.0095

Theil 3.3657 3.2598 2.9679 1.8150 94.1781 82.5274POCID(%) 51.8132 0.5821 49.7802 1.3755 49.6667 1.1771

ARV 4.0018e-2 3.8759e-2 8.5780e-2 5.2458e-2 0.7473 0.6549AIC -1451.7 161.62 -673.1 57.764 -397.9 75.553BIC -1342.2 161.62 -581.6 57.764 -306.6 75.553

3-10-1

MSE 0.0120 0.0014 0.0247 0.0246 0.1334 0.1213MAPE(%) 0.0052 0.0011 0.0004 0.0004 0.0039 0.0074

Theil 1.0269 0.1175 1.6327 1.6245 34.2393 64.6741POCID(%) 51.7033 0.1738 50.3297 0.6950 50.1111 0.9729

ARV 1.2210e-2 1.3973e-3 4.7190e-2 4.6955e-2 0.2717 0.5132AIC -1550.9 189.12 -683.4 55.398 -502.2 132.50BIC -1336.3 189.12 -503.8 55.398 -323.1 132.50

A partir dos experimentos das RNAs (Tabela D.6 – Apendice D) e possıvel identificar

a melhor inicializacao, elegendo-se a rede 3-10-1 (inicializacao 7) como o modelo mais

apto dentre os investigados.

Um grafico comparativo entre a serie real (linha solida) e a previsao (linha tracejada)

gerada pelo melhor modelo e mostrado na Figura 5.15. Como esperado, segundo as

medidas da estatıstica U de Theil e o POCID, o comportamento da rede neural apresenta

uma resposta defasada temporalmente em relacao aos valores reais — modelo do tipo

Random Walk. Tambem e possıvel notar que a rede nao responde adequadamente a


tendencia da serie, podendo vir a significar uma limitacao pelo uso de uma funcao de

ativacao linear na ultima camada da rede.

0 10 20 30 40 50 60 70 80 90 1001000

1500

2000

2500

3000

3500

4000

4500

5000


S&

P50

0

Figura 5.15: Grafico comparativo entre a serie real do Indice S&P500 (linha solida) e aprevisao gerada pela rede neural (linha tracejada) para o conjunto de teste.

Comparando-se os resultados alcancados pelas redes neurais e modelos de Box &

Jenkins, e possıvel notar que as RNAs apresentam um desempenho de previsao superior.

A Tabela 5.20 mostra os resultados para os melhores casos dos experimentos de Box &

Jenkins e das RNAs, com quatro medidas de desempenho em favor das RNAs contra

apenas uma medida a favor dos modelos de Box & Jenkins.

Tabela 5.20: Resultados experimentais (conjunto de teste) com os melhores modelos (Box& Jenkins e RNAs) para a serie do Indice S&P500.



U de Theil 1.4090 0.9166 Modelos SemelhantesPOCID 47.2222% 51.11% RNAARV 0.1374 7.2728e-3 RNAAIC -310.5510 -741.0 RNABIC -307.9400 -561.9 Modelos Semelhantes



Para a serie do valor de fechamento das acoes da Petrobras (PetrobrasON) foram eleitos

os retardos temporais 1 ao 3 como relevantes, utilizando novamente as arquiteturas 3-1-1,

3-5-1 e 3-10-1 para as RNAs.

Na Tabela 5.21 sao mostrados os valores medios e desvios padroes para as medidas de

desempenho dos experimentos realizados com as RNAs para a serie do valor de fechamento

das acoes da Petrobras. Os resultados para cada um destes experimentos sao apresentados

na Tabela D.7 (Apendice D).

Tabela 5.21: Medias (x) e desvios padroes (σx) das medidas de desempenho para as dezinicializacoes das RNAs utilizadas para a previsao da serie da Petrobras (PetreobrasON).


x σx x σx x σx

3-1-1

MSE 0.0161 0.0000 0.0698 0.0055 0.1583 0.0133MAPE(%) 0.08 0.00 0.08 0.01 0.17 0.01

Theil 0.9862 0.0001 10.4024 0.8121 25.1660 2.1089POCID(%) 47.8482 0.0304 54.4231 0.0000 51.4451 0.0000

ARV 4.6610e-3 2.8460e-7 3.5840e-2 2.7980e-3 1.4817 0.1242AIC -9091.0 7.0215e-2 -3775.7 45.414 -3343.2 4.9105e1BIC -9055.3 7.0215e-2 -3744.1 45.414 -3311.7 4.9105e1

3-5-1

MSE 0.0189 0.0071 0.0585 0.0179 0.1300 0.0542MAPE(%) 0.09 0.02 0.07 0.02 0.14 0.06

Theil 1.1617 0.4383 8.7203 2.6633 20.6645 8.6185POCID(%) 47.9635 0.1697 54.0000 0.2979 52.1580 0.6553

ARV 5.4903e-3 2.0717e-3 3.0045e-2 9.1759e-3 1.2167 0.5074AIC -8924.9 289.82 -3855.0 199.58 -3501.6 438.79BIC -8924.9 289.82 -3718.4 199.58 -3365.0 438.79

3-10-1

MSE 0.0342 0.0450 0.0459 0.0152 0.0901 0.0455MAPE(%) 0.17 0.22 0.06 0.02 0.10 0.05

Theil 2.0997 2.7635 6.8417 2.2574 14.3328 7.2323POCID(%) 48.2229 0.1432 54.0769 0.2689 51.9653 0.3524

ARV 9.9234e-3 1.3061e-2 2.3572e-2 7.7775e-3 0.8439 0.4258AIC -8602.0 775.67 -3931.5 190.21 -3651.1 4.2656e2BIC -8298.6 775.67 -3663.5 190.21 -3383.2 4.2656e2

Observando a Tabela D.7 (Apendice D) e possıvel eleger o melhor modelo das RNAs

investigadas segundo o conjunto de medidas de desempenho. Desta forma, a inicializacao

6 da arquitetura 3-10-1, segundo o conjunto de teste, alcancou os melhores valores para

as medidas de desempenho.

Entretanto, mesmo para esta melhor inicializacao, a previsao gerada pela RNA e

pior que as previsoes geradas por um modelo do tipo Random Walk — os valores da


estatıstica U de Theil para todos os conjuntos de dados sao bem superiores a 1. Este fato

vem a indicar que a um custo bem menor e possıvel se obter uma previsao equivalente,

ou melhor, assumindo-se apenas que o valor para a acao da Petrobras do futuro (tempo

t + 1) e o valor do presente (tempo t). Outro ponto negativo para o desempenho e

demonstrado pelo valor obtido pelo POCID, em torno de 50%, indicando que a rede esta

comportando-se de forma semelhante a um experimento do tipo cara ou coroa.

Um grafico comparativo entre os valores reais (linha solida) e a previsao gerada pela

melhor inicializacao (linha tracejada) das redes neurais, para o conjunto de teste da serie

do Valor de Fechamento das Acoes da Petrobras, e mostrado na Figura 5.16a. Novamente,

o comportamento da previsao, como esperado pelas medidas da estatıstica U de Theil

e do POCID, funciona como um modelo do tipo Random Walk, como explicitado na

Figura 5.16b para os ultimos 100 pontos do conjunto de teste.

0 50 100 150 200 250 300 350 400 450 50035

40

45

50

55

60

65


Pet

robr

asO

N


420 430 440 450 460 470 480 490 500 510 52044

46

48

50

52

54

56

58

60


Pet

robr

asO

N


Figura 5.16: Serie real do DJIA (linha solida) e a previsao gerada pela rede neural (linhatracejada) para o conjunto de teste.

Comparando-se os resultados dos experimentos com as RNAs e o modelo de Box &

Jenkins, e possıvel notar que as redes neurais tem um melhor desempenho de previsao,

superior em seis das sete medidas de desempenho. A partir da Tabela 5.22 observa-

se os valores alcancados para as medidas de desempenho para os modelos eleitos nos

experimentos de Box & Jenkins e RNAs, segundo o conjunto de teste.


Tabela 5.22: Resultados experimentais (conjunto de teste) com os melhores modelos (Box& Jenkins e RNAs) para a serie do Valor de Fechamento das Acoes da Petrobras.



U de Theil 4.0261 1.5124 RNAPOCID 49.0385% 51.64% RNAARV 0.2080 0.0890 RNAAIC -1723.1 -4713.4 RNABIC -1710.0 -4445.5 RNA


Para a serie Random Walk foram escolhidos os retardos temporais 1 ao 3 como relevantes

e as arquiteturas 3-1-1, 3-5-1 e 3-10-1 para as RNAs.

Na Tabela 5.23 sao mostrados os valores medios e desvios para as medidas de de-

sempenho dos experimentos com as RNAs para a serie Random Walk. Os resulta-

dos alcancados individualmente para estes experimentos sao exibidos na Tabela D.8

(Apendice D).

Dos experimentos realizados com as RNAs e possıvel identificar a melhor inicializacao

a partir da Tabela D.8 (Apendice D), elegendo a inicializacao 6 da rede 3-5-1 como o

modelo mais apto dentre os investigados.

Contudo, os resultados de previsao obtidos sao ainda comparaveis a um experimento

do tipo Random Walk — os valores da estatıstica U de Theil sao aproximadamente 1

para todas as inicializacoes. Este resultado era o esperado, visto que a serie em questao

trata-se realmente de um Random Walk. Outro ponto indicativo de baixo desempenho

vem da medida de POCID, assemelhando as redes a um experimento do tipo cara ou

coroa, onde existe 50% de possibilidade de acertar, ao acaso, se um determinado valor

da serie no tempo t tera um acrescimo (ira subir) ou um decrescimo (ira cair) no tempo

t + 1.

Um grafico comparativo entre a serie real (linha solida) e a previsao (linha tracejada)

gerada pela melhor rede (inicializacao 6 — arquitetura 3-5-1) e mostrado na Figura 5.17.

Como e esperado, a rede neural consegue capturar o comportamento da serie com uma

defasagem temporal, caracterizando um processo do tipo Random Walk.


Tabela 5.23: Medias (x) e desvios padroes (σx) para as medidas de desempenho relativasas dez inicializacoes das RNAs para a previsao da serie Random Walk.


x σx x σx x σx

3-1-1

MSE 0.1232 0.0069 0.1314 0.0010 0.1510 0.0299MAPE(%) 0.47 0.04 0.32 0.00 0.30 0.03

Theil 1.0062 0.0568 1.0046 0.0079 1.2024 0.2378POCID(%) 45.3213 0.1355 52.4194 0.1901 48.7097 0.1700


3-5-1

MSE 0.1206 0.0012 0.1312 0.0008 0.1352 0.0035MAPE(%) 0.45 0.02 0.32 0.00 0.28 0.00

Theil 0.9851 0.0099 1.0030 0.0062 1.0765 0.0277POCID(%) 45.1205 0.3001 52.7016 0.6026 48.9919 0.3427


3-10-1

MSE 0.1201 0.0006 0.1310 0.0007 0.1328 0.0045MAPE(%) 0.45 0.01 0.32 0.00 0.28 0.00

Theil 0.9815 0.0048 1.0020 0.0054 1.0578 0.0360POCID(%) 44.7791 0.6279 52.4597 0.7940 49.0323 0.2819


Comparando os resultados alcancados com os experimentos das redes (Tabela D.8)

com os experimentos de Box & Jenkins (Tabela 5.8), e possıvel notar um desempenho

superior de previsao para o modelo das RNAs. Apesar da serie ser gerada por um processo

linear, esta e tida como um processo nao estacionario, elegendo as redes neurais como

um modelo mais eficiente para a sua previsao. Na Tabela 5.24 sao expostos os resultados

para os modelos eleitos nos experimentos de Box & Jenkins e das RNAs.

Tabela 5.24: Resultados experimentais (conjunto de teste) com os melhores modelos (Box& Jenkins e RNAs) para a serie Random Walk.


MSE 0.0018 0.1313 Box & JenkinsMAPE 6.70% 0.28% RNA

U de Theil 1.7633 1.0454 RNAPOCID 54.55% 49.19% Box & JenkinsARV 0.1921 4.8108e-2 RNAAIC -629.7357 -1600.3 RNABIC -626.1305 -1482.9 RNA

Os resultados alcancados para a serie Random Walk podem ser comparados de forma


0 50 100 150 200 25050

60

70

80

90

100

110

120

Pontos − Conjuntos Teste

Ran

dom

Wal

k

Figura 5.17: Grafico comparativo entre a serie real Random Walk (linha solida) e aprevisao gerada pela rede neural (linha tracejada) para o conjunto de teste.

qualitativa com os demais resultados obtidos com as RNAs para as outras series. Quando

analisados sob o ponto de vista da estatıstica U de theil e do POCID, os resultados para

a serie Random Walk revelam um comportamento bastante semelhante aos experimentos

que trataram com series economicas e financeiras, e um comportamento bem adverso as

demais series, gerando indıcios que o modelo mais simples possıvel, o modelo de Random

Walk, e aparentemente o mais atraente para a previsao de series economicas e financei-

ras. Entretanto, como ja explicitado no Capıtulo 4, segundo os graficos de lagplot, ha a

possibilidade de existirem certas estruturas nao-lineares mescladas as estruturas lineares

para as series economicas e financeiras, sendo necessario uma busca pelas variaveis de

relevancia para a viabilizacao da captura da informacao nao-linear contida nas series.

Este processo pode gerar um salto na qualidade de desempenho de previsao, visto que

se nao ocorre a captura da informacao nao-linear, o modelo nao-linear no maximo se

comportara como um modelo linear.

CAPITULO 6

COMBINACAO DE REDES NEURAIS ARTIFICIAIS E

ALGORITMOS GENETICOS PARA A PREVISAO DE

SERIES TEMPORAIS

Neste Capıtulo e apresentada a combinacao das tecnicas inteligentes das Redes Neurais

Artificiais com os Algoritmos Geneticos para a obtencao de um Sistema Hıbrido Inteli-

gente aplicado a previsao de series temporais.

O Algoritmo Genetico utilizado apresenta-se como uma variacao do procedimento

canonico exibido no Capıtulo 3, utilizando quatro operadores de cruzamento e tres ope-

radores de mutacao projetados no intuito de aumentar a velocidade de convergencia para

a solucao do problema.

6.1 INTRODUCAO

Como apresentado no Capıtulo 5, ha uma evolucao significativa dos resultados alcancados

pelos modelos de Box & Jenkins para os resultados obtidos pelas redes neurais. Entre-

tanto, os resultados obtidos pelas redes neurais ainda sao de maneira geral insatisfatorios,

em especial para as series economicas e financeiras, comparaveis a um modelo do tipo

Random Walk e a um experimento do tipo cara ou coroa.

Uma possıvel causa para o baixo desempenho das RNAs e o mau ajuste dos seus

parametros, como a quantidade de entradas (ou retardos temporais), a quantidade de

neuronios na camada intermediaria, o conjunto de conexoes efetivamente ativas, o algo-

ritmo de treinamento e a funcao de ativacao. Contudo, o ajuste de tais parametros e uma

tarefa extremamente complicada, visto que sao parametros dependentes do problema, e,

de forma geral, nao ha regras que determinem seus valores.

A ideia apresentada neste capıtulo e a combinacao das redes neurais com os algoritmos

geneticos de tal forma que os AGs possam realizar uma busca pelo espaco de possıveis

102

6.2 ALGORITMO GENETICO E REDES NEURAIS 103

valores para os parametros das RNAs, a procura de uma configuracao com o melhor

desempenho possıvel de previsao.

Nas proximas secoes serao exibidos os procedimentos utilizados para a realizacao

da combinacao do AG modificado e as RNAs, bem como os resultados experimentais

alcancados.

6.2 ALGORITMO GENETICO E REDES NEURAIS

A menos que seja uma caracterıstica intrınseca do fenomeno gerador da serie temporal ser

aleatorio, existe a possibilidade de melhoria no desempenho de predicao com o correto

ajuste dos parametros da RNA. O grande problema em questao e como determinar o

valor destes parametros, visto que sao dependentes do problema e pertencentes a um vasto

universo de possibilidades. Para tanto e necessaria a aplicacao de alguma tecnica de busca

que seja capaz de encontrar uma configuracao otima (ou aceitavel) destes parametros.

O intuito de combinar AGs com RNAs e baseado na utilizacao dos pontos fortes de

uma tecnica para a compensacao dos pontos fracos da outra tecnica, ou seja, os AGs

sao utilizados para o ajuste dos parametros do modelo de previsao e as RNAs funcionam

como um modelo generico para a previsao. Nesta combinacao, considera-se que uma RNA

e um aproximador universal de funcoes [39] com varios parametros a serem ajustados.

Definindo-se inicialmente o domınio de cada um desses parametros, aplica-se um AG

modificado [84] para a busca por uma combinacao satisfatoria destes parametros.

Um AG padrao segue o procedimento exibido na Figura 3.4, onde uma populacao

e criada, avaliada indivıduo a indivıduo, sendo alguns selecionados, combinados e mo-

dificados atraves dos operadores geneticos de cruzamento (crossover) e mutacao para a

geracao de uma nova populacao. Este procedimento e repetido ate que alguma condicao

de parada seja alcancada.

No intuito de aumentar o desempenho da busca pela populacao que melhor se adequa

a solucao do problema, o AG padrao pode ser modificado e novos operadores introduzidos,

como proposto originalmente por Leung et al. [84], segundo o Algoritmo (6.1).

A populacao inicial consiste de um conjunto de possıveis solucoes, definida por,

P = {p1,p2, . . . ,pTamPop} (.)


beginτ → 0; // τ: Numero de Iterac~oes

Inicializa Pop(τ); // Pop(τ): Populac~ao na Iterac~ao τ

Avalia f(Pop(τ)); // f(Pop(τ)): Func~ao de Fitness

while not Condicao de Parada doτ → τ + 1;Seleciona dois pais p1 e p2 a partir de Pop(τ);Realiza operacao de cruzamento de acordo com as Equacoes . a .;Realiza operacao de mutacao de acordo com a Equacao . para gerar os novoscromossomos MC1, MC2 e MC3;// Gera nova Populac~ao

O cromossomo de maior valor de fitness gerado ira substituir o cromossomo de menorvalor de fitness em Pop(τ − 1);for i=1 to 3 do

// pMut: probabilidade de aceitar a mutac~ao

if Numero Aleatorio < pMut thenMCi substitui cromossomo de menor valor de fitness em Pop(τ − 1)

else

if f(MCi) >menor valor de fitness de Pop(τ − 1) thenMCi substitui cromossomo de menor valor de fitness em Pop(τ − 1)

avalia f(Pop(τ));

end

Algoritmo 6.1: Procedimento do Algoritmo Genetico Modificado.

onde

pi =[pi

1 pi2 . . . pi

j . . . pinV ar

](.)

i = 1, 2, . . . , T amPop

j = 1, 2, . . . , nV ar

pimin ≤ pi

j ≤ pimax

sendo pi um indivıduo da populacao P, composta por um total de TamPop indivıduos.

Cada um desses indivıduos e formado por um cromossomo que, por sua vez, e compos-

to por varios genes, onde estes ultimos recebem os parametros ou variaveis que geram

uma possıvel solucao. Cada um destes cromossomos tera uma quantidade fixa de genes,

definida por nVar, e um domınio de validade, definido por pimin e pi

max – seus valores

de maximo e mınimo, respectivamente. Desta forma, um dado parametro pode assumir

qualquer valor real entre pimin e pi

max, caracterizando um cromossomo com codificacao

real, ao inves de uma representacao binaria utilizada no AG padrao.

Cada um dos cromossomos, ou indivıduos, sao avaliados por uma funcao de custo, ou


fitness, onde o melhor cromossomo ira retornar o maior valor de fitness.

A cada geracao, um par de indivıduos, os pais, sao escolhidos atraves do metodo da

roleta (Secao 3.4.3), onde e esperado que pais aptos tenham alta probabilidade de gerar

novos indivıduos (os filhos) tambem aptos. Desta forma, o cromossomo que tiver o maior

valor de fitness tera a maior probabilidade de ser selecionado. A probabilidade de selecao,

definida por qi, para um indivıduo pi, e dada por,

qi =f(pi)∑TamPop

k=1 f(pk)(.)

onde f(pi) e a funcao de fitness do indivıduo pi.

Definido-se tambem a probabilidade acumulada, qi, para o indivıduo pi como,

qi =i∑

k=1

qk (.)

a selecao e realizada com o sorteio de um numero aleatorio, ξ ∈ [0,1]. O indivıduo pi sera

selecionado se qi−1 < ξ ≤ qi, onde e assumido q0 = 0.

O operador de cruzamento, ou crossover, e entao utilizado para realizar a mistura de

informacoes geneticas dos indivıduos pais para a geracao dos indivıduos filhos. Neste AG

modificado sao aplicados quatro tipos diferentes de operadores de cruzamento aos pais

(p1 e p2), gerando quatro novos cromossomos: C1, C2, C3 e C4, definidos por,

C1 =[C1

1 C12 . . . C1

nV ar

]=

p1 + p2

2(.)

C2 =[C2

1 C22 . . . C2

nV ar

]= pmax(1 − w) + max(p1,p2) (.)

C3 =[C3

1 C32 . . . C3

nV ar

]= pmin(1 − w) + min(p1,p2) (.)

C4 =[C4

1 C42 . . . C4

nV ar

]=

(pmax + pmin)(1 − w) + (p1 + p2)w

2(.)


onde,

pmax =[p1

max p2max . . . pnV ar

max

](.)

pmin =[p1

min p2min . . . pnV ar

min

](.)

sendo w ∈ [0,1] um peso definido pelo usuario, onde quanto maior o valor de w maior e

a contribuicao direta dos pais. A funcao max(p1,p2) ira escolher o gene de maior valor

para cada uma das possıveis posicoes nos dois cromossomos dos pais, por exemplo,

max([1 5 − 4], [2 3 − 1]) = [2 5 − 1].

De forma equivalente, a funcao min(p1,p2) ira retornar os genes que tiveram os

menores valores, ou seja,

min([1 5 − 4], [2 3 − 1]) = [1 3 − 4].

Dentre os quatro cromossomos gerados, aquele que detiver o maior valor de fitness

sera eleito como o filho criado pelo processo de cruzamento entre os pais p1 e p2, sendo

os demais cromossomos descartados.

Provavelmente, este tipo de operacao ira gerar uma populacao mais apta do que a

antecedente e o indivıduo de mais alto valor de fitness podera ser alcancado em uma

quantidade menor de iteracoes. As operacoes de cruzamento dadas pela Equacao (.)

e pela Equacao (.) tendem a varrer a regiao central do domınio de busca (se w ≈ 1

na Equacao (.)), e as Equacoes (.) e (.) tendem a mover a busca para os limites

maximo e mınimo do domınio respectivamente, cobrindo o espaco de busca de forma bem

mais ampla que a forma convencional dos AGs.

Depois da selecao do filho, este e clonado. Seu clone ira sofrer um processo de mutacao,

que consiste em alterar de forma aleatoria os genes do seu cromossomo, e por sua vez,

as informacoes herdadas dos seus pais. Este processo de clonagem e a nova modificacao

introduzida no AG proposto por Leung et al. [84], garantindo que todos os cromossomos

gerados serao testados.

A partir de um clone dos cromossomos originais (Cg, g = 1, 2, 3, 4) sao criados tres

novos filhos (MCj, j = 1, 2, 3), gerados a partir de mutacoes,

MCj =[Cg

1 Cg2 . . . CnV ar

g

]+ [γ1∆MC1 γ2∆MC2 . . . γnV ar∆MCnV ar] (.)


onde γi (i = 1, 2, . . . , nV ar) so pode assumir o valor 0 ou o valor 1, e ∆MCi (i =

1, 2, . . . , nV ar) sao numeros aleatorios gerados de tal forma a satisfazerem a condicao:

pimin ≤ Cg

i + ∆MCi ≤ pimax (.)

A primeira mutacao (j = 1 ⇒ MC1) e realizada com apenas um unico γi igual a 1

(escolhido aleatoriamente), e os demais iguais a zero. A segunda mutacao (j = 2 ⇒ MC2)

ocorre com uma quantidade aleatoria de γi’s (escolhidos ao acaso) iguais a 1 e os restantes

demais iguais a zero. E, por fim, a terceira mutacao (j = 3 ⇒ MC3) e realizada com

todos os γi’s iguais a 1.

Dada a constante Pmut, probabilidade de aceitacao de um filho gerado pela mutacao,

definida pelo usuario, e sorteado um novo numero aleatorio, Sortimut. Se Sortimut < Pmut,

entao o filho MCi (i = 1, 2, 3) criado pelo processo de mutacao entrara na populacao

substituindo o indivıduo que detiver o menor valor de fitness. Entretanto, se Sortimut >

Pmut, verifica-se o fitness do filho mutante, e se este obtiver um valor de fitness superior ao

fitness do pior indivıduo da populacao, tal indivıduo mutante ira substituir este membro

menos apto da populacao. Caso contrario, o filho mutante sera descartado.

Apos as operacoes de cruzamento e mutacao uma nova geracao e criada, e esta passa

novamente pelo mesmo processo, que sera repetido ate que uma condicao de parada seja

satisfeita. Nos experimentos realizados foram utilizados tres criterios de paradas:

1. Quantidade de Iteracoes – quantidade maxima permitida de geracoes;

2. Progresso de Treinamento (PT) – quantidade mınima aceitavel de crescimento

para o fitness medio da populacao entre geracoes consecutivas; e

3. Crescimento do Erro de Validacao (CV) – quantidade maxima aceitavel de

decrescimo do fitness para o conjunto de validacao. Esta quantidade e uma medida

percentual relativa ao valor de maior fitness de validacao alcancado durante toda a

execucao do AG.

Cada indivıduo representa uma rede neural do tipo MLP de tres camadas. A quanti-

dade de entradas (lags) e a quantidade de neuronios intermediarios sao constantes defi-

nidas pelo usuario, ja a camada de saıda sera constituıda apenas por um unico neuronio.

A Figura 6.1 mostra um esquema generico para a rede que e representada por cada


indivıduo. E possıvel notar que em cada conexao existe uma chave liga/desliga, represen-

tada por um pequeno quadrado. Estas chaves podem ativar ou desativar as respectivas

conexoes, dando a possibilidade da execucao de um procedimento de poda [51–55], onde

conexoes nao necessarias devem ser eliminadas, gerando uma rede mais compacta.

Figura 6.1: Esquema generico da rede neural artificial codificada como indivıduo dapopulacao do algoritmo genetico descrito.

Cada cromossomo ira conter os seguintes genes (parametros):

• S1ij: chaves das conexoes da camada de entrada para a camada intermediaria;

• S2jk: chaves das conexoes da camada intermediaria para a camada de saıda;

• S1j : chaves das conexoes dos bias para os neuronios da camada intermediaria;

• S2k: chave da conexao do bias para o neuronio da camada de saıda;

• Wij: pesos das conexoes da camada de entrada para a camada intermediaria;

• Wjk: pesos das conexoes da camada intermediaria para a camada de saıda;

• b1j : bias dos neuronios intermediarios;

• b2k: bias dos neuronios de saıda.


podendo todos estes valores assumirem valores reais.

Foram utilizados tres possıveis modelos para as redes neurais,

REDE 1:

Esta configuracao da rede foi utilizada por Leung et al. [84], onde os neuronios

intermediarios tem a funcao sigmoide logıstica (Equacao (.)) como funcao

de ativacao, e os neuronios de saıda tem uma funcao de ativacao linear com

os valores de bias passando por uma funcao sigmoide logıstica. A resposta

desta rede, para um neuronio de saıda k e dada por,

yk(t) =

nh∑

j=1

δ(S2jk)WjkSig

[nin∑

i=1

(δ(S1

ij)WijZi(t) − δ(S1j )b

1j

)]− δ(S2

k)Sig(b2k)

(.)

onde Sig e a funcao sigmoide logıstica e δ(x) e uma funcao degrau, definida

por,

δ(x) =

1, se x ≥ 0

0, se x < 0(.)

Zi(t) (i = 1, 2, . . . , nin) sao os valores de entrada da rede, nin denota o numero

de entradas e nh e o numero de neuronios escondidos. Como esta sendo

considerado apenas um unico neuronio de saıda, tem-se k = 1.

REDE 2:

A segunda configuracao e uma RNA com funcao de ativacao igual a sigmoide

logıstica (Equacao (.)) para a camada intermediaria, e camada de saıda com

funcao de ativacao linear (Equacao (.)), resultando na saıda da rede,

yk(t) =

nh∑

j=1

δ(S2jk)WjkSig

[nin∑

i=1

(δ(S1


1j

)]− δ(S2

k)(b2k)

(.)

REDE 3:

A terceira opcao e uma rede com todos os neuronios (camada intermediaria e

de saıda) com funcoes de ativacao iguais a sigmoides logısticas (Equacao (.)),

resultando na saıda da rede,

6.3 RESULTADOS EXPERIMENTAIS COM O SISTEMA HIBRIDO AG+RNA 110

yk(t) = Sig

{nh∑

j=1

δ(S2jk)WjkSig

[nin∑

i=1

(δ(S1


1j

)]− δ(S2

k)(b2k)

}

(.)

Para todos os tres modelos de redes neurais foi utilizada a mesma funcao de fitness,

definida como,

f =1

1 + MSE(.)

onde o erro MSE e definido pela Equacao (.).

Os valores de maximo e mınimo para cada um desses parametros foram definidos

como [84],

−3√nh + 1

≥ Wij, Wjk, b1j , b

2k ≥ 3√

nh + 1(.)

−1 ≥ S1ij, S

2jk, S

1j , S

2k ≥ 1 (.)

gerando um cromossomo com a estrutura,

[S2

jk Wjk S1ij Wij S1

j b1j S2

k b2k

](.)

6.3 RESULTADOS EXPERIMENTAIS COM O SISTEMA HIBRIDO AG+RNA

Foram realizados experimentos com os tres modelos de redes (REDE 1, REDE 2 e REDE

3), cada um dos quais com as mesmas arquiteturas utilizadas nos experimentos apresen-

tados no Capıtulo 5.

Para todos os experimentos descritos a seguir, foram especificados os seguintes valores

para os parametros do algoritmo:


w = 0.9;

PMUT = 0.1;

No de iteracoes = 1000;

PT = 0.000001;

CV = 5%

.

Nas subsecoes que se seguem sao expostos os resultados alcancados pela melhor con-

figuracao (modelo e arquitetura) obtida para a RNA para as series introduzidas no

Capıtulo 4.


Dentre os experimentos realizados com a serie do Mapa de Henon, o modelo REDE 1

da arquitetura 4-5-1 apresenta os melhores resultados, sendo este eleito como o melhor

modelo de previsao para a serie. Na Tabela 6.1 sao expostos os valores alcancados pelas

medidas de desempenho para o melhor modelo gerado.

Tabela 6.1: Resultados experimentais obtidos pelo melhor modelo do Sistema HıbridoAG+RNA para a serie do Mapa de Henon (RNA 4-5-1).

Modelo Erros Treinamento Validacao Teste

REDE 1

MSE 0.0556 0.0565 0.0558MAPE (%) 783.8473 859.8755 1027.4527Theil 0.3500 0.3541 0.3495POCID (%) 55.3421 62.1847 62.1849ARV 0.0902 0.0933 0.0915AIC -14401.1117 -7138.6666 -7168.0374BIC -14243.2591 -6995.3700 -7024.7408

Um grafico comparativo entre os valores reais da serie (linha solida) e os valores

previstos (linha tracejada) pelo modelo eleito, para os ultimos 100 pontos do conjunto de

teste, e exposto na Figura 6.2.

O processo de poda realizado sobre as RNAs e apresentado por duas matrizes, onde

a primeira representa as conexoes entre a camada de entrada e a camada intermediaria,

e, a segunda matriz, as conexoes da camada intermediaria para a camada de saıda. Tais

matrizes, chamadas de matrizes de conexoes, definem a topologia da rede e sao expostas

no Apendice E para o melhor modelo.


0 10 20 30 40 50 60 70 80 90 1000

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

Pontos − Conjunt de Teste

Hen

on

Figura 6.2: Serie do Mapa de Henon (linha solida) e os valores previstos (linha tracejada)pelo Sistema Hıbrido AG+RNA para os ultimos 100 pontos do conjunto de teste.

Comparando os experimentos realizados com as RNAs e os experimentos do modelo

AG+RNA, Tabela 6.2, observa-se que o melhor modelo do Sistema Hıbrido para a serie do

Mapa de Henon se apresenta com um desempenho inferior aos resultados alcancados pelo

modelo da RNA (Capıtulo 5). Este resultado vem a gerar indıcios de que o treinamento

das RNAs realizado atraves do AG nao e eficiente quando comparado com metodos de

gradiente descendente, visto que o AG depara-se com um espaco de busca extremamente

vasto para o ajuste dos pesos das RNAs. Contudo, os resultados obtidos pelo modelo

AG+RNA ainda sao melhores que os resultados obtidos pelo modelo linear de Box &

Jenkins, demonstrando que embora o processo de treinamento nao seja eficiente, o Sis-

tema Hıbrido e capaz de selecionar configuracoes de RNAs com desempenho superior aos

tradicionais modelos lineares estatısticos, muito provavelmente devido ao correto ajuste

dos parametros da topologia das redes.

Tabela 6.2: Resultados experimentais (conjunto de teste) com os melhores modelos (Box& Jenkins, RNAs e AG+RNA) para a serie de Henon.

Erros Box & Jenkins RNA AG+RNA Melhor Modelo

MSE 0.3625 4.0840e-9 0.0558 RNAMAPE 404.53% 1.0349e-8% 1027.4527% RNA

U de Theil 2.2709 3.9090e-11 0.3495 RNAPOCID 48.9489% 100.00% 62.1849% RNAARV 4.2811 7.8006e-11 0.0915 RNAAIC -5045.4 -59657.5 -7168.0374 RNABIC -4940.2 -59241.3 -7024.7408 RNA


6.3.2 Serie das Manchas Solares

Os experimentos realizados com o Sistema Hıbrido AG+RNA para a serie das Manchas

Solares elegem o modelo REDE 2 da arquitetura 3-1-1 com o mais apto para a previsao.

Na Tabela 6.3 sao expostos os resultados obtidos para o melhor modelo.

Tabela 6.3: Resultados experimentais obtidos pelo melhor modelo do Sistema HıbridoAG+RNA para a serie das Manchas Solares (RNA 3-1-1).


REDE 2


Um grafico comparativo entre os valores reais da serie (linha solida) e os valores

previstos (linha tracejada) pelo modelo eleito, para o conjunto de teste, e exposto na

Figura 6.3.

0 10 20 30 40 50 60 700

0.2

0.4

0.6

0.8

1


Man

chas

Sol

ares

Figura 6.3: Serie das Manchas Solares (linha solida) e os valores previstos (linha trace-jada) pelo Sistema Hıbrido AG+RNA para o conjunto de teste.

As estruturas de conexoes para o melhor modelo gerado (REDE 2 - arquitetura 3-1-1)

nos experimentos com a serie das Manhas Solares sao expostas no Apendice E.

Atraves da Tabela 6.4 e possıvel comparar os resultados obtidos para a serie das Man-

chas Solares entre os melhores modelos nos experimentos com Box & Jenkins, RNAs e


AG+RNA. De forma global, os experimentos com as RNAs tem os melhores resultados.

Contudo, o modelo AG+RNA apresenta um bom desempenho global, superior ao desem-

penho dos modelos de Box & Jenkins. Em particular, os criterios de informacao revelam

que o modelo AG+RNA estabelece um modelo de previsao bem mais parcimonioso que

os demais, indicando novamente um bom ajuste para a topologia das redes.

Tabela 6.4: Resultados experimentais (conjunto de teste) com os melhores modelos (Box& Jenkins, RNAs e AG+RNA) para a series das Manchas Solares.


MSE 0.0219 0.9205 0.0127 AG+RNAMAPE 42.35% 2.41% 40.00% RNA

U de Theil 0.7805 0.3443 0.4588 RNAPOCID 75.000% 90.0000% 58.326% RNAARV 0.4007 0.1418 0.1999 RNAAIC -92.8323 -280.9 -304.2590 AG+RNABIC -71.5266 -196.0 -287.8757 AG+RNA


Os experimentos com o Sistema Hıbrido AG+RNA elege o modelo REDE 2 da arquitetura

3-1-1 como o indivıduo mais apto para a previsao da serie de Medidas do Brilho de uma

Estrela. Na Tabela 6.5 sao expostos os resultados obtidos pelo melhor modelo AG+RNA.

Tabela 6.5: Resultados experimentais obtidos pelo melhor modelo do Sistema HıbridoAG+RNA para a serie de Medidas de Brilhos de uma Estrela (RNA 3-1-1).


REDE 2

MSE 7.0540e-4 7.5549e-4 7.0158e-4MAPE (%) 8.9205 10.5821 11.8313Theil 0.1852 0.1865 0.1910POCID (%) 49.3289 48.3221 48.3221ARV 0.0006 0.0009 0.0006AIC -2152.5110 -1061.0330 -1079.3262BIC -2129.0255 -1041.0133 -1059.2730

A topologia do melhor modelo AG+RNA para a previsao da serie de Medidas do Brilho

de uma Estrela e representada pelas matrizes de conexoes, apresentadas no Apendice E.

Um grafico comparativo entre os valores reais da serie de Medidas do Brilho de uma

Estrela (linha solida) e os valores gerados pela previsao (linha tracejada) do modelo mais

apto, para o conjunto de teste, e mostrado na Figura 6.4.


0 50 100 1500

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1


Bril

ho d

e um

a E

stre

la (

u.a.

)

Figura 6.4: Serie de Medidas de Brilhos de um Estrela (linha solida) e a previsao (linhatracejada) gerada pelo modelo REDE 2 da arquitetura 3-1-1.

Atraves da Tabela 6.6 e possıvel comparar os resultados obtidos pelas medidas de de-

sempenho para os experimentos de Box & Jenkins, RNAs e Sistema Hıbrido AG+RNA.

Novamente os experimentos que utilizam unicamente as RNAs se destacam como o pro-

cedimento que alcancou o melhor desempenho geral.

Tabela 6.6: Resultados experimentais (conjunto de teste) com os melhores modelos (Box& Jenkins, RNAs e AG+RNA) para a serie de Medidas do Brilho de uma Estrela.


MSE 3.9004e-4 0.0234 7.0158e-4 Box & JenkinsMAPE 9.36% 0.10% 11.8313% RNA

U de Theil 0.0679 0.0632 0.1910 RNAPOCID 100.00% 72.97% 48.3221% Box & JenkinsARV 0.0035 3.3357e-3 0.0006 AG+RNAAIC -294.9564 -1193.9 -1079.3262 RNABIC -22.6541 -1089.8 -1059.2730 RNA

6.3.4 Serie do Indice Dow Jones Industrial Average

Os experimentos com o Sistema Hıbrido AG+RNA apontam o modelo REDE 2 da arqui-

tetura 3-10-1 como o mais apto para a previsao da serie do Indice Dow Jones Industrial

Average. Na Tabela 6.7 sao exibidos os valores para as medidas de desempenho para o

modelo eleito, e sua topologia exposta no Apendice E.


Tabela 6.7: Resultados experimentais obtidos pelo melhor modelo do Sistema HıbridoAG+RNA para a serie DJIA (RNA 3-10-1).


REDE 2


Um grafico comparativo entre os valores reais (linha solida) da serie DJIA e a previsao

(linha tracejada) gerada pelo modelo REDE 2 da arquitetura 3-10-1 para o conjunto de

teste e mostrado na Figura 6.5a.

Analisando os valores das medidas de desempenho para o melhor modelo gerado,

em particular segundo a estatıstica U de Theil e a medida POCID, percebe-se que a

previsao gerada e inferior a previsao gerada por um modelo do tipo Random Walk —

medida da estatıstica U de Theil igual a 1.0827 — tambem se comportando como um

experimento semelhante ao do tipo cara ou coroa quanto a previsao da tendencia do

proximo valor futuro — medida POCID igual a 50.8475%. Ambos os comportamentos

podem ser observados na Figura 6.5a e na Figura 6.5b.

0 50 100 150 200 250 300 3500

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8


DJI

A


260 270 280 290 300 310 320 330 340 3500.2

0.25

0.3

0.35

0.4

0.45

0.5


DJI

A


Figura 6.5: Serie real do DJIA (linha solida) e a previsao gerada pelo Sistema HıbridoAG+RNA (linha tracejada), REDE 2 da arquitetura 3-10-1, para o conjunto de teste.

Atraves da Tabela 6.8 e possıvel comparar os resultados obtidos nos experimentos


de Box & Jenkins, das RNAs e do modelo AG+RNA. Os experimentos com as RNAs

apresentam um desempenho geral superior aos demais, seguido pelos resultados obtidos

pelo modelo AG+RNA, que se apresentam superiores aos resultados dos modelos de Box

& Jenkins. Estes indıcios novamente apontam para o fato que o Sistema Hıbrido e capaz

de ajustar a topologia das RNAs, porem e ineficiente para a execucao do treinamento das

mesma.

Tabela 6.8: Resultados experimentais (conjunto de teste) com os melhores modelos (Box& Jenkins, RNAs e AG+RNA) para a serie DJIA.



U de Theil 1.2649 0.9878 1.0827 RNAPOCID 46.10% 46.74% 50.8475 AG+RNAARV 0.0392 3.4226e-2 0.0189 AG+RNAAIC -1056.2 -2500.7 -2412.3142 RNABIC -1052.2 -2471.5 -2227.1738 RNA


A partir dos experimentos com o Sistema Hıbrido AG+RNA, o modelo REDE 2 da arqui-

tetura 3-5-1 apresenta o melhor conjunto de resultados para as medidas de desempenho

segundo o conjunto de teste, sendo eleito como o melhor modelo para a previsao da serie

do Indice Nasdaq. Na Tabela 6.9 sao apresentados os valores de medidas de desempenho

obtidos pelo melhor modelo, e sua topologia e exposta no Apendice E.

Tabela 6.9: Resultados experimentais obtidos pelo melhor modelo do Sistema HıbridoAG+RNA para a serie do Indice Nasdaq (RNA 3-5-1).


REDE 2


Analisando os resultados alcancados pelo modelo eleito como mais apto, observa-se

um erro percentual de previsao baixo, MAPE = 1.9660%. Todavia, ao se observar o

valor alcancado pela medida da estatıstica U de Theil (13.8660 para o conjunto de teste),


percebe-se que este modelo tem um desempenho muito inferior a um simples modelo do

tipo Random Walk. Atraves da medida do POCID (53.2541% para o conjunto de teste)

tambem se constata que tal modelo funciona aproximadamente como um experimento do

tipo cara ou cora para a previsao da tendencia do proximo valor.

Um grafico comparativo entre os valores reais (linha solida) da serie do Indice Nasdaq

e a previsao (linha tracejada) gerada pelo melhor modelo, para o conjunto de teste, e

mostrado na Figura 6.6a. Uma ampliacao deste mesmo grafico, para os ultimos 100 pontos

do conjunto de teste, e exibida na Figura 6.6b, onde e possıvel se observar claramente os

efeitos relatados pelos valores da estatıstica U de Theil e do POCID.

0 200 400 600 800 1000 1200 1400 1600 1800 20000.6

0.65

0.7

0.75

0.8

0.85

0.9

0.95

1


Nas

daq


2010 2020 2030 2040 2050 2060 2070 2080 2090 21000.6

0.65

0.7

0.75

0.8

0.85

0.9

0.95

1


Nas

daq


Figura 6.6: Serie do Indice Nasdaq (linha solida) e a previsao gerada pelo Sistema HıbridoAG+RNA (linha tracejada), REDE 2 da arquitetura 3-5-1, para o conjunto de teste.

Atraves da Tabela 6.10 e possıvel ter uma comparacao direta entre os resultados

alcancados pelos experimentos ja realizados com a serie do Indice Nasdaq. Mais uma vez,

os experimentos com as RNAs tem um desempenho global superior aos demais.


Tabela 6.10: Resultados experimentais (conjunto de teste) com os melhores modelos (Box& Jenkins, RNAs e AG+RNA) para a serie do Indice Nasdaq.


MSE 2.4222e-5 0.0022 2.5983e-4 Box & JenkinsMAPE 0.50% 2.6988e-3% 1.9660% RNA

U de Theil 1.2702 1.1728 13.8660 RNA e Box & JenkinsPOCID 50.4751% 53.06% 53.2541% AG+RNAARV 0.0162 3.4977e-3 0.0085 Modelos SemelhantesAIC -8871.6 -22536.0 -17346.0409 RNABIC -8619.2 -22363.1 -17212.9900 RNA


Analisando-se os experimentos realizados com o Sistema Hıbrido AG+RNA para a serie

do Indice S&P500, observa-se que o modelo REDE 2 da arquitetura 3-5-1 e detentor dos

melhores valores de desempenho segundo o conjunto de teste, sendo eleito como o modelo

mais apto dentre os investigados. Na Tabela 6.11 sao apresentados os valores das medidas

de desempenho obtidos pelo melhor modelo, sendo sua topologia exibida no Apendice E.

Tabela 6.11: Resultados experimentais obtidos pelo melhor modelo do Sistema HıbridoAG+RNA para a serie do Indice S&P500 (RNA 3-5-1).


REDE 2


Observando o melhor modelo segundo a estatıstica U de Theil (5.4402), percebe-se

que este e inferior a um modelo do tipo Random Walk. Entretanto, atraves do POCID

(74.7252%), este modelo tem a capacidade de prever a proxima tendencia da serie com

um desempenho superior a um sistema do tipo cara ou coroa. Um grafico entre a serie

(linha solida) e a previsao (linha traceja) gerada e mostrado na Figura 6.7.

Na Tabela 6.12 compara-se os resultados experimentais para a serie do Indice S&P500.

Mais uma vez os experimentos com as RNAs mostram um desempenho global superior

e o Sistema Hıbrido AG+RNA apresenta-se em geral mais apto que os modelos de Box

& Jenkins, vindo a indicar novamente que embora o processo de treinamento nao seja

realizado de forma satisfatoria, o Sistema AG+RNA consegue ajustar os parametros das


0 10 20 30 40 50 60 70 80 900.65

0.7

0.75

0.8

0.85

0.9

0.95

1


S&

P50

0

Figura 6.7: Serie S&P500 (linha solida) e a previsao gerada pelo modelo REDE 2 daarquitetura 3-5-1 para o conjunto de teste.

topologias das RNAs de forma eficiente.

Tabela 6.12: Resultados experimentais (conjunto de teste) com os melhores modelos (Box& Jenkins, RNAs e AG+RNA) para a serie do Indice S&P500.



U de Theil 1.4090 0.9166 5.4402 RNA e Box & JenkinsPOCID 47.2222% 51.11% 74.7252% AG+RNAARV 0.1374 7.2728e-3 0.0682 RNAAIC -310.5510 -741.0 -645.4452 RNABIC -307.9400 -561.9 -567.9658 Modelos Semelhantes


Comparando-se os resultados experimentais realizados com o Sistema Hıbrido AG+RNA,

elege-se o modelo REDE 2 da arquitetura 3-10-1 como o mais apto para a previsao da

serie do Valor de Fechamento das Acoes da Petrobras (PetrobrasON). Na Tabela 6.13 sao

apresentados os valores da medidas de desempenho alcancados pelo melhor modelo.

Analisando os resultados obtidos pelo melhor modelo, observa-se um erro percentual

baixo, em linhas gerais, para uma serie que representa os valores reais das acoes da

Petrobras negociadas na bolsa de valores do estado de Sao Paulo, MAPE = 0.9815%.

Entretanto, quando analisada a medida da estatıstica U de Theil, 2.1875, este modelo


Tabela 6.13: Resultados experimentais obtidos pelo melhor modelo do Sistema HıbridoAG+RNA para a serie do Valor de Fechamento das Acoes da Petrobras (RNA 3-10-1).


REDE 2


apresenta-se com um desempenho medio bem inferior a um modelo do tipo Random Walk,

e quanto a medida de POCID (57.3791%), este se comporta apenas um pouco melhor

que um experimento tipo cara ou coroa para a previsao de tendencias.

A estrutura da rede para o melhor modelo e representada atraves das matrizes de

conexoes, expostas no Apendice E.

Um grafico comparativo entre os valores reais (linha solida) da serie e a previsao (linha

tracejada) gerada pelo modelo REDE 2 da arquitetura 3-10-1 e mostrado na Figura 6.8a.

Atraves de uma ampliacao deste grafico, mostrado na Figura 6.8b, fica claro os efeitos

relatados pelos resultados apresentados a partir das medidas da estatıstica U de Theil e

pela medida do POCID.

0 50 100 150 200 250 300 350 400 450 500

0.82

0.84

0.86

0.88

0.9

0.92

0.94

0.96

0.98

1


Pet

robr

asO

N


430 440 450 460 470 480 490 500 510 520

0.82

0.84

0.86

0.88

0.9

0.92

0.94

0.96

0.98

1


Pet

robr

asO

N


Figura 6.8: Serie do Valor de Fechamento das Acoes da Petrobras (linha solida) e a pre-visao gerada pelo Sistema Hıbrido AG+RNA (linha tracejada), REDE 2 da arquitetura3-10-1, para o conjunto de teste.


A partir dos resultados experimentais alcancados ate entao com a serie do Valor de

Fechamento das Acoes da Petrobras, resumidos na Tabela 6.14, mais uma vez observa-se

que as RNAs apresentam um desempenho geral superior as demais abordagens. Observa-

se tambem que o modelo AG+RNA, embora tenha um desempenho inferior ao desem-

penho das RNAs, apresenta-se mais adequado que os modelos de Box & Jenkins, vindo a

indicar novamente que o modelo nao consegue realizar um bom procedimento de treina-

mento, mas realiza um bom ajuste da topologia das RNAs.

Tabela 6.14: Resultados experimentais (conjunto de teste) com os melhores modelos(Box & Jenkins, RNAs e AG+RNA) para a serie do Valor de Fechamento das Acoes daPetrobras.


MSE 2.5532e-4 0.0095 1.3712e-4 AG+RNAMAPE 1.41% 0.1000% 0.9815% RNA

U de Theil 4.0261 1.5124 2.1875 RNAPOCID 49.0385% 51.64% 57.3791% AG+RNAARV 0.2080 0.0890 0.0951 RNAAIC -1723.1 -4713.4 -4555.0048 RNABIC -1710.0 -4445.5 -4323.6674 RNA


A partir dos experimentos realizados com o Sistema Hıbrido AG+RNA, elege-se o modelo

REDE 2 da arquitetura 3-10-1 como o mais apto para a previsao da serie Random Walk,

segundo o conjunto de teste. Na Tabela 6.15 sao expostos os valores das medidas de

desempenho obtidas para este melhor modelo.

Tabela 6.15: Resultados experimentais obtidos pelo melhor modelo do Sistema HıbridoAG+RNA para a serie Random Walk (RNA 3-10-1).


REDE 2


O melhor modelo AG+RNA tem a topologia da rede representada atraves das matrizes

de conexoes, apresentadas no Apendice E.


Observando-se os resultados das medidas da estatıstica U de Theil (1.1276) e POCID

(48.2551%), constata-se um desempenho de previsao inferior ao modelo tipo Random

Walk e um comportamento do tipo cara ou coroa para a previsao da tendencias para o

proximo ponto da serie. Estas observacoes demonstram um desempenho nao satisfatorio

para a aplicacao deste modelo em situacoes praticas.

Um grafico comparativo entre os valores reais da serie (linha solida) e a previsao (linha

tracejada) gerada pelo melhor modelo para o conjunto de teste e mostrado na Figura 6.9a.

Ampliando-se este grafico, Figura 6.9b, e possıvel notar o comportamento da previsao

responsavel pelos valores relatados pelas medidas da estatıstica U de Theil e POCID.

0 50 100 150 200 2500.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1


Ran

dom

Wal

k


150 160 170 180 190 200 210 220 230 240 2500.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1


Ran

dom

Wal

k


Figura 6.9: Serie Random Walk (linha solida) e a previsao gerada pelo Sistema HıbridoAG+RNA (linha tracejada), REDE 1 da arquitetura 3-1-1, para o conjunto de teste.

A partir da Tabela 6.16 e possıvel comparar diretamente os resultados obtidos com

os experimentos ja realizados com a serie Random Walk. Mantendo o mesmo comporta-

mento das outras series, os experimentos com as RNAs apresentam em geral os melhores

resultados. Contudo, o Sistema Hıbrido, embora nao seja superior as RNAs, obteve um

melhor desempenho quando comparado aos modelos de Box & Jenkins, indicando um

bom ajuste dos parametros da topologia das rede.

Desta forma, percebe-se que o Sistema Hıbrido AG+RNA e capaz de ajustar os

parametros da topologia das RNAs, mas nao e habil para realizar o processo de treina-

mento, sendo preferido um treinamento atraves de um algoritmo de gradiente descen-

dente.


Tabela 6.16: Resultados experimentais (conjunto de teste) com os melhores modelos (Box& Jenkins, RNAs e AG+RNA) para a serie Random Walk.


MSE 0.0018 0.1313 0.0014 Box & JenkinsMAPE 6.70% 0.28% 6.9377% RNA

U de Theil 1.7633 1.0454 1.1276 RNAPOCID 54.55% 49.19% 48.2551% Box & JenkinsARV 0.1921 4.8108e-2 0.0956 RNAAIC -629.7357 -1600.3 -1562.4317 RNABIC -626.1305 -1482.9 -1390.6162 RNA

CAPITULO 7

UM NOVO METODO HIBRIDO INTELIGENTE PARA

A PREVISAO DE SERIES TEMPORAIS

Neste capıtulo e proposta uma nova metodologia para a previsao de series temporais

baseada em um sistema hıbrido inteligente composto pela combinacao de um algoritmo

genetico modificado (descrito no Capıtulo 6), redes neurais artificiais do tipo MLP, uma

busca evolutiva pelos retardos temporais relevantes para a serie e um teste estatıstico

para a determinacao do comportamento da serie.

Este novo metodo — The Time-lag Added Evolutionary Forecasting (TAEF) Me-

thod — apresenta-se como uma alternativa viavel para a previsao de series temporais,

alcancando altos desempenhos de previsao.

7.1 INTRODUCAO

Analisando os resultados obtidos atraves dos experimentos e metodologias abordados ate

o Capıtulo anterior, percebe-se que, de forma geral, os modelos lineares sao superados

pelos modelos gerados com o uso de tecnicas da Inteligencia Artificial (RNAs e AGs).

Nota-se tambem que os experimentos com a utilizacao unicamente das RNAs, que uti-

lizam metodos baseados em calculos numericos do gradiente descendente das funcoes de

erro para o processo de treinamento, de forma global, alcancaram os melhores resultados.

Os experimentos com o Sistema Hıbrido AG+RNA, que utiliza um procedimento

estocastico para o ajuste das RNAs, demonstraram, em linhas gerais, serem aptos na

escolha das configuracoes dos parametros da topologia das RNAs, porem inaptos para o

processo de treinamento devido ao vasto espaco de configuracoes para os pesos das RNAs.

Nos experimentos com o Sistema Hıbrido AG+RNA estudado foram dadas basica-

mente duas possibilidades de ajuste na topologia das redes: a selecao dos retardos tem-

porais relevantes dentro de um domınio de entradas pre-estabelecidas no inıcio dos expe-

rimentos, e a selecao da quantidade de neuronios na camada intermediaria efetivamente

125

7.2 UMA NOVA PROPOSTA: METODO TAEF 126

ativos. Ambas as escolhas foram estabelecidas atraves do processo de poda das conexoes

entre as camadas da rede.

Desta forma, o fato de se escolher convenientemente os parametros da RNA e de

se utilizar um metodo de treinamento para a RNA baseado no calculo do gradiente

descendente do erro de previsao sao procedimentos adequados para o sucesso da previsao

com a utilizacao das RNAs.

A ideia chave e combinar os pontos fortes de cada uma das tecnicas ja abordadas

na tentativa de criar uma nova metodologia aplicada ao problema de previsao de series

temporais de forma a obter melhores resultados de desempenho a um custo aceitavel.

7.2 UMA NOVA PROPOSTA: THE TIME-LAG ADDED EVOLUTIONARY FO-

RECASTING METHOD

Como ja discutido no Capıtulo 2, baseado no teorema de F. Takens [16] (Apendice A), o

parametro fundamental para a reconstrucao do espaco de fase de uma serie temporal e a

correta escolha dos retardos temporais relevantes (ou lags).

Seja M um espaco de fase que contem as dimensoes de interesse para a determinacao

do comportamento de um determinado fenomeno temporal. Seja ϕt(x) a trajetoria tem-

poral descrita pelo fenomeno de interesse sobre o espaco M e y(ϕt(x)) a observacao dos

pontos relativos a evolucao temporal deste fenomeno, ou seja, a propria serie temporal.

Desta forma o problema de previsao e a determinacao do correto mapeamento entre a

observacao dos pontos da evolucao temporal e o espaco de fase M, mapeamento este

definido por Φ(ϕ,y) : M → Rd+1, e dado por:

Φ(ϕ,y) =(y(x), y(ϕ(x)), . . . , y(ϕd(x))

)(.)

onde d/2 e a dimensao do espaco de fase M. Takens [16] provou que um sistema dinamico

que evolui no tempo pode ser mapeado a partir do seu espaco de fase, que para uma

serie temporal e constituıda por seus retardos temporais, de forma a necessitar de uma

quantidade mınima finita de dimensoes, d + 1.

O Time-lag Added Evolutionary Forecasting Method (metodo TAEF) tenta reconstruir

o espaco de fase de uma dada serie temporal realizando uma busca pela dimensionali-

dade mınima necessaria para a reproducao do fenomeno gerador da serie e seus valores


subsequentes. E interessante ter a quantidade mınima possıvel de retardos temporais

(lags), visto que quanto maior esta quantidade, maior o custo associado ao treinamento

das RNAs.

O procedimento utilizado pelo metodo TAEF, esquematizado na Figura 7.1, utiliza

o AG modificado descrito na Secao 6.2 para a busca dos seguintes parametros de uma

RNA:

• Os retardos temporais relevantes, ou lags, sendo inicialmente definida uma

quantidade maxima de retardos temporais (Rmax) para a selecao do AG. Desta

forma, o numero de retardos temporais para cada indivıduo da populacao estara

contido no intervalo [1, Rmax];

• A quantidade de neuronios nas camadas intermediarias, onde a quantidade

maxima permitida (Nhmax) e estabelecida inicialmente pelo usuario. O AG ira

escolher para cada indivıduo a quantidade de neuronios das camadas intermediarias

contida no intervalo [1, Nhmax];

• O algoritmo de treinamento da RNA, onde sao pre-estabelecidos quatro di-

ferentes algoritmos: RproP [74], Levenberg-Marquardt [75], metodo do Gradiente

Conjugado Escalado [77], e o algoritmo Um Passo Secante [78]. Todos estes basea-

dos no metodo do gradiente descendente.

Ao inicializar o metodo TAEF, o usuario deve determinar o horizonte de predicao, a

quantidade inicial maxima de retardos temporais a serem investigados (Rmax), a quan-

tidade maxima de neuronios das camadas escondidas das RNAs (Nhmax), a quantidade

de iteracoes do metodo (Cont) e o valor mınimo aceitavel de fitness que deve ser al-

cancado por pelo menos um indivıduo da populacao, sendo este valor calculado pela

Equacao (.). Estes parametros, determinados pelo usuario, constituem apenas valores

iniciais que serao ajustados a medida que o metodo evolui em busca do melhor modelo

possıvel para a previsao da serie temporal.

Dados os valores iniciais para os parametros acima descritos, o metodo TAEF inicializa

um AG modificado, como descrito na Secao 6.2, para a realizacao da busca pela melhor

configuracao possıvel dos parametros das RNAs bem como o algoritmo de treinamento

aplicado. Uma vez o AG alcancando alguma condicao de parada, este ira testar se o

melhor indivıduo encontrado na populacao conseguiu obter sucesso quanto a meta esta-

belecida para seu valor de fitness. Caso o melhor indivıduo nao tenha conseguido alcancar


Figura 7.1: Esquema do Metodo TAEF proposto para a solucao do problema de previsaode series temporais

tal meta, o metodo TAEF considera que uma possıvel causa e a baixa dimensionalidade

de Rmax (quantidade maxima de retardos temporais permitida), inviabilizando a recons-

trucao do espaco de fase gerador da serie de forma homeomorfica a original, segundo o

teorema de F. Takens [16]. Neste caso, o metodo TAEF incrementa em uma unidade a

dimensionalidade de busca dos retardos temporais (Rmax), e repete o procedimento em

uma nova iteracao.

Entretanto, se o melhor indivıduo tiver conseguido alcancar, ou ate mesmo superar

a meta inicialmente estabelecida pelo usuario para o menor valor de fitness aceitavel

(Fitmin), o metodo TAEF encara que uma solucao aceitavel, segundo os criterios do


usuario, foi encontrada. Contudo, se o numero maximo de iteracoes (Cont) nao tiver

sido alcancado, o metodo TAEF considera a possibilidade de melhorar a propria meta

previamente estabelecia pelo usuario. Desta forma, o metodo ajusta o valor do parametro

de mınimo valor de fitness aceitavel (Fitmin) como sendo o proprio valor de fitness al-

cancado pelo melhor indivıduo da iteracao, e tambem verifica a quantidade de retardos

temporais utilizado por este indivıduo, ajustando o valor de dimensionalidade de busca

dos retardos (Rmax) para o valor do retardo temporal de mais alta ordem utilizado pelo

indivıduo. Este procedimento tenta buscar a mınima dimensionalidade necessaria para

a correta reconstrucao do espaco de fase gerador da serie temporal. Uma vez dados

estes ajustes, e repetido o procedimento de busca pelo melhor preditor. Este ultimo pro-

cedimento e repetido toda vez que o melhor indivıduo da populacao consegue superar o

fitness mınimo estabelecido para sua iteracao, gerando assim novas metas para a proxima

iteracao do metodo.

Caso o algoritmo, depois de reajustar os valores de fitness mınimo e da dimensionali-

dade de busca dos retardos temporais, nao consiga alcancar um indivıduo de desempenho

superior ou igual a meta estabelecida para sua iteracao, o metodo TAEF assume que o

espaco de busca dos retardos temporais foi restringido o suficiente para causar este pro-

blema. Desta forma, o metodo TAEF volta ao valor da dimensionalidade de busca dos

retardos temporais para o valor da iteracao anterior, incrementa-o de uma unidade e

repete o procedimento de busca.

Todos estes procedimentos sao encadeados pelo metodo TAEF ate que a sua condicao

de parada seja alcancada, no caso, o numero de iteracoes (Cont), retornando a melhor

solucao possıvel encontrada.

7.2.1 Experimentos Iniciais com o Metodo TAEF

Em uma primeira etapa, varios experimentos foram gerados com o metodo TAEF (Fer-

reira et al. [104, 105]). Varias configuracoes para as RNAs, totalizando quatro tipos de

estruturas, foram testadas:

• Rede Neural do tipo MLP com tres camadas e funcao de ativacao sigmoide logıstica

em todos os neuronios;

• Rede Neural do tipo MLP com tres camadas com funcao de ativacao sigmoide

logıstica para a camada intermediaria e funcao linear para a camada de saıda;


• Rede Neural do tipo MLP com quatro camadas com funcao de ativacao sigmoide

logıstica para as camadas intermediarias e funcao linear para a camada de saıda;

• Rede Neural do tipo MLP com tres camadas com funcao de ativacao sigmoide

logıstica para a camada intermediaria e funcao linear para a camada de saıda,

acrescida com ligacoes diretas entra a camada de entrada e a camada de saıda.

A partir destas investigacoes foi possıvel observar que a topologia com os melhores

desempenhos foi a rede neural do tipo MLP de tres camadas com funcao de ativacao

sigmoide logıstica na camada intermediaria e funcao de ativacao linear na camada de

saıda. Desta forma, esta topologia foi adotada para as investigacoes subsequentes, com

horizonte unitario de previsao e os demais parametros abaixo especificados para os expe-

rimentos realizados.

Fitmin = 0.99;

Rmax = 5;

Nhmax = 15;

Cont = 10.

Os valores dos parametros para o AG foram os mesmos ja utilizados nos experimentos

da Secao 6.2.

7.2.1.1 Experimentos com a Serie do Mapa de Henon

Para a serie do mapa de Henon, o melhor indivıduo gerado pelo metodo TAEF selecionou

os lags 2, 3, 5 e 7 como os retardos temporais relevantes utilizando 14 neuronios na camada

escondida. O algoritmo de treinamento eleito foi o Levenberg-Marquardt.

Na Tabela 7.1 sao mostrados os valores para as medidas de desempenho alcancadas

pelo metodo TAEF para os conjuntos de treinamento, validacao e teste.

Na Tabela 7.2 e possıvel comparar o conjunto de resultados alcancados pelo metodo

TAEF (Tabela 7.1) com os experimentos ja exibidos nos Capıtulos anteriores (modelos

de Box & Jenkins, RNAs, Sistema Hıbrido AG+RNA). Em particular, a comparacao

com os experimentos das RNAs mostra que o metodo TAEF consegue obter um conjunto

global de valores semelhante para as medidas de desempenho. Contudo, o Metodo TAEF

apresenta a vantagem do procedimento totalmente automatizado de escolha e ajuste de


Tabela 7.1: Resultados experimentais para a serie do Mapa de Henon — metodo TAEF.Erros Treinamento Validacao Teste

MSE 3.1393e-11 3.3011e-11 3.1678e-11MAPE (%) 0.0297 0.0322 0.0061Theil 9.2972e-10 5.1516e-10 1.9836e-10POCID (%) 100.00 100.00 100.00ARV 1.3304e-10 1.4453e-10 1.3932e-10AIC -120401.6280 -59863.3204 -55250.9695BIC -118717.9112 -58334.8237 -53722.5625

parametros.

Tabela 7.2: Resultados experimentais (conjunto de teste) com os melhores modelos (Box& Jenkins, RNAs, AG+RNA e TAEF) para a serie do Mapa de Henon.

Erros Box & Jenkins RNA AG+RNA TAEF Melhor Modelo

MSE 0.3625 4.0840e-9 0.0558 3.1678e-11 TAEFMAPE 404.53% 1.0349e-8% 1027.4527% 0.0061% RNA

U de Theil 2.2709 3.9090e-11 0.3495 1.9836e-10 TAEF e RNAPOCID 48.9489% 100.00% 62.1849% 100.00% TAEF e RNAARV 4.2811 7.8006e-11 0.0915 1.3932e-10 TAEF e RNAAIC -5045.4 -59657.5 -7168.0374 -55250.9695 TAEF e RNABIC -4940.2 -59241.3 -7024.7408 -53722.5625 TAEF e RNA


tracejada) gerada pelo metodo TAEF e exibido na Figura 7.2.

2400 2410 2420 2430 2440 2450 2460 2470 2480 2490−1.5

−1

−0.5

0

0.5

1

1.5


Hen

on

Figura 7.2: Serie do mapa de Henon (linha solida) e a previsao (linha tracejada) geradapelo metodo TAEF para os ultimos 100 pontos do conjunto de teste.


7.2.1.2 Experimentos com a Serie das Manchas Solares

Para a serie das manchas solares, o melhor indivıduo gerado pelo metodo TAEF selecionou

os retardos de 1 ao 4 como relevantes utilizando 4 neuronios na camada escondida, sendo

o algoritmo Levenberg-Marquardt eleito como algoritmo de treinamento mais apto.

Na Tabela 7.3 sao mostrados os valores para as medidas de desempenho relativas aos

conjuntos de treinamento, validacao e teste.

Tabela 7.3: Resultados experimentais para a serie das Manchas Solares — metodo TAEF.Erros Treinamento Validacao Teste


Na Tabela 7.4 e possıvel comparar o conjunto de resultados obtidos com o metodo

TAEF e os experimentos ja exibidos nos Capıtulos anteriores para esta serie. Embora os

experimentos com as RNAs ja tenham alcancado bons resultados, o metodo TAEF obtem

melhores resultados de forma global, inferior apenas na medida do MAPE e equivalente

na medida de POCID.

Tabela 7.4: Resultados experimentais (conjunto de teste) com os melhores modelos (Box& Jenkins, RNAs, AG+RNA e TAEF) para a series das Manchas Solares.


MSE 0.0219 0.9205 0.0127 0.0070 TAEFMAPE 42.35% 2.41% 40.00% 30.0661% RNA

U de Theil 0.7805 0.3443 0.4588 0.1763 TAEFPOCID 75.000% 90.0000% 58.326% 84.0580% RNA e TAEFARV 0.4007 0.1418 0.1999 0.1233 TAEFAIC -92.8323 -280.9 -304.2590 -321.5201 TAEFBIC -71.5266 -196.0 -287.8757 -305.5321 TAEF

Um grafico comparativo entre os valores reais da serie das Manchas Solares (linha

solida) e a previsao (linha tracejada) gerada pelo metodo TAEF para o conjunto de teste

e exibido na Figura 7.3.


0 10 20 30 40 50 60 700

50

100

150

200


Man

chas

Sol

ares

Figura 7.3: Serie das Manchas Solares (linha solida) e a previsao (linha tracejada) geradapelo metodo TAEF para o conjunto de teste.

7.2.1.3 Experimentos com a Serie de Medidas do Brilho de uma Estrela

Para a serie de Medidas do Brilho de uma Estrela, o melhor indivıduo gerado pelo metodo

TAEF selecionou os retardos de 1 ao 9 como relevantes, utilizando 15 neuronios na camada

escondida, sendo mais uma vez o algoritmo de treinamento Levenberg-Marquardt eleito

como o mais apto ao problema.

Na Tabela 7.5 sao mostrados os valores para as medidas de desempenho de previsao

para os conjuntos de treinamento, validacao e teste alcancadas pelo metodo TAEF.

Tabela 7.5: Resultados experimentais para a serie de Medidas do Brilho de uma Estrela— metodo TAEF.

Erros Treinamento Validacao Teste

MSE 8.4979e-5 1.2123-4 1.3852e-4MAPE (%) 2.0218 3.3120 2.7834Theil 0.0057 0.0098 0.0371POCID (%) 81.3559 76.8707 77.3972ARV 0.0022 0.0021 0.0020AIC -2264.4389 -1888.4629 -1796.0131BIC -1068.3972 -1435.4545 -1234.2578

Comparando o conjunto de resultados do metodo TAEF, mostrados na Tabela 7.5,

com os experimentos ja exibidos nos Capıtulos anteriores, o metodo TAEF apresenta-se,

em geral, superior em desempenho de previsao, como exibe a Tabela 7.6.

Um grafico comparativo entre os valores reais da serie de Medidas do Brilho de uma

Estrela (linha solida) e a previsao (linha tracejada) gerada pelo metodo TAEF e exibidos

na Figura 7.4.


Tabela 7.6: Resultados experimentais (conjunto de teste) com os melhores modelos (Box& Jenkins, RNAs, AG+RNA e TAEF) para a serie de medidas do brilho de uma estrela.


MSE 3.9004e-4 0.0234 7.0158e-4 1.3852e-4 TAEFMAPE 9.36% 0.10% 11.8313% 2.7834% RNA

U de Theil 0.0679 0.0632 0.1910 0.0371 TAEFPOCID 100.00% 72.97% 48.3221% 77.3972% Box & JenkinsARV 0.0035 3.3357e-3 0.0006 0.0020 AG+RNAAIC -294.9564 -1193.9 -1079.3262 -1796.0131 TAEFBIC -22.6541 -1089.8 -1059.2730 -1234.2578 TAEF

0 20 40 60 80 100 120 140−10

0

10

20

30

40


Bril

ho d

e um

a E

stre

la (

u.a.

)

Figura 7.4: Serie Brilho de uma Estrela (linha solida) e a previsao (linha tracejada)gerada pelo metodo TAEF para o conjunto de teste.

7.2.1.4 Experimentos com a Serie do Indice Dow Jones Industrial Average

Para a serie do Indice Dow Jones Industrial Average (DJIA), o melhor indivıduo gerado

pelo metodo TAEF selecionou os retardos 2, 4, 5, 6, 9 e 10 como os relevantes, utili-

zando 10 neuronios na camada escondida, sendo o Levenberg-Marquardt o algoritmo de

treinamento eleito como o mais apto para o problema.

Na Tabela 7.7 sao mostrados os valores para as medidas de desempenho obtidas pelo

metodo TAEF para os conjuntos de treinamento, validacao e teste para a serie DJIA.

Tabela 7.7: Resultados experimentais para a serie do Indice DJIA — metodo TAEF.Erros Treinamento Validacao Teste



Na Tabela 7.8 sao exibidos os melhores resultados para todos os experimentos rea-

lizados com a serie do Indice DJIA. Nota-se que os experimentos com as RNAs ainda

detem o melhor conjunto de resultados. Contudo, o metodo TAEF tem um comporta-

mento bastante semelhante aos experimentos com as RNAs, mostrando que mesmo com a

possibilidade de ajuste dos parametros e escolha do algoritmo de treinamento das RNAs,

nao foi possıvel a obtencao de um modelo de maior desempenho.

Tabela 7.8: Resultados experimentais (conjunto de teste) com os melhores modelos (Box& Jenkins, RNAs, AG+RNA e TAEF) para a serie do Indice DJIA.


MSE 5.8033e-4 0.0827 9.0341e-4 8.4183e-4 Box & JenkinsMAPE 8.32% 0.37% 10.3436% 1.1529% RNA

U de Theil 1.2649 0.9878 1.0827 1.0006 RNA e TAEFPOCID 46.10% 46.74% 50.8475% 47.5783% AG+RNAARV 0.0392 3.4226e-2 0.0189 0.0346 AG+RNAAIC -1056.2 -2500.7 -2412.3142 -2384.0349 RNABIC -1052.2 -2471.5 -2227.1738 -1514.5357 RNA


tracejada) gerada pelo metodo TAEF e exibido na Figura 7.5. Observando a Figura 7.6,

e possıvel notar claramente que a previsao esta se comportando como um Random Walk,

de forma semelhante aos experimentos com as RNAs.

0 50 100 150 200 250 300 3507000

7500

8000

8500

9000

9500

10000

10500


DJI

A

Figura 7.5: Serie DJIA (linha solida) e a previsao (linha tracejada) gerada pelo metodoTAEF para o conjunto de teste.


260 270 280 290 300 310 320 330 340 3508000

8500

9000

9500


DJI

A

Figura 7.6: Serie DJIA (linha solida) e a previsao (linha tracejada) gerada pelo metodoTAEF para os ultimos 100 pontos do conjunto de teste.

7.2.1.5 Experimentos com a Serie do Indice Nasdaq

Para a serie do Indice Nasdaq, o melhor indivıduo gerado pelo metodo TAEF selecionou

os retardos 3, 4, 6 e 8 como relevantes, utilizando 11 neuronios na camada escondida e o

algoritmo de treinamento Levenberg-Marquardt.

Na Tabela 7.9 sao mostrados os valores para as medidas de desempenho para os

conjuntos de treinamento, validacao e teste obtidas pelo metodo TAEF.

Tabela 7.9: Resultados experimentais para a serie do Indice Nasdaq — o metodo TAEF.Erros Treinamento Validacao Teste


Na Tabela 7.10 sao expostos todos os melhores resultados ja realizados para a serie do

Indice Nasdaq. Embora o metodo TAEF apresente de forma geral os melhores resultados,

tem um comportamento semelhante aos experimentos com as RNAs, nao garantindo que

este possa gerar um modelo suficientemente superior as RNAs para justificar seu uso.


tracejada) gerada pelo metodo TAEF para o conjunto de teste e exibido na Figura 7.7. Na

Figura 7.8 e mostrada uma ampliacao do grafico da Figura 7.7 para os ultimos 100 pontos

do conjunto de teste, destacando o comportamento da previsao com uma defasagem de

um passo no tempo, semelhante aos experimentos das RNAs – um modelo do tipo Random


Tabela 7.10: Resultados experimentais (conjunto de teste) com os melhores modelos (Box& Jenkins, RNAs, AG+RNA e TAEF) para a serie do Indice Nasdaq.


MSE 2.4222e-5 0.0022 2.5983e-4 2.1449e-5 TAEFMAPE 0.50% 2.6988e-3% 1.9660% 0.2012% RNA

U de Theil 1.2702 1.1728 13.8660 1.1441 Modelos SemelhantesPOCID 50.4751% 53.06% 53.2541% 52.7091% AG+RNAARV 0.0162 3.4977e-3 0.0085 0.0034 Modelos SemelhantesAIC -8871.6 -22536.0 -17346.0409 -22342.4331 RNA e TAEFBIC -8619.2 -22363.1 -17212.9900 -21391.1870 RNA e TAEF

Walk.

0 200 400 600 800 1000 1200 1400 1600 1800 20006.5

7

7.5

8

8.5

9

Pontos − Conjunto de teste

Nas

daq

Figura 7.7: Serie do Indice Nasdaq (linha solida) e a previsao (linha tracejada) geradapelo metodo TAEF para o conjunto de teste.

2000 2010 2020 2030 2040 2050 2060 2070 2080 2090 21007.5

7.55

7.6

7.65

7.7

7.75


Nas

daq

Figura 7.8: Serie do Indice Nasdaq (linha solida) e a previsao (linha tracejada) geradapelo metodo TAEF para os ultimos 100 pontos do conjunto de teste.


7.2.1.6 Experimentos com a Serie do Indice S&P500

Para a serie do Indice S&P500, o melhor indivıduo gerado pelo metodo TAEF selecionou

o retardo 1 como o unico retardo temporal relevante utilizando 3 neuronios na camada

escondida, sendo novamente o Levenberg-Marquardt eleito como o algoritmo de treina-

mento mais apto.

Na Tabela 7.11 sao mostrados os valores para as medidas de desempenho obtidas pelo

metodo TAEF para os conjuntos de treinamento, validacao e teste.

Tabela 7.11: Resultados experimentais para a serie do Indice S&P500 — o Metodo TAEF.Erros Treinamento Validacao Teste


Comparando o conjunto de resultados mostrados na Tabela 7.11 com os experimen-

tos ja exibidos nos Capıtulos anteriores, exibidos na Tabela 7.12, as RNAs apresentam

novamente o melhor conjunto de resultados de desempenho de previsao, seguidas pelo

metodo TAEF.

Tabela 7.12: Resultados experimentais (conjunto de teste) com os melhores modelos (Box& Jenkins, RNAs, AG+RNA e TAEF) para a serie do Indice S&P500.


MSE 2.1447e-4 0.0095 5.5643e-4 7.4290e-4 Box & JenkinsMAPE 1.24% 0.1000% 2.4029% 1.0431% RNA

U de Theil 1.4090 0.9166 5.4402 7.24123 RNA e Box & JenkinsPOCID 47.2222% 51.11% 74.7252% 50.5494% AG+RNAARV 0.1374 7.2728e-3 0.0682 0.0100 RNAAIC -310.5510 -741.0 -645.4452 -632.8550 RNABIC -307.9400 -561.9 -567.9658 -580.0282 TAEF


tracejada) gerada pelo metodo TAEF e exibido na Figura 7.9.


0 10 20 30 40 50 60 70 80 907

7.5

8

8.5

9


S&

P50

0

Figura 7.9: Serie do Indice S&P500 (linha solida) e a previsao (linha tracejada) geradapelo metodo TAEF para o conjunto de teste.

7.2.1.7 Experimentos com a Serie do Valor de Fechamento das Acoes da

Petrobras

Para a serie do Valor de Fechamento das Acoes da Petrobras, o melhor indivıduo gerado

pelo metodo TAEF selecionou retardos 3, 4 e 7 como relevantes, utilizando 17 neuronios

na camada escondida, elegendo o Levenberg-Marquardt como o algoritmo de treinamento

mais adequado ao problema.

Na Tabela 7.13 sao mostrados os valores para as medidas de desempenho alcancadas

pelo metodo TAEF para os conjuntos de treinamento, validacao e teste.

Tabela 7.13: Resultados experimentais para a serie do Valor de Fechamento das Acoesda Petrobras — metodo TAEF.

Erros Treinamento Validacao Teste


Na Tabela 7.14 sao apresentados os melhores resultados obtidos com todos os ex-

perimentos realizados para a previsao da serie do Valor de Fechamento das Acoes da

Petrobras. De forma geral, o desempenho de previsao dos experimentos com as RNAs

e com o metodo TAEF apresentam-se semelhantes, onde cada uma das metodologias

alcancam melhores resultados para tres medidas de desempenho distintas. Assim, a con-

clusao plausıvel e de equivalencia de previsao entre os experimentos.


Tabela 7.14: Resultados experimentais (conjunto de teste) com os melhores modelos (Box& Jenkins, RNAs, AG+RNA e TAEF) para a serie do Valor de Fechamento das Acoesda Petrobras.


MSE 2.5532e-4 0.0095 1.3712e-4 7.5951e-5 TAEFMAPE 1.41% 0.1000% 0.9815% 0.5480% RNA

U de Theil 4.0261 1.5124 2.1875 1.2077 TAEFPOCID 49.0385% 51.64% 57.3791% 52.7938% AG+RNAARV 0.2080 0.0890 0.0951 0.0050 TAEFAIC -1723.1 -4713.4 -4555.0048 -4286.4167 RNABIC -1710.0 -4445.5 -4323.6674 -2589.4300 RNA

0 50 100 150 200 250 300 350 400 450 5003.4

3.6

3.8

4

4.2


Pet

robr

asO

N

Figura 7.10: Serie de Valor de Fechamento das Acoes da Petrobras (linha solida) e aprevisao (linha traceja) gerada pelo metodo TAEF para o conjunto de teste.


tracejada) gerada pelo metodo TAEF para o conjunto de teste e exibido na Figura 7.10.

Na Figura 7.11 e mostrada uma ampliacao da Figura 7.10 para os ultimos 100 pontos

do conjunto de teste, exibindo um deslocamento de um passo entre os dados reais e a

previsao, caracterıstica esta de um modelo do tipo Random Walk.

420 430 440 450 460 470 480 490 500 510 5203.75

3.8

3.85

3.9

3.95

4

4.05

4.1


Pet

robr

asO

N

Figura 7.11: Serie de Valor de Fechamento das Acoes da Petrobras (linha solida) e aprevisao gerada pelo metodo TAEF para os ultimos 100 pontos do conjunto de teste.


7.2.1.8 Experimentos com a Serie Random Walk

Para a serie Random Walk, o melhor indivıduo gerado pelo metodo TAEF selecionou

os retardos temporais 2, 3 e 5 como os relevantes, utilizando 15 neuronios na camada

escondida, elegendo o Levenberg-Marquardt como o algoritmo de treinamento mais apto.

Na Tabela 7.15 sao mostrados os valores para as medidas de desempenho gerados pelo

metodo TAEF para os conjuntos de treinamento, validacao e teste.

Tabela 7.15: Resultados experimentais para a serie Random Walk — metodo TAEF.Erros Treinamento Validacao Teste


Na Tabela 7.16 sao apresentados os resultados dos melhores modelos alcancados nos

experimentos ja apresentados para a serie Random Walk. Novamente os experimentos

com as RNAs detem o melhor conjunto de valores para as medidas de desempenho,

seguidas pelo metodo TAEF.

Tabela 7.16: Resultados experimentais (conjunto de teste) com os melhores modelos (Box& Jenkins, RNAs, AG+RNA e TAEF) para a serie Random Walk.


MSE 0.0018 0.1313 0.0014 0.0009 TAEFMAPE 6.70% 0.28% 6.9377% 5.4631% RNA

U de Theil 1.7633 1.0454 1.1276 1.1016 RNAPOCID 54.55% 49.19% 48.2551% 51.4170% Box & JenkinsARV 0.1921 4.8108e-2 0.0956 0.0767 RNAAIC -629.7357 -1600.3 -1562.4317 -1588.3290 RNABIC -626.1305 -1482.9 -1390.6162 -854.5578 RNA


tracejada) gerada pelo metodo TAEF para o conjunto de teste e exibido na Figura 7.12.

E possıvel notar claramente que o grafico da previsao apresenta-se deslocado no tempo de

um passo em relacao ao grafico dos valores reais da serie, explicando o baixo desempenho

exibidos pelas medidas da estatıstica U de Theil e pelo POCID.


0 50 100 150 20040

60

80

100

120

140


Ran

dom

Wal

k

Figura 7.12: Serie Random Walk (linha solida) e a previsao gerada pelo metodo TAEFpara o conjunto de teste.

7.2.2 Analise Comportamental das Series Temporais

A partir dos experimentos desenvolvidos para as series temporais estudadas e possıvel

construir um quadro comparativo entre as metodologias aplicadas a cada destas series

destacando a mais apta, como exibido na Tabela 7.17.

Tabela 7.17: Metodologias mais adequadas para cada serie temporal estudada.

Serie MetodologiaHenon → TAEF e RNA

Manchas Solares → TAEFBrilho de uma Estrela → TAEF

DJIA → RNANasdaq → TAEF e RNAS&P500 → RNA

Petrobras → RNA e TAEFRandom Walk → RNA

Observando-se os resultados obtidos nos experimentos realizados com o metodo TAEF,

pode-se notar duas situacoes bem distintas. A primeira situacao, referentes a serie do

Mapa de Henon, serie das Manchas Solares e serie de Medidas de Brilho de uma Estrela,

revela que o metodo proposto e capaz de ajustar os parametros pesquisados, conseguindo,

em media, obter melhores marcas de desempenho de previsao em comparacao aquelas

alcancadas pelas demais metodologias. Em especial, os valores obtidos para a estatıstica

U de Theil e para o POCID demonstram que os modelos gerados nesta primeira situacao

sao bem superiores em precisao quando comparados a modelos do tipo Random Walk

(medida da estatıstica U de Theil) e experimentos do tipo cara ou coroa (medida POCID).

A segunda situacao, observada para as series economicas e financeiras e para a serie


Random Walk, e caracterizada por valores relativamente baixos do erro MSE, quando

comparados aos erros alcancados nos demais experimentos (Capıtulos 5 e 6), indicando um

melhor desempenho do sistema quanto ao ajuste da sua funcao de fitness (Equacao (.)).

Contudo, segundo as demais medidas de desempenho, e constatado que o desempenho

medio do metodo TAEF nao e habil para superar os resultados ja obtidos pela metodo-

logia das RNAs, alcancando apenas valores semelhantes.

Em particular, analisando as medidas de desempenho da estatıstica U de Theil e

POCID, para a segunda situacao, constata-se que os resultados obtidos sao bem inferiores

aos alcancados por modelos do tipo Random Walk e bem semelhantes a um modelo do

tipo cara ou coroa. Tais caracterısticas comportamentais fortalecem a suposicao de que

as series economicas e financeiras tendem a um modelo tipicamente de Random Walk,

como ja suposto no Capıtulo 4.

Dado que a serie estudada segue um modelo do tipo Random Walk, sua formulacao

generica, ja mostrada no Capıtulo 4 (Equacao (7.17)), pode ser escrita como:

Zt = Zt−1 + rt (.)

onde Zt e a observacao atual, Zt−1 e a observacao imediatamente antes da atual e rt e

um termo de ruıdo, com media zero e desvio padrao σa.

Com a previsao pretende-se na realidade construir uma estimativa para Zt, represen-

tada por Zt, baseada nos valores passados da serie, que para o caso de um modelo do

tipo Random Walk, e a componente Zt−1. Portanto, uma boa previsao e tida quando em

media o valor esperado da diferenca da estimativa da serie pela propria serie tende a zero,

E[Zt − Zt] → 0 (.)

o que leva ao desenvolvimento, supondo que E[rt] = 0 e E[rtrk] = 0 (∀ t 6= k),

E

[Zt − (Zt−1 + rt)

]→ 0

E[Zt] − E[Zt−1] − E[rt] → 0

E[Zt] − E[Zt−1] → 0

E[Zt] → E[Zt−1]


Desta forma, mostra-se que a minimizacao do erro entre a estimativa e a serie real con-

duz naturalmente a uma previsao deslocada de um passo em relacao a serie original,

explicando o motivo das RNAs e do metodo TAEF convergirem ambos para este com-

portamento.

Apos o processo de treinamento, a RNA adquire a informacao do comportamento da

serie temporal. Considerando que o modelo da serie temporal tenda a um modelo do tipo

Random Walk e de se esperar que a informacao aprendida pela RNA seja que o valor

da serie para o tempo t e simplesmente o valor no tempo t − 1. Este comportamento e

exatamente observado no grafico de previsao para as series economicas-financeiras apre-

sentadas, bem como para a propria serie artificial de Random Walk. Sitte e Sitte [103]

mostraram que as RNAs, tanto do tipo MLP como redes recorrentes, apresentam este

mesmo tipo de comportamento para a previsao de series economicas e financeiras.

Entretanto, como exposto nos graficos dos lagplots, as series economicas e financeiras

apresentam estruturas indicativas de algum tipo de relacionamento nao-linear entre os

retardos temporais, mesmo que sobreposta a uma componente linear dominante. Por-

tanto, e de se esperar que as series economicas e financeiras tendam a um modelo do

tipo Random Walk, mas nao sejam exatamente regidas por tal tipo de modelo, apresen-

tando um comportamento nao-linear bastante sutil, facilmente mascarado por uma forte

componente de Random Walk.

E entao suposto que o metodo TAEF seja capaz de encontrar uma condicao quase-

otima (ou ate mesmo otima) de ajuste dos parametros das RNAs, de tal forma que

seja habil de absorver grande parte da (ou toda a) informacao contida nos dados, tanto

a linear como a nao-linear. O comportamento ja observado para as series economicas

e financeiras, com uma previsao deslocada de um passo, pode ser suposto pelo fato

da componente linear (ou de Random Walk) ser dominante em relacao a componente

nao-linear. Esta componente nao-linear pode, por exemplo, ser originada por alguma

correlacao de alta ordem sobre os dados muito menor que a correlacao com o primeiro

retardo temporal, ou, ate mesmo, sobre as componentes de ruıdo, com o aparecimento

de alguma heterocedasticidade [7, 8].

Este comportamento de deslocamento ou defasagem temporal observado nas previsoes

das series temporais, a partir de um segundo ponto de vista, pode ser encarado como um

ajuste de uma fase temporal relativa entre os dados reais e a previsao gerada. Como as

series temporais abordadas tem observacoes discretas no tempo, a fase temporal relativa


sera quantizada no tempo, onde o seu elemento fundamental (ou quanta) de incremento

ou decremento sera a distancia temporal entre os pontos da serie, sendo este quanta a

unidade fundamental de tempo para o problema.

Como ja exibido nos graficos comparativos entre os dados reais das series e as pre-

visoes geradas pelo metodo TAEF, ha duas possibilidades: a primeira, para as series que

nao tendem a um modelo Random Walk, onde as previsoes encontram-se em fase; e a

segunda, para as series que tendem a um modelo do tipo Random Walk, onde as previsoes

encontram-se fora de fase, estando a rede defasada negativamente de um quanta, ou seja,

atrasada em sua previsao em uma unidade fundamental de tempo ou um passo. Para

esta ultima possibilidade, a fase pode ser ajustada com um mecanismo que considera

uma previsao de dois passos temporais. Inicialmente apresenta-se um padrao de entrada

a rede, que gera uma saıda (primeiro passo). Em seguida, esta saıda e combinada com

os dados da entrada, gerando um padrao de ajuste, que e apresentado novamente a rede,

que por sua vez gera uma nova saıda (segundo passo), corrigindo a fase em um quanta

temporal. Este procedimento de correcao de fase e ilustrado na Figura 7.13.

Figura 7.13: Procedimento de ajuste da fase da previsao gerada pelo metodo TAEF.

E importante salientar que o fato de ser possıvel o ajuste da fase relativa entre a

previsao e a serie real implica que o modelo gerado tende a um modelo do tipo Random

Walk, muito provavelmente devido a forte componente linear contida nas series, mas

que, de alguma forma, e capaz de aprender o relacionamento entre os pontos e nao

simplesmente indicar que o valor do tempo t e igual ao valor do tempo t − 1.

Com a implementacao do procedimento de ajuste de fase ao metodo TAEF, surge um

novo problema: como determinar se a serie tende ou nao a um modelo do tipo Random

Walk? Ou, de forma equivalente, como determinar se a RNA esta gerando uma previsao


em fase ou fora de fase? Este problema foi resolvido aplicando-se os dois procedimentos

de previsao (em fase e fora de fase), ao conjunto de validacao, logo apos o termino do

processo de treinamento da RNA. Com os dois resultados, a previsao na suposicao de fase

e a previsao na suposicao fora de fase, e aplicado um teste estatıstico, teste t [106], onde

a hipotese nula e: o erro MSE da previsao em fase e menor que o erro MSE da previsao

fora de fase, sendo testados todos os pares de pontos (dados reais, dados previstos). A

hipotese alternativa e a suposicao contraria, ou seja, o erro MSE da previsao em fase e

maior que o erro MSE da previsao fora de fase.

Todo o procedimento de deteccao e ajuste da fase foi incorporado ao metodo TAEF,

onde o teste t utiliza um grau de confianca de 99% (α = 0.01). Uma vez a hipotese nula

sendo aceita, o metodo ira supor que a previsao esta em fase, nao sendo necessaria a in-

tervencao no ajuste da fase da previsao. Caso contrario, a hipotese nula sendo rejeitada,

o metodo TAEF ira supor que a previsao gerada esta fora de fase e realizara o procedi-

mento de ajuste de fase temporal da previsao. Na Figura 7.14 e mostrado o esquema do

metodo TAEF com a inclusao do teste comportamental para a determinacao da fase de

previsao.

Varios experimentos com esta nova funcionalidade do metodo TAEF foram realizados

com as series temporais ja apresentadas, comprovando a viabilidade da deteccao e do

ajuste de fase da previsao, como podera ser comprovado nos resultados experimentais

expostos na proxima Secao, aumentando consideravelmente o desempenho de previsao

do metodo proposto.

7.2.3 Experimentos com a Inclusao da Analise Comportamental ao Metodo TAEF

Nas subsecoes subsequentes sao expostos os resultados obtidos com a utilizacao do proce-

dimento de analise e ajuste da fase temporal incorporado ao metodo TAEF para as series

ja apresentadas. O mesmo procedimento de ajuste de fase tambem e aplicado diretamente

as RNAs afim de possibilitar uma validacao mais robusta do desempenho do metodo em

relacao aos demais modelos. O objetivo e descartar ou confirmar a possibilidade do ajuste

de fase ser suficiente para aprimorar o desempenho de um modelo mais simples como as

RNAs tıpicas.


Figura 7.14: Esquema do metodo TAEF com a inclusao do teste comportamental para adeterminacao da fase de previsao

7.2.3.1 Experimentos com a Serie do Mapa de Henon

Para a serie do Mapa de Henon, o procedimento de analise da fase temporal da pre-

visao gerada pelo metodo TAEF indica uma previsao em fase, gerando os resultados ja

apresentados na Tabela 7.1.

Entretanto, para efeito de comparacao, foram recalculados os valores para as medidas


de desempenho forcando a suposicao de previsao fora de fase. Os resultados para o

conjunto de teste sao apresentados na Tabela 7.18 tanto para o metodo TAEF como para

as RNAs. Estes resultados mostram que o metodo TAEF e capaz de escolher corretamente

a previsao em fase para a serie, sendo a melhor metodologia dentre as investigadas sob o

aspecto da capacidade de automacao do processo de previsao.

Tabela 7.18: Resultados experimentais para a serie do Mapa de Henon com as RNAs e ometodo TAEF na suposicao em fase e fora de fase para o conjunto de teste.

ErrosRNA TAEF

Em Fase Fora de Fase Em Fase Fora de FaseMSE 4.0840e-9 0.1588 3.1678e-11 1.0445

MAPE (%) 1.0349e-10 1227.5241 0.0061 305.0857Theil 3.9090e-10 0.9998 1.9836e-10 0.9996

POCID (%) 100.00 42.3823 100.00 41.5064ARV 7.8006e-11 2.6363 1.3932e-10 1.3187AIC -59657.5 -8746.5570 -55250.9695 556.6590BIC -59241.3 -7062.8850 -53722.5625 2084.9763


tracejada) gerada pelo metodo em ambas as situacoes de fase e exibido na Figura 7.15.

E possıvel notar claramente que o grafico de suposicao de fase apresenta uma previsao

bastante superior ao grafico que considera a situacao fora de fase.

7.2.3.2 Experimentos com a Serie das Manchas Solares

Para a serie das Manchas Solares, o procedimento de analise da fase temporal da previsao

gerada pelo metodo TAEF indica uma previsao em fase, alcancando os resultados ja

apresentados na Tabela 7.3.

Novamente, para efeito de comparativo, foram recalculados os valores para as medidas

de desempenho forcando a suposicao de previsao fora de fase. As medidas para o conjunto

de teste sao apresentadas na Tabela 7.19 tanto para o metodo TAEF como para as

RNAs. O procedimento de analise comportamental da fase temporal incorporado ao

metodo TAEF e habil para caracterizar corretamente a previsao em fase para a serie

das Manchas Solares, sendo o metodo TAEF, dentre os investigados, o que apresenta o

melhor desempenho.


(linha tracejada) gerada pelo metodo TAEF em ambas as situacoes da fase e exibido na


2400 2410 2420 2430 2440 2450 2460 2470 2480 2490−1.5

−1

−0.5

0

0.5

1

1.5Em Fase


Hen

on

2400 2410 2420 2430 2440 2450 2460 2470 2480 2490−1.5

−1

−0.5

0

0.5

1

1.5Fora de Fase


Hen

on

Figura 7.15: Serie do Mapa de Henon (linha solida) e as previsoes (linha tracejada)geradas pelo metodo TAEF para os ultimos 100 pontos do conjunto de teste. O graficosuperior e referente a suposicao de previsao em fase e o grafico inferior a suposicao deprevisao fora de fase.

Tabela 7.19: Resultados experimentais para a serie das Manchas Solares com as RNAs eo metodo TAEF na suposicao em fase e fora de fase para o conjunto de teste.

ErrosRNA TAEF

Em Fase Fora de Fase Em Fase Fora de FaseMSE 0.9205 1.0163 0.0070 0.0307

MAPE (%) 2.41 133.5613 30.0661 82.5523Theil 0.3443 1.3295 0.1763 1.2225

POCID (%) 90.00 61.7021 84.0580 65.2174ARV 0.1418 0.3020 0.1233 0.4125AIC -280.9 76.9087 -321.5201 -195.8776BIC -196.0 81.9688 -305.5321 -117.9137

Figura 7.16. E possıvel notar claramente que o grafico de suposicao de fase apresenta

uma previsao bastante superior ao grafico que considera a situacao fora de fase.

7.2.3.3 Experimentos com a Serie de Medidas do Brilho de uma Estrela

Para a serie de Medidas do Brilho de uma Estrela, o procedimento de analise da fase

temporal da previsao gerada pelo metodo TAEF indica novamente uma previsao em


0 10 20 30 40 50 60 700

50

100

150

200Em Fase


Man

chas

Sol

ares

0 10 20 30 40 50 60 70−50

0

50

100

150

200Fora de Fase


Man

chas

Sol

ares

Figura 7.16: Serie das Manchas Solares (linha solida) e as previsoes (linha tracejada)geradas pelo metodo TAEF para o conjunto de teste. O grafico superior e referente asuposicao de previsao em fase e o grafico inferior a suposicao de previsao fora de fase.

fase, gerando os resultados ja apresentados na Tabela 7.5. Foram calculados tambem os

valores das medidas de desempenho para o conjunto de teste forcando a suposicao de

previsao fora de fase com a utilizacao tanto do metodo TAEF como das RNAs, sendo

estes apresentados na Tabela 7.20. O procedimento de analise comportamental da fase

de previsao novamente foi caracterizado corretamente pelo metodo TAEF.

Tabela 7.20: Resultados para a serie de Medidas do Brilho de uma Estrela com as RNAse o metodo TAEF na suposicao em fase e fora de fase para o conjunto de teste.

ErrosRNA TAEF

Em Fase Fora de Fase Em Fase Fora de FaseMSE 0.0234 0.8865 1.3852e-4 0.0087

MAPE (%) 0.1000 27.7194 2.7834 26.7629Theil 0.0632 2.2185 0.0371 2.3149

POCID (%) 72.97 66.1905 77.3972 73.7931ARV 3.3357e-3 0.7482 0.0020 0.6128AIC -1193.9 -188.4629 -1796.0131 -182.6801BIC -1089.8 306.7158 -1234.2578 833.1395



Figura 7.17. E possıvel notar claramente que o grafico de suposicao de fase apresenta


uma previsao bastante superior ao grafico que considera a situacao fora de fase.

0 20 40 60 80 100 120 140−10

0

10

20

30

40Em Fase


Bril

ho d

e um

a E

stre

la (

u.a.

)

0 20 40 60 80 100 120 1400

5

10

15

20

25

30

35Fora de Fase


Bril

ho d

e um

a E

stre

la (

u.a.

)

Figura 7.17: Serie de Medidas do Brilho de uma Estrela (linha solida) e as previsoes(linha tracejada) geradas pelo metodo TAEF para o conjunto de teste. O grafico superiore referente a suposicao de previsao em fase e o grafico inferior a suposicao de previsaofora de fase.

7.2.3.4 Experimentos com a Serie do Indice Dow Jones Industrial Average

Para a serie do Indice Dow Jones Industrial Average, o procedimento de analise de fase

da previsao indica uma previsao fora de fase. Com esta suposicao o metodo TAEF aplica

o procedimento de correcao de fase, tentando corrigir tal distorcao.

Recalculando todos os valores para as medidas de desempenho na suposicao de pre-

visao fora de fase e comparando com os resultados em fase, e observada uma extrema

melhoria no desempenho de previsao com a utilizacao do metodo TAEF. Ja o modelo

da RNA nao e capaz de corrigir a distorcao de fase, funcionando como um modelo do

tipo Random Walk, como mostra a Tabela 7.21. Em particular, percebe-se que o modelo

do metodo TAEF (fora de fase) consegue obter um melhor desempenho que um modelo

do tipo Random Walk, evidenciado pelo valor da estatıstica U de Theil (0.0318), e bem

superior ao comportamento usual de um experimento do tipo cara ou coroa, com um

valor de POCID de 97.1429%.


Tabela 7.21: Resultados experimentais para a serie do Indice DJIA com as RNAs e ometodo TAEF na suposicao de previsao em fase e fora de fase para o conjunto de teste.

ErrosRNA TAEF

Em Fase Fora de Fase Em Fase Fora de FaseMSE 0.0827 0.0830 8.4183e-4 2.6841e-5

MAPE (%) 0.3700 0.3788 1.1529 0.1993Theil 0.9878 0.9885 1.0006 0.0318

POCID (%) 46.7422 46.5909 47.5783 97.1429ARV 3.3877e-2 3.4204e-2 0.0346 0.0007AIC -2500.7 -2499.2 -2384.0349 -3408.4698BIC -2471.5 -2470.8 -1514.5357 -2713.3773

O procedimento de analise comportamental da fase de previsao novamente foi correto

em sua classificacao fora de fase. Um grafico comparativo entre os valores reais da serie

(linha solida) e a previsao (linha tracejada) gerada pelo metodo TAEF em ambas as

situacoes da fase e exibido na Figura 7.18. E possıvel notar a partir da Figura 7.19 que

o grafico de suposicao fora de fase apresenta uma previsao bastante superior ao grafico

que considera a situacao em fase.

0 50 100 150 200 250 300 3507000

7500

8000

8500

9000

9500

10000

10500Em Fase


DJI

A

0 50 100 150 200 250 300 3507000

7500

8000

8500

9000

9500

10000

10500Fora de Fase


DJI

A

Figura 7.18: Serie do Indice DJIA (linha solida) e as previsoes (linha tracejada) geradaspelo metodo TAEF para o conjunto de teste. O grafico superior e referente a suposicaode previsao em fase e o grafico inferior a suposicao de previsao fora de fase.


260 270 280 290 300 310 320 330 340 3508000

8500

9000

9500Em Fase


DJI

A

260 270 280 290 300 310 320 330 340 3508000

8500

9000

9500Fora de Fase


DJI

A

Figura 7.19: Serie do Indice DJIA (linha solida) e as previsoes (linha tracejada) geradaspelo metodo TAEF para os ultimos 100 pontos do conjunto de teste. O grafico superiore referente a suposicao de previsao em fase e o grafico inferior a suposicao de previsaofora de fase.

7.2.3.5 Experimentos com a Serie do Indice Nasdaq

Para a serie do Indice Nasdaq, o procedimento de analise de fase temporal indica uma

previsao fora de fase, implicando no procedimento de correcao de fase para a tentativa

da correcao da distorcao.

Recalculando todos valores para as medidas de desempenho na suposicao de previsao

fora de fase e observada uma grande melhoria em relacao a situacao de previsao em fase

com a utilizacao do metodo TAEF. Para a RNA nenhuma melhoria e observada, como

mostra a Tabela 7.22.

O metodo TAEF (fora de fase) consegue um desempenho bastante superior a um

modelo do tipo Random Walk, como evidenciado pela estatıstica U de Theil (0.1726),

e bem superior ao comportamento tıpico de um experimento do tipo cara ou coroa,

alcancando um valor de POCID de 89.6338%.

Portanto, o procedimento de analise comportamental da fase de previsao incorporado

ao metodo foi capaz novamente de caracterizar corretamente a previsao. Este mesmo

procedimento aplicado a RNA nao apresentou nenhum benefıcio, caracterizando-a como


Tabela 7.22: Resultados experimentais para a serie do Indice Nasdaq com as RNAs e ometodo TAEF na suposicao em fase e fora de fase fase para o conjunto de teste.

ErrosRNA TAEF

Em Fase Fora de Fase Em Fase Fora de FaseMSE 0.0022 0.0023 2.1449e-5 32374e-6

MAPE (%) 2.6988e-3 2.7001e-3 0.2012 0.0774Theil 1.1728 1.1759 1.1441 0.1726

POCID (%) 53.0641 53.9458 52.7091 89.6338ARV 3.4977e-3 3.5011e-3 0.0034 5.1500e-4AIC -22536.0 -22536.4 -22342.4331 -26310.0737BIC -22363.1 -22363.9 -21391.1870 -25358.8956

um modelo do tipo Random Walk.



Figura 7.20. Nota-se, a partir da Figura 7.21, que o grafico de suposicao fora de fase

apresenta uma previsao bastante superior ao grafico que considera a situacao em fase.

0 200 400 600 800 1000 1200 1400 1600 1800 20006.5

7

7.5

8

8.5

9Em Fase


Nas

daq

0 200 400 600 800 1000 1200 1400 1600 1800 20006.5

7

7.5

8

8.5

9Fora de Fase


Nas

daq

Figura 7.20: Serie do Indice Nasdaq (linha solida) e as previsoes (linha tracejada) geradaspelo metodo TAEF para o conjunto de teste. O grafico superior e referente a suposicaode previsao em fase e o grafico inferior a suposicao de previsao fora de fase.


2000 2010 2020 2030 2040 2050 2060 2070 2080 2090 21007.5

7.55

7.6

7.65

7.7

7.75Em Fase


Nas

daq

2000 2010 2020 2030 2040 2050 2060 2070 2080 2090 21007.5

7.55

7.6

7.65

7.7

7.75Fora de Fase


Nas

daq

Figura 7.21: Serie do Indice Nasdaq (linha solida) e as previsoes (linha tracejada) geradaspelo metodo TAEF para os ultimos 100 pontos do conjunto de teste. O grafico superiore referente a suposicao de previsao em fase e o grafico inferior a suposicao de previsaofora de fase.

7.2.3.6 Experimentos com a Serie do Indice S&P500

Para a serie do Indice S&P500, o procedimento de analise da fase temporal da previsao

gerada indica uma previsao fora de fase, implicando no procedimento de correcao de fase.

Recalculando todos os valores para as medidas de desempenho na suposicao de pre-

visao fora de fase, nao se observa nenhuma melhoria significativa em relacao a situacao

de previsao em fase para ambos os metodos, sendo os valores alcancados para a carac-

terizacao fora de fase aproximadamente iguais aos valores obtidos para a suposicao em

fase. Todas as medidas de desempenho (conjunto de teste) para ambas as situacoes sao

apresentadas na Tabela 7.23.

O fato das medidas de desempenho nao alcancarem valores superiores em precisao

quando comparadas com a suposicao de previsao em fase pode ser explicado pela tendencia

existente na serie. Tal tendencia faz com que a previsao em fase se aproxime mais dos

pontos reais, diminuindo a distancia media entre os pontos reais e os pontos previstos.

Entretanto, para o metodo TAEF, quando observada a medida de POCID, a suposicao

em fase alcanca um valor de 50.5494%, contra um valor de 100.00% para a suposicao fora


de fase. A medida ARV tambem indica que a suposicao fora de fase e mais adequada,

com um valor de 0.0012 contra 0.0100 para a suposicao em fase. Sob este angulo, o pro-

cedimento de analise comportamental da fase de previsao incorporado ao metodo TAEF

foi capaz novamente de caracterizar corretamente a previsao como fora de fase. Tal com-

portamento nao e observado para a RNA que apresenta desempenho insatisfatorio nas

duas hipoteses de previsao.

Tabela 7.23: Resultados experimentais para a serie do Indice S&P500 com as RNAs e ometodo TAEF nas suposicoes de previsao em fase e fora de fase para o conjunto de teste.

ErrosRNA TAEF


MAPE (%) 0.0100 0.0103 1.0431 1.0228Theil 0.9166 0.9179 7.24123 7.0883

POCID (%) 51.1111 50.9874 50.5494 100.00ARV 7.2728e-3 7.2875e-3 0.0100 0.0012AIC -741.0 -740.8 -632.8550 -628.6120BIC -561.9 -560.4 -580.0282 -585.9491


(linha tracejada) gerada pelo metodo TAEF em ambas as situacoes da fase e exibido

na Figura 7.22. A partir deste, nota-se o problema da nao evolucao das medidas de

desempenho para a suposicao fora de fase gerada pela tendencia da serie.

7.2.3.7 Experimentos com a Serie do Valor de Fechamento das Acoes da

Petrobras

Para a serie do Valor de Fechamento das Acoes da Petrobras, o procedimento de analise

de fase indica uma previsao fora de fase, implicando no procedimento de correcao de fase.

Todas as medidas de desempenho para o conjunto de teste e para as situacoes em fase

e fora de fase sao apresentadas na Tabela 7.24. Observa-se que o metodo TAEF escolheu

corretamente a suposicao de previsao fora de fase como a melhor opcao. Ja para a RNA,

as duas suposicoes da fase nao apresentam nenhuma diferenca significativa, evidenciando

o comportamento do tipo Random Walk da rede.

Nota-se que o modelo atual para o metodo TAEF (fora de fase) apresenta um desem-

penho bastante superior a um modelo do tipo Random Walk, observando-se o valor da

estatıstica U de Theil (0.3023), e bem superior ao comportamento usual de um experi-


0 10 20 30 40 50 60 70 80 907

7.5

8

8.5

9Em Fase


S&

P50

0

0 10 20 30 40 50 60 70 80 907

7.5

8

8.5

9Fora de Fase

Pontos − Conjunto de Testes

S&

P50

0

Figura 7.22: Serie do Indice S&P500 (linha solida) e as previsoes (linha tracejada) geradaspelo metodo TAEF para o conjunto de teste. O grafico superior e referente a suposicaode previsao em fase, e o grafico inferior referente a suposicao de previsao fora de fase.

mento do tipo cara ou coroa, com o valor de POCID de 97.6834%.

Tabela 7.24: Resultados experimentais para a serie da Petrobras com as RNAs e o metodoTAEF nas suposicoes de previsao em fase e fora de fase para o conjunto de teste.

ErrosRNA TAEF


MAPE (%) 0.0100 0.0101 0.5480 0.2850Theil 1.5124 1.5130 1.2077 0.3023

POCID (%) 51.6378 51.6400 52.7938 97.6834ARV 0.0890 0.0895 0.0050 0.0019AIC -4713.4 -4713.4 -4286.4167 -4994.7414BIC -4445.5 -4445.5 -2589.4300 -3298.3765

E possıvel concluir que o procedimento de analise comportamental da fase de previsao

incorporado ao metodo TAEF foi capaz novamente de caracterizar e corrigir a fase da

previsao, o que nao ocorreu com o modelo da RNA.


(linha tracejada) gerada pelo metodo TAEF em ambas as situacoes de fase e exibido na

Figura 7.23. Nota-se, a partir da Figura 7.24, que o grafico de suposicao fora de fase


apresenta uma previsao superior ao grafico que considera a situacao em fase.

0 50 100 150 200 250 300 350 400 450 5003.4

3.6

3.8

4

4.2Em Fase


Pet

robr

asO

N

0 50 100 150 200 250 300 350 400 450 5003.4

3.6

3.8

4

4.2Fora de Fase


Pet

robr

asO

N

Figura 7.23: Serie da Petrobras (linha solida) e a previsao gerada pelo metodo TAEF(linha tracejada) para o conjunto de teste. O grafico superior e referente a suposicao deprevisao em fase e o grafico inferior a suposicao de previsao fora de fase.

420 430 440 450 460 470 480 490 500 510 5203.75

3.8

3.85

3.9

3.95

4

4.05

4.1Em Fase


Pet

robr

asO

N

420 430 440 450 460 470 480 490 500 5103.75

3.8

3.85

3.9

3.95

4

4.05

4.1Fora de Fase


Pet

robr

asO

N

Figura 7.24: Serie da Petrobras (linha solida) e as previsoes geradas pelo metodo TAEF(linha tracejada) para os ultimos 100 pontos do conjunto de teste. O grafico superior ereferente a suposicao de previsao em fase e o grafico inferior a de previsao fora de fase.

7.3 COMPARACOES COM OUTROS TRABALHOS 159

7.2.3.8 Experimentos com a Serie Random Walk

Para a serie Random Walk, o procedimento de analise da fase da previsao gerada indica

uma previsao fora de fase, o que leva a aplicacao do procedimento de correcao de fase.

Calculando os valores para as medidas de desempenho na suposicao de previsao fora de

fase para o conjunto de teste, e observada uma melhoria em relacao a situacao de previsao

em fase para o metodo TAEF. Ja para o modelo da RNA nenhuma diferenca significativa

e observada entre as suposicoes em fase e fora de fase. As medidas de desempenho para

as situacoes em fase e fora de fase sao apresentadas na Tabela 7.25.

Tabela 7.25: Resultados experimentais para a serie Random Walk com as RNAs e ometodo TAEF nas suposicoes de previsao em fase e fora de fase para o conjunto de teste.

ErrosRNAs TAEF

Em Fase Fora de Fase Em Fase Fora de FaseMSE 0.1313 0.1315 0.0009 9.9106e-5

MAPE (%) 0.2800 0.2875 5.4631 0.4345Theil 1.0454 1.050 1.1016 0.0784

POCID (%) 49.1935 49.2031 51.4170 97.5610ARV 4.8108e-2 4.7985 0.0767 0.0008AIC -1600.3 -1600.0 -1588.3290 -2037.1730BIC -1482.9 -1481.8 -854.5578 -1496.0464

E possıvel notar que o modelo atual do metodo TAEF (fora de fase) consegue ser

bem superior a propria suposicao do modelo Random Walk atraves do valor alcancado

pela estatıstica U de Theil (0.0784), e bem superior ao comportamento usual de um

experimento do tipo cara ou coroa, com um valor de POCID de 97.5610%. Este fato vem

a mostrar que o metodo TAEF consegue capturar o comportamento das componentes

aleatorias e caracterizar devidamente a serie.



Figura 7.25.

7.3 COMPARACOES COM OUTROS TRABALHOS

Os experimentos realizados permitiram evidenciar que o metodo TAEF consegue alcancar

um desempenho superior na resolucao do problema de previsao de series temporais, e, em

especial, para as series economicas e financeiras quando comparado as tecnicas examina-


0 50 100 150 20040

60

80

100

120

140Em Fase


Ran

dom

Wal

k

0 50 100 150 20040

60

80

100

120

140Fora de Fase


Ran

dom

Wal

k

Figura 7.25: Serie Random Walk (linha solida) e a previsao gerada pelo metodo TAEF(linha tracejada) para o conjunto de teste. O grafico superior e referente a suposicao deprevisao em fase e o grafico inferior a suposicao fora de fase.

das nos capıtulos anteriores.

Entretanto, uma vasta quantidade de trabalhos com diferentes tecnicas sao apresen-

tados na literatura com o mesmo fim, a previsao de series temporais. Desta forma,

naturalmente surge a indagacao de quao eficiente e o metodo TAEF frente aos outros

metodos e trabalhos existentes na literatura.

Para a serie do mapa de Henon, D. B. Murray [90] propos uma metodologia que, da

mesma forma que o metodo TAEF, tenta reconstruir o espaco de fase da serie atraves dos

retardos temporais relevantes. Murray, que utiliza uma serie do mapa de Henon identica

a utilizada aqui, em seu melhor caso, alcancou um erro MSE de 1.4e-5, desempenho bem

inferior ao valor de MSE de 3.1678e-11 alcancado pelo metodo TAEF para a mesma serie.

Para a serie das Manchas Solares N. Terui e H. K. Van Dijk [107] apresentaram

uma metodologia hıbrida que combinou modelos lineares e nao-lineares, dentre os quais,

modelos AR, TAR e Exp-AR. No trabalho de Terui e Dijk foi alcancado um valor de

MSE de 0.0390 para a previsao. Nas mesmas condicoes para a serie, o metodo TAEF

alcancou um MSE de 0.0086 para a previsao, sendo assim superior em desempenho ao


trabalho de Terui e Dijk.

Para a Serie do Indice Dow Jones Industrial Average, Li e Tsang [108] propuseram

uma metodologia chamada programacao genetica financeira (FGP - Financial Genetic

Programming) onde aplicaram a serie do Indice DJIA para a tomada de decisao de in-

vestimento baseada na previsao da serie. Seus resultados sao expressos em acertos ou

erros quanto a tomada de decisao, baseando-se em uma medida semelhante ao POCID,

alcancando uma taxa de acerto de 62.13%. Nesse sentido, considerando a medida de

POCID = 97.1429% alcancada pelo Metodo TAEF, ha um acrescimo muito significativo

na taxa de acerto para a tomada de decisao, tornando o metodo TAEF mais eficiente.

Para a serie S&P500, C. A. Casas [109] propos um trabalho baseado em redes neurais

para a previsao desta serie, alcancando um MSE de 0.0012. Vale ressaltar que neste

trabalho Casas utilizou um conjunto de dados com apenas 48 pontos, sendo 90% destes

utilizados para o treinamento e 10% para teste. Com uma serie bem mais complexa, e

com a utilizacao de tres conjuntos de dados (treinamento, validacao e teste), o metodo

TAEF apresentou resultados de previsao superiores, com um MSE de 8.0263e-4, calculado

sobre um conjunto muito maior de dados.

Para as demais series temporais investigadas nao foram encontrados trabalhos que

realizem experimentos de previsao. Entretanto, os valores alcancados, quando compara-

dos a modelos do tipo Random Walk (atraves da medida da estatıstica U de Theil) e

modelos medios (atraves da medida ARV), implicam que o metodo TAEF e uma opcao

valida de alto desempenho de previsao.

CAPITULO 8

INVESTIGACOES COMPLEMENTARES AO METODO

TAEF

Neste capıtulo e apresentado um conjunto adicional de experimentos com o metodo TAEF

utilizando varias series artificiais de alta complexidade.

Este novo grupo de experimentos vem a consolidar o desempenho de previsao ja

alcancado pelo metodo TAEF, comprovando a sua eficiencia para um grupo de carac-

terısticas nao-lineares de alta complexidade comumente encontradas em series temporais

do mundo real.

8.1 INTRODUCAO

Varios experimentos foram realizados com as series apresentadas no Capıtulo 4. Em

todos os casos o metodo TAEF apresentou-se como a opcao de melhor desempenho de

previsao.

Contudo, o conjunto de series apresentadas, embora sejam de alta complexidade e de

relevancia em situacoes do mundo real, nao apresentam todas as possıveis caracterısticas

que uma serie temporal pode vir a possuir, dentre as quais, tendencias, sazonalidades,

transientes, mudanca de modelos, dependencias entre os retardos temporais com decai-

mento exponencial, heterocedasticidade, dentre outras.

Desta forma, foi realizado um grupo de experimentos adicionais com o metodo TAEF

para a verificacao de seu desempenho com series artificiais de alta complexidade que

contenham varias das caracterısticas citadas acima, como:

1. Serie Random Walk com drift [110], sazonalidade e drift com sazonalidade;

2. Series com Heterocedasticidade, modelos GARCH [7,8];

3. Modelos SETAR [25];

162

8.2 FAMILIA DE SERIES DO TIPO RANDOM WALK 163

4. Modelos STAR [111].

8.2 FAMILIA DE SERIES DO TIPO RANDOM WALK

Como uma primeira aproximacao, modelos do tipo Random Walk sao utilizados para a

representacao de series economicas e financeiras [110]. Entretanto, as series economicas

e financeiras associadas a um modelo do tipo Random Walk quase sempre apresentam

caracterısticas adicionais, como tendencias e/ou sazonalidades.

Neste sentido, foram montadas artificialmente famılias de series temporais do tipo

Random Walk : 1. series do tipo Random Walk com drift – Equacao (.); 2. series do

tipo Random Walk com sazonalidade aditiva – Equacao (.); e 3. series do tipo Random

Walk com drift e sazonalidade aditiva – Equacao (.).

Zt = Zt−1 + θ + rt (.)

Zt = Zt−1 + sin(2πFt) + rt (.)

Zt = Zt−1 + θ + sin(2πFt) + rt (.)

onde θ e o termo de drift, F e o termo de frequencia e rt e o termo de ruıdo.

8.2.1 Famılia de Series Random Walk com Drift

A famılia de series do tipo Random Walk com drift e composta por seis series tem-

porais, onde o termo de drift (θ) variou no intervalo [0,1], assumindo os valores θ =

0.0, 0.2, 0.4, 0.6, 0.8, 1.0.

Todas as series geradas tem 1000 pontos, onde o primeiro ponto e sempre igual a zero

(Z0 = 0) e o termo de ruıdo guiado por uma distribuicao gaussiana de media zero e desvio

padrao 10 (rt ∼ N(0, 10)).

A Tabela 8.1 mostra os parametros escolhidos pelo metodo TAEF para cada uma das

series caracterizadas pelos seus respectivos termos de drift, sendo apresentados os retardos


Tabela 8.1: Configuracoes escolhidas pelo metodo TAEF para a famılia de series do tipoRandom Walk com drift.

Serie Retardos Neuronios Escondidos Algoritmo Previsao

Drift 0.0 2,3,5 15 Levenberg-Marquardt Fora de FaseDrift 0.2 2,5,6,8,9,10 8 Gradiente Conjugado Fora de FaseDrift 0.4 2,3,4,5,7,8 2 Levenberg-Marquardt Fora de FaseDrift 0.6 2,3,6,7 10 Gradiente Conjugado Fora de FaseDrift 0.8 2,3,6,7 4 Levenberg-Marquardt Fora de FaseDrift 1.0 2,3,6,7,8,9 12 Levenberg-Marquardt Fora de Fase

temporais utilizados, a quantidade de neuronios escondidos, o algoritmo de aprendizagem

eleito e a classificacao da previsao em fase ou fora de fase.

Na Tabela 8.2 sao exibidos os resultados para as medidas de desempenho para todas

as series da famılia Random Walk com drift para ambos os casos de previsao em fase e

previsao fora de fase, onde as previsoes fora de fase apresentam-se superiores.

Tabela 8.2: Resultados experimentais para as series da famılia de Random Walk comdrift.

Series PrevisaoMedidas de Desempenho

MSE MAPE U of Theil POCID ARV AIC BIC

Drift 0.0Em Fase 0.0009 5.46% 1.1016 51.42% 0.0767 -1588.3 -79.4

Fora de Fase 2.7178 · 10−5 1.04% 0.0290 97.96% 0.0023 -2444.7 -2102.0

Drift 0.2Em Fase 0.0009 3.53% 0.4241 51.22% 0.0671 -1704.5 -1686.4

Fora de Fase 4.5431 · 10−5 0.6965% 0.0527 97.14% 0.0035 -2425.8 -2349.2

Drift 0.4Em Fase 0.0004 2.11% 0.2826 49.80% 0.0485 -1650.2 -680.7

Fora de Fase 4.9884 · 10−5 0.59% 0.1211 97.15% 0.0054 -2178.7 -1574.5

Drift 0.6Em Fase 0.0002 1.50% 0.0675 52.23% 0.0345 -1950.8 -1291.2

Fora de Fase 2.1655 · 10−5 0.44% 0.0960 97.97% 0.0029 -2530.8 -2255.8

Drift 0.8Em Fase 0.0001 1.26% 0.3778 52.63% 0.0275 -2145.2 -2038.9

Fora de Fase 3.7601 · 10−5 0.56% 0.2670 97.56% 0.0057 -2466.6 -2353.8

Drift 1.0Em Fase 9.3751 · 10−5 1.13% 2.7337 52.44% 0.0250 -2096.9 -1197.3

Fora de Fase 5.0811 · 10−5 0.68% 0.5278 96.73% 0.0084 -2238.3 -1801.3

Na Figura 8.1 sao apresentados graficos comparativos entre as series da famılia Ran-

dom Walk com drift (linhas solidas) e suas respectivas previsoes (linhas tracejadas) ge-

radas pelos modelos eleitos com o metodo TAEF. Para cada uma das series e mostrado

um grafico na hipotese de previsao em fase (grafico superior) e um grafico na hipotese de

previsao fora de fase (grafico inferior).


0 50 100 150 200 250−50

0

50

100

150Em Fase

Conjunto de Teste

Ran

dom

Wal

k

0 50 100 150 200 250−50

0

50

100

150Fora de Fase

Ran

dom

Wal

k

Conjunto de Teste

(a) Drift = 0.0

0 50 100 150 200 25050

100

150

200

250

300Em Fase

Conjunto de Teste

Ran

dom

Wal

k D

rift 0

.3

0 50 100 150 200 25050

100

150

200

250

300Fora de Fase

Conjunto de Teste

Ran

dom

Wal

k D

rif 0

.2

(b) Drift = 0.2

0 50 100 150 200 250250

300

350

400

450

500

550 Em Fase

Conjunto de Teste

Ran

dom

Wal

k D

ritft

0.4

0 50 100 150 200 250250

300

350

400

450

500

550Fora de Fase

Ran

dom

Wal

k D

rift 0

.4

(c) Drift = 0.4

0 50 100 150 200 250400

450

500

550

600

650

700Em Fase

Conjunto de Teste

Ran

dom

Wal

k D

rift 0

.6

0 50 100 150 200 250400

450

500

550

600

650

700Fora de Fase

Conjunto de Teste

Ran

dom

Wal

k D

rift 0

.6

(d) Drift = 0.6

0 50 100 150 200 250550

600

650

700

750

800

850

900Em Fase

Conjunto de Teste

Ran

dom

Wal

k D

rift 0

.8

0 50 100 150 200 250550

600

650

700

750

800

850

900Fora de Fase

Conjunto de Teste

Ran

dom

Wal

k D

rift 0

.8

(e) Drift = 0.8

0 50 100 150 200 250700

800

900

1000

1100Em Fase

Conjunto de Teste

Ran

dom

Wal

k D

rift 1

.0

0 50 100 150 200 250700

800

900

1000

1100Fora de Fase

Conjunto de Teste

Ran

dom

Wal

k D

rift 1

.0

(f) Drift = 1.0

Figura 8.1: Series Random Walk com drift. Para todas as figuras, hipoteses de previsaoem fase (grafico superior) e previsao fora de fase (grafico inferior). As linhas solidas saoos dados reais e as linhas tracejadas sao as previsoes.


8.2.2 Famılia de Series Random Walk com Sazonalidade Aditiva

A famılia de Series Random Walk com Sazonalidade e composta por cinco series, onde a

frequencia F assume os valores 17, 1

15, 1

30, 1

90e 1

180por unidade de tempo. Se a unidade de

tempo considerada for “dia”, obtem-se perıodos de uma semana, quinze dias, um mes,

tres meses e seis meses, respectivamente.

Todas as series geradas sao compostas por 1000 pontos, seguindo a Equacao (.),

com Z0 = 0 e termo de ruıdo (rt) guiado por uma distribuicao gaussiana de media nula

e desvio padrao 10 (rt ∼ N(0, 10)). A Tabela 8.3 mostra os valores dos parametros

escolhidos pelo metodo TAEF para cada uma das series.

Tabela 8.3: Configuracoes alcancadas pelo metodo TAEF para a famılia de Series RandomWalk com Sazonalidade Aditiva.

Frequencia Retardos Neuronios Escondidos Algoritmo Previsao17 3,8,9,10,11 1 Levenberg-Marquardt Fora de Fase115 3,4,6,10,12 6 Gradiente Conjugado Fora de Fase130 2,4,7,10,13 3 Levenberg-Marquardt Fora de Fase190 4,9,10 4 Levenberg-Marquardt Fora de Fase1

180 2,3,4,5,10,11,12 10 Gradiente Conjugado Fora de Fase

Na Tabela 8.4 sao exibidos os resultados obtidos pelo metodo TAEF para todas as

series da famılia para ambos os casos de hipoteses de previsao, em fase e fora de fase.

Tabela 8.4: Resultados obtidos pelo metodo TAEF para a famılia de Series Random Walkcom Sazonalidade Aditiva.

Frequencia HipoteseMedias de Desempenho


17

Em Fase 0.0007 2.74% 1.0863 60.98% 0.0794 -1795.2 -1791.7Fora de Fase 0.0002 1.52% 0.2827 86.94% 0.0257 -2066.2 -2030.2

115


130


190


1180

Em Fase 0.0001 3.12% 0.5251 71.54% 0.0518 -2030.0 -1430.9Fora de Fase 6.8244 · 10−4 1.26% 0.3851 96.32% 0.0012 -2177.7 -1767.7

A Figura 8.2 mostra alguns graficos comparativos entre os dados reais (linha solida)

e as respectivas previsoes (linha traceja) realizadas pelo metodo TAEF para os conjuntos

de testes de todas as series da famılia Random Walk com sazonalidade aditiva, tanto na

suposicao de previsao em fase quanto na fora de fase.


0 50 100 150 200 250−20

−10

0

10

20

30

40

50Em Fase

Conjunto de Teste

Ran

dom

Wal

k (F

=1/

7)

0 50 100 150 200 250−20

−10

0

10

20

30

40

50Fora de Fase

Conjunto de Teste

Ram

dom

Wal

k (F

=1/

7)

(a) Frequencia = 1

7

0 50 100 150 200 250−20

0

20

40

60Em Fase

Conjunto de Teste

Ran

dom

Wal

k (F

=1/

15)

0 50 100 150 200 250−20

0

20

40

60Fora de Fase

Conjunto de Teste

Ran

dom

Wal

k (F

=1/

15)

(b) Frequencia = 1

15

0 50 100 150 200 250−20

0

20

40

60

80Em Fase

Conjunto de Teste

Ran

dom

Wal

k (F

=1/

30)

0 50 100 150 200 250−20

0

20

40

60

80Fora de Fase

Conjunto de Teste

Ran

dom

Wal

k (F

=1/

30)

(c) Frequencia = 1

30

0 50 100 150 200 250−20

0

20

40

60

80

100

120Em Fase

Conjunto de Teste

Ran

dom

Wal

k (F

=1/

90)

0 50 100 150 200 250−20

0

20

40

60

80

100

120Fora de Fase

Conjunto de Teste

Ran

dom

Wal

k (F

=1/

90)

(d) Frequencia = 1

90

0 50 100 150 200 250−50

0

50

100

150

200

250Em Fase

Conjunto de Teste

Ran

dom

Wal

k (F

=1/

180)

0 50 100 150 200 250−50

0

50

100

150

200

250Fora de Fase

Conjunto de Teste

Ram

dom

Wal

k (F

=1/

180)

(e) Frequencia = 1

180

Figura 8.2: Series Random Walk com Sazonalidade Aditiva. Sao exibidas as hipotesede previsao em fase (grafico superior) e previsao fora de fase (grafico inferior) para osconjuntos de teste. As linhas solidas sao os dados reais e as linhas tracejadas as previsoes.


8.2.3 Famılia de Series Random Walk com Drift e Sazonalidade Aditiva

A famılia de Series Random Walk com drift e sazonalidade aditiva e composta por cinco

series temporais, de acordo com a Equacao (.), onde o termo de frequencia F assume

os mesmos valores da Secao 8.2.2 ( 17, 1

15, 1

30, 1

90e 1

180) e termo de drift constante, θ = 0.8.

Todas as series sao compostas por 1000 pontos gerados pela Equacao (.), com Z0 = 0

e termo de ruıdo guiado por uma distribuicao gaussiana de media zero e desvio padrao 10

(rt ∼ N(0, 10)). Na Tabela 8.5 sao exibidos os parametros escolhidos pelo metodo TAEF

para cada uma das series.

Tabela 8.5: Configuracoes alcancadas pelo metodo TAEF para a famılia de Series RandomWalk com Drift (θ = 0.8) e Sazonalidade Aditiva.

Frequencia Retardos Neuronios Escondidos Algoritmo Previsao17 8 19 Gradiente Conjugado Fora de Fase115 3,4,5,6,8,9 14 Levenberg-Marquardt Fora de Fase130 1 20 Levenberg-Marquardt Fora de Fase190 2,4,11,12,14,15 20 Levenberg-Marquardt Fora de Fase1

180 5,6,8,10,11,12 20 Levenberg-Marquardt Fora de Fase

Na Tabela 8.6 sao mostrados os resultados do metodo TAEF para todas as series da

famılia Random Walk com drift e sazonalidade aditiva, para o conjunto de teste.

Tabela 8.6: Resultados obtidos pelo metodo TAEF para o conjunto de teste das seriesda famılia Random Walk com Drift e Sazonalidade aditiva.

Frequencia HipoteseMedidas de Desempenho


17

Em Fase 8.2950 · 10−4 0.87% 2.5866 56.85% 0.0183 -2163.9 3519.3Fora de Fase 5.2422 · 10−4 0.75% 0.0007 100.00% 0.0116 -2268.3 -1871.2

115

Em Fase 0.0003 0.54% 0.3451 69.23% 0.0078 -1925.8 -1779.9Fora de Fase 7.0000 · 10−5 0.24% 0.3064 88.21% 0.0016 -2851.7 -2666.8

130

Em Fase 0.0002 3.09% 0.3471 64.92% 0.0519 -1925.0 5846.3Fora de Fase 4.0000 · 10−5 0.19% 0.0062 100.00% 0.0003 -2855.4 -2390.5

190

Em Fase 6.5889 · 10−5 0.62% 7.4867 59.18% 0.0121 -1582.4 13888.4Fora de Fase 3.1126 · 10−5 0.49% 1.9211 80.33% 0.0075 -1756.7 12.5

1180

Em Fase 0.0002 1.12% 1.9050 70.73% 0.0174 -1259.3 1971.7Fora de Fase 9.2301 · 10−5 0.98% 0.9373 97.14% 0.0133 -1371.7 68.7

Na Figura 8.3 sao exibidos graficos comparativos entre os dados reais (linhas solidas)

e as suas respectivas previsoes (linhas tracejadas) realizadas pelo metodo TAEF para os

respectivos conjuntos de teste. Ambas as hipoteses de previsao em fase (grafico superior)

e previsao fora de fase (grafico inferior) sao mostradas.


0 50 100 150 200 250600

650

700

750

800

850Em Fase

Conjunto de Teste

Ran

dom

Wal

k

0 50 100 150 200 250600

650

700

750

800

850Fora de Fase

Conjunto de Teste

Ran

dom

Wal

k

(a) Frequencia = 1

7

0 50 100 150 200 250600

650

700

750

800

850Em Fase

Conjunto de Teste

Ran

dom

Wal

k

0 50 100 150 200 250600

650

700

750

800

850Fora de Fase

Conjunto de Teste

Ran

dom

Wal

k

(b) Frequencia = 1

15

0 50 100 150 200 250600

650

700

750

800

850Em Fase

Conjunto de Teste

Ran

dom

Wal

k

0 50 100 150 200 250600

650

700

750

800

850Fora de Fase

Conjunto de Teste

Ran

dom

Wal

k

(c) Frequencia = 1

30

0 50 100 150 200 250650

700

750

800

850

900Em Fase

Conjunto de Teste

Ran

dom

Wal

k

0 50 100 150 200 250650

700

750

800

850

900Fora de Fase

Conjunto de Teste

Ran

dom

Wal

k

(d) Frequencia = 1

90

0 50 100 150 200 250650

700

750

800

850

900

950

1000Em Fase

Conjunto de Teste

Ran

dom

Wal

k

0 50 100 150 200 250650

700

750

800

850

900

950

1000Fora de Fase

Conjunto de Teste

Ran

dom

Wla

k

(e) Frequencia = 1

180

Figura 8.3: Series Random Walk com Drift e Sazonalidade Aditiva. Sao exibidos graficosna hipotese de previsao em fase (grafico superior) e fora de fase (grafico inferior) para osconjuntos de teste. As linhas solidas sao os dados reais e as linhas tracejadas as previsoes.

8.3 FAMILIA DE SERIES DOS MODELOS GARCH 170

8.3 FAMILIA DE SERIES DOS MODELOS GARCH

De forma simplista, os modelos GARCH (General Autoregressive Conditional Heterosce-

dasticity) sao relatados a situacoes onde ha a necessidade da descricao de uma funcao de

variancia dependente do tempo, isto e, algum processo de volatidade.

Os modelos GARCH foram desenvolvidos por Bollerslev [8] como uma generalizacao

de uma outra famılia de modelos, chamados modelos ARCH (Autoregressive Conditional

Heteroscedasticity) [7], no intuito de oferecer uma metodologia mais parcimoniosa e de

menor custo computacional como ja descrito no Capıtulo 2.

Os modelos GARCH sao usualmente aplicados a series de retornos. As series de

retornos sao simplesmente as diferencas entre os valores sobre o tempo t e o tempo t− 1

de uma dada serie temporal, caracterizando a variacao da serie entre duas observacoes

consecutivas. Quando este procedimento e aplicado as series economicas e financeiras,

como por exemplo dados historicos de cotacoes de acoes em bolsas de valores, este informa

o retorno (ganho ou perda) que a acao gerou.

Assim, faca uma serie de retorno ser dada por,

xt = C + rt (.)

onde C e uma constante e rt um termo de ruıdo branco, tambem chamado de inovacao.

A variacao condicional deste inovacao e, por definicao,

V art−1(xt) = Et−1(r2t ) = σ2

t (.)

onde Et−1 denota o valor esperado condicional sobre o passado do processo ate o tempo

t − 1.

O modelo generico GARCH(P, Q) para a variancia condicional das inovacoes e dado

por,

σ2t = κ +

P∑

i=1

giσ2t−i +

Q∑

j=1

ajr2t−j (.)

com os vınvulos,P∑

i=1

gi +

Q∑

j=1

aj < 1;

8.3 FAMILIA DE SERIES DOS MODELOS GARCH 171

κ > 0;

gi ≥ 0 para i = 1, 2, 3, . . . , P ;

aj ≥ 0 para j = 1, 2, 3, . . . , Q

Desta forma, quatro modelos GARCH foram criados GARCH(1,1), GARCH(1,2),

GARCH(2,1) and GARCH(2,2). Para todos os modelos gerados foi considerado o valor

da constante condicional como 1 (κ = 1). O modelo GARCH(1,1) foi ajustado com

g1 = 0.3 e a1 = 0.4; o modelo GARCH(1,2) com g1 = 0.3, a1 = 0.4 e a2 = 0.2; o modelo

GARCH(2,1) g1 = 0.39, g2 = 0.18 e a1 = 0.25; e o modelo GARCH(2,2) com g1 = 0.18,

g2 = 0.25, a1 = 0.1 e a2 = 0.34.

Seguindo estes modelos, foram criados conjuntos de dados contendo 1000 pontos cada.

A partir destes conjuntos, considerados como series de retornos, as series temporais foram

construıdas. O valor inicial considerado para a elaboracao de todas as series foi Z0 = 0

e todos os demais pontos foram dados por,

Zt = xt + Zt−1 (.)

onde xt e o ponto sobre o tempo t das series de retornos (Equacao (.)).

Na Tabela 8.7 sao exibidos os parametros eleitos pelo metodo TAEF para cada uma

das series geradas a partir dos modelos GARCH, onde a primeira coluna representa o

modelo de origem da serie.

Tabela 8.7: Configuracoes alcancadas pelo metodo TAEF para a famılia de Series dosModelos GARCH.


GARCH(1,1) 4,6,8,10,11 15 RProP Fora de FaseGARCH(1,2) 2,3,4,5 8 Gradiente Conjugado Fora de FaseGARCH(2,1) 4,5,6,8 15 Um Passo Secante Fora de FaseGARCH(2,2) 2 13 Um Passo Secante Fora de Fase

Na Tabela 8.8 sao mostrados os resultados alcancados pelo metodo TAEF para toda

a famılia de series dos modelos GARCH, considerando os respectivos conjuntos de testes.

Todas as medidas sao calculadas para ambas as suposicoes de previsao em fase e previsao

fora de fase. E possıvel notar que o metodo TAEF classifica corretamente a previsao das

series.

8.4 FAMILIA DE SERIES DOS MODELOS SETAR 172

Tabela 8.8: Resultados para as medidas de desempenho alcancados pelo metodo TAEFpara a famılia de Series dos Modelos GARCH.

Series HipoteseMedidas de Desempnho


GARHC(1,1)Em Fase 0.0005 10.96% 0.3187 51.82% 0.0424 -1653.4 -204.5

Fora de Fase 2.100 · 10−5 2.58% 0.0403 95.53% 0.0017 -2447.4 -1969.4

GARHC(1,2)Em Fase 0.0009 3.28% 3.2783 50.00% 0.0258 -1650.8 -1227.4

Fora de Fase 6.0000 · 10−5 1.03% 0.0643 97.16% 0.0017 -2314.6 -2093.4

GARHC(2,1)Em Fase 0.0012 4.05% 22.6936 51.42% 0.0624 -1459.8 438.0

Fora de Fase 0.0004 2.38% 0.5457 93.09% 0.0226 -1712.1 -1247.6

GARHC(2,2)Em Fase 0.0011 20.97% 1.4075 52.63% 0.0601 -1611.6 -421.5

Fora de Fase 6.0000 · 10−6 2.90% 0.0136 100.00% 0.0008 -2901.7 -2721.4

Na Figura 8.4 sao expostos graficos comparativos entre as series geradas a partir dos

modelos GARCH (linhas solidas) e as respectivas previsoes (linhas tracejadas) geradas

pelo metodo TAEF, tanto na suposicao de previsao em fase (grafico superior) como na

previsao fora de fase (grafico inferior).

8.4 FAMILIA DE SERIES DOS MODELOS SETAR

Os modelos SETAR (Self-Exciting Threshold Autoregressive) assumem que o domınio

de uma variavel Zt pode ser dividido em varios subdomınios. Em cada um destes sub-

domınios, a variavel e regida por um modelo auto-regressivo linear. Sendo a variavel Zt

uma serie temporal, esta pode sofrer uma mudanca de modelo, dependendo dos valores

assumidos por um determinado retardo temporal Zt−β, sendo β uma constante.

Para medir a capacidade do Metodo TAEF de prever series com mudanca de modelos,

uma famılia de series do modelo SETAR, composta por quatro series, foi gerada. A

primeira serie (SETAR1) e dada por,

Zt =

0.95Zt−1 + rt, Se |Zt−1| ≥ 7

−0.95Zt−1 + rt, Caso Contrario.(.)

onde o primeiro termo e Z0 = 0 e o termo de ruıdo (rt) e guiado por uma distribuicao

gaussiana (rt ∼ N(0, 0.0625)).

A segunda serie da famılia (SETAR2) e dada pela Equacao (.),


0 50 100 150 200 250−220

−200

−180

−160

−140

−120

−100

−80

Conjunto de Teste

GA

RC

H(1

,1)

0 50 100 150 200 250−220

−200

−180

−160

−140

−120

−100

−80Fora de Fase

Conjunto de Teste

GA

RC

H(1

,1)

(a) GARCH(1,1)

0 50 100 150 200 250−600

−400

−200

0

200Em Fase

Conjunto de Teste

GA

RC

H(1

,2)

0 50 100 150 200 250−600

−400

−200

0

200Fora de Fase

Conjunto de Teste

GA

RC

H(1

,2)

(b) GARCH(1,2)

0 50 100 150 200 250−400

−200

0

200

400

600Em Fase

Conjunto de Teste

GA

RC

H(2

,1)

0 50 100 150 200 250−400

−200

0

200

400

600Fora de Fase

Conjunto de Teste

GA

RC

H(2

,1)

(c) GARCH(2,1)

0 50 100 150 200 250−400

−350

−300

−250

−200

−150

−100Em Fase

Conjunto de Teste

GA

RC

H(2

,2)

0 50 100 150 200 250−400

−350

−300

−250

−200

−150

−100Fora de Fase

Conjunto de Teste

GA

RC

H(2

,2)

(d) GARCH(2,2)

Figura 8.4: Famılia de Series Temporais geradas com os modelos GARCH. As figurasmostram graficos comparativos entre os dados reais (linhas solidas) e suas respectivasprevisoes (linhas tracejadas) para o conjunto de teste.

Zt =

0.2 + 0.8Zt−1 + rt, if |Zt−1 − Zt−2| ≥ 0.2

0.2 − 0.4Zt−1 + rt, Caso Contrario.(.)

onde o primeiro e segundo termos sao Z0 = 0 e Z1 = 0.02, respectivamente, e o termo de

ruıdo (rt) e guiado por uma distribuicao gaussiana (rt ∼ N(0, 0.001)).

A terceira (SETAR3) e quarta (SETAR4) serie da famılia sao dadas respectivamente

pelas Equacoes (.) e (.),


Zt =

0.5 + 0.8Zt−1 + rt, Se Zt−2 ≤ 0 e Zt−2 − Zt−1 > 0

0.5 − 0.8Zt−1 + rt, Se Zt−2 ≤ 0 e Zt−2 − Zt−1 ≤ 0

−0.5 + 0.8Zt−1 + rt, Se Zt−2 > 0 e Zt−2 − Zt−1 > 0

0.5 − 0.8Zt−1 + rt, Demais Casos.

(.)

Zt =

0.5 + 0.8Zt−1 + rt, Se Zt−3 − Zt−2 ≤ 0 e Zt−2 − Zt−1 > 0

0.5 − 0.8Zt−1 + rt, Se Zt−3 − Zt−2 ≤ 0 e Zt−2 − Zt−1 ≤ 0

−0.5 + 0.8Zt−1 + rt, Se Zt−3 − Zt−2 > 0 e Zt−2 − Zt−1 > 0

−0.5 − 0.8Zt−1 + rt, Demais Casos.

(.)

onde o primeiro, segundo e terceiro termos sao dados respectivamente por Z0 = 0, Z1 =

0.02 and Z3 = −0.01. O termo de ruıdo e guiado por uma distribuicao gaussiana –

rt ∼ N(0, 1).

Com todas as quatro Equacoes foram gerados 3000 pontos, onde somente os ultimos

1000 pontos foram utilizados para a confeccao das series da Famılia, de forma a evitar

qualquer efeito de transiente inicial.

Na Tabela 8.9 sao expostas as configuracoes alcancadas pelo metodo TAEF para cada

uma das quatro series do modelos SETAR.

Tabela 8.9: Configuracoes alcancadas pelo Metodo TAEF para a famılia de Series dosModelos SETAR.


SETAR1 3,6 4 Levenberg-Marquardt Em FaseSETAR2 8,9 8 Gradiente Conjugado Em FaseSETAR3 2,3,7,8 11 Gradiente Conjugado Em FaseSETAR4 2 14 Levenberg-Marquardt Fora de Fase

A Tabela 8.10 ilustra todos os resultados obtidos com o metodo TAEF para a famılia

das Series dos Modelos SETAR no contexto dos conjuntos de teste, mostrando todos os

valores para as medidas de desempenho, tanto na hipotese de previsao em fase como de

previsao fora de fase.

Na Figura 8.5 sao apresentados graficos comparativos entre os dados reais das series

(linhas solidas) e as previsoes (linhas tracejadas) geradas pelo metodo TAEF para os

respectivos conjuntos de teste em ambas as hipoteses de previsao em fase e fora de fase.


Tabela 8.10: Resultados obtidos pelo metodo TAEF para a famılia das Series dos ModelosSETAR para os respectivos conjuntos de teste.

Series HipotesesMedidas de Desempenho


SETAR1Em Fase 0.0032 9.43% 0.0033 73.68% 0.1191 -1393.6 -1271.3

Fora de Fase 0.0133 17.89% 0.8524 42.68% 0.4994 -1032.8 -956.2

SETAR2Em Fase 0.0094 124.51% 0.0875 73.28% 0.4195 -1091.5 -636.5

Fora de Fase 0.0257 108.04% 0.7186 32.11% 1.1603 -837.9 -689.0

SETAR3Em Fase 0.0147 29.53% 0.0011 78.54% 0.5379 -925.0 -265.4

Fora de Fase 0.0528 52.04% 0.7456 26.02% 1.8699 -604.3 -329.3

SETAR4Em Fase 0.0190 28.71% 1.0291 43.32% 0.7195 -909.2 111.0

Fora de Fase 0.0079 17.41% 0.3248 100.00% 0.3047 -1121.7 -954.88

0 50 100 150 200 250−2

−1

0

1

2

3Em Fase

Conjunto de Teste

SE

TA

R1

0 50 100 150 200 250−2

−1

0

1

2

3Fora de Fase

Conjunto de Teste

SE

TA

R1

(a) SETAR1

0 50 100 150 200 250−0.4

−0.2

0

0.2

0.4

0.6

0.8

1Em Fase

Conjunto de Teste

SE

TA

R2

0 50 100 150 200 250−0.4

−0.2

0

0.2

0.4

0.6

0.8

1Fora de Fase

Conjunto de Teste

SE

TA

R2

(b) SETAR2

0 50 100 150 200 250−5

0

5Em Fase

Conjunto de Teste

SE

TA

R3

0 50 100 150 200 250−5

0

5Fora de Fase

Conjunto de Teste

SE

TA

R3

(c) SETAR3

0 50 100 150 200 250−6

−4

−2

0

2

4

6Em Fase

Conjunto de Teste

SE

TA

R4

0 50 100 150 200 250−6

−4

−2

0

2

4

6Fora de Fase

Conjunto de Teste

SE

TA

R4

(d) SETAR4

Figura 8.5: Famılia das Series dos Modelos SETAR. Em todas as figuras sao expostas acomparacao entre os dados reais (linhas solidas) e as previsoes (linhas tracejadas) geradaspara o conjunto de teste. O graficos superiores representam a suposicao de previsao emfase e os inferiores a previsao fora de fase.

8.5 SERIE GERADA PELO MODELO STAR 176

8.5 SERIE GERADA PELO MODELO STAR

Uma possıvel variacao do modelo SETAR e o modelo STAR (Smooth Threshold Autore-

gressive), que segue a expressao geral,

Zt = α0 + α1 + (β0 + β1)F (Zt−d) + rt (.)

onde d, α0 e β0 sao constantes, α1 = (Zt−1Zt−2, . . . , Zt−p), β1 = (β11, β12, . . . , β1p) – vetor

de constantes, F (·) e uma funcao de transicao e rt e um termo de ruıdo.

De forma geral, um determinado fenomeno pode ser representado por um modelo

STAR se seus parametros sao tais que variam suavemente no tempo. O modelo STAR

utilizado nesta Tese e dado pela Equacao (.),

Zt = 0.3Zt−1 + 0.6Zt−2 + (0.1 − 0.9Zt−1 + 0.8Zt−2)

(1

1 + exp(−10Zt−1)

)+ rt. (.)

onde a funcao de transferencia utilizada foi a sigmoide logıstica.

Seguindo a Equacao (.) foram gerados 3000 pontos. Para se descartar qualquer

influencia devido a transientes iniciais, foram utilizados os ultimos 1000 pontos para a

confeccao da serie.

O metodo TAEF identificou os retardos temporais 2, 3, 4 e 6 como relevantes para a

descricao da serie gerada com o modelo STAR, definiu 5 neuronios na camada escondida

e elegeu como algoritmo de treinamento o Gradiente Conjugado Escalado, classificando

a previsao como em fase.

Na Tabela 8.11 sao exibidos os resultados obtidos pelo metodo TAEF para o conjunto

de teste em ambas as situacoes de previsao em fase e fora de fase.

Na Figura 8.6 sao mostrados graficos comparativos entre os dados reais (linha solida)

da serie do modelo STAR e a previsao (linha tracejada) gerada para o conjunto de teste.

8.6 COMENTARIOS SOBRE OS RESULTADOS 177

Tabela 8.11: Resultados experimentais obtidos pelo metodo TAEF para a Serie do ModeloSTAR para o conjunto de teste.

Medidas de DesempenhoResultados

Em Fase Fora de Fase

MSE 6.300 · 10−5 0.0458MAPE 1.67 % 44.57%

U of Theil 0.0055 99.32POCID 97.57% 6.91%ARV 0.0027 1.9366AIC -2312.1 -675.8BIC -1988.8 -481.9

0 50 100 150 200 250−0.6

−0.4

−0.2

0

0.2

0.4

0.6

0.8Em Fase

Conjunto de Teste

Mod

elo

ST

AR

0 50 100 150 200 250−0.6

−0.4

−0.2

0

0.2

0.4

0.6

0.8Fora de Fase

Conjunto de Teste

Mod

elo

ST

AR


150 160 170 180 190 200 210 220 230 240 250−0.4

−0.2

0

0.2

0.4

0.6Em Fase

Conjunto de Teste

Mod

elo

ST

AR

150 160 170 180 190 200 210 220 230 240 250−0.4

−0.2

0

0.2

0.4

0.6Fora de Fase

Conjunto de Teste

Mod

elo

ST

AR


Figura 8.6: Graficos comparativos entre os valores reais (linha solida) da serie do modeloSTAR e a previsao (linha tracejada) gerada pelo metodo TAEF.

8.6 COMENTARIOS SOBRE OS RESULTADOS

Neste Capıtulo foram apresentados diversos modelos de alta complexidade utilizados para

a analise e previsao de series temporais. A partir destes modelos foram criadas varias

series temporais com caracterısticas de difıcil modelagem a partir de observacoes pontuais.

O metodo TAEF foi habil o suficiente para configurar as RNAs para a realizacao da

previsao das series criadas. Em todos os casos, o metodo TAEF classificou corretamente

as previsoes em fase e fora de fase, como comprovado com os resultados obtidos para as

medidas de desempenho.

Para as series cujos relacionamentos entre os dados se apresentam de forma muito

8.6 COMENTARIOS SOBRE OS RESULTADOS 178

complexa, onde a informacao tende a ser distribuıda igualmente sobre todas as suas

componentes (maximo valor de Entropia [112]), o metodo TAEF classifica a previsao

como fora de fase. Ja para as series que contem alguma estrutura mais definida de

relacionamento entre os dados (baixo valor de Entropia [112]) o metodo TAEF classifica

a previsao como em fase. A transicao entre estes dois comportamentos distintos pode ser

vista na Secao 8.4, onde com o aumento de complexidade nos modelos SETAR gerados,

o metodo TAEF passa da situacao de previsao em fase (series: SETAR1, SETAR2 e

SETAR3) para a situacao de previsao fora de fase (serie: SETAR4).

Os resultados apresentados neste Capıtulo indicam que o metodo TAEF e robusto

o suficiente para gerar modelos para a previsao de series temporais com caracterısticas

bastante complexas. Esses resultados complementam a analise experimental realizada no

Capıtulo anterior, possibilitando uma visao mais concreta das qualidades de previsao do

metodo proposto.

CAPITULO 9

SIMULACOES DE COMPRA E VENDA DE ACOES

Neste Capıtulo e desenvolvido um primeiro ensaio para a elaboracao de um sistema

de apoio a tomada de decisao baseado em previsao de series temporais. Para tanto, e

montado um esquema para compra e venda de acoes na bolsa de valores de Sao Paulo,

Bovespa, sendo simuladas operacoes com uma carteira de acoes reais.

As condicoes de compra e venda utilizadas nas simulacoes e seus respectivos resultados

comprovam a viabilidade de utilizacao do metodo TAEF em uma aplicacao pratica do

mundo real.

9.1 INTRODUCAO

Nos Capıtulos 7 e 8 foram apresentados um conjunto de experimentos com varias series

temporais de alto grau de complexidade, tanto do mundo real como artificiais. Em todos

os casos, o metodo TAEF apresentou-se como uma solucao de maior desempenho de

previsao.

Desta forma, o raciocınio imediato leva ao questionamento de qual seria o desempenho

do metodo TAEF em uma situacao de operacao no mercado. Na tentativa de responder

a essa questao e montado um procedimento para a simulacao de um processo de compra

e venda de acoes na bolsa de valores do estado de Sao Paulo, a Bovespa, levando em

consideracao os fatores reais requeridos pela Bovespa, como taxas e tributos, para a

efetuacao da negociacao com as acoes.

Nas secoes que se seguem sao exibidos os criterios e regras utilizados na elaboracao

do sistema de compra e venda de acoes baseado na previsao gerada com o metodo TAEF,

a carteira de acoes utilizada, bem como os resultados obtidos em termos de retorno de

capital com as acoes.

179

9.2 REGRAS DE COMPRA E VENDA 180

9.2 REGRAS DE COMPRA E VENDA

Toda decisao de compra e venda de acoes e tomada para uma previsao de horizonte

unitario, isto e, e assumido que o unico conhecimento e o valor da acao no fechamento

do proximo pregao da bolsa.

Levando em consideracao que o metodo TAEF gera um modelo de previsao nao per-

feito, o erro medio da previsao tambem sera utilizado para a definicao da estrategia de

compra e venda. Desta forma, podem-se criar duas regioes para a tomada de decisao:

1. Regiao segura: essa regiao de tomada de decisao ocorre quando o valor atual da

serie (Zt), com os custos operacionais, e a sua previsao (Zt+1) estao a uma distancia

superior ao erro MAPE do modelo gerado pelo metodo TAEF, ou seja,

Zt mais Custos /∈ [Zt+1 − MAPE · Zt+1, Zt+1 + MAPE · Zt+1]; (.)

2. Regiao nao-segura: essa regiao de tomada de decisao ocorre quando o valor

atual da serie (Zt), com os custos operacionais, e a sua previsao (Zt+1) estao a uma

distancia inferior ao erro MAPE do modelo gerado pelo metodo TAEF, ou seja,

Zt mais Custos ∈ [Zt+1 − MAPE · Zt+1, Zt+1 + MAPE · Zt+1]. (.)

Para a regiao segura, as regras de compra e venda sao definidas como,

• Regra de Compra: o sistema devera comprar se o valor atual (Zt) acrescido dos

custos operacionais for inferior ao valor de previsao diminuıdo pelo valor do erro de

previsao (Zt+1 − MAPE),

SE (Zt + Custos ) < (Zt+1 − MAPE)

ENTAO COMPRE

• Regra de Venda: o sistema devera vender se o valor atual (Zt) menos os custos

operacionais for superior ao valor de previsao mais o valor do erro de previsao

(Zt+1 + MAPE),

SE (Zt - Custos ) > (Zt+1 + MAPE)

ENTAO VENDA

9.3 CARTEIRA DE TITULOS UTILIZADA 181

Para a regiao nao-segura as regras de compra e venda necessitam de uma analise

mais sofisticada, como uma previsao de horizonte superior ou ate mesmo o auxılio de um

especialista humano.

9.3 CARTEIRA DE TITULOS UTILIZADA

Para a realizacao das simulacoes de compra e venda de acoes com o metodo TAEF foi

montada uma carteira de tıtulos composta por cinco acoes de empresas que compoem

o mercado na Bovespa mais o cambio Dolar-Real. As acoes utilizadas sao expostas

na Tabela 9.1, onde sao indicados os respectivos codigos de identificacao das acoes na

Bovespa.

Tabela 9.1: Quadro das Acoes utilizadas na composicao da Carteira de Tıtulos.

Codigo da Bovespa Nome da EmpresaGGBR4 GerdauPETR4 PetrobrasUNIP6 UniparUSIM5 UsiminasVALE5 Vale do Rio Doce

Todas as series temporais dos tıtulos que compoem a carteira (acoes mais cambio

Dolar-Real) sao compostas por observacoes diarias de 3 de janeiro de 2000 a 27 de junho de

2005. Estes pontos foram separados em dois conjuntos iniciais, sendo o primeiro, contendo

os dados dos anos de 2000 a 2004, utilizado para a criacao do modelo de previsao pelo

metodo TAEF, e o segundo, composto pelos dados do ano de 2005, aplicado a simulacao

de compra e venda.

9.4 SIMULACAO DE COMPRA E VENDA DE ACOES

Com a utilizacao da carteira de tıtulos descrita na Secao 9.3 e montado o procedimento de

compra e venda. Toda a simulacao tenta ser o mais fiel possıvel ao procedimento real no

corrente mercado, contudo e considerado que a negociacao de compra e venda da moeda

norte americana e realizada segundo os mesmos criterios utilizados nas negociacoes com

as acoes na Bovespa.

Os custos operacionais de compra e venda considerados sao os aplicados na Bovespa,

9.4 SIMULACAO DE COMPRA E VENDA DE ACOES 182

chamados de Emolumentos, 0.035% do valor da operacao, onde e assumida que apenas

uma ordem de compra e/ou venda e realizada por dia por tıtulo. Alem dos Emolumentos,

e necessaria a contratacao dos servicos de uma corretora credenciada junto a Bovespa.

Existem varias corretoras que trabalham recebendo as ordem de compra e venda de

acoes, com diferentes formas de taxacoes para este servico. Contudo, analisando as

corretoras mais populares, como por exemplo o Banco do Brasil, verifica-se que as taxas

de corretagens variam de 2% a 3% sobre o valor da operacao. Sera assumido para as

simulacoes o pior caso, ou seja, uma taxa de corretagem de 3%. Portanto, o custo total

para as operacoes sera de 3.035% do valor negociado, tanto na compra como na venda.

Segundo as regras descritas na Secao 9.2, o sistema de apoio a tomada de decisao

pode,

• Vender;

• Vender e Comprar;

• Comprar;

• Nao realizar nenhuma operacao.

Para a realizacao das operacoes, e montada uma estrutura com o lucro previsto para

a compra do tıtulo na regiao segura, venda do tıtulo na regiao segura, compra do tıtulo

na regiao nao-segura e venda do tıtulo na regiao nao segura. Esta estrutura e elaborada

de tal forma a garantir regioes disjuntas, ou seja, se um determinado tıtulo tem lucro na

regiao segura nao tera lucro na regiao nao-segura, e vice e versa.

A simulacao e realizada seguindo o procedimento descrito no Algoritmo 9.2. Inicial-

mente e definida o a quantidade disponıvel de recursos que poderao ser utilizados para

a compra dos tıtulos da carteira, variavel Saldo, que para as simulacoes realizadas foi

considerada igual a 100, tendo seu valor ajustado iteracao a iteracao dependendo das

operacoes de compra e venda.

Foi assumido que o Saldo sera dividido em dois montantes, um para ser utilizado na

compra das acoes na regiao segura, e o outro para a compra das acoes na regiao nao

segura. A divisao do Saldo nestes dois montantes e realizada por uma constante (Risco)

definida pelo usuario, que pode variar no intervalo [0,1]. Quanto mais conservador for o

usuario, mais proxima de 0 sera a variavel Risco, e quanto mais arrojado mais proxima

de 1.


beginSaldo(t) = 100; // Saldo inicial para compra de tıtulos no tempo t

Risco = 0.15; // Percentual do saldo para operac~oes na regi~ao n~ao segura

while Perıodo de Simulacao doRealiza a previsao t + 1 para todas as series da carteira;Constroi Estrutura de Lucro;if Tıtulo com lucro para operacao de venda na regiao segura then

Venda Tıtulo;Atualiza Saldo(t);

if Tıtulo com lucro para operacao de venda na regiao nao-segura then

if Existe tıtulo com lucro na regiao de compra segura thenVenda Tıtulo;Atualiza Saldo(t);

if Existe Tıtulo com lucro na regiao de compra segura then

for i=1 to 6 do// Para cada tıtulo da carteira

V alor Comprai = Saldo ∗ (1 − Risco) ∗ Lucro Compra Segurai�6

j=1Lucro Compra Seguraj

if Existe Tıtulo com lucro na regiao de compra nao segura then

for i=1 to 6 do// Para cada tıtulo da carteira

V alor Comprai = Saldo ∗ (Risco) ∗ Lucro Compra N ao Segurai�6

j=1Lucro Compra N ao Seguraj

Atualiza Saldo(t);

end

Algoritmo 9.1: Procedimento utilizado para a compra e venda de acoes.

Com a definicao de Saldo e Risco, comeca a simulacao propriamente dita. Dado que t

e o tempo presente, para cada previsao t+1 e construıda a estrutura Lucro para cada um

dos tıtulos da carteira. Se houver algum tıtulo na condicao de lucro para venda segura,

entao sera executada a sua venda e atualizado o valor do Saldo. Ja se houver algum tıtulo

na condicao de venda nao segura, e assumido que este so sera vendido se houver algum

outro tıtulo na condicao de compra segura, caso contrario nao sera realizada nenhuma

operacao com este tıtulo. Havendo tıtulos na condicao de compra segura, o montante

(Saldo ∗ (1 − Risco)) sera distribuıdo de forma ponderada entre estes tıtulos para suas

respectivas compras, onde o peso da ponderacao e o valor do lucro do proprio tıtulo

normalizado pelo somatorio dos lucros de todos os tıtulos com compra segura, como

descrito pela Equacao (.).

Comprai = Saldo ∗ (1 − Risco) ∗ Lucro Compra Segurai∑j={Carteira} Lucro Compra Seguraj

(.)


onde Comprai e o valor destinado para a operacao de compra do tıtulo i, Lucro Compra

Segura i e o lucro previsto para o tıtulo i e o termo de somatorio age sobre todos os tıtulos

da carteira, onde Lucro Compra Seguraj sera nulo caso o tıtulo j nao contenha lucro

com compra segura.

De forma semelhante, havendo tıtulos com compra nao segura, e calculado o montante

para compra de risco (Saldo∗Risco), onde tal quantia tambem sera distribuıda, de forma

ponderada, entre os tıtulos de risco para suas respectivas compras. A Equacao (.)

calcula a fatia do montante de risco para cada um dos tıtulos na condicao de compra nao

segura,

Compra N ao Segurai = Saldo∗Risco∗ Lucro Compra N ao Segurai∑j={Carteira} Lucro Compra N ao Seguraj

. (.)

9.4.1 Resultados das Simulacoes

Inicialmente os conjuntos das series temporais, para cada um dos tıtulos da carteira,

foram divididos nos conjuntos de ajustes e simulacao. Os conjuntos de ajustes (dados

referentes aos anos de 2000, 2001, 2002, 2003 e 2004) foram utilizados para a confeccao

dos modelos de previsao e os conjuntos de simulacao (dados referentes aos ano de 2005)

foram utilizados para a simulacao do processo de compra e venda. Na Tabela 9.2 sao

mostrados os erros MAPE alcancados pelo metodo TAEF e modelos de Box & Jenkins

(para o conjunto de teste) para cada um dos tıtulos.

Tabela 9.2: Quadro com os erros MAPE para cada um dos tıtulos utilizados na Carteira.

TıtuloMAPE

TAEF Box & JenkinsDolar 0.6047% 9.5432%

GGBR4 6.4559% 20.0497%PETR4 2.6093% 18.9978%UNIP6 4.8871% 20.1452%USIM5 3.6586% 17.5567%VALE5 2.7449% 19.3459%

Como base comparativa, foram considerados dois procedimentos alternativos ao metodo

TAEF. O primeiro foi o simples rateamento igualitario do saldo entre os tıtulos da carteira

e verificacao do retorno do investimento ao longo da simulacao. O segundo procedimento,

utilizou modelos de Box & Jenkins (otimizados segundo a previsao) aplicando-os as mes-


mas condicoes de compra e venda dos tıtulos utilizados pelo metodo TAEF.

Varios experimentos foram realizados variando o fator Risco no intervalo [0,1]. Nas

Figuras 9.1, 9.2 e 9.3 sao apresentados os resultados para as simulacoes com a utilizacao

do metodo TAEF (linha solida pontuada), modelos de Box & Jenkins (asteriscos) e a

simples compra das acoes (linha solida).

A partir dos graficos das Figuras 9.1, 9.2 e 9.3 e possıvel notar que o desempenho do

metodo TAEF e bem superior para pequenos valores do fator de Risco (de 5% a 15%).

Comportamento inverso e observado para os modelos de Box & Jenkins, que tem o seu

maximo de retorno para um fator de Risco em torno dos 100%. Considerando o ultimo

ponto do retorno acumulado percentual e possıvel construir um grafico do comportamento

dos desempenhos para o metodo TAEF e os modelos de Box & Jenkins (Figura 9.4).

0 10 20 30 40 50 60 70 80 90 100−500

0

500

1000

1500

2000

2500

3000

3500

4000

4500

Pontos diários (Pregões)

Ret

orno

Acu

mul

ado

Per

cent

ual

TAEF ARMA Serie Fator Risco = 0.0

(a) Fator Risco = 0.00

0 10 20 30 40 50 60 70 80 90 100−1000

0

1000

2000

3000

4000

5000

6000

7000


Ret

orno

Acu

mul

ado

Per

cent

ual


(b) Fator Risco = 0.05

Figura 9.1: Resultados das simulacoes de compra e venda de acoes com a utilizacao dometodo TAEF (linha solida com pontos), modelos de Box & Jenkins (asteriscos) e acompra simples das acoes (linhas solida).


0 10 20 30 40 50 60 70 80 90 100−1000

0

1000

2000

3000

4000

5000

6000


Ret

orno

Acu

mul

ado

Per

cent

ual



0 10 20 30 40 50 60 70 80 90 100−1000

0

1000

2000

3000

4000

5000

6000


Ret

orno

Acu

mul

ado

Per

cent

ual



0 10 20 30 40 50 60 70 80 90 100−500

0

500

1000

1500

2000

2500

3000

3500

4000

4500


Ret

orno

Acu

mul

ado

Per

cent

ual


(c) Fator Risco = 0.20

0 10 20 30 40 50 60 70 80 90 100−500

0

500

1000

1500

2000

2500

3000

3500

4000


Ret

orno

Acu

mul

ado

Per

cent

ual


(d) Fator Risco = 0.25

0 10 20 30 40 50 60 70 80 90 100−500

0

500

1000

1500

2000

2500

3000

3500


Ret

orno

Acu

mul

ado

Per

cent

ual


(e) Fator Risco = 0.30

0 10 20 30 40 50 60 70 80 90 100−500

0

500

1000

1500

2000

2500

3000

3500


Ret

orno

Acu

mul

ado

Per

cent

ual


(f) Fator Risco = 0.35



0 10 20 30 40 50 60 70 80 90 100−500

0

500

1000

1500

2000

2500

3000


Ret

orno

Acu

mul

ado

Per

cent

ual



0 10 20 30 40 50 60 70 80 90 100−500

0

500

1000

1500

2000

2500

3000


Ret

orno

Acu

mul

ado

Per

cent

ual



0 10 20 30 40 50 60 70 80 90 100−500

0

500

1000

1500

2000

2500


Ret

orna

Acu

mul

ado

Per

cent

ual


(c) Fator Risco = 0.50

0 10 20 30 40 50 60 70 80 90 100−500

0

500

1000

1500

2000


Ret

orno

Acu

mul

ado

Per

cent

ual

TAEF ARMA Serie

Fator Risco = 0.60

(d) Fator Risco = 0.60

0 10 20 30 40 50 60 70 80 90 100−500

0

500

1000

1500

2000

2500

3000


Ret

orno

Acu

mul

ado

Per

cent

ual


(e) Fator Risco = 0.70

0 10 20 30 40 50 60 70 80 90 100−500

0

500

1000

1500

2000

2500

3000

3500


Ret

orno

Acu

mul

ado

Per

cent

ual

TAEFARMASerie

Fator Risco = 1.00

(f) Fator Risco = 1.00



O fator de Risco criado e uma forma de automatizar a decisao a ser tomada quando

a previsao gerada se encontra na regiao nao-segura. Desta forma, a Figura 9.4 mostra o

quanto o investidor deve se arriscar para tirar o maximo de retorno dos metodos.

O fato das simulacoes com os modelos de Box & Jenkins terem seus retornos incre-

mentados com o aumento do fator de Risco indica que devido as altas taxas de erros,

apresentadas na Tabela 9.2, ha a necessidade de arriscar, uma vez que a grande maio-

ria das previsoes encontram-se na regiao nao-segura, vindo a justificar uma tendencia

exponencial no crescimento inicial do retorno, como apresentado na Figura 9.4.

Analisando a Figura 9.4 e possıvel observar que o metodo TAEF consegue ter aproxi-

madamente o dobro de desempenho quando comparado com os modelos de Box & Jenkins,

aliado ao fato de ser um metodo conservador (fator de Risco ∼ 5% a 10%), contra um

metodo extremamente arriscado (fator de Risco dos modelos de Box & Jenkins ∼ 100%).

Contudo, tomando uma postura conservadora (Risco = 0), visto que para uma si-

tuacao desconhecida o estado defensivo e naturalmente escolhido pela grande maioria

dos seres humanos, o metodo TAEF e muito superior aos modelos de Box & Jenkins,

com um desempenho de retorno financeiro da ordem de 400 vezes superior.

Portanto, as simulacoes realizadas indicam que o metodo TAEF e bem mais apro-

priado como base da elaboracao de um sistema de apoio a tomada de decisao para a com-

pra e venda de tıtulos em um mercado de valores, apresentando uma baixa necessidade de

intervencao humana, representada pelos baixos valores do Fator de Risco determinados

como otimos para o metodo.

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 10

500

1000

1500

2000

2500

3000

3500

4000

4500

Fator Risco

Ret

orno

Fin

al

TAEFBox & Jenkins

Figura 9.4: Valor do retorno acumulado percentual versus o Fator de Risco para asoperacoes de compra e venda: metodo TAEF (©) e modelos de Box & Jenkins (∗).

CAPITULO 10

CONCLUSOES

Neste Capıtulo final sao apresentadas as conclusoes dos estudos e investigacoes experi-

mentais realizadas para a resolucao do problema de previsao das series temporais.

Discussoes sobre a nova metodologia proposta — The Time-lag Added Evolutionary

Forecasting Method — sao apresentadas, considerando sua viabilidade em aplicacoes

praticas de previsao. Limitacoes do metodo e do trabalho desenvolvido nesta pesquisa

tambem sao discutidas.

Por fim, tambem sao apresentados possıveis desdobramentos para trabalhos futuros

que poderao contribuir para a evolucao do metodo TAEF, bem como para um melhor

entendimento do problema de previsao de series temporais.

10.1 CONCLUSOES

Nesta tese de doutoramento foi abordado o problema de previsao de series temporais

com o estudo de varias tecnicas da estatıstica e da inteligencia artificial. Os modelos

estatısticos comentados, lineares e nao-lineares, sao os mais populares encontrados na

literatura especializada, destacando-se os modelos de Box & Jenkins, que sao dentre todos

os mais difundidos e estudados. Desta forma, os modelos de Box & Jenkins apresentam-

se como um ponto de partida e de formalizacao dos estudos das leis que governam os

fenomenos geradores das series temporais.

Dentre os modelos da Inteligencia Artificial (IA), foram analisados aqueles encontra-

dos de forma mais comum nas aplicacoes de previsao de series temporais relatadas na

literatura especializada, as Rede Neurais Artificiais (RNAs) e os Algoritmos Geneticos

(AGs).

A previsao de uma serie temporal e a tentativa do mapeamento das informacoes

passadas nas informacoes futuras. As RNAs, devido a sua capacidade intrınseca de

mapear informacao, sao as tecnicas da IA mais utilizadas na previsao de series temporais.

189

10.1 CONCLUSOES 190

Os AGs tambem sao bastante utilizados para a previsao de series temporais, realizando

buscas para a determinacao de regras que geram os acontecimentos futuros a partir da

analise dos dados historicos de um fenomeno de interesse. Alem deste tipo de utilizacao,

os AGs tambem sao comumente aplicados como algoritmos de configuracao e ajuste de

parametros de modelos devido a sua capacidade de pesquisa em grandes espacos de busca,

tentando ajustar alguma expressao matematica aos dados de uma serie temporal. Em

particular, os AGs podem ser utilizados em conjunto com os modelos estatısticos nao-

lineares, proporcionando uma forma tecnicamente mais simples quando comparada as

formas convencionais aplicadas pela estatıstica para o ajuste de paramentos nao-lineares.

Em um primeiro instante, varias series temporais de relevancia na literatura e em

problemas do mundo real foram agrupadas para a consolidacao de um conjunto de dados

(benchmark) para a analise de desempenho dos modelos em estudo, formado por series

artificiais (serie do Mapa de Henon e serie Random Walk) e series reais, sendo estas

ultimas compostas por series de fenomenos naturais (serie das Manchas Solares — Sunspot

— e serie de Medidas do Brilho de uma Estrela) e series economico-financeiras (serie do

Indice Dow Jones Industrial Average, serie do Indice Nasdaq, serie do Indice S&P500 e

serie do Valor de Fechamento das Acoes da Petrobras).

Para o estabelecimento de um nıvel de referencia para o desempenho de previsao do

conjunto de series temporais, foram realizados experimentos com os modelos de Box &

Jenkins, visto que estes sao modelos lineares simples, totalmente entendidos e que, na

pratica, sao bastante utilizados. Os modelos gerados foram otimizados para a previsao.

Com a referencia estabelecida pelos experimentos de Box & Jenkins, foram montados

varios experimentos que utilizaram unicamente as RNAs do tipo MLP para a previsao

das series temporais. Os ajustes e configuracoes aplicados as RNAs foram escolhidos por

meio de tentativa e erro atraves de varios experimentos preliminares com o objetivo de

otimizar os modelos. Os resultados alcancados pelas RNAs, de forma geral, superam

expressivamente os resultados obtidos pelos experimentos de Box & Jenkins.

Analisando os experimentos, as RNAs, embora apresentem um desempenho superior

aos modelos de Box & Jenkins, ainda seguem a mesma tendencia comportamental apre-

sentada por Box & Jenkins, para as series economico-financeiras se comportam como um

modelo do tipo Random Walk, como relata a medida da estatıstica U de Theil, e um

experimento do tipo cara ou coroa para a determinacao da tendencia do proximo valor

futuro, como explicitado pela medida POCID.

10.1 CONCLUSOES 191

Este comportamento das RNAs (modelos do tipo Random Walk e experimentos do

tipo cara ou coroa) pode ser o reflexo da ma escolha dos parametros das RNAs. Para

tanto, foi construıdo um Sistema Hıbrido Inteligente (SHI) composto pela combinacao de

um AG modificado e RNAs. A ideia basica e utilizar o AG para uma escolha sub-otima,

ou ate mesmo otima, dos parametros utilizados pelas RNAs, inclusive os valores dos pesos

e a topologia da rede com a possibilidade de um processo de poda das conexoes.

Varios experimentos com o SHI foram realizados, mas o desempenho geral ficou um

pouco abaixo do alcancado pelos experimentos que utilizaram unicamente as RNAs. Este

comportamento de baixo desempenho de previsao do SHI vem provavelmente do fato

do espaco de estados possıveis para os pesos das RNAs constituir um universo de busca

extremamente vasto e de alta dimensionalidade, necessitando de um tempo muito extenso

para o correto treinamento das RNAs. Entretanto, embora o SHI tenha exibido um

desempenho inferior ao das RNAs, este obteve um desempenho superior aos experimentos

de Box & Jenkins, com uma configuracao bem mais compacta para as topologias da

RNAs. Contudo, o SHI ainda mantem o mesmo comportamento para as series economico-

financeiras, gerando modelos de previsao inferiores a modelos do tipo Random Walk.

Fazendo uma analise dos resultados obtidos com os experimentos realizados, e aliado

ao teorema de F. Takens [16], que prova a existencia de uma quantidade mınima necessaria

de retardos temporais para a reproducao do fenomeno gerador de uma serie temporal, foi

criado um novo metodo, chamado de Time-lag Added Evolutionary Forecasting Method,

ou simplesmente metodo TAEF, que realiza uma busca evolutiva pela dimensionalidade

mınima para a reconstrucao do espaco de estados da serie temporal, com a utilizacao

de um AG modificado que seleciona a topologia de uma RNA conjuntamente com o

algoritmo de treinamento aplicado para a previsao de series temporais.

Varios experimentos foram realizados com esta nova metodologia, que apresentaram

basicamente duas situacoes: para as dos fenomenos naturais, o metodo TAEF obteve

melhores resultados que as RNAs; entretanto, para as demais series (series economico-

financeiras e serie artificiais) o metodo TAEF apresenta um desempenho equivalente as

RNAs. Para as series economico-financeiras o metodo TAEF manteve um comportamento

tıpico de um modelo do tipo Random Walk e de um experimento do tipo cara ou coroa

para a determinacao da tendencia futura da serie. Tal comportamento, ja relatado na

literatura [103], e esperado quando a serie tende a um modelo do tipo Random Walk.

Entretanto, supondo que o modelo gerado e capaz de capturar informacao suficiente da

10.1 CONCLUSOES 192

serie, o comportamento do tipo Random Walk pode vir a ser devido a presenca de uma

componente linear auto-regressiva, com coeficiente em torno da unidade, que mascara

qualquer outra componente nao linear da serie. Se esta suposicao for verdadeira, existira

alguma forma de ajuste para a defasagem temporal entre a previsao e os dados reais,

criada pela forte tendencia de Random Walk.

Neste sentido, foi elaborado o procedimento de ajuste de fase temporal, sendo de-

senvolvida uma segunda versao do metodo TAEF, que a partir de um teste estatıstico

de hipotese determina se ha a necessidade ou nao de ajuste de fase. Tal procedimento

mostra-se habil para o ajuste da defasagem temporal entre os dados reais da serie tem-

poral e sua respectiva previsao.

Este mesmo procedimento de ajuste de fase tambem foi aplicado as RNAs, mas que

apresentou-se de forma nao habil para o ajuste de fase, mostrando que as RNAs ini-

ciais realmente se comportam com um modelo do tipo Random Walk, evidenciando a

importancia do correto ajuste dos parametros das RNAs gerado pelo metodo TAEF.

Desta forma, foram elaborados novos experimentos com series temporais artificiais de

alta complexidade para uma verificacao complementar ao metodo TAEF, apresentando

resultados de desempenho bastante satisfatorios.

Com o superior desempenho de previsao apresentado pelo metodo TAEF, foi cons-

truıdo um procedimento para a simulacao real de um sistema de apoio a tomada de

decisao baseado em previsao para a compra e venda de acoes da bolsa de valores do

estado de Sao Paulo, Bovespa. Com os resultados destas simulacoes, pode-se notar que

o metodo TAEF e capaz de dar subsıdios suficientes para superar em muito o mercado e

um processo de compra e venda de acoes baseado em modelos de Box & Jenkins, com a

necessidade de um risco muito baixo e a producao um retorno financeiro bem superior.

Desta forma, o metodo TAEF apresenta-se como uma nova metodologia viavel, tanto

cientificamente como de forma pratica, para a abordagem do problema de previsao de

series temporais e classificacao das series como modelos que tendem ou nao a um Random

Walk, sendo relatado em varios trabalhos publicados na literatura [104, 105, 113–117].

10.1.1 Contribuicoes da Tese

E possıvel enumerar as principais contribuicoes desta tese nos seguintes pontos:

10.1 CONCLUSOES 193

• Estudo de possıveis metodologias aplicadas para a previsao de series temporais em

um universo diversificado de fenomenos:

1. Fenomenos da Natureza;

2. Fenomenos Artificiais;

3. Fenomenos Economicos e Financeiros.

• Estudo comparativos entre as principais tecnicas encontradas na literatura para a

previsao de series temporais:

1. Modelos Box & Jenkins;

2. Tecnicas da IA:

– RNAs;

– AGs;

– Sistema Hıbrido AG + RNA.

• Identificacao de caracterısticas em comum entre os modelos gerados para as series

economicas e financeiras e um modelo do tipo Random Walk ;

• Desenvolvimento de um procedimento de busca evolutivo para a determinacao au-

tomatica:

1. Da dimensionalidade mınima de retardos temporais (baseado no teorema de

F. Takens [16]);

2. Dos parametros das RNAs.

• Desenvolvimento de um procedimento de teste comportamental para as series tem-

porais:

1. Serie temporal tende a um modelo do tipo Random Walk ; ou

2. Serie temporal nao tende a um modelo do tipo Random Walk.

• Desenvolvimento de uma nova metodologia hıbrida inteligente para a previsao de

series temporais:

1. O Metodo TAEF:

– Busca evolutiva pelos retardos temporais e demais parametros das RNAs;

– Busca evolutiva pelos retardos temporais e demais parametros das RNAs;

10.2 LIMITACOES DO TRABALHO 194

– Teste comportamental da serie estudada;

– Procedimento para o ajuste fino da fase de previsao.

• Investigacao detalha do metodo proposto;

• Proposta de um sistema de apoio a tomada de decisao aplicado ao mercado fi-

nanceiros, com a realizacao de simulacoes de compra e venda em uma carteira real

de acoes.

10.2 LIMITACOES DO TRABALHO

Embora o metodo TAEF tenha alcancado resultados expressivos, inclusive em com-

paracoes a outros trabalhos encontrados na literatura, como descrito na Secao 7.3, ainda

ha varios pontos em aberto que necessitam de um estudo cuidadoso e aprofundado.

Um desses pontos e a explicacao teorica do porque uma RNA apresentar dois compor-

tamentos tao distintos entre um modelo em fase e um modelo fora de fase, indicando a

possibilidade da existencia de algum fenomeno de transicao de fase descrito pelas RNAs.

Uma explicacao formal para este comportamento ainda e desconhecida.

Uma questao tambem importante a ser considerada e o conjunto de condicoes de pa-

rada utilizadas no metodo TAEF. Atualmente, a unica condicao de parada e a quantidade

de iteracoes realizadas, apos 10 iteracoes o metodo TAEF finaliza. Este procedimento,

embora seja muito simples de ser implementado, pode nao ser o mais adequado, neces-

sitando de um estudo bem mais aprimorado para a determinacao do correto ponto de

parada.

A propria natureza no metodo TAEF demonstra um custo relativamente alto para a

producao de um modelo de previsao baseado em RNAs. Nenhum estudo formal a respeito

do custo computacional (memoria e tempo) foi realizado, entretanto, em termos praticos,

o metodo TAEF com a utilizacao de computadores pessoais com processadores de clock

em torno de 2.0GHz e memoria de aproximadamente 512Mb, gasta em media duas horas

para o desenvolvimento de um modelo. Levando em consideracao uma aplicacao pratica

de compra e venda de acoes, um poder computacional razoavel e necessario para a infra-

estrutura operacional necessaria a criacao e manutencao dos modelos de previsao.

10.3 TRABALHOS FUTUROS 195

10.3 TRABALHOS FUTUROS

Uma extensao imediata do trabalho exposto e a investigacao teorica dos comportamen-

tos de previsao em fase e fora de fase, bem como o processo de transicao entre eles,

apresentados pelas RNAs submetidas ao metodo TAEF. Este tipo de analise pode vir a

evidenciar alguma propriedade ainda nao conhecida a respeito do comportamento descri-

tivo da dinamica de sistemas complexos por meio das RNAs.

Outro ponto interessante vem da analise dos proprios resultados obtidos com o metodo

TAEF. Construindo as series dos resıduos entre os dados reais e a previsao gerada pelo

metodo TAEF, observam-se dois comportamentos tıpicos:

1. Se a previsao esta em fase, a serie de resıduos tem uma distribuicao aproximada-

mente gaussiana com media zero e coeficientes de correlacao nulos, vindo a indicar

um termo realmente de ruıdo;

2. Ja para a previsao fora de fase, a serie de resıduos tem uma distribuicao nao gaus-

siana com media diferente de zero e coeficientes de correlacao nao nulos.

Portanto, o ajuste de fase pode ser na realidade o primeiro passo para a criacao de

uma teoria de pertubacao [118–121], comumente utilizada em outros ramos da ciencia,

como na fısica e quımica. Este tipo de teoria e semelhante a uma expansao em serie

de potencias, como na expansao de Taylor, onde cada termo acrescentado na expansao

introduz um fator de correcao que converge para a solucao real do problema. Para o caso

em particular, cada serie de resıduos e uma nova iteracao a ser introduzida ao metodo

TAEF, gerando novos termos de correcao para a previsao final.

Um ponto fundamental do trabalho apresentado e o fato da possibilidade de ajuste

de fase entre os dados reais e a previsao. Analisando a serie temporal como um sistema

dinamico em um certo espaco de fase generalizado M, as observacoes tidas da serie sao

na realidade a interseccao da trajetoria descrita pela evolucao do sistema com uma hiper-

superfıcie do espaco M, chamada de superfıcie de Poincare [21].

Supondo que o espaco M e formado por dimensoes complexas e a superfıcie de Poin-

care seja pertencente ao espaco real (valores observaveis), ha naturalmente uma perda

de fase de correlacao entre os pontos da trajetoria no espaco M e os observaveis reais,

visto que matematicamente o observavel de uma grandeza complexa e o seu modulo ao

quadrado, ou seja, dado um numero complexo,

10.4 TRABALHOS PUBLICADOS 196

F = Aeiφ

onde A e um termo real de amplitude, i e a constante complexa e φ um termo de fase.

O modulo ao quadrado de F e dado por,

|F |2 = FF † = AA† · ei(φ−φ) = A2

onde o sımbolo † representa o complexo conjugado. Logo, o termo de fase e naturalmente

eliminado pela observacao.

Este tipo de comportamento e comumente considerado na Mecanica Quantica que

considera a existencia de um emaranhado de possıveis estados correlacionados por uma

fase complexa. A Mecanica Quantica tambem afirma que, ao se interagir com o sistema,

o emaranhado de estados quanticos colapsa para um determinado estado de uma funcao

de onda, gerando o observavel nao mais correlacionado ao sistema original.

Assim, um ponto de interesse futuro e o estudo da computacao quantica [122,123], em

particular as redes neurais quanticas [124,125], para a analise do problema de previsao de

series temporais, em particular series economicas e financeiras, verificando as correlacoes

em estados complexos da representacao de informacao.

10.4 TRABALHOS PUBLICADOS

Com esta Tese foram gerados os seguintes trabalhos:

1. Um modelo de Previsao Baseado em Inteligencia Artificial na Gestao de Bibliotecas

Universitarias [126];

2. Combinacao de Redes Neurais Artificiais com Algoritmo Genetico Modificado para

a Previsao de Series Temporais [127];

3. Composicao de Redes Neurais Artificiais com Algoritmo Genetico Modificado para

a Previsao de Series Temporais [128];

4. A Hybrid Intelligence System Approach for Improving the Prediction of Real World

Time Series [104];

10.4 TRABALHOS PUBLICADOS 197

5. An ANN-GA Approach for Automatic Lag Search and Real World Time Series

Forecasting [105];

6. An ANN-GA Approach for Automatic Lag Search and Real Worlds Time Series

Forecasting [113];

7. A New Hybrid Approach for Enhanced Times Series Prediction [114];

8. Evolutionary Method for Real-Word Times Series Prediction [115];

9. A New Hybrid Method for Time Series Forecasting [116];

10. A New Intelligent Methodology for Times Series Forecasting [117];

APENDICE A

ENUNCIADO DOS TEOREMAS DE F. TAKENS

Neste Apendice sao enunciados os quatro teoremas de F. Takens, originalmente apresen-

tados no trabalho Detecting Strange Attractor in Turbulence [16].

Estes teoremas sao a justificativa teorica para a possibilidade da reconstrucao do

espaco de fase gerador de uma serie temporal. Esta possibilidade e a base do funcio-

namento do metodo desenvolvido nesta tese para a resolucao do problema de previsao de

series temporais.

A.1 SISTEMA DINAMICO COM UM OBSERVAVEL

Seja um espaco M compacto. Um sistema sobre M tera uma dinamica temporal, corres-

pondente a um ponto inicial x0 (x0 ∈ M), dada pela funcao ϕt(x0), que descrevera uma

trajetoria em M .

Um observavel e uma funcao suave y : M → R. O primeiro problema que Takens quiz

responder foi: se, para algum sistema dinamico fısico com evolucao temporal ϕt, uma vez

conhecida a trajetoria t 7→ y(ϕt(x)), com x ∈ M , como obter informacao a respeito da

dinamica original do sistema (e sua dimensionalidade)? Os proximos tres teoremas estao

correlacionados com este problema.

Teorema A.1. Seja M um espaco compacto de dimensao m. Para pares do tipo (ϕ, y),

onde ϕ : M → M e um difemorfısmo suave e y : M → R uma funcao suave, uma

propriedade generica para mapeamento Φ(ϕ, y) : M → (R)2m+1 e definida como:

Φ(ϕ,y)(x) =(y(x), (y(ϕ(x)), . . . , y(ϕ2m(x))

)

que e um mapeamento de dimensao embutida, ou um embutido, e e entendido “suave”

como pelo menos pertencente a classe C2.

Teorema A.2. Seja M um espaco compacto de dimensao m. Para pares (X,y), X um

campo vetorial suave (i.e., C2) e y um funcao suave sobre M, uma propriedade generica

198

A.1 SISTEMA DINAMICO COM UM OBSERVAVEL 199

e que ΦX,y : M → R2m+1, definido por ΦX,y(x) = (y(x), (y(ϕ1(x)), . . . , y(ϕ2m(x))) e um

embutido, onde ϕt e o fluxo de X.

Teorema A.3. Seja M um espaco compacto de dimensao m. Para pares (X,y), X um

campo vetorial suave e y uma funcao suave sobre M, uma propriedade generica do ma-

peamento ΦX,y : M → R2m+1, definido como,

ΦX,y(x) =

(y(x),

d

dt(y(ϕt(x)))

∣∣∣∣t=0

, . . . ,d2m

dt2m(y(ϕt(x)))

∣∣∣∣t=0

)

e um embebido. Aqui ϕt novamente denota o fluxo de X, entretanto ser suave e agora

entendido como pelo menos ser C2m+1.

A partir destes tres teoremas e possıvel se determinar como um sistema dinamico

com evolucao temporal ϕt e observavel y e determinado genericamente pelo conjunto

de todas as funcoes t 7→ y(ϕt(x)). Na pratica a seguinte situacao pode ocorrer: tem-se

um sistema dinamico com tempo contınuo, mas os valores dos observaveis y sao apenas

determinados para um conjunto discreto de observacoes. Aliado a este fato, de todas

as observacoes discretas do observavel ({y(ϕiα(x))}∞i=0, com x ∈ M) so e conhecida tal

sequencia para um ou poucos valores de x (dependendo da quantidade de experimentos),

e mesmo assim nao e conhecida a totalidade da sequencia, apenas uma sub-sequencia

de i = 1, 2, . . . , N , sendo N um numero grande porem finito. Desta forma, e possıvel

pensar, sobre consideracoes genericas, que a topologia e a dinamica do sistema sobre um

conjunto em um limite positivo,

L+(x) = {x′ ∈ M |∃ti → ∞ com ϕti → x′}

de x e determinada pela sequencia {y(ϕiα(x))}∞i=0. O que gera o proximo teorema e seu

subsequente corolario.

Teorema A.4. Seja M um espaco compacto, X um campo vetorial sobre M com fluxo

ϕt e p um ponto em M . Entao, existe um subconjunto de residual CX,p de numeros reais

positivos tal que α ∈ CX,p onde o conjunto dos limites positivos para p, para um fluxo ϕt

de X e para o difeomorfismo ϕα sao os mesmos. Em outras palavras, para α ∈ CX,p, tem-

se que cada ponto q ∈ M , o qual e o limite de uma sequencia ϕti(p), ti ∈ R, ti → +∞, e

o limite da sequencia ϕniα(p), ni ∈ N e ni → ∞.

Corolario A.1. Seja M um espaco compacto de dimensao m. Considere 4-tuplas, con-

sistindo de um campo vetorial X, uma funcao y, um ponto p e um numero real positivo

A.1 SISTEMA DINAMICO COM UM OBSERVAVEL 200

α. De forma generica (X, y, p, α) (mais precisamente: o par generico (X,Y) e α satis-

fazendo condicoes genericas dependendo de X e p), conjunto de limite positivo L+(p) e

“difeomorfico” com o conjunto de pontos limites da seguinte sequencia em R2m+1:

{(y (ϕk,α(p))) ,

(y(ϕ(k+1),α(p)

)), . . . ,

(y(ϕ(k+2m),α(p)

))}∞k=0

.

O significado do “difeomorfico” poderia ser: existe um embutido suave de M dentro de

R2m+1 mapeando L+(p) de forma bijetiva com o conjunto de pontos limites

Desta forma, o trabalho de Takens prova que e possıvel se construir um espaco de

fase composto com os retardos temporais relevantes de tal forma que este seja capaz de

reproduzir a dinamica original de uma serie temporal, que nada mais e que um conjunto

finito de observacoes da evolucao temporal de um sistema dinamico.

APENDICE B

EVOLUCAO DA POPULACAO DOS ALGORITMOS

GENETICOS

Dado um Algoritmo Genetico (AG), pode-se perguntar se ha a possibilidade de carac-

terizar matematicamente a evolucao temporal de sua populacao. Hollande [79] mostrou

que tal caracterizacao e possıvel atraves do uso do Teorema dos Esquemas.

O Teorema dos Esquemas e baseado no conceito dos esquemas, ou padroes, que des-

crevem um conjunto de strings de bits. De forma mais precisa, um esquema e qualquer

string composta por 0’s, 1’s e *’s. Cada esquema representa uma combinacao de 0’s e 1’s,

onde cada * e utilizado nas posicoes da string onde e irrelevante ter 0 ou 1. Por exemplo,

o esquema,

0 ∗ 10

representa o conjunto de strings: 0010 e 0110.

De forma inversa, cada string em um dado conjunto de strings pode ser vista como

uma representacao de diferentes esquemas que casam com ela. Por exemplo, dada a String

0010, esta pode ser representada por qualquer esquema que case com os bits 0010, como:

00**, *01*, ****, etc, totalizando 24 esquemas possıveis para esta representacao. Da

mesma maneira, a populacao de strings pode ser representada em termos de um conjunto

de esquemas e o numero de associacoes individuais com cada um desses esquemas.

Com a utilizacao da representacao dos indivıduos pelos esquemas, o Teorema dos

Esquemas caracteriza a evolucao da populacao do AG em termos do numero de instancias

que representam cada esquema.

B.1 O TEOREMA DOS ESQUEMAS

Seja m(s, t) o numero de instancias de um esquema s em uma populacao no tempo t (ou

seja, durante a t-esima geracao). O Teorema dos Esquemas ira descrever o valor esperado

201

B.1 O TEOREMA DOS ESQUEMAS 202

de m(s, t + 1) em termos de m(s, t).

Como explicitado no Capıtulo 3, a evolucao da populacao de um AG depende dos

procedimentos de selecao, recombinacao (operacao de cruzamento) e mutacao.

Considerando inicialmente o processo de selecao, seja f(h) a funcao de fitness de uma

string e f(t) a media da funcao de fitness sobre todas as strings da populacao no tempo t.

Seja N o numero total de indivıduos na populacao. Fazendo tambem h ∈ s∩pt, sendo

h um indivıduo que seja representado pelo esquema s e membro da populacao do AG no

tempo t (pt). E, por fim, seja u(s, t) o fitness medio das instancias do esquema s no tempo

t. Deseja-se calcular o valor esperado de m(s, t + 1), representado por E[m(s, t + 1)].

Assumindo que a probabilidade de selecao seja dada por,

Pr(h) =f(h)

∑N

i=1 f(hi)=

f(h)

Nf (t)(B.)

a probabilidade de selecao de um representante do esquema s e,

Pr(h ∈ s) =∑

h∈s∩pt

f(h)

Nf(t)=

u(s, t)

Nf(t)m(s, t). (B.)

Contudo, por definicao,

u(s, t) =

∑h∈s∩t

f(t)

m(s, t)(B.)

o que leva a interpretar a Equacao (B.) como a probabilidade de que um unico indivıduo

seja selecionado pelo AG, sendo este uma instancia do esquema s. Desta forma, o valor

esperado do numero de instancias de s resultante de N passos independentes de selecao,

que ira criar a nova geracao, e exatamente N vezes a Equacao (B.),

E[m(s, t + 1)] =u(s, t)

f(t)m(s, t) (B.)

A Equacao (B.) mostra que o numero de instancias de s, sobre a geracao t + 1, e

proporcional ao fitness medio u(s, t) das instancias deste mesmo esquema no tempo t, e

inversamente proporcional ao fitness medio f(t) de todos os membros da populacao no

tempo t.

A Equacao (B.) nao leva em consideracao as operacoes de cruzamento e mutacao.

B.1 O TEOREMA DOS ESQUEMAS 203

Todas as duas operacoes podem tanto criar novas instancias de s como tambem po-

dem destruir as existentes. Considerando apenas o efeito de destruicao de instancias, o

Teorema dos Esquemas tera um limite inferior para o valor esperado da frequencia dos

esquemas s, dado por,

E[m(s, t + 1)] ≥ u(s, t)

f(t)m(s, t)

(1 − pc

d(s)

l − 1

)(1 − pm)o(s) (B.)

onde pc e a probabilidade do operador de cruzamento (um ponto) ser aplicado a um

indivıduo arbitrario e pm a probabilidade que um bit arbitrario de um indivıduo qualquer

seja alterado (mutacao). o(s) e o numero de bits definidos no esquema s, d(s) e a distancia

entre o bit definido mais a esquerda e o mais a direita no esquema s e l e o comprimento

de um indivıduo da populacao.

A Equacao (B.) e o proprio Teorema dos Esquemas, onde o lado esquerdo e composto

por tres termos. O primeiro, identico ao da Equacao (B.), reflete o efeito do processo de

selecao, o segundo termo (termos central do lado esquerdo) descreve o efeito do operador

de cruzamento, em particular, descreve a probabilidade de um indivıduo representado

por um esquema s ainda ser representado pelo esquema s apos a aplicacao do operador

de cruzamento. Por fim, o ultimo termo (termo mais a direita) descreve a probabilidade

de um indivıduo representado pelo esquema s ainda ser representado pelo esquema s apos

a aplicacao da operacao de mutacao.

Desta forma, o Teorema dos Esquemas pode ser rigorosamente interpretado como

o estatuto que afirma que esquemas com um grande poder de ajuste (muitos *’s) irao

tender a crescer em influencia, especialmente aqueles esquemas cujos bits definidos sejam

proximos uns dos outros.

APENDICE C

VALORES DOS COEFICIENTES PARA OS MODELOS

DE BOX & JENKINS

Neste Apendice sao expostos os valores dos coeficientes auto-regressivos e de medias

moveis obtidos pelos experimentos realizados com os modelos de Box & Jenkins para

cada uma das series temporais apresentadas no Capıtulo 4.

C.1 SERIE DO MAPA DE HENON

Para a Serie do Mapa de Henon os experimentos com os modelos de Box & Jenkins

elegeram o modelo ARIMA(26,0,1). Os coeficientes auto-regressivos sao mostrados na

Tabela C.1, e o unico coeficiente de medias moveis assume o valor de 0.5000.

Tabela C.1: Parametros auto-regressivos selecionados para o modelo ARIMA(26,0,1)referentes a serie do Mapa de Henon, devendo ser lidos da esquerda para a direita, linhaa linha, do coeficiente 1 ao 26.

-0.0037 -0.2896 -0.0199 0.0336 -0.0070 -0.3755 -0.0072 -0.2015-0.1915 0.0013 -0.1527 -0.0058 0.0142 -0.0094 -0.0235 0.00083-0.0085 0.0205 -0.0230 0.0135 0.0113 0.0064 -0.0058 -0.00080.0379

C.2 SERIE DAS MANCHAS SOLARES

Para a serie das Manchas Solares os experimentos com os modelos de Box & Jenkins

selecionaram o modelo ARIMA(9,0,1), cujos coeficientes auto-regressivos sao mostrados

na Tabela C.2 e o unico coeficiente de medias moveis e 0.5000.

204

C.3 SERIE DE MEDIDAS DE BRILHO DE UMA ESTRELA 205

Tabela C.2: Parametros auto-regressivos selecionados para o modelo ARIMA(9,0,1) re-ferentes a serie das Manchas Solares, devendo ser lidos da esquerda para a direita, linhaa linha, do coeficiente 1 ao 9.

1.1939 -0.4251 -0.1600 0.1842 -0.1256 -0.0032 0.0153 0.03220.1559

C.3 SERIE DE MEDIDAS DE BRILHO DE UMA ESTRELA

Para a serie de Medidas de Brilho de uma Estrela, os experimentos de Box & Jenkins

selecionaram o modelo ARIMA(88,0,0), sendo assim constituıdo apenas por coeficientes

auto-regressivos, mostrados na Tabela C.3.

Tabela C.3: Parametros auto-regressivos selecionados para o modelo ARIMA(88,0,0)referentes a serie de Medidas de Brilho de uma Estrela, devendo ser lidos da esquerdapara a direita, linha a linha, do coeficiente 1 ao 88.

0.1786 0.0767 0.0918 0.1298 0.0106 -0.0080 -0.0615 -0.1085-0.0707 -0.2062 -0.0476 -0.0046 -0.0829 -0.1883 -0.1402 -0.0805-0.0397 -0.0039 -0.0724 0.0542 -0.0394 -0.0330 0.0204 0.3008-0.0652 -0.0451 -0.0377 0.0491 0.3532 -0.0377 -0.0548 -0.0989-0.0288 -0.0081 0.0519 0.1110 0.0789 0.1022 0.0080 0.03380.0243 0.0808 0.0012 0.0859 0.0334 -0.0026 -0.0048 -0.2078-0.1448 -0.0341 -0.0586 -0.0274 -0.2068 -0.0348 0.0010 -0.0626-0.0026 0.3634 -0.0218 0.0152 -0.0220 -0.0133 -0.0711 -0.0500-0.0285 0.0165 0.0489 0.0851 0.0345 -0.0261 0.0139 0.2473-0.0397 0.0941 0.0143 0.0576 -0.0958 -0.0054 0.1170 0.06070.0557 -0.0892 0.0192 0.0952 0.0688 0.0342 0.2147 0.1368

C.4 SERIE DO INDICE DOW JONES INDUSTRIAL AVERAGE

Para a serie do Indice Dow Jones Industrial Average os experimentos com os modelos

de Box & Jenkins selecionaram o modelo ARIMA(1,0,1), sendo constituıdo por apenas

dois coeficientes, um auto-regressivo com o valor de 0.9924 e um de medias moveis com

o valor de 0.5003.

C.5 SERIE DO INDICE NASDAQ

Para a serie do Indice Nasdaq os experimentos de Box & Jenkins elegeram o modelo

ARIMA(44,0,1), onde os coeficientes auto-regressivos sao expostos na Tabela C.4, e o

C.6 SERIE DO INDICE S&P500 206

coeficiente de medias moveis e dado por 0.4997.

Tabela C.4: Coeficientes auto-regressivos selecionados para o modelo ARIMA(44,0,1)referentes a serie do Indice Nasdaq, devendo ser lidos da esquerda para a direita, linha alinha, do coeficiente 1 ao 44.

.

0.1461 -0.1592 0.0210 0.0308 -0.0308 -0.0134 0.0305 -0.06740.0374 0.0382 -0.0251 0.0358 -0.0081 -0.0622 0.0549 -0.03670.0069 -0.0289 0.0862 -0.0540 -0.0408 0.0268 0.0118 0.0499-0.0734 0.0628 0.0169 -0.0265 0.0174 0.0202 -0.0719 0.05230.0111 -0.0481 0.0330 0.0058 -0.0781 0.0622 0.0174 -0.05150.0313 -0.0247 0.0652 -0.0374

C.6 SERIE DO INDICE S&P500

Para a serie do Indice S&P500 os experimentos de Box & Jenkins escolheram o modelo

ARIMA(1,0,1) como o mais indicado, contendo o coeficiente auto-regressivo dado por

0.9990 e o coeficiente de medias moveis dado por 0.5010.

C.7 SERIE DO VALOR DE FECHAMENTO DAS ACOES DA PETROBRAS

Para a serie do Valor de Fechamento das Acoes da Petrobras (PetrobrasON) os experi-

mentos com os modelos de Box & Jenkins elegeram o modelo ARIMA(2,0,1), onde os

coeficientes auto-regressivos sao 0.9136 e 0.0855, e o coeficiente de medias moveis e dado

por -0.1714.

C.8 SERIE RANDOM WALK

Para a serie Random Walk os experimentos de Box & Jenkins escolheram o modelo

ARIMA(1,0,1) com o mais apto, sendo o coeficiente auto-regressivo dado por 0.9783 e o

coeficiente de medias moveis dado por 0.4999.

APENDICE D

RESULTADOS EXPERIMENTAIS COM AS REDES

NEURAIS ARTIFICIAIS

Neste Apendice sao mostrados os resultados obtidos para todos os experimento de pre-

visao realizados unicamente com as Rede Neurais Artificiais.

Para cada uma das oito series temporais apresentadas no Capıtulo 4, foram realizadas

dez inicializacoes distintas para tres arquiteturas diferentes, totalizando 240 experimentos.

Para cada uma das series temporais e mostrado uma Tabela contendo todos os valores

das medidas de desempenho utilizadas (Secao 4.10) para cada uma das dez inicializacoes

das tres arquiteturas utilizadas, juntamente com os valores medios e do desvio padrao

para cada uma destas medidas nos conjuntos de treinamento, validacao e teste, sendo:

Tabela D.1 - Resultados para a serie de Henon:

Tabela D.2 - Resultados para a serie das Manchas Solares;

Tabela D.3 - Resultados para a serie de Medida de Brilho de uma Estrela;

Tabela D.4 - Resultados para a serie do Indice Dow Jones Industrial Average;

Tabela D.5 - Resultados para a serie do Indice Nasdaq;

Tabela D.6 - Resultados para a serie do Indice S&P500;

Tabela D.7 - Resultados para a serie do Valor de Fechamento das Acoes da Petrobras;

Tabela D.8 - Resultados para a serie Random Walk.

207

RE

SU

LTA

DO

SE

XP

ER

IME

NTA

ISC

OM

AS

RE

DE

SN

EU

RA

ISA

RT

IFIC

IAIS

208

Tabela D.1: Resultados experimentais para a previsao da serie do mapa de Henon utilizando RNAs. Para todas as medidasde desempenho sao calculadas as suas medias (x), desvios padroes (σx) e intervalos de confianca com um erro de 1% (limiteinferior – Conf−; e limite superior – Conf+). Em negrito e destacada a melhor inicializacao.

RNA x Conjunto de Treinamento Conjunto de Validacao Conjunto de Teste Ep.MSE MAPE Theil POCID ARV AIC BIC MSE MAPE Theil POCID ARV AIC BIC MSE MAPE Theil POCID ARV AIC BIC

4-1-1

1 0.1918 0.2612 0.1847 71.04 0.3671 -8238.7 -8186.0 0.2032 0.7565 0.1946 70.82 0.3878 -3968.1 -3920.3 0.1946 0.3120 0.1863 70.50 0.3717 -4076.1 -4028.3 172 0.1918 0.2607 0.1846 71.04 0.3671 -8239.6 -8187.0 0.2032 0.7592 0.1947 70.82 0.3878 -3968.1 -3920.3 0.1946 0.3120 0.1863 70.50 0.3717 -4076.5 -4028.8 143 0.1918 0.2612 0.1847 71.04 0.3671 -8238.8 -8186.1 0.2032 0.7565 0.1946 70.82 0.3878 -3968.1 -3920.3 0.1946 0.3120 0.1863 70.50 0.3717 -4076.1 -4028.4 194 0.1918 0.2613 0.1847 71.02 0.3671 -8239.2 -8186.6 0.2032 0.7557 0.1946 70.82 0.3878 -3968.1 -3920.3 0.1946 0.3120 0.1863 70.50 0.3717 -4076.4 -4028.6 255 0.1918 0.2604 0.1846 71.02 0.3671 -8239.1 -8186.5 0.2032 0.7615 0.1947 70.82 0.3878 -3968.1 -3920.3 0.1946 0.3120 0.1863 70.50 0.3717 -4076.3 -4028.5 166 0.1918 0.2613 0.1847 71.02 0.3671 -8238.8 -8186.2 0.2033 0.7553 0.1946 70.82 0.3878 -3968.1 -3920.3 0.1946 0.3120 0.1863 70.50 0.3717 -4076.3 -4028.4 257 0.1918 0.2613 0.1847 71.02 0.3671 -8239.2 -8186.6 0.2032 0.7554 0.1946 70.82 0.3878 -3968.1 -3920.3 0.1946 0.3120 0.1863 70.50 0.3717 -4076.3 -4028.6 228 0.1918 0.2612 0.1847 71.04 0.3671 -8238.7 -8186.1 0.2032 0.7567 0.1946 70.82 0.3878 -3968.1 -3920.3 0.1946 0.3120 0.1863 70.50 0.3717 -4076.3 -4028.6 199 0.1918 0.2612 0.1847 71.02 0.3671 -8239.2 -8186.5 0.2032 0.7568 0.1946 70.82 0.3878 -3968.1 -3920.3 0.1946 0.3120 0.1863 70.50 0.3717 -4076.1 -4028.6 2710 0.1918 0.2607 0.1846 71.04 0.3671 -8238.6 -8186.0 0.2032 0.7598 0.1947 70.82 0.3878 -3968.1 -3920.3 0.1946 0.3120 0.1863 70.50 0.3717 -4076.1 -4028.3 17x 0.1918 0.2611 0.1847 71.03 0.3671 -8239.0 -8186.4 0.2032 0.7573 0.1946 70.82 0.3878 -3968.1 -3920.3 0.1946 0.3120 0.1863 70.50 0.3717 -4076.3 -4076.3 20.1σx 0.0000 0.0003 4.8e-5 0.0105 0.0000 0.3178 0.3307 0.0000 2.0961e-3 4.8e-5 0.00 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.1434 0.1595 4.41

Conf.− 0.1918 0.2608 0.1846 71.021 0.3671 -8239.2 -8186.6 0.2032 0.7556 0.1946 70.82 0.3878 -3968.1 -3920.3 0.1946 0.3120 0.1863 70.50 0.3717 -4076.4 -4028.6 16.5Conf.+ 0.1918 0.2613 0.1847 71.039 0.3671 -8238.7 -8186.1 0.2032 0.7590 0.1947 70.82 0.3878 -3968.1 -3920.3 0.1946 0.3120 0.1863 70.50 0.3717 -4076.1 -4028.4 23.7

4-5-1

1 3.1294e-9 8.0834e-9 3.0128e-9 100.00 5.9891e-9 -97811 -97577 3.1634e-9 9.2714e-9 3.0210e-9 100.00 6.0361e-9 -48847 -48635 3.2001e-9 7.9040e-9 3.0633e-9 100.00 6.1124e-9 -48818 -48607 5002 4.0797e-9 1.3108e-8 3.9276e-9 100.00 7.8078e-9 -96485 -96252 4.2557e-9 2.7416e-8 4.0759e-9 100.00 8.1202e-9 -48106 -47894 4.0960e-9 2.7416e-8 4.0760e-9 100.00 7.8235e-9 -48201 -47990 5003 7.1305e-9 2.2262e-8 6.8674e-9 100.00 1.3646e-8 -93694 -93461 7.5604e-9 6.0160e-8 7.2410e-9 100.00 1.4426e-8 -46670 -46458 7.1319e-9 2.5772e-8 6.8272e-9 100.00 1.3622e-8 -46815 -46604 5004 6.5702e-9 2.4353e-8 6.3254e-9 100.00 1.2574e-8 -94103 -93870 6.9692e-9 2.8238e-8 6.6748e-9 100.00 1.3298e-8 -46873 -46662 6.8059e-9 2.8238e-8 6.5151e-9 100.00 1.3000e-8 -46932 -46721 5005 1.1735e-8 3.3023e-8 1.1298e-8 100.00 2.2459e-8 -91204 -90971 1.2063e-8 5.6545e-8 1.1553e-8 100.00 2.3017e-8 -45550 -45291 1.1836e-8 3.4920e-8 1.1330e-8 100.00 2.2607e-8 -45550 -45338 5006 3.0375e-8 7.6297e-8 2.9243e-8 100.00 5.8132e-8 -86451 -86218 3.3041e-8 1.1340e-7 3.1645e-8 100.00 6.3044e-8 -42984 -42773 3.1936e-8 7.3922e-8 3.0571e-8 100.00 6.1000e-8 -43069 -42858 5007 1.0792e-9 2.7330e-9 1.0389e-9 100.00 2.0653e-9 -103132 -102899 1.0745e-9 2.7061e-9 1.0295e-9 100.00 2.0510e-9 -51544 -51333 1.1037e-9 2.6087e-9 1.0566e-9 100.00 2.1082e-9 -51478 -51267 5008 1.4081e-8 3.6891e-8 1.3556e-8 100.00 2.8708e-8 -90294 -90061 1.5046e-8 5.4709e-8 1.4410e-8 100.00 2.8708e-8 -44950 -44738 1.4788e-8 3.5863e-8 1.4156e-8 100.00 2.8246e-8 -44993 -44782 5009 1.1871e-8 3.9646e-8 1.1428e-8 100.00 2.2719e-8 -91147 -90914 1.1842e-8 5.5078e-8 1.1341e-8 100.00 2.2595e-8 -45548 -45337 1.1710e-8 4.1740e-8 1.1210e-8 100.00 2.2367e-8 -45576 -45365 50010 8.9856e-9 2.9673e-8 8.6507e-9 100.00 1.7197e-8 -92539 -92306 9.5041e-9 5.7506e-8 9.1026e-9 100.00 1.8134e-8 -46098 -45886 9.0882e-9 3.1810e-8 8.6998e-9 100.00 1.7359e-8 -46210 -45998 500x 9.9037e-9 2.8607e-8 9.5346e-9 100.00 1.9100e-8 -93686.4 -93453.4 1.0452e-8 4.6503e-8 1.0010e-8 100.00 1.9943e-8 -46712.7 -46501.2 1.0170e-8 3.1019e-8 9.7350e-9 100.00 1.9425e-8 -46764.8 -46553.3 500σx 8.3072e-9 2.0749e-8 7.9975e-9 0.0000 1.6000e-8 4.6190e3 4.6190e3 9.0475e-7 3.1671e-8 8.6654e-9 0.0000 1.7263e-8 2.3589e3 2.3589e3 8.7536e-9 1.9392e-8 8.3795e-9 0.0000 1.6720e-8 2.3219e3 2.3219e3 0.00

Conf.− 3.1371e-9 1.1706e-8 3.0205e-9 100.00 6.0920e-9 -97448 -97215 3.0822e-9 2.0706e-8 2.9504e-9 100.00 5.8812e-9 -48636 -48422 3.0394e-9 1.5223e-8 2.9347e-9 100.00 5.8053e-9 -48655.4 -48444.3 500Conf.+ 1.6670e-8 4.5508e-8 1.6049e-8 100.00 3.2167e-8 -89923 -89690 1.7822e-8 7.2300e-8 1.7068e-8 100.00 3.4005e-8 -44798 -44579 1.7300e-8 4.6816e-8 1.6566E-8 100.00 3.3044e-8 -44873.0 -44661.7 500

4-10-1

1 3.9234e-9 1.0862e-10 3.7770e-11 100.00 7.5087e-11 -119637.4 -119178.9 4.0289e-9 1.1010e-10 3.8590e-11 100.00 7.6875e-11 -59691.4 -59275.2 4.0840e-9 1.0349e-10 3.9090e-11 100.00 7.8006e-11 -59657.5 -59241.3 5002 6.1288e-8 1.5018e-9 5.9004e-10 100.00 1.1729e-9 -105899.8 -105441.3 6.0041e-8 2.3907e-9 5.7505e-10 100.00 1.1456e-9 -52940.3 -52524.0 6.2322e-8 1.4488e-9 5.9659e-10 100.00 1.1904e-9 -52847.1 -52430.9 5003 2.5113e-7 6.9563e-9 2.4177e-9 100.00 4.8062e-9 -98850.6 -98392.1 2.7097e-7 1.4953e-8 2.5953e-9 100.00 5.1704e-9 -49174.3 -48758.1 2.6117e-7 7.7007e-9 2.5001e-9 100.00 4.9884e-9 -49266.4 -48850.2 5004 8.3116e-8 1.5103e-9 8.0018e-10 100.00 1.5907e-9 -104377.2 -103918.6 8.2924e-8 2.1065e-9 7.9421e-10 100.00 1.5822e-9 -52133.4 -51717.1 8.6476e-8 1.6839e-9 8.2781e-10 100.00 1.6517e-9 -52028.6 -51612.3 5005 5.9875e-8 1.2242e-9 5.7643e-10 100.00 1.1459e-9 -106016.5 -105557.9 6.1607e-8 1.4745e-9 5.9005e-10 100.00 1.1755e-9 -52876.0 -52459.7 6.1249e-8 1.2907e-9 5.8631e-10 100.00 1.1699e-9 -52890.5 -52474.3 5006 3.2717e-8 8.7035e-10 3.1498e-10 100.00 6.2614e-10 -109037.0 -108578.5 3.4071e-8 1.5570e-9 3.2632e-10 100.00 6.5009e-10 -54356.2 -53940.0 3.3988e-8 9.2560e-10 3.2536e-10 100.00 6.4919e-10 -54362.3 -53946.0 5007 1.4234e-8 5.9250e-10 1.3703e-10 100.00 2.7240e-10 -113196.8 -112738.3 1.5090e-8 6.2950e-10 1.4452e-10 100.00 2.8792e-10 -56391.5 -55975.2 1.4491e-8 5.6776e-10 1.3872e-10 100.00 2.7679e-10 -56492.5 -56076.3 5008 2.5552e-7 8.1940e-9 2.4600e-9 100.00 4.8902e-9 -98764.1 -98305.6 2.6352e-7 9.6488e-9 2.5239e-9 100.00 5.0282e-9 -49244.0 -48827.7 2.6109e-7 7.0695e-9 2.4993e-9 100.00 4.9869e-9 -49267.2 -48851.0 5009 8.1093e-8 1.7399e-9 7.8070e-10 100.00 1.5520e-9 -104500.4 -104041.8 7.9169e-8 2.2404e-9 7.5825e-10 100.00 1.5106e-9 -52249.2 -51832.9 8.2224e-8 1.9599e-9 7.8710e-10 100.00 1.5705e-9 -52154.6 -51738.3 50010 4.8544e-8 1.5411e-9 4.6735e-10 100.00 9.2904e-10 -107064.9 -106606.4 4.9490e-8 2.0145e-9 4.7399e-10 100.00 9.4430e-10 -53423.2 -53007.0 4.9405e-8 1.6190e-9 4.7294e-10 100.00 9.4367e-10 -53427.5 -53011.3 500x 8.9144e-8 2.4239e-9 8.5822e-10 100.00 1.7061e-9 -106734.5 -106276.0 9.2092e-8 3.7125e-9 8.8202e-10 100.00 1.7572e-9 -53247.9 -52831.7 9.1649e-8 2.4369e-9 8.7733e-10 100.00 1.7505e-9 -53239.4 -52823.2 500σx 9.0285e-8 2.7756e-9 8.6920e-10 0.0000 1.7279e-9 6.2459e3 6.2459e3 9.5720e-8 4.7505e-9 9.1677e-10 0.0000 1.8264e-9 3.1226e3 3.1226e3 9.3140e-8 2.6697e-9 8.9160e-10 0.0000 1.7790e-9 3.1190e3 3.1190e3 0.00

Conf.− 1.5603e-8 1.6303e-10 1.5021e-10 100.00 2.9861e-10 -111822.1 -111363.5 1.4124e-8 1.5699e-10 1.3526e-10 100.00 2.6946e-10 -55791.5 -55375.2 1.5782e-8 2.6235e-10 1.5107e-10 100.00 3.0145e-10 -55780.0 -55363.8 500Conf.+ 1.6268e-7 4.6848e-9 1.5662e-9 100.00 3.1135e-09 -101646.9 -101188.3 1.7006E-7 7.5820e-09 1.6288e-9 100.00 3.2449e-9 -50704.4 -50288.1 1.6752e-7 4.6115e-9 1.6036e-9 100.00 3.1996e-9 -50698.9 -50282.6 500

RE

SU

LTA

DO

SE

XP

ER

IME

NTA

ISC

OM

AS

RE

DE

SN

EU

RA

ISA

RT

IFIC

IAIS

209

Tabela D.2: Resultados experimentais para a previsao da serie das Manchas Solares utilizando RNAs. Para todas as medidasde desempenho sao calculadas as suas medias (x), desvios padroes (σx) e intervalos de confianca com um erro de 1% (limiteinferior – Conf−; e limite superior – Conf+). Em negrito e destacada a melhor inicializacao.


3-1-1

1 0.5643 0.0377 0.4634 71.1268 0.1680 -728.4 -704.6 0.5711 0.0382 0.4747 67.6056 0.1876 -359.9 -340.2 0.0136 0.0368 0.5080 74.2857 0.2093 -293.2 -273.7 102 0.5558 0.0461 0.4565 71.1268 0.1655 -730.5 -706.7 0.5830 0.0478 0.4847 66.1972 0.1915 -358.4 -338.8 0.0137 0.0389 0.5127 72.8571 0.2112 -292.6 -273.0 123 0.5531 0.0437 0.4542 71.1268 0.1647 -731.2 -707.4 0.5830 0.0452 0.4847 66.1972 0.1915 -358.4 -338.8 0.0139 0.0389 0.5202 72.8571 0.2143 -291.6 -272.0 294 0.5729 0.0450 0.4705 70.4225 0.1706 -726.2 -702.4 0.5443 0.0446 0.4525 67.6056 0.1788 -363.4 -343.7 0.0139 0.0370 0.5209 75.7143 0.2146 -291.5 -271.9 95 0.5531 0.0436 0.4542 71.1268 0.1647 -731.2 -707.5 0.5830 0.0451 0.4847 66.1972 0.1915 -358.4 -338.8 0.0139 0.0389 0.5202 72.8571 0.2143 -291.6 -272.0 336 0.5561 0.0478 0.4567 71.1268 0.1656 -730.4 -706.7 0.5813 0.0499 0.4832 66.1972 0.1909 -358.6 -339.0 0.0140 0.0393 0.5241 72.8571 0.2159 -291.0 -271.5 127 0.5574 0.0396 0.4578 71.8310 0.1660 -730.1 -706.3 0.5835 0.0404 0.4850 67.6056 0.1916 -358.4 -338.7 0.0138 0.0381 0.5159 72.8571 0.2125 -292.1 -272.6 128 0.5530 0.0432 0.4541 71.1268 0.1647 -731.3 -707.5 0.5832 0.0446 0.4848 66.1972 0.1916 -358.4 -338.7 0.0139 0.0388 0.5202 72.8571 0.2143 -291.6 -272.0 139 0.5521 0.0415 0.4534 71.1268 0.1644 -731.5 -707.7 0.5844 0.0429 0.4858 66.1972 0.1920 -358.2 -338.6 0.0142 0.0391 0.5314 72.8571 0.2189 -290.0 -270.5 1510 0.5521 0.0416 0.4534 71.1268 0.1644 -731.5 -707.7 0.5844 0.0430 0.4858 66.1972 0.1919 -358.2 -338.6 0.0142 0.0391 0.5310 72.8571 0.2187 -290.1 -270.5 15x 0.5570 0.0430 0.4574 71.1268 0.1659 -730.2 -706.5 0.5781 0.0442 0.4806 66.6197 0.1899 -359.0 -339.4 0.0139 0.0385 0.5205 73.2857 0.2144 -291.5 -272.0 16.0σx 0.0067 0.0030 0.0055 0.3320 1.9879e-3 1.7012 1.7012 0.0125 0.0034 0.0104 0.6803 4.1011e-3 1.5946 1.5946 0.0002 0.0009 0.0073 0.9642 2.9985e-3 9.9605e-1 9.9605e-1 8.18

Conf.− 0.5515 0.0405 0.4529 70.8564 0.1642 -731.6 -707.8 0.5679 0.0414 0.4721 66.0656 0.1865 -360.3 -340.7 0.0138 0.0378 0.5145 72.5003 0.2120 -292.3 -272.8 9.3Conf.+ 0.5624 0.0454 0.4619 71.3972 0.1675 -728.8 -705.1 0.5883 0.0469 0.4891 67.1739 0.1932 -357.7 -338.1 0.0141 0.0392 0.5264 74.0711 0.2168 -290.7 -271.2 22.7

3-5-1

1 0.4389 0.0347 0.3604 76.7606 0.1307 -724.3 -621.3 0.5156 0.0360 0.4286 70.4225 0.1693 -327.3 -242.1 0.0117 0.0293 0.4378 87.1429 0.1803 -263.8 -179.0 182 0.4522 0.0378 0.3713 78.1690 0.1346 -720.0 -617.0 0.4861 0.0376 0.4041 73.2394 0.1597 -331.5 -246.3 0.0130 0.0338 0.4879 82.8571 0.2010 -256.1 -171.3 123 0.4357 0.0347 0.3578 77.4648 0.1298 -725.3 -622.3 0.4893 0.0371 0.4067 71.8310 0.1607 -331.0 -245.8 0.0128 0.0326 0.4793 81.4286 0.1974 -257.4 -172.5 274 0.4242 0.0338 0.3484 77.4648 0.1263 -729.2 -626.1 0.5040 0.0370 0.4190 73.2394 0.1655 -328.9 -243.7 0.0110 0.0284 0.4125 88.5714 0.1699 -268.0 -183.2 245 0.4425 0.0405 0.3634 76.7606 0.1318 -723.1 -620.1 0.5050 0.0419 0.4198 71.8310 0.1659 -328.8 -243.6 0.0109 0.0286 0.4084 87.1429 0.1682 -268.7 -183.9 156 0.4296 0.0373 0.3528 75.3521 0.1279 -727.4 -624.3 0.5198 0.0431 0.4321 67.6056 0.1707 -326.7 -241.5 0.9624 0.0261 0.3600 87.1429 0.1483 -277.7 -192.9 297 0.4570 0.0363 0.3753 77.4648 0.1361 -718.5 -615.5 0.5251 0.0368 0.4365 69.0141 0.1725 -325.9 -240.8 0.0110 0.0294 0.4129 85.7143 0.1701 -268.0 -183.1 138 0.4762 0.0419 0.3911 75.3521 0.1418 -712.6 -609.6 0.5229 0.0411 0.4347 67.6056 0.1718 -326.2 -241.1 0.0111 0.0301 0.4142 84.2857 0.1706 -267.7 -182.9 119 0.3823 0.0347 0.3140 76.7606 0.1139 -744.0 -641.0 0.5125 0.0465 0.4260 70.4225 0.1683 -327.7 -242.5 0.9205 0.0241 0.3443 90.0000 0.1418 -280.9 -196.0 2810 0.4458 0.0320 0.3661 78.1690 0.1327 -722.1 -619.0 0.4912 0.0327 0.4083 73.2394 0.1613 -330.8 -245.6 0.0130 0.0318 0.4864 82.8571 0.2003 -256.3 -171.5 16x 0.4384 0.0364 0.3601 76.9718 0.1306 -724.7 -621.6 0.5072 0.0390 0.4216 70.8451 0.1666 -328.5 -243.3 0.1978 0.0294 0.4244 85.7143 0.1748 -266.5 -181.6 19.3σx 0.0246 0.0031 0.0202 0.9987 7.3246e-3 8.2732 8.2732 0.0144 0.0041 0.0120 2.2071 4.7263e-3 2.0534 2.0534 0.3921 0.0029 0.0497 2.7766 2.0484e-2 8.4602 8.4602 7.02

Conf.− 0.4184 0.0339 0.3436 76.1584 0.1246 -731.4 -628.4 0.4954 0.0357 0.4118 69.0473 0.1627 -330.2 -245.0 0.1216 0.0270 0.3839 83.4526 0.1581 -273.4 -188.5 13.6Conf.+ 0.4585 0.0389 0.3765 77.7853 0.1365 -717.9 -614.9 0.5189 0.0423 0.4313 72.6428 0.1704 -326.8 -241.6 0.5171 0.0318 0.4649 87.9760 0.1915 -259.6 -174.7 25.0

3-10-1

1 0.4532 0.0321 0.3722 77.4648 0.1350 -669.7 -467.6 0.5134 0.0332 0.4267 69.0141 0.1686 -277.6 -110.5 0.0113 0.0297 0.4229 85.7143 0.1742 -216.3 -49.9 112 0.4250 0.0350 0.3490 75.3521 0.1266 -678.9 -476.8 0.5222 0.0412 0.4341 67.6056 0.1715 -276.3 -109.2 0.9175 0.0259 0.3432 84.2857 0.1414 -231.1 -64.7 193 0.4303 0.0329 0.3534 76.0563 0.1281 -677.1 -475.0 0.5305 0.0369 0.4410 73.2394 0.1742 -275.2 -108.1 0.9484 0.0256 0.3548 85.7143 0.1461 -228.7 -62.3 184 0.4450 0.0353 0.3655 75.3521 0.1325 -672.3 -470.2 0.5235 0.0377 0.4352 69.0141 0.1719 -276.2 -109.1 0.0101 0.0275 0.3784 84.2857 0.1559 -224.1 -57.7 145 0.4427 0.0358 0.3636 76.7606 0.1318 -673.0 -470.9 0.5168 0.0381 0.4296 71.8310 0.1697 -277.1 -110.0 0.0101 0.0266 0.3781 84.2857 0.1558 -224.2 -57.8 126 0.4341 0.0321 0.3565 76.0563 0.1293 -675.9 -473.8 0.5228 0.0361 0.4346 71.8310 0.1717 -276.3 -109.2 0.9623 0.0271 0.3600 82.8571 0.1483 -227.7 -61.3 127 0.4358 0.0322 0.3579 75.3521 0.1298 -675.3 -473.2 0.5341 0.0361 0.4440 70.4225 0.1754 -274.7 -107.6 0.0101 0.0267 0.3783 84.2857 0.1558 -224.2 -57.8 118 0.4173 0.0326 0.3427 75.3521 0.1243 -681.5 -479.4 0.5270 0.0403 0.4381 69.0141 0.1731 -275.7 -108.6 0.9095 0.0255 0.3402 85.7143 0.1401 -231.7 -65.3 139 0.3894 0.0306 0.3198 77.4648 0.1160 -691.4 -489.3 0.5522 0.0442 0.4590 70.4225 0.1814 -272.3 -105.2 0.8471 0.0238 0.3169 84.2857 0.1305 -236.8 -70.4 1510 0.4384 0.0317 0.3601 76.0563 0.1306 -674.5 -472.3 0.5373 0.0351 0.4467 73.2394 0.1765 -274.3 -107.2 0.9680 0.0265 0.3621 85.7143 0.1492 -227.3 -60.9 11x 0.4311 0.0330 0.3541 76.1268 0.1284 -677.0 -474.9 0.5280 0.0379 0.4389 70.5634 0.1734 -275.6 -108.5 0.5595 0.0265 0.3635 84.7143 0.1497 -227.2 -60.8 13.6σx 0.0179 0.0018 0.0147 0.8431 5.3066e-3 6.0819 6.0819 0.0112 0.0032 0.0094 1.9300 3.7091e-3 1.5216 1.5216 0.4737 0.0015 0.0287 0.9642 1.1823e-2 5.5417 5.5417 2.91

Conf.− 0.4166 0.0316 0.3421 75.4400 0.1241 -681.9 -479.8 0.5188 0.0353 0.4313 68.9913 0.1704 -276.8 -109.7 0.1736 0.0252 0.3401 83.9289 0.1401 -231.7 -65.3 11.2Conf.+ 0.4457 0.0344 0.3660 76.8135 0.1327 -672.0 -469.9 0.5371 0.0405 0.4465 72.1355 0.1764 -274.3 -107.2 0.9453 0.0277 0.3868 85.4997 0.1594 -222.7 -56.3 16.0

RE

SU

LTA

DO

SE

XP

ER

IME

NTA

ISC

OM

AS

RE

DE

SN

EU

RA

ISA

RT

IFIC

IAIS

210

Tabela D.3: Resultados experimentais para a previsao da serie de Medidas de Brilhos de uma Estrela utilizando RNAs. Paratodas as medidas de desempenho sao calculadas as suas medias (x), desvios padroes (σx) e intervalos de confianca com umerro de 1% (limite inferior – Conf−; e limite superior – Conf+). Em negrito e destacada a melhor inicializacao.


3-1-1

1 0.0234 0.0007 0.0605 76.85 3.3887e-3 -2487.1 -2458.9 0.0256 0.0009 0.0658 73.65 3.7031e-3 -1220.5 -1196.4 0.0237 0.0009 0.0641 73.65 3.3790e-3 -1232.0 -1208.0 452 0.0234 0.0007 0.0605 76.85 3.3882e-3 -2487.1 -2458.9 0.0256 0.0009 0.0658 73.65 3.7029e-3 -1220.5 -1196.4 0.0237 0.0009 0.0640 73.65 3.3773e-3 -1232.1 -1208.0 343 0.0234 0.0007 0.0605 76.85 3.3883e-3 -2487.1 -2458.9 0.0256 0.0009 0.0658 73.65 3.7033e-3 -1220.5 -1196.4 0.0237 0.0009 0.0640 73.65 3.3769e-3 -1232.1 -1208.1 224 0.0234 0.0007 0.0605 76.85 3.3881e-3 -2487.1 -2458.9 0.0256 0.0009 0.0658 73.65 3.7032e-3 -1220.5 -1196.4 0.0237 0.0009 0.0640 73.65 3.3770e-3 -1232.1 -1208.1 125 0.0234 0.0007 0.0605 76.85 3.3882e-3 -2487.1 -2458.9 0.0256 0.0009 0.0658 73.65 3.7028e-3 -1220.5 -1196.5 0.0237 0.0009 0.0640 73.65 3.3776e-3 -1232.1 -1208.0 476 0.0234 0.0007 0.0605 76.85 3.3882e-3 -2487.1 -2458.9 0.0256 0.0009 0.0658 73.65 3.7028e-3 -1220.5 -1196.5 0.0237 0.0009 0.0640 73.65 3.3776e-3 -1232.1 -1208.0 557 0.0234 0.0007 0.0606 76.85 3.3887e-3 -2487.1 -2458.9 0.0256 0.0009 0.0658 73.65 3.7031e-3 -1220.5 -1196.4 0.0237 0.0009 0.0641 73.65 3.3790e-3 -1232.0 -1208.0 438 0.0234 0.0007 0.0605 76.85 3.3882e-3 -2487.1 -2458.9 0.0256 0.0009 0.0658 73.65 3.7028e-3 -1220.5 -1196.5 0.0237 0.0009 0.0640 73.65 3.3776e-3 -1232.1 -1208.0 509 0.0234 0.0007 0.0605 76.85 3.3881e-3 -2487.1 -2458.9 0.0256 0.0009 0.0658 73.65 3.7033e-3 -1220.5 -1196.4 0.0237 0.0009 0.0640 73.65 3.3769e-3 -1232.1 -1208.1 1410 0.0234 0.0007 0.0605 76.85 3.3882e-3 -2487.1 -2458.9 0.0256 0.0009 0.0658 73.65 3.7028e-3 -1220.5 -1196.5 0.0237 0.0009 0.0640 73.65 3.3776e-3 -1232.1 -1208.0 49x 0.0234 0.0007 0.0605 76.85 3.3883e-3 -2487.1 -2458.9 0.0256 0.0009 0.0658 73.65 3.7030e-3 -1220.5 -1196.4 0.0237 0.0009 0.0640 73.65 3.3777e-3 -1232.1 -1208.0 37.1σx 0.0000 0.0000 0.0000 0.0000 2.2336e-7 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 2.1318e-7 0.0000 0.0516 0.0000 0.0000 4.2e-5 0.0000 7.6920e-7 0.0422 0.0483 15.72

Conf.− 0.0234 0.0007 0.0605 76.85 3.3881e-3 -2487.1 -2458.9 0.0256 0.0009 0.0658 73.65 3.7028e-3 -1220.5 -1196.5 0.0237 0.0009 0.0640 73.65 3.3770e-3 -1232.1 -1208.1 24.29Conf.+ 0.0234 0.0007 0.0605 76.85 3.3885e-3 -2487.1 -2458.9 0.0256 0.0009 0.0658 73.65 3.7032e-3 -1220.5 -1196.4 0.0237 0.0009 0.0641 73.65 3.3783e-3 -1232.0 -1208.0 49.91

3-5-1

1 0.0229 0.0006 0.0592 76.85 3.3111e-3 -2454.0 -2331.8 0.0251 0.0009 0.0646 74.32 3.6364e-3 -1183.2 -1079.1 0.0235 0.0010 0.0635 72.97 3.3500e-3 -1193.3 -1089.2 1252 0.0232 0.0006 0.0598 76.85 3.3489e-3 -2450.6 -2328.4 0.0254 0.0009 0.0654 73.65 3.6836e-3 -1181.3 -1077.1 0.0235 0.0010 0.0635 72.97 3.3518e-3 -1193.2 -1089.1 233 0.0231 0.0006 0.0597 76.85 3.3422e-3 -2451.2 -2329.0 0.0252 0.0009 0.0649 73.65 3.6547e-3 -1182.4 -1078.3 0.0234 0.0010 0.0632 72.97 3.3357e-3 -1193.9 -1089.8 594 0.0231 0.0006 0.0596 76.85 3.3339e-3 -2452.0 -2329.8 0.0255 0.0009 0.0655 73.65 3.6897e-3 -1181.0 -1076.9 0.0235 0.0010 0.0637 72.97 3.3618e-3 -1192.8 -1088.6 155 0.0233 0.0006 0.0602 76.85 3.3669e-3 -2449.0 -2326.8 0.0255 0.0009 0.0657 73.65 3.6969e-3 -1180.7 -1076.6 0.0236 0.0009 0.0639 73.65 3.3690e-3 -1192.4 -1088.3 356 0.0233 0.0007 0.0602 76.85 3.3679e-3 -2448.9 -2326.7 0.0254 0.0009 0.0654 73.65 3.6797e-3 -1181.4 -1077.3 0.0236 0.0009 0.0638 73.65 3.3642e-3 -1192.6 -1088.5 137 0.0228 0.0006 0.0588 76.85 3.2911e-3 -2455.8 -2333.6 0.0249 0.0009 0.0641 74.32 3.6060e-3 -1184.4 -1080.3 0.0235 0.0010 0.0635 73.65 3.3509e-3 -1193.2 -1089.1 1368 0.0231 0.0006 0.0598 76.85 3.3448e-3 -2451.0 -2328.8 0.0253 0.0009 0.0651 73.65 3.6623e-3 -1182.1 -1078.0 0.0234 0.0010 0.0633 72.97 3.3387e-3 -1193.8 -1089.7 139 0.0232 0.0006 0.0599 76.85 3.3517e-3 -2450.4 -2328.2 0.0256 0.0009 0.0658 73.65 3.7031e-3 -1180.5 -1076.4 0.0236 0.0010 0.0638 72.97 3.3659e-3 -1192.6 -1088.5 1510 0.0231 0.0006 0.0596 76.85 3.3365e-3 -2451.7 -2329.5 0.0255 0.0009 0.0656 73.65 3.6956e-3 -1180.8 -1076.7 0.0236 0.0010 0.0640 72.97 3.3757e-3 -1192.1 -1088.0 20x 0.0231 0.0006 0.0597 76.85 3.3395e-3 -2451.5 -2329.3 0.0253 0.0009 0.0652 73.78 3.6708e-3 -1181.8 -1077.7 0.0235 0.0010 0.0636 73.17 3.3564e-3 -1193.0 -1088.9 45.4σx 0.0002 3.2e-5 0.0004 0.0000 2.3616e-5 2.1183 2.1182 0.0002 0.0000 0.0005 0.2825 3.1008e-5 1.2524 1.2570 7.9e-5 0.0000 0.0003 0.3285 1.3105e-5 0.5915 0.5959 47.06

Conf.− 0.0230 5.8424e-4 0.0593 76.85 3.3203e-3 -2453.2 -2331.0 0.0252 0.0009 0.0648 73.55 3.6455e-3 -1182.8 -1078.7 0.0235 0.0010 0.0634 72.90 3.3457e-3 -1193.5 -1089.4 7.07Conf.+ 0.0232 6.3576e-4 0.0600 76.85 3.3587e-3 -2449.7 -2327.5 0.0255 0.0009 0.0656 74.01 3.6961e-3 -1180.6 -1076.6 0.0236 0.0010 0.0638 73.44 3.3670e-3 -1192.5 -1088.4 83.73

3-10-1

1 0.0232 0.0006 0.0600 76.85 3.3574e-3 -2399.9 -2160.1 0.0255 0.0009 0.0655 73.65 3.6879e-3 -1131.1 -926.9 0.0235 0.0010 0.0637 72.97 3.3603e-3 -1142.8 -938.6 182 0.0231 0.0006 0.0595 76.85 3.3322e-3 -2402.1 -2162.4 0.0253 0.0009 0.0650 74.32 3.6590e-3 -1132.2 -928.0 0.0235 0.0010 0.0636 72.97 3.3521e-3 -1143.2 -939.0 543 0.0230 0.0006 0.0595 76.85 3.3271e-3 -2402.6 -2162.8 0.0254 0.0009 0.0653 74.32 3.6754e-3 -1131.6 -927.4 0.0236 0.0010 0.0638 72.97 3.3629e-3 -1142.7 -938.5 654 0.0233 0.0007 0.0602 76.85 3.3715e-3 -2398.6 -2158.9 0.0256 0.0009 0.0658 73.65 3.7033e-3 -1130.5 -926.3 0.0236 0.0009 0.0640 73.65 3.3747e-3 -1142.2 -938.0 175 0.0232 0.0006 0.0599 76.85 3.3512e-3 -2400.4 -2160.7 0.0253 0.0009 0.0652 73.65 3.6697e-3 -1131.8 -927.6 0.0234 0.0010 0.0634 72.97 3.3418e-3 -1143.6 -939.4 326 0.0231 0.0006 0.0597 76.85 3.3384e-3 -2401.6 -2161.8 0.0252 0.0009 0.0649 73.65 3.6522e-3 -1132.5 -928.3 0.0233 0.0010 0.0632 72.97 3.3319e-3 -1144.1 -939.9 357 0.0229 0.0006 0.0591 76.85 3.3057e-3 -2404.5 -2164.8 0.0250 0.0009 0.0642 74.32 3.6141e-3 -1134.1 -929.9 0.0234 0.0010 0.0634 72.97 3.3419e-3 -1143.6 -939.4 1498 0.0229 0.0006 0.0591 76.85 3.3096e-3 -2404.2 -2164.4 0.0251 0.0009 0.0647 74.32 3.6401e-3 -1133.0 -928.8 0.0235 0.0010 0.0637 72.97 3.3616e-3 -1142.8 -938.6 1229 0.0230 0.0006 0.0594 76.85 3.3226e-3 -2403.0 -2163.3 0.0252 0.0009 0.0648 74.32 3.6460e-3 -1132.8 -928.6 0.0234 0.0010 0.0634 72.97 3.3444e-3 -1143.5 -939.3 9810 0.0233 0.0006 0.0601 76.85 3.3624e-3 -2399.4 -2159.7 0.0255 0.0009 0.0656 73.65 3.6934e-3 -1130.9 -926.7 0.0235 0.0010 0.0637 72.97 3.3620e-3 -1142.7 -938.5 26x 0.0231 0.0006 0.0597 76.85 3.3378e-3 -2401.6 -2161.9 0.0253 0.0009 0.0651 73.99 3.6641e-3 -1132.1 -927.6 0.0235 0.0010 0.0636 73.04 3.3534e-3 -1443.1 -938.9 61.5σx 0.0001 3.2e-5 0.0004 0.0000 2.2379e-5 2.0150 2.0058 0.0002 0.0000 0.0005 0.3531 2.7268e-5 1.0947 1.0947 9.5e-5 0.0000 0.0002 0.2150 1.3100e-5 0.5750 0.5750 46.45


RE

SU

LTA

DO

SE

XP

ER

IME

NTA

ISC

OM

AS

RE

DE

SN

EU

RA

ISA

RT

IFIC

IAIS

211

Tabela D.4: Resultados experimentais para a previsao da serie do Indice Dow Jones Industrial Average utilizando RNAs.Para todas as medidas de desempenho sao calculadas as suas medias (x), desvios padroes (σx) e intervalos de confianca comum erro de 1% (limite inferior – Conf−; e limite superior – Conf+). Em negrito e destacada a melhor inicializacao.


3-1-1

1 0.0674 0.0019 0.9842 50.1412 1.1465e-2 -5165.6 -5132.2 0.0848 0.0015 0.9940 45.8924 5.0697e-2 -2491.6 -2462.3 0.0831 0.0038 0.9924 46.7422 3.4035e-2 -2499.1 -2469.9 112 0.0685 0.0020 1.0009 50.1412 1.1659e-2 -5153.6 -5120.3 0.0849 0.0015 0.9942 46.4589 5.0705e-2 -2491.5 -2462.3 0.0828 0.0039 0.9899 46.1756 3.3949e-2 -2500.0 -2470.7 133 0.0705 0.0019 1.0291 50.5650 1.1988e-2 -5133.9 -5100.5 0.0850 0.0015 0.9954 45.3258 5.0765e-2 -2491.1 -2461.9 0.0840 0.0038 1.0033 46.7422 3.4408e-2 -2495.2 -2466.0 114 0.0670 0.0019 0.9789 50.5650 1.1402e-2 -5169.4 -5136.1 0.0855 0.0015 1.0013 45.3258 5.1068e-2 -2489.0 -2459.8 0.0838 0.0038 1.0009 47.0255 3.4327e-2 -2496.0 -2466.8 155 0.0681 0.0019 0.9952 50.5650 1.1593e-2 -5157.7 -5124.3 0.0850 0.0015 0.9962 45.3258 5.0808e-2 -2490.8 -2461.6 0.0827 0.0037 0.9878 46.7422 3.3877e-2 -2500.7 -2471.5 126 0.0670 0.0019 0.9789 50.5650 1.1402e-2 -5169.4 -5136.1 0.0855 0.0015 1.0013 45.3258 5.1069e-2 -2489.0 -2459.8 0.0838 0.0038 1.0009 47.0255 3.4328e-2 -2496.0 -2466.8 187 0.0674 0.0019 0.9843 50.5650 1.1465e-2 -5165.5 -5132.1 0.0848 0.0015 0.9941 45.3258 5.0700e-2 -2491.5 -2462.3 0.0830 0.0038 0.9912 47.0255 3.3995e-2 -2499.5 -2470.3 118 0.0670 0.0019 0.9789 50.5650 1.1403e-2 -5169.4 -5136.0 0.0854 0.0015 1.0008 45.3258 5.1042e-2 -2489.2 -2459.9 0.0839 0.0038 1.0026 47.0255 3.4384e-2 -2495.5 -2466.2 129 0.0673 0.0019 0.9831 50.5650 1.1451e-2 -5166.4 -5133.0 0.0850 0.0015 0.9958 45.6091 5.0789e-2 -2490.9 -2461.7 0.0845 0.0039 1.0098 46.7422 3.4634e-2 -2492.9 -2463.7 1210 0.0670 0.0019 0.9788 50.5650 1.1401e-2 -5169.5 -5136.1 0.0855 0.0015 1.0021 45.3258 5.1110e-2 -2488.7 -2459.5 0.0838 0.0038 1.0007 47.0255 3.4320e-2 -2496.1 -2466.9 15x 0.0677 0.0019 0.9892 50.4802 1.1523e-2 -5162.1 -5128.7 0.0851 0.0015 0.9975 45.5241 5.0875e-2 -2490.3 -2461.1 0.0835 0.0038 0.9979 46.8272 3.4226e-2 -2497.1 -2467.9 13.0σx 0.0011 0.0000 0.0159 0.1787 1.8562e-4 11.2650 11.2650 0.0003 0.0000 0.0034 0.3789 1.7423e-4 1.2111 1.2111 0.0006 5.6765e-5 0.0072 0.2687 2.4548e-4 2.5388 2.5388 2.31

Conf.− 0.0668 0.0019 0.9763 50.3347 1.1372e-2 -5171.2 -5137.9 0.0849 0.0015 0.9947 45.2155 5.0733e-2 -2491.3 -2462.1 0.0831 3.7638e-3 0.9921 46.6083 3.4026e-2 -2499.2 -2469.9 11.12Conf.+ 0.0686 0.0019 1.0022 50.6258 1.1674e-2 -5152.9 -5119.5 0.0854 0.0015 1.0003 45.8327 5.1017e-2 -2489.3 -2460.1 0.0840 3.8562e-3 1.0038 47.0461 3.4426e-2 -2495.0 -2465.8 14.88

3-5-1

1 0.0670 0.0019 0.9784 50.7062 1.1397e-2 -5129.7 -4985.1 0.0850 0.0015 0.9963 45.6091 5.0814e-2 -2450.7 -2324.1 0.0841 0.0038 1.0047 46.4589 3.4457e-2 -2454.7 -2328.1 112 0.0677 0.0019 0.9884 50.4237 1.1513e-2 -5122.6 -4977.9 0.0847 0.0015 0.9919 45.6091 5.0590e-2 -2452.3 -2325.7 0.0840 0.0038 1.0038 47.0255 3.4426e-2 -2455.0 -2328.4 113 0.0673 0.0019 0.9838 50.5650 1.1460e-2 -5125.9 -4981.2 0.0848 0.0015 0.9935 45.3258 5.0669e-2 -2451.8 -2325.2 0.0832 0.0038 0.9941 46.7422 3.4092e-2 -2458.5 -2331.9 114 0.0707 0.0021 1.0325 50.7062 1.2027e-2 -5091.6 -4946.9 0.0849 0.0015 0.9950 45.0425 5.0745e-2 -2451.2 -2324.6 0.0861 0.0041 1.0285 47.3088 3.5274e-2 -2446.4 -2319.8 115 0.0667 0.0019 0.9736 50.5650 1.1341e-2 -5133.2 -4988.6 0.0862 0.0015 1.0099 45.6091 5.1506e-2 -2446.0 -2319.4 0.0853 0.0039 1.0189 47.0255 3.4943e-2 -2449.8 -2323.1 146 0.0673 0.0019 0.9825 50.1412 1.1445e-2 -5126.8 -4982.1 0.0854 0.0015 1.0006 45.6091 5.1033e-2 -2449.2 -2322.6 0.0850 0.0039 1.0153 46.1756 3.4821e-2 -2451.0 -2324.4 667 0.0671 0.0019 0.9804 50.5650 1.1420e-2 -5128.4 -4983.7 0.0850 0.0015 0.9954 45.3258 5.0768e-2 -2451.1 -2324.5 0.0833 0.0038 0.9959 46.7422 3.4155e-2 -2457.8 -2331.2 158 0.0674 0.0019 0.9848 50.5650 1.1472e-2 -5125.1 -4980.5 0.0848 0.0015 0.9935 45.3258 5.0669e-2 -2451.8 -2325.2 0.0829 0.0038 0.9910 46.7422 3.3988e-2 -2459.6 -2333.0 119 0.0659 0.0019 0.9629 50.0000 1.1216e-2 -5141.1 -4996.5 0.0854 0.0015 1.0005 45.8924 5.1028e-2 -2449.3 -2322.7 0.0851 0.0039 1.0163 46.4589 3.4855e-2 -2450.6 -2324.0 4210 0.0671 0.0019 0.9808 50.5650 1.1425e-2 -5128.0 -4983.4 0.0852 0.0015 0.9986 45.3258 5.0927e-2 -2450.0 -2323.4 0.0846 0.0039 1.0113 46.7422 3.4682e-2 -2452.4 -2325.8 17x 0.0674 0.0019 0.9848 50.4802 1.1472e-2 -5125.2 -4980.6 0.0851 0.0015 0.9975 45.4674 5.0875e-2 -2450.3 -2323.7 0.0844 0.0039 1.0080 46.7422 3.4569e-2 -2453.6 -2327.0 20.9σx 0.0012 0.0000 0.0182 0.2326 2.1182e-4 12.8880 12.8880 0.0004 0.0000 0.0053 0.2407 2.6820e-4 1.8607 1.8607 0.0010 0.0001 0.0122 0.3271 4.1693e-4 4.2683 4.2683 18.46


3-10-1


Conf.− 0.0663 0.0019 0.9693 50.3207 1.1291e-2 -5086.4 -4802.7 0.0851 0.0015 0.9967 45.4199 5.0831e-2 -2400.6 -2152.3 0.0841 3.8030e-3 1.0043 46.7505 3.4443e-2 -2404.9 -2156.5 12.56Conf.+ 0.0670 0.0019 0.9786 50.6680 1.1399e-2 -5079.6 -4795.9 0.0857 0.0015 1.0042 46.0816 5.1217e-2 -2398.0 -2149.6 0.0851 3.9170e-3 1.0163 47.1305 3.4854e-2 -2400.6 -2152.3 20.04

RE

SU

LTA

DO

SE

XP

ER

IME

NTA

ISC

OM

AS

RE

DE

SN

EU

RA

ISA

RT

IFIC

IAIS

212

Tabela D.5: Resultados experimentais para a previsao da serie do Indice Nasdaq utilizando RNAs. Para todas as medidasde desempenho sao calculadas as suas medias (x), desvios padroes (σx) e intervalos de confianca com um erro de 1% (limiteinferior – Conf−; e limite superior – Conf+). Em negrito e destacada a melhor inicializacao.


3-1-1

1 0.0002 2.6785e-5 0.8849 60.7932 1.7467e-4 -54544.8 -54500.7 0.0004 9.0041e-6 0.9795 58.8599 8.1251e-4 -26035.2 -25995.3 0.0028 3.3755e-5 1.4777 52.7791 4.4072e-3 -22089.3 -22049.4 5002 0.0002 2.6791e-5 0.8849 60.7932 1.7467e-4 -54544.8 -54500.7 0.0004 8.9693e-6 0.9746 58.8599 8.0843e-4 -26045.8 -26005.8 0.0027 3.2376e-5 1.4146 52.7791 4.2191e-3 -22181.1 -22141.2 4793 0.0002 2.6780e-5 0.8849 60.7932 1.7468e-4 -54544.8 -54500.7 0.0004 9.0327e-6 0.9835 58.8599 8.1585e-4 -26026.5 -25986.6 0.0029 3.4883e-5 1.5293 52.7791 4.5610e-3 -22017.0 -21977.1 5004 0.0002 2.6783e-5 0.8849 60.7932 1.7467e-4 -54544.8 -54500.7 0.0004 9.0136e-6 0.9809 58.8599 8.1362e-4 -26032.3 -25992.4 0.0028 3.4130e-5 1.4949 52.7791 4.4584e-3 -22064.9 -22025.0 5005 0.0002 2.6785e-5 0.8849 60.7932 1.7467e-4 -54544.8 -54500.7 0.0004 9.0051e-6 0.9797 58.8599 8.1263e-4 -26034.9 -25995.0 0.0028 3.3794e-5 1.4795 52.7791 4.4125e-3 -22086.7 -22046.8 5006 0.0002 2.6785e-5 0.8849 60.7932 1.7467e-4 -54544.8 -54500.7 0.0004 9.0024e-6 0.9793 58.8599 8.1231e-4 -26035.7 -25995.8 0.0028 3.3688e-5 1.4747 52.7791 4.3981e-3 -22093.6 -22053.7 5007 0.0004 7.1267e-5 1.3091 60.7932 2.5839e-4 -52895.6 -52851.5 0.0018 3.0952e-5 4.0425 59.1924 3.3532e-3 -23049.8 -23009.9 0.0884 0.0010 47.1960 52.8741 1.4076e-1 -14794.5 -14754.6 108 0.0002 2.6784e-5 0.8849 60.7932 1.7467e-4 -54544.8 -54500.7 0.0004 9.0079e-6 0.9801 58.8599 8.1296e-4 -26034.0 -25994.1 0.0028 3.3907e-5 1.4847 52.7791 4.4280e-3 -22079.4 -22039.4 5009 0.0002 2.6782e-5 0.8849 60.7932 1.7467e-4 -54544.8 -54500.7 0.0004 9.0189e-6 0.9816 58.8599 8.1424e-4 -26030.7 -25990.8 0.0028 3.4341e-5 1.5045 52.7791 4.4872e-3 -22051.4 -22011.5 50010 0.0002 2.6787e-5 0.8849 60.7932 1.7467e-4 -54544.8 -54500.7 0.0004 8.9895e-6 0.9775 58.8599 8.1080e-4 -26039.6 -25999.7 0.0027 3.3177e-5 1.4513 52.7791 4.3283e-3 -22127.3 -22087.4 500x 0.0002 3.1233e-5 0.9273 60.7932 1.8304e-4 -54379.9 -54335.8 0.0006 1.1200e-5 1.2859 58.8931 1.0667e-3 -25736.4 -25696.5 0.0113 0.0001 6.0507 52.7886 8.1565e-4 -21358.5 -21318.6 448.9σx 0.0000 1.4067e-5 0.1341 0.0000 2.6474e-5 521.53 521.53 0.0004 6.9404e-6 0.9686 0.1052 8.0341e-4 9.4400e2 9.4400e2 0.0271 0.0003 14.4570 0.0300 9.4846e-6 2.3068e3 2.3068e3 154.35

Conf.− 0.0002 1.9775e-5 0.8181 60.7932 1.6148e-4 -54804.7 -54760.6 0.0002 5.5463e-6 0.4970 58.8075 4.1224e-4 -26505.4 -26465.5 0.0107 9.1848e-5 5.7252 52.7641 8.0792e-4 -23237.5 -23197.6 323.17Conf.+ 0.0002 4.2691e-5 1.0366 60.7932 2.0461e-4 -53955.1 -53911.0 0.0009 1.6853e-5 2.0749 58.9788 1.7211e-3 -24967.5 -24927.6 0.0334 3.7929e-4 17.8267 52.8131 8.2337e-4 -19479.5 -19439.6 574.63

3-5-1

1 0.0002 2.6860e-5 0.8968 60.8169 1.7702e-4 -54448.5 -54257.5 0.0005 9.5200e-6 1.0501 58.7648 8.7108e-4 -25848.6 -25675.6 0.0054 6.4811e-5 2.9006 52.6841 8.6509e-3 -20628.9 -20455.9 142 0.0002 2.6640e-5 0.8863 60.7694 1.7494e-4 -54498.4 -54307.4 0.0004 8.8823e-6 0.9602 58.5748 7.9650e-4 -26037.1 -25864.1 0.0042 4.8946e-5 2.2209 53.0641 6.6236e-3 -21191.3 -21018.3 133 0.0014 0.0002 5.1768 60.8169 1.0218e-3 -47064.6 -46873.6 0.0004 9.2439e-6 0.9973 58.7648 8.2725e-4 -25957.3 -25784.3 0.0168 0.0002 8.9664 52.9216 2.6742e-2 -18252.2 -18079.2 124 0.0002 2.6715e-5 0.8846 60.8169 1.7462e-4 -54506.1 -54315.2 0.0004 9.0884e-6 0.9902 58.5748 8.2140e-4 -25972.2 -25799.3 0.0029 3.5576e-5 1.5579 52.9216 4.6463e-3 -21938.0 -21765.0 3715 0.0002 2.6654e-5 0.8845 60.8169 1.7458e-4 -54506.9 -54316.0 0.0004 8.8730e-6 0.9599 58.4798 7.9621e-4 -26037.9 -25864.9 0.0028 3.3244e-5 1.4704 53.0166 4.3853e-3 -22059.8 -21886.8 2566 0.0002 2.6614e-5 0.8843 60.7932 1.7454e-4 -54508.0 -54317.0 0.0004 8.8125e-6 0.9516 58.5748 7.8935e-4 -26056.1 -25883.1 0.0022 2.6988e-5 1.1728 53.0641 3.4977e-3 -22536.0 -22363.1 2307 0.0002 2.6726e-5 0.8846 60.7932 1.7462e-4 -54506.2 -54315.2 0.0004 9.0741e-6 0.9885 58.8124 8.1995e-4 -25976.0 -25803.0 0.0029 3.5020e-5 1.5327 52.8741 4.5713e-3 -21972.3 -21799.3 1548 0.0002 2.6629e-5 0.8876 60.8407 1.7519e-4 -54492.3 -54301.3 0.0004 8.9433e-6 0.9716 59.0974 8.0596e-4 -26012.2 -25839.2 0.0067 7.6983e-5 3.5577 52.8741 1.0611e-2 -20198.9 -20025.9 159 0.0002 2.6715e-5 0.8846 60.8169 1.7461e-4 -54506.2 -54315.2 0.0004 9.0521e-6 0.9849 58.6223 8.1700e-4 -25983.6 -25810.6 0.0027 3.3566e-5 1.4652 52.7791 4.3699e-3 -22067.2 -21894.2 17010 0.0002 2.6583e-5 0.8843 60.7932 1.7455e-4 -54507.8 -54316.8 0.0005 1.0120e-5 1.1402 58.7648 9.4584e-4 -25675.2 -25502.2 0.0272 0.0003 14.5123 52.8741 4.3282e-2 -17238.1 -17065.1 17x 0.0004 3.9543e-5 1.3154 60.8074 2.5965e-4 -53754.5 -53563.5 0.0004 9.1610e-6 0.9995 58.7031 8.2905e-4 -25955.6 -25782.6 0.0074 8.5464e-5 3.9357 52.9074 1.1738e-2 -20808.3 -20635.3 125.2σx 0.0004 4.0670e-5 1.3567 0.0200 2.6779e-4 2350.7 2350.7 4.21637e-5 3.9577e-7 0.0567 0.1778 4.7074e-5 114.63 114.63 0.0082 9.2480e-5 4.3789 0.1207 1.3058e-2 1782.5 1782.5 130.37

Conf.− 1.0900e-5 6.3035e-7 0.2103 60.7911 4.1515e-5 -55669.2 -55478.3 3.8566e-4 8.8386e-6 0.9532 58.5582 7.9071e-4 -26049.0 -25876.0 6.9652e-4 1.1230e-5 0.3689 52.8090 1.1002e-3 -22260.2 -22087.3 19.01Conf.+ 6.2910e-4 8.8658e-5 2.4206 60.8237 4.7778e-4 -51839.8 -51648.8 4.5434e-4 9.4833e-6 1.0457 58.8479 8.6740e-4 -25862.2 -25689.3 1.4063e-2 1.5980e-4 7.5025 53.0057 2.2376e-2 -19356.3 -19183.3 231.39

3-10-1

1 0.0002 2.6726e-5 0.8846 60.7932 1.7461e-4 -54456.3 -54081.7 0.0004 9.0906e-6 0.9908 58.8599 8.2191e-4 -25920.9 -25581.7 0.0029 3.5766e-5 1.5669 52.8741 4.6733e-3 -21875.8 -21536.5 982 0.0002 2.6726e-5 0.8847 60.8169 1.7462e-4 -54456.1 -54081.5 0.0004 9.0074e-6 0.9790 58.8124 8.1209e-4 -25946.3 -25607.0 0.0027 3.2784e-5 1.4320 52.7316 4.2709e-3 -22065.4 -21726.1 993 0.0002 2.6735e-5 0.8847 60.8169 1.7462e-4 -54456.1 -54081.5 0.0004 9.0640e-6 0.9872 59.0024 8.1890e-4 -25928.7 -25589.4 0.0029 3.4770e-5 1.5217 52.7791 4.5383e-3 -21937.5 -21598.3 4524 0.0002 2.6733e-5 0.8847 60.8169 1.7462e-4 -54456.1 -54081.5 0.0004 9.0476e-6 0.9848 58.9074 8.1688e-4 -25933.9 -25594.6 0.0028 3.4007e-5 1.4866 52.7316 4.4336e-3 -21986.7 -21647.4 305 0.0002 2.6726e-5 0.8846 60.8169 1.7461e-4 -54456.3 -54081.7 0.0004 8.9983e-6 0.9778 58.7173 8.1106e-4 -25948.9 -25609.6 0.0028 3.3597e-5 1.4706 52.6841 4.3858e-3 -22009.5 -21670.2 166 0.0002 2.6735e-5 0.8847 60.7932 1.7462e-4 -54456.1 -54081.5 0.0004 9.0968e-6 0.9918 58.9549 8.2268e-4 -25919.0 -25579.7 0.0032 3.8442e-5 1.6936 52.7791 5.0510e-3 -21712.1 -21372.8 277 0.0002 2.6736e-5 0.8846 60.8644 1.7461e-4 -54456.4 -54081.8 0.0004 9.0942e-6 0.9917 59.1449 8.2260e-4 -25919.2 -25579.9 0.0030 3.6116e-5 1.5833 52.8741 4.7221e-3 -21853.9 -21514.6 1198 0.0002 2.6733e-5 0.8846 60.8169 1.7461e-4 -54456.4 -54081.8 0.0004 9.0575e-6 0.9863 58.9074 8.1816e-4 -25930.6 -25591.3 0.0028 3.4536e-5 1.5108 52.8266 4.5059e-3 -21952.6 -21613.3 1209 0.0002 2.6670e-5 0.8845 60.8169 1.7459e-4 -54456.7 -54082.1 0.0004 8.8310e-6 0.9539 58.5273 7.9130e-4 -26000.9 -25661.6 0.0021 2.6569e-5 1.1460 53.0641 3.4178e-3 -22534.7 -22195.4 18410 0.0002 2.6717e-5 0.8845 60.8169 1.7459e-4 -54456.8 -54082.2 0.0004 9.0825e-6 0.9896 58.6698 8.2091e-4 -25923.5 -25584.2 0.0029 3.5093e-5 1.5353 52.7791 4.5789e-3 -21918.8 -21579.5 60x 0.0002 2.6724e-5 0.8846 60.8169 1.7461e-4 -54456.3 -54081.7 0.0004 9.0370e-6 0.9833 58.8504 8.1565e-4 -25937.2 -25597.9 0.0028 3.4168e-5 1.4947 52.8124 4.4578e-3 -21984.7 -21645.4 120.5σx 0.0000 1.9862e-8 0.0001 0.0194 1.1547e-8 2.6148e-1 2.6148e-1 0.0000 8.0160e-8 0.0114 0.1775 9.4846e-6 24.744 24.744 0.0003 3.0909e-6 0.1420 0.1075 4.2347e-4 2.1615e2 2.1615e2 127.54

Conf.− 0.0002 2.6708e-5 0.8846 60.8011 1.7460e-4 -54456.5 -54081.9 0.0004 8.9717e-6 0.9740 58.7058 8.0792e-4 -25957.3 -25618.1 0.0026 3.1650e-5 1.3790 52.7248 4.1128e-3 -22160.8 -21821.5 16.61Conf.+ 0.0002 2.6740e-5 0.8847 60.8327 1.7462e-4 -54456.1 -54081.5 0.0004 9.1023e-6 0.9926 58.9949 8.2337e-4 -25917.0 -25577.7 0.0030 3.6686e-5 1.6103 52.8999 4.8027e-3 -21808.6 -21469.3 224.39

RE

SU

LTA

DO

SE

XP

ER

IME

NTA

ISC

OM

AS

RE

DE

SN

EU

RA

ISA

RT

IFIC

IAIS

213

Tabela D.6: Resultados experimentais para a previsao da serie do Indice S&P500 utilizando RNAs. Para todas as medidasde desempenho sao calculadas as suas medias (x), desvios padroes (σx) e intervalos de confianca com um erro de 1% (limiteinferior – Conf−; e limite superior – Conf+). Em negrito e destacada a melhor inicializacao.


3-1-1

1 0.0114 0.0048 0.9713 51.6484 1.1549e-2 -1650.2 -1624.9 0.0429 0.0007 2.8387 50.5495 8.2048e-2 -701.3 -680.1 0.0117 0.0128 112.7405 50.0000 8.9459e-1 -393.1 -372.0 132 0.0114 0.0048 0.9710 52.1978 1.1546e-2 -1650.2 -1625.0 0.0509 0.0009 3.3638 50.5495 9.7223e-2 -685.7 -664.5 0.0137 0.0150 132.0439 50.0000 1.0478 -378.7 -357.6 113 0.0113 0.0049 0.9693 51.6484 1.1525e-2 -1650.6 -1625.3 0.1404 0.0023 9.2777 50.5495 2.6816e-1 -592.3 -571.2 0.0312 0.0347 301.7119 50.0000 2.3941 -303.5 -282.4 144 0.0114 0.0048 0.9728 51.6484 1.1567e-2 -1649.9 -1624.6 0.0247 0.0004 1.6351 50.5495 4.7259e-2 -752.0 -730.9 0.6248 0.0068 60.3974 50.0000 4.7925e-1 -449.9 -428.8 155 0.0116 0.0050 0.9914 51.6484 1.1787e-2 -1646.4 -1621.2 0.0143 0.0003 0.9456 50.5495 2.7330e-2 -802.4 -781.3 0.0104 0.0001 1.0068 50.0000 7.9886e-3 -822.4 -801.4 106 0.0114 0.0048 0.9728 51.6484 1.1567e-2 -1649.9 -1624.6 0.0248 0.0004 1.6399 50.5495 4.7398e-2 -751.8 -730.6 0.6267 0.0069 60.5844 50.0000 4.8073e-1 -449.6 -428.5 167 0.0114 0.0050 0.9735 52.1978 1.1575e-2 -1649.8 -1624.5 0.0320 0.0006 2.1184 50.5495 6.1227e-2 -728.2 -707.1 0.8704 0.0095 84.1414 50.0000 6.6766e-1 -419.7 -398.6 118 0.1025 0.0195 8.7634 52.7473 1.0420e-1 -1247.6 -1222.4 0.1388 0.0024 9.1756 52.7473 2.6520e-1 -593.3 -572.2 0.0512 0.0567 495.0729 54.4444 3.9284 -258.4 -237.4 99 0.0115 0.0046 0.9850 52.1978 1.1711e-2 -1647.6 -1622.4 0.0598 0.0010 3.9550 50.5495 1.1431e-1 -670.8 -649.6 0.0146 0.0161 141.4013 50.0000 1.1220 -372.5 -351.4 1110 0.0115 0.0047 0.9850 51.6484 1.1711e-2 -1647.6 -1622.4 0.0242 0.0004 1.5979 50.5495 4.6185e-2 -754.1 -733.0 0.4866 0.0053 47.0358 50.0000 3.7323e-1 -472.6 -451.6 15x 0.0205 0.0063 1.7556 51.9231 2.0874e-2 -1609.0 -1583.7 0.0553 0.0009 3.6548 50.7692 1.0563e-1 -703.2 -682.1 0.2741 0.0164 143.6136 50.4444 1.1396 -432.0 -411.0 12.5σx 0.0288 0.0046 2.4623 0.3885 2.9278e-2 126.97 126.97 0.0465 0.0008 3.0733 0.6950 8.8829e-2 69.547 69.547 0.3384 0.0170 147.8101 1.4055 1.1729 152.54 152.54 2.42

Conf.− 0.0029 0.0025 0.2501 51.6067 2.9746e-3 -1712.4 -1687.2 0.0174 0.0003 1.1514 50.2032 3.3278e-2 -759.8 -738.7 0.0015 0.0026 23.2149 49.2996 0.1842 -556.3 -535.2 10.53Conf.+ 0.0440 0.0101 3.7612 52.2396 4.4722e-2 -1505.5 -1480.3 0.0932 0.0016 6.1581 51.3354 1.7799e-1 -646.5 -625.4 0.5497 0.0302 264.0124 51.5892 2.0949 -307.8 -286.7 14.47

3-5-1

1 0.0149 0.0075 1.2761 51.6484 1.5172e-2 -1560.3 -1450.8 0.0308 0.0005 2.0355 50.5495 5.8832e-2 -691.9 -600.3 0.7787 0.0085 75.2725 50.0000 0.5973 -389.8 -298.6 102 0.0194 0.0036 1.6591 51.6484 1.9726e-2 -1512.2 -1402.8 0.0300 0.0005 1.9850 50.5495 5.7371e-2 -694.2 -602.6 0.8746 0.0095 84.5456 47.7778 0.6709 -379.3 -288.0 93 0.0550 0.0172 4.7065 51.6484 5.5960e-2 -1321.4 -1212.0 0.0784 0.0013 5.1855 50.5495 1.4988e-1 -605.8 -514.3 0.0247 0.0274 239.0152 52.2222 1.8966 -284.7 -193.4 104 0.0369 0.0157 3.1537 53.2967 3.7497e-2 -1394.7 -1285.2 0.0696 0.0012 4.6030 50.5495 1.3304e-1 -616.8 -525.2 0.7131 0.0080 68.9327 50.0000 0.5470 -397.8 -306.6 95 0.0114 0.0048 0.9740 51.6484 1.1581e-2 -1609.7 -1500.2 0.0180 0.0003 1.1908 50.5495 3.4417e-2 -741.2 -649.6 0.3583 0.0039 34.6317 48.8889 0.2748 -460.5 -369.2 106 0.0114 0.0047 0.9746 51.6484 1.1587e-2 -1609.6 -1500.1 0.0149 0.0003 0.9830 50.5495 2.8412e-2 -758.8 -667.3 0.1910 0.0021 18.4607 50.0000 0.1465 -517.7 -426.4 237 0.0976 0.0204 8.3506 51.0989 9.9287e-2 -1216.5 -1107.0 0.0563 0.0012 3.7232 47.2527 1.0761e-1 -636.3 -544.8 0.5079 0.0054 49.0955 50.0000 0.3896 -428.7 -337.4 98 0.0193 0.0037 1.6494 51.6484 1.9612e-2 -1513.3 -1403.8 0.0287 0.0005 1.8952 49.4505 5.4776e-2 -698.4 -606.9 0.3375 0.0037 32.6204 50.0000 0.2588 -465.9 -374.6 109 0.0125 0.0053 1.0667 51.6484 1.2683e-2 -1593.0 -1483.6 0.0934 0.0015 6.1728 47.2527 1.7841e-1 -589.8 -498.2 0.0258 0.0286 249.4562 48.8889 1.9794 -280.8 -189.5 1110 0.1151 0.0278 9.8465 52.1978 1.1707e-1 -1186.3 -1076.9 0.0288 0.0005 1.9048 50.5495 5.5054e-2 -698.0 -606.4 0.9285 0.0102 89.7509 48.8889 0.7122 -373.8 -282.5 9x 0.0394 0.0111 3.3657 51.8132 4.0018e-2 -1451.7 -1342.2 0.0449 0.0008 2.9679 49.7802 8.5780e-2 -673.1 -581.6 0.4740 0.0107 94.1781 49.6667 0.7473 -397.9 -306.6 11.0σx 0.0381 0.0086 3.2598 0.5821 3.8759e-2 161.62 161.62 0.0275 0.0005 1.8150 1.3755 5.2458e-2 57.764 57.764 0.3388 0.0095 82.5274 1.1771 0.6549 75.553 75.553 4.27

Conf.− 0.0083 0.0041 0.7104 51.3391 8.4467e-3 -1583.3 -1473.9 0.0225 0.0004 1.4895 48.6598 4.3050e-2 -720.2 -628.6 0.1980 0.0030 26.9554 48.7079 0.2139 -459.4 -368.2 7.52Conf.+ 0.0704 0.0181 6.0210 52.2873 7.1588e-2 -1320.1 -1210.6 0.0672 0.0012 4.4463 50.9007 1.2851e-1 -626.1 -534.5 0.7500 0.0185 161.4008 50.6254 1.2807 -336.4 -245.1 14.48

3-10-1

1 0.0129 0.0058 1.1043 51.6484 1.3130e-2 -1536.7 -1322.0 0.0157 0.0003 1.0358 50.5495 2.9938e-2 -704.0 -524.4 0.0452 0.0005 4.3658 50.0000 3.4642e-2 -598.9 -419.9 92 0.0114 0.0047 0.9743 51.6484 1.1584e-2 -1559.6 -1344.9 0.0146 0.0003 0.9637 50.5495 2.7854e-2 -710.7 -531.1 0.1619 0.0018 15.6483 48.8889 1.2417e-1 -482.8 -303.7 113 0.0114 0.0047 0.9755 51.6484 1.1598e-2 -1559.4 -1344.7 0.0140 0.0003 0.9264 50.5495 2.6777e-2 -714.3 -534.7 0.0845 0.0009 8.1712 50.0000 6.4838e-2 -541.9 -362.8 134 0.0114 0.0047 0.9754 51.6484 1.1597e-2 -1559.4 -1344.7 0.0141 0.0003 0.9289 50.5495 2.6848e-2 -714.0 -534.4 0.1189 0.0013 11.4938 50.0000 9.1203e-2 -510.9 -331.8 105 0.0118 0.0045 1.0075 51.6484 1.1979e-2 -1553.5 -1338.8 0.0171 0.0003 1.1328 50.5495 3.2741e-2 -695.8 -516.2 0.1615 0.0018 15.6101 50.0000 1.2387e-1 -483.0 -303.9 106 0.0157 0.0079 1.3400 51.6484 1.5932e-2 -1501.3 -1286.6 0.0324 0.0006 2.1403 50.5495 6.1861e-2 -637.3 -457.6 0.3560 0.0040 34.4127 48.8889 2.7306e-1 -411.1 -232.0 97 0.0112 0.0046 0.9605 52.1978 1.1420e-2 -1562.2 -1347.5 0.0145 0.0003 0.9604 48.3516 2.7757e-2 -711.0 -531.4 0.0095 0.0001 0.9166 51.1111 7.2728e-3 -741.0 -561.9 898 0.0115 0.0051 0.9804 51.6484 1.1657e-2 -1558.5 -1343.8 0.0928 0.0016 6.1366 50.5495 1.7737e-1 -540.4 -360.7 0.0223 0.0246 215.5730 52.2222 1.7106 -244.1 -65.0 119 0.0114 0.0047 0.9771 51.6484 1.1617e-2 -1559.1 -1344.4 0.0140 0.0003 0.9231 50.5495 2.6680e-2 -714.6 -535.0 0.0505 0.0005 4.8828 50.0000 3.8745e-2 -588.8 -409.7 2110 0.0114 0.0048 0.9741 51.6484 1.1582e-2 -1559.7 -1345.0 0.0178 0.0003 1.1790 50.5495 3.4076e-2 -692.1 -512.5 0.3240 0.0035 31.3190 50.0000 2.4851e-1 -419.6 -240.6 12x 0.0120 0.0052 1.0269 51.7033 1.2210e-2 -1550.9 -1336.3 0.0247 0.0004 1.6327 50.3297 4.7190e-2 -683.4 -503.8 0.1334 0.0039 34.2393 50.1111 0.2717 -502.2 -323.1 19.5σx 0.0014 0.0011 0.1175 0.1738 1.3973e-3 18.912 18.912 0.0246 0.0004 1.6245 0.6950 4.6955e-2 55.398 55.398 0.1213 0.0074 64.6741 0.9729 0.5132 132.50 132.50 24.67

Conf.− 0.0109 0.0043 0.9312 51.5618 1.1071e-2 -1566.3 -1351.6 0.0047 0.0001 0.3094 49.7636 8.9428e-3 -728.5 -548.9 0.0346 0.0021 18.4410 49.3187 0.1463 -610.1 -431.1 0.59Conf.+ 0.0131 0.0060 1.1226 51.8449 1.3348e-2 -1535.5 -1320.8 0.0447 0.0008 2.9560 50.8959 8.5438e-2 -638.3 -458.7 0.2322 0.0099 86.9197 50.9036 0.6897 -394.3 -215.2 39.59

RE

SU

LTA

DO

SE

XP

ER

IME

NTA

ISC

OM

AS

RE

DE

SN

EU

RA

ISA

RT

IFIC

IAIS

214

Tabela D.7: Resultados experimentais para a previsao da serie do Valor de Fechamento das Acoes da Petrobras utilizandoRNAs. Para todas as medidas de desempenho sao calculadas as suas medias (x), desvios padroes (σx) e intervalos de confiancacom um erro de 1% (limite inferior – Conf−; e limite superior – Conf+). Em negrito e destacada a melhor inicializacao.


3-1-1


Conf.− 0.0161 0.0008 0.9862 47.8235 4.6608e-3 -9091.0 -9055.3 0.0654 0.0007 9.7410 54.4231 3.3561e-2 -3812.6 -3781.1 0.1475 0.0016 23.4482 51.4451 1.3806 -3383.2 -3351.7 12.52Conf.+ 0.0161 0.0008 0.9863 47.8730 4.6612e-3 -9090.9 -9055.2 0.0743 0.0008 11.0639 54.4231 3.8119e-2 -3738.7 -3707.2 0.1691 0.0018 26.8838 51.4451 1.5829 -3303.2 -3271.7 17.28

3-5-1


Conf.− 0.0131 0.0007 0.8046 47.8252 3.8028e-3 -9161.0 -9006.3 0.0440 0.0005 6.5509 53.7573 2.2570e-2 -4017.6 -3881.0 0.0858 0.0009 13.6443 51.6242 0.8033 -3859.0 -3722.4 11.05Conf.+ 0.0247 0.0011 1.5187 48.1017 7.1778e-3 -8688.8 -8534.2 0.0731 0.0008 10.8897 54.2427 3.7519e-2 -3692.5 -3555.9 0.1741 0.0019 27.6847 52.6918 1.6300 -3144.2 -3007.6 12.55

3-10-1


Conf.− 0.0024 0.0001 0.1514 48.1062 7.1545e-4 -9233.8 -8930.4 0.0336 0.0004 5.0029 53.8579 1.7237e-2 -4086.5 -3818.4 0.0531 0.0006 8.4417 51.6783 0.4970 -3998.6 -3730.6 8.94Conf.+ 0.0709 0.0035 4.3507 48.3395 2.0562e-2 -7970.1 -7666.7 0.0583 0.0007 8.6805 54.2960 2.9907e-2 -3776.6 -3508.6 0.1272 0.0013 20.2239 52.2523 1.1907 -3303.7 -3035.8 15.86

RE

SU

LTA

DO

SE

XP

ER

IME

NTA

ISC

OM

AS

RE

DE

SN

EU

RA

ISA

RT

IFIC

IAIS

215

Tabela D.8: Resultados experimentais para a previsao da serie Random Walk utilizando RNAs. Para todas as medidas dedesempenho sao calculadas as suas medias (x), desvios padroes (σx) e intervalos de confianca com um erro de 1% (limiteinferior – Conf−; e limite superior – Conf+). Em negrito e destacada a melhor inicializacao.


3-1-1


Conf.− 0.1175 0.0043 0.9599 45.2109 2.8795e-2 -3353.3 -3322.0 0.1305 0.0032 0.9982 52.2645 9.0544e-2 -1641.7 -1614.6 0.1266 0.0027 1.0087 48.5712 4.6417e-2 -1644.8 -1617.7 10.53Conf.+ 0.1288 0.0050 1.0524 45.4317 3.1569e-2 -3310.0 -3278.7 0.1322 0.0032 1.0110 52.5742 9.1709e-2 -1638.5 -1611.4 0.1753 0.0032 1.3961 48.8481 6.4246e-2 -1573.7 -1546.6 14.87

3-5-1


Conf.− 0.1196 0.0044 0.9771 44.8760 2.9310e-2 -3305.6 -3170.1 0.1305 0.0032 0.9980 52.2108 9.0530e-2 -1601.7 -1484.3 0.1323 0.0028 1.0539 48.7128 4.8500e-2 -1598.3 -1480.8 7.32Conf.+ 0.1216 0.0047 0.9932 45.3649 2.9795e-2 -3297.5 -3162.0 0.1318 0.0032 1.0080 53.1925 9.1441e-2 -1599.2 -1481.8 0.1380 0.0028 1.0991 49.2710 5.0580e-2 -1587.9 -1470.4 23.88

3-10-1

1 0.1207 0.0045 0.9859 45.3815 2.9576e-2 -3251.1 -2985.3 0.1315 0.0032 1.0054 52.0161 9.1197e-2 -1549.9 -1319.5 0.1326 0.0028 1.0559 48.7903 4.8592e-2 -1547.8 -1317.4 112 0.1203 0.0045 0.9831 45.3815 2.9491e-2 -3252.5 -2986.7 0.1314 0.0032 1.0050 52.0161 9.1161e-2 -1550.0 -1319.6 0.1355 0.0028 1.0793 48.7903 4.9670e-2 -1542.4 -1312.0 103 0.1196 0.0045 0.9773 44.1767 2.9317e-2 -3255.5 -2989.7 0.1303 0.0032 0.9965 51.6129 9.0393e-2 -1552.1 -1321.7 0.1277 0.0027 1.0170 48.7903 4.6801e-2 -1557.2 -1326.8 194 0.1196 0.0046 0.9769 44.1767 2.9306e-2 -3255.7 -2989.8 0.1302 0.0032 0.9959 51.6129 9.0336e-2 -1552.3 -1321.9 0.1267 0.0027 1.0087 48.7903 4.6421e-2 -1559.2 -1328.8 535 0.1213 0.0048 0.9912 44.5783 2.9733e-2 -3248.5 -2982.6 0.1305 0.0032 0.9980 53.6290 9.0527e-2 -1551.7 -1321.3 0.1307 0.0027 1.0407 49.1935 4.7894e-2 -1551.4 -1321.0 126 0.1193 0.0045 0.9746 43.7751 2.9237e-2 -3256.9 -2991.0 0.1302 0.0032 0.9953 52.0161 9.0281e-2 -1552.4 -1322.0 0.1290 0.0027 1.0272 49.1935 4.7271e-2 -1554.7 -1324.3 647 0.1200 0.0045 0.9802 45.1807 2.9404e-2 -3254.0 -2988.2 0.1316 0.0032 1.0061 53.2258 9.1262e-2 -1549.7 -1319.3 0.1344 0.0028 1.0703 49.1935 4.9254e-2 -1544.4 -1314.1 248 0.1201 0.0045 0.9814 45.3815 2.9440e-2 -3253.4 -2987.6 0.1320 0.0032 1.0092 53.6290 9.1548e-2 -1548.9 -1318.5 0.1345 0.0028 1.0713 49.1935 4.9298e-2 -1544.2 -1313.8 119 0.1204 0.0045 0.9834 44.3775 2.9500e-2 -3252.4 -2986.5 0.1308 0.0032 1.0005 52.0161 9.0755e-2 -1551.1 -1320.7 0.1418 0.0029 1.1294 49.5968 5.1975e-2 -1531.1 -1300.7 1310 0.1200 0.0045 0.9804 45.3815 2.9411e-2 -3253.9 -2988.1 0.1319 0.0032 1.0085 52.8226 9.1483e-2 -1549.1 -1318.7 0.1354 0.0028 1.0780 48.7903 4.9610e-2 -1542.7 -1312.3 13x 0.1201 0.0045 0.9815 44.7791 2.9442e-2 -3253.4 -2987.5 0.1310 0.0032 1.0020 52.4597 9.0894e-2 -1550.7 -1320.3 0.1328 0.0028 1.0578 49.0323 4.8679e-2 -1547.5 -1317.1 23.0σx 0.0006 0.0001 0.0048 0.6279 1.4413e-4 2.4402 2.4402 0.0007 0.0000 0.0054 0.7940 4.9050e-4 1.3438 1.3438 0.0045 6.7495e-5 0.0360 0.2819 1.6552e-3 8.4179 8.4179 19.37

Conf.− 0.1197 0.0045 0.9775 44.2677 2.9324e-2 -3255.4 -2989.5 0.1305 0.0032 0.9976 51.8129 9.0495e-2 -1551.8 -1321.4 0.1292 0.0027 1.0285 48.8026 4.7330e-2 -1554.4 -1324.0 7.22Conf.+ 0.1206 0.0046 0.9854 45.2905 2.9559e-2 -3251.4 -2985.6 0.1316 0.0032 1.0064 53.1064 9.1294e-2 -1549.6 -1319.2 0.1365 0.0028 1.0871 49.2619 5.0027e-2 -1540.7 -1310.3 38.78

APENDICE E

ESTRUTURAS DE CONEXOES PARA OS MELHORES

INDIVIDUOS DO SISTEMA HIBRIDO INTELIGENTE

— ALGORITMO GENETICO MODIFICADO COM

REDES NEURAIS ARTIFICIAIS

Neste Apendice sao expostas as estruturas de conexoes assumidas pelos melhores in-

divıduos eleitos pelo sistema hıbrido inteligente — Algoritmo Genetico Modificado com-

binado com as Rede Neurais Artificiais.

Todos os indivıduos gerados nos experimentos com o sistema hıbrido inteligente sao

Rede Neurais Artificiais de tres camadas contendo conexoes entre a primeira e a segunda

camada, e conexoes entre a segunda e terceira camada. Contudo devido ao processo de

poda realizado pelo Algoritmo Genetico, tais conexoes podem ou nao existir. Desta forma,

a arquitetura das RNAs sao representadas por duas matrizes de conexoes: a primeira para

o conjunto de conexoes entre a camada de entrada e a camada intermediaria, e a segunda

para o conjunto de conexoes entre a camada intermediaria e a camada de saıda da rede.

Cada elemento dessas matrizes de conexoes representa uma dada conexao, onde o

valor 0 significa que a conexao esta inativa o valor 1 significa que a conexao esta ativa.

Cada linha destas matrizes esta relacionada com um neuronio da camada de partida da

conexao e cada coluna com um neuronio da camada final da conexao. Assim, uma rede

m−n−1 tera duas matrizes, a primeira (m+1)×n e a segunda (n+1)×1, onde a linha

adicionada nas duas matrizes e referente as conexoes relativas aos bias para cada um

dos neuronios localizados na camada final das respectivas conexoes. Portanto, a conexao

do neuronio i (localizado na camada inicial da conexao) para o neuronio j (localizado

na camada terminal da conexao) existira se o elemento ij for 1, e nao existira caso o

elemento ij seja 0.

216

E.1 MELHORES INDIVIDUOS PARA A SERIE DO MAPA DE HENON 217

E.1 MELHORES INDIVIDUOS PARA A SERIE DO MAPA DE HENON

As matrizes de conexoes para o melhor indivıduo da serie do Mapa de Henon.

Arquitetura 4-5-1

REDE 1:

1 0 1 1 1

0 0 1 1 0

1 1 1 1 0

1 0 1 1 1

1 1 1 0 1

1

0

1

0

1

0

(E.)

E.2 MELHORES INDIVIDUOS PARA A SERIE DAS MANCHAS SOLARES

As matrizes de conexoes para o melhor indivıduo da serie das Manchas Solares.

Arquitetura 3-1-1

REDE 2:

0

1

1

1

[1

1

](E.)

E.3 MELHORES INDIVIDUOS PARA A SERIE DE MEDIDAS DO BRILHO DE

UMA ESTRELA

As matrizes de conexoes para o melhor indivıduo da serie de Medidas de Brilho de uma

Estrela.

Arquitetura 3-1-1

E.4 MELHORES INDIVIDUOS PARA A SERIE DO INDICE DOW JONES INDUSTRIAL AVERAGE218

REDE 2:

1

0

1

1

[1

1

](E.)

E.4 MELHORES INDIVIDUOS PARA A SERIE DO INDICE DOW JONES IN-

DUSTRIAL AVERAGE

As matrizes de conexoes para o melhor indivıduo da serie do Indice Dow Jones Industrial

Average.

Arquitetura 3-10-1

REDE 2:

0 1 0 1 1 1 1 1 0 1

0 1 1 1 0 0 1 1 1 1

1 1 1 1 1 1 1 0 1 1

1 1 0 1 0 1 1 0 1 0

1

1

1

1

1

0

0

1

1

1

1

(E.)

E.5 MELHORES INDIVIDUOS PARA A SERIE DO INDICE NASDAQ

As matrizes de conexoes para o melhor indivıduo da serie do Indice Nasdaq.

Arquitetura 3-5-1

E.6 MELHORES INDIVIDUOS PARA A SERIE DO INDICE S&P500 219

REDE 2:

1 0 1 1 0

0 1 1 1 1

1 1 1 1 0

0 1 1 1 1

1

0

1

1

1

0

(E.)

E.6 MELHORES INDIVIDUOS PARA A SERIE DO INDICE S&P500

As matrizes de conexoes para o melhor indivıduo da serie do Indice S&P500.

Arquitetura 3-5-1

REDE 2:

1 1 1 1 1

1 1 1 1 1

1 1 0 1 1

1 0 0 0 1

1

1

1

1

1

1

(E.)

E.7 MELHORES INDIVIDUOS PARA A SERIE DO VALOR DE FECHAMENTO

DAS ACOES DA PETROBRAS

As matrizes de conexoes para o melhor indivıduo da serie do Valor de Fechamento das

Acoes da Petrobras.

E.8 MELHORES INDIVIDUOS PARA A SERIE RANDOM WALK 220

E.7.1 Arquitetura 3-10-1

REDE 2:

1 1 0 0 1 1 1 1 1 1

1 0 1 1 1 1 1 0 1 1

1 1 1 0 1 1 1 1 1 1

1 1 1 1 1 1 1 1 1 1

1

1

1

1

0

0

1

1

1

1

1

(E.)

E.8 MELHORES INDIVIDUOS PARA A SERIE RANDOM WALK

As matrizes de conexoes para o melhor indivıduo da serie Random Walk.

Arquitetura 3-10-1

REDE 2:

0 1 0 1 1 1 1 1 1 0

1 1 0 1 1 1 1 0 0 0

1 1 1 1 0 1 1 0 0 1

0 1 1 1 1 1 1 1 1 0

1

0

1

1

1

1

1

1

1

1

1

(E.)

REFERENCIAS BIBLIOGRAFICAS

[1] George E. P. Box, Gwillym M. Jenkins, and Gregory C. Reinsel. Time Series

Analysis: Forecasting and Control. Prentice Hall, New Jersey, third edition, 1994.

[2] T. Subba Rao and M. M. Gabr. Introduction to Bispectral Analysis and Bilinear

Time Series Models, volume 24 of Lecture Notes in Statistics. Springer, Berlin,

1984.

[3] M. B. Priestley. Non-Linear and Non-Stacionary time Series Analysis. Academic

Press, 1988.

[4] T. Ozaki. Nonlinear Time Series Models and Dynamical Systems, volume 5 of Hand

Books of Statistics. Noth-Holland, Amsterdam, 1985.

[5] D. E. Rumelhart and J. L. McCleland. Parallel Distributed Processing, Explorations

in the Microstructure of Cognition, volume 1 & 2. MIT Press, 1987.

[6] J. G. De Gooijer and K. Kumar. Some recent developments in non-linear time series

modelling, testing, and forecasting. International Journal of Forecasting, 8:135–156,

1992.

[7] R. F. Engle. Autoregressive conditional heteroskedasticity with estimates of the

variance of uk onflation. Econometrica, 50:987–1008, 1982.

[8] T. Bollerslev. Generalized autoregressive conditional heteroskedasticity. Journal of

Econometrics, 31:307–328, 1986.

[9] M. P. Clements, P. H. Franses, and N. R. Swanson. Forecasting economic and

financial time-seires with non-linear models. International Journal of Forecasting,

20:169–183, 2004.

[10] G. Zhang, B. Eddy Patuwo, and M. Y. Hu. Forecasting with artificial neural

networks: The state of the art. International Journal of Forecasting, 14:35–62,

1998.

221

REFERENCIAS BIBLIOGRAFICAS 222

[11] C. T. Chan, C. H. Chuek, D. P. Mital, and T. T. Huat. Time series modelling

and forecasting using genetic algorithms. In L. C. Jain, editor, First Internatio-

nal Conference on Knowledge-Based Intelligent Electronic Systems, pages 260–268,

Adelaide, 1997.

[12] Andre Neubauer. Genetic algorithms for adaptive non-linear predictors. In IEEE

International Conference on Electronics, Circuits and Systems, volume 1, pages

209–212, 1998.

[13] R. J. Povinelli and Xin Feng. A new temporal patter identification method for

characterization and prediction of complex time series events. IEEE Transactions

on Knowledge and Data Engineering, 15(2):339–352, March/April 2003.

[14] Jerry M. Mendel. Fuzzy logic systems for engineering: A tutorial. In Proceedings

of the IEEE, volume 83, pages 345–377, 1995.

[15] Suran Goonatilake and Sukhdev Khebbal. Intelligence Hybrid Systems. John Wiley

& Son, 1995.

[16] Floris Takens. Detecting strange attractor in turbulence. In A. Dold and B. Eck-

mann, editors, Dynamical Systems and Turbulence, volume 898 of Lecture Notes in

Mathematics, pages 366–381, New York, 1980. Springer-Verlag.

[17] R. Savit and M. Green. Time series and dependent variables. Physica D, 50:95–116,

1991.

[18] H. Pi and C. Peterson. Finding the embedding dimension and variable dependences

in time series. Neural Computation, 6:509–520, 1994.

[19] N. Tanaka, H. Okamoto, and M. Naito. Estimating the active dimension of the

dynamics in a time series based on a information criterion. Physica D, 158:19–31,

2001.

[20] Donald B. Percival and Andrew T. Walden. Spectral Analysis for Physical Applica-

tions – Multitaper and Conventional Univariate Techniques. Cambridge University

Press, New York, 1998.

[21] Haolger Kantz and Thomas Schreiber. Nonlinear Time Series Analysis. Cambridge

University Press, New York, NY, USA, second edition, 2003.


[22] Pedro A. Morettin. Analise Harmonica de Processos Estocasticos. IMPA - Instituto

de Matematica Pura e Aplicada, Rio de Janeiro, 1979.

[23] Pedro A. Morettin e Clelia M. Toloi. Modelos para Previsao em Series Temporias,

volume 1 e 2. IMPA - Instituto de Matematica Pura e Aplicada, Sao Paulo, 1981.

[24] Pedro A. Morettin e Clelia M. Toloi. Series Temporais. Colecao Metodos Quanti-

tativos. Atual Editora, Sao Paulo, 2sd edition, 1987.

[25] Michalem P. Clements, Philip Hans Franses, Jeremy Smith, and Dick Van Dijk.

On setar non-linearity and forecasting. Journal of Forecasting, 22(5):359–375, Aug

2003.

[26] Mitja Perus. Multi-level synergetic computation in brain. Nonlinear Phenomena

in Complex Systems, 4(2):157–193, 2001.

[27] Simon Haykin. Redes Neurais - Princıpios e Pratica. Bookman, Porto Alegre -

Brasil, 2a edition, 2002.

[28] T. Kohonen. Self-organized formation of topologically connect feature maps. Bio-

logical Cybernetics, 43:5–69, 1982.

[29] Teuvo Kohonen. Self-Organization and Associative Memory. Springer-Verlog, Ber-

lin, 1984.

[30] J. J. Hopfield. Neural networks and physical systems with emergent coletive com-

putational abilities. In Proceedings of the National Academy of the Sciences of the

U.S.A., volume 79, pages 2554–2558, 1982.

[31] G. A. Carpenter and S. Grossberg. The art of adaptive pattern recognition by a

self-organizing neural network. Computer, 21(3):77–88, March 1988.

[32] Tom M. Mitchell. Machine Learning. WCB McGraw-Hill, Boston, 1997.

[33] P. A. Braga, A. P. L. F. Carvalho, and T. B. Ludemir. Redes Neurais Artificiais:

Teoria e Aplicacoes. LTC, Rio de Janeiro, 2000.

[34] H. White. Learning in artificial neural networks: A statistical prespective. Neural

Communication, 1:425–464, 1989.

[35] B. D. Ripley. Networks and Chaos-Statistical Probabilistic Aspects. Chapman-Hall,

London, 1993.


[36] B. Cheng and D. M. Titterington. Neural networks: A review from a statistical

perspective. Statistical Science, 9(1):2–54, 1994.

[37] B. Irie and S. Miyake. Capabilities of three-layers perceptrons. In Proceedings of

the IEEE International Conference on Neural Networks, volume I, pages 641–648,

1998.

[38] K. Hornik, M. Stinchcombe, and H. White. Multilayer feedforward networks are

universal approximators. Neural Networks, 2:359–366, 1989.

[39] G. Cybenko. Approximation by superpositions of a sigmoidal function. Mathema-

tical Control Signals Systems, 2:303–314, 1989.

[40] K. Funahashi. On the approximate realization of continuos mappings by neural

networks. Neural Networks, 2:183–192, 1989.

[41] k. Hornik. Approximation capabilities of multilayer feedforward neural networks.

Neural Networks, 4:251–257, 1991.

[42] K. Hornik. Some new results on neural networks approximation. Neural Networks,

6:1069–1072, 1993.

[43] C. W. J. Granger and T. Terasvirta. Modelling Nonlinear Economic Relationships.

Oxford University Press, Oxford, 1993.

[44] J. Park and I. W. Sandberg. Approximation and radial bases functions networks.

Neural Computation, 5:305–316, 1993.

[45] C. H. Chang, S. Chen, and B. Mulgrew. Gradient radial basis function networks for

nonlinear and nonstationnary time series prediction. IEEE Transations on Neural

Networks, 7(1):190–194, 1996.

[46] J. M. Gorriz, C. G. Puntonet, M. Salmeron, and J. J. G. de la Rosa. A new model

for time-series forecasting using radial base functions and exogenous data. Neural

Comput & Application, 13:101–111, 2004.

[47] X. Zhang and A. Beveniste. Wavelet networks. IEEE Transations on Neural Net-

works, 3(6):889–898, 1992.

[48] S. P. Cristea, R. Tuduce, and A. Cristea. Time series predicting with wavenet

neural networks. In Proceedings of the 5th Seminar on Neural Network Applications

Electral Engineering – NEURAL2000, pages 5–10, 2000.


[49] Lutz Prechelt. Proben1: A set of neural network benchmark problems and bench-

marking rules. Technical Report 21/94, 1994.

[50] D. E. Rumelhart and J. L. McClelland. Parallel Distributed Processing, volume 1:

Foundations. The MIT Press, 1986.

[51] J. Sietsma and R. Dow. Neural net pruning – why and how? In Proceedings of

the IEEE International Conference on Neural Networks, volume 1, pages 325–333,

1988.

[52] E. D. Karnin. A simple procedure for pruning back-propagation trained neural net-

works. In Proceedings of the IEEE International Conference on Neural Neteworks,

volume 1, pages 239–245, 1990.

[53] Andreas S. Weigend, David E. Rumelhart, and Bernardo A. Huberman. Generali-

zation by weight-elimination with application to forecasting. In Advances in Neural

Information Processing Systems – NIPS, volume 3, pages 875–882, 1991.

[54] R. Reed. Pruning algorithms - a survey. IEEE Transactions on Neural Networks,

4(5):740–747, 1993.

[55] M. Crottel, B. Girard, Y. Girard, M. Mangeas, and C. Muller. Neural modeling for

time series: a statistical stepwise method for weight elimination. IEEE Transactions

on Neural Networks, 6(6):1355–1364, 1995.

[56] A. Roy, L. S. Kim, and S. Mukhopadhyay. A polynomial time algorithm for the

construction and training of a class of multilayer perceptron. Neural Networks,

6:535–545, 1993.

[57] Z. Wang, C. D. Massimo, M. T. Tham, and A. J. Morris. A procedure for deter-

mining the topology of multilayer feedforward neural networks. Neural Networks,

7(2):291–300, 1994.

[58] N. Murata, S. Yoshizawa, and S. Amari. Network information criterion-determining

the number of hidden units for artificial neural netework model. IEEE Transactions

on Neural Networks, 5(6):865–872, 1994.

[59] D. Srinivasan, A. C. Liew, and C. S. Chang. A neural network short-time load

forecast. Electral Power Systems Research, 28:227–234, 1994.


[60] R. P. Lippmann. An introduction to computing with neural nets. IEEE ASSP

Magazine, pages 4–22, April 1987.

[61] A. Lapedes and R. Faber. How neural nets work. In D. Z. Anderson, editor,

Neural Information Processing Systems, pages 442–456, New York, 1988. Americam

Institute of Physics.

[62] F. S. Wong. Time series forecasting using backpropagation neural networks. Neu-

rocomputing, 2:147–159, 1991.

[63] Z. Tang and P. A. Fishwick. Feedforward neural nets as models for time series

forecasting. ORSA Journal on Computing, 5(4):374–385, 1993.

[64] C. De Groot and D. Wortz. Analysis of multivariate time series with connectionist

nets: a case study of two classical examples. Neurocomputing, 3:177–192, 1991.

[65] K. Chakrabort, K. Mehrotra, C. K. Mohan, and S. Ranka. Forecasting the behavior

of multivariate of time series using neural networks. Neural Networks, 5:961–970,

1992.

[66] R. Sharda and R. B. Patil. Connectionist approach to time series prediction: An

empirical test. Journal of Intelligent Manufacturing, 3:317–323, 1992.

[67] S. T. Cheng, D. C. Yu, and A. R. Moghaddamjo. Weather sensitive short-term load

forecasting using nonfully connected artificial neural networks. In Proceedings of the

IEEE/Power Engineering Society Summer Meeting, volume 91 SM 449-8 PWRS,

1991.

[68] K. A. Duliba. Constrasting neural nets with regression in predicting performance

in the transportation industry. In Proceedings of the Annual IEEE International

Conference on Systems Sciences, volume 25, pages 163–170, 1991.

[69] D. C. Pack, M. A. El-Sharkawi, and R. J. Marks II. An adaptively trained neural

network. IEEE Transactions on Neural Networks, 2(3):334–345, 1991.

[70] D. C. Pack, M. A. El-Sharkawi, R. J. Marks II, L. E. Atlas, and M. J. Damborg.

Electric load forecasting using an artificial neural network. IEEE Transactions on

Power Systems, 6(2):442–449, 1991.

[71] R. A. Jacobs. Incresed rates of convergence through learning rate adaptation.

Neural Networks, 1(4):295–308, 1998.


[72] S. E. Fahlman. An empirical study of learning speed in backpropagation networks.

Technical report, Carnegie Mellow University, 1988.

[73] S. Falhman. Faster-learning variations of back-propagation: An empirical study.

In D. Touretzky, G. Hilton, and T. Sejnowski, editors, Proceedings of the 1998

Connectionist Models Summer School, pages 38–51, 1989.

[74] M. Reidmiller and H. Braun. A direct adaptive method for faster backpropagation

learing: The rprop algorithm. In Proceedings of the IEEE Int. Conf. on Neural

Networks (ICNN), pages 586–591, San Francisco, 1993.

[75] J. J. Mor. The levenberg-marquardt algorithm: Implementation and theory. In

G. A. Watson, editor, Numerical Analysis, volume 630 of Lecture Notes in Mathe-

matics, pages 105–116, Berlin, 1977. Springer-Verlag.

[76] M. Hagan and M. Menhaj. Training feedforward networks with the marquardt

algorithm. IEEE Transactions on Neural Networks, 5(6):989–993, November 1994.

[77] M. F. Moller. A scaled conjugate gradient algorithm for fast supervised learning.

Neural Networks, 6:525–533, 1993.

[78] R. Battiti. One step secant conjugate gradient. Neural Computation, 4:141–166,

1992.

[79] John H. Holland. Adaptation in Natural and Artificial Systems. University of

Michigan Press, Michigan, 1975.

[80] John H. Holland. Genetic algorithms. Scientific Amerian, pages 66–72, july 1992.

[81] David E. Goldberg. Genetic Algorithms in Search, Optimization, and Machine

Learning. Addison-Wesley, 1989.

[82] Stan Franklin. Artificial Minds. MIT Press, 2001.

[83] M. Mitchell. An Introduction to Genetic Algorithms. MIT Press, Canbridge, 1999.

[84] F. H. F. Leung, H. K. Lam, S. H. Ling, and P. K. S. Tam. Tuning of the structure

and parametrs of the neural network using an improved genetic algorithm. IEEE

Transactions on Neural Networks, 14(1):79–88, January 2003.

[85] D. Dasgupta. Artificial Immune System and the Applications. Springr-Verlog,

Berlin, 1999.


[86] Donald Arthur Waterman. A guide to expert systems. Addison-Wesley, 1986.

[87] Maria Carolina Monard and Jose Augusto Baranauskas. Inducao de Regras e

Arvores de Decisao, chapter 5 - Sistemas Inteligentes – Fundamentos e Aplicacoes,

pages 115–139. Mallone, Sao Paulo, 2003.

[88] M. Henon. A two-dimensional mapping with a stranger attractor. Communications

in Mathematical Physics, 50(1):69–77, 1976.

[89] Derek Y. Chan and Dan Prager. Analysis of time series by neural networks. In

IEEE International Joint Conference on Neural Networks, volume 1, pages 355–360,

1991.

[90] D. B. Murray. Forecasting a chaotic time series using an improved metric for

embedding space. Physica D, 68:318–325, 1993.

[91] Vladimir Golovko ans Yury Savitsky and Nikolay Maniakov. Modeling nonlinear

dynamic using multilayer neural networks. In IEEE International Workshop on

Intelligence Data and Advanced Computing Systems: Technology and Applications,

pages 197–202, Foros - UKraine, 2001.

[92] K. W. Lau and Q. H. Wu. Local prediction of chaotic time series based on gaussian

processes. In Proceedings of the 2002 IEEE International Conference on Control

Applications, pages 1309–1313, Glasgow, Scotland, 2002.

[93] Miomir S. Stankovic, Branimir T. Todorovic, and Bojana M. Vidojkovic. Recon-

struction of chaotic dynamics using structurally adaptive radial basis function net-

works. In IEEE 6th Seminar on Neural Network Application in Electrical Enginee-

ring - NEUREL 2002, pages 33–36, Yugoslavia, 2002.

[94] S. H. Ling, H. K. Lam, F. H. F. Leung, and Y. S. Lee. A genetic algorithm based

neural-tuned neural network. In The 29th Annual Conference of the IEEE Industrial

Eletronics Society - IECON’03, volume 3, pages 2423–2428, 2003.

[95] L. J. Cao, K. S. Chua, and L. K. Guan. Combining kpca with support vector

machine for time series forecasting. In Proceeding IEEE International Conference

on Computational Intelligence for Financial Engineering, pages 325–329, 2003.

[96] A. Sfetsos and C. Siriopoulos. Time series forecasting with a hybrid clustering

scheme and pattern recognition. IEEE Transactions on Systems, Man, and Cyber-

netics - Part A: Systems and Humans, 34(3):399–405, May 2004.


[97] H. Joseph Newton. TimesLab: A Time Series Analysis Laboratory. Stati-

stics/Probability Series. Wadsworth & Brooks/Cole, 1998.

[98] Time series data library - http://www-personal.buseco.monash.edu.au/∼hyndman/

TSDL/.

[99] M. P. Clements and D. F. Hendry. On the limitations of comparing mean square

forecast errors. Journal of Forecasting, 12(8):617–637, Dec. 1993.

[100] T. H. Hann and E. Steurer. Much ado about nothing? exchange rate forecasting:

Neural networks vs. linear models using monthly and weekly data. Neurocomputing,

10:323–339, 1996.

[101] H. Akaike. A new look at the statistical model identification. IEEE Transactions

on Automatic Control, AC-19(6):716–723, 1974.

[102] Chris Chatfield. Time Series Forecasting. Chapman & Hall/CRC, London, 2001.

[103] Renate Sitte and Joaquin Sitte. Neural networks approach to the random walk

dilemma of financial time series. Applied Intelligence, 16(3):163–171, May 2002.

[104] Tiago A. E. Ferreira, Germano C. Vasconcelos, and Paulo J. L. Adeodato. A hybrid

intelligence system approach for improving the prediction of real world time series.

In IEEE Proceedings of the Congress on Evolutionary Computation, volume 1, pages

736–743, Portland, Oregon, 2004. IEEE.

[105] Tiago A. E. Ferreira, Germano C. Vasconcelos, and Paulo J. L. Adeodato. An

ann-ga approach for automatic lag search and real world time series forecasting. In

IEEE Proceedings of the 8th Brazilian Symposium on Neural Networks, Sao Luiz,

Maranhao, 2004. IEEE.

[106] Wilton de O. Bussab and Pedro A. Morettin. Estatıstica Basica. Editora Saraiva,

Sao Paulo, 5 edition, 2004.

[107] N. Teru and H. K. Van Dijk. Combined forecasts form linear and nonlinear time

series models. Intenational Journal od Forecasting, 18:421–438, 2002.

[108] J. li and E. P. K. Tsang. Investment decision making using fgp: a case study. In

IEEE Proceedings of Congress on Evolutionary Computation, volume 2, page 1259.

IEEE, 1999.


[109] C. A. Casas. Tatical asset allocation: an artificial neural network based model. In

IJCNN’2001, volume 3, pages 1844–1816. IEEE, 2001.

[110] T. C. Mills. The Econometric Modelling of Financial Time Series. Cambridge

University Press, Cambridge, 2003.

[111] Gianna Boero and Emanuela Marrocu. The performance of non-linear exchange

rate models: a forecasting comparison. Journal of Forecasting, 21(7):513–542, Nov.

2002.

[112] Thomas M. Cover and Joy A. Thomas. Elements of Information Theory. Wiley

series in telecommunications. John Wiley, New York, 1991.

[113] Tiago A. E. Ferreira, Germano C. Vasconcelos, and Paulo J. L. Adeodato. A new

evolutionary method for times series forescasting. In ACM Proceedings of Genetic

Evolutionary Computation Conference - GECCO 2005, Washington D.C., USA,

2005. ACM.


hybrid approach for enhanced times series prediction. In Anais do XXV Congresso

da Sociedade Brasileira de Computacao, pages 831–840, Sao Leopoldo / RS, 2005.

SBC.

[115] Tiago A. E. Ferreira, Germano C. Vasconcelos, and Paulo J. L. Adeodato. Evo-

lutionary method for real-word times series prediction. In Proceedings of the 8th

Join Conference on Information Sciences (JCIS’2005) – 4th International Work-

shop on Computational Intelligence in Economics and Finance (CIEF’2005), Salt

Lake City, Utah, USA, 2005.


hybrid method for time series forecasting. In Anais do VII Congresso Brasileiro de

Redes Neurias - CBRN 2005, Natal, RN, Brasil, 2005.


intelligent methodology for times series forecasting. New Mathematics and Natural

Computation (Artigo aceito para publicacao), 2005.

[118] L. Allen and J. H. Eberly. Optical Resonance and Two-Level Atoms. Dover, New

York, 1987.


[119] Gerhard Herzberg. Atomic Spectra and Atomic Structure. Dover, New York, 1944.

[120] Claude Cohen-Tannoudji, Bernard Diu, and Franck Laloe. Quantum Mechanics,

volume 1 & 2. John Wiley & Sons, New York, 1977.

[121] J. J. Sakurai. Modern Quantum Mechanics. Addison-Wesley, Massachusetts, 1994.

[122] D. Deutsch and R. Jozsa. Rapid solution of problems by quantum computation.

In Proceedings of Royal Society of London, volume 439 of Series A, pages 553–558,

1992.

[123] Mika Hirvensolo. Quantum Computing. Natural Computing Series. Springer, second

edition edition, 2004.

[124] Nouriaki Kouda, Nobuyuki Matsui, and Haruhiko Nishimura. A multi-layered feed-

forward network based on qubit neuron model. Systems and Computers in Japan,

35(13):43–51, 2004.

[125] Nouriaki Kouda, Nobuyuki Matsui, Haruhiko Nishimura, and Ferdinand Peper. An

examination of qubit neural network in controlling an inverted pendulum. Neural

Processing Letters, 22:277–290, 2005.

[126] Domingos V. Filho, Tiago A. E. Ferreira, Teresa B. Ludermir, and Meuser J. S.

Valenca. Um modelo de previsao baseado em inteligencia artificial na gestao de

bibliotecas universitarias. In Anais do XII Seminario Nacional de Bibliotecas Uni-

versitarias - XII SNBU 2002, Recife - PE, 2002.

[127] Paulo S. G. de Mattos Neto, Gustavo G. Petry, Joao P. de M. Ataide, and Tiago

A. E. Ferreira. Combinacao de redes neurais artificiais co algoritmo genetico modi-

ficado para a previsao de series temporais. In Anais do XXV Congresso Brasileirop

de Computacao - V ENIA, pages 952–961, Sao Leopoldo -RS, 2005. SBC.

[128] Paulo S. G. de Mattos Neto, Gustavo G. Petry, Joao P. de M. Ataide, and Tiago

A. E. Ferreira. Composicao de redes neurais artificiais com algoritmo genetico mo-

dificado para a previsao de series temporais. In Anais do VII Congresso Brasileiro

de Redes Neurais - VII CBRN, Natal - RN, 2005. Sociedade Brasileira de Redes

Neurais.

uma nova metodologia h ibrida inteligente para a … · resumo nestetrabalho...

Documents