uma nova metodologia h ibrida inteligente para a … · resumo nestetrabalho...
TRANSCRIPT
Pos-graduacao em Ciencia da Computacao
UMA NOVA METODOLOGIA HIBRIDAINTELIGENTE PARA A PREVISAO DE
SERIES TEMPORAIS
Tiago Alessandro Espınola Ferreira
TESE DE DOUTORADO
Universidade Federal de [email protected]
www.cin.ufpe.br/vposgraduacao
Recife, Fevereiro/2006
Universidade Federal de Pernambuco
Centro de Informatica
Tiago Alessandro Espınola Ferreira
UMA NOVA METODOLOGIA HIBRIDA INTELIGENTE PARA APREVISAO DE SERIES TEMPORAIS
Trabalho apresentado ao Programa de Pos-graduacao em
Ciencia da Computacao do Centro de Informatica da Uni-
versidade Federal de Pernambuco como requisito parcial
para obtencao do grau de Doutor em Ciencia da Com-
putacao.
Orientador: Prof. Germano Crispim Vasconcelos
Co-orientador: Prof. Paulo Jorge Leitao Adeodato
Recife, Fevereiro/2006
A minha Famılia.
AGRADECIMENTOS
Gostaria inicialmente de agradecer a Deus e a minha famılia pelo apoio incondicional naoso durante este trabalho, mas por todo o tempo da minha existencia.
Gostaria de agradecer em especial ao Prof. Germano Crispim Vasconcelos pela suasegura orientacao. Sua experiencia e conhecimento foram de fundamental importanciano decorrer deste trabalho.
Ao Prof. Paulo Jorge Leitao Adeodato pelo apoio.
A minha querida e amada Marcia que ao meu lado dividiu minhas tristezas e multi-plicou minhas alegrias.
Aos meus colegas de sala, e acima de tudo amigos: Robson, Sergio, Paulo, Joel, Maurye Vitor. E, tambem, a todos os outros colegas do CIn que fizeram dos dias de interminaveltrabalho um excelente bem estar.
Aos funcionarios do Centro de Informatica: Rosali, Inacia, Edlene, Mario e Rodrigo,pela boa vontade, infra-estrutura e suporte.
Aos orgaos de financiamento, em especial ao CNPq, pela bolsa de estudos.
E a todos aqueles que de forma direta e indireta contribuıram para a execucao destetrabalho.
iv
The best way to predict the future is by creating it.
—PETER DRUCKER
RESUMO
Neste trabalho e realizado um estudo sistematico para a resolucao do problema de previsaode series temporais com a utilizacao de tecnicas de Inteligencia Artificial.
Inicialmente, modelos de Box & Jenkins sao aplicados para a previsao de series tem-porais para a geracao de um padrao de referencia. Sao investigadas entao tecnicas daInteligencia Artificial mais comumente encontradas na literatura, como redes neurais ar-tificiais e algoritmos geneticos, bem como um sistema hıbrido inteligente resultante dauniao destas duas tecnicas.
Observando as deficiencias e os pontos fortes das metodologias estudadas, foi desen-volvido um novo metodo para a previsao de series temporais, the Time-lag Added Evolu-tionary Forecasting (TAEF) Method, combinando redes neurais artificiais, um algoritmogenetico modificado, um mecanismo de busca evolutiva pela dimensionalidade mınimanecessaria para a reconstrucao do espaco de fase gerador da serie, e um procedimento depos-processamento para a determinacao da fase da previsao gerada.
Experimentos extensivos realizados com o Metodo TAEF com series temporais denatureza, complexidade e caracterısticas de comportamento diversificadas, comprovama eficiencia e robustez do metodo proposto. Tendo sido testado em um conjunto deoito series temporais, sendo duas series artificiais (serie do Mapa de Henon e serie Ran-dom Walk), duas de fenomenos naturais (serie das Manchas Solares e serie de Medidasde Brilho de uma Estrela) e quatro series economicas e financeiras (Indice Dow Jones,Indice Nasdaq, Indice S&P500 e Acoes da Petrobras), o metodo TAEF apresenta umdesempenho de previsao comprovadamente superior as demais tecnicas investigadas e avarios outros trabalhos encontrados na literatura. Alem deste experimentos, series artifi-ciais com caracterısticas peculiares tambem foram criadas para a certificacao da robustezdo metodo, como series de Random Walk com Drift e/ou Sazonalidade aditiva, Seriesgeradas a partir de modelos GARCH, SETAR e STAR.
Por fim, simulacoes de um sistema de apoio a decisao para a compra e venda de acoesna bolsa de valores do estado de Sao Paulo (Bovespa) sao montadas, demonstrando apossibilidade de uso pratico do metodo TAEF, consolidando-o como uma nova metodo-logia viavel e de alto desempenho para a resolucao do problema de previsao de seriestemporais.
Palavras-chave: Previsao de Series Temporais, Redes Neurais Artificiais, AlgoritmosGeneticos, Sistemas Hıbridos Inteligentes, Sistemas de Apoio a Decisao.
vi
ABSTRACT
In this work, a systematic study for the solution of the times series Forecasting problemis performed with the artificial Intelligence techniques.
Initially, Box & Jenkins models are employed for the prediction of the time seriesto establish a benchmark for model comparison. Then artificial intelligence techniqueswidely found in the literature, such as artificial neural networks and genetics Algorithmsare studies for the same purpose and a hybrid intelligent system based on the combinationof the two techniques is considered for times series forecasting.
As a result of the investigations conducted, the advantages and weaknesses of eachapproach are identified, giving insights for a more robust combination of the methods.A new methodology is created — the Time-lag Added Evolutionary Method (TAEF) —which combines artificial neural networks with a modified genetic algorithm, performsan evolutionary search for the minimum necessary dimensionality for reconstructing thephase space that generates the times series, and a post-processing procedure that carriesout a statistical test to measure the behavior of the prediction generated.
Extensive experiments conducted with the TAEF method with several time series ofdifferent natures, trends and features showed a superior performance of the proposedapproach when compared to all the other techniques previously examined and with othermethods found in the literature. For the experimental investigations carried out eighttime series were employed: two artificial series (Henon Map and Random Walk), two ofnatural phenomena (Sunspot and Star Brightness), and four financial series (Dow JonesIndustrial Average Index, S&P500 Index, Nasdaq Index and Petrobras Stock Values).
Finally, simulations of a decision support system for stock purchase and sale in the SaoPaulo Stock Market (Bovespa) was considered to demonstrate the capacity of the TAEFmethod to produce real financial returns on real market operations, consolidating theTAEF method as a feasible and high performance new methodology for the forecastingof the times series problem.
Keywords: Times Series Forecasting, Artificial Neural Network, Genetic Algorithms,Intelligent Hybrid Systems, Decision Support Systems.
vii
SUMARIO
Capıtulo 1—Introducao 1
1.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Motivacao, Justificativa e Objetivos . . . . . . . . . . . . . . . . . . . . . 5
1.3 Estrutura da Tese . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
Capıtulo 2—O Problema de Previsao de Series Temporais 10
2.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.2 Series Temporais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.3 Previsao de Series Temporais . . . . . . . . . . . . . . . . . . . . . . . . 11
2.4 Modelos Convencionais para Previsao de Series Temporais . . . . . . . . 13
2.4.1 Modelos de Box & Jenkins . . . . . . . . . . . . . . . . . . . . . . 14
2.4.1.1 Modelos Auto-Regressivos de Ordem p . . . . . . . . . . 16
2.4.1.1.1 Funcao de Auto-Correlacao para o Modelo AR(p). 16
2.4.1.2 Modelos de Medias Moveis de Ordem q . . . . . . . . . . 18
2.4.1.2.1 Funcao de Auto-Correlacao para o Modelo MA(q). 18
2.4.1.3 Modelos Mistos: Auto-Regressivos com Medias Moveis . 20
2.4.1.3.1 Funcao de Auto-Correlacao (FAC). . . . . . . . 20
2.4.1.4 Funcao de Auto-Correlacao Parcial (FACP) . . . . . . . 21
2.4.1.5 Modelos ARIMA . . . . . . . . . . . . . . . . . . . . . . 22
2.4.2 Modelos Nao-Lineares . . . . . . . . . . . . . . . . . . . . . . . . 23
Capıtulo 3—Abordagens da Inteligencia Artificial para Previsao de Series Tem-porais 29
viii
SUMARIO ix
3.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
3.2 Redes Neurais Artificiais . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
3.3 Redes Neurais Artificiais e o Problema de Previsao . . . . . . . . . . . . 31
3.3.1 Redes Neurais Perceptrons Multi-Camadas . . . . . . . . . . . . . 32
3.3.2 Projeto de uma Rede Neural Artificial . . . . . . . . . . . . . . . 35
3.3.2.1 Arquitetura da Rede . . . . . . . . . . . . . . . . . . . . 35
3.3.2.1.1 Quantidade de Entradas e Retardos Temporais. 36
3.3.2.1.2 Quantidade de Camadas Escondidas e Neuronios. 36
3.3.2.1.3 Quantidade de Saıdas. . . . . . . . . . . . . . . 38
3.3.2.2 Funcao de Ativacao . . . . . . . . . . . . . . . . . . . . . 38
3.3.2.3 Conexoes entre Neuronios . . . . . . . . . . . . . . . . . 40
3.3.2.4 Algoritmo de Treinamento . . . . . . . . . . . . . . . . . 40
3.3.2.5 Normalizacao dos Dados . . . . . . . . . . . . . . . . . . 41
3.4 Algoritmos Geneticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
3.4.1 Indivıduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
3.4.2 Funcao de Custo . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
3.4.3 Escolha de Indivıduos . . . . . . . . . . . . . . . . . . . . . . . . 45
3.4.4 Operadores Geneticos . . . . . . . . . . . . . . . . . . . . . . . . . 46
3.4.5 Algoritmos Geneticos e o Problema de Previsao . . . . . . . . . . 48
3.5 Sistemas Hıbridos Inteligentes . . . . . . . . . . . . . . . . . . . . . . . . 48
3.5.1 Algoritmos Geneticos e Redes Neurais . . . . . . . . . . . . . . . 49
Capıtulo 4—Caracterizacao das Series Temporais Utilizadas 51
4.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
4.2 Serie do Mapa de Henon . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
4.3 Serie das Manchas Solares (sunspot) . . . . . . . . . . . . . . . . . . . . 54
4.4 Serie de Medidas do Brilho de uma Estrela . . . . . . . . . . . . . . . . . 55
4.5 Serie do Indice Dow Jones Industrial Average (DJIA) . . . . . . . . . . . 57
SUMARIO x
4.6 Serie do Indice Nasdaq . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
4.7 Serie do Indice S&P500 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
4.8 Serie do Valor de Fechamento das Acoes da Petrobras . . . . . . . . . . . 63
4.9 Random Walk . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
4.9.1 O Modelo Random Walk e as Series Financeiras . . . . . . . . . . 65
4.10 Medidas de Desempenho para a Previsao . . . . . . . . . . . . . . . . . . 67
Capıtulo 5—Resultados Experimentais com Metodos Tradicionais 71
5.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
5.2 Experimentos com os Modelos de Box & Jenkins . . . . . . . . . . . . . . 72
5.2.1 Serie do Mapa de Henon . . . . . . . . . . . . . . . . . . . . . . . 72
5.2.2 Serie das Manchas Solares . . . . . . . . . . . . . . . . . . . . . . 74
5.2.3 Serie de Medidas do Brilho de uma Estrela . . . . . . . . . . . . . 75
5.2.4 Serie do Indice Dow Jones Industrial Average (DJIA) . . . . . . . 77
5.2.5 Serie do Indice Nasdaq . . . . . . . . . . . . . . . . . . . . . . . . 78
5.2.6 Serie do Indice S&P500 . . . . . . . . . . . . . . . . . . . . . . . . 79
5.2.7 Serie do Valor de Fechamento das Acoes da Petrobras . . . . . . . 81
5.2.8 Serie Random Walk . . . . . . . . . . . . . . . . . . . . . . . . . . 82
5.3 Experimentos com Redes Neurais Artificiais do Tipo MLP . . . . . . . . 83
5.3.1 Serie do Mapa de Henon . . . . . . . . . . . . . . . . . . . . . . . 85
5.3.2 Series das Manchas Solares . . . . . . . . . . . . . . . . . . . . . . 87
5.3.3 Serie de Medidas do Brilho de uma Estrela . . . . . . . . . . . . . 89
5.3.4 Serie do Indice Dow Jones Industrial Average . . . . . . . . . . . 90
5.3.5 Serie do Indice Nasdaq . . . . . . . . . . . . . . . . . . . . . . . . 93
5.3.6 Serie do Indice S&P500 . . . . . . . . . . . . . . . . . . . . . . . . 95
5.3.7 Serie do Valor de Fechamento das Acoes da Petrobras . . . . . . . 97
5.3.8 Serie Random Walk . . . . . . . . . . . . . . . . . . . . . . . . . . 99
SUMARIO xi
Capıtulo 6—Combinacao de Redes Neurais Artificiais e Algoritmos Geneticospara a Previsao de Series Temporais 102
6.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
6.2 Algoritmo Genetico e Redes Neurais . . . . . . . . . . . . . . . . . . . . 103
6.3 Resultados Experimentais com o Sistema Hıbrido AG+RNA . . . . . . . 110
6.3.1 Serie do Mapa de Henon . . . . . . . . . . . . . . . . . . . . . . . 111
6.3.2 Serie das Manchas Solares . . . . . . . . . . . . . . . . . . . . . . 113
6.3.3 Serie de Medidas do Brilho de uma Estrela . . . . . . . . . . . . . 114
6.3.4 Serie do Indice Dow Jones Industrial Average . . . . . . . . . . . 115
6.3.5 Serie do Indice Nasdaq . . . . . . . . . . . . . . . . . . . . . . . . 117
6.3.6 Serie do Indice S&P500 . . . . . . . . . . . . . . . . . . . . . . . . 119
6.3.7 Serie do Valor de Fechamento das Acoes da Petrobras . . . . . . . 120
6.3.8 Serie Random Walk . . . . . . . . . . . . . . . . . . . . . . . . . . 122
Capıtulo 7—Um Novo Metodo Hıbrido Inteligente para a Previsao de SeriesTemporais 125
7.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
7.2 Uma Nova Proposta: Metodo TAEF . . . . . . . . . . . . . . . . . . . . 126
7.2.1 Experimentos Iniciais com o Metodo TAEF . . . . . . . . . . . . 129
7.2.1.1 Experimentos com a Serie do Mapa de Henon . . . . . . 130
7.2.1.2 Experimentos com a Serie das Manchas Solares . . . . . 132
7.2.1.3 Experimentos com a Serie de Medidas do Brilho de umaEstrela . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133
7.2.1.4 Experimentos com a Serie do Indice Dow Jones IndustrialAverage . . . . . . . . . . . . . . . . . . . . . . . . . . . 134
7.2.1.5 Experimentos com a Serie do Indice Nasdaq . . . . . . . 136
7.2.1.6 Experimentos com a Serie do Indice S&P500 . . . . . . . 138
7.2.1.7 Experimentos com a Serie do Valor de Fechamento dasAcoes da Petrobras . . . . . . . . . . . . . . . . . . . . . 139
SUMARIO xii
7.2.1.8 Experimentos com a Serie Random Walk . . . . . . . . . 141
7.2.2 Analise Comportamental das Series Temporais . . . . . . . . . . . 142
7.2.3 Experimentos com a Inclusao da Analise Comportamental ao MetodoTAEF . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146
7.2.3.1 Experimentos com a Serie do Mapa de Henon . . . . . . 147
7.2.3.2 Experimentos com a Serie das Manchas Solares . . . . . 148
7.2.3.3 Experimentos com a Serie de Medidas do Brilho de umaEstrela . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149
7.2.3.4 Experimentos com a Serie do Indice Dow Jones IndustrialAverage . . . . . . . . . . . . . . . . . . . . . . . . . . . 151
7.2.3.5 Experimentos com a Serie do Indice Nasdaq . . . . . . . 153
7.2.3.6 Experimentos com a Serie do Indice S&P500 . . . . . . . 155
7.2.3.7 Experimentos com a Serie do Valor de Fechamento dasAcoes da Petrobras . . . . . . . . . . . . . . . . . . . . . 156
7.2.3.8 Experimentos com a Serie Random Walk . . . . . . . . . 159
7.3 Comparacoes com Outros Trabalhos . . . . . . . . . . . . . . . . . . . . . 159
Capıtulo 8—Investigacoes Complementares ao Metodo TAEF 162
8.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162
8.2 Famılia de Series do Tipo Random Walk . . . . . . . . . . . . . . . . . . 163
8.2.1 Famılia de Series Random Walk com Drift . . . . . . . . . . . . . 163
8.2.2 Famılia de Series Random Walk com Sazonalidade Aditiva . . . . 166
8.2.3 Famılia de Series Random Walk com Drift e Sazonalidade Aditiva 168
8.3 Famılia de Series dos Modelos GARCH . . . . . . . . . . . . . . . . . . . 170
8.4 Famılia de Series dos Modelos SETAR . . . . . . . . . . . . . . . . . . . 172
8.5 Serie Gerada pelo Modelo STAR . . . . . . . . . . . . . . . . . . . . . . . 176
8.6 Comentarios sobre os Resultados . . . . . . . . . . . . . . . . . . . . . . 177
Capıtulo 9—Simulacoes de Compra e Venda de Acoes 179
SUMARIO xiii
9.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 179
9.2 Regras de Compra e Venda . . . . . . . . . . . . . . . . . . . . . . . . . . 180
9.3 Carteira de Tıtulos Utilizada . . . . . . . . . . . . . . . . . . . . . . . . . 181
9.4 Simulacao de Compra e Venda de Acoes . . . . . . . . . . . . . . . . . . 181
9.4.1 Resultados das Simulacoes . . . . . . . . . . . . . . . . . . . . . . 184
Capıtulo 10—Conclusoes 189
10.1 Conclusoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 189
10.1.1 Contribuicoes da Tese . . . . . . . . . . . . . . . . . . . . . . . . 192
10.2 Limitacoes do Trabalho . . . . . . . . . . . . . . . . . . . . . . . . . . . . 194
10.3 Trabalhos Futuros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 195
10.4 Trabalhos Publicados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 196
Apendice A—Enunciado dos Teoremas de F. Takens 198
A.1 Sistema Dinamico com um Observavel . . . . . . . . . . . . . . . . . . . 198
Apendice B—Evolucao da Populacao dos Algoritmos Geneticos 201
B.1 O Teorema dos Esquemas . . . . . . . . . . . . . . . . . . . . . . . . . . 201
Apendice C—Valores dos Coeficientes para os Modelos de Box & Jenkins 204
C.1 Serie do Mapa de Henon . . . . . . . . . . . . . . . . . . . . . . . . . . . 204
C.2 Serie das Manchas Solares . . . . . . . . . . . . . . . . . . . . . . . . . . 204
C.3 Serie de Medidas de Brilho de uma Estrela . . . . . . . . . . . . . . . . . 205
C.4 Serie do Indice Dow Jones Industrial Average . . . . . . . . . . . . . . . 205
C.5 Serie do Indice Nasdaq . . . . . . . . . . . . . . . . . . . . . . . . . . . . 205
C.6 Serie do Indice S&P500 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 206
C.7 Serie do Valor de Fechamento das Acoes da Petrobras . . . . . . . . . . . 206
C.8 Serie Random Walk . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 206
SUMARIO xiv
Apendice D—Resultados Experimentais com as Redes Neurais Artificiais 207
Apendice E—Estruturas de Conexoes para os Melhores Indivıduos do SistemaHıbrido Inteligente — Algoritmo Genetico Modificado com Redes NeuraisArtificiais 216
E.1 Melhores Indivıduos para a Serie do Mapa de Henon . . . . . . . . . . . 217
E.2 Melhores Indivıduos para a Serie das Manchas Solares . . . . . . . . . . . 217
E.3 Melhores Indivıduos para a Serie de Medidas do Brilho de uma Estrela . 217
E.4 Melhores Indivıduos para a Serie do Indice Dow Jones Industrial Average 218
E.5 Melhores Indivıduos para a Serie do Indice Nasdaq . . . . . . . . . . . . 218
E.6 Melhores Indivıduos para a Serie do Indice S&P500 . . . . . . . . . . . . 219
E.7 Melhores Indivıduos para a Serie do Valor de Fechamento das Acoes daPetrobras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 219
E.7.1 Arquitetura 3-10-1 . . . . . . . . . . . . . . . . . . . . . . . . . . 220
E.8 Melhores Indivıduos para a Serie Random Walk . . . . . . . . . . . . . . 220
Referencias Bibliograficas 221
LISTA DE FIGURAS
1.1 Grafico ilustrativo do custo versus o benefıcio na previsao em relacao aoaumento da precisao em um processo de previsao . . . . . . . . . . . . . 2
2.1 Estagios para a construcao de um modelo iterativo de Box e Jenkins. . . 15
2.2 Graficos tıpicos das FACs para um Modelo AR. (a) φ = 0.8 e (b) φ = −0.8. 18
3.1 Rede MLP de tres camadas totalmente conectada. . . . . . . . . . . . . . 33
3.2 Esquema do processo de aprendizagem supervisionada. . . . . . . . . . . 34
3.3 Graficos das funcoes de ativacao mais comuns. (A) Funcao SigmoideLogıstica; (B) Funcao Tangente Hiperbolica; (C) Funcao Seno; (D) FuncaoLinear. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
3.4 Procedimento padrao de um Algoritmo Genetico tıpico. . . . . . . . . . . 43
3.5 Representacao esquematica da informacao biologica. O indivıduo e ab-straıdo como uma solucao a um problema, seu cromossomo a sua codi-ficacao e os genes aos parametros da solucao. . . . . . . . . . . . . . . . . 44
3.6 Metodo da Roleta aplicado a uma populacao de cinco indivıduos. . . . . 46
3.7 Operadores de cruzamento e mutacao aplicados nos AGs binarios. . . . . 47
4.1 Grafico da serie do Mapa de Henon (500 primeiros pontos). . . . . . . . . 52
4.2 Lagplot para o mapa Henon do lag 1 ao 9. . . . . . . . . . . . . . . . . . 53
4.3 Imagem da superfıcie solar, construıda pela NASA, onde sao apresentadosgrupos de manchas solares, destacados pelos cırculos tracejados. . . . . . 54
4.4 Grafico da serie das Manchas Solares (Sunspot) — medidas anuais. . . . 55
4.5 Lagplot para a serie das Manchas Solares do lag 1 ao 9. . . . . . . . . . . 56
4.6 Grafico da serie de medidas do brilho de uma estrela. . . . . . . . . . . . 56
4.7 Lagplot para a serie de medidas do brilho de uma estrela do lag 1 ao 9. . 57
4.8 Grafico da serie do Indice Dow Jones Industrial Average. . . . . . . . . . 59
xv
LISTA DE FIGURAS xvi
4.9 Lagplot para a serie do Indice Dow Jones Industrial Average do lag 1 ao 9. 59
4.10 Grafico da serie do Indice Nasdaq. . . . . . . . . . . . . . . . . . . . . . . 61
4.11 Lagplot para a serie do Indice Nasdaq do lag 1 ao 9. . . . . . . . . . . . . 61
4.12 Grafico da serie do Indice S&P500. . . . . . . . . . . . . . . . . . . . . . 62
4.13 Lagplot para a serie do Indice S&P500 do lag 1 ao 9. . . . . . . . . . . . 63
4.14 Grafico da serie da Acoes da Petrobras. . . . . . . . . . . . . . . . . . . . 64
4.15 Lagplot para a serie das Acoes da Petrobras do lag 1 ao 9. . . . . . . . . 64
4.16 Grafico da serie artificial gerada pelo modelo de Random Walk referente aEquacao (.). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
4.17 Lagplot para a serie artificial gerada pelo modelo de Random Walk refe-rente a Equacao (.) do lag 1 ao 9. . . . . . . . . . . . . . . . . . . . . . 66
5.1 Grafico comparativo entre os valores reais (linha solida) e os valores deprevisao (linha tracejada) gerados pelo modelo de Box & Jenkins para osultimos 100 pontos do conjunto de teste da serie de Henon. . . . . . . . . 74
5.2 Grafico comparativo entre os valores reais (linha solida) e os valores deprevisao gerados pelo modelo de Box & Jenkins (linha tracejada) para oconjunto de teste da serie das Manchas Solares. . . . . . . . . . . . . . . 75
5.3 Grafico comparativo entre os valores reais (linha solida) e os valores deprevisao gerados pelo modelo de Box & Jenkins (linha tracejada) para oconjunto de teste da serie de Medidas do Brilho de uma Estrela. . . . . . 76
5.4 Grafico comparativo entre os valores reais (linha solida) e os valores deprevisao gerados pelo modelo de Box & Jenkins (linha tracejada) para oconjunto de teste da serie do Indice Dow Jones Industrial Average (DJIA). 77
5.5 Grafico comparativo entre os valores reais (linha solida) e os valores deprevisao gerados pelo modelo de Box & Jenkins (linha tracejada) para oconjunto de teste da serie do Indice Nasdaq. . . . . . . . . . . . . . . . . 79
5.6 Grafico comparativo entre os valores reais (linha solida) e a previsao ge-rada pelo modelo ARIMA (linha tracejada) para os ultimos 142 pontos doconjunto de teste do Indice Nasdaq. . . . . . . . . . . . . . . . . . . . . . 79
5.7 Grafico comparativo entre os valores reais (linha solida) e os valores deprevisao gerados pelo modelo de Box & Jenkins (linha tracejada) para oconjunto de teste da serie do Indice S&P500. . . . . . . . . . . . . . . . . 80
LISTA DE FIGURAS xvii
5.8 Grafico comparativo entre os valores reais (linha solida) e os valores deprevisao gerados pelo modelo de Box & Jenkins (linha tracejada) para oconjunto de teste da serie do Valor de Fechamento das Acoes da Petrobras. 82
5.9 Grafico comparativo entre os valores reais (linha solida) e os valores deprevisao gerados pelo modelo de Box & Jenkins (linha tracejada) para oconjunto de teste da serie Random Walk. . . . . . . . . . . . . . . . . . . 83
5.10 Serie do Mapa de Henon (linha solida) e a previsao gerada pela rede neural(linha tracejada) para os ultimos 100 pontos do conjunto de teste. . . . . 87
5.11 Grafico comparativo entre os valores reais (linha solida) e os valores pre-vistos pela RNA (linha tracejada) para a serie das Manchas Solares. . . . 88
5.12 Grafico comparativo entre a serie real de medidas do brilho de um estrela(linha solida) e a previsao gerada pela rede neural (linha tracejada). . . . 90
5.13 Serie real do DJIA (linha solida) e a previsao gerada pela rede neural (linhatracejada) para o conjunto de teste. . . . . . . . . . . . . . . . . . . . . . 92
5.14 Serie real do Indice Nasdaq (linha solida) e a previsao gerada pela redeneural (linha tracejada) para o conjunto de teste. . . . . . . . . . . . . . 94
5.15 Grafico comparativo entre a serie real do Indice S&P500 (linha solida) e aprevisao gerada pela rede neural (linha tracejada) para o conjunto de teste. 96
5.16 Serie real do DJIA (linha solida) e a previsao gerada pela rede neural (linhatracejada) para o conjunto de teste. . . . . . . . . . . . . . . . . . . . . . 98
5.17 Grafico comparativo entre a serie real Random Walk (linha solida) e aprevisao gerada pela rede neural (linha tracejada) para o conjunto de teste. 101
6.1 Esquema generico da rede neural artificial codificada como indivıduo dapopulacao do algoritmo genetico descrito. . . . . . . . . . . . . . . . . . . 108
6.2 Serie do Mapa de Henon (linha solida) e os valores previstos (linha tra-cejada) pelo Sistema Hıbrido AG+RNA para os ultimos 100 pontos doconjunto de teste. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
6.3 Serie das Manchas Solares (linha solida) e os valores previstos (linha tra-cejada) pelo Sistema Hıbrido AG+RNA para o conjunto de teste. . . . . 113
6.4 Serie de Medidas de Brilhos de um Estrela (linha solida) e a previsao (linhatracejada) gerada pelo modelo REDE 2 da arquitetura 3-1-1. . . . . . . . 115
6.5 Serie real do DJIA (linha solida) e a previsao gerada pelo Sistema HıbridoAG+RNA (linha tracejada), REDE 2 da arquitetura 3-10-1, para o con-junto de teste. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
LISTA DE FIGURAS xviii
6.6 Serie do Indice Nasdaq (linha solida) e a previsao gerada pelo SistemaHıbrido AG+RNA (linha tracejada), REDE 2 da arquitetura 3-5-1, parao conjunto de teste. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
6.7 Serie S&P500 (linha solida) e a previsao gerada pelo modelo REDE 2 daarquitetura 3-5-1 para o conjunto de teste. . . . . . . . . . . . . . . . . . 120
6.8 Serie do Valor de Fechamento das Acoes da Petrobras (linha solida) e aprevisao gerada pelo Sistema Hıbrido AG+RNA (linha tracejada), REDE2 da arquitetura 3-10-1, para o conjunto de teste. . . . . . . . . . . . . . 121
6.9 Serie Random Walk (linha solida) e a previsao gerada pelo Sistema HıbridoAG+RNA (linha tracejada), REDE 1 da arquitetura 3-1-1, para o conjuntode teste. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
7.1 Esquema do Metodo TAEF proposto para a solucao do problema de pre-visao de series temporais . . . . . . . . . . . . . . . . . . . . . . . . . . . 128
7.2 Serie do mapa de Henon (linha solida) e a previsao (linha tracejada) geradapelo metodo TAEF para os ultimos 100 pontos do conjunto de teste. . . . 131
7.3 Serie das Manchas Solares (linha solida) e a previsao (linha tracejada)gerada pelo metodo TAEF para o conjunto de teste. . . . . . . . . . . . . 133
7.4 Serie Brilho de uma Estrela (linha solida) e a previsao (linha tracejada)gerada pelo metodo TAEF para o conjunto de teste. . . . . . . . . . . . . 134
7.5 Serie DJIA (linha solida) e a previsao (linha tracejada) gerada pelo metodoTAEF para o conjunto de teste. . . . . . . . . . . . . . . . . . . . . . . . 135
7.6 Serie DJIA (linha solida) e a previsao (linha tracejada) gerada pelo metodoTAEF para os ultimos 100 pontos do conjunto de teste. . . . . . . . . . . 136
7.7 Serie do Indice Nasdaq (linha solida) e a previsao (linha tracejada) geradapelo metodo TAEF para o conjunto de teste. . . . . . . . . . . . . . . . . 137
7.8 Serie do Indice Nasdaq (linha solida) e a previsao (linha tracejada) geradapelo metodo TAEF para os ultimos 100 pontos do conjunto de teste. . . . 137
7.9 Serie do Indice S&P500 (linha solida) e a previsao (linha tracejada) geradapelo metodo TAEF para o conjunto de teste. . . . . . . . . . . . . . . . . 139
7.10 Serie de Valor de Fechamento das Acoes da Petrobras (linha solida) e aprevisao (linha traceja) gerada pelo metodo TAEF para o conjunto de teste.140
7.11 Serie de Valor de Fechamento das Acoes da Petrobras (linha solida) e aprevisao gerada pelo metodo TAEF para os ultimos 100 pontos do conjuntode teste. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140
LISTA DE FIGURAS xix
7.12 Serie Random Walk (linha solida) e a previsao gerada pelo metodo TAEFpara o conjunto de teste. . . . . . . . . . . . . . . . . . . . . . . . . . . . 142
7.13 Procedimento de ajuste da fase da previsao gerada pelo metodo TAEF. . 145
7.14 Esquema do metodo TAEF com a inclusao do teste comportamental paraa determinacao da fase de previsao . . . . . . . . . . . . . . . . . . . . . 147
7.15 Serie do Mapa de Henon (linha solida) e as previsoes (linha tracejada)geradas pelo metodo TAEF para os ultimos 100 pontos do conjunto deteste. O grafico superior e referente a suposicao de previsao em fase e ografico inferior a suposicao de previsao fora de fase. . . . . . . . . . . . . 149
7.16 Serie das Manchas Solares (linha solida) e as previsoes (linha tracejada)geradas pelo metodo TAEF para o conjunto de teste. O grafico superiore referente a suposicao de previsao em fase e o grafico inferior a suposicaode previsao fora de fase. . . . . . . . . . . . . . . . . . . . . . . . . . . . 150
7.17 Serie de Medidas do Brilho de uma Estrela (linha solida) e as previsoes(linha tracejada) geradas pelo metodo TAEF para o conjunto de teste.O grafico superior e referente a suposicao de previsao em fase e o graficoinferior a suposicao de previsao fora de fase. . . . . . . . . . . . . . . . . 151
7.18 Serie do Indice DJIA (linha solida) e as previsoes (linha tracejada) geradaspelo metodo TAEF para o conjunto de teste. O grafico superior e referentea suposicao de previsao em fase e o grafico inferior a suposicao de previsaofora de fase. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152
7.19 Serie do Indice DJIA (linha solida) e as previsoes (linha tracejada) geradaspelo metodo TAEF para os ultimos 100 pontos do conjunto de teste. Ografico superior e referente a suposicao de previsao em fase e o graficoinferior a suposicao de previsao fora de fase. . . . . . . . . . . . . . . . . 153
7.20 Serie do Indice Nasdaq (linha solida) e as previsoes (linha tracejada) ge-radas pelo metodo TAEF para o conjunto de teste. O grafico superior ereferente a suposicao de previsao em fase e o grafico inferior a suposicaode previsao fora de fase. . . . . . . . . . . . . . . . . . . . . . . . . . . . 154
7.21 Serie do Indice Nasdaq (linha solida) e as previsoes (linha tracejada) gera-das pelo metodo TAEF para os ultimos 100 pontos do conjunto de teste.O grafico superior e referente a suposicao de previsao em fase e o graficoinferior a suposicao de previsao fora de fase. . . . . . . . . . . . . . . . . 155
7.22 Serie do Indice S&P500 (linha solida) e as previsoes (linha tracejada) ge-radas pelo metodo TAEF para o conjunto de teste. O grafico superior ereferente a suposicao de previsao em fase, e o grafico inferior referente asuposicao de previsao fora de fase. . . . . . . . . . . . . . . . . . . . . . . 157
LISTA DE FIGURAS xx
7.23 Serie da Petrobras (linha solida) e a previsao gerada pelo metodo TAEF(linha tracejada) para o conjunto de teste. O grafico superior e referente asuposicao de previsao em fase e o grafico inferior a suposicao de previsaofora de fase. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158
7.24 Serie da Petrobras (linha solida) e as previsoes geradas pelo metodo TAEF(linha tracejada) para os ultimos 100 pontos do conjunto de teste. O graficosuperior e referente a suposicao de previsao em fase e o grafico inferior ade previsao fora de fase. . . . . . . . . . . . . . . . . . . . . . . . . . . . 158
7.25 Serie Random Walk (linha solida) e a previsao gerada pelo metodo TAEF(linha tracejada) para o conjunto de teste. O grafico superior e referentea suposicao de previsao em fase e o grafico inferior a suposicao fora de fase. 160
8.1 Series Random Walk com drift. Para todas as figuras, hipoteses de previsaoem fase (grafico superior) e previsao fora de fase (grafico inferior). As linhassolidas sao os dados reais e as linhas tracejadas sao as previsoes. . . . . . 165
8.2 Series Random Walk com Sazonalidade Aditiva. Sao exibidas as hipotesede previsao em fase (grafico superior) e previsao fora de fase (grafico infe-rior) para os conjuntos de teste. As linhas solidas sao os dados reais e aslinhas tracejadas as previsoes. . . . . . . . . . . . . . . . . . . . . . . . . 167
8.3 Series Random Walk com Drift e Sazonalidade Aditiva. Sao exibidosgraficos na hipotese de previsao em fase (grafico superior) e fora de fase(grafico inferior) para os conjuntos de teste. As linhas solidas sao os dadosreais e as linhas tracejadas as previsoes. . . . . . . . . . . . . . . . . . . . 169
8.4 Famılia de Series Temporais geradas com os modelos GARCH. As figurasmostram graficos comparativos entre os dados reais (linhas solidas) e suasrespectivas previsoes (linhas tracejadas) para o conjunto de teste. . . . . 173
8.5 Famılia das Series dos Modelos SETAR. Em todas as figuras sao expostasa comparacao entre os dados reais (linhas solidas) e as previsoes (linhastracejadas) geradas para o conjunto de teste. O graficos superiores repre-sentam a suposicao de previsao em fase e os inferiores a previsao fora defase. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175
8.6 Graficos comparativos entre os valores reais (linha solida) da serie do mo-delo STAR e a previsao (linha tracejada) gerada pelo metodo TAEF. . . 177
9.1 Resultados das simulacoes de compra e venda de acoes com a utilizacaodo metodo TAEF (linha solida com pontos), modelos de Box & Jenkins(asteriscos) e a compra simples das acoes (linhas solida). . . . . . . . . . 185
LISTA DE FIGURAS xxi
9.2 Resultados das simulacoes de compra e venda de acoes com a utilizacaodo metodo TAEF (linha solida com pontos), modelos de Box & Jenkins(asteriscos) e a compra simples das acoes (linhas solida). . . . . . . . . . 186
9.3 Resultados das simulacoes de compra e venda de acoes com a utilizacaodo metodo TAEF (linha solida com pontos), modelos de Box & Jenkins(asteriscos) e a compra simples das acoes (linhas solida). . . . . . . . . . 187
9.4 Valor do retorno acumulado percentual versus o Fator de Risco para asoperacoes de compra e venda: metodo TAEF (©) e modelos de Box &Jenkins (∗). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 188
LISTA DE TABELAS
4.1 Valores tıpicos e algumas estatısticas da serie do mapa de Henon utilizada. 53
4.2 Valores tıpicos e algumas estatısticas da serie das Manchas Solares (Sunspots). 55
4.3 Valores tıpicos e algumas estatısticas da serie de Medidas de Brilho de umaEstrela. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
4.4 Valores tıpicos e algumas estatısticas da serie do Indice Dow Jones Indus-trial Average. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
4.5 Valores tıpicos e algumas estatısticas da serie do Indice Nasdaq. . . . . . 60
4.6 Valores tıpicos e algumas estatısticas da serie do Indice S&P500. . . . . . 63
4.7 Valores tıpicos e algumas estatısticas da serie do Valor de Fechamento daAcoes da Petrobras. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
4.8 Valores tıpicos e algumas estatısticas da serie artificial gerada pelo modelode Random Walk referente a Equacao (.). . . . . . . . . . . . . . . . . 67
5.1 Medidas de Desempenho de previsao para o modelo ARIMA(26,0,1) apli-cado a serie de Henon . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
5.2 Medidas de Desempenho de previsao para o modelo ARIMA(9,0,1) apli-cado a serie das Manchas Solares. . . . . . . . . . . . . . . . . . . . . . . 74
5.3 Medidas de Desempenho de previsao para o modelo ARIMA(88,0,0) apli-cado a serie de Medidas do Brilho de uma Estrela. . . . . . . . . . . . . . 76
5.4 Medidas de Desempenho de previsao para o modelo ARIMA(1,0,1) apli-cado a serie do Indice Dow Jones Industrial Average (DJIA). . . . . . . . 78
5.5 Medidas de desempenho de previsao para o modelo ARIMA(44,0,1) apli-cado a serie do Indice Nasdaq. . . . . . . . . . . . . . . . . . . . . . . . . 78
5.6 Medidas de Desempenho de previsao para o modelo ARIMA(1,0,1) apli-cado a serie do Indice S&P500. . . . . . . . . . . . . . . . . . . . . . . . 80
5.7 Medidas de desempenho de previsao para o modelo ARIMA(2,0,1) aplicadoa serie do Valor de Fechamento das Acoes da Petrobras. . . . . . . . . . . 81
xxii
LISTA DE TABELAS xxiii
5.8 Medidas de desempenho de previsao para o modelo ARIMA(1,0,1) aplicadoa serie Random Walk. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
5.9 Medias (x) e desvios padroes (σx) das medidas de desempenho relativas asdez inicializacoes das RNAs utilizadas para a previsao da serie do Mapade Henon . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
5.10 Resultados experimentais (conjunto de teste) com os melhores modelos(Box & Jenkins e RNAs) para a serie de Henon. . . . . . . . . . . . . . . 86
5.11 Medias (x) e desvios padroes (σx) para as medidas de desempenho relativasas dez inicializacoes das RNAs utilizadas para a previsao da serie dasManchas Solares. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
5.12 Resultados experimentais (conjunto de teste) com os melhores modelos(Box & Jenkins e RNAs) para a serie das Manchas Solares. . . . . . . . . 89
5.13 Medias (x) e desvios padroes (σx) das medidas de desempenho dos expe-rimentos com as RNAs para a previsao da serie de Medidas do Brilho deuma Estrela. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
5.14 Resultados experimentais (conjunto de teste) com os melhores modelos(Box & Jenkins e RNAs) para a serie de medidas do brilho de uma estrela. 91
5.15 Medias (x) e desvios padroes (σx) para as medidas de desempenho relativasas dez inicializacoes das RNAs utilizadas para a previsao da serie DJIA. . 91
5.16 Resultados experimentais (conjunto de teste) com os melhores modelos(Box & Jenkins e RNAs) para a serie DJIA. . . . . . . . . . . . . . . . . 93
5.17 Medias (x) e desvios padroes (σx) para as medidas de desempenho relativasas dez inicializacoes das RNAs utilizadas para a previsao da serie do IndiceNasdaq. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
5.18 Resultados experimentais (conjunto de teste) com os melhores modelos(Box & Jenkins e RNAs) para a serie do Indice Nasdaq. . . . . . . . . . . 94
5.19 Medias (x) e desvios padroes (σx) para as medidas de desempenho relativasas dez inicializacoes das RNAs utilizadas para a previsao da serie do IndiceS&P500 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
5.20 Resultados experimentais (conjunto de teste) com os melhores modelos(Box & Jenkins e RNAs) para a serie do Indice S&P500. . . . . . . . . . 96
5.21 Medias (x) e desvios padroes (σx) das medidas de desempenho para as dezinicializacoes das RNAs utilizadas para a previsao da serie da Petrobras(PetreobrasON). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
LISTA DE TABELAS xxiv
5.22 Resultados experimentais (conjunto de teste) com os melhores modelos(Box & Jenkins e RNAs) para a serie do Valor de Fechamento das Acoesda Petrobras. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
5.23 Medias (x) e desvios padroes (σx) para as medidas de desempenho relativasas dez inicializacoes das RNAs para a previsao da serie Random Walk. . . 100
5.24 Resultados experimentais (conjunto de teste) com os melhores modelos(Box & Jenkins e RNAs) para a serie Random Walk. . . . . . . . . . . . 100
6.1 Resultados experimentais obtidos pelo melhor modelo do Sistema HıbridoAG+RNA para a serie do Mapa de Henon (RNA 4-5-1). . . . . . . . . . 111
6.2 Resultados experimentais (conjunto de teste) com os melhores modelos(Box & Jenkins, RNAs e AG+RNA) para a serie de Henon. . . . . . . . 112
6.3 Resultados experimentais obtidos pelo melhor modelo do Sistema HıbridoAG+RNA para a serie das Manchas Solares (RNA 3-1-1). . . . . . . . . 113
6.4 Resultados experimentais (conjunto de teste) com os melhores modelos(Box & Jenkins, RNAs e AG+RNA) para a series das Manchas Solares. . 114
6.5 Resultados experimentais obtidos pelo melhor modelo do Sistema HıbridoAG+RNA para a serie de Medidas de Brilhos de uma Estrela (RNA 3-1-1). 114
6.6 Resultados experimentais (conjunto de teste) com os melhores modelos(Box & Jenkins, RNAs e AG+RNA) para a serie de Medidas do Brilho deuma Estrela. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
6.7 Resultados experimentais obtidos pelo melhor modelo do Sistema HıbridoAG+RNA para a serie DJIA (RNA 3-10-1). . . . . . . . . . . . . . . . . 116
6.8 Resultados experimentais (conjunto de teste) com os melhores modelos(Box & Jenkins, RNAs e AG+RNA) para a serie DJIA. . . . . . . . . . . 117
6.9 Resultados experimentais obtidos pelo melhor modelo do Sistema HıbridoAG+RNA para a serie do Indice Nasdaq (RNA 3-5-1). . . . . . . . . . . 117
6.10 Resultados experimentais (conjunto de teste) com os melhores modelos(Box & Jenkins, RNAs e AG+RNA) para a serie do Indice Nasdaq. . . . 119
6.11 Resultados experimentais obtidos pelo melhor modelo do Sistema HıbridoAG+RNA para a serie do Indice S&P500 (RNA 3-5-1). . . . . . . . . . . 119
6.12 Resultados experimentais (conjunto de teste) com os melhores modelos(Box & Jenkins, RNAs e AG+RNA) para a serie do Indice S&P500. . . . 120
LISTA DE TABELAS xxv
6.13 Resultados experimentais obtidos pelo melhor modelo do Sistema HıbridoAG+RNA para a serie do Valor de Fechamento das Acoes da Petrobras(RNA 3-10-1). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
6.14 Resultados experimentais (conjunto de teste) com os melhores modelos(Box & Jenkins, RNAs e AG+RNA) para a serie do Valor de Fechamentodas Acoes da Petrobras. . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
6.15 Resultados experimentais obtidos pelo melhor modelo do Sistema HıbridoAG+RNA para a serie Random Walk (RNA 3-10-1). . . . . . . . . . . . 122
6.16 Resultados experimentais (conjunto de teste) com os melhores modelos(Box & Jenkins, RNAs e AG+RNA) para a serie Random Walk. . . . . . 124
7.1 Resultados experimentais para a serie do Mapa de Henon — metodo TAEF.131
7.2 Resultados experimentais (conjunto de teste) com os melhores modelos(Box & Jenkins, RNAs, AG+RNA e TAEF) para a serie do Mapa de Henon.131
7.3 Resultados experimentais para a serie das Manchas Solares — metodo TAEF.132
7.4 Resultados experimentais (conjunto de teste) com os melhores modelos(Box & Jenkins, RNAs, AG+RNA e TAEF) para a series das ManchasSolares. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
7.5 Resultados experimentais para a serie de Medidas do Brilho de uma Estrela— metodo TAEF. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133
7.6 Resultados experimentais (conjunto de teste) com os melhores modelos(Box & Jenkins, RNAs, AG+RNA e TAEF) para a serie de medidas dobrilho de uma estrela. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134
7.7 Resultados experimentais para a serie do Indice DJIA — metodo TAEF. 134
7.8 Resultados experimentais (conjunto de teste) com os melhores modelos(Box & Jenkins, RNAs, AG+RNA e TAEF) para a serie do Indice DJIA. 135
7.9 Resultados experimentais para a serie do Indice Nasdaq — o metodo TAEF.136
7.10 Resultados experimentais (conjunto de teste) com os melhores modelos(Box & Jenkins, RNAs, AG+RNA e TAEF) para a serie do Indice Nasdaq. 137
7.11 Resultados experimentais para a serie do Indice S&P500 — o Metodo TAEF.138
7.12 Resultados experimentais (conjunto de teste) com os melhores modelos(Box & Jenkins, RNAs, AG+RNA e TAEF) para a serie do Indice S&P500.138
7.13 Resultados experimentais para a serie do Valor de Fechamento das Acoesda Petrobras — metodo TAEF. . . . . . . . . . . . . . . . . . . . . . . . 139
LISTA DE TABELAS xxvi
7.14 Resultados experimentais (conjunto de teste) com os melhores modelos(Box & Jenkins, RNAs, AG+RNA e TAEF) para a serie do Valor deFechamento das Acoes da Petrobras. . . . . . . . . . . . . . . . . . . . . 140
7.15 Resultados experimentais para a serie Random Walk — metodo TAEF. . 141
7.16 Resultados experimentais (conjunto de teste) com os melhores modelos(Box & Jenkins, RNAs, AG+RNA e TAEF) para a serie Random Walk. . 141
7.17 Metodologias mais adequadas para cada serie temporal estudada. . . . . 142
7.18 Resultados experimentais para a serie do Mapa de Henon com as RNAs eo metodo TAEF na suposicao em fase e fora de fase para o conjunto deteste. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148
7.19 Resultados experimentais para a serie das Manchas Solares com as RNAse o metodo TAEF na suposicao em fase e fora de fase para o conjunto deteste. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149
7.20 Resultados para a serie de Medidas do Brilho de uma Estrela com as RNAse o metodo TAEF na suposicao em fase e fora de fase para o conjunto deteste. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 150
7.21 Resultados experimentais para a serie do Indice DJIA com as RNAs eo metodo TAEF na suposicao de previsao em fase e fora de fase para oconjunto de teste. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152
7.22 Resultados experimentais para a serie do Indice Nasdaq com as RNAs e ometodo TAEF na suposicao em fase e fora de fase fase para o conjunto deteste. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154
7.23 Resultados experimentais para a serie do Indice S&P500 com as RNAs eo metodo TAEF nas suposicoes de previsao em fase e fora de fase para oconjunto de teste. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156
7.24 Resultados experimentais para a serie da Petrobras com as RNAs e ometodo TAEF nas suposicoes de previsao em fase e fora de fase para oconjunto de teste. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157
7.25 Resultados experimentais para a serie Random Walk com as RNAs e ometodo TAEF nas suposicoes de previsao em fase e fora de fase para oconjunto de teste. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159
8.1 Configuracoes escolhidas pelo metodo TAEF para a famılia de series dotipo Random Walk com drift. . . . . . . . . . . . . . . . . . . . . . . . . 164
8.2 Resultados experimentais para as series da famılia de Random Walk comdrift. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164
LISTA DE TABELAS xxvii
8.3 Configuracoes alcancadas pelo metodo TAEF para a famılia de Series Ran-dom Walk com Sazonalidade Aditiva. . . . . . . . . . . . . . . . . . . . . 166
8.4 Resultados obtidos pelo metodo TAEF para a famılia de Series RandomWalk com Sazonalidade Aditiva. . . . . . . . . . . . . . . . . . . . . . . . 166
8.5 Configuracoes alcancadas pelo metodo TAEF para a famılia de Series Ran-dom Walk com Drift (θ = 0.8) e Sazonalidade Aditiva. . . . . . . . . . . 168
8.6 Resultados obtidos pelo metodo TAEF para o conjunto de teste das seriesda famılia Random Walk com Drift e Sazonalidade aditiva. . . . . . . . . 168
8.7 Configuracoes alcancadas pelo metodo TAEF para a famılia de Series dosModelos GARCH. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171
8.8 Resultados para as medidas de desempenho alcancados pelo metodo TAEFpara a famılia de Series dos Modelos GARCH. . . . . . . . . . . . . . . . 172
8.9 Configuracoes alcancadas pelo Metodo TAEF para a famılia de Series dosModelos SETAR. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 174
8.10 Resultados obtidos pelo metodo TAEF para a famılia das Series dos Mo-delos SETAR para os respectivos conjuntos de teste. . . . . . . . . . . . . 175
8.11 Resultados experimentais obtidos pelo metodo TAEF para a Serie do Mo-delo STAR para o conjunto de teste. . . . . . . . . . . . . . . . . . . . . 177
9.1 Quadro das Acoes utilizadas na composicao da Carteira de Tıtulos. . . . 181
9.2 Quadro com os erros MAPE para cada um dos tıtulos utilizados na Carteira.184
C.1 Parametros auto-regressivos selecionados para o modelo ARIMA(26,0,1)referentes a serie do Mapa de Henon, devendo ser lidos da esquerda paraa direita, linha a linha, do coeficiente 1 ao 26. . . . . . . . . . . . . . . . 204
C.2 Parametros auto-regressivos selecionados para o modelo ARIMA(9,0,1) re-ferentes a serie das Manchas Solares, devendo ser lidos da esquerda para adireita, linha a linha, do coeficiente 1 ao 9. . . . . . . . . . . . . . . . . . 205
C.3 Parametros auto-regressivos selecionados para o modelo ARIMA(88,0,0)referentes a serie de Medidas de Brilho de uma Estrela, devendo ser lidosda esquerda para a direita, linha a linha, do coeficiente 1 ao 88. . . . . . 205
C.4 Coeficientes auto-regressivos selecionados para o modelo ARIMA(44,0,1)referentes a serie do Indice Nasdaq, devendo ser lidos da esquerda para adireita, linha a linha, do coeficiente 1 ao 44. . . . . . . . . . . . . . . . . 206
LISTA DE TABELAS xxviii
D.1 Resultados experimentais para a previsao da serie do mapa de Henon utili-zando RNAs. Para todas as medidas de desempenho sao calculadas as suasmedias (x), desvios padroes (σx) e intervalos de confianca com um erro de1% (limite inferior – Conf−; e limite superior – Conf+). Em negrito edestacada a melhor inicializacao. . . . . . . . . . . . . . . . . . . . . . . 208
D.2 Resultados experimentais para a previsao da serie das Manchas Solaresutilizando RNAs. Para todas as medidas de desempenho sao calculadasas suas medias (x), desvios padroes (σx) e intervalos de confianca comum erro de 1% (limite inferior – Conf−; e limite superior – Conf+). Emnegrito e destacada a melhor inicializacao. . . . . . . . . . . . . . . . . . 209
D.3 Resultados experimentais para a previsao da serie de Medidas de Brilhosde uma Estrela utilizando RNAs. Para todas as medidas de desempenhosao calculadas as suas medias (x), desvios padroes (σx) e intervalos deconfianca com um erro de 1% (limite inferior – Conf−; e limite superior –Conf+). Em negrito e destacada a melhor inicializacao. . . . . . . . . . . 210
D.4 Resultados experimentais para a previsao da serie do Indice Dow JonesIndustrial Average utilizando RNAs. Para todas as medidas de desem-penho sao calculadas as suas medias (x), desvios padroes (σx) e intervalosde confianca com um erro de 1% (limite inferior – Conf−; e limite superior– Conf+). Em negrito e destacada a melhor inicializacao. . . . . . . . . . 211
D.5 Resultados experimentais para a previsao da serie do Indice Nasdaq utili-zando RNAs. Para todas as medidas de desempenho sao calculadas as suasmedias (x), desvios padroes (σx) e intervalos de confianca com um erro de1% (limite inferior – Conf−; e limite superior – Conf+). Em negrito edestacada a melhor inicializacao. . . . . . . . . . . . . . . . . . . . . . . 212
D.6 Resultados experimentais para a previsao da serie do Indice S&P500 utili-zando RNAs. Para todas as medidas de desempenho sao calculadas as suasmedias (x), desvios padroes (σx) e intervalos de confianca com um erro de1% (limite inferior – Conf−; e limite superior – Conf+). Em negrito edestacada a melhor inicializacao. . . . . . . . . . . . . . . . . . . . . . . 213
D.7 Resultados experimentais para a previsao da serie do Valor de Fechamentodas Acoes da Petrobras utilizando RNAs. Para todas as medidas de desem-penho sao calculadas as suas medias (x), desvios padroes (σx) e intervalosde confianca com um erro de 1% (limite inferior – Conf−; e limite superior– Conf+). Em negrito e destacada a melhor inicializacao. . . . . . . . . . 214
D.8 Resultados experimentais para a previsao da serie Random Walk utili-zando RNAs. Para todas as medidas de desempenho sao calculadas assuas medias (x), desvios padroes (σx) e intervalos de confianca com umerro de 1% (limite inferior – Conf−; e limite superior – Conf+). Emnegrito e destacada a melhor inicializacao. . . . . . . . . . . . . . . . . . 215
LISTA DE ABREVIATURAS, SIGLAS E SIMBOLOS
Siglas Descricaox Valor medio de xσx Desvio padrao de x∆d Operador de diferencas de ordem dδ(x) Funcao degrauΦ(B) Operador auto-regressivo estacionarioφkk Funcao de Auto-correlacao parcial de ordem k por kγj Auto-Correlacao com atraso jρj Funcao de auto-correlacao normalizada para a ordem jΘ(B) Operador de medias moveis estacionarioAELB Modelo estatıstico de Alisamento Exponencial Biparametrico de HoltAELB Modelo estatıstico de Alisamento Exponencial Linear de BrowAES Modelo estatıstica de Alisamento Exponencial SimplesAIC Akaike Information Criteron — Criterio de informacao de AkaikeAG Algoritmo geneticoAR(p) Autoregressive — Modelo estatıstico auto-regressivo de ordem pARCH(p, q) Autoregressive Conditional Heteroskedasticity — Modelo auto-
regressivo condicional heterocedasticoARIMA(p, d, q) Autoregressive integrated Moving Average — Modelo misto auto-
regressivo integrado de medias moveis de ordem d, p e qARMA(p, q) Autoregressive Moving Average — Modelo misto auto-regressivo de
medias moveis de ordem p e qART Adaptive Resonant Theory — Modelo de redes neurais artificial ba-
seado na teoria ressonante adaptativaARV Average Relative Variance — Variancia relativa mediab1j bias dos neuronios intermediarios de uma rede neural
b2k bias dos neuronios de saıda de uma rede neural
B Operador de translacao para o passadoBIC Baysean Information Criterion — Criterio de informacao bayseanoBovespa Bolsa de Valores do Estado de Sao PauloCi Cromossomo i em um algoritmo geneticoCont Quantidade de iteracoes do metodo TAEFCV Crescimento do erro de Validacaod Dimensao do espaco de fase gerador de uma serie temporal
DJIA Dow Jones Industrial Average — Indice medio Dow Jones IndustrialFA Modelo estatıstico de Filtragem Adaptativa
Continua na proxima pagina
xxix
LISTA DE ABREVIATURAS, SIGLAS E SIMBOLOS xxx
Siglas DescricaoFAC Funcao de auto-correlacaoFACP Funcao de auto-correlacao parcialFitmin Quantidade mınima de fitness a ser alcancada pelo metodo TAEFfitness Funcao de custo ou adaptacao de um algoritmo geneticoGARCH(p, q) General Autoregressive Conditional Heteroskedasticity — Modelo
auto-regressivo condicional heterocedastico geralGGBR4 Codigo da Bovespa para acoes da empresa GerdauIA Inteligencia ArtificialLag Retardo TemporalMA(q) Moving Average — Modelo de medias moveis de ordem qMCj Cromossomo mutacionado j em um algoritmo geneticoMLP Multi-Layer Perceptron — Perceptron de Multi-CamadasMSE Mean Square Error — Erro medio quadraticoMAPE Mean Absolute Percentual Error — Erro medio percentual absolutoMMS Modelo estatıstica de Medias Moveis SimplesNhmax Quantidade maxima de neuronios escondidos em uma rede neuralnin Quantidade de neuronios na camada de entrada da rede neuralnh Quantidade de neuronios na camada escondida da rede neuralnV ar Quantidade de genes que compoem o cromossomo de um indivıduo
pertencente a uma populacao de um algoritmo geneticoNasdaq National Association of Securities Dealers Automated QuotationP Populacao de um algoritmo geneticopi Indivıduo de uma populacao de um algoritmo geneticopi
max Valor maximo assumido por um gene do indivıduo i pertencente auma populacao de um algoritmo genetico
pimin Valor mınimo assumido por um gene do indivıduo i pertencente a
uma populacao de um algoritmo geneticoPETR4 Codigo da Bovespa para acoes da PetrobrasPOCID Prediction On Change In Direction — Erro percentual para a pre-
visao da tendencia instantaneaPT Progresso de Treinamentoqi Probabilidade de selecao de um indivıduo i em um algoritmo geneticoqi Probabilidade acumulada de um indivıduo i em um algoritmo
geneticoRmax Quantidade maxima de retardos temporaisrt Termo de ruıdo no instante tS1
j Chaves das conexoes em uma rede neural dos bias para os neuroniosda camada intermediaria
Continua na proxima pagina
LISTA DE ABREVIATURAS, SIGLAS E SIMBOLOS xxxi
Siglas DescricaoS2
k Chaves das conexoes em uma rede neural do bias para o neuronio dacamada de saıda
S1ij Chaves das conexoes em uma rede neural da camada de entrada para
a camada intermediariaS2
jk Chaves das conexoes em uma rede neural da camada intermediariapara a camada de saıda
S&P500 Standard & Poor 500 — Indice ponderado de valores de mercado das500 acoes mais negociadas no New York Stock Exchange, no AmericanStock Exchange e no Nasdaq National Market System
SETAR Self-Excited Threshold Autoregressive — Modelo estatıstico de limiarauto-regressivo auto-excitado
SHI Sistema Hıbrido InteligenteSig Funcao sigmoide logısticaSTAR Smooth Threshold Autoregressive — Modelo estatıstico de limiar
suave auto-regressivoTAEF Time-lag Added Evolutionary Forecasting Method — Metodo de Pre-
visao com adicao evolutiva de retardos temporaisTamPop Cardinalidade da populacao de um algoritmo geneticoTAR Threshold Autoregressive — Modelo estatıstico de limiar auto-
regressivoTheil Estatıstica U de TheilUNIP6 Codigo da Bovespa para acoes da UniparUSIM5 Codigo da Bovespa para acoes da UsiminasVALE5 Codigo da Bovespa para acoes da Vale do Rio DoceWij Pesos das conexoes de uma rede neural da camada de entrada para
a camada intermediariaWjk Pesos das conexoes de uma rede neural da camada intermediaria para
a camada de saıdayk(t) k-esima saıda de uma rede neural no instante tZt Ponto do instante t da serie temporal discreta Z
Zt Ponto do instante t da serie temporal discreta com media nulaZ(t) Ponto do instante t da serie temporal contınua Z
CAPITULO 1
INTRODUCAO
Neste Capıtulo inicial e realizada uma pequena introducao ao problema abordado: a
previsao de series temporais, com a possibilidade da criacao de um sistema de apoio da
tomada de decisao. Logo apos a introducao e exibida a estrutura dos capıtulos subsequen-
tes desta tese.
1.1 INTRODUCAO
Previsao e um elemento chave na tomada de decisao. Tal afirmativa nao e surpreendente
uma vez que qualquer decisao depende fortemente dos eventos que a antecedem.
A habilidade de prever comportamentos futuros em eventos de interesse tem como
meta apoiar o planejamento de futuras acoes, maximizando os ganhos e minimizando
as perdas. Por essa razao, sistemas de gerenciamento para planejamento e controle de
operacoes tem tipicamente uma funcao de previsao. Pode-se citar algumas situacoes
praticas onde ha a necessidade real de algum tipo de sistema de previsao no suporte aos
processos de tomada de decisao:
1. Planejamento da Producao: Para o bom projeto da manufatura de uma linha
de producao e necessario uma previsao das vendas de cada item para um certo
numero de meses no futuro;
2. Planejamento Financeiro: Um gerenciamento financeiro tem como interesse o
padrao de fluxo monetario que uma companhia experimentara em um certo intervalo
de tempo. Deseja-se, portanto, a previsao do cenario monetario para um futuro
proximo;
3. Gerenciamento de Estoque: O controle de estoque de pecas compradas para a
manutencao de uma aeronave, por exemplo, necessita de uma estimativa da taxa de
uso de cada peca, e em adicao, uma estimativa do erro de previsao sobre o tempo
decorrido para se estabelecer novas compras;
1
1.1 INTRODUCAO 2
4. Escalonamento de Pessoal: O administrador de um ponto dos correios, por
exemplo, necessita de uma previsao horaria do volume e mistura de correspondencias
a serem processadas para executar um escalonamento de pessoal de forma eficiente.
De forma geral, os processos de previsoes sao erroneos e a magnitude desses erros
depende do sistema utilizado para a previsao. Quanto maior a quantidade de recursos
aplicados para o desenvolvimento de modelos de previsao maior e a precisao alcancada,
eliminando perdas, resultantes de incertezas, no processo de tomada de decisao. Entre-
tanto, o ganho alcancado nem sempre cresce na mesma escala dos custos. Na Figura 1.1
e ilustrado o conceito do aumento de precisao em um processo de previsao versos o custo
associado. O custo total do sistema sera a soma de todos os custos, relativos a previsao e
relativos as incertezas (ou erros) da previsao. Esperar-se que em um determinado ponto
da curva de custo total seja identificado um mınimo, produzindo um ponto otimo de
trabalho.
Figura 1.1: Grafico ilustrativo do custo versus o benefıcio na previsao em relacao aoaumento da precisao em um processo de previsao
Devido ao processo de previsao nao eliminar totalmente o risco, e necessario que
a tomada de decisao considere explicitamente a incerteza da previsao, ponderando os
resultados obtidos a partir dos modelos de previsao da seguinte maneira:
Decisao Atual = Decisao assumindo que a previsao esta correta +
Compensacao devido ao erro da previsao.
Este fato implica que um sistema de previsao poderia prover uma descricao para o erro
de previsao tao bem quanto a propria previsao. Idealmente, o processo de previsao poderia
1.1 INTRODUCAO 3
resultar em uma estimativa da distribuicao de probabilidade da variavel de interesse,
permitindo que o risco seja objetivamente incorporado ao processo de tomada de decisao.
Muitos fatores influenciam o nıvel de detalhes da previsao: disponibilidade dos da-
dos, precisao alcancavel, custo de analise, dentre outros. Em situacoes onde a escolha
apropriada das variaveis nao e clara, pode-se tentar algumas combinacoes possıveis a par-
tir de estudos que explicitem quais variaveis apresentam um maior grau de correlacao,
escolhendo aquele conjunto de variaveis que alcance o melhor desempenho1.
Uma segunda classe de decisoes importantes envolve os tres elementos temporais: o
perıodo da previsao, o horizonte da previsao e o intervalo da previsao. O perıodo da
previsao e a unidade basica de tempo na qual as previsoes sao realizadas. Por exemplo,
deseja-se prever a demanda por semana, neste caso o perıodo e uma semana. O horizonte
da previsao corresponde ao numero de perıodos cobertos, no futuro, pela previsao. Desta
forma, pode-se requerer uma previsao para as proximas dez semanas, com uma analise
semanal. Sendo o horizonte da previsao igual a dez semanas e o perıodo da previsao
igual a uma semana. Finalmente o intervalo da previsao e a frequencia com a qual novas
previsoes sao preparadas.
Frequentemente, o intervalo da previsao e igual ao perıodo, desta forma as previsoes
sao revisadas a cada perıodo. Se o horizonte tem sempre o mesmo comprimento, digamos
T perıodos, e a previsao e revisada a cada perıodo, diz-se que a operacao tem uma base
de horizonte movel.
Um terceiro aspecto para a definicao do problema e a forma requerida da previsao. E
conveniente conceber a variavel de interesse como uma variavel aleatoria com uma distri-
buicao de probabilidades desconhecida. O problema da tomada de decisao pode requerer
uma estimativa de alguma caracterıstica desta distribuicao de probabilidades, tal como a
media, mediana ou valor mais provavel, ou ainda, como medida de incerteza, estimativas
do desvio padrao, percentuais, ou um intervalo contendo uma alta probabilidade de um
determinado valor ocorrer.
Um outro aspecto importante a considerar e a disponibilidade de dados historicos
sobre o problema. A precisao e a representatividade estatıstica de tais dados sao essenciais
para o sucesso da previsao.
A partir destas definicoes, com a utilizacao de metodos estatısticos convencionais, os
1Processo tipicamente realizado durante o desenvolvimento de sistemas de previsao atraves de si-mulacoes de dados historicos.
1.1 INTRODUCAO 4
procedimentos de previsao de series temporais podem ser divididos, de forma generica,
em duas grandes categorias:
1. Automaticos, que sao aplicados diretamente aos dados historicos do
fenomeno, a partir do desenvolvimento e a implementacao de programas sim-
ples de computador;
2. Nao-Automaticos, que exigem a intervencao de pessoal especializado,
para serem aplicados, mantidos e analisados.
Tanto os modelos ditos automaticos com os nao-automaticos aplicados ao problema
de previsao se baseiam em dados historicos de algum processo ou fenomeno. Esses dados
historicos sao comumente chamados de series temporais. Uma serie temporal e uma
sequencia de observacoes ordenadas no tempo que descreve o comportamento cronologico
de um determinado fenomeno. De forma pratica, as series temporais sao utilizadas para
o estudo de sistemas dinamicos em quatro grandes areas [1]:
1. Previsao de Series Temporais - a previsao de valores futuros a partir de valores
do presente e do passado;
2. Determinacao de Funcoes de Transferencia - a determinacao da dinamica de
modelos de mapeamento de entrada-saıda, que mostra quais os efeitos na saıda de
um sistema segundo uma serie de entradas aplicadas;
3. Analise de Efeitos Nao-Usuais de Intervencao em Sistemas - uso de variaveis
de entradas indicadoras externas (variaveis exogenas) em modelos de funcoes de
transferencia para a representacao e acesso a eventos de intervencoes nao-usuais no
comportamento de uma serie temporal;
4. Controle de Sistemas - a partir da monitoracao de variaveis chaves de um pro-
cesso, pode-se construir um sistema para a predicao dos seus possıveis comporta-
mentos futuros, determinando-se as condicoes otimas para a realizacao do processo.
O foco desta Tese esta contido no primeiro ıtem da lista apresentada — previsao de
series temporais — com a aplicacao de tecnicas inteligentes para a construcao de modelos
de previsao, que, a partir de valores do passado de um certo fenomeno, tenta construir
os seus valores futuros, dando indıcios de quais decisoes devem ser tomadas no presente.
1.2 MOTIVACAO, JUSTIFICATIVA E OBJETIVOS 5
1.2 MOTIVACAO, JUSTIFICATIVA E OBJETIVOS
Grandes esforcos sao realizados na esperanca da determinacao dos acontecimentos futuros
a partir de dados do presente e passado. De forma generica, a estatıstica e o ramo da
ciencia que vem trabalho sistematicamente na elaboracao de modelos para a previsao
de acontecimentos baseados na analise cronologia de um determinado fenomeno e suas
respectivas interacoes com o meio.
Varios modelos estatısticos ja foram propostos. Dentre todos, os modelos de Box &
Jenkins, conhecidos como modelos ARIMA [1], sao os mais difundidos tanto no meio
academico como no meio pratico, principalmente em aplicacoes economicas e financeiras
(bolsas de valores, mercados financeiros, etc).
Os modelos de Box & Jenkins sao muito bem entendidos, porem sao modelos lineares,
o que pode vir a ser um fator limitante se o fenomeno em estudo for governado por
leis de relacionamentos nao-lineares. Neste sentido, varios outros modelos nao-lineares
tambem estatıstico sao propostos, como por exemplo, os modelos bilineares (bilinear
models) [2], os modelos auto-regressivos exponenciais (exponential autoregressive models)
[3], os modelos de limiar auto-regressivo (threshold autoregressive models) [4], os modelos
de estados dependentes (general state dependent models) [5], os modelos auto-regressivos
de transicao suave [6], os modelos auto-regressivos com coeficientes dependentes do tempo
[6], os modelos heterocedasticos condicionais auto-regressivos (ARCH) [7] e os modelos
heterocedasticos condicionais auto-regressivos gerais (GARCH) [8], dentre outros.
Cada um destes modelos estatısticos nao-lineares citados tem suas vantagens e des-
vantagens, sendo aplicados a determinadas situacoes. Embora o objetivo principal da
inclusao da nao-linearidade nos modelos de previsao seja o aumento da capacidade de
descricao dos fenomenos nao-lineares, os resultados praticos com esses modelos, de forma
geral, ainda sao insatisfatorios, sendo comparaveis aos modelos lineares, como observou
De Gooijer e Kumar [6], que em 1992 com o seu artigo de revisao a respeito dos mode-
los nao-lineares, nao conseguiram evidencias claras em favor dos modelos nao-lineares,
quando comparados aos modelos lineares em termos de desempenho de previsao. Tal
situacao nao mudou de forma significativa ate os dias atuais, como relata Clements et
al [9].
Desta forma, na perspectiva de previsao, existe uma grande motivacao para a pesquisa
de modelos nao-lineares, como destaca a edicao especial do International Journal of Fore-
1.2 MOTIVACAO, JUSTIFICATIVA E OBJETIVOS 6
casting de abril/junho de 2004 – Forecasting Economic and Financial Time Series Using
Nonlinear Methods, onde e esperado que a sofisticacao dos testes, selecao e estimacao de
modelos nao-lineares venha a aperfeicoar o desempenho na previsao.
Neste cenario, a Inteligencia Artificial (IA) e vista como uma alternativa para a pre-
visao de series temporais, com metodos e procedimentos geralmente nao-lineares, e que
em termos praticos atuais nao apresentam tantas dificuldades tecnicas quando compa-
rada aos modelos estatısticos nao-lineares. Muitas tecnicas da IA podem ser aplicadas ao
problema de previsao, destacando-se na literatura as tecnicas [10–14],
• Redes Neurais Artificiais;
• Algoritmos Geneticos;
• Programacao Genetica;
• Sistemas de Logica difusa (fuzzy logic).
Muitos trabalhos atuais tambem exploram a combinacao destas tecnicas para a geracao
de solucoes otimizadas com a criacao de sistemas hıbridos inteligentes [15], compostos pela
combinacao de duas (ou mais) tecnica da IA de tal forma que o ponto forte de uma das
tecnicas compense o ponto fraco da outra.
Desta maneira, grandes esforcos ainda necessitam ser aplicados para o estudo e desen-
volvimento de modelos nao-lineares para a previsao de series temporais do mundo real.
Aliado a esta necessidade, a IA com suas tecnicas e algoritmos inteligentes, adaptativos
e evolucionarios apresenta-se com uma area ainda pouco explorada cientificamente na
analise e previsao de series temporais, gerando um campo a ser desbravado.
Neste sentido, e possıvel enumerar os principais objetivos desta Tese,
1. Estudo e analise dos modelos estatısticos lineares mais utilizados na pratica para a
previsao de series temporais, como os modelos de Box & Jenkins;
2. Criacao de um conjunto diversificado de series temporais artificiais e do mundo real
envolvendo tanto fenomenos naturais como fenomenos economicos-financeiros;
3. Estudo e analise das principais tecnicas da Inteligencia Artificial, em particular as
redes neurais artificiais do tipo MLP e os algoritmos geneticos, para a previsao de
series temporais;
1.3 ESTRUTURA DA TESE 7
4. Combinacao adequada de tecnicas de Inteligencia Artificial para a obtencao de um
sistema hıbrido inteligente aplicado ao problema de previsao;
5. Desenvolvimento de simulacoes de operacao de compra e venda de acoes em uma
bolsa de valores real com a utilizacao do metodo hıbrido desenvolvido visando a
criacao de um sistema de apoio a tomada de decisao baseado em previsao.
1.3 ESTRUTURA DA TESE
A estrutura apresentada nesta Tese e composta por dez capıtulos, sendo:
Capıtulo 1 - Introducao: neste primeiro capıtulo e realizada uma breve introducao
ao problema de previsao de series temporais abordado, com a definicao de alguns
termos e caracterısticas utilizadas em um processo generico de previsao;
Capıtulo 2 - O Problema de Previsao de Series Temporais: neste capıtulo e
definido o problema de previsao de series temporais. A partir desta definicao sao
expostos os modelos estatısticos de Box & Jenkins (modelos lineares) e os modelos
estatısticos nao-lineares mais encontrados na literatura para a previsao de series
temporais;
Capıtulo 3 - Abordagens da Inteligencia Artificial para Previsao de Series
Temporais: neste capıtulo sao exibidas as tecnicas da inteligencia artificial mais
populares para a previsao de series temporais: as Redes Neurais Artificiais (RNAs)
e os Algoritmos Geneticos (AGs), expondo os fundamentos basicos de forma a gerar
condicoes suficientes para o entendimento da utilizacao de cada uma dessas tecnicas
a aplicacoes de previsao. A combinacao de tecnicas inteligentes para a criacao de
sistemas hıbridos inteligentes tambem e discutida;
Capıtulo 4 - Caracterizacao das Series Temporais Utilizadas: neste capıtulo
sao mostradas as series temporais utilizadas como estudos de casos. Para cada uma
das series sao discutidas suas caracterısticas e estruturas de correlacoes entre seus
dados, fornecendo subsıdios para a determinacao dos retardos temporais relevantes
a serem utilizados no processo de previsao;
Capıtulo 5 - Resultados Experimentais com Metodos Tradicionais: neste capı-
tulo sao apresentados os resultados experimentais obtidos com os modelos de Box &
1.3 ESTRUTURA DA TESE 8
Jenkins e com as Redes Neurais Artificiais do tipo Perceptron Multicamadas (MLP).
A partir destes experimentos e formada uma base de resultados que servirao como
parametros comparativos para os demais metodos propostos neste trabalho;
Capıtulo 6 - Combinacao de Redes Neurais Artificiais e Algoritmos Geneticos
para a Previsao de Series Temporais: neste capıtulo e realizado o desenvol-
vimento de uma primeira tentativa hıbrida inteligente para a geracao de modelos
para a previsao de series temporais;
Capıtulo 7 - Um Novo Metodo Hıbrido Inteligente para a Previsao de Series
Temporais: neste capıtulo e proposta uma nova metodologia a ser aplicada ao
problema de previsao de series temporais — The Time-delay Added Evolutionary
Forecasting Method (Metodo TAEF) — composto por um sistema hıbrido resul-
tante da combinacao de RNAs e o Algoritmo Genetico Modificado, um processo
de treinamento hıbrido, uma busca evolutiva pelos retardos temporais relevantes
para cada series e um procedimento de ajuste de fase para a determinacao com-
portamental das series. Resultados experimentais para esta nova metodologia sao
apresentados;
Capıtulo 8 - Experimentos Adicionais com o Metodo TAEF: os experimentos
realizados no Capıtulo 7 com o Metodo TAEF utilizam as series temporais expostas
no Capıtulo 4. Entretanto, tais series, mesmo sendo no mundo real, nao apresentam
todas as caracterısticas que podem vir a existir em uma serie, tais como: tendencias,
variancia dependente do tempo, estruturas cıclicas nao-lineares, estruturas com
decaimento exponencial, dentre outras. Desta forma, este capıtulo apresenta um
novo grupo de series criadas artificialmente para o estudo mais aprofundado das
propriedades do Metodo TAEF, com uma analise das suas possıveis limitacoes;
Capıtulo 9 - Simulacao de Compra e Venda de Acoes: neste capıtulo e realizada
uma simulacao com a utilizacao do metodo TAEF para o procedimento de compra
e venda de acoes na bolsa de valores de Sao Paulo - Bovespa. Na simulacao, o
Metodo TAEF passa a administrar uma carteira de acoes indicando as intervencoes
de compra e venda baseado na previsao de cada um dos tıtulos contidos na carteira.
As simulacoes apresentadas tentam copiar um procedimento real de compra e venda
de acoes na Bovespa, tambem comparadas com simulacoes que utilizam os modelos
de Box & Jenkins sob as mesmas condicoes;
1.3 ESTRUTURA DA TESE 9
Capıtulo 10 - Conclusoes: neste capıtulo sao apresentadas as conclusoes dos proce-
dimentos, tecnicas e experimentos realizados. Uma discussao a respeito da nova
metodologia proposta e realizada, limitacoes do trabalho sao relacionadas e dis-
cutidas, e, por fim, propostas de novos trabalhos na mesma linha, com possıveis
ramificacoes do metodo TAEF, sao exibidas.
CAPITULO 2
O PROBLEMA DE PREVISAO DE SERIES
TEMPORAIS
Neste capıtulo e apresentada a descricao do problema de previsao de series temporais,
justificando-se a possibilidade da construcao de um espaco de fase, ou espaco de estados,
que possa reproduzir com fidelidade as estruturas encontradas nos dados das series.
Com a definicao do problema de previsao de series temporais, sao apresentados os
modelos convencionais, basicamente pertencentes ao ramo da estatıstica, tanto lineares
— como os modelos de Box & Jenkins— como varias abordagens nao-lineares encontradas
na literatura.
2.1 INTRODUCAO
Desde tempos remotos o homem tenta prever o futuro na esperanca de melhor se precaver
quanto as dificuldades que lhe esperam. Muitas tecnicas estatısticas tem sido elaboradas
para este fim, em grande maioria baseadas em metodos lineares. Entre os mais populares
encontrados na literatura, destacam-se os modelos de Box-Jenkins (ARIMA) [1] para a
previsao de series temporais.
Nas proximas secoes estara sendo apresentada uma definicao formal do que vem a
ser uma serie temporal e serao descritos alguns dos modelos mais populares aplicados ao
problema de previsao de series temporais desenvolvidos pela estatıstica.
2.2 SERIES TEMPORAIS
Uma serie temporal e uma sequencia de observacoes sobre uma variavel de interesse.
A variavel e observada em pontos temporais discretos, usualmente equidistantes, ou
contınuos. A analise deste comportamento temporal envolve a descricao do processo
ou fenomeno que gera a sequencia de observacoes.
10
2.3 PREVISAO DE SERIES TEMPORAIS 11
Uma serie temporal pode ser definida como,
Zt = {zt ∈ R | t = 1, 2, 3, . . . , N} (.)
onde t e um ındice cronologico (geralmente o tempo, mas nao obrigatoriamente) e N e o
numero total de observacoes.
Desta forma, estara sendo considerado que uma serie temporal Zt e uma sequencia de
observacoes pontuais, igualmente espacadas, ordenadas segundo um ındice cronologico t,
que sera chamado de tempo e definira a granularidade das observacoes.
2.3 PREVISAO DE SERIES TEMPORAIS
A ideia de se aplicar tecnicas de previsao na analise de series temporais tem como intuito
a identificacao de estruturas e padroes existentes em seus dados historicos e a construcao
de um determinado modelo capaz de gerar os proximos padroes temporais da serie.
Os modelos utilizados para a analise de series temporais podem, de forma bastante
generica, abordar o problema em dois domınios: domınio espectral e domınio tempo-
ral. Ambos os casos sao equivalentes. No domınio espectral procura-se pela correta
combinacao de frequencias para a determinacao do espectro da serie, e no domınio tem-
poral, pela escolha correta dos retardos temporais para a determinacao das estruturas
cronologicas da serie.
A abordagem do problema de previsao no domınio temporal e a forma mais popular
encontrada na literatura. A ideia basica e a analise de uma certa janela temporal do
passado e presente para a determinacao dos pontos no futuro. Essa janela temporal e
formada por um conjunto de pontos da serie que trazem consigo informacao suficiente para
a determinacao dos acontecimentos futuros. Estes pontos que compoem a janela temporal
sao chamados de retardos temporais (ou lags), podendo ser a princıpio quaisquer pontos
ja observados na serie.
Neste contexto, um fator primordial para um bom desempenho na previsao e a correta
escolha dos retardos temporais. Desta forma, tais retardos temporais, quando relevantes
a serie, irao gerar estruturas de relacionamento entre os dados historicos de tal maneira
a tornar possıvel a caracterizacao das leis que governam o fenomeno gerador da serie.
Tais estruturas de relacionamento dos dados constituem um espaco de fase d−dimensio-
2.3 PREVISAO DE SERIES TEMPORAIS 12
nal, onde d e a dimensao mınima capaz de representar tais relacionamentos. Desta forma,
um espaco de fase d -dimensional pode ser construıdo de tal modo que contenha toda a
informacao referente a uma serie temporal de interesse. F. Takens [16] no seu trabalho
intitulado “Turbulence in the Chaos” enunciou um conjunto de quatro teoremas que pro-
vam que se d e suficientemente grande, tal espaco de fase e homeomorfico ao espaco de
fase original que gerou a serie temporal.
Assim, os teoremas de Takens [16] sao, primeiramente, a justificativa teorica que
garante a possibilidade da construcao de um espaco de estados com a utilizacao dos
corretos retardos temporais e, de forma secundaria, tambem garante que se o espaco e
corretamente reconstruıdo, a dinamica deste e topologicamente identica a dinamica do
espaco de estados original. Os enunciados dos teoremas de Takens sao encontrados no
Apendice A.
O grande problema na reconstrucao do espaco de estados original e naturalmente a
escolha correta dos retardos temporais necessarios para a caracterizacao da dinamica do
sistema. Para estruturas de relacionamentos lineares entre os dados historicos, pode-se
aplicar as funcoes de auto-correlacao e auto-correlacao parcial [1] para a identificacao
das dependencias relevantes entre os dados. Tais funcoes sao comumente aplicadas em
conjunto com modelos lineares, como na construcao dos modelos de Box & Jenkins.
Entretanto, independentemente do modelo de previsao aplicado, linear ou nao-linear,
muitos outros metodos sao propostos na literatura para a definicao dos retardos temporais
relevantes [17–19]. Tais metodos sao baseados em calculos de probabilidades condicionais,
os quais consideram que a serie temporal e da forma,
Zt = f(zt−1, zt−2, . . . , zt−d) + rt (.)
onde f(zt−1, zt−2, . . . , zt−d) e uma funcao que realiza um possıvel mapeamento entre os
valores do passado e do futuro e rt e um termo de ruıdo. Em geral, rt decresce com o
incremento de d, e se o sistema for totalmente determinıstico, rt tende a zero quando
d excede a dimensao embutida mınima necessaria para a descricao do sistema. Estes
procedimentos almejam a obtencao dos pontos:
1. A dimensao embutida mınima, dmin;
2. A sensibilidade de Zt com respeito aos retardos temporais;
3. A estimativa do tamanho do ruıdo, rt.
2.4 MODELOS CONVENCIONAIS PARA PREVISAO DE SERIES TEMPORAIS 13
E possıvel citar alguns exemplos de teste que utilizam estes procedimentos para a
verificacao e determinacao dos retardos temporais relevantes, como: o BSD Test [17], a
analise de variaveis independentes [1], e o metodo δ-Test [18], dentre outros [19]. Contudo,
de forma geral, tais metodos sao formulados a partir de dependencias primarias entre as
variaveis, descartando-se as dependencias induzidas (ordem superior a 1), ou seja, se
f(Zt−1) = f(f(Zt−2)) (.)
Zt−1 e a dependencia primaria, e a dependencia induzida sobre Zt−2 nao e considerada.
Uma outra metodologia totalmente grafica aplicada a determinacao dos retardos tem-
porais relevantes, chamada por Donald B. Percival e Andrew T. Walden [20] de lagplot
ou de phase portrait por Holger Kantz e Thomas Schreiber [21], consiste simplesmente na
construcao de graficos de dispersao entre os retardos (Zt vs Zt−1, Zt vs Zt−2, Zt vs Zt−3,
. . .). A existencia de alguma relevancia para um dado retardo pode ser observada com o
aparecimento de alguma estrutura nestes graficos. Tal tecnica e bastante limitada uma
vez que depende da interpretacao humana dos graficos. Entretanto, a sua simplicidade e
um forte argumento para sua utilizacao, mesmo que apenas de forma estimativa.
2.4 MODELOS CONVENCIONAIS PARA PREVISAO DE SERIES TEMPORAIS
Para a realizacao de um processo de previsao de series temporais, de forma sistematica e
cientıfica, ha a necessidade de representar as caracterısticas da serie atraves de um modelo
matematico e/ou computacional que possa, de alguma forma, estimar tais caracterısticas
no futuro.
Na maioria dos casos, os modelos convencionais estatısticos sao desenvolvidos para
representarem os seguintes tipos de padroes de informacoes, ou uma combinacao destes [1]:
1. Constantes – Processamentos que permanecem constantes sobre um certo nıvel
todo o tempo, com variacoes de perıodo a perıodo devido a causas aleatorias;
2. Tendencias – Padroes com tendencias no nıvel dos processos, sendo a variacao de
um perıodo a outro atribuıda a uma tendencia mais uma variacao aleatoria;
3. Sazonalidades – Processos que variam ciclicamente no tempo, como em processos
periodicos, por exemplo: o clima;
2.4 MODELOS CONVENCIONAIS PARA PREVISAO DE SERIES TEMPORAIS 14
4. Ciclos – Processos que apresentam um desvio cıclico em torno de sua tendencia
com um frequencia nao muito bem definida.
Embora os padroes descritos acima sejam os mais corriqueiros, algumas variacoes
podem ocorrer, com o aparecimento de padroes de transientes, impulsos, degraus, apare-
cimento subito de tendencias, dentre outras.
De forma geral, os modelos convencionais da estatıstica para a representacao de series
temporais sao baseados em funcoes temporais algebricas ou transcendentais, ou ainda
alguma composicao de ambas [22–24], podendo ser escritos de forma generica como,
Zt = b1f1(t) + b2f2(t) + · · ·+ bkfk(t) + rt (.)
onde bi e fi(t) (i = 1, 2, 3, . . . , k) sao parametros constantes e funcoes matematicas de t
respectivamente, e rt e uma componente aleatoria.
Contudo, ainda existem outras formas de modelagens, como por exemplo a corrente
observacao de Zt descrita como uma funcao das componentes aleatorias ordenadas tem-
poralmente, do presente para o passado: rt, rt−1, rt−2, . . .
Zt = m + y0rt + y1rt−1 + y2rt−2 + · · · + ykrt−k (.)
onde m e {yi} (i = 1, 2, 3, . . .,k) sao constantes. A Equacao (.) e comumente chamada
de “modelos de filtros lineares”.
A previsao de series temporais consiste na estimativa dos parametros desconhecidos
dos modelos apropriados para a sua descricao, com o intuito de projetar os valores futuros
da serie.
2.4.1 Modelos de Box & Jenkins
Na literatura e possıvel encontrar uma grande quantidade de modelos propostos para
a previsao de series temporais. A grande maioria destes modelos sao lineares, onde e
possıvel citar: Medias Moveis Simples (MMS) [23, 24], Alisamento Exponencial Simples
(AES) [23, 24], Alisamento Exponencial Linear de Brow (AELB) [23, 24], Alisamento
Exponencial Biparametrico de Holt (AEBH) [23,24], Filtragem Adaptativa (FA) [23,24],
dentre outros [1,22–24]. Entretanto, dentre estes modelos, uma classe recebe um destaque
2.4 MODELOS CONVENCIONAIS PARA PREVISAO DE SERIES TEMPORAIS 15
especial, os modelos de Box & Jenkins [1], que de forma pratica sao os mais populares.
Box & Jenkins [1] propuseram uma famılia de modelos algebricos (chamados de mo-
delos ARIMA), onde a partir dos quais seleciona-se um modelo que melhor desempenhe a
previsao de uma dada serie temporal. O modelo ARIMA(p, d, q) (Autoregressive Integra-
ted Moving Average) e uma combinacao de outros modelos, o AR(p) (Autoregressive) [1]
e o MA(q) (Moving Average) [1], combinados com uma integracao de ordem d.
Um modelo ARIMA(p, d, q) e um estudo algebrico que mostra como uma variavel
de uma serie temporal (Zt) e relacionada com seus proprios valores passados (Zt−1, . . . ,
Zt−p) e os valores passados dos termos de ruıdo (rt−1, . . . , rt−q), diferenciados d vezes.
Box & Jenkins propuseram um procedimento pratico para encontrar um modelo ade-
quado para uma dada situacao, como esquematizado na Figura 2.1.
Figura 2.1: Estagios para a construcao de um modelo iterativo de Box e Jenkins.
No Estagio 1 da Figura 2.1, identificacao, usam-se dois dispositivos graficos para se
medir a correlacao entre as observacoes dentro de um conjunto de dados da serie temporal.
Estes dispositivos sao: a funcao de auto-correlacao e a funcao de correlacao parcial [1].
A partir destes escolhem-se possıveis modelos candidatos.
No Estagio 2 da Figura 2.1, estimacao, estimam-se os coeficientes do modelo escolhido
no estagio anterior.
No Estagio 3 da Figura 2.1, diagnostico, Box e Jenkins supuseram alguns procedimen-
2.4 MODELOS CONVENCIONAIS PARA PREVISAO DE SERIES TEMPORAIS 16
tos de checagens para determinar se o modelo e estatisticamente adequado. Um modelo
que falhe nestes testes e rejeitado [1, 23].
Em geral, os modelos sao parcimoniosos, pois contem um numero pequeno de parametros
e as previsoes obtidas sao bastantes precisas, comparando-se com outros metodos lineares.
2.4.1.1 Modelos Auto-Regressivos de Ordem p
Um modelo auto-regressivo de ordem p (AR(p)) considera que um determinado ponto no
tempo t da serie e dependente de pontos passados mais um termo aleatorio, dado por,
Zt = φ1Zt−1 + φ2Zt−2 + · · ·+ φpZt−p + rt (.)
onde, sem perda de generalidade, foi subtraıdo o nıvel medio (µ) da serie,
Zk = Zk − µ (.)
e os temos φi (i = 1, 2, . . . , p) sao os coeficientes auto-regressivos.
Definindo o operador auto-regressivo estacionario de ordem p como,
Φ(B) = 1 − φ1B − φ2B2 − · · · − φpB
p (.)
onde a condicao de estacionariedade e |B| ≤ 1 (B e o operador Translacao para o passado
– BmZt = Zt−m), pode-se escrever a Equacao (.) como,
Φ(B)Zt = rt (.)
2.4.1.1.1 Funcao de Auto-Correlacao para o Modelo AR(p). A funcao de auto-correlacao
(FAC) de um processo AR(p) estacionario e encontrada multiplicando-se Zt−j com Zt,
ou seja,
Zt−jZt = φ1Zt−jZt−1 + · · ·+ φpZt−jZt−p + Zt−jrt (.)
Como o termo Zt−k (k = 1, 2, ..., p) so envolve ruıdos ate rt−k, nao correlacionados
com rt, o valor esperado E(Zt−jZt−k) = 0 se j > k. Logo, calculando-se o valor esperado
da Equacao (.),
γj = φ1γj−1 + φ2γj−2 + · · · + φpγj−p (.)
2.4 MODELOS CONVENCIONAIS PARA PREVISAO DE SERIES TEMPORAIS 17
onde γj = E(Zt−jZt
). Dividindo-se todos os termos da equacao Equacao (.) por γ0,
que e a variancia de Z (V ar(Z)), obtem-se
ρj = φ1ρj−1 + φ2ρj−2 + · · · + φpρj−p, para j > 0 (.)
onde ρk = γk
γ0. Desta forma, e possıvel escrever a Equacao (.) (Funcao de Auto-
Correlacao normalizada para um modelo AR(p)) como,
Φ(B)ρj = 0 (.)
onde o operador B age sobre o ındice j. Pode-se mostrar [1] que a solucao geral da
Equacao (.) e escrita como,
ρj = A1Gj1 + A2G
j2 + · · ·+ ApG
jp (.)
Para situacoes estacionarias, ou seja, |Gi| < 1, e se as raızes forem distintas, duas
situacoes podem ocorrer:
1. Se Gi for real, o termo AiGji decai geometricamente para zero (amortecimento
exponencial);
2. Se Gi for complexa, um par de raızes complexas conjugadas contribui com um termo
da forma Adjsen(2πfj +φ) (senoide amortecida), onde f e uma frequencia, φ e uma
fase, e o termo Adj e a amplitude que decresce com o incremento de j (|d| < 1).
Portanto, a forma geral da funcao de auto-correlacao de um processo AR e constituıda
por uma mistura de exponenciais e senoides amortecidas, como mostrado na Figura 2.2.
As funcoes de auto-correlacao podem ser estimadas por,
rj =Cj
C0, j = 1, . . . , p − 1 (.)
onde
Ck =1
N
N−k∑
t=1
(Zt − Z
) (Zt+k − Z
), k = 0, 1, . . . , N − 1 (.)
2.4 MODELOS CONVENCIONAIS PARA PREVISAO DE SERIES TEMPORAIS 18
Figura 2.2: Graficos tıpicos das FACs para um Modelo AR. (a) φ = 0.8 e (b) φ = −0.8.
sendo Ck e a funcao de auto-correlacao amostral e Z e a media amostral.
2.4.1.2 Modelos de Medias Moveis de Ordem q
Um processo de medias moveis de ordem q, chamado de MA(q) (Moving Average), e
caracterizado pela combinacao dos choques aleatorios ocorridos no passado, descrito por,
Zt = µ + rt − θ1rt−1 − · · · − θqrt−q. (.)
Utilizando o fato que Zt = Zt − µ, pode-se escrever,
Z = (1 − θ1B − θ2B2 − · · · − θqB
q)rt = Θ(B)at (.)
onde
Θ(B) = 1 − θ1B − θ2B2 − · · · − θqB
q (.)
e o operador de medias moveis.
2.4.1.2.1 Funcao de Auto-Correlacao para o Modelo MA(q). Da Equacao (.), a
funcao de Auto-correlacao (FAC) e calculada como,
2.4 MODELOS CONVENCIONAIS PARA PREVISAO DE SERIES TEMPORAIS 19
γj = E{ZtZt−j} = E
([rt −
q∑
k=1
θkrt−k
][rt−j −
q∑
l=1
θlrt−j−l
])
= E(rtrt−j) −q∑
k=1
θkE(rt−jrt−k) −q∑
l=1
θlE(rtrt−j−l) +
q∑
k=1
q∑
l=1
θkθlE(rt−krt−j−l)
(.)
Lembrando que,
γr(j) = E(rtrt−j) =
{σ2
r , j = 0
0, j 6= 0(.)
e
γ0 = V ar(Zt) = σ2Z = (1 + θ2
1 + · · ·+ θ2q)σ
2a (.)
Pode-se organizar os ındices da Equacao (.), reescrevendo-a em termos de γr,
resultando em,
γj = γr(j) −q∑
k=1
θkγr(k − j) −q∑
l=1
θlγr(j + l) +
q∑
k=1
q∑
l=1
θkθlγr(j + l − k) (.)
levando a,
γj =
{(−θj +
∑q
l=1 θlθl+j)σ2r = (−θj + θ1θj+1 + θ2θj+2 + · · ·+ θqθq−j)σ
2r , j = 1, . . . , q
0, j > q
(.)
ou simplesmente,
ρj =
{−θj+θ1θj+1+θ2θj+2+···+θqθq−j
1+θ21+···+θ2
q, j = 1, . . . , q
0, j > q(.)
Observe que a funcao FAC de um processo MA(q) e igual a zero para retardos tem-
porais de ordem superior a q.
2.4 MODELOS CONVENCIONAIS PARA PREVISAO DE SERIES TEMPORAIS 20
2.4.1.3 Modelos Mistos: Auto-Regressivos com Medias Moveis
Para muitas series encontradas na pratica, um modelo com o menor numero possıvel
de parametros e desejado (princıpio da parcimonidade). A inclusao de termos auto-
regressivos e de medias moveis em um unico modelo e uma possıvel solucao para a ob-
tencao de uma pequena quantidade de parametros. Desta uniao surgem os modelos
ARMA(p, q), da forma,
Zt = φ1Zt−1 + · · · + φpZt−p + rt − θ1rt−1 − · · · − θqrt−q. (.)
Sendo Φ(B) e Θ(B) os operadores auto-regressivos e de medias moveis, introduzidos
anteriormente, pode-se escrever a Equacao (.) em uma forma compacta,
Φ(B)Zt = Θ(B)rt (.)
2.4.1.3.1 Funcao de Auto-Correlacao (FAC). Multiplicando-se a Equacao (.) por
Zt−j e tomando-se o valor esperado tem-se,
γj = E(ZtZt−j) = E{(
φ1Zt−1 + · · ·+ φpZt−p + rt − θ1rt−1 − · · · − θqrt−q
)Zt−j
}
(.)
ou
γj = φ1γj−1 + φ2γj−2 + · · · + φpγj−p − θ1γZr(j − 1) − · · · − θqγZr(j − q) (.)
onde γZr(j) e a covariancia cruzada entre Zt e rt, definida por,
γZr(j) = E(rtZt−j) (.)
Como Zt−j so depende de choques rt ocorridos ate o instante t-j,
γZr(j) −→{
= 0, j > 0
6= 0, j ≤ 0(.)
2.4 MODELOS CONVENCIONAIS PARA PREVISAO DE SERIES TEMPORAIS 21
de modo que,
γj = φ1γj−1 + φ2γj−2 + · · ·+ φpγj−p, j > q (.)
Desta forma, obtem-se,
ρj = φ1ρj−1 + φ2ρj−2 + · · ·+ φpρj−p, j > q (.)
deduzindo-se que as auto-correlacoes de retardos temporais 1, 2, . . . , q serao afetadas pelos
parametros de medias moveis, ja para j > q as mesmas comportam-se como nos modelos
auto-regressivos. Pode-se verificar [1] que se q < p a funcao de auto-correlacao consiste
de uma mistura de exponenciais e/ou senoides amortecidas, entretanto, se q ≥ p, os
primeiros q-p+1 valores ρ0, ρ1, . . . , ρq−p nao seguirao este padrao.
2.4.1.4 Funcao de Auto-Correlacao Parcial (FACP)
Alem das funcoes de auto-correlacao, Box & Jenkins [1] propuseram a utilizacao de um
outro instrumento para facilitar o procedimento de identificacao: a Funcao de Auto-
Correlacao Parcial (FACP).
Considere um modelo AR(k). Sendo φkj o j-esimo coeficiente auto-regressivo, de tal
modo que φkk seja o ultimo coeficiente, e possıvel escrever,
ρj = φk1ρj−1 + φk2ρj−2 + · · ·+ φkkρj−k, j = 1, . . . , k (.)
A partir da Equacao (.) e possıvel se obter a equacao de Yule-Walker [1],
1 ρ1 · · · ρk−1
ρ1 1 · · · ρk−2
...
ρk−1 ρk−2 · · · 1
φk1
φk2
...
φkk
=
ρ1
ρ2
...
ρk
(.)
Resolvendo este sistema de equacoes para k = 1, 2, . . ., obtem-se de forma geral,
2.4 MODELOS CONVENCIONAIS PARA PREVISAO DE SERIES TEMPORAIS 22
φkk =|P ∗
k ||Pk|
(.)
onde Pk e a matriz de auto-correlacao e P ∗k e a matriz de auto-correlacao com a ultima
coluna substituıda pelo vetor de auto-correlacoes.
A quantidade φkk, encarada como uma funcao de k, e denominada de Funcao de Auto-
Correlacao Parcial (FACP). Pode-se demonstrar [1] que, para os processos ja vistos,
1. Um processo AR(p) tem FACP φkk 6= 0 para k ≤ p, e φkk = 0 para k > p;
2. Um processo MA(q) tem FACP que se comporta de maneira similar as FACs de um
processo AR(p), sao dominadas por exponenciais e/ou senoides amortecidas;
3. Um processo ARMA(p,q) tem FACP que se comporta como a FACP de um processo
MA(p) puro.
2.4.1.5 Modelos ARIMA
Os modelos apresentados ate o momento sao apropriados para a descricao de series esta-
cionarias, isto e, series que se desenvolvem no tempo ao redor de um nıvel constante.
Algumas series, que sao nao estacionarias, quando diferenciadas, tornam-se esta-
cionarias. Por exemplo, Zt na Equacao (.) e uma serie nao estacionaria, mas Wt
e uma serie estacionaria.
Wt = Zt − Zt−1 = (1 − B)Zt = ∆Zt (.)
Os modelos com este tipo de filtro de diferencas sao apropriados para series cujo com-
portamento e nao explosivo, em particular series que apresentam alguma homogeneidade
em seu comportamento nao estacionario [1].
Series Zt tais que, tomando-se um numero finito de diferencas, d, tornam-se esta-
cionarias, sao chamadas “nao estacionarias homogeneas”.
Se
Wt = ∆dZt (.)
2.4 MODELOS CONVENCIONAIS PARA PREVISAO DE SERIES TEMPORAIS 23
e estacionaria, pode-se representar Wt por um modelo ARMA(p, q), ou seja,
Φ(B)Wt = Θ(B)rt (.)
Se Wt e uma diferenca de Zt, entao Zt e uma integral de Wt, daı se diz que Zt e um
modelo Auto-Regressivo-Integrado-Medias-Moveis, ou simplesmente um Modelo ARIMA,
Φ(B)∆dZt = Θ(B)rt (.)
escrevendo-se ARIMA(p, d, q), sendo p e q as ordens de Φ(B) e Θ(B), respectivamente, e
d a ordem das diferencas.
Na grande maioria dos casos d = 1 ou d = 2 e utilizado para a construcao dos modelos
na pratica, correspondendo a dois casos comuns de nao estacionariedade homogeneas [1]:
• Series nao estacionarias quanto ao nıvel: oscilam ao redor de um nıvel du-
rante algum tempo e depois saltam para outro nıvel temporario. Para torna-las
estacionarias e suficiente tomar uma diferenca;
• Series nao estacionarias quanto a inclinacao: oscilam numa direcao por algum
tempo e depois mudam para outra direcao temporaria. Para torna-las estacionarias
e necessario tomar a segunda diferenca.
2.4.2 Modelos Nao-Lineares
A grande maioria da literatura de series temporais nao somente assume que as series
sao estacionarias (ou que podem ser transformadas em series estacionarias atraves de
alguma transformacao simples), mas que estas tambem sao processos lineares, de forma
que podem ser representadas por modelos lineares.
Entretanto, nao ha nenhuma razao que generalize a suposicao de linearidade. Na
realidade, e de se esperar que devido a natureza nao-linear do meio que forma o cenario de
acontecimentos da serie temporal (mundo real), e bem mais natural se supor a existencia
de estruturas nao-lineares [9].
De forma geral, as series temporais podem ser modeladas como,
2.4 MODELOS CONVENCIONAIS PARA PREVISAO DE SERIES TEMPORAIS 24
Zt = h(Zt−1, . . . , Zt−p, rt−1, . . . , rt−q) + rt (.)
onde {rt} e um termo de ruıdo, p e q sao ındices inteiros que determinam as janelas de
dependencia temporal nos termos passados da serie e do ruıdo, respectivamente, e h(·)e uma funcao nao-linear de transferencia, que modela o mapeamento entre os valores do
futuro e os valores do passado.
Varios modelos nao lineares estatısticos tem sido propostos, como os modelos bilinear
(bilinear models) [2], os modelos auto-regressivos exponenciais (exponential autoregressive
models) [3], os modelos de limiar auto-regressivo (threshold autoregressive models) [4], e
os modelos de estados dependentes (general state dependent models) [5], dentre outros.
Expandindo a Equacao (.) em serie de Taylor, em torno de um ponto fixo no
tempo, encontra-se,
Zt +
p∑
i=1
φi(yt−1)Zt−1 = µ(yt−1) + rt +
q∑
j+1
θi(yt−1)rt−j (.)
yt = (rt−q+1, . . . , rt, Zt−p+1, . . . , Zt)′ e o entao chamado vetor de estado, onde o apostrofo
denota o sinal de transposicao. Este modelo, Equacao (.), e chamado de modelo
de estado dependente de ordem (p, q) e pode ser tido como uma linearizacao local da
Equacao (.). Os parametros deste modelo sao φi(x)(i = 1, . . . , p), θj(x)(j = 1, . . . , q)
e µ(x), onde todos dependem do estado do processo sobre o tempo t-1.
Uma classe destes modelos, os modelos bilineares, pode ser resguardada como uma
extensao nao-linear natural de um modelo ARMA. Fazendo µ(x) e φi(x) constantes e
θj(yt−1) = θj +∑Q
v=1 cjvZt−v (sendo j = 1, . . ., e cjv os coeficientes a serem determinados)
no modelo da Equacao (.), tem-se a forma geral para os modelos bilineares, dada pela
Equacao (.) – modelo bilinear de ordem (p,q,P,Q).
Zt +
p∑
i=1
φiZt−i = µ + rt +
q∑
j=1
θjrt−j +
P∑
u=1
Q∑
v=1
cuvZt−vrt−u (.)
Perceba que a Equacao (.) e linear nos termos Zt e rt, e nao-linear em relacao ao
termo cruzado de Z e r (ultimo termo da Equacao (.)). Fazendo todos os cuv = 0 na
Equacao (.), esta se reduz a um modelo ARMA(p,q).
2.4 MODELOS CONVENCIONAIS PARA PREVISAO DE SERIES TEMPORAIS 25
De forma pratica, um modelo bilinear de primeira ordem e montado a partir da
Equacao (.) e e dado por,
Zt = αZt−1 + βrt + γZt−1rt−1 (.)
onde α, β, e γ sao parametros constantes a serem determinados. Note que o ultimo termo
e o nao-linear.
De forma geral, os modelos bilineares tem a vantagem de serem mais gerais, conside-
rando a correlacao entre os pontos da serie temporal propriamente ditos (Zt) e os termos
de ruıdo inerentes (r). Contudo, uma grande dificuldade vem da ardua derivacao das
condicoes suficientes para existencia de solucoes estacionarias [6].
Fazendo-se agora µ(x) uma constante, θj(x) = 0 (∀ x), e φi(yt−1) = φi+πiexp(−γZ2t−1)
na Equacao (.), obtem-se os chamados modelos auto-regressivos exponenciais de or-
dem p (Equacao (.)) onde o parametro γ e um fator de escala para a serie temporal.
Zt +
p∑
i=1
{φi + πiexp(−γZ2
t−1)}
Zt−i = µ + rt (.)
Uma grande vantagem deste tipo do modelo e a possibilidade de pre-estabelecimento
de alguns tipos de comportamento. Por exemplo, fazendo p = 2 na Equacao (.), pode-
se incorporar procedimentos de frequencias dependentes da amplitude e padroes cıclicos.
A grande dificuldade vem do fato que a estimacao dos parametros e essencialmente um
problema de otimizacao nao-linear, envolvendo grandes dificuldades computacionais.
Outra classe de modelos nao-lineares sao os modelos de limiar auto-regressivo (TAR –
Threshold Autoregressive), que sao uma famılia de processos cujos parametros dependem
dos valores passados do proprio processo. Desta forma, os modelos TAR representam um
conjunto finito de possıveis modelos AR que um determinado processo pode vir a obedecer
em qualquer ponto no tempo. Se a passagem relativa entre os modelos e determinada
pela localizacao dos valores dos dados em relacao aos limiares, o modelo TAR e dito ser
auto-excitado (SETAR) [25]. Um modelo TAR de primeira ordem pode ser escrito como,
Zt =
{α1Zt−1 + rt, se Zt−1 < d
α2Zt−1 + rt, se Zt−1 ≥ d(.)
2.4 MODELOS CONVENCIONAIS PARA PREVISAO DE SERIES TEMPORAIS 26
onde a constante d e chamada de limiar.
Fazendo µ(x) = φ(j)0 , θ(x) = 0 (∀ x) e φi(yt−1) = φ
(j)i se Zt−d ∈ R(j) (i = 1, . . . , p;
j = 1, . . . , l), onde d e um inteiro positivo e R(j) e um subconjunto dos numeros reais (os
limiares), a Equacao (.) transforma-se em,
Zt + φ(j)0 +
p∑
i=1
φ(j)i Zt−i = r
(j)t , Se Zt−d ∈ R(j), j = 1, . . . , l (.)
onde este e um modelo SETAR(l, p, . . . , p), sendo {r(j)t } um ruıdo branco, e r
(j)t e inde-
pendente de r(j′)t , com j 6= j ′.
Desta forma, a ideia central dos modelos TAR e SETAR e a modelagem do espaco de
estados de um determinado fenomeno nao-linear por partes ou trechos, de tal forma que
em cada um destes trechos, caracterizados por um valor de limiar, seja possıvel aproximar
o fenomeno por um modelo linear.
Ainda existe uma gama enorme de outros modelos nao lineares, como por exemplo,
modelos auto-regressivos de transicao suave [6], modelos auto-regressivos com coeficien-
tes dependentes do tempo [6], modelos heterocedasticos condicionais auto-regressivos
(ARCH) [7], dentre outros.
Em especial, os modelos do tipo ARCH [7] nao podem ser representados como uma
variacao da Equacao (.). Esta nova classe de modelos foi apresentada por Engle [7]
como uma famılia parametrica especıfica de heteroscedasticidade em um modelo AR.
O modelo ARCH de ordem q e definido como um modelo AR(q) onde {rt} e condi-
cionado a informacao avaliada no tempo t − 1, com variancia,
ht = α0 +
q∑
i+1
αir2t−i (.)
com α0 > 0 e αi ≥ 0. Desta forma, o modelo ARCH e dado pela equacao,
Zt = rt
[α0 +
q∑
i+1
αir2t−i
] 1
2
(.)
Neste modelo a nao-linearidade vem da variancia condicional de {rt}.
2.4 MODELOS CONVENCIONAIS PARA PREVISAO DE SERIES TEMPORAIS 27
Desde o trabalho de Engle [7], muitas variacoes do modelo ARCH tem sido propostas.
Uma importante expansao do modelo ARCH e o modelo heterocedastico condicional auto-
regressivos geral (GARCH), sugerido por Bollerslev [8], onde e permitido que a variancia
condicional ht tambem seja uma funcao de si propria, isto e, uma funcao de ht−1, . . . , ht−p
— modelo GARCH(p, q).
Os modelos ARCH e GARCH ja foram aplicados com sucesso na economia [6], contudo
existem algumas desvantagens do ponto de vista tecnico. Uma destas desvantagens vem
da mistura de operacoes de adicao e multiplicacao na Equacao (.), resultando em
uma parametrizacao pouco natural e nao intuitiva, levando a grandes complicacoes para
se provar algum resultado aplicado a estes modelos. Um segundo ponto vem do fato
de que apenas momentos estatısticos de baixas ordens aparentam existir. De forma
pratica, o quarto momento ja se apresenta como uma grandeza infinita, implicando que
variancias de algumas estatısticas importantes possam ser infinitas ou muito grandes.
Um outro aspecto negativo para estes modelos e que a suposicao que a distribuicao de
{rt} assintota a distribuicao normal e fraca para amostras finitas.
A partir de uma visao geral da literatura, tem-se a sugestao de que o desempenho
de previsao para tais modelos nao-lineares esta abaixo do esperado [9]. Devido ao nıvel
de complexidade adicionado ao problema de previsao com uma abordagem nao-linear,
quando comparado com uma abordagem linear, nao ha um ganho de desempenho signifi-
cativo na previsao como poderia ser esperado [9]. De Gooijer e Kumar [6], em 1992, com
o seu artigo de revisao a respeito dos modelos nao-lineares, nao conseguiram evidencias
claras em favor dos modelos nao-lineares, quando comparados aos modelos lineares em
termos de desempenho de previsao. Tal situacao nao mudou de forma significativa ate os
dias atuais, como relata Clements et al [9].
Entretanto, e um conceito global aceitar que o ambiente gerador das series temporais
e nao-linear de forma geral, e portanto o problema pode ser simplesmente o fato que
os atuais modelos nao-lineares nao consigam descrever a realidade de forma tao me-
lhor que as simples aproximacoes lineares, sugerindo que uma nova abordagem deve ser
desenvolvida.
Observa-se em particular nas ciencias economicas, como nas teorias macroeconomicas
e financeiras, que um grande repositorio de modelos nao-lineares esta em voga. Por
exemplo, a maior parte dos modelos de ciclo real de negocios sao altamente nao-lineares
[9], como tambem os modelos de financas [9]. O uso destes modelos nao-lineares na
2.4 MODELOS CONVENCIONAIS PARA PREVISAO DE SERIES TEMPORAIS 28
economia e financas e totalmente consistente com o uso dos modelos lineares aplicados
na pratica, uma vez que tais modelos podem ser vistos como uma aproximacao dos
fenomenos nao-lineares de interesse.
Desta forma, na perspectiva de previsao, existe uma grande motivacao para a pesquisa
de modelos nao-lineares, como destaca a edicao especial do International Journal of Fore-
casting de abril/junho de 2004 – Forecasting Economic and Financial Time Series Using
Nonlinear Methods, onde e esperado que a sofisticacao dos testes, selecao e estimacao de
modelos nao-lineares venha a aperfeicoar o desempenho na previsao.
Assim, nao e surpreendente que modelos nao-lineares nos ultimos anos tenham tido
grande atencao na literatura, ate mesmo com a inclusao de novos paradigmas aplicados ao
problema de previsao, como e o caso das redes neurais artificiais, dos algoritmos geneticos
e outras tecnicas de inteligencia artificial, que serao abordados no proximo capıtulo.
CAPITULO 3
ABORDAGENS DA INTELIGENCIA ARTIFICIAL PARA
PREVISAO DE SERIES TEMPORAIS
Neste Capıtulo e apresentada uma discussao a respeito dos metodos e tecnicas mais
populares da Inteligencia Artificial encontrados na literatura aplicados ao problema de
previsao de series temporais.
3.1 INTRODUCAO
A estatıstica e o ramo da ciencia que aborda naturalmente o problema de previsao de
series temporais [1,22–24], apresentando genericamente: (a) os modelos lineares, que sao
muito bem entendidos, mas que nem sempre sao aptos para a resolucao do problema; e
(b) os modelos nao-lineares, que tentam suprir as deficiencias dos modelos lineares, mas
que, devido ao alto grau de complexidade, nem sempre sao aplicaveis na pratica.
Neste cenario, e vista como uma alternativa a Inteligencia Artificial (IA), com metodos
e procedimentos geralmente nao-lineares, e que em termos praticos atuais nao apresen-
tam tantas dificuldades tecnicas quando comparada aos modelos estatısticos nao-lineares.
Muitas tecnicas da IA podem ser aplicadas ao problema de previsao, destacando-se na
literatura as tecnicas [10–14]:
• Redes Neurais Artificiais;
• Algoritmos Geneticos;
• Programacao Genetica;
• Sistemas de Logica difusa (fuzzy logic).
Muitos trabalhos atuais tambem exploram a combinacao destas tecnicas para a geracao
de solucoes otimizadas com a criacao de sistemas hıbridos inteligentes [15].
29
3.2 REDES NEURAIS ARTIFICIAIS 30
Neste Capıtulo e apresentada uma visao a respeito das duas primeiras tecnicas da
IA citadas, redes neurais artificiais e algoritmos geneticos, quando aplicadas a solucao
do problema de previsao de series temporais. Estas tecnicas sao as mais utilizadas em
abordagens ao problema de previsao, podendo ser facilmente combinadas [10, 15].
3.2 REDES NEURAIS ARTIFICIAIS
Redes Neurais Artificiais (RNAs) sao algoritmos originalmente baseados no funcionamento
de sistemas neurais biologicos e, em particular, o cerebro humano [26]. As RNAs sao siste-
mas paralelos distribuıdos compostos por unidades de processamento simples, chamadas
de neuronios ou nodos, que calculam funcoes matematicas, normalmente nao-lineares.
Os neuronios ou nodos sao dispostos em um arranjo espacial composto geralmente
por uma ou mais camadas e interligados por um grande numero de conexoes. Na maior
parte dos modelos, estas conexoes estao associadas a pesos, os quais armazenam o conhe-
cimento representado no modelo e servem como ponderadores para os sinais de entrada
dos neuronios da rede.
Cada uma das unidades de uma RNA e condicionada a receber um sinal. Este sinal,
ponderado pelos respectivos pesos das conexoes de entrada da unidade, e processado
por uma funcao matematica, chamada de funcao de ativacao ou funcao de transferencia,
produzindo um novo sinal de saıda que e propagado pela rede.
As RNAs possuem a capacidade de aprender atraves de exemplos, realizar inter-
polacoes dos dados e extrapolacoes das informacoes aprendidas. No processo de apren-
dizado de uma RNA a principal tarefa e a determinacao da intensidade das conexoes
entre os neuronios, sendo os algoritmos de aprendizado utilizados para a adaptacao destes
parametros. Estes algoritmos tem a finalidade de realizar o ajuste dos pesos das conexoes
para a melhor generalizacao possıvel da informacao contida nos exemplos expostos.
Muitos tipos de modelos de RNAs tem sido propostos, dentre os quais, podem-se
destacar os mais populares,
• Redes Multi-Layer Perceptron (MLP) [27];
• Redes Recorrentes [27];
• Redes de Kohonen [28, 29];
3.3 REDES NEURAIS ARTIFICIAIS E O PROBLEMA DE PREVISAO 31
• Redes de Hopfield [30];
• Redes ART [31].
Destes tipos de modelos de RNAs, as rede MLPs sao indubitavelmente as mais po-
pulares devido a sua praticidade, flexibilidade e eficiencia, sendo aplicada a uma vasta
gama de problemas [10, 27, 32, 33].
3.3 REDES NEURAIS ARTIFICIAIS E O PROBLEMA DE PREVISAO
As RNAs constituem uma ferramenta bastante atraente para o problema de previsao
devido as suas caracterısticas intrınsecas de mapeamento de entradas e saıdas. De forma
contraria aos metodos baseados em modelos analıticos, as RNAs sao metodos adaptativos
baseados em dados, com nenhuma (ou quase nenhuma) suposicao a priori do fenomeno
em estudo. As redes aprendem exclusivamente a partir de exemplos e capturam os relacio-
namentos e estruturas que possam vir a existir nos dados, mesmo que tais relacoes e estru-
turas sejam desconhecidas e/ou de difıcil observacao para especialistas humanos. Desta
forma, as RNAs sao adequadas para problemas cujas solucoes requerem um conhecimento
que nao pode ser adquirido de forma simples, mas para os quais ha quantidade de dados
estatisticamente representativa, contendo a informacao desejada. Neste sentido, as RNAs
sao tidas como um metodo estatıstico nao parametrico nao-linear multivariavel [34–36].
Uma desvantagem de modelos dependentes unicamente de dados vem do fato que
regras a respeito do sistema em estudo sao, de forma geral, nao evidentes e as observacoes
sao frequentemente marcadas por ruıdo, o que pode ser um fator primordial para o
fracasso do modelo. Contudo, em algumas situacoes praticas, este tipo de modelagem e
o unico modo plausıvel para a resolucao de problemas do mundo real.
Um segundo ponto importante e o poder de generalizacao das RNAs, ou seja, apos
o processo de aprendizagem com os dados apresentados (amostra de dados de uma po-
pulacao), as RNAs sao capazes, de forma geral, de inferirem corretamente padroes nao
apresentados na fase de treinamento. Como a previsao e basicamente a determinacao do
comportamento futuro (dados nao apresentados) a partir do seu comportamento passado
(dados apresentados), esta torna-se uma aplicacao ideal para as RNAs.
Um terceiro aspecto favoravel para a utilizacao das RNAs ao problema de previsao
baseia-se no fato que as redes sao aproximadores universais de funcoes, aproximam qual-
3.3 REDES NEURAIS ARTIFICIAIS E O PROBLEMA DE PREVISAO 32
quer funcao com uma precisao desejada [37–42]. Uma vez que as series temporais podem
ser representadas como uma funcao matematica dependente do tempo, as RNAs podem
ser utilizadas para a determinacao de tais funcoes.
Outro ponto de extrema importancia vem da nao linearidade das RNAs. Os modelos
estatısticos lineares para previsao tem a vantagem de serem entendidos e analisados em
grande detalhe, serem de facil implementacao e explicacao, contudo podem ser totalmente
inadequados se o mecanismo da serie temporal for nao-linear [43].
Dentre os modelos existentes de RNAs, as redes MLPs sao as mais utilizadas na
solucao do problema de previsao. Contudo, tambem se encontra com relativa frequencia
na literatura o relato da utilizacao de outros modelos de redes, como as as redes de funcao
de base radial (RBF) [44–46] e redes wavelets, ou simplesmente wavenets [47, 48].
3.3.1 Redes Neurais Perceptrons Multi-Camadas
As Redes Neurais Perceptrons Multi-Camadas (MLP) sao compostas tipicamente por
algumas camadas de neuronios. A primeira camada e conhecida como camada de entrada,
onde a informacao e apresentada a rede. A ultima camada e chamada de camada de saıda,
onde respostas finais do modelo sao produzidas. A camada de entrada e a camada de
saıda sao separadas por uma ou mais camadas, chamadas de camadas intermediarias,
camadas escondidas ou camadas ocultas.
Os neuronios de uma camada sao conectados a outros neuronios da camada adjacente.
Se cada neuronio de uma determinada camada for conectado a todos os neuronios da
proxima camada tem-se uma rede MLP totalmente conectada, como ilustra a Figura 3.1
Para o problema de previsao, as entradas de uma RNA sao usualmente as variaveis
de predicao. Desta forma, a relacao funcional estimada pela RNA pode ser escrita como,
y = f(x1, x2, . . . , xp) (.)
onde x1, x2, . . . , xp sao p variaveis independentes e y e uma variavel dependente. Portanto,
a RNA funciona de forma equivalente a um modelo de regressao nao-linear.
Por outro lado, encarando o problema como uma extrapolacao, as entradas da rede
sao tipicamente as observacoes passadas da serie e a saıda e o respectivo valor futuro.
3.3 REDES NEURAIS ARTIFICIAIS E O PROBLEMA DE PREVISAO 33
Figura 3.1: Rede MLP de tres camadas totalmente conectada.
Entao, a RNA dependera de uma funcao de mapeamento esquematizada como,
yt+1 = f(yt, yt−1, . . . , yt−p) (.)
onde yt e a observacao da serie temporal no tempo t. Analisando sob este angulo, a RNA
e equivalente a um modelo auto-regressivo nao-linear.
Uma RNA pode incorporar tanto variaveis de previsao como retardos temporais (ou
lags) de uma serie temporal, equivalendo-se a um modelo geral de funcao de transferencia.
Antes da RNA desempenhar qualquer tarefa, esta deve passar por um processo de
aprendizagem. Uma rede MLP e treinada de forma supervisionada, para cada padrao de
entrada exibido a rede e exibido um padrao de saıda, forcando a rede a ajustar seus pesos
(aprendizado) de forma a conseguir realizar o mapeamento entre o padrao de entrada e
o padrao de saıda, atraves da minimizacao do erro entre a saıda da rede e a resposta
desejada (ou o padrao de saıda), como esquematizado na Figura 3.2.
O conjunto de dados de entrada utilizado no treinamento da rede geralmente e formado
por varios vetores, correspondendo a cada um dos elementos destes vetores um neuronio
da camada de entrada da rede. Para o problema de previsao, o numero de neuronios da
camada de entrada da RNA e muito bem definido, sendo determinado pelo numero de
variaveis independentes ou pela quantidade de retardos temporais.
A quantidade total de dados historicos disponıveis de uma serie temporal e usualmente
dividida em duas ou tres partes. Se dividida em duas partes, a primeira e utilizada para o
3.3 REDES NEURAIS ARTIFICIAIS E O PROBLEMA DE PREVISAO 34
Figura 3.2: Esquema do processo de aprendizagem supervisionada.
treinamento (conjunto de treinamento) do modelo de predicao e a segunda (conjunto de
teste) para realizar testes de desempenho do modelo. Nao existe a priori nenhuma regra
bem estabelecida para determinar a cardinalidade de cada um dos conjuntos, entretanto,
nesta configuracao, de forma geral utiliza-se um conjunto de treinamento bem maior que o
conjunto de teste, representando de 70% a 90% dos dados, sendo o restante utilizado como
conjunto de teste. Ja na segunda configuracao (dados historicos divididos em tres partes),
a primeira parte e novamente utilizada para o treinamento do modelo, a segunda parte
(conjunto de validacao) e utilizada para validar o treinamento (determinando o momento
mais adequado para seu termino), e a terceira parte constitui o conjunto de teste. Nesta
segunda configuracao tambem nao ha nenhuma regra definitiva para a determinacao das
quantidades de elementos por conjuntos. Contudo, existe uma tentativa de padronizacao
dos experimentos com RNAs, descrita no relatorio tecnico Proben1 [49]. Seguindo esta
padronizacao, a divisao dos dados deve ser realizada na proporcao de 50% para o conjunto
de treinamento, 25% para o conjunto de validacao e 25% para o conjunto de teste.
O treinamento de uma RNA do tipo MLP decorre em linhas gerais da seguinte ma-
neira: primeiro, exemplos do conjunto de treinamento sao colocados nas entradas da
RNA. Os valores dos sinais de entrada sao ponderados e somados em cada neuronio da
primeira camada escondida. O resultado desta soma e entao transformado pela funcao
de ativacao do neuronio atual, gerando o sinal de saıda do neuronio, que e propagado
para a proxima camada da rede. Este processo se repete camada a camada ate que, even-
tualmente, os valores de ativacao dos neuronios da camada de saıda sao calculados. Um
algoritmo de treinamento e entao utilizado para encontrar os pesos das conexoes entre
os neuronios de forma a minimizar uma medida de erro global da rede. Tipicamente,
uma funcao objetivo ou funcao custo, geralmente baseada no erro SSE (Sum of Squared
3.3 REDES NEURAIS ARTIFICIAIS E O PROBLEMA DE PREVISAO 35
Errors), Equacao (.), deve ser minimizada durante o processo de treinamento,
E =1
2
N∑
i=1
(targeti − outputi)2 (.)
onde targeti e a saıda desejada da rede para o padrao i, outputi e a saıda da rede para o
padrao i, e o fator 12
e apenas utilizado por uma questao de simplificacao nas expressoes
das derivadas da Equacao (.) calculadas intensamente nos algoritmo de treinamento,
como no caso do algoritmo classico Backpropagation [50].
3.3.2 Projeto de uma Rede Neural Artificial
O projeto de uma RNA para uma aplicacao de previsao constitui-se em uma tarefa
delicada. A determinacao dos parametros que afetam o desempenho da rede deve ser
considerada cuidadosamente.
Uma decisao crıtica e a determinacao apropriada da arquitetura da rede, ou seja, a
quantidade de camadas, a quantidade de neuronios em cada camada e a quantidade de
entradas da rede, que para o problema de previsao e determinada pela quantidade de
retardos temporais relevantes ou quantidade de variaveis relevantes da series em estudo.
Em adicao, outros parametros necessitam ser definidos, como a funcao de ativacao dos
neuronios, o algoritmo de treinamento, a definicao de medidas de desempenho, o pre-
processamento da serie temporal com a escolha de transformacoes e normalizacao dos
dados, e a divisao dos dados em conjuntos de treinamento, validacao e teste.
3.3.2.1 Arquitetura da Rede
No projeto da arquitetura de uma rede do tipo MLP, parametros necessitam de definicao:
• A quantidade de entradas;
• O numero de camadas escondidas e a quantidade de neuronios em cada uma delas;
• A quantidade de saıdas.
A selecao destes parametros e dependente do problema em questao. Existem algumas
abordagens que tentam encontrar a configuracao otima para uma RNA, tais como o algo-
3.3 REDES NEURAIS ARTIFICIAIS E O PROBLEMA DE PREVISAO 36
ritmo de poda (pruning algorithm) [51–55], o algoritmo de tempo polinomial (polynomial
time algorithm) [56], a tecnica de decomposicao canonica [57], o criterio de informacao da
rede [58], dentre outros. Contudo, de forma geral, estes metodos sao bastante complexos e
difıceis de serem implementados, alem do fato que nenhum destes pode garantir a solucao
otima para o problema. Por esta razao, na grande maioria dos casos, a arquitetura da
rede e definida com base em experimentos preliminares.
3.3.2.1.1 Quantidade de Entradas e Retardos Temporais. O numero de entradas de
uma RNA para o problema de previsao sera a quantidade de variaveis ou elementos
contidos no vetor de entrada, correspondendo aos retardos temporais relevantes (lags) ou
as variaveis relevantes para a serie.
Os lags sao as observacoes passadas utilizadas para a determinacao do proximo valor
futuro da serie. Por exemplo, e possıvel que para uma serie seja necessario observar os
lags 1, 3 e 8, para a determinacao do seu valor no tempo t. Logo, estes serao os valores
da serie nos tempos t-1, t-3 e t-8 respectivamente. Portanto, um ponto bastante crıtico
no problema de previsao e a determinacao correta dos lags para que seja possıvel uma fiel
representacao das estruturas temporais inerentes a serie, como discutido na Secao 2.3.
Assim, o numero de neuronios da camada de entrada, ou equivalentemente os retardos
temporais a serem utilizados, e um dos fatores chave a serem ajustados, sendo altamente
dependente do problema. A escolha dos retardos temporais e uma tarefa complexa, onde
na grande maioria dos casos ha a necessidade da interacao com especialistas humanos da
area, tornando este ajuste um procedimento de difıcil automatizacao.
3.3.2.1.2 Quantidade de Camadas Escondidas e Neuronios. As camadas escondidas
e os neuronios que as compoem sao fatores extremamente importantes para o funcio-
namento de uma RNA. Estes permitem a rede detectar as caracterısticas e padroes exis-
tentes nos dados, desempenhando o mapeamento entre as variaveis de entrada e saıda.
Na grande maioria dos casos, influenciados pelos trabalhos teoricos que mostram a ne-
cessidade de apenas uma unica camada escondida para que uma RNA consiga aproximar
qualquer funcao nao-linear contınua [38,39], os pesquisadores relatam em seus trabalhos
apenas o uso de uma unica camada escondida para aplicacoes de previsao.
Contudo, apenas uma unica camada escondida pode requerer uma grande quantidade
3.3 REDES NEURAIS ARTIFICIAIS E O PROBLEMA DE PREVISAO 37
de neuronios, podendo comprometer o tempo de treinamento e o poder de generalizacao
da RNA. Redes com duas camadas escondidas podem trazer benefıcios para alguns tipos
de problemas especıficos e, por isso, alguns pesquisadores utilizam mais de uma camada
escondida (usualmente duas camadas). Srinnivasan et al [59] usam uma RNA com duas
camadas escondidas, resultando em uma rede mais compacta com um maior desempenho
no processo de treinamento, quando comparada a uma rede de uma camada. Em um
outro trabalho, de Zhang et al [10], tambem e mostrado que redes de duas camadas
escondidas tem um melhor desempenho do que redes de uma camada escondida para
uma dada serie.
Resultados sugeridos por Lippman [60] e Lapedes and Farber [61] indicam que nao
sao necessarias mais de duas camadas escondidas para resolver quase todos os problemas,
inclusive problemas de previsao. Contudo, constata-se na literatura que apenas uma
camada escondida e o suficiente para alcancar um desempenho satisfatorio de previsao
[10], sendo o uso de duas camadas uma otimizacao para alguns problemas especıficos.
Determinar a quantidade de neuronios escondidos tambem e uma tarefa complexa.
Em geral, redes com quantidades pequenas de neuronios sao preferidas, pois espera-se
alcancar um maior poder de generalizacao e uma menor probabilidade de super estimacao
(overfitting). Porem, redes com uma quantidade insuficiente de neuronios podem nao ter
o poder suficiente para modelar e aprender as estruturas contidas nos dados em estudo.
A maneira mais popular de se determinar a quantidade de neuronios escondidos e
atraves de experimentos de tentativa e erro com a realizacao de simulacoes diretas com
os dados. Entretanto, existem algumas regras heurısticas que tentam auxiliar a deter-
minacao desta quantidade. Uma destas regras [10] parte do pressuposto que a quanti-
dade de neuronios escondidos depende diretamente do numero de entradas, considerando
tambem que para cada peso existente na rede ha em media necessidade de dez exemplos
para ajusta-lo. Desta forma, a partir do conjunto de dados pode-se estimar um limite
para a quantidade de neuronios da rede. Para redes de uma unica camada escondida exis-
tem algumas regras praticas que assumem a quantidade de neuronios escondidos como
2n + 1 [60], 2n [62], n [63] e n/2 [10], onde n e o numero de entradas da rede.
Tang e Fishwick [63] investigaram o efeito da quantidade de neuronios escondidos
em particular ao problema de previsao de series temporais. Estes encontraram que tal
parametro tem um certo efeito sobre o desempenho de previsao da RNA, contudo nao
muito significativo, podendo ate mesmo ser desprezado para alguns problemas. Nota-se
3.3 REDES NEURAIS ARTIFICIAIS E O PROBLEMA DE PREVISAO 38
ainda que alguns dos melhores resultados de previsao sao apresentados em trabalhos onde
o numero de neuronios escondidos e igual a quantidade de entradas da rede [63–66].
3.3.2.1.3 Quantidade de Saıdas. O numero de neuronios da camada de saıda e uma
grandeza facil de ser determinada para o problema de previsao. Existem basicamente
duas formas de previsao que podem ser desempenhadas:
1. Previsao de um passo;
2. Previsao de multiplos passos.
A previsao de um unico passo utiliza apenas um neuronio na saıda da rede, o qual ira
estimar o proximo valor futuro da serie (horizonte de previsao unitario). Ja na previsao
de multiplos passos existem dois esquemas possıveis para sua implementacao. O primeiro,
chamado de previsao iterativa, comumente utilizado nos modelos estatısticos, faz uso de
apenas uma saıda (ou neuronio) para a rede, onde o valor gerado e entao utilizado para
construir de forma iterativa o padrao de entrada para a previsao do proximo passo.
O segundo esquema, chamado de previsao direta, consiste em projetar um RNA com
uma quantidade de neuronios de saıda igual ao horizonte de previsao, onde cada um destes
neuronios e responsavel pela previsao de um determinado passo no futuro. Na literatura
e possıvel encontrar todos os dois esquemas para a previsao de multiplos passos [10].
3.3.2.2 Funcao de Ativacao
A funcao de ativacao determina o relacionamento entre as entradas e saıda de um neuronio
e, em geral, introduz um grau de nao linearidade na maioria das redes.
Qualquer funcao diferenciavel em segunda ordem (Classe C2) pode ser uma funcao
de ativacao, contudo na pratica, apenas um pequeno grupo de funcoes de ativacao “bem
comportadas” sao utilizadas. Pode-se citar as mais comuns:
1. Funcao Sigmoide Logıstica
f(x) =1
1 + exp(−λx)(.)
3.3 REDES NEURAIS ARTIFICIAIS E O PROBLEMA DE PREVISAO 39
onde λ e um parametro que determina a sensibilidade na resposta da funcao, ajus-
tado comumente para 1;
2. Funcao Tangente Hiperbolica
f(x) =exp(x) − exp(−x)
exp(x) + exp(−x)(.)
3. Funcao seno ou cosseno
f(x) = sen(x) ou f(x) = cos(x) (.)
4. Funcao Linear
f(x) = αx + β (.)
Na Figura 3.3 sao exibidos os graficos destas funcoes.
−10 −5 0 5 100
0.2
0.4
0.6
0.8
1
X
Sig
moi
de(x
)
−10 −5 0 5 10−1
−0.5
0
0.5
1
X
Tan
gent
e H
iper
bolic
a (x
)
−10 −5 0 5 10−1
−0.5
0
0.5
1
X
Sen
(x)
−10 −5 0 5 10−10
−5
0
5
10
X
f(x)
=x
(A) (B)
(C) (D)
Figura 3.3: Graficos das funcoes de ativacao mais comuns. (A) Funcao SigmoideLogıstica; (B) Funcao Tangente Hiperbolica; (C) Funcao Seno; (D) Funcao Linear.
De forma generica, uma RNA pode ter diferentes funcoes de ativacao para neuronios
de uma mesma camada ou de camadas distintas, contudo a grande maioria das RNAs
tem a mesma funcao de ativacao para todos os neuronios de uma mesma camada.
3.3 REDES NEURAIS ARTIFICIAIS E O PROBLEMA DE PREVISAO 40
Na maior parte dos trabalhos da literatura, usa-se a funcao sigmoide logıstica nos
neuronios escondidos, porem, quanto a funcao de ativacao para os neuronios de saıda,
nao ha um consenso formado. Em problemas de previsao que envolvem valores contınuos
e razoavel a utilizacao de uma funcao de ativacao linear na camada de saıda da rede,
contudo e importante notar que RNAs com saıdas lineares tem a limitacao de nao modelar
series com tendencias [55], podendo ser necessario um pre-processamento da serie.
3.3.2.3 Conexoes entre Neuronios
Para a grande maioria dos problemas de previsao relatados na literatura as redes sao
completamente conectadas, ou seja, todos os neuronios de uma camada sao conectados
com todos os outros neuronios da camada seguinte. Alguns trabalhos tambem apresentam
redes com conexoes parciais [67] ou redes com conexoes diretas da camada de entrada
para a camada de saıda [68]. A adicao de conexoes diretas em uma rede pode aumentar
a acuracia de previsao uma vez que estas podem ser utilizadas para a modelagem das
estruturas lineares dos dados (ultima camada da rede com funcao de ativacao linear).
3.3.2.4 Algoritmo de Treinamento
O processo de treinamento de uma RNA e um problema de minimizacao nao-linear no
qual os pesos (ou conexoes) da rede sao iterativamente ajustados para prover um erro
mınimo entre a saıda desejada e a saıda obtida pela rede.
O algoritmo de treinamento mais popular e o Backpropagation [50], que e essencial-
mente um metodo de gradiente descendente. Outros algoritmos, na sua maioria modi-
ficacoes ou variacoes do Backpropagation, tambem sao utilizados com sucesso. Sao exem-
plos os metodos adaptativos [69–71], QuickProp [72,73], RproP [74] e outros metodos de
segunda ordem, como Levenberg-Marquardt [75, 76], gradiente conjugado [77], gradiente
conjugado com um passo de secante [78], dentre tantos outros. A escolha do algoritmo de
treinamento tambem e uma tarefa de difıcil solucao, dependendo fortemente do problema.
3.4 ALGORITMOS GENETICOS 41
3.3.2.5 Normalizacao dos Dados
As funcoes de ativacao nao-lineares sao definidas sobre um domınio, por exemplo, a
sigmoide logıstica e definida para o intervalo [0, 1]. Portanto, todos os dados informados
a rede devem estar normalizados sobre o domınio da funcao de ativacao utilizada.
O processo de normalizacao dos dados e realizado antes do treinamento, no pre-
processamento. As formas de normalizacao comumente utilizadas podem ser sumarizadas
nos seguintes pontos [10]:
• Transformacao linear para o intervalo [0,1]:
Xn =X0 − Xmin
Xmax − Xmin
(.)
• Transformacao linear para o intervalo [a,b]:
Xn = (b − a)X0 − Xmin
Xmax − Xmin
+ a (.)
• Normalizacao estatıstica:
Xn =(X0 − X)
s(.)
• Normalizacao simples:
Xn =X0
Xmax
(.)
onde Xn, X0, Xmax, Xmix, X e s sao os valores normalizados, os valores originais, o valor
maximo, o valor mınimo, o valor medio e o desvio padrao dos dados, respectivamente.
As normalizacoes dos dados de entrada e saıda sao independentes. Contudo, no
problema de previsao, a normalizacao das entradas e saıdas e realizada de forma unica.
3.4 ALGORITMOS GENETICOS
Os Algoritmos Geneticos (AGs) sao metodos de aprendizagem de maquina, busca e oti-
mizacao desenvolvidos por Holland e seu alunos [79–81]. Estes algoritmos fazem parte do
paradigma de computacao evolutiva e sao motivados pela teoria da evolucao de Charles
Darwin, que em 1859 publicou o livro A Origem das Especies, onde postulou:
3.4 ALGORITMOS GENETICOS 42
“As especies evoluem pelo princıpio da selecao natural e sobrevivencia do mais
apto”
Em 1865, Gregor Mendel, considerado o pai da genetica, apresentou os resultados
dos seus experimentos com ervilhas, constatando que a informacao genetica dos pais e
transferida aos seus filhos de forma probabilıstica. Estes experimentos geraram subsıdios
para o entendimento da diversificacao das especies, o que possibilita o aumento do poder
de adaptacao do indivıduo ao seu meio, integrando a genetica com a selecao natural,
consolidando a teoria da evolucao.
A ideia da teoria da evolucao, de forma simplista, pode ser encarada como a trans-
ferencia das informacoes geneticas dos pais para seus filhos. Os filhos que receberem as
informacao adequadas terao um maior poder de adaptacao ao meio com grandes chances
de sobreviver, ja os que nao forem dotados de tais informacoes tenderao a serem extintos.
Como um procedimento tıpico de busca e otimizacao, os AGs irao realizar uma busca
pela melhor solucao para o problema, contudo nao partindo de apenas um unico estado
inicial, mas sim de um certo conjunto de estados iniciais que sao formados por possıveis
solucoes para o problema. Cada uma dessas possıveis solucoes sao chamadas de in-
divıduos, e o grupo de indivıduos de populacao. Heurısticas inspiradas na Teoria da
Evolucao sao iterativamente aplicadas, permitindo a populacao evoluir para uma solucao
aceitavel do problema. Os AGs realizam buscas atraves de multiplas trajetorias simulta-
neamente, sendo estes excelentes para a execucao em computadores paralelos [82].
De forma geral, uma tecnica de otimizacao apresenta:
• Espaco de Busca: onde estao todas as possıveis solucoes do problema;
• Funcao Objetivo: avalia as solucoes produzidas, associando a cada uma delas um
valor numerico de utilidade, ou uma nota, que mede o quao boa e a solucao.
O metodo aplicado pelos AGs e a busca em um espaco de hipotese, ou solucoes
candidatas, constituindo seu espaco de busca. A melhor hipotese e determinada atraves
de uma medida numerica pre-determinada, a funcao objetivo, comumente chamada de
funcao custo ou fitness.
Existem um grande numero de diferentes implementacoes para os AGs que, de forma
geral, sao variacoes do seguinte esquema:
3.4 ALGORITMOS GENETICOS 43
1. Os AGs operam iterativamente sobre um conjunto de solucoes — os indivıduos —
que formam uma populacao;
2. Para cada iteracao, todos os indivıduos da populacao sao avaliados segundo uma
funcao de fitness;
3. Um nova populacao e entao formada atraves de um procedimento probabilıstico a
partir da populacao atual. Alguns indivıduos sao levados da populacao atual para
a nova populacao sem sofrerem nenhuma transformacao (intactos) e alguns outros
indivıduos sao utilizados como base para a geracao de novos indivıduos (pais que
geram filhos) atraves de operadores de cruzamento (crossover) e mutacao.
Um algoritmo representando um AG generico e mostrado na Figura 3.4. A evolucao da
populacao dos AGs pode ser descrita atraves do teorema dos esquemas [81,83], comentado
no Apendice B.
Figura 3.4: Procedimento padrao de um Algoritmo Genetico tıpico.
3.4.1 Indivıduo
Os AGs sao inicializados pela geracao de uma populacao de indivıduos, onde cada um
desses indivıduos iniciais sao solucoes tentativas do problema em estudo. Contudo, o que
vem a ser um indivıduo?
Um indivıduo e formado basicamente por um cromossomo, que em analogia a biologia,
contem toda a informacao necessaria para representar o indivıduo. Em alguns casos, o
cromossomo pode assumir estruturas bem complexas contendo varias hierarquias, mas
3.4 ALGORITMOS GENETICOS 44
Figura 3.5: Representacao esquematica da informacao biologica. O indivıduo e abstraıdocomo uma solucao a um problema, seu cromossomo a sua codificacao e os genes aosparametros da solucao.
na grande maioria das vezes, um cromossomo e apenas um vetor, onde cada um dos seus
elementos e um gen.
Um gen e tipicamente expresso como um caractere, ou uma string de caracteres,
escrito em algum alfabeto, que codifica uma determinada caracterıstica do indivıduo, ou
seja, um parametro da solucao.
Em analogia a um sistema biologico, esquematizado na Figura 3.5, um determinado
indivıduo tem o seu cromossomo formado por varios genes, onde cada um desses genes e
responsavel por uma determinada caracterıstica. Encarando o meio ambiente como “um
problema” e o indivıduo com uma “determinada solucao”, o ajuste dos seus genes ira
gerar um cromossomo, que, por sua vez, gera as caracterısticas do indivıduo (ou uma
solucao tentativa), podendo se adaptar mais ou menos ao meio, destacando-se ou nao
entre os demais indivıduos. E de se esperar que os indivıduos com um maior destaque
tenham maior probabilidade de sobrevivencia.
Portanto, dado um problema, idealiza-se um indivıduo formado por um cromossomo
que contenha todos os parametros para uma possıvel solucao. Para cada um desses
parametros e associado um gen, e para cada gen e definido um intervalo de variacao.
3.4.2 Funcao de Custo
A avaliacao nos AGs e realizada indivıduo a indivıduo, atraves da funcao de custo ou
fitness. O melhor indivıduo ira retornar um menor custo ou o maior valor de fitness,
3.4 ALGORITMOS GENETICOS 45
sendo este o indivıduo mais apto da populacao.
O fitness e uma funcao matematica que gera um ındice de ordenamento por aptidao
para todos os indivıduos da populacao. Esta funcao, por sua vez, e dependente do
problema, e pode ter uma quantidade muito grande de variacoes para uma unica situacao.
Quando a situacao requer a minimizacao de um determinado parametro, como um erro
(como e o caso do problema de previsao), um possıvel fitness e dado por,
fitness =1
1 + erro(.)
3.4.3 Escolha de Indivıduos
Para o processo de criacao da nova populacao, o primeiro passo e selecionar um certo
numero de indivıduos (geralmente dois), chamados de pais. Existem varias formas
possıveis para se realizar esta selecao: selecao baseada em meta, metodo de amostragem
estocastica (metodo da roleta), estrategias elitistas, eleicao de estados ligados, selecao
por torneio, dentre outras [84].
Destes procedimentos para a selecao de indivıduos, existem dois metodos que merecem
uma maior atencao:
• Metodo de selecao por torneio;
• Metodo de selecao por roleta.
No metodo de selecao por torneio, sao escolhidos aleatoriamente uma certa quantidade
de indivıduos da populacao, e a partir destes escolhe-se o mais apto (maior valor de
fitness). Tal procedimento e repetido para a selecao de um par de indivıduos (os pais)
que gerem novos indivıduos (os filhos).
No metodo por roleta, tem-se um procedimento de selecao por amostragem estocastica,
onde o indivıduo mais apto tera uma maior chance de sobreviver. Desta forma, para uma
populacao com P indivıduos, a probabilidade de um indivıduo i ser selecionado e,
Pr(indi) =f(indi)∑P
j=1 f(indj)(.)
onde indi esta representando o indivıduo i e o f(·) e a funcao de custo ou fitness.
3.4 ALGORITMOS GENETICOS 46
Analisando a Equacao (.), a probabilidade de um certo indivıduo ser selecionado
e diretamente proporcional ao seu valor de fitness e inversamente proporcional ao so-
matorio dos valores de fitness de todos os indivıduos da populacao. Graficamente, este
procedimento pode ser representado como uma roleta, sendo representada por um grafico
tipo pizza. Cada indivıduo da populacao e associado a uma fatia do grafico, quanto maior
o seu valor de fitness maior sera a area da fatia, como mostra a Figura 3.6, sendo a selecao
do indivıduo realizada atraves de um sorteio.
Figura 3.6: Metodo da Roleta aplicado a uma populacao de cinco indivıduos.
3.4.4 Operadores Geneticos
Os operadores geneticos, de forma bastante generica, recombinam e modificam os mem-
bros da populacao selecionados.
Tipicamente, um AG tem operadores que manipulam um conjunto de bits, como
ilustrado na Figura 3.7. Estes operadores sao aplicados aos cromossomos escritos em um
alfabeto binario, mas podem ser facilmente generalizados para um alfabeto qualquer.
Os operadores utilizados pelo AG correspondem a versoes abstratas dos operadores
encontrados na evolucao de um sistema biologico. Os dois operadores mais comuns sao
os operadores de cruzamento (crossover) e os operadores de mutacao.
Os operadores de cruzamento sao responsaveis pela geracao dos cromossomos filhos
a partir dos cromossomos pais, misturando os genes dos indivıduos pais para a obtencao
dos novos cromossomos. Por exemplo, o bit na posicao i do cromossomo filho e gerado
a partir de uma copia do bit da posicao i do cromossomo do pai1 ou do cromossomo
3.4 ALGORITMOS GENETICOS 47
Figura 3.7: Operadores de cruzamento e mutacao aplicados nos AGs binarios.
do pai2. A escolha de qual pai ira ser o doador de um certo gene e determinada por
uma string adicional chamada mascara de cruzamento, escrita em binario e de mesmo
comprimento dos cromossomos da populacao. Se o bit da mascara na posicao i for 1,
entao o gene na posicao i do pai1 sera repassado para o filho, e caso o valor do bit seja
0, entao e o pai2 que ira repassar o gene (e vice e versa). Neste tipo de cruzamento sao
gerados dois filhos para cada par de pais, como tambem e o caso para o cruzamento de
um ponto, dois pontos ou multiplos pontos.
Um dos fatores que geram a diversificacao de uma populacao em um sistema biologico
e a chance do aparecimento de indivıduos mutacionados. A possibilidade de mutacao
em um sistema biologico e geralmente baixa e gerada por fatores casuais. Simulando
este procedimento, o operador mutacao em um AG entra com a possibilidade de alterar
um cromossomo de forma aleatoria, modificando o valor dos seus genes, garantido a
diversificacao da populacao.
De forma geral, estes sao os operadores utilizados em praticamente todas as aplicacoes
que usam os AG. Contudo, ainda existem sistemas baseados em AGs que utilizam ou-
tros operadores, especialmente operadores especializados em particularidades do sistema,
como operadores de generalizacao de regras [32].
3.5 SISTEMAS HIBRIDOS INTELIGENTES 48
3.4.5 Algoritmos Geneticos e o Problema de Previsao
Os AGs nao sao utilizados diretamente para a previsao de series temporais, mas no apoio
a outros metodos e tecnicas na busca de uma melhor modelagem e previsao possıvel.
Chan et al. [11] utilizaram um AG para determinar os parametros ideais para um
modelo ARMA a partir dos dados de uma serie temporal real relativa a ındices de precos.
Na mesma linha, Neubauer [12] utilizou um AG tıpico para ajustar filtros nao-lineares,
baseados em modelos biparametricos para a previsao de series de incendios, mostrando
uma forma de ajuste de modelos estatısticos nao-lineares sem a necessidade de uma analise
matematica tao sofisticada como a requerida comumente.
Uma outra abordagem dos AGs utilizada por Povinellie e Feng [13] trata-se do re-
conhecimento de padroes e estruturas existentes em uma dada serie temporal. A ideia
consiste na procura por padroes (ou estruturas) atraves de uma medida de correlacao
entre os pontos da serie. Neste procedimento, a funcao de custo ou fitness e exatamente
o valor da correlacao para as estruturas, quanto maior a correlacao mais apta e a estru-
tura. Tal metodologia e bastante util em sistemas de alarme, como em um sismografo,
identificando certos padroes que antecedem um terremoto.
3.5 SISTEMAS HIBRIDOS INTELIGENTES
Os seres humanos sao um bom exemplo de “maquinas” que possuem informacoes de
forma hıbrida. Nossas atitudes e acoes sao governadas pela combinacao de informacao
genetica e informacao adquirida atraves de aprendizagem.
Este tipo de processamento de informacao hıbrida esta sendo replicada na geracao de
maquinas que se adaptam, onde em seus nucleos estao sistemas de computacao inteli-
gentes, sendo alguns desses inspirados em mecanismos da natureza. Pode-se citar alguns
exemplos: redes neurais, algoritmos geneticos, sistemas fuzzy, sistemas imunologicos ar-
tificiais [85], sistemas especialistas [86] e regras de inducao [87].
Sistemas Hıbridos Inteligentes tambem sao importantes quando se considera a natu-
reza variada do domınio de aplicacoes. Muitos domınios complexos tem muitas compo-
nentes de problemas diferentes, cada qual podendo requerer um tipo de processamento
diferente. Alem do mais, representam nao somente a combinacao de diferentes tecnicas
inteligentes, mas tambem a integracao dessas tecnicas com sistemas convencionais de
3.5 SISTEMAS HIBRIDOS INTELIGENTES 49
computacao.
Pode-se sumarizar tres principais motivos para a criacao de sistemas hıbridos:
• Tecnicas de Intensificacao: integracao de diferentes tecnicas com o intuito de
superar as limitacoes das tecnicas individuais, onde pelo menos duas tecnicas sao
combinadas de tal modo que o ponto fraco de uma seja compensado pelo ponto
forte da outra.
• Multiplicidade de Aplicacoes em Tarefas: um Sistema Hıbrido Inteligente e
criado uma vez que uma unica tecnica nao e capaz de ser aplicavel aos muitos
sub-problemas que uma dada aplicacao possa ter.
• Realizacao de Multipla Funcionalidade: a criacao de sistemas hıbridos que
exibam a capacidade de processamento multiplo de informacoes dentro de uma
arquitetura, ou seja, estes sistemas funcionalmente imitam ou emulam diferentes
tecnicas de processamento.
Muitas sao as combinacoes possıveis entre as varias tecnicas de IA para a criacao de
Sistemas Hıbridos Inteligentes, contudo a discussao aqui exposta estara sendo limitada a
combinacao das tecnicas ja discutidas.
3.5.1 Algoritmos Geneticos e Redes Neurais
Algoritmos Geneticos, como ja discutido, sao algoritmos de busca e otimizacao baseados
em mecanismos de selecao natural e genetica que trabalham com um conjunto de possıveis
solucoes simultaneamente.
As tecnicas de otimizacao e busca geralmente apresentam um espaco de busca onde
estao todas as possıveis solucoes e uma funcao de avaliacao ou custo que estima, geral-
mente atraves de uma nota, cada possıvel solucao. Os Algoritmos Geneticos diferenciam-
se destes metodos tradicionais em quatro aspectos principais:
1. Trabalham com uma codificacao do conjunto de parametros;
2. Trabalham com uma populacao de solucoes candidatas simultaneamente, e nao com
uma unica solucao;
3.5 SISTEMAS HIBRIDOS INTELIGENTES 50
3. Utilizam informacoes de custo ou recompensa, e nao derivadas de funcoes;
4. Utilizam regras de transicao probabilısticas, e nao determinısticas.
Ja em uma Rede Neural, o seu desempenho depende da topologia usada bem como
dos parametros do seu algoritmo de treinamento. Portanto, a determinacao de tais
parametros da rede afeta a velocidade e a eficiencia do processo de aprendizado, a to-
lerancia a falhas a ruıdos e a capacidade de generalizacao. Os Algoritmos Geneticos sao
usados em combinacao com Redes Neurais na transformacao de uma populacao de redes
candidatas, de uma geracao para a outra, diversificando esta populacao e mantendo as
caracterısticas desejaveis adquiridas pelas geracoes anteriores. E, de uma forma evolu-
tiva, tende-se a alcancar uma configuracao de Rede Neural que seja uma solucao quase
otima (senao otima) para o problema em questao.
Neste sentido, o Sistema Hıbrido Inteligente AG+RNA segue a ideia de tecnicas de
intensificacao, onde o ponto forte do AG, a busca por parametros em um espaco de
possibilidades imenso, consegue suprir o ponto fraco das RNAs, o ajuste adequado dos
seus parametros, que por definicao constituem um universo de possibilidades tao grande
que torna-se inviavel uma busca completa direta pelos melhores valores para o ajuste.
Desta forma, um indivıduo da populacao do AG e uma RNA, onde o seu cromossomo
e uma codificacao para os seus parametros (numero de camadas escondidas, quantidade
de neuronios em cada camada, funcoes de ativacao, quantidade de conexoes, algoritmos
de treinamento, dentre outros).
Existem basicamente duas abordagens possıveis com este sistema. Na primeira, as
RNAs entram apenas com o modelo funcional, e o AG ajusta todos os seus parametros,
inclusive o valor dos pesos, executando tanto a tarefa de ajuste da topologia como o
processo de treinamento da rede. Na segunda possibilidade, o AG ajusta apenas os
parametros estaticos a rede, inclusive com a possibilidade de escolha do algoritmo de
treinamento. Este segundo procedimento e considerado como um treinamento hıbrido,
pois a rede e projetada pelo AG, mas e treinada de forma convencional.
CAPITULO 4
CARACTERIZACAO DAS SERIES TEMPORAIS
UTILIZADAS
Neste Capıtulo sao descritas as series temporais utilizadas como conjunto de testes apli-
cado aos experimentos descritos nos proximos capıtulos. Para cada uma das series e
apresentada uma pequena descricao e a motivacao em adota-las.
4.1 INTRODUCAO
O foco principal do trabalho desenvolvido e a apresentacao de uma nova metodologia
na abordagem do problema de previsao de series temporais. Por este motivo, faz-se ne-
cessaria a utilizacao de um conjunto de series temporais que sirva como teste (benchmark)
para comparacoes dos resultados obtidos com as tecnicas distintas investigadas.
Para tal, um conjunto de series artificiais e reais (mundo real), com caracterısticas
particulares e relevantes em termos de complexidade, representatividade, variabilidade e
aplicacao pratica foi eleito para investigacao, compreendendo as series:
• Serie do Mapa de Henon – serie artificial sem ruıdo;
• Serie das Manchas Solares (Sunspot) – serie do mundo real;
• Serie de Medidas do Brilho de uma Estrela – serie do mundo real;
• Serie do Indice Dow Jones Industrial Average (DJIA) – serie do mundo real;
• Serie do Indice Nasdaq – serie do mundo real;
• Serie do Indice S&P500 – serie do mundo real;
• Serie do valor de Fechamento das Acoes da Petrobras (PetrobrasON) – serie do
mundo real;
• Serie Random Walk – serie artificial com ruıdo.
51
4.2 SERIE DO MAPA DE HENON 52
4.2 SERIE DO MAPA DE HENON
A serie do Mapa de Henon e um mapa iterativo e inversıvel em duas dimensoes com
solucoes caoticas proposto pelo astronomo frances Michel Henon em 1976 [88] como um
modelo simplificado para o mapa de Poincare [21] para o modelo de Lorenz de atratores.
O mapa de Henon e comumente estudado em sistemas dinamicos. Nas engenharias,
matematica e fısica, tais sistemas sao constituıdos por processos determinısticos onde
suas funcoes tem seus valores alterados no tempo segundo regras definidas a partir dos
proprios valores atuais destas mesmas funcoes.
A serie do Mapa de Henon utilizada e composta por 10000 pontos, gerados a partir
da Equacao (.) com a = 1.4, b = 0.3 e sem a inclusao de ruıdo (termos em r sao nulos),
como mostra a Figura 4.1. Os valores dos parametros a e b determinam as caracterısticas
do mapa de Henon, onde os valores adotados geram um comportamento caotico.
Zt = 1 − a(Zt−2 − rt−2)2 + b(Zt−4 − rt−4) (.)
0 50 100 150 200 250 300 350 400 450 500−1.5
−1
−0.5
0
0.5
1
1.5
Figura 4.1: Grafico da serie do Mapa de Henon (500 primeiros pontos).
Pode-se notar claramente da Equacao (.) que os retardos temporais relevantes sao
t − 2 e t − 4, tidos como os de relevancia primaria e naturalmente eleitos com os mais
importantes. Metodos de escolha de retardos temporais com dependencias unicamente
primarias, como o δ-Test [18], elegem apenas estes dois lags como importantes. Contudo,
4.2 SERIE DO MAPA DE HENON 53
0 0.5 10
0.5
1
Z(t
)
Z(t−1)0 0.5 1
0
0.5
1
Z(t
)
Z(t−2)0 0.5 1
0
0.5
1
Z(t
)
Z(t−3)
0 0.5 10
0.5
1Z
(t)
Z(t−4)0 0.5 1
0
0.5
1
Z(t
)
Z(t−5)0 0.5 1
0
0.5
1
Z(t
)
Z(t−6)
0 0.5 10
0.5
1
Z(t
)
Z(t−7)0 0.5 1
0
0.5
1
Z(t
)
Z(t−8)0 0.5 1
0
0.5
1
Z(t
)
Z(t−9)
Figura 4.2: Lagplot para o mapa Henon do lag 1 ao 9.
com a utilizacao do metodo de lagplot e possıvel notar a existencia de retardos de alta
ordem que ainda contem informacao a respeito do atrator que governa a dinamica dos
pontos, como mostra a Figura 4.2. Desta forma, tais lags de ordens superiores devem
ser levados em consideracao para um melhor desempenho da previsao. Entretanto, com
o aumento da quantidade de lags, tambem ha um aumento no custo computacional dos
metodos utilizados para a previsao e uma diminuicao efetiva dos pontos que poderao ser
utilizados para o processo de treinamento do preditor. Embora a quantidade de pontos
para o caso do mapa de Henon nao seja crıtica, em outras series tal fator pode ser crucial.
Esta serie do mapa de Henon foi escolhida por ser utilizada em uma grande quantidade
de trabalhos encontrados na literatura [18, 89–93], servindo assim como uma referencia
para comparacoes. Alguns valores tıpicos e estatısticas da serie sao encontrados na Ta-
bela 4.1.
Tabela 4.1: Valores tıpicos e algumas estatısticas da serie do mapa de Henon utilizada.
Estatısticas Valores
Quantidade de Pontos 10000Valor Maximo 1.2729Valor Mınimo -1.2845Valor Medio 0.2538Variancia 0.5231
Desvio Padrao 0.7232
4.3 SERIE DAS MANCHAS SOLARES (SUNSPOT) 54
4.3 SERIE DAS MANCHAS SOLARES (SUNSPOT)
Em 1610, logo apos observar o sol com o seu telescopio, Galileo Galilei realizou a primeira
observacao europeia de manchas solares. As manchas solares sao regioes escuras na
superfıcie do sol, como detalha a imagem construıda pela NASA (National Aeronautics
and Space Administration) atraves da observacao solar, mostrada na Figura 4.3.
Figura 4.3: Imagem da superfıcie solar, construıda pela NASA, onde sao apresentadosgrupos de manchas solares, destacados pelos cırculos tracejados.
A temperatura no centro das regioes escuras chega a cair para 3700oK (a temperatura
da superfıcie do sol e em torno de 5700oK). Estas manchas duram tipicamente alguns
dias, podendo, algumas delas, durar ate algumas semanas.
As manchas solares sao regioes na superfıcie do sol com campos magneticos de magni-
tude milhares de vezes maior do que o campo magnetico da Terra, geralmente apresentando-
se em grupos. De forma sistematica, as observacoes diarias das manchas solares foram
inicializadas no seculo XVIII, mais precisamente em 1746, sendo o numero de manchas
utilizado para a construcao da serie calculado pela contagem do numero de grupos e o
numero de manchas individuais, seguindo a seguinte expressao,
R = k(10G + S) (.)
onde S e o numero de manchas individuais, G e o numero de grupos de manchas e k e
uma fator de qualidade, utilizado depois da comparacao dos resultados das medidas de
varios pontos de observacoes diferentes.
A serie das manchas solares, ou sunspots, utilizada nesta tese sao as totalizacoes anu-
ais das manchas solares entre os anos de 1700 e 1988, compondo 289 pontos. Esta serie e
bastante famosa na literatura de previsao por ter sido uma das primeiras a serem estuda-
das e tambem devido a sua nao linearidade e difıcil previsao. Na Figura 4.4 e mostrado
4.4 SERIE DE MEDIDAS DO BRILHO DE UMA ESTRELA 55
um grafico da serie, onde claramente pode-se notar o seu comportamento nao linear. Na
literatura e possıvel encontrar uma grande quantidade de trabalhos relacionados com a
previsao desta serie [84, 94–96].
1700 1750 1800 1850 1900 1950 20000
20
40
60
80
100
120
140
160
180
200
Anos
Qua
ntid
ade
de M
anch
as S
olar
es
Figura 4.4: Grafico da serie das Manchas Solares (Sunspot) — medidas anuais.
Com a utilizacao do metodo δ-Test [18] sao determinados que os lags 1 e 2 sao os
relevantes. Contudo, analisando tambem o lagplot para esta serie nao fica claro o apare-
cimento de alguma estrutura nos dados, como mostra a Figura 4.5, sendo extremamente
difıcil a confirmacao da relevancia para os lags sugerido pelo δ-Test. Alguns valores de
estatısticas da serie sao encontrados na Tabela 4.2.
Tabela 4.2: Valores tıpicos e algumas estatısticas da serie das Manchas Solares (Sunspots).
Estatısticas Valores
Quantidade de Pontos 289Valor Maximo 190.2000Valor Mınimo 0.0000Valor Medio 48.6135Variancia 1558.2000
Desvio Padrao 39.4741
4.4 SERIE DE MEDIDAS DO BRILHO DE UMA ESTRELA
A serie de medidas do brilho de uma estrela e uma serie natural com observacoes diarias
da intensidade luminosa de uma estrela de brilho oscilante, realizadas sempre no mesmo
4.4 SERIE DE MEDIDAS DO BRILHO DE UMA ESTRELA 56
0 0.5 10
0.5
1
Z(t
)
Z(t−1)0 0.5 1
0
0.5
1
Z(t
)
Z(t−2)0 0.5 1
0
0.5
1
Z(t
)
Z(t−3)
0 0.5 10
0.5
1Z
(t)
Z(t−4)0 0.5 1
0
0.5
1
Z(t
)
Z(t−5)0 0.5 1
0
0.5
1
Z(t
)
Z(t−6)
0 0.5 10
0.5
1
Z(t
)
Z(t−7)0 0.5 1
0
0.5
1
Z(t
)
Z(t−8)0 0.5 1
0
0.5
1
Z(t
)
Z(t−9)
Figura 4.5: Lagplot para a serie das Manchas Solares do lag 1 ao 9.
local e mesma hora.
Esta serie e constituıda por 600 pontos e o seu grafico e mostrado na Figura 4.6.
Utilizando o metodo do δ-Test, sao obtidos como retardos temporais relevantes os lags
1 e 2, contudo analisando o lagplot desta serie, como mostrado na Figura 4.7, todos os
retardos observados (lags 1 ao 9) apresentam uma clara estrutura nao-linear, indicando
que todos estes retardos contem informacoes a respeito da dinamica temporal da serie.
0 100 200 300 400 500 6000
5
10
15
20
25
30
35
Medidas
Val
or d
e B
rilho
(u.
a.)
Figura 4.6: Grafico da serie de medidas do brilho de uma estrela.
4.5 SERIE DO INDICE DOW JONES INDUSTRIAL AVERAGE (DJIA) 57
0 0.5 10
0.5
1
Z(t
)
Z(t−1)0 0.5 1
0
0.5
1
Z(t
)
Z(t−2)0 0.5 1
0
0.5
1
Z(t
)
Z(t−3)
0 0.5 10
0.5
1
Z(t
)
Z(t−4)0 0.5 1
0
0.5
1
Z(t
)
Z(t−5)0 0.5 1
0
0.5
1
Z(t
)
Z(t−6)
0 0.5 10
0.5
1
Z(t
)
Z(t−7)0 0.5 1
0
0.5
1
Z(t
)
Z(t−8)0 0.5 1
0
0.5
1
Z(t
)
Z(t−9)
Figura 4.7: Lagplot para a serie de medidas do brilho de uma estrela do lag 1 ao 9.
Esta serie foi utilizada por Newton [97] como um estudo de caso e testes em modelos
estatısticos, e pode ser encontrada em [98]. Algumas estatısticas para esta serie sao
expostas na Tabela 4.3.
Tabela 4.3: Valores tıpicos e algumas estatısticas da serie de Medidas de Brilho de umaEstrela.
Estatısticas Valores
Quantidade de Pontos 600Valor Maximo 34.00Valor Mınimo 0.00Valor Medio 17.1133Variancia 80.6749
Desvio Padrao 8.9819
4.5 SERIE DO INDICE DOW JONES INDUSTRIAL AVERAGE (DJIA)
Quando Charles H. Dow mediu e monitorou o valor medio das acoes de industriais em
26 de maio de 1896, procurava na verdade ter o sentimento medio da evolucao e com-
portamento do mercado de valores, que nao estava ainda bem consolidado. Investidores
prudentes para esta epoca negociavam tıtulos que pagassem quantias previsıveis, e que
estivessem voltados a maquinaria real, construcoes de fabrica e outros recursos tangıveis.
Hoje, acoes sao habitualmente consideradas como veıculos de investimento, ate mesmo
por investidores considerados conservadores.
4.5 SERIE DO INDICE DOW JONES INDUSTRIAL AVERAGE (DJIA) 58
De forma geral, as informacoes que podem guiar grupos de investidores e trabalhado-
res comuns a tomarem suas decisoes de investimento estao abundantemente disponıveis
em varios meios de comunicacao e mıdia. O Indice Dow Jones Industrial Average teve
um papel chave em provocar uma forte mudanca na forma de se encarar o mercado de
acoes. Cem anos atras, ate mesmo investidores experientes em Wall Street achavam ex-
tremamente difıcil discernir a confusao diaria do sobe e desce dos valores dos papeis, nao
sabendo ao certo se uma dada acao estava realmente caindo ou subindo. Charles Dow
inventou um ındice medio para tentar dar algum sentido nesta confusao do sobe e desce.
Ele comecou em 1884 a analisar a media de 11 acoes, a maior parte delas referentes a
vias ferreas, que foram as primeiras grandes corporacoes americanas. Comparou o valor
medio de seu ındice ao procedimento de colocar varas na areia da praia para determinar,
depois de sucessivas ondas, se a mare esta enchendo ou secando. Se a media dos picos e
vales do ındice subiam progressivamente, entao, de forma geral, as empresas estavam se
valorizando; caso contrario estavam se desvalorizando.
O registro da dinamica das primeiras medias das acoes era ditado pela necessidade de
computa-los com papel e lapis: somam-se os precos e divide-se o resultado pelo numero
de acoes. Esta aplicacao de aritmetica elementar, porem criativa, foi apenas utilizada ha
pouco mais de um seculo dando a possibilidade de ter algum sentimento a respeito do
comportamento coletivo de um certo grupo de empresas.
O DJIA (Dow Jones Industrial Average) atual utiliza 30 acoes que representam todos
os importantes fatores industriais, consolidando um ındice capaz de refletir o comporta-
mento medio das acoes relativas ao parque industrial, nao so americano, mas tambem
relativo as grandes empresas multi-nacionais, que segue a tendencia de uma economia
globalizada.
A serie do ındice DJIA aqui utilizada e constituıda por observacoes diarias do ındice a
partir de primeiro de janeiro de 1998 ate 26 de agosto de 2003, totalizando 1420 pontos.
Aplicando o metodo δ-Test para esta serie e encontrado como retardo temporal relevante
apenas o lag 1. Construindo tambem um lagplot e verificado que do lag 1 ao lag 9 existe
um forte relacionamento linear (Figura 4.9) mas a medida que se aumenta o grau do
retardo, ha o aparecimento de uma estrutura, aproximadamente no centro dos graficos.
Esta observacao pode vir a indicar algum relacionamento nao linear ou simplesmente
um aumento na perda de correlacao entre os pontos, visto que tambem e observado um
crescimento na variancia relativa a espessura das “linhas”, a medida que se aumenta
a ordem dos lags. E muito difıcil, simplesmente atraves da analise visual dos graficos
4.5 SERIE DO INDICE DOW JONES INDUSTRIAL AVERAGE (DJIA) 59
gerados pelo lagplot, definir qual das duas interpretacoes descritas acima e a correta,
contudo com o resultado do δ-Test, a hipotese da perda de correlacao entre os pontos a
medida que se aumenta o grau dos lags e fortalecida, uma vez que o δ-Test, a priori, e
capaz de capturar todas as correlacoes primarias entre os pontos da serie.
Algumas estatısticas basicas para a serie DJIA aqui utilizada podem ser encontradas
na Tabela 4.4.
0 200 400 600 800 1000 1200 14007000
7500
8000
8500
9000
9500
10000
10500
11000
11500
12000
Observaçoes Diarias
Val
or d
o D
JIA
Figura 4.8: Grafico da serie do Indice Dow Jones Industrial Average.
0 0.5 10
0.5
1
Z(t
)
Z(t−1)0 0.5 1
0
0.5
1
Z(t
)
Z(t−2)0 0.5 1
0
0.5
1
Z(t
)
Z(t−3)
0 0.5 10
0.5
1
Z(t
)
Z(t−4)0 0.5 1
0
0.5
1
Z(t
)
Z(t−5)0 0.5 1
0
0.5
1
Z(t
)
Z(t−6)
0 0.5 10
0.5
1
Z(t
)
Z(t−7)0 0.5 1
0
0.5
1
Z(t
)
Z(t−8)0 0.5 1
0
0.5
1
Z(t
)
Z(t−9)
Figura 4.9: Lagplot para a serie do Indice Dow Jones Industrial Average do lag 1 ao 9.
4.6 SERIE DO INDICE NASDAQ 60
Tabela 4.4: Valores tıpicos e algumas estatısticas da serie do Indice Dow Jones IndustrialAverage.
Estatısticas Valores
Quantidade de Pontos 1420Valor Maximo 11723.0000Valor Mınimo 7286.3000Valor Medio 9708.3000Variancia 1096756.9054
Desvio Padrao 1047.2616
4.6 SERIE DO INDICE NASDAQ
O ındice Nasdaq (National Association of Securities Dealers Automated Quotation) do
Mercado de Valores, fundado em 1971, foi o primeiro mercado de valores eletronico do
mundo. O proposito de sua fundacao foi a popularizacao do OTC (over-the-count) do
mercado, onde ate aquele ponto era relativamente desconhecido e novo para muitos in-
vestidores, consistindo em um ındice calculado a partir de um processo de ponderamento
de capitalizacao.
A serie aqui utilizada do Indice Nasdaq consiste em observacoes diarias desde 2 de
fevereiro de 1971 ate 18 de junho de 2004, totalizando 8428 pontos, onde a Figura 4.10
mostra o grafico da serie.
Aplicando o δ-Test, o unico retardo temporal relevante e o lag 1. Ja pelo metodo
lagplot (Figura 4.11), todos os lags de 1 a 9 tem, a priori, um mesmo comportamento,
aparentemente linear, onde todos podem contribuir para um melhor resultado em pre-
visoes. Algumas estatısticas basicas a respeito da serie sao encontradas na Tabela 4.5.
Tabela 4.5: Valores tıpicos e algumas estatısticas da serie do Indice Nasdaq.
Estatısticas Valores
Quantidade de Pontos 8427Valor Maximo 8.5269Valor Mınimo 4.0050Valor Medio 5.9931Variancia 1.2689
Desvio Padrao 1.1264
4.7 SERIE DO INDICE S&P500 61
0 1000 2000 3000 4000 5000 6000 7000 80004
4.5
5
5.5
6
6.5
7
7.5
8
8.5
9
Medidas Diarias
Vav
or d
a N
asda
q
Figura 4.10: Grafico da serie do Indice Nasdaq.
0 0.5 10
0.2
0.4
0.6
0.8
Z(t
)
Z(t−1)0 0.5 1
0
0.2
0.4
0.6
0.8
Z(t
)
Z(t−2)0 0.5 1
0
0.2
0.4
0.6
0.8
Z(t
)
Z(t−3)
0 0.5 10
0.2
0.4
0.6
0.8
Z(t
)
Z(t−4)0 0.5 1
0
0.2
0.4
0.6
0.8
Z(t
)
Z(t−5)0 0.5 1
0
0.2
0.4
0.6
0.8
Z(t
)
Z(t−6)
0 0.5 10
0.2
0.4
0.6
0.8
Z(t
)
Z(t−7)0 0.5 1
0
0.2
0.4
0.6
0.8
Z(t
)
Z(t−8)0 0.5 1
0
0.2
0.4
0.6
0.8
Z(t
)
Z(t−9)
Figura 4.11: Lagplot para a serie do Indice Nasdaq do lag 1 ao 9.
4.7 SERIE DO INDICE S&P500
O Indice S&P500 (Standard & Poor 500 ) e um ındice ponderado de valores de mercado
de 500 acoes que sao negociadas no New York Stock Exchange (NYSE), American Stock
Exchange (AMEX), e no Nasdaq National Market System. O ponderamento faz as in-
fluencias de cada companhia sobre a apresentacao do ındice ser diretamente proporcional
ao seu valor de mercado. As companhias selecionadas para compor o Indice S&P500
4.7 SERIE DO INDICE S&P500 62
nao sao escolhidas apenas pelo fato de serem as maiores em termos de valor de mercado,
ou vendas, ou lucros. Ademais, estas companhias incluıdas no ındice tendem a ser de
industrias representativas dentro de importantes ramos da economia norte americana.
Usando este metodo, e possıvel fazer correcoes absolutas para divisoes e mudancas de
capital similares sem afetar a continuidade do ındice ou a importancia relativa da acao
sobre o ındice como um todo. Deste modo, o Padrao “500” evita as distorcoes criadas
pela utilizacao de medias simples com e o caso dos ındices Dow Jones e Nasdaq.
A serie S&P500 utilizada e composta por 369 pontos referentes as observacoes mensais
do ındice de janeiro de 1970 a agosto de 2003. Na Figura 4.12 e mostrado o grafico para
a serie utilizada.
0 50 100 150 200 250 300 3500
500
1000
1500
2000
2500
3000
3500
4000
4500
5000
Observaçoes Mensais
Val
or S
&P
500
Figura 4.12: Grafico da serie do Indice S&P500.
Aplicando-se o metodo do δ-Test para esta serie e encontrado como retardo temporal
relevante apenas o lag 1. Construindo o lagplot para os lags de 1 a 9 (Figura 4.13) ha
o aparecimento de estruturas com uma forte tendencia linear, contudo, a medida que se
aumenta o grau dos lags, nota-se o aparecimento de uma estrutura na parte superior dos
graficos, podendo vir a caracterizar algum relacionamento nao-linear. Entretanto devido
ao resultado do δ-Test assumir apenas a correlacao do primeiro lag, tais estruturas podem
vir a significar apenas um aumento na perda de correlacao entre os pontos.
Algumas estatısticas basicas a respeito da serie S&P500 utilizada podem ser encon-
tradas na Tabela 4.6.
4.8 SERIE DO VALOR DE FECHAMENTO DAS ACOES DA PETROBRAS 63
0 0.2 0.40
0.1
0.2
0.3
0.4
Z(t
)
Z(t−1)0 0.2 0.4
0
0.1
0.2
0.3
0.4
Z(t
)
Z(t−2)0 0.2 0.4
0
0.1
0.2
0.3
0.4
Z(t
)
Z(t−3)
0 0.2 0.40
0.1
0.2
0.3
0.4
Z(t
)
Z(t−4)0 0.2 0.4
0
0.1
0.2
0.3
0.4
Z(t
)
Z(t−5)0 0.2 0.4
0
0.1
0.2
0.3
0.4
Z(t
)
Z(t−6)
0 0.2 0.40
0.1
0.2
0.3
0.4
Z(t
)
Z(t−7)0 0.2 0.4
0
0.1
0.2
0.3
0.4
Z(t
)
Z(t−8)0 0.2 0.4
0
0.1
0.2
0.3
0.4
Z(t
)
Z(t−9)
Figura 4.13: Lagplot para a serie do Indice S&P500 do lag 1 ao 9.
Tabela 4.6: Valores tıpicos e algumas estatısticas da serie do Indice S&P500.
Estatısticas Valores
Quantidade de Pontos 369Valor Maximo 3533.8200Valor Mınimo 74.1240Valor Medio 866.7524Variancia 1189443.0922
Desvio Padrao 1090.6159
4.8 SERIE DO VALOR DE FECHAMENTO DAS ACOES DA PETROBRAS
A serie da Petrobras e constituıda por registros diarios referentes ao valor de fechamento
das acoes da Petrobras (PetrobrasON - Codigo da Bovespa PETR3) de 2 de janeiro de
1995 ate 3 de julho de 2003, totalizando 2086 pontos.
A Petrobras e uma empresa brasileira de prospeccao, extracao e refino de petroleo
de grande destaque a nıvel internacional, principalmente em tecnologia de extracao de
petroleo em aguas de alta profundidade, sendo tambem uma das maiores empresas bra-
sileiras, merecendo atencao no mercado de valores.
A Figura 4.14 mostra o grafico da serie das acoes da Petrobras. Aplicando o metodo
do δ-Test a esta serie e encontrado como retardo temporal relevante apenas o lag 1,
enquanto com o lagplot para os lags de 1 a 9, Figura 4.15, percebe-se novamente que
existe uma forte componente linear do lag 1 ao 9. Porem, e possıvel perceber a formacao
de uma estrutura nao-linear aproximadamente no centro dos graficos a medida que se
4.9 RANDOM WALK 64
avanca no grau dos lags, vindo novamente a contradizer o resultado obtido pelo δ-Test.
0 200 400 600 800 1000 1200 1400 1600 1800 20000
10
20
30
40
50
60
70
Observaçoes Diarias
Val
or d
a P
etro
bras
ON
Figura 4.14: Grafico da serie da Acoes da Petrobras.
0 0.5 10
0.2
0.4
0.6
0.8
Z(t
)
Z(t−1)0 0.5 1
0
0.2
0.4
0.6
0.8
Z(t
)
Z(t−2)0 0.5 1
0
0.2
0.4
0.6
0.8
Z(t
)
Z(t−3)
0 0.5 10
0.2
0.4
0.6
0.8
Z(t
)
Z(t−4)0 0.5 1
0
0.2
0.4
0.6
0.8
Z(t
)
Z(t−5)0 0.5 1
0
0.2
0.4
0.6
0.8
Z(t
)
Z(t−6)
0 0.5 10
0.2
0.4
0.6
0.8
Z(t
)
Z(t−7)0 0.5 1
0
0.2
0.4
0.6
0.8
Z(t
)
Z(t−8)0 0.5 1
0
0.2
0.4
0.6
0.8
Z(t
)
Z(t−9)
Figura 4.15: Lagplot para a serie das Acoes da Petrobras do lag 1 ao 9.
Na Tabela 4.7 sao mostrados os valores de algumas estatısticas basicas a respeito da
serie dos valores de fechamento da acoes da Petrobras.
4.9 RANDOM WALK
Devido a grande complexidade do sistema associado a dinamica que rege o comporta-
mento de series economicas e financeiras, e comum se considerar como primeira apro-
4.9 RANDOM WALK 65
Tabela 4.7: Valores tıpicos e algumas estatısticas da serie do Valor de Fechamento daAcoes da Petrobras.
Estatısticas Valores
Quantidade de Pontos 2086Valor Maximo 62.9986Valor Mınimo 2.7082Valor Medio 26.0622Variancia 363.9645
Desvio Padrao 19.0779
ximacao para um dado valor futuro de uma serie, o respectivo valor atual mais ou me-
nos uma pequena flutuacao. Este modelo e exatamente um Random Walk, ou tambem
chamado simplesmente de “caminhada aleatoria”, que pode ser representado como um
modelo mostrado na Equacao (.),
Zt = Zt−1 + rt (.)
onde rt e um termo aleatorio.
Neste sentido, foi gerado artificialmente um conjunto de 1000 pontos (Figura 4.16)
seguindo o modelo da Equacao (.), onde o valor inicial para a serie foi Z0 = 100 e
o termo aleatorio (rt) foi construıdo a partir de uma distribuicao uniforme de numeros
aleatorios no intervalo [-10,10].
A este conjunto de pontos gerados pelo modelo de Random Walk foi aplicado o metodo
δ-Test, que determinou como retardo temporal relevante o lag 1, e o metodo lagplot, para
os lags de 1 a 9 (Figura 4.17), revelou um comportamento linear para todos os nove
lags. Observando os graficos do lagplot, a medida que se aumenta o grau dos lags ha um
aumento na variancia dos pontos (largura das “linhas retas”), o que esta de acordo com
o modelo de um Random Walk onde sua variancia aumenta linearmente com o horizonte
de previsao. Algumas estatısticas basicas para esta serie tipo Random Walk podem ser
encontradas na Tabela 4.8.
4.9.1 O Modelo Random Walk e as Series Financeiras
Pode-se verificar que o comportamento das series economicas e financeiras tratadas (DJIA,
Nasdq, S&P500, Petrobras) assemelha-se a serie artificial gerada pelo modelo de Random
4.9 RANDOM WALK 66
0 100 200 300 400 500 600 700 800 900 100030
40
50
60
70
80
90
100
110
120
130
Pontos
Ran
dom
Wal
k
Figura 4.16: Grafico da serie artificial gerada pelo modelo de Random Walk referente aEquacao (.).
0 0.5 10
0.5
1
Z(t
)
Z(t−1)0 0.5 1
0
0.5
1
Z(t
)
Z(t−2)0 0.5 1
0
0.5
1
Z(t
)
Z(t−3)
0 0.5 10
0.5
1
Z(t
)
Z(t−4)0 0.5 1
0
0.5
1
Z(t
)
Z(t−5)0 0.5 1
0
0.5
1
Z(t
)
Z(t−6)
0 0.5 10
0.5
1
Z(t
)
Z(t−7)0 0.5 1
0
0.5
1
Z(t
)
Z(t−8)0 0.5 1
0
0.5
1
Z(t
)
Z(t−9)
Figura 4.17: Lagplot para a serie artificial gerada pelo modelo de Random Walk referentea Equacao (.) do lag 1 ao 9.
Walk, Equacao (.), segundo os resultados obtidos pelos metodos δ-Test e lagplot. Con-
tudo, ao comparar tais resultados obtidos pelo lagplot, verifica-se tambem que tais series
economicas, exceto a Nasdaq, apresentam um indıcio de aparecimento de uma estrutura
nao-linear de relacionamento entre os pontos a medida que se aumenta o grau dos lags.
Este fato pode vir a indicar que tais series economicas sejam formadas por duas com-
ponentes, uma componente linear, bastante sensıvel a acontecimentos ocorridos em um
4.10 MEDIDAS DE DESEMPENHO PARA A PREVISAO 67
Tabela 4.8: Valores tıpicos e algumas estatısticas da serie artificial gerada pelo modelode Random Walk referente a Equacao (.).
Estatısticas Valores
Quantidade de Pontos 1000Valor Maximo 120.1989Valor Mınimo 37.1578Valor Medio 74.8705Variancia 221.5401
Desvio Padrao 14.8842
passado extremamente recente, sendo responsavel pelo comportamento aparentemente
aleatorio (Random Walk); e uma componente nao-linear, referente a acontecimentos de
longo prazo, ou de um comportamento medio da serie, que e responsavel pelo apareci-
mento das estruturas nao-lineares nos graficos dos lagplots a medida que se aumenta o
grau dos lags.
Seguindo esta linha de raciocınio, series economicas e financeiras sao dominadas pela
componente linear de Random Walk devido a propria magnitude relativa entre as estrutu-
ras lineares e nao-lineares. Assim, para previsoes de horizontes pequenos um modelo tao
simples apresenta resultados bastante eficientes, que leva as aplicacoes praticas considera-
rem como relevantes apenas um historico pequeno de dados relativos as series, capturando
apenas o comportamento linear do fenomeno. Contudo, segundo estes indıcios apresen-
tados, e possıvel melhorar o grau de desempenho de previsao considerando nao apenas a
componente linear, mas tambem a componente nao-linear com o uso de historicos maio-
res de dados, podendo englobar um comportamento mais geral do fenomeno que governa
a serie, e, aliado a este historico mais completo, um modelo capaz de reconhecer tais
estruturas nao-linear aparentemente tao sutis.
4.10 MEDIDAS DE DESEMPENHO PARA A PREVISAO
Para o problema de previsao, a medida de desempenho natural e a propria previsao
alcancada. Entretanto, nao existe uma forma unica nem universalmente adotada pelos
pesquisadores da area para a avaliacao da previsao.
As medidas de desempenho sao frequentemente definidas em termos do erro de pre-
visao, o qual e formulado como a diferenca entre o valor atual da serie (ou valor dese-
jado — target) e o valor previsto (ou valor de saıda do modelo —output), definido pela
4.10 MEDIDAS DE DESEMPENHO PARA A PREVISAO 68
Equacao (.),
et = (targett − outputt) (.)
Da Equacao (.) escreve-se a medida mais popular utilizada para o desempenho de
previsao,
MSE =1
N
N∑
t=1
(et)2 (.)
onde N e a quantidade de pontos da serie temporal.
Embora o erro MSE (Mean Square Error) possa ser utilizado como parametro de
medida de qualidade da previsao realizada, este nao exibe, de forma clara, o comporta-
mento do modelo de previsao, gerando polemica quanto ao seu uso [99]. Desta forma,
para uma melhor compreensao e analise dos modelos de previsao, serao utilizadas outras
medidas de desempenho em conjunto com o MSE, gerando uma base mais consolidada
de resultados.
Dentre as medidas adotadas, tem-se o Erro Medio Percentual (Mean Absolute Per-
centual Error – MAPE),
MAPE =1
N
N∑
t=1
∣∣∣∣et
Zt
∣∣∣∣ (.)
onde N e a quantidade de pontos previstos, et e o erro dado pela Equacao (.) e Zt e o
ponto da serie no instante t.
Outra medida de desempenho e a estatıstica U de Theil (ou NMSE) [100], que se
baseia no MSE do preditor normalizado pelo erro de previsao de um modelo do tipo
Random Walk. Um modelo Random Walk simplesmente assume que o melhor valor de
previsao para o tempo t + 1 e o valor obtido no tempo t. Portanto, a estatıstica U de
Theil e dada por,
Theil =
∑N
t=1(targett − outputt)2
∑N
t=1(outputt − outputt−1)2(.)
onde se Theil = 1 o modelo tem um desempenho igual a um modelo do tipo Random
Walk ; se Theil > 1 o desempenho e inferior a um modelo do tipo Random Walk ; e, se
Theil < 1, o preditor tera um desempenho superior a um modelo do tipo Random Walk.
Em um modelo ideal, a estatıstica U de Theil deve tender a zero.
Outra medida de desempenho e a medida da previsao da alteracao da direcao, ou
seja, se o valor futuro ira subir ou cair em relacao ao valor atual. A medida POCID
4.10 MEDIDAS DE DESEMPENHO PARA A PREVISAO 69
(Prediction On Change In Direction) mede o percentual de acerto quanto a tendencia da
serie, definida por,
POCID = 100
∑N
t=1 Dt
N(.)
onde,
Dt =
{1, se (Targett − Targett−1) · (Outputt − Outputt−1) > 0
0, Caso contrario(.)
Uma medida de desempenho relativa bem relevante e a Variancia Relativa Media
(ARV), dada por,
ARV =1
N
∑N
t=1(outputt − targett)2
∑N
t=1(outputt − target)2(.)
onde N e a quantidade de pontos preditos, targett e a saıda desejada para o modelo
preditor no tempo t, outputt e a saıda do modelo de preditor e target e a media da serie
temporal.
A medida ARV ira medir o ganho de desempenho de previsao do modelo relativo a
uma previsao da media da serie, onde se ARV = 1, entao o modelo e equivalente a se
calcular a media da serie e utilizar esta como previsao. Se ARV > 1, entao o modelo e
inferior a previsao realizada pela media da serie, e por fim, se ARV < 1, entao o modelo
tem um desempenho de previsao superior quando comparado a previsao atraves da media
da serie. Em um modelo ideal ARV deve tender a zero.
Contudo, todas estas medidas de desempenho exibidas ate entao nao levam em con-
sideracao a quantidade de graus de liberdade, ou parametros de ajuste, que o modelo
contem. Quanto maior a quantidade de parametros livres, maior a possibilidade de
super-estimacao (ou overfitting).
Os criterios de informacao AIC (Akaike Information criterion) [101,102] e BIC (Bay-
sean Information criterion) [64,102] levam em consideracao a quantidade de parametros
livres do sistema, penalizando o modelo de forma proporcional a sua quantidade de
parametros livres. Estes criterios podem ser definidos de forma aproximada como [102],
AIC = −Nln(MSE) + 2p (.)
BIC = Nln(MSE) + p + pln(N) (.)
4.10 MEDIDAS DE DESEMPENHO PARA A PREVISAO 70
Tanto o AIC como o BIC penalizam os parametros livres no modelo, porem o BIC
pune estes parametros de forma mais severa que o AIC, e por essa razao pode ser preferido
como criterio de comparacao e escolha de modelos [102].
CAPITULO 5
RESULTADOS EXPERIMENTAIS COM METODOS
TRADICIONAIS
Neste Capıtulo sao apresentados os resultados experimentais com os metodos ditos con-
vencionais — modelos de Box & Jenkins e a tecnica da Inteligencia Artificial mais popular,
as Redes Neurais Artificiais do tipo MLP.
Os modelos de Box & Jenkins sao as tecnicas mais populares no ramo da estatıstica
para a previsao de series temporais, sendo o ponto de partida para um bom entendimento
das leis que regem um determinado fenomeno temporal. Ja as Redes Neurais Artificiais
do Tipo MLP sao tecnicas relativamente novas (paradigma cognitivo da Inteligencia Arti-
ficial), porem aplicadas ha mais de uma decada a previsao, sendo a forma mais encontrada
na literatura de utilizar a Inteligencia Artificial na resolucao deste problema.
5.1 INTRODUCAO
Dadas as series temporais introduzidas no Capıtulo 4, estarao sendo mostrados nas
proximas secoes deste Capıtulo os experimentos de previsao realizados com os modelos
de Box & Jenkins e com as Redes Neurais do tipo MLP .
Inicialmente, foram realizados experimentos com os modelos lineares de Box & Jen-
kins, construindo uma base de resultados utilizada como ponto de partida para as com-
paracoes de desempenho com os demais metodos investigados. E interessante ressaltar
que os modelos de Box & Jenkins sao, em termos praticos, bastante aplicados como sis-
temas de apoio a decisao baseados na determinacao de acontecimentos futuros. Desta
forma, aliado ao fato da baixa complexidade computacional, os modelos de Box & Jen-
kins geram um limiar de resultados que deverao ser ultrapassados para que uma nova
metodologia adquira interesse em aplicacoes praticas.
Em seguida e apresentada uma serie de experimentos que utilizam unicamente as
RNAs do tipo MLP como preditores, sendo estes resultados analisados e comparados
71
5.2 EXPERIMENTOS COM OS MODELOS DE BOX & JENKINS 72
com os resultados gerados a partir dos experimentos dos modelos de Box & Jenkins.
5.2 EXPERIMENTOS COM OS MODELOS DE BOX & JENKINS
Foram realizados alguns experimentos com os modelos de Box & Jenkins (ARIMA(p, d, q))
para a obtencao de resultados provenientes de modelos estatısticos lineares bem funda-
mentados, servindo como base para comparacoes de desempenho de previsao com os
demais modelos nao-lineares utilizados.
Para a realizacao destes experimentos foi utilizada a ferramenta MatLab, versao 6.5
(R.13), com a toolbox ARMASA. Esta toolbox e de distribuicao livre e pode ser encontrada
para download no endereco eletronico http://www.dcsc.tudelft.nl/Research/Software/. Sua
proposta basica e calcular os coeficientes dos operadores utilizados na construcao dos mo-
delos ARMA(p,q), otimizando-os a partir do desempenho de previsao.
Em todos os experimentos realizados com os modelos de Box & Jenkins, as series
temporais foram divididas em dois conjuntos: o conjunto de treinamento, utilizado para
o ajuste dos parametros do modelo, e o conjunto de teste, utilizado para medir o desem-
penho de previsao do modelo, respeitando sempre a proporcao de 90% e 10% dos dados
historicos das series para os dois conjuntos respectivamente. Tambem foi realizada um
normalizacao das series para o intervalo [0,1], utilizando a Equacao (.), na tentativa de
padronizacao de algumas medidas de desempenho, como o MSE.
5.2.1 Serie do Mapa de Henon
Para a serie de Henon foi selecionado o modelo ARIMA(26,0,1), onde os coeficientes
auto-regressivos e de medias moveis sao expostos no Apendice C.
Na Tabela 5.1 sao apresentados os resultados obtidos atraves das medidas de de-
sempenho de previsao, tanto para o conjunto de treinamento como para o de teste.
Analisando os resultados alcancados com o modelo ARIMA(26,0,1), o Erro MSE por
si so nao apresenta uma boa descricao das caracterısticas do sistema, mas serve como
parametro de medida, indicando um desempenho para o conjunto de teste de 0.3625.
O Erro MAPE da um melhor sentimento quanto ao comportamento da previsao em
relacao ao valor real da serie que para o conjunto de teste apresentou um valor muito alto
5.2 EXPERIMENTOS COM OS MODELOS DE BOX & JENKINS 73
(404.53%) demonstrando um fraco desempenho do modelo.
Tabela 5.1: Medidas de Desempenho de previsao para o modelo ARIMA(26,0,1) aplicadoa serie de Henon
Erros Conjunto de Treinamento Conjunto de Teste
MSE 0.3637 0.3625MAPE 446.07% 404.53%
U de Theil 2.2905 2.2709POCID 48.8943% 48.9489%ARV 4.5077 4.2811AIC -5028.9 -5045.4BIC -4923.6 -4940.2
O valor alcancado pela estatıstica U de Theil, que gera um limiar de comparacao com
um modelo do tipo Random Walk, mostra que o modelo aplicado a serie de Henon tem
um desempenho bem pior do que o desempenho de um modelo extremamente simplista
(Random Walk), obtendo um valor de 2.2709 para o conjunto de teste.
A medida POCID, que relata o acerto da direcao (subida ou queda) do ponto previsto
em relacao ao ponto real, tambem mostra resultados muito pobres (conjunto de teste
— 48.9489%), visto que ha uma chance de 50% de acertar a direcao do proximo ponto
utilizando uma suposicao ao acaso (experimento do tipo cara ou coroa).
A medida ARV, que compara o desempenho do modelo com a previsao media da serie,
revela que este modelo e bem inferior a utilizacao do valor medio da serie com previsao.
Os criterios de informacao, AIC e BIC, da mesma forma como o Erro MSE, por si
so nao dao um bom sentimento a respeito da previsao, mas servem como parametros de
comparacao de desempenho entre modelos de forma bem mais robusta que o MSE, uma
vez que levam em consideracao a quantidade de graus de liberdade de cada modelo, como
ja descrito no Capıtulo 4. O AIC teve como resultados para o conjunto de teste -5045.4;
e o BIC para o conjunto de teste -4940.2.
Na Figura 5.1 e mostrado um grafico comparativo para os ultimos 100 pontos do con-
junto de teste entre os valores reais da seria (linha solidas) e a previsao (linha tracejada).
5.2 EXPERIMENTOS COM OS MODELOS DE BOX & JENKINS 74
910 920 930 940 950 960 970 980 990 1000−2
−1.5
−1
−0.5
0
0.5
1
1.5
2
Hen
on
Pontos − Conjunto de Teste
Figura 5.1: Grafico comparativo entre os valores reais (linha solida) e os valores deprevisao (linha tracejada) gerados pelo modelo de Box & Jenkins para os ultimos 100pontos do conjunto de teste da serie de Henon.
5.2.2 Serie das Manchas Solares
Para a serie das Manchas Solares foi selecionado o modelo ARIMA(9,0,1), cujos coefi-
cientes auto-regressivos e de medias moveis sao apresentados no Apendice C.
Na Figura 5.2 e mostrado um grafico comparativo para o conjunto de teste entre os
valores reais da serie (linha solida) e a previsao (linha tracejada). As mesmas medidas
de desempenho de previsao utilizadas na serie de Henon tambem foram aplicadas a esta
serie, resumidas na Tabela 5.2. De forma geral, as medidas de desempenho apresentam
resultados superiores quando comparados com a serie de Henon, podendo vir a indicar
que o modelo de Box & Jenkins melhor se ajusta para sua predicao.
Tabela 5.2: Medidas de Desempenho de previsao para o modelo ARIMA(9,0,1) aplicadoa serie das Manchas Solares.
Erros Conjunto de Treinamento Conjunto de Teste
MSE 0.0153 0.0219MAPE 57.03% 42.35%
U de Theil 1.0865 0.7805POCID 77.2201% 75.000%ARV 0.3760 0.4007AIC -1069.3 -92.8323BIC -1028.3 -71.5266
5.2 EXPERIMENTOS COM OS MODELOS DE BOX & JENKINS 75
0 5 10 15 20 25 30−20
0
20
40
60
80
100
120
140
160
Man
chas
Sol
ares
Pontos − Conjunto de Teste
Figura 5.2: Grafico comparativo entre os valores reais (linha solida) e os valores deprevisao gerados pelo modelo de Box & Jenkins (linha tracejada) para o conjunto deteste da serie das Manchas Solares.
Analisando os resultados para o conjunto de teste, pode-se destacar tres medidas de
desempenjo, o POCID, ARV e a estatıstica U de Theil. Para o POCID tem-se resultados
expressivos de 75.0000%, bem superiores em comparacao aos 50% obtidos por uma pre-
visao tipo cara ou coroa. Para a medida do ARV foram alcancados os valores de 0.4007,
demonstrando uma previsao bem superior a suposicao do valor medio. Ja a estatıstica U
de Theil (0.7805), mostra que este modelo alcanca uma melhor generalizacao, tornando-se
mais apto do que um Random Walk. As demais medidas de desempenho foram, MSE –
0.0219; MAPE – 42.35%; AIC – -92.8323; e BIC – -71.5266.
5.2.3 Serie de Medidas do Brilho de uma Estrela
Para a serie de Medidas do Brilho de uma Estrela foi selecionado o modelo ARIMA(88, 0,
0), que apesar da grande quantidade de parametros auto-regressivos, consegue ter um bom
desempenho nas previsoes. Os parametros selecionados sao mostrados no Apendice C.
Na Figura 5.3 e exibido um grafico comparativo para o conjunto de teste entre os valo-
res reais da serie (linha solidas) e a previsao (linha tracejada). As medidas de desempenho
de previsao ja utilizadas nas demais series tambem foram aplicadas, e sao resumidas na
Tabela 5.3. Para esta serie em particular as medidas de desempenho mostram resultados
bem superiores quando comparados de forma relativa as outras, vindo a indicar que, a
5.2 EXPERIMENTOS COM OS MODELOS DE BOX & JENKINS 76
despeito da nao-linearidade da serie, os modelos de Box & Jenkins conseguem descrever
relativamente bem o fenomeno.
0 10 20 30 40 50 600
5
10
15
20
25
30
35
Bril
ho d
e um
a E
stre
laV
alor
de
Bril
ho (
u.a.
)
Pontos − Conjunto de Teste
Figura 5.3: Grafico comparativo entre os valores reais (linha solida) e os valores deprevisao gerados pelo modelo de Box & Jenkins (linha tracejada) para o conjunto deteste da serie de Medidas do Brilho de uma Estrela.
Tabela 5.3: Medidas de Desempenho de previsao para o modelo ARIMA(88,0,0) aplicadoa serie de Medidas do Brilho de uma Estrela.
Erros Conjunto de Treino Conjunto de Teste
MSE 2.0484e-4 3.9004e-4MAPE 3.05% 9.36%
U de Theil 0.0564 0.0679POCID 100.00% 100.00%ARV 0.0032 0.0035AIC -4410.4 -294.9564BIC -3944.7 -22.6541
Destas medidas para o conjunto de teste, podem-se destacar tres: a estatıstica U
de Theil, POCID e ARV. A estatıstica U de Theil mostra o valor de 0.0679, indicando
um desempenho de uma ordem de grandeza superior a um Random Walk. O POCID
tambem apresenta resultados expressivos de 100.00%, e a medida ARV revela o superior
desempenho de previsao quando comparado a uma previsao baseada na media da serie,
alcancando o valor de 0.0035.
Para as demais medidas, sempre em relacao ao conjunto de teste, o MSE alcancou o
valor de 3.9004e-4; o MAPE, que e um erro absoluto percentual, alcancou um valor de
5.2 EXPERIMENTOS COM OS MODELOS DE BOX & JENKINS 77
9.36%, sendo bons resultados, considerando-se a nao-linearidade da serie. O criterio de
informacao AIC alcancou -294.9564, e o criterio de informacao BIC -22.6541.
5.2.4 Serie do Indice Dow Jones Industrial Average (DJIA)
Para a serie do Indice Dow Jones Industrial Average (DJIA) foi selecionado o modelo
de Box & Jenkins ARIMA(1,0,1), onde o coeficiente auto-regressivo e o coeficiente de
medias moveis sao dados no Apendice C.
Um grafico comparativo entre a serie real DJIA (linha solida) e a previsao gerada
pelo modelo ARIMA(1, 0, 1) (linha tracejada) e exibido na Figura 5.4, onde e possıvel
perceber que a previsao nao e capaz de acompanhar as flutuacoes de alta frequencia
da serie, refletindo apenas um comportamento medio. Nota-se tambem que em alguns
pontos a previsao tenta repetir, ou se aproxima, do ponto imediatamente anterior (no
tempo) da serie real, caracterizando um comportamento do tipo Random Walk.
0 20 40 60 80 100 120 1407500
8000
8500
9000
9500
DJI
A
Pontos − Conjunto de Teste
Figura 5.4: Grafico comparativo entre os valores reais (linha solida) e os valores deprevisao gerados pelo modelo de Box & Jenkins (linha tracejada) para o conjunto deteste da serie do Indice Dow Jones Industrial Average (DJIA).
Quanto as medidas de desempenho, exibidas na Tabela 5.4, embora apresentem para
o conjunto de teste um MSE de 5.8033e-4 e um MAPE de 8.32%, exibem um valor para
a estatıstica U de Theil de 1.2649, indicando que o modelo tem um desempenho inferior
a um Random Walk, e um POCID 46.0993%, assemelhando-se a um experimento do tipo
cara ou coroa. Ja a medida ARV apresenta valores que indicam uma previsao superior
quando comparada a media da serie, com valor de 0.0392. Tambem sao apresentados os
5.2 EXPERIMENTOS COM OS MODELOS DE BOX & JENKINS 78
Tabela 5.4: Medidas de Desempenho de previsao para o modelo ARIMA(1,0,1) aplicadoa serie do Indice Dow Jones Industrial Average (DJIA).
Erros Conjunto de Treinamento Conjunto de Teste
MSE 0.0011 5.8033e-4MAPE 6.47% 8.32%
U de Theil 1.3921 1.2649POCID 49.1778% 46.0993%ARV 0.0210 0.0392AIC -8691.2 -1056.2BIC -8685.1 -1052.2
resultados para os criterios de informacoes AIC (-1056.2) e BIC (-1052.2).
5.2.5 Serie do Indice Nasdaq
Para a serie do Indice Nasdaq os experimentos com os modelos Box & Jenkins elegeram
o modelo ARIMA(44,0,1), onde os coeficientes auto-regressivos e de medias moveis sao
dados no Apendice C.
Tabela 5.5: Medidas de desempenho de previsao para o modelo ARIMA(44,0,1) aplicadoa serie do Indice Nasdaq.
Erros Conjunto de Treinamento Conjunto de Teste
MSE 8.4070e-6 2.4222e-5MAPE 0.92% 0.50%
U de Theil 1.4558 1.2702POCID 58.6443% 50.4751%ARV 1.5036e-4 0.0162AIC -88542.0 -8871.6BIC -88193.0 -8619.2
Graficos comparativos entre a serie real (linha solida) e a previsao gerada pelo modelo
ARIMA(44,0,1) (linha tracejada) sao mostrados na Figura 5.5 e Figura 5.6. Observando
a Figura 5.5 (grafico comparativo para todo o conjunto de teste — 842 pontos) exibe
um bom ajuste visual da previsao aos valores reais. Entretanto, realizando uma am-
pliacao neste grafico, Figura 5.6, e possıvel perceber que a previsao executa apenas o
comportamento medio da serie, defasada no tempo, assemelhando-se ao comportamento
de um modelo do tipo Random Walk, justificando os resultados obtidos pelas medidas de
desempenho da estatıstica U de Theil e POCID, resumidas na Tabela 5.5.
5.2 EXPERIMENTOS COM OS MODELOS DE BOX & JENKINS 79
0 100 200 300 400 500 600 700 8007
7.1
7.2
7.3
7.4
7.5
7.6
7.7
7.8
7.9
8
Nas
daq
Pontos − Conjunto de Teste
Figura 5.5: Grafico comparativo entre os valores reais (linha solida) e os valores deprevisao gerados pelo modelo de Box & Jenkins (linha tracejada) para o conjunto deteste da serie do Indice Nasdaq.
700 720 740 760 780 800 820 8407
7.1
7.2
7.3
7.4
7.5
7.6
7.7
7.8
7.9
8
Nas
daq
Pontos − Conjunto de Teste
Figura 5.6: Grafico comparativo entre os valores reais (linha solida) e a previsao geradapelo modelo ARIMA (linha tracejada) para os ultimos 142 pontos do conjunto de testedo Indice Nasdaq.
5.2.6 Serie do Indice S&P500
Para a serie do Indice S&P500 os experimentos com os modelos de Box & Jenkins elegeram
o modelo ARIMA(1, 0, 1), onde o coeficiente auto-regressivo e o coeficiente de medias
moveis sao dados no Apendice C.
5.2 EXPERIMENTOS COM OS MODELOS DE BOX & JENKINS 80
Um grafico comparativo entre a serie real (linha solida) e a previsao do modelo
ARIMA(1, 0, 1) (linha tracejada) e mostrado na Figura 5.7. O modelo de Box & Jenkins
apenas preve o comportamento medio da serie, nao respondendo as flutuacoes de alta
frequencia, apresentando um aparente deslocamento temporal (de um passo) em relacao
aos pontos reais, assemelhando-se a um modelo do tipo Random Walk. Os valores das
medidas de desempenho sao mostrados na Tabela 5.6.
Tabela 5.6: Medidas de Desempenho de previsao para o modelo ARIMA(1,0,1) aplicadoa serie do Indice S&P500.
Erros Conjunto de Treinamento Conjunto de Teste
MSE 1.8430e-4 2.1447e-4MAPE 14.85% 1.24%
U de Theil 1.5481 1.4090POCID 54.0785% 47.2222%ARV 0.0031 0.1374AIC -2852.8 -310.5510BIC -2848.0 -307.9400
0 5 10 15 20 25 30 357.8
7.9
8
8.1
8.2
8.3
8.4
8.5
S&
P50
0
Pontos − Conjunto de Teste
Figura 5.7: Grafico comparativo entre os valores reais (linha solida) e os valores deprevisao gerados pelo modelo de Box & Jenkins (linha tracejada) para o conjunto deteste da serie do Indice S&P500.
Para o conjunto de teste, o erro MSE alcancado foi de 2.1447e-4 e o erro MAPE
obteve 1.24%. Contudo, calculando a estatıstica U de Theil e obtido o valor de 1.4090.
Estes resultados informam que o modelo ARIMA(1,0,1) em questao e bem inferior a
um modelo do tipo Random Walk. O POCID de 47.2222% constata que este modelo
tambem e equivalente a um experimento do tipo cara ou coroa, afirmando ao acaso se o
5.2 EXPERIMENTOS COM OS MODELOS DE BOX & JENKINS 81
proximo ponto da serie ira subir ou cair em relacao ao atual. A medida ARV mostra que
embora este modelo se comporte como um Random Walk ainda e superior a uma simples
previsao baseada na media da serie, alcancando o valor de 0.1374. Por fim, os criterios
de informacao AIC e BIC obtiveram respectivamente -310.5510 e -307.9400.
5.2.7 Serie do Valor de Fechamento das Acoes da Petrobras
O modelo eleito nos experimentos de Box & Jenkins para a serie do valor de fechamento
das acoes da Petrobras (PetrobrasON) foi o ARIMA(2, 0, 1), onde os coeficientes auto-
regressivos e de medias moveis sao dados no Apendice C.
Um grafico comparativo entre os valores da serie (linha solida) e os valores de previsao
gerados pelo modelo ARIMA (2, 0, 1) (linha tracejada) e mostrado na Figura 5.8. Nota-
se que o modelo adotado so representa um comportamento medio, nao respondendo as
flutuacoes de alta frequencia, defasado temporalmente (de um passo) em relacao aos
pontos reais, demonstrando um comportamento usual de modelos do tipo Random Walk.
As medidas de desempenho, sumarizadas na Tabela 5.7, mostram para o conjunto de
teste um erro MSE de 2.5532e-4 e um erro MAPE de 1.41%. Ao se calcular a estatıstica
U de Theil, tem-se o valor de 4.0261, indicando que este modelo ARIMA e bem inferior
a um modelo do tipo Random Walk.
A medida POCID obteve 49.0385% para o conjunto de teste, indicando que este
modelo funciona como um experimento do tipo cara ou coroa. A medida ARV obteve
0.2080 e, por fim, os criterios de informacao AIC e BIC alcancaram os valores -1723.1 e
-1710.0 respectivamente.
Tabela 5.7: Medidas de desempenho de previsao para o modelo ARIMA(2,0,1) aplicadoa serie do Valor de Fechamento das Acoes da Petrobras.
Erros Conjunto de Treinamento Conjunto de Teste
MSE 4.9763e-4 2.5532e-4MAPE 4.89% 1.41%
U de Theil 4.1618 4.0261POCID 48.2942% 49.0385%ARV 0.0058 0.2080AIC -14270.0 -1723.1BIC -14250.0 -1710.0
5.2 EXPERIMENTOS COM OS MODELOS DE BOX & JENKINS 82
0 20 40 60 80 100 120 140 160 180 2003.5
3.6
3.7
3.8
3.9
4
4.1
Pet
robr
asO
N
Pontos − Conjunto de Teste
Figura 5.8: Grafico comparativo entre os valores reais (linha solida) e os valores deprevisao gerados pelo modelo de Box & Jenkins (linha tracejada) para o conjunto deteste da serie do Valor de Fechamento das Acoes da Petrobras.
5.2.8 Serie Random Walk
Aplicando o procedimento de Box & Jenkins a serie Random Walk, o modelo ARIMA(1, 0,
1) e selecionado como o de melhor desempenho (coeficientes apresentados no Apendice C).
Um grafico comparativo entre os pontos reais da serie (linha solida) e os pontos gerados
pelo modelo ARIMA(1,0,1) (linha tracejada) e exposto na Figura 5.9, onde o modelo em
questao so e capaz de gerar o comportamento medio da serie com um deslocamento
temporal (de um passo).
As medidas de desempenho alcancadas sao expostas na Tabela 5.8. Para o conjunto
de teste, o erro MSE computado foi de 0.0018 e o erro MAPE de 6.70%. A estatıstica
U de Theil alcancou um valor de 1.7633, mostrando que este modelo e inferior a simples
suposicao de que a melhor previsao e o ultimo valor gerado pela serie – suposicao de Ran-
dom Walk. O POCID computado foi de 54.5455%, indicando que este modelo funciona
como um experimento do tipo cara ou coroa. A medida ARV alcancou 0.1921, indicando
um desempenho superior ao da previsao da serie com a utilizacao de seu valor medio.
Por fim, os criterios de informacoes AIC e BIC foram respectivamente de -629.7357 e
-626.1305.
5.3 EXPERIMENTOS COM REDES NEURAIS ARTIFICIAIS DO TIPO MLP 83
0 10 20 30 40 50 60 70 80 90 100−20
0
20
40
60
80
100
120
140
160
Hen
on
Pontos − Conjunto de Teste
Figura 5.9: Grafico comparativo entre os valores reais (linha solida) e os valores deprevisao gerados pelo modelo de Box & Jenkins (linha tracejada) para o conjunto deteste da serie Random Walk.
Tabela 5.8: Medidas de desempenho de previsao para o modelo ARIMA(1,0,1) aplicadoa serie Random Walk.
Erros Conjunto de Treinamento Conjunto de Teste
MSE 0.0014 0.0018MAPE 7.77% 6.70%
U de Theil 1.5859 1.7633POCID 51.1680% 54.5455%ARV 0.0457 0.1921AIC -5888.3 -629.7357BIC -5882.5 -626.1305
5.3 EXPERIMENTOS COM REDES NEURAIS ARTIFICIAIS DO TIPO MLP
As redes neurais artificiais do tipo MLP [27] foram selecionadas para os experimentos
de previsao pela sua popularidade e eficiencia demonstrada na solucao de problemas de
previsao [10]. A arquitetura basica utilizada para todos os experimentos consiste em uma
rede neural MLP de tres camadas (uma camada de entrada, uma camada intermediaria e
uma camada de saıda), descrita com a notacao a-b-c, onde a e a quantidade de entradas,
b e a quantidade de neuronios na camada escondida e c e a quantidade de saıdas da rede.
A quantidade de entradas das redes e definida pela quantidade de retardos tempo-
rais utilizados para a descricao da serie. Para a definicao dos retardos temporais foram
utilizados o metodo δ-Test [18], os graficos de lagplot e alguns experimentos preliminares.
5.3 EXPERIMENTOS COM REDES NEURAIS ARTIFICIAIS DO TIPO MLP 84
A quantidade de neuronios escondidos foi determinada atraves de uma serie de ex-
perimentos preliminares, a partir dos quais foram eleitas tres configuracoes: 1, 5 e 10
neuronios. Ja a quantidade de saıdas das redes para todos os experimentos foi sempre
unitaria, visto que todos os experimentos com as RNAs objetivaram a previsao de apenas
um passo (horizonte da previsao unitario).
Em todos os experimentos a funcao sigmoide logıstica foi adotada como funcao de
ativacao para a camada intermediaria, Equacao (.). Ja para a camada de saıda foi
adotada a funcao linear, Equacao (.). O algoritmo de treinamento utilizado, para
todos os experimentos, foi o Levenberg-Marquardt [75].
A validacao cruzada foi utilizada em todos os experimentos (Proben1 [49]), com tres
criterios de parada:
1. Quantidade de Epocas no Processo de Treinamento - Quantidade maxima
de epocas realizadas no treinamento. Foi assumido um valor de 500 epocas.
2. Progresso do Treinamento - Desempenho mınimo requerido para a continuidade
do processo de treinamento. Foi assumido um valor de 10−6.
3. Erro de Validacao - Perda de generalizacao, definida pela quantidade maxima
permitida de acrescimo para o erro de validacao em relacao ao seu valor mınimo
durante o processo de treinamento. Foi assumido uma variacao aceitavel de 5%.
Todos os experimentos com as redes neurais foram desenvolvidos e implementados
com a ferramenta MatLab 6.5 (Release 13), com a utilizacao da toolbox de redes neurais
(Artificial Neural Network Toolbox ). Para cada arquitetura utilizada nos experimentos
foram executadas dez inicializacoes distintas, com o objetivo de obter um comportamento
medio do modelo. Os resultados para todos os experimentos e todas as medidas de
desempenho sao exibidos Apendice D, onde sao calculados os respectivos valores medios,
desvios padroes e intervalos de confianca. Todos os intervalos de confianca sao calculados
com a suposicao de distribuicao normal com um grau de certeza de 99% (α = 0.01).
Os experimentos foram realizados com uma constante preocupacao para a obtencao
de redes com um melhor desempenho de previsao possıvel, com o objetivo de garantir
uma comparacao de resultados entre modelos otimizados.
Nas proximas subsecoes sao expostos os resultados medios para as series temporais
5.3 EXPERIMENTOS COM REDES NEURAIS ARTIFICIAIS DO TIPO MLP 85
apresentadas no Capıtulo 4. Os resultados completos para todas as dez inicializacoes para
cada uma das arquiteturas das RNAs, para todas as series, sao exibidos no Apendice D.
5.3.1 Serie do Mapa de Henon
Para a serie do mapa de Henon foram escolhidos como retardos temporais relevantes os
lags 1 ao 4 baseado nos resultados obtidos a partir do metodo δ−Test e da propria equacao
geradora da serie (Equacao (.)), produzindo as arquiteturas 4-1-1, 4-5-1 e 4-10-1.
Na Tabela 5.9 sao mostrados os resultados para as medias (x) e desvios padroes (σx)
das medidas de desempenho para as dez inicializacoes com cada uma das tres arquiteturas
escolhidas. Os resultados completos sao exibidos na Tabela D.1 — Apendice D.
Tabela 5.9: Medias (x) e desvios padroes (σx) das medidas de desempenho relativas asdez inicializacoes das RNAs utilizadas para a previsao da serie do Mapa de Henon
Arq. ErrosTreinamento Validacao Teste
x σx x σx x σx
4-1-1
MSE 0.1918 0.0000 0.2032 3.1e-5 0.1946 0.0000MAPE(%) 26.11 0.0300 75.73 4.8e-3 31.20 0.0000
Theil 0.1847 4.8e-5 0.1946 4.8e-5 0.1863 0.0000POCID(%) 71.03 0.0105 70.82 0.00 70.50 0.0000
ARV 0.3671 0.0000 0.3878 0.0000 0.3717 0.0000AIC -8239.0 0.3178 -3968.1 0.00 -4076.3 0.1434BIC -8186.4 0.3307 -3920.3 0.00 -4076.3 0.1595
4-5-1
MSE 9.9037e-9 8.3072e-9 1.0452e-8 9.0475e-7 1.0170e-6 8.7536e-7MAPE(%) 2.8607e-6 2.0749e-6 4.6503e-6 3.1671e-6 3.1019e-6 1.9392e-6
Theil 9.5346e-9 7.9975e-9 1.0010e-8 8.6654e-9 9.7350e-9 8.3795e-9POCID(%) 100.00 0.0000 100.00 0.0000 100.00 0.0000
ARV 1.9100e-8 1.6000e-8 1.9943e-8 1.7263e-8 1.9425e-8 1.6720e-8AIC -93686.4 4.6190e3 -46712.7 2.3589e3 -46764.8 2.3219e3BIC -93453.4 4.6190e3 -46501.2 2.3589e3 -46553.3 2.3219e3
4-10-1
MSE 8.9144e-8 9.0285e-8 9.2092e-8 9.5720e-8 9.1649e-8 9.3140e-8MAPE(%) 2.4239e-7 2.7756e-7 3.7125e-7 4.7505e-7 2.4369e-7 2.6697e-7
Theil 8.5822e-10 8.6920e-10 8.8202e-10 9.1677e-10 8.7733e-10 8.9160e-10POCID(%) 100.00 0.0000 100.00 0.0000 100.00 0.0000
ARV 1.7061e-9 1.7279e-9 1.7572e-9 1.8264e-9 1.7505e-9 1.7790e-9AIC -106734.5 6.2459e3 -53247.9 -5283.1 -53239.4 3.1190e3BIC -106276.0 6.2459e3 3.1226e3 3.1226e3 -52823.2 3.1190e3
Nos experimentos foram utilizados tres conjuntos, o conjunto de treinamento para o
ajuste dos pesos da RNA, o conjunto de validacao para determinar o momento de parada
do processo de treinamento, e o conjunto de teste para determinar o desempenho de
previsao da rede. Desta forma, a partir dos resultados do conjunto de teste, observa-se
5.3 EXPERIMENTOS COM REDES NEURAIS ARTIFICIAIS DO TIPO MLP 86
que a arquitetura 4-10-1 (inicializacao 1) alcancou os melhores resultados, sendo estes bem
superiores aos resultados obtidos pelo modelo ARIMA(26,0,1) (Tabela 5.1). A Tabela 5.10
mostra a comparacao entre os resultados alcancados nos experimentos de Box & Jenkins
e das RNAs. Se o valor da medida de desempenho alcancado nos experimentos de Box
& Jenkins estiver abaixo do intervalo de confianca da respectiva medida para as RNAs,
e dito que as RNAs tem um desempenho superior naquela determinada medida. Se, por
outro lado, o valor da medida de desempenho dos modelos de Box & Jenkins estiver acima
do intervalo de confianca para as RNAs, e dito que o modelo de Box & Jenkins tem um
desempenho superior. E por fim, se o valor de desempenho do modelo de Box & Jenkins
estiver contido no intervalo de confianca para a medida de desempenho das RNAs e dito
que ambos os modelos tem desempenhos semelhantes.
O fato de todas as medias das medidas de desempenho para a RNA terem alcancados
baixos valores de desvio padrao implica estabilidade, ou seja, as dez inicializacoes da
RNA 4-10-1 convergiram para resultados proximos.
Tabela 5.10: Resultados experimentais (conjunto de teste) com os melhores modelos (Box& Jenkins e RNAs) para a serie de Henon.
Erros Box & Jenkins RNA Melhor Modelo
MSE 0.3625 4.0840e-9 RNAMAPE 404.53% 1.0349e-8% RNA
U de Theil 2.2709 3.9090e-11 RNAPOCID 48.9489% 100.00% RNAARV 4.2811 7.8006e-11 RNAAIC -5045.4 -59657.5 RNABIC -4940.2 -59241.3 RNA
Um grafico comparativo entre os valores reais da serie (linha solida) e a previsao
gerada pela melhor rede (linha tracejada) para os ultimos 100 pontos do conjunto de
teste e mostrado na Figura 5.10.
Como mostram os proprios resultados, obtidos nas Tabelas 5.9 e D.1, a previsao gerada
pela RNA tem um alto grau de concordancia com a realidade, mostrando-se indistinguıvel
dos pontos reais da serie na Figura 5.10. Nota-se que a rede neural consegue capturar
todas as informacoes necessarias para a correta descricao do processo gerador da serie.
5.3 EXPERIMENTOS COM REDES NEURAIS ARTIFICIAIS DO TIPO MLP 87
2400 2410 2420 2430 2440 2450 2460 2470 2480 2490 2500−1.5
−1
−0.5
0
0.5
1
1.5
Pontos
Hen
on
Figura 5.10: Serie do Mapa de Henon (linha solida) e a previsao gerada pela rede neural(linha tracejada) para os ultimos 100 pontos do conjunto de teste.
5.3.2 Series das Manchas Solares
Para a serie das manchas solares foram escolhidos os retardos temporais 1 ao 3 como
relevantes, gerando as arquiteturas 3-1-1, 3-5-1 3-10-1 para as redes.
Na Tabela 5.11 sao mostrados os resultados das medias e desvios padroes para as me-
didas de desempenho das dez inicializacoes com cada uma das tres arquiteturas escolhidas
para as RNAs, sendo os resultados completos exibidos na Tabela D.2 (Apendice D).
Comparando-se as inicializacoes para cada uma das arquiteturas das redes, a inicia-
lizacao 1 da arquitetura 3-1-1 e a inicializacao 9 da arquitetura 3-5-1 estao empatadas em
quantidades de medidas de desempenho favoraveis a cada uma. Entretanto, levando-se
em consideracao a estatıstica U de Theil e a Medida de POCID, elege-se o melhor modelo
como a inicializacao 9 da rede 3-5-1.
Um grafico comparativo entre a serie real (linha solida) e a serie prevista (linha trace-
jada) pela rede 3-5-1 (inicializacao 9), para o conjunto de teste, e mostrado na Figura 5.11.
Observando este grafico, nota-se que a rede neural e capaz de capturar o comportamento
global do fenomeno gerador da serie, com um grafico de previsao visualmente mais bem
ajustado quando comparado aos modelos de Box & Jenkins (Figura 5.3).
Comparando-se o melhor modelo das redes neurais e o modelo eleito de Box & Jenkins
e possıvel afirmar que o modelo mais adequado e o baseado em redes neurais. Abstraindo-
5.3 EXPERIMENTOS COM REDES NEURAIS ARTIFICIAIS DO TIPO MLP 88
Tabela 5.11: Medias (x) e desvios padroes (σx) para as medidas de desempenho relativasas dez inicializacoes das RNAs utilizadas para a previsao da serie das Manchas Solares.
Arq. ErrosTreinamento Validacao Teste
x σx x σx x σx
3-1-1
MSE 0.5570 0.0067 0.5781 0.0125 0.0139 0.0002MAPE(%) 4.30 0.30 4.42 0.34 3.85 0.09
Theil 0.4574 0.0055 0.4806 0.0104 0.5205 0.0073POCID(%) 71.13 0.3320 66.62 0.6803 73.29 0.9642
ARV 0.1659 1.9879e-3 0.1899 4.1011e-3 0.2144 2.9985e-3AIC -730.2 1.7012 -359.0 1.5946 -291.5 9.9605e-1BIC -706.5 1.7012 -339.4 1.5946 -272.0 9.9605e-1
3-5-1
MSE 0.4384 0.0246 0.5072 0.0144 0.1978 0.3921MAPE(%) 3.64 0.31 3.90 0.41 2.94 0.29
Theil 0.3601 0.0202 0.4216 0.0120 0.4244 0.0497POCID(%) 76.97 8.2732 70.85 2.2071 85.71 2.7766
ARV 0.1306 7.3246e-3 0.1666 4.7263e-3 0.1748 2.0484e-2AIC -724.7 8.2732 -328.5 2.0534 -266.5 8.4602BIC -621.6 8.2732 -243.3 2.0534 -181.6 8.4602
3-10-1
MSE 0.4311 0.0179 0.5280 0.0112 0.5595 0.4737MAPE(%) 3.30 0.18 3.79 0.32 2.65 0.15
Theil 0.3541 0.0147 0.4389 0.0094 0.3635 0.0287POCID(%) 76.13 0.8431 70.56 1.9300 84.71 0.0287
ARV 0.1284 5.3066e-3 0.1734 3.7091e-3 0.1497 1.1823e-2AIC -677.0 6.0819 -275.6 1.5216 -227.2 5.5417BIC -474.9 6.0819 -108.5 1.5216 -60.8 5.5417
0 10 20 30 40 50 60 700
20
40
60
80
100
120
140
160
180
200
Pontos − Conjunto de Teste
Man
chas
Sol
ares
Figura 5.11: Grafico comparativo entre os valores reais (linha solida) e os valores previstospela RNA (linha tracejada) para a serie das Manchas Solares.
se do fato das diferentes divisoes entre os conjuntos de dados nos experimentos com as
redes neurais e nos experimentos com Box & Jenkins, utiliza-se o conjunto de teste para
as comparacoes de desempenho. A Tabela 5.12 destaca os resultados para ambos os
5.3 EXPERIMENTOS COM REDES NEURAIS ARTIFICIAIS DO TIPO MLP 89
modelos e mostra o modelo da RNA com 6 medidas a seu favor contra apenas uma para
os modelos de Box & Jenkins.
Tabela 5.12: Resultados experimentais (conjunto de teste) com os melhores modelos (Box& Jenkins e RNAs) para a serie das Manchas Solares.
Erros Box & Jenkins RNA Melhor Modelo
MSE 0.0219 0.9205 Box & JenkinsMAPE 42.35% 2.41% RNA
U de Theil 0.7805 0.3443 RNAPOCID 75.000% 90.0000% RNAARV 0.4007 0.1418 RNAAIC -92.8323 -280.9 RNABIC -71.5266 -196.0 RNA
5.3.3 Serie de Medidas do Brilho de uma Estrela
Para a serie de medidas do brilho de uma estrela foram escolhidos os retardos temporais
1 ao 3 como relevantes e as arquiteturas 3-1-1, 3-5-1 e 3-10-1 para as RNAs.
Na Tabela 5.13 sao mostrados os resultados das medias e os respectivos desvios padroes
das medidas de desempenho para as dez inicializacoes das arquiteturas das RNAs. Os
resultados completos sao sumarizados na Tabela D.3 (Apendice D).
Comparando-se os valores medios dos resultados obtidos pelas medidas de desem-
penho, e possıvel observar que as arquiteturas estudadas tem desempenhos semelhantes.
Contudo, analisando-se experimento a experimento (Tabela D.3 – Apendice D), elege-se
a inicializacao 3 da arquitetura 3-5-1 como o melhor modelo dentre os testados.
Um grafico comparativo entre os pontos reais (linha solida) e a previsao (linha tra-
cejada) gerada pelo melhor modelo (inicializacao 3 - arquitetura 3-5-1) e exposto na
Figura 5.12. Pode-se perceber que a rede consegue capturar o comportamento da serie,
realizando uma boa predicao.
Comparando-se os resultados do melhor modelo das RNAs com o modelo de Box &
Jenkins, as RNAs apresentam um desempenho de previsao superior. A Tabela 5.14 exibe
os resultados obtidos tanto pelo modelo ARIMA como para o melhor modelo de RNA.
5.3 EXPERIMENTOS COM REDES NEURAIS ARTIFICIAIS DO TIPO MLP 90
Tabela 5.13: Medias (x) e desvios padroes (σx) das medidas de desempenho dos experi-mentos com as RNAs para a previsao da serie de Medidas do Brilho de uma Estrela.
Arq. ErrosTreinamento Validacao Teste
x σx x σx x σx
3-1-1
MSE 0.0234 0.0000 0.0256 0.0000 0.0237 0.0000MAPE(%) 0.07 0.00 0.09 0.00 0.09 0.00
Theil 0.0605 0.0000 0.0658 0.0000 0.0640 4.2e-5POCID(%) 76.85 0.0000 73.65 0.0000 73.65 0.0000
ARV 3.3883e-3 2.2336e-7 3.7030e-3 2.1318e-7 3.3777e-3 7.6920e-7AIC -2487.1 0.0000 -1220.5 0.0000 -1232.1 0.0422BIC -2458.9 0.0000 -1196.4 0.0516 -1208.0 0.0422
3-5-1
MSE 0.0231 0.0002 0.0253 0.0002 0.0235 7.9e-5MAPE(%) 0.06 3.2e-3 0.09 0.00 0.10 0.00
Theil 0.0597 0.0004 0.0652 0.0005 0.0636 0.0003POCID(%) 76.85 0.0000 73.78 0.2825 73.17 0.3285
ARV 3.3395e-3 2.3616e-5 3.6708e-3 3.1008e-5 3.3564e-3 1.3105e-5AIC -2451.5 2.1183 -1181.8 1.2524 -1193.0 0.5915BIC -2329.3 2.1182 -1077.7 1.2570 -1088.9 0.5959
3-10-1
MSE 0.0231 0.0001 0.0253 0.0002 0.0235 9.5e-5MAPE(%) 0.06 3.2e-3 0.09 0.00 0.10 0.00
Theil 0.0597 0.0004 0.0651 0.0005 0.0636 0.0002POCID(%) 76.85 0.0000 73.99 0.3531 73.04 0.2150
ARV 3.3378e-3 2.2379e-5 3.6641e-3 2.7268e-5 3.3534e-3 1.3100e-5AIC -2401.6 2.0150 -1132.1 1.0947 -1443.1 0.5750BIC -2161.9 2.0058 -927.6 1.0947 -938.9 0.5750
0 50 100 1500
5
10
15
20
25
30
35
Pontos − conjunto de Teste
Val
or d
e B
rolh
o (u
.a.)
Figura 5.12: Grafico comparativo entre a serie real de medidas do brilho de um estrela(linha solida) e a previsao gerada pela rede neural (linha tracejada).
5.3.4 Serie do Indice Dow Jones Industrial Average
Para a serie do ındice Dow Jones Industrial Average (DJIA) foram escolhidos os retardos
temporais do 1 ao 3 como relevantes e as arquiteturas 3-1-1, 3-5-1 e 3-10-1 para as RNAs.
5.3 EXPERIMENTOS COM REDES NEURAIS ARTIFICIAIS DO TIPO MLP 91
Tabela 5.14: Resultados experimentais (conjunto de teste) com os melhores modelos (Box& Jenkins e RNAs) para a serie de medidas do brilho de uma estrela.
Erros Box & Jenkins RNA Melhor Modelo
MSE 3.9004e-4 0.0234 Box & JenkinsMAPE 9.36% 0.10% RNA
U de Theil 0.0679 0.0632 RNAPOCID 100.00% 72.97% Box & JenkinsARV 0.0035 3.3357e-3 Desempenhos SemelhantesAIC -294.9564 -1193.9 RNABIC -22.6541 -1089.8 RNA
Tabela 5.15: Medias (x) e desvios padroes (σx) para as medidas de desempenho relativasas dez inicializacoes das RNAs utilizadas para a previsao da serie DJIA.
Arq. ErrosTreinamento Validacao Teste
x σx x σx x σx
3-1-1
MSE 0.0677 0.0011 0.0851 0.0003 0.0835 0.0006MAPE(%) 0.19 0.00 0.15 0.00 0.38 0.00
Theil 0.9892 0.0159 0.9975 0.0034 0.9979 0.0072POCID(%) 50.48 0.1787 45.52 0.3789 46.83 0.2687
ARV 1.1523e-2 1.8562e-4 5.0875e-2 1.7423e-4 3.4226e-2 2.4548e-4AIC -5162.1 11.265 -2490.3 1.2111 -2497.1 2.5388BIC -5128.7 11.265 -2461.1 1.2111 -2467.9 2.5388
3-5-1
MSE 0.0674 0.0012 0.0851 0.0004 0.0844 0.0010MAPE(%) 0.19 0.00 0.15 0.00 0.39 0.01
Theil 0.9848 0.0182 0.9975 0.0053 1.0080 0.0122POCID(%) 50.48 0.2326 45.47 0.2407 46.74 0.3271
ARV 1.1472e-2 2.1182e-4 5.0875e-2 2.6820e-4 3.4569e-2 4.1693e-4AIC -5125.2 12.888 -2450.3 1.8607 -2453.6 4.2683BIC -4980.6 12.888 -2323.7 1.8607 -2327.0 4.2683
3-10-1
MSE 0.0667 0.0004 0.0854 0.0004 0.0846 0.0006MAPE(%) 0.19 0.00 0.15 0.00 0.39 0.01
Theil 0.9740 0.0057 1.0004 0.0046 1.0103 0.0074POCID(%) 50.49 0.2132 45.75 0.4062 46.94 0.2332
ARV 1.1345e-2 6.6790e-5 5.1024e-2 2.3652e-4 3.4649e-2 2.5253e-4AIC -5083.0 4.1827 -2399.3 1.6434 -2402.8 2.5746BIC -4799.3 4.1827 -2151.0 1.6434 -2154.4 2.5746
Na Tabela 5.15 sao apresentados os valores medios e os desvios padroes das medidas
de desempenho para os dez experimentos realizados com cada uma das arquiteturas das
redes, sendo os resultados completos apresentados na Tabela D.4 (Apendice D).
Dentre os modelos investigados, destaca-se a inicializacao 5 da arquitetura 3-1-1,
sendo este o modelo eleito para a previsao da serie DJIA. Um grafico comparativo entre
os valores reais (linha solida) e a previsao gerada por este modelo (linha tracejada) para
o conjunto de teste e mostrado na Figura 5.13a.
5.3 EXPERIMENTOS COM REDES NEURAIS ARTIFICIAIS DO TIPO MLP 92
0 50 100 150 200 250 300 3507000
7500
8000
8500
9000
9500
10000
10500
Pontos − Conjunto de Teste
DJI
A
(a) Conjunto de teste completo.
250 260 270 280 290 300 310 320 330 340 3507800
8000
8200
8400
8600
8800
9000
9200
9400
9600
Pontos − Conjunto de Teste
DJI
A(b) Ultimos 100 pontos do conjunto de teste.
Figura 5.13: Serie real do DJIA (linha solida) e a previsao gerada pela rede neural (linhatracejada) para o conjunto de teste.
Observando-se a Figura 5.13a e possıvel notar que a rede neural utilizada como predi-
tor e capaz de capturar o comportamento global da serie, conseguindo tambem responder
as flutuacoes de alta frequencia. Contudo, embora o modelo seja capaz de descrever o
comportamento geral da serie, a previsao apresenta-se deslocada temporalmente de um
passo (fora de fase), caracterizando um modelo de previsao do tipo Random Walk (o valor
da serie no tempo t, mais ou menos um ruıdo, e usado para determinar o valor da serie no
tempo t + 1). Este comportamento e confirmado com o valor obtido para a medida da U
de Theil (≈ 1), podendo ser melhor visualizado com a ampliacao da Figura 5.13a, mos-
trada na Figura 5.13b. Nesta Figura sao visualizados os ultimos 104 pontos do conjunto
de teste da serie (linha solida) juntamente com sua previsao (linha tracejada).
Tal comportamento de Random Walk para as redes neurais quando aplicadas a pre-
visao de series economicas e financeiras ja foi observado por Sitte e Sitte [103], sendo
relatado tal efeito tanto para uma rede neural do tipo MLP como para redes recorrentes.
Na Tabela 5.16 sao exibidos os resultados das medidas de desempenho do melhor
modelo para os experimentos de Box & Jenkins e das RNAs. A RNA apresenta um
desempenho superior, com seis medidas a seu favor contra apenas uma em favor do
modelo ARIMA.
5.3 EXPERIMENTOS COM REDES NEURAIS ARTIFICIAIS DO TIPO MLP 93
Tabela 5.16: Resultados experimentais (conjunto de teste) com os melhores modelos (Box& Jenkins e RNAs) para a serie DJIA.
Erros Box & Jenkins RNA Melhor Modelo
MSE 5.8033e-4 0.0827 Box & JenkinsMAPE 8.32% 0.37% RNA
U de Theil 1.2649 0.9878 RNAPOCID 46.10% 46.74% RNAARV 0.0392 3.4226e-2 RNAAIC -1056.2 -2500.7 RNABIC -1052.2 -2471.5 RNA
5.3.5 Serie do Indice Nasdaq
Para a serie do ındice Nasdaq foram escolhidos os retardos temporais 1 ao 3 como rele-
vantes, sendo novamente geradas as arquiteturas 3-1-1, 3-5-1 e 3-10-1 para as RNAs.
Na Tabela 5.17 sao exibidos os resultados medios, juntamente com os desvios padroes,
para as medidas de desempenho alcancadas com as RNAs para a serie do Indice Nasdaq.
Os resultados individuais dos experimentos sao sumarizados na Tabela D.5 (Apendice D).
Tabela 5.17: Medias (x) e desvios padroes (σx) para as medidas de desempenho relativasas dez inicializacoes das RNAs utilizadas para a previsao da serie do Indice Nasdaq.
Arq. ErrosTreinamento Validacao Teste
x σx x σx x σx
3-1-1
MSE 0.0002 0.0000 0.0006 0.0004 0.0113 0.0271MAPE(%) 3.1233e-3 1.4067e-3 1.1200e-3 6.9404e-4 0.01 0.03
Theil 0.9273 0.1341 1.2859 0.9686 6.0507 14.4570POCID(%) 60.7932 0.0000 58.8931 0.1052 52.7886 0.0300
ARV 1.8304e-4 2.6474e-5 1.0667e-3 8.0341e-4 8.1565e-4 9.4846e-6AIC -54379.9 521.53 -25736.4 944.00 -21358.5 2306.8BIC -54335.8 521.53 -25696.5 944.00 -21318.6 2306.8
3-5-1
MSE 0.0004 0.0004 0.0004 0.0000 0.0074 0.0082MAPE(%) 3.9543e-3 4.0670e-3 9.1610e-4 3.9577e-5 8.5464e-3 9.2480e-3
Theil 1.3154 1.3567 0.9995 0.0567 3.9357 4.3789POCID(%) 60.8074 0.0200 58.7031 0.1778 52.9074 0.1207
ARV 2.5965e-4 2.6779e-4 8.2905e-4 4.7074e-5 1.1738e-2 1.3058e-2AIC -53754.5 2350.7 -25955.6 114.63 -20808.3 1782.5BIC -53563.5 2350.7 -25782.6 114.63 -20635.3 1782.5
3-10-1
MSE 0.0002 0.0000 0.0004 0.0000 0.0028 0.0003MAPE(%) 2.6724e-3 1.9862e-6 9.0370e-4 8.0160e-6 3.4168e-3 3.0909e-4
Theil 0.8846 0.0001 0.9833 0.0114 1.4947 0.1420POCID(%) 60.8169 0.0194 58.8504 0.1775 52.8124 0.1075
ARV 1.7461e-4 1.1547e-8 8.1565e-4 9.4846e-6 4.4578e-3 4.2347e-4AIC -54456.3 0.26148 -25937.2 24.744 -21984.7 216.15BIC -54081.7 0.26148 -25597.9 24.744 -21645.4 216.15
5.3 EXPERIMENTOS COM REDES NEURAIS ARTIFICIAIS DO TIPO MLP 94
A partir da Tabela D.5 (Apendice D) elege-se o melhor modelo dentre os investigados.
Desta forma, a inicializacao 6 da rede 3-5-1 obteve os melhore resultados, sendo esta eleita
como o modelo mais apto para a previsao da serie do Indice Nasdaq.
Um grafico com a serie real (linha solida) e a previsao (linha tracejada) gerada pela
RNA e mostrado na Figura 5.14a. A partir do valores alcancados pela estatıstica U de
Theil e o POCID, a rede corresponde ao funcionado de um modelo do tipo Random Walk,
como evidencia a Figura 5.14b, que mostra os ultimos 106 pontos do conjunto de teste.
0 200 400 600 800 1000 1200 1400 1600 1800 20006.8
7
7.2
7.4
7.6
7.8
8
8.2
8.4
8.6
8.8
Pontos − Conjunto de Teste
Nas
daq
(a) Conjunto de teste completo.
2000 2010 2020 2030 2040 2050 2060 2070 2080 2090 21007.52
7.54
7.56
7.58
7.6
7.62
7.64
7.66
7.68
7.7
Pontos − Conjunto de Teste
Nas
daq
(b) Ultimos 100 pontos do conjunto de teste.
Figura 5.14: Serie real do Indice Nasdaq (linha solida) e a previsao gerada pela redeneural (linha tracejada) para o conjunto de teste.
A partir da Tabela 5.18 e possıvel comparar o desempenho relativo entre os modelos
lineares e as redes neurais, observando-se que as RNAs apresentam um desempenho de
previsao superior.
Tabela 5.18: Resultados experimentais (conjunto de teste) com os melhores modelos (Box& Jenkins e RNAs) para a serie do Indice Nasdaq.
Erros Box & Jenkins RNA Melhor Modelo
MSE 2.4222e-5 0.0022 Box & JenkinsMAPE 0.50% 2.6988e-3% RNA
U de Theil 1.2702 1.1728 Modelos SemelhantesPOCID 50.4751% 53.06% RNAARV 0.0162 3.4977e-3 Modelos SemelhantesAIC -8871.6 -22536.0 RNABIC -8619.2 -22363.1 RNA
5.3 EXPERIMENTOS COM REDES NEURAIS ARTIFICIAIS DO TIPO MLP 95
5.3.6 Serie do Indice S&P500
Para a serie do ındice S&P500 foram escolhidos os retardos temporais 1 ao 3 como rele-
vantes e as arquiteturas 3-1-1, 3-5-1 e 3-10-1 para as RNAs.
Na Tabela 5.19 sao mostrados os valores medios e desvios padroes alcancados pelas me-
didas de desempenho para os experimentos com as RNAs para a serie do Indice S&P500.
Os resultados individuais dos experimentos sao exibidos na Tabela D.6 (Apendice D).
Tabela 5.19: Medias (x) e desvios padroes (σx) para as medidas de desempenho relativasas dez inicializacoes das RNAs utilizadas para a previsao da serie do Indice S&P500
Arq. ErrosTreinamento Validacao Teste
x σx x σx x σx
3-1-1
MSE 0.0205 0.0288 0.0553 0.0465 0.2741 0.3384MAPE(%) 0.0063 0.0046 0.0009 0.0008 0.0164 0.0170
Theil 1.7556 2.4623 3.6548 3.0733 143.6136 147.8101POCID(%) 51.9231 0.3885 50.7692 0.6950 50.4444 1.4055
ARV 2.0874e-2 2.9278e-2 1.0563e-1 8.8829e-2 1.1396 1.1729AIC -1609.0 126.97 -703.2 69.547 -432.0 152.54BIC -1583.7 126.97 -682.1 69.547 -411.0 152.54
3-5-1
MSE 0.0394 0.0381 0.0449 0.0275 0.4740 0.3388MAPE(%) 0.0111 0.0086 0.0008 0.0005 0.0107 0.0095
Theil 3.3657 3.2598 2.9679 1.8150 94.1781 82.5274POCID(%) 51.8132 0.5821 49.7802 1.3755 49.6667 1.1771
ARV 4.0018e-2 3.8759e-2 8.5780e-2 5.2458e-2 0.7473 0.6549AIC -1451.7 161.62 -673.1 57.764 -397.9 75.553BIC -1342.2 161.62 -581.6 57.764 -306.6 75.553
3-10-1
MSE 0.0120 0.0014 0.0247 0.0246 0.1334 0.1213MAPE(%) 0.0052 0.0011 0.0004 0.0004 0.0039 0.0074
Theil 1.0269 0.1175 1.6327 1.6245 34.2393 64.6741POCID(%) 51.7033 0.1738 50.3297 0.6950 50.1111 0.9729
ARV 1.2210e-2 1.3973e-3 4.7190e-2 4.6955e-2 0.2717 0.5132AIC -1550.9 189.12 -683.4 55.398 -502.2 132.50BIC -1336.3 189.12 -503.8 55.398 -323.1 132.50
A partir dos experimentos das RNAs (Tabela D.6 – Apendice D) e possıvel identificar
a melhor inicializacao, elegendo-se a rede 3-10-1 (inicializacao 7) como o modelo mais
apto dentre os investigados.
Um grafico comparativo entre a serie real (linha solida) e a previsao (linha tracejada)
gerada pelo melhor modelo e mostrado na Figura 5.15. Como esperado, segundo as
medidas da estatıstica U de Theil e o POCID, o comportamento da rede neural apresenta
uma resposta defasada temporalmente em relacao aos valores reais — modelo do tipo
Random Walk. Tambem e possıvel notar que a rede nao responde adequadamente a
5.3 EXPERIMENTOS COM REDES NEURAIS ARTIFICIAIS DO TIPO MLP 96
tendencia da serie, podendo vir a significar uma limitacao pelo uso de uma funcao de
ativacao linear na ultima camada da rede.
0 10 20 30 40 50 60 70 80 90 1001000
1500
2000
2500
3000
3500
4000
4500
5000
Pontos − Conjunto de Teste
S&
P50
0
Figura 5.15: Grafico comparativo entre a serie real do Indice S&P500 (linha solida) e aprevisao gerada pela rede neural (linha tracejada) para o conjunto de teste.
Comparando-se os resultados alcancados pelas redes neurais e modelos de Box &
Jenkins, e possıvel notar que as RNAs apresentam um desempenho de previsao superior.
A Tabela 5.20 mostra os resultados para os melhores casos dos experimentos de Box &
Jenkins e das RNAs, com quatro medidas de desempenho em favor das RNAs contra
apenas uma medida a favor dos modelos de Box & Jenkins.
Tabela 5.20: Resultados experimentais (conjunto de teste) com os melhores modelos (Box& Jenkins e RNAs) para a serie do Indice S&P500.
Erros Box & Jenkins RNA Melhor Modelo
MSE 2.1447e-4 0.0095 Box & JenkinsMAPE 1.24% 0.0010% RNA
U de Theil 1.4090 0.9166 Modelos SemelhantesPOCID 47.2222% 51.11% RNAARV 0.1374 7.2728e-3 RNAAIC -310.5510 -741.0 RNABIC -307.9400 -561.9 Modelos Semelhantes
5.3 EXPERIMENTOS COM REDES NEURAIS ARTIFICIAIS DO TIPO MLP 97
5.3.7 Serie do Valor de Fechamento das Acoes da Petrobras
Para a serie do valor de fechamento das acoes da Petrobras (PetrobrasON) foram eleitos
os retardos temporais 1 ao 3 como relevantes, utilizando novamente as arquiteturas 3-1-1,
3-5-1 e 3-10-1 para as RNAs.
Na Tabela 5.21 sao mostrados os valores medios e desvios padroes para as medidas de
desempenho dos experimentos realizados com as RNAs para a serie do valor de fechamento
das acoes da Petrobras. Os resultados para cada um destes experimentos sao apresentados
na Tabela D.7 (Apendice D).
Tabela 5.21: Medias (x) e desvios padroes (σx) das medidas de desempenho para as dezinicializacoes das RNAs utilizadas para a previsao da serie da Petrobras (PetreobrasON).
Arq. ErrosTreinamento Validacao Teste
x σx x σx x σx
3-1-1
MSE 0.0161 0.0000 0.0698 0.0055 0.1583 0.0133MAPE(%) 0.08 0.00 0.08 0.01 0.17 0.01
Theil 0.9862 0.0001 10.4024 0.8121 25.1660 2.1089POCID(%) 47.8482 0.0304 54.4231 0.0000 51.4451 0.0000
ARV 4.6610e-3 2.8460e-7 3.5840e-2 2.7980e-3 1.4817 0.1242AIC -9091.0 7.0215e-2 -3775.7 45.414 -3343.2 4.9105e1BIC -9055.3 7.0215e-2 -3744.1 45.414 -3311.7 4.9105e1
3-5-1
MSE 0.0189 0.0071 0.0585 0.0179 0.1300 0.0542MAPE(%) 0.09 0.02 0.07 0.02 0.14 0.06
Theil 1.1617 0.4383 8.7203 2.6633 20.6645 8.6185POCID(%) 47.9635 0.1697 54.0000 0.2979 52.1580 0.6553
ARV 5.4903e-3 2.0717e-3 3.0045e-2 9.1759e-3 1.2167 0.5074AIC -8924.9 289.82 -3855.0 199.58 -3501.6 438.79BIC -8924.9 289.82 -3718.4 199.58 -3365.0 438.79
3-10-1
MSE 0.0342 0.0450 0.0459 0.0152 0.0901 0.0455MAPE(%) 0.17 0.22 0.06 0.02 0.10 0.05
Theil 2.0997 2.7635 6.8417 2.2574 14.3328 7.2323POCID(%) 48.2229 0.1432 54.0769 0.2689 51.9653 0.3524
ARV 9.9234e-3 1.3061e-2 2.3572e-2 7.7775e-3 0.8439 0.4258AIC -8602.0 775.67 -3931.5 190.21 -3651.1 4.2656e2BIC -8298.6 775.67 -3663.5 190.21 -3383.2 4.2656e2
Observando a Tabela D.7 (Apendice D) e possıvel eleger o melhor modelo das RNAs
investigadas segundo o conjunto de medidas de desempenho. Desta forma, a inicializacao
6 da arquitetura 3-10-1, segundo o conjunto de teste, alcancou os melhores valores para
as medidas de desempenho.
Entretanto, mesmo para esta melhor inicializacao, a previsao gerada pela RNA e
pior que as previsoes geradas por um modelo do tipo Random Walk — os valores da
5.3 EXPERIMENTOS COM REDES NEURAIS ARTIFICIAIS DO TIPO MLP 98
estatıstica U de Theil para todos os conjuntos de dados sao bem superiores a 1. Este fato
vem a indicar que a um custo bem menor e possıvel se obter uma previsao equivalente,
ou melhor, assumindo-se apenas que o valor para a acao da Petrobras do futuro (tempo
t + 1) e o valor do presente (tempo t). Outro ponto negativo para o desempenho e
demonstrado pelo valor obtido pelo POCID, em torno de 50%, indicando que a rede esta
comportando-se de forma semelhante a um experimento do tipo cara ou coroa.
Um grafico comparativo entre os valores reais (linha solida) e a previsao gerada pela
melhor inicializacao (linha tracejada) das redes neurais, para o conjunto de teste da serie
do Valor de Fechamento das Acoes da Petrobras, e mostrado na Figura 5.16a. Novamente,
o comportamento da previsao, como esperado pelas medidas da estatıstica U de Theil
e do POCID, funciona como um modelo do tipo Random Walk, como explicitado na
Figura 5.16b para os ultimos 100 pontos do conjunto de teste.
0 50 100 150 200 250 300 350 400 450 50035
40
45
50
55
60
65
Pontos − Conjunto de Teste
Pet
robr
asO
N
(a) Conjunto de teste completo.
420 430 440 450 460 470 480 490 500 510 52044
46
48
50
52
54
56
58
60
Pontos − Conjunto de Teste
Pet
robr
asO
N
(b) Ultimos 100 pontos do conjunto de teste.
Figura 5.16: Serie real do DJIA (linha solida) e a previsao gerada pela rede neural (linhatracejada) para o conjunto de teste.
Comparando-se os resultados dos experimentos com as RNAs e o modelo de Box &
Jenkins, e possıvel notar que as redes neurais tem um melhor desempenho de previsao,
superior em seis das sete medidas de desempenho. A partir da Tabela 5.22 observa-
se os valores alcancados para as medidas de desempenho para os modelos eleitos nos
experimentos de Box & Jenkins e RNAs, segundo o conjunto de teste.
5.3 EXPERIMENTOS COM REDES NEURAIS ARTIFICIAIS DO TIPO MLP 99
Tabela 5.22: Resultados experimentais (conjunto de teste) com os melhores modelos (Box& Jenkins e RNAs) para a serie do Valor de Fechamento das Acoes da Petrobras.
Erros Box & Jenkins RNA Melhor Modelo
MSE 2.5532e-4 0.0095 Box & JenkinsMAPE 1.41% 0.1000% RNA
U de Theil 4.0261 1.5124 RNAPOCID 49.0385% 51.64% RNAARV 0.2080 0.0890 RNAAIC -1723.1 -4713.4 RNABIC -1710.0 -4445.5 RNA
5.3.8 Serie Random Walk
Para a serie Random Walk foram escolhidos os retardos temporais 1 ao 3 como relevantes
e as arquiteturas 3-1-1, 3-5-1 e 3-10-1 para as RNAs.
Na Tabela 5.23 sao mostrados os valores medios e desvios para as medidas de de-
sempenho dos experimentos com as RNAs para a serie Random Walk. Os resulta-
dos alcancados individualmente para estes experimentos sao exibidos na Tabela D.8
(Apendice D).
Dos experimentos realizados com as RNAs e possıvel identificar a melhor inicializacao
a partir da Tabela D.8 (Apendice D), elegendo a inicializacao 6 da rede 3-5-1 como o
modelo mais apto dentre os investigados.
Contudo, os resultados de previsao obtidos sao ainda comparaveis a um experimento
do tipo Random Walk — os valores da estatıstica U de Theil sao aproximadamente 1
para todas as inicializacoes. Este resultado era o esperado, visto que a serie em questao
trata-se realmente de um Random Walk. Outro ponto indicativo de baixo desempenho
vem da medida de POCID, assemelhando as redes a um experimento do tipo cara ou
coroa, onde existe 50% de possibilidade de acertar, ao acaso, se um determinado valor
da serie no tempo t tera um acrescimo (ira subir) ou um decrescimo (ira cair) no tempo
t + 1.
Um grafico comparativo entre a serie real (linha solida) e a previsao (linha tracejada)
gerada pela melhor rede (inicializacao 6 — arquitetura 3-5-1) e mostrado na Figura 5.17.
Como e esperado, a rede neural consegue capturar o comportamento da serie com uma
defasagem temporal, caracterizando um processo do tipo Random Walk.
5.3 EXPERIMENTOS COM REDES NEURAIS ARTIFICIAIS DO TIPO MLP 100
Tabela 5.23: Medias (x) e desvios padroes (σx) para as medidas de desempenho relativasas dez inicializacoes das RNAs para a previsao da serie Random Walk.
Arq. ErrosTreinamento Validacao Teste
x σx x σx x σx
3-1-1
MSE 0.1232 0.0069 0.1314 0.0010 0.1510 0.0299MAPE(%) 0.47 0.04 0.32 0.00 0.30 0.03
Theil 1.0062 0.0568 1.0046 0.0079 1.2024 0.2378POCID(%) 45.3213 0.1355 52.4194 0.1901 48.7097 0.1700
ARV 3.0182e-2 1.7027e-3 9.1127e-2 7.1503e-4 5.5332e-2 1.0944e-2AIC -3331.6 26.562 -1640.1 1.9712 -1609.2 43.689BIC -3300.4 26.562 -1613.0 1.9712 -1582.1 43.689
3-5-1
MSE 0.1206 0.0012 0.1312 0.0008 0.1352 0.0035MAPE(%) 0.45 0.02 0.32 0.00 0.28 0.00
Theil 0.9851 0.0099 1.0030 0.0062 1.0765 0.0277POCID(%) 45.1205 0.3001 52.7016 0.6026 48.9919 0.3427
ARV 2.9552e-2 2.9778e-4 9.0985e-2 5.5954e-4 4.9540e-2 1.2769e-3AIC -3301.5 4.9670 -1600.5 1.5390 -1593.1 6.3658BIC -3166.0 4.9670 -1483.0 1.5390 -1475.6 6.3658
3-10-1
MSE 0.1201 0.0006 0.1310 0.0007 0.1328 0.0045MAPE(%) 0.45 0.01 0.32 0.00 0.28 0.00
Theil 0.9815 0.0048 1.0020 0.0054 1.0578 0.0360POCID(%) 44.7791 0.6279 52.4597 0.7940 49.0323 0.2819
ARV 2.9442e-2 1.4413e-4 9.0894e-2 4.9050e-4 4.8679e-2 1.6552e-3AIC -3253.4 2.4402 -1550.7 1.3438 -1547.5 8.4179BIC -2987.5 2.4402 -1320.3 1.3438 -1317.1 8.4179
Comparando os resultados alcancados com os experimentos das redes (Tabela D.8)
com os experimentos de Box & Jenkins (Tabela 5.8), e possıvel notar um desempenho
superior de previsao para o modelo das RNAs. Apesar da serie ser gerada por um processo
linear, esta e tida como um processo nao estacionario, elegendo as redes neurais como
um modelo mais eficiente para a sua previsao. Na Tabela 5.24 sao expostos os resultados
para os modelos eleitos nos experimentos de Box & Jenkins e das RNAs.
Tabela 5.24: Resultados experimentais (conjunto de teste) com os melhores modelos (Box& Jenkins e RNAs) para a serie Random Walk.
Erros Box & Jenkins RNA Melhor Modelo
MSE 0.0018 0.1313 Box & JenkinsMAPE 6.70% 0.28% RNA
U de Theil 1.7633 1.0454 RNAPOCID 54.55% 49.19% Box & JenkinsARV 0.1921 4.8108e-2 RNAAIC -629.7357 -1600.3 RNABIC -626.1305 -1482.9 RNA
Os resultados alcancados para a serie Random Walk podem ser comparados de forma
5.3 EXPERIMENTOS COM REDES NEURAIS ARTIFICIAIS DO TIPO MLP 101
0 50 100 150 200 25050
60
70
80
90
100
110
120
Pontos − Conjuntos Teste
Ran
dom
Wal
k
Figura 5.17: Grafico comparativo entre a serie real Random Walk (linha solida) e aprevisao gerada pela rede neural (linha tracejada) para o conjunto de teste.
qualitativa com os demais resultados obtidos com as RNAs para as outras series. Quando
analisados sob o ponto de vista da estatıstica U de theil e do POCID, os resultados para
a serie Random Walk revelam um comportamento bastante semelhante aos experimentos
que trataram com series economicas e financeiras, e um comportamento bem adverso as
demais series, gerando indıcios que o modelo mais simples possıvel, o modelo de Random
Walk, e aparentemente o mais atraente para a previsao de series economicas e financei-
ras. Entretanto, como ja explicitado no Capıtulo 4, segundo os graficos de lagplot, ha a
possibilidade de existirem certas estruturas nao-lineares mescladas as estruturas lineares
para as series economicas e financeiras, sendo necessario uma busca pelas variaveis de
relevancia para a viabilizacao da captura da informacao nao-linear contida nas series.
Este processo pode gerar um salto na qualidade de desempenho de previsao, visto que
se nao ocorre a captura da informacao nao-linear, o modelo nao-linear no maximo se
comportara como um modelo linear.
CAPITULO 6
COMBINACAO DE REDES NEURAIS ARTIFICIAIS E
ALGORITMOS GENETICOS PARA A PREVISAO DE
SERIES TEMPORAIS
Neste Capıtulo e apresentada a combinacao das tecnicas inteligentes das Redes Neurais
Artificiais com os Algoritmos Geneticos para a obtencao de um Sistema Hıbrido Inteli-
gente aplicado a previsao de series temporais.
O Algoritmo Genetico utilizado apresenta-se como uma variacao do procedimento
canonico exibido no Capıtulo 3, utilizando quatro operadores de cruzamento e tres ope-
radores de mutacao projetados no intuito de aumentar a velocidade de convergencia para
a solucao do problema.
6.1 INTRODUCAO
Como apresentado no Capıtulo 5, ha uma evolucao significativa dos resultados alcancados
pelos modelos de Box & Jenkins para os resultados obtidos pelas redes neurais. Entre-
tanto, os resultados obtidos pelas redes neurais ainda sao de maneira geral insatisfatorios,
em especial para as series economicas e financeiras, comparaveis a um modelo do tipo
Random Walk e a um experimento do tipo cara ou coroa.
Uma possıvel causa para o baixo desempenho das RNAs e o mau ajuste dos seus
parametros, como a quantidade de entradas (ou retardos temporais), a quantidade de
neuronios na camada intermediaria, o conjunto de conexoes efetivamente ativas, o algo-
ritmo de treinamento e a funcao de ativacao. Contudo, o ajuste de tais parametros e uma
tarefa extremamente complicada, visto que sao parametros dependentes do problema, e,
de forma geral, nao ha regras que determinem seus valores.
A ideia apresentada neste capıtulo e a combinacao das redes neurais com os algoritmos
geneticos de tal forma que os AGs possam realizar uma busca pelo espaco de possıveis
102
6.2 ALGORITMO GENETICO E REDES NEURAIS 103
valores para os parametros das RNAs, a procura de uma configuracao com o melhor
desempenho possıvel de previsao.
Nas proximas secoes serao exibidos os procedimentos utilizados para a realizacao
da combinacao do AG modificado e as RNAs, bem como os resultados experimentais
alcancados.
6.2 ALGORITMO GENETICO E REDES NEURAIS
A menos que seja uma caracterıstica intrınseca do fenomeno gerador da serie temporal ser
aleatorio, existe a possibilidade de melhoria no desempenho de predicao com o correto
ajuste dos parametros da RNA. O grande problema em questao e como determinar o
valor destes parametros, visto que sao dependentes do problema e pertencentes a um vasto
universo de possibilidades. Para tanto e necessaria a aplicacao de alguma tecnica de busca
que seja capaz de encontrar uma configuracao otima (ou aceitavel) destes parametros.
O intuito de combinar AGs com RNAs e baseado na utilizacao dos pontos fortes de
uma tecnica para a compensacao dos pontos fracos da outra tecnica, ou seja, os AGs
sao utilizados para o ajuste dos parametros do modelo de previsao e as RNAs funcionam
como um modelo generico para a previsao. Nesta combinacao, considera-se que uma RNA
e um aproximador universal de funcoes [39] com varios parametros a serem ajustados.
Definindo-se inicialmente o domınio de cada um desses parametros, aplica-se um AG
modificado [84] para a busca por uma combinacao satisfatoria destes parametros.
Um AG padrao segue o procedimento exibido na Figura 3.4, onde uma populacao
e criada, avaliada indivıduo a indivıduo, sendo alguns selecionados, combinados e mo-
dificados atraves dos operadores geneticos de cruzamento (crossover) e mutacao para a
geracao de uma nova populacao. Este procedimento e repetido ate que alguma condicao
de parada seja alcancada.
No intuito de aumentar o desempenho da busca pela populacao que melhor se adequa
a solucao do problema, o AG padrao pode ser modificado e novos operadores introduzidos,
como proposto originalmente por Leung et al. [84], segundo o Algoritmo (6.1).
A populacao inicial consiste de um conjunto de possıveis solucoes, definida por,
P = {p1,p2, . . . ,pTamPop} (.)
6.2 ALGORITMO GENETICO E REDES NEURAIS 104
beginτ → 0; // τ: Numero de Iterac~oes
Inicializa Pop(τ); // Pop(τ): Populac~ao na Iterac~ao τ
Avalia f(Pop(τ)); // f(Pop(τ)): Func~ao de Fitness
while not Condicao de Parada doτ → τ + 1;Seleciona dois pais p1 e p2 a partir de Pop(τ);Realiza operacao de cruzamento de acordo com as Equacoes . a .;Realiza operacao de mutacao de acordo com a Equacao . para gerar os novoscromossomos MC1, MC2 e MC3;// Gera nova Populac~ao
O cromossomo de maior valor de fitness gerado ira substituir o cromossomo de menorvalor de fitness em Pop(τ − 1);for i=1 to 3 do
// pMut: probabilidade de aceitar a mutac~ao
if Numero Aleatorio < pMut thenMCi substitui cromossomo de menor valor de fitness em Pop(τ − 1)
else
if f(MCi) >menor valor de fitness de Pop(τ − 1) thenMCi substitui cromossomo de menor valor de fitness em Pop(τ − 1)
avalia f(Pop(τ));
end
Algoritmo 6.1: Procedimento do Algoritmo Genetico Modificado.
onde
pi =[pi
1 pi2 . . . pi
j . . . pinV ar
](.)
i = 1, 2, . . . , T amPop
j = 1, 2, . . . , nV ar
pimin ≤ pi
j ≤ pimax
sendo pi um indivıduo da populacao P, composta por um total de TamPop indivıduos.
Cada um desses indivıduos e formado por um cromossomo que, por sua vez, e compos-
to por varios genes, onde estes ultimos recebem os parametros ou variaveis que geram
uma possıvel solucao. Cada um destes cromossomos tera uma quantidade fixa de genes,
definida por nVar, e um domınio de validade, definido por pimin e pi
max – seus valores
de maximo e mınimo, respectivamente. Desta forma, um dado parametro pode assumir
qualquer valor real entre pimin e pi
max, caracterizando um cromossomo com codificacao
real, ao inves de uma representacao binaria utilizada no AG padrao.
Cada um dos cromossomos, ou indivıduos, sao avaliados por uma funcao de custo, ou
6.2 ALGORITMO GENETICO E REDES NEURAIS 105
fitness, onde o melhor cromossomo ira retornar o maior valor de fitness.
A cada geracao, um par de indivıduos, os pais, sao escolhidos atraves do metodo da
roleta (Secao 3.4.3), onde e esperado que pais aptos tenham alta probabilidade de gerar
novos indivıduos (os filhos) tambem aptos. Desta forma, o cromossomo que tiver o maior
valor de fitness tera a maior probabilidade de ser selecionado. A probabilidade de selecao,
definida por qi, para um indivıduo pi, e dada por,
qi =f(pi)∑TamPop
k=1 f(pk)(.)
onde f(pi) e a funcao de fitness do indivıduo pi.
Definido-se tambem a probabilidade acumulada, qi, para o indivıduo pi como,
qi =i∑
k=1
qk (.)
a selecao e realizada com o sorteio de um numero aleatorio, ξ ∈ [0,1]. O indivıduo pi sera
selecionado se qi−1 < ξ ≤ qi, onde e assumido q0 = 0.
O operador de cruzamento, ou crossover, e entao utilizado para realizar a mistura de
informacoes geneticas dos indivıduos pais para a geracao dos indivıduos filhos. Neste AG
modificado sao aplicados quatro tipos diferentes de operadores de cruzamento aos pais
(p1 e p2), gerando quatro novos cromossomos: C1, C2, C3 e C4, definidos por,
C1 =[C1
1 C12 . . . C1
nV ar
]=
p1 + p2
2(.)
C2 =[C2
1 C22 . . . C2
nV ar
]= pmax(1 − w) + max(p1,p2) (.)
C3 =[C3
1 C32 . . . C3
nV ar
]= pmin(1 − w) + min(p1,p2) (.)
C4 =[C4
1 C42 . . . C4
nV ar
]=
(pmax + pmin)(1 − w) + (p1 + p2)w
2(.)
6.2 ALGORITMO GENETICO E REDES NEURAIS 106
onde,
pmax =[p1
max p2max . . . pnV ar
max
](.)
pmin =[p1
min p2min . . . pnV ar
min
](.)
sendo w ∈ [0,1] um peso definido pelo usuario, onde quanto maior o valor de w maior e
a contribuicao direta dos pais. A funcao max(p1,p2) ira escolher o gene de maior valor
para cada uma das possıveis posicoes nos dois cromossomos dos pais, por exemplo,
max([1 5 − 4], [2 3 − 1]) = [2 5 − 1].
De forma equivalente, a funcao min(p1,p2) ira retornar os genes que tiveram os
menores valores, ou seja,
min([1 5 − 4], [2 3 − 1]) = [1 3 − 4].
Dentre os quatro cromossomos gerados, aquele que detiver o maior valor de fitness
sera eleito como o filho criado pelo processo de cruzamento entre os pais p1 e p2, sendo
os demais cromossomos descartados.
Provavelmente, este tipo de operacao ira gerar uma populacao mais apta do que a
antecedente e o indivıduo de mais alto valor de fitness podera ser alcancado em uma
quantidade menor de iteracoes. As operacoes de cruzamento dadas pela Equacao (.)
e pela Equacao (.) tendem a varrer a regiao central do domınio de busca (se w ≈ 1
na Equacao (.)), e as Equacoes (.) e (.) tendem a mover a busca para os limites
maximo e mınimo do domınio respectivamente, cobrindo o espaco de busca de forma bem
mais ampla que a forma convencional dos AGs.
Depois da selecao do filho, este e clonado. Seu clone ira sofrer um processo de mutacao,
que consiste em alterar de forma aleatoria os genes do seu cromossomo, e por sua vez,
as informacoes herdadas dos seus pais. Este processo de clonagem e a nova modificacao
introduzida no AG proposto por Leung et al. [84], garantindo que todos os cromossomos
gerados serao testados.
A partir de um clone dos cromossomos originais (Cg, g = 1, 2, 3, 4) sao criados tres
novos filhos (MCj, j = 1, 2, 3), gerados a partir de mutacoes,
MCj =[Cg
1 Cg2 . . . CnV ar
g
]+ [γ1∆MC1 γ2∆MC2 . . . γnV ar∆MCnV ar] (.)
6.2 ALGORITMO GENETICO E REDES NEURAIS 107
onde γi (i = 1, 2, . . . , nV ar) so pode assumir o valor 0 ou o valor 1, e ∆MCi (i =
1, 2, . . . , nV ar) sao numeros aleatorios gerados de tal forma a satisfazerem a condicao:
pimin ≤ Cg
i + ∆MCi ≤ pimax (.)
A primeira mutacao (j = 1 ⇒ MC1) e realizada com apenas um unico γi igual a 1
(escolhido aleatoriamente), e os demais iguais a zero. A segunda mutacao (j = 2 ⇒ MC2)
ocorre com uma quantidade aleatoria de γi’s (escolhidos ao acaso) iguais a 1 e os restantes
demais iguais a zero. E, por fim, a terceira mutacao (j = 3 ⇒ MC3) e realizada com
todos os γi’s iguais a 1.
Dada a constante Pmut, probabilidade de aceitacao de um filho gerado pela mutacao,
definida pelo usuario, e sorteado um novo numero aleatorio, Sortimut. Se Sortimut < Pmut,
entao o filho MCi (i = 1, 2, 3) criado pelo processo de mutacao entrara na populacao
substituindo o indivıduo que detiver o menor valor de fitness. Entretanto, se Sortimut >
Pmut, verifica-se o fitness do filho mutante, e se este obtiver um valor de fitness superior ao
fitness do pior indivıduo da populacao, tal indivıduo mutante ira substituir este membro
menos apto da populacao. Caso contrario, o filho mutante sera descartado.
Apos as operacoes de cruzamento e mutacao uma nova geracao e criada, e esta passa
novamente pelo mesmo processo, que sera repetido ate que uma condicao de parada seja
satisfeita. Nos experimentos realizados foram utilizados tres criterios de paradas:
1. Quantidade de Iteracoes – quantidade maxima permitida de geracoes;
2. Progresso de Treinamento (PT) – quantidade mınima aceitavel de crescimento
para o fitness medio da populacao entre geracoes consecutivas; e
3. Crescimento do Erro de Validacao (CV) – quantidade maxima aceitavel de
decrescimo do fitness para o conjunto de validacao. Esta quantidade e uma medida
percentual relativa ao valor de maior fitness de validacao alcancado durante toda a
execucao do AG.
Cada indivıduo representa uma rede neural do tipo MLP de tres camadas. A quanti-
dade de entradas (lags) e a quantidade de neuronios intermediarios sao constantes defi-
nidas pelo usuario, ja a camada de saıda sera constituıda apenas por um unico neuronio.
A Figura 6.1 mostra um esquema generico para a rede que e representada por cada
6.2 ALGORITMO GENETICO E REDES NEURAIS 108
indivıduo. E possıvel notar que em cada conexao existe uma chave liga/desliga, represen-
tada por um pequeno quadrado. Estas chaves podem ativar ou desativar as respectivas
conexoes, dando a possibilidade da execucao de um procedimento de poda [51–55], onde
conexoes nao necessarias devem ser eliminadas, gerando uma rede mais compacta.
Figura 6.1: Esquema generico da rede neural artificial codificada como indivıduo dapopulacao do algoritmo genetico descrito.
Cada cromossomo ira conter os seguintes genes (parametros):
• S1ij: chaves das conexoes da camada de entrada para a camada intermediaria;
• S2jk: chaves das conexoes da camada intermediaria para a camada de saıda;
• S1j : chaves das conexoes dos bias para os neuronios da camada intermediaria;
• S2k: chave da conexao do bias para o neuronio da camada de saıda;
• Wij: pesos das conexoes da camada de entrada para a camada intermediaria;
• Wjk: pesos das conexoes da camada intermediaria para a camada de saıda;
• b1j : bias dos neuronios intermediarios;
• b2k: bias dos neuronios de saıda.
6.2 ALGORITMO GENETICO E REDES NEURAIS 109
podendo todos estes valores assumirem valores reais.
Foram utilizados tres possıveis modelos para as redes neurais,
REDE 1:
Esta configuracao da rede foi utilizada por Leung et al. [84], onde os neuronios
intermediarios tem a funcao sigmoide logıstica (Equacao (.)) como funcao
de ativacao, e os neuronios de saıda tem uma funcao de ativacao linear com
os valores de bias passando por uma funcao sigmoide logıstica. A resposta
desta rede, para um neuronio de saıda k e dada por,
yk(t) =
nh∑
j=1
δ(S2jk)WjkSig
[nin∑
i=1
(δ(S1
ij)WijZi(t) − δ(S1j )b
1j
)]− δ(S2
k)Sig(b2k)
(.)
onde Sig e a funcao sigmoide logıstica e δ(x) e uma funcao degrau, definida
por,
δ(x) =
1, se x ≥ 0
0, se x < 0(.)
Zi(t) (i = 1, 2, . . . , nin) sao os valores de entrada da rede, nin denota o numero
de entradas e nh e o numero de neuronios escondidos. Como esta sendo
considerado apenas um unico neuronio de saıda, tem-se k = 1.
REDE 2:
A segunda configuracao e uma RNA com funcao de ativacao igual a sigmoide
logıstica (Equacao (.)) para a camada intermediaria, e camada de saıda com
funcao de ativacao linear (Equacao (.)), resultando na saıda da rede,
yk(t) =
nh∑
j=1
δ(S2jk)WjkSig
[nin∑
i=1
(δ(S1
ij)WijZi(t) − δ(S1j )b
1j
)]− δ(S2
k)(b2k)
(.)
REDE 3:
A terceira opcao e uma rede com todos os neuronios (camada intermediaria e
de saıda) com funcoes de ativacao iguais a sigmoides logısticas (Equacao (.)),
resultando na saıda da rede,
6.3 RESULTADOS EXPERIMENTAIS COM O SISTEMA HIBRIDO AG+RNA 110
yk(t) = Sig
{nh∑
j=1
δ(S2jk)WjkSig
[nin∑
i=1
(δ(S1
ij)WijZi(t) − δ(S1j )b
1j
)]− δ(S2
k)(b2k)
}
(.)
Para todos os tres modelos de redes neurais foi utilizada a mesma funcao de fitness,
definida como,
f =1
1 + MSE(.)
onde o erro MSE e definido pela Equacao (.).
Os valores de maximo e mınimo para cada um desses parametros foram definidos
como [84],
−3√nh + 1
≥ Wij, Wjk, b1j , b
2k ≥ 3√
nh + 1(.)
−1 ≥ S1ij, S
2jk, S
1j , S
2k ≥ 1 (.)
gerando um cromossomo com a estrutura,
[S2
jk Wjk S1ij Wij S1
j b1j S2
k b2k
](.)
6.3 RESULTADOS EXPERIMENTAIS COM O SISTEMA HIBRIDO AG+RNA
Foram realizados experimentos com os tres modelos de redes (REDE 1, REDE 2 e REDE
3), cada um dos quais com as mesmas arquiteturas utilizadas nos experimentos apresen-
tados no Capıtulo 5.
Para todos os experimentos descritos a seguir, foram especificados os seguintes valores
para os parametros do algoritmo:
6.3 RESULTADOS EXPERIMENTAIS COM O SISTEMA HIBRIDO AG+RNA 111
w = 0.9;
PMUT = 0.1;
No de iteracoes = 1000;
PT = 0.000001;
CV = 5%
.
Nas subsecoes que se seguem sao expostos os resultados alcancados pela melhor con-
figuracao (modelo e arquitetura) obtida para a RNA para as series introduzidas no
Capıtulo 4.
6.3.1 Serie do Mapa de Henon
Dentre os experimentos realizados com a serie do Mapa de Henon, o modelo REDE 1
da arquitetura 4-5-1 apresenta os melhores resultados, sendo este eleito como o melhor
modelo de previsao para a serie. Na Tabela 6.1 sao expostos os valores alcancados pelas
medidas de desempenho para o melhor modelo gerado.
Tabela 6.1: Resultados experimentais obtidos pelo melhor modelo do Sistema HıbridoAG+RNA para a serie do Mapa de Henon (RNA 4-5-1).
Modelo Erros Treinamento Validacao Teste
REDE 1
MSE 0.0556 0.0565 0.0558MAPE (%) 783.8473 859.8755 1027.4527Theil 0.3500 0.3541 0.3495POCID (%) 55.3421 62.1847 62.1849ARV 0.0902 0.0933 0.0915AIC -14401.1117 -7138.6666 -7168.0374BIC -14243.2591 -6995.3700 -7024.7408
Um grafico comparativo entre os valores reais da serie (linha solida) e os valores
previstos (linha tracejada) pelo modelo eleito, para os ultimos 100 pontos do conjunto de
teste, e exposto na Figura 6.2.
O processo de poda realizado sobre as RNAs e apresentado por duas matrizes, onde
a primeira representa as conexoes entre a camada de entrada e a camada intermediaria,
e, a segunda matriz, as conexoes da camada intermediaria para a camada de saıda. Tais
matrizes, chamadas de matrizes de conexoes, definem a topologia da rede e sao expostas
no Apendice E para o melhor modelo.
6.3 RESULTADOS EXPERIMENTAIS COM O SISTEMA HIBRIDO AG+RNA 112
0 10 20 30 40 50 60 70 80 90 1000
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
Pontos − Conjunt de Teste
Hen
on
Figura 6.2: Serie do Mapa de Henon (linha solida) e os valores previstos (linha tracejada)pelo Sistema Hıbrido AG+RNA para os ultimos 100 pontos do conjunto de teste.
Comparando os experimentos realizados com as RNAs e os experimentos do modelo
AG+RNA, Tabela 6.2, observa-se que o melhor modelo do Sistema Hıbrido para a serie do
Mapa de Henon se apresenta com um desempenho inferior aos resultados alcancados pelo
modelo da RNA (Capıtulo 5). Este resultado vem a gerar indıcios de que o treinamento
das RNAs realizado atraves do AG nao e eficiente quando comparado com metodos de
gradiente descendente, visto que o AG depara-se com um espaco de busca extremamente
vasto para o ajuste dos pesos das RNAs. Contudo, os resultados obtidos pelo modelo
AG+RNA ainda sao melhores que os resultados obtidos pelo modelo linear de Box &
Jenkins, demonstrando que embora o processo de treinamento nao seja eficiente, o Sis-
tema Hıbrido e capaz de selecionar configuracoes de RNAs com desempenho superior aos
tradicionais modelos lineares estatısticos, muito provavelmente devido ao correto ajuste
dos parametros da topologia das redes.
Tabela 6.2: Resultados experimentais (conjunto de teste) com os melhores modelos (Box& Jenkins, RNAs e AG+RNA) para a serie de Henon.
Erros Box & Jenkins RNA AG+RNA Melhor Modelo
MSE 0.3625 4.0840e-9 0.0558 RNAMAPE 404.53% 1.0349e-8% 1027.4527% RNA
U de Theil 2.2709 3.9090e-11 0.3495 RNAPOCID 48.9489% 100.00% 62.1849% RNAARV 4.2811 7.8006e-11 0.0915 RNAAIC -5045.4 -59657.5 -7168.0374 RNABIC -4940.2 -59241.3 -7024.7408 RNA
6.3 RESULTADOS EXPERIMENTAIS COM O SISTEMA HIBRIDO AG+RNA 113
6.3.2 Serie das Manchas Solares
Os experimentos realizados com o Sistema Hıbrido AG+RNA para a serie das Manchas
Solares elegem o modelo REDE 2 da arquitetura 3-1-1 com o mais apto para a previsao.
Na Tabela 6.3 sao expostos os resultados obtidos para o melhor modelo.
Tabela 6.3: Resultados experimentais obtidos pelo melhor modelo do Sistema HıbridoAG+RNA para a serie das Manchas Solares (RNA 3-1-1).
Modelo Erros Treinamento Validacao Teste
REDE 2
MSE 0.0060 0.0059 0.0127MAPE (%) 67.8179 74.8045 39.9941Theil 0.4984 0.5298 0.4588POCID (%) 56.6434 57.7465 58.3265ARV 0.1990 0.1923 0.1999AIC -720.8525 -354.1071 -304.2590BIC -701.0383 -337.7937 -287.8757
Um grafico comparativo entre os valores reais da serie (linha solida) e os valores
previstos (linha tracejada) pelo modelo eleito, para o conjunto de teste, e exposto na
Figura 6.3.
0 10 20 30 40 50 60 700
0.2
0.4
0.6
0.8
1
Pontos − Conjunto de Teste
Man
chas
Sol
ares
Figura 6.3: Serie das Manchas Solares (linha solida) e os valores previstos (linha trace-jada) pelo Sistema Hıbrido AG+RNA para o conjunto de teste.
As estruturas de conexoes para o melhor modelo gerado (REDE 2 - arquitetura 3-1-1)
nos experimentos com a serie das Manhas Solares sao expostas no Apendice E.
Atraves da Tabela 6.4 e possıvel comparar os resultados obtidos para a serie das Man-
chas Solares entre os melhores modelos nos experimentos com Box & Jenkins, RNAs e
6.3 RESULTADOS EXPERIMENTAIS COM O SISTEMA HIBRIDO AG+RNA 114
AG+RNA. De forma global, os experimentos com as RNAs tem os melhores resultados.
Contudo, o modelo AG+RNA apresenta um bom desempenho global, superior ao desem-
penho dos modelos de Box & Jenkins. Em particular, os criterios de informacao revelam
que o modelo AG+RNA estabelece um modelo de previsao bem mais parcimonioso que
os demais, indicando novamente um bom ajuste para a topologia das redes.
Tabela 6.4: Resultados experimentais (conjunto de teste) com os melhores modelos (Box& Jenkins, RNAs e AG+RNA) para a series das Manchas Solares.
Erros Box & Jenkins RNA AG+RNA Melhor Modelo
MSE 0.0219 0.9205 0.0127 AG+RNAMAPE 42.35% 2.41% 40.00% RNA
U de Theil 0.7805 0.3443 0.4588 RNAPOCID 75.000% 90.0000% 58.326% RNAARV 0.4007 0.1418 0.1999 RNAAIC -92.8323 -280.9 -304.2590 AG+RNABIC -71.5266 -196.0 -287.8757 AG+RNA
6.3.3 Serie de Medidas do Brilho de uma Estrela
Os experimentos com o Sistema Hıbrido AG+RNA elege o modelo REDE 2 da arquitetura
3-1-1 como o indivıduo mais apto para a previsao da serie de Medidas do Brilho de uma
Estrela. Na Tabela 6.5 sao expostos os resultados obtidos pelo melhor modelo AG+RNA.
Tabela 6.5: Resultados experimentais obtidos pelo melhor modelo do Sistema HıbridoAG+RNA para a serie de Medidas de Brilhos de uma Estrela (RNA 3-1-1).
Modelo Erros Treinamento Validacao Teste
REDE 2
MSE 7.0540e-4 7.5549e-4 7.0158e-4MAPE (%) 8.9205 10.5821 11.8313Theil 0.1852 0.1865 0.1910POCID (%) 49.3289 48.3221 48.3221ARV 0.0006 0.0009 0.0006AIC -2152.5110 -1061.0330 -1079.3262BIC -2129.0255 -1041.0133 -1059.2730
A topologia do melhor modelo AG+RNA para a previsao da serie de Medidas do Brilho
de uma Estrela e representada pelas matrizes de conexoes, apresentadas no Apendice E.
Um grafico comparativo entre os valores reais da serie de Medidas do Brilho de uma
Estrela (linha solida) e os valores gerados pela previsao (linha tracejada) do modelo mais
apto, para o conjunto de teste, e mostrado na Figura 6.4.
6.3 RESULTADOS EXPERIMENTAIS COM O SISTEMA HIBRIDO AG+RNA 115
0 50 100 1500
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
Pontos − Conjunto de Teste
Bril
ho d
e um
a E
stre
la (
u.a.
)
Figura 6.4: Serie de Medidas de Brilhos de um Estrela (linha solida) e a previsao (linhatracejada) gerada pelo modelo REDE 2 da arquitetura 3-1-1.
Atraves da Tabela 6.6 e possıvel comparar os resultados obtidos pelas medidas de de-
sempenho para os experimentos de Box & Jenkins, RNAs e Sistema Hıbrido AG+RNA.
Novamente os experimentos que utilizam unicamente as RNAs se destacam como o pro-
cedimento que alcancou o melhor desempenho geral.
Tabela 6.6: Resultados experimentais (conjunto de teste) com os melhores modelos (Box& Jenkins, RNAs e AG+RNA) para a serie de Medidas do Brilho de uma Estrela.
Erros Box & Jenkins RNA AG+RNA Melhor Modelo
MSE 3.9004e-4 0.0234 7.0158e-4 Box & JenkinsMAPE 9.36% 0.10% 11.8313% RNA
U de Theil 0.0679 0.0632 0.1910 RNAPOCID 100.00% 72.97% 48.3221% Box & JenkinsARV 0.0035 3.3357e-3 0.0006 AG+RNAAIC -294.9564 -1193.9 -1079.3262 RNABIC -22.6541 -1089.8 -1059.2730 RNA
6.3.4 Serie do Indice Dow Jones Industrial Average
Os experimentos com o Sistema Hıbrido AG+RNA apontam o modelo REDE 2 da arqui-
tetura 3-10-1 como o mais apto para a previsao da serie do Indice Dow Jones Industrial
Average. Na Tabela 6.7 sao exibidos os valores para as medidas de desempenho para o
modelo eleito, e sua topologia exposta no Apendice E.
6.3 RESULTADOS EXPERIMENTAIS COM O SISTEMA HIBRIDO AG+RNA 116
Tabela 6.7: Resultados experimentais obtidos pelo melhor modelo do Sistema HıbridoAG+RNA para a serie DJIA (RNA 3-10-1).
Modelo Erros Treinamento Validacao Teste
REDE 2
MSE 7.3549e-4 8.5662e-4 9.0341e-4MAPE (%) 5.1829 3.6351 10.3436Theil 1.0745 0.9990 1.0827POCID (%) 52.8249 50.8475 50.8475ARV 0.0190 0.0188 0.0189AIC -5032.2038 -2424.1295 -2412.3142BIC -4820.8310 -2239.0962 -2227.1738
Um grafico comparativo entre os valores reais (linha solida) da serie DJIA e a previsao
(linha tracejada) gerada pelo modelo REDE 2 da arquitetura 3-10-1 para o conjunto de
teste e mostrado na Figura 6.5a.
Analisando os valores das medidas de desempenho para o melhor modelo gerado,
em particular segundo a estatıstica U de Theil e a medida POCID, percebe-se que a
previsao gerada e inferior a previsao gerada por um modelo do tipo Random Walk —
medida da estatıstica U de Theil igual a 1.0827 — tambem se comportando como um
experimento semelhante ao do tipo cara ou coroa quanto a previsao da tendencia do
proximo valor futuro — medida POCID igual a 50.8475%. Ambos os comportamentos
podem ser observados na Figura 6.5a e na Figura 6.5b.
0 50 100 150 200 250 300 3500
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
Pontos − Conjunto de Teste
DJI
A
(a) Conjunto de teste completo.
260 270 280 290 300 310 320 330 340 3500.2
0.25
0.3
0.35
0.4
0.45
0.5
Pontos − Conjunto de Teste
DJI
A
(b) Ultimos 100 pontos do conjunto de teste.
Figura 6.5: Serie real do DJIA (linha solida) e a previsao gerada pelo Sistema HıbridoAG+RNA (linha tracejada), REDE 2 da arquitetura 3-10-1, para o conjunto de teste.
Atraves da Tabela 6.8 e possıvel comparar os resultados obtidos nos experimentos
6.3 RESULTADOS EXPERIMENTAIS COM O SISTEMA HIBRIDO AG+RNA 117
de Box & Jenkins, das RNAs e do modelo AG+RNA. Os experimentos com as RNAs
apresentam um desempenho geral superior aos demais, seguido pelos resultados obtidos
pelo modelo AG+RNA, que se apresentam superiores aos resultados dos modelos de Box
& Jenkins. Estes indıcios novamente apontam para o fato que o Sistema Hıbrido e capaz
de ajustar a topologia das RNAs, porem e ineficiente para a execucao do treinamento das
mesma.
Tabela 6.8: Resultados experimentais (conjunto de teste) com os melhores modelos (Box& Jenkins, RNAs e AG+RNA) para a serie DJIA.
Erros Box & Jenkins RNA AG+RNA Melhor Modelo
MSE 5.8033e-4 0.0827 9.0341e-4 Box & JenkinsMAPE 8.32% 0.37% 10.3436% RNA
U de Theil 1.2649 0.9878 1.0827 RNAPOCID 46.10% 46.74% 50.8475 AG+RNAARV 0.0392 3.4226e-2 0.0189 AG+RNAAIC -1056.2 -2500.7 -2412.3142 RNABIC -1052.2 -2471.5 -2227.1738 RNA
6.3.5 Serie do Indice Nasdaq
A partir dos experimentos com o Sistema Hıbrido AG+RNA, o modelo REDE 2 da arqui-
tetura 3-5-1 apresenta o melhor conjunto de resultados para as medidas de desempenho
segundo o conjunto de teste, sendo eleito como o melhor modelo para a previsao da serie
do Indice Nasdaq. Na Tabela 6.9 sao apresentados os valores de medidas de desempenho
obtidos pelo melhor modelo, e sua topologia e exposta no Apendice E.
Tabela 6.9: Resultados experimentais obtidos pelo melhor modelo do Sistema HıbridoAG+RNA para a serie do Indice Nasdaq (RNA 3-5-1).
Modelo Erros Treinamento Validacao Teste
REDE 2
MSE 2.6690e-5 1.3150e-4 2.5983e-4MAPE (%) 5.3288 1.8716 1.9660Theil 9.9688 30.2940 13.8660POCID (%) 56.1016 53.8936 53.2541ARV 0.0014 0.0019 0.0085AIC -44317.5710 -18780.2075 -17346.0409BIC -44170.6572 -18647.1566 -17212.9900
Analisando os resultados alcancados pelo modelo eleito como mais apto, observa-se
um erro percentual de previsao baixo, MAPE = 1.9660%. Todavia, ao se observar o
valor alcancado pela medida da estatıstica U de Theil (13.8660 para o conjunto de teste),
6.3 RESULTADOS EXPERIMENTAIS COM O SISTEMA HIBRIDO AG+RNA 118
percebe-se que este modelo tem um desempenho muito inferior a um simples modelo do
tipo Random Walk. Atraves da medida do POCID (53.2541% para o conjunto de teste)
tambem se constata que tal modelo funciona aproximadamente como um experimento do
tipo cara ou cora para a previsao da tendencia do proximo valor.
Um grafico comparativo entre os valores reais (linha solida) da serie do Indice Nasdaq
e a previsao (linha tracejada) gerada pelo melhor modelo, para o conjunto de teste, e
mostrado na Figura 6.6a. Uma ampliacao deste mesmo grafico, para os ultimos 100 pontos
do conjunto de teste, e exibida na Figura 6.6b, onde e possıvel se observar claramente os
efeitos relatados pelos valores da estatıstica U de Theil e do POCID.
0 200 400 600 800 1000 1200 1400 1600 1800 20000.6
0.65
0.7
0.75
0.8
0.85
0.9
0.95
1
Pontos − Conjunto de Teste
Nas
daq
(a) Conjunto de teste completo.
2010 2020 2030 2040 2050 2060 2070 2080 2090 21000.6
0.65
0.7
0.75
0.8
0.85
0.9
0.95
1
Pontos − Conjunto de Teste
Nas
daq
(b) Ultimos 100 pontos do conjunto de teste.
Figura 6.6: Serie do Indice Nasdaq (linha solida) e a previsao gerada pelo Sistema HıbridoAG+RNA (linha tracejada), REDE 2 da arquitetura 3-5-1, para o conjunto de teste.
Atraves da Tabela 6.10 e possıvel ter uma comparacao direta entre os resultados
alcancados pelos experimentos ja realizados com a serie do Indice Nasdaq. Mais uma vez,
os experimentos com as RNAs tem um desempenho global superior aos demais.
6.3 RESULTADOS EXPERIMENTAIS COM O SISTEMA HIBRIDO AG+RNA 119
Tabela 6.10: Resultados experimentais (conjunto de teste) com os melhores modelos (Box& Jenkins, RNAs e AG+RNA) para a serie do Indice Nasdaq.
Erros Box & Jenkins RNA AG+RNA Melhor Modelo
MSE 2.4222e-5 0.0022 2.5983e-4 Box & JenkinsMAPE 0.50% 2.6988e-3% 1.9660% RNA
U de Theil 1.2702 1.1728 13.8660 RNA e Box & JenkinsPOCID 50.4751% 53.06% 53.2541% AG+RNAARV 0.0162 3.4977e-3 0.0085 Modelos SemelhantesAIC -8871.6 -22536.0 -17346.0409 RNABIC -8619.2 -22363.1 -17212.9900 RNA
6.3.6 Serie do Indice S&P500
Analisando-se os experimentos realizados com o Sistema Hıbrido AG+RNA para a serie
do Indice S&P500, observa-se que o modelo REDE 2 da arquitetura 3-5-1 e detentor dos
melhores valores de desempenho segundo o conjunto de teste, sendo eleito como o modelo
mais apto dentre os investigados. Na Tabela 6.11 sao apresentados os valores das medidas
de desempenho obtidos pelo melhor modelo, sendo sua topologia exibida no Apendice E.
Tabela 6.11: Resultados experimentais obtidos pelo melhor modelo do Sistema HıbridoAG+RNA para a serie do Indice S&P500 (RNA 3-5-1).
Modelo Erros Treinamento Validacao Teste
REDE 2
MSE 2.6597e-4 7.8277e-4 5.5643e-4MAPE (%) 27.3515 4.5061 2.4029Theil 2.2776 5.1461 5.4402POCID (%) 63.9344 74.7253 74.7252ARV 0.0606 0.0798 0.0682AIC -1462.4761 -606.8926 -645.4452BIC -1369.8674 -529.6537 -567.9658
Observando o melhor modelo segundo a estatıstica U de Theil (5.4402), percebe-se
que este e inferior a um modelo do tipo Random Walk. Entretanto, atraves do POCID
(74.7252%), este modelo tem a capacidade de prever a proxima tendencia da serie com
um desempenho superior a um sistema do tipo cara ou coroa. Um grafico entre a serie
(linha solida) e a previsao (linha traceja) gerada e mostrado na Figura 6.7.
Na Tabela 6.12 compara-se os resultados experimentais para a serie do Indice S&P500.
Mais uma vez os experimentos com as RNAs mostram um desempenho global superior
e o Sistema Hıbrido AG+RNA apresenta-se em geral mais apto que os modelos de Box
& Jenkins, vindo a indicar novamente que embora o processo de treinamento nao seja
realizado de forma satisfatoria, o Sistema AG+RNA consegue ajustar os parametros das
6.3 RESULTADOS EXPERIMENTAIS COM O SISTEMA HIBRIDO AG+RNA 120
0 10 20 30 40 50 60 70 80 900.65
0.7
0.75
0.8
0.85
0.9
0.95
1
Pontos − Conjunto de Teste
S&
P50
0
Figura 6.7: Serie S&P500 (linha solida) e a previsao gerada pelo modelo REDE 2 daarquitetura 3-5-1 para o conjunto de teste.
topologias das RNAs de forma eficiente.
Tabela 6.12: Resultados experimentais (conjunto de teste) com os melhores modelos (Box& Jenkins, RNAs e AG+RNA) para a serie do Indice S&P500.
Erros Box & Jenkins RNA AG+RNA Melhor Modelo
MSE 2.1447e-4 0.0095 5.5643e-4 Box & JenkinsMAPE 1.24% 0.1000% 2.4029% RNA
U de Theil 1.4090 0.9166 5.4402 RNA e Box & JenkinsPOCID 47.2222% 51.11% 74.7252% AG+RNAARV 0.1374 7.2728e-3 0.0682 RNAAIC -310.5510 -741.0 -645.4452 RNABIC -307.9400 -561.9 -567.9658 Modelos Semelhantes
6.3.7 Serie do Valor de Fechamento das Acoes da Petrobras
Comparando-se os resultados experimentais realizados com o Sistema Hıbrido AG+RNA,
elege-se o modelo REDE 2 da arquitetura 3-10-1 como o mais apto para a previsao da
serie do Valor de Fechamento das Acoes da Petrobras (PetrobrasON). Na Tabela 6.13 sao
apresentados os valores da medidas de desempenho alcancados pelo melhor modelo.
Analisando os resultados obtidos pelo melhor modelo, observa-se um erro percentual
baixo, em linhas gerais, para uma serie que representa os valores reais das acoes da
Petrobras negociadas na bolsa de valores do estado de Sao Paulo, MAPE = 0.9815%.
Entretanto, quando analisada a medida da estatıstica U de Theil, 2.1875, este modelo
6.3 RESULTADOS EXPERIMENTAIS COM O SISTEMA HIBRIDO AG+RNA 121
Tabela 6.13: Resultados experimentais obtidos pelo melhor modelo do Sistema HıbridoAG+RNA para a serie do Valor de Fechamento das Acoes da Petrobras (RNA 3-10-1).
Modelo Erros Treinamento Validacao Teste
REDE 2
MSE 3.4320e-4 1.3933e-4 1.3712e-4MAPE (%) 6.0569 1.2591 0.9815Theil 2.1056 2.0659 2.1875POCID (%) 54.8511 57.6923 57.3791ARV 0.0988 0.0997 0.0951AIC -8216.2547 -4528.9110 -4555.0048BIC -7954.5455 -4297.7425 -4323.6674
apresenta-se com um desempenho medio bem inferior a um modelo do tipo Random Walk,
e quanto a medida de POCID (57.3791%), este se comporta apenas um pouco melhor
que um experimento tipo cara ou coroa para a previsao de tendencias.
A estrutura da rede para o melhor modelo e representada atraves das matrizes de
conexoes, expostas no Apendice E.
Um grafico comparativo entre os valores reais (linha solida) da serie e a previsao (linha
tracejada) gerada pelo modelo REDE 2 da arquitetura 3-10-1 e mostrado na Figura 6.8a.
Atraves de uma ampliacao deste grafico, mostrado na Figura 6.8b, fica claro os efeitos
relatados pelos resultados apresentados a partir das medidas da estatıstica U de Theil e
pela medida do POCID.
0 50 100 150 200 250 300 350 400 450 500
0.82
0.84
0.86
0.88
0.9
0.92
0.94
0.96
0.98
1
Pontos − Conjunto de Teste
Pet
robr
asO
N
(a) Conjunto de teste completo.
430 440 450 460 470 480 490 500 510 520
0.82
0.84
0.86
0.88
0.9
0.92
0.94
0.96
0.98
1
Pontos − Conjunto de Teste
Pet
robr
asO
N
(b) Ultimos 100 pontos do conjunto de teste.
Figura 6.8: Serie do Valor de Fechamento das Acoes da Petrobras (linha solida) e a pre-visao gerada pelo Sistema Hıbrido AG+RNA (linha tracejada), REDE 2 da arquitetura3-10-1, para o conjunto de teste.
6.3 RESULTADOS EXPERIMENTAIS COM O SISTEMA HIBRIDO AG+RNA 122
A partir dos resultados experimentais alcancados ate entao com a serie do Valor de
Fechamento das Acoes da Petrobras, resumidos na Tabela 6.14, mais uma vez observa-se
que as RNAs apresentam um desempenho geral superior as demais abordagens. Observa-
se tambem que o modelo AG+RNA, embora tenha um desempenho inferior ao desem-
penho das RNAs, apresenta-se mais adequado que os modelos de Box & Jenkins, vindo a
indicar novamente que o modelo nao consegue realizar um bom procedimento de treina-
mento, mas realiza um bom ajuste da topologia das RNAs.
Tabela 6.14: Resultados experimentais (conjunto de teste) com os melhores modelos(Box & Jenkins, RNAs e AG+RNA) para a serie do Valor de Fechamento das Acoes daPetrobras.
Erros Box & Jenkins RNA AG+RNA Melhor Modelo
MSE 2.5532e-4 0.0095 1.3712e-4 AG+RNAMAPE 1.41% 0.1000% 0.9815% RNA
U de Theil 4.0261 1.5124 2.1875 RNAPOCID 49.0385% 51.64% 57.3791% AG+RNAARV 0.2080 0.0890 0.0951 RNAAIC -1723.1 -4713.4 -4555.0048 RNABIC -1710.0 -4445.5 -4323.6674 RNA
6.3.8 Serie Random Walk
A partir dos experimentos realizados com o Sistema Hıbrido AG+RNA, elege-se o modelo
REDE 2 da arquitetura 3-10-1 como o mais apto para a previsao da serie Random Walk,
segundo o conjunto de teste. Na Tabela 6.15 sao expostos os valores das medidas de
desempenho obtidas para este melhor modelo.
Tabela 6.15: Resultados experimentais obtidos pelo melhor modelo do Sistema HıbridoAG+RNA para a serie Random Walk (RNA 3-10-1).
Modelo Erros Treinamento Validacao Teste
REDE 2
MSE 0.0019 0.0015 0.0014MAPE (%) 10.8807 7.8892 6.9377Theil 1.0516 1.1793 1.1276POCID (%) 53.6145 50.2008 48.2551ARV 0.0956 0.0987 0.0956AIC -3234.8592 -1538.1084 -1562.4317BIC -3036.8564 -1366.4452 -1390.6162
O melhor modelo AG+RNA tem a topologia da rede representada atraves das matrizes
de conexoes, apresentadas no Apendice E.
6.3 RESULTADOS EXPERIMENTAIS COM O SISTEMA HIBRIDO AG+RNA 123
Observando-se os resultados das medidas da estatıstica U de Theil (1.1276) e POCID
(48.2551%), constata-se um desempenho de previsao inferior ao modelo tipo Random
Walk e um comportamento do tipo cara ou coroa para a previsao da tendencias para o
proximo ponto da serie. Estas observacoes demonstram um desempenho nao satisfatorio
para a aplicacao deste modelo em situacoes praticas.
Um grafico comparativo entre os valores reais da serie (linha solida) e a previsao (linha
tracejada) gerada pelo melhor modelo para o conjunto de teste e mostrado na Figura 6.9a.
Ampliando-se este grafico, Figura 6.9b, e possıvel notar o comportamento da previsao
responsavel pelos valores relatados pelas medidas da estatıstica U de Theil e POCID.
0 50 100 150 200 2500.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
Pontos − Conjunto de Teste
Ran
dom
Wal
k
(a) Conjunto de teste completo.
150 160 170 180 190 200 210 220 230 240 2500.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
Pontos − Conjunto de Teste
Ran
dom
Wal
k
(b) Ultimos 100 pontos do conjunto de teste.
Figura 6.9: Serie Random Walk (linha solida) e a previsao gerada pelo Sistema HıbridoAG+RNA (linha tracejada), REDE 1 da arquitetura 3-1-1, para o conjunto de teste.
A partir da Tabela 6.16 e possıvel comparar diretamente os resultados obtidos com
os experimentos ja realizados com a serie Random Walk. Mantendo o mesmo comporta-
mento das outras series, os experimentos com as RNAs apresentam em geral os melhores
resultados. Contudo, o Sistema Hıbrido, embora nao seja superior as RNAs, obteve um
melhor desempenho quando comparado aos modelos de Box & Jenkins, indicando um
bom ajuste dos parametros da topologia das rede.
Desta forma, percebe-se que o Sistema Hıbrido AG+RNA e capaz de ajustar os
parametros da topologia das RNAs, mas nao e habil para realizar o processo de treina-
mento, sendo preferido um treinamento atraves de um algoritmo de gradiente descen-
dente.
6.3 RESULTADOS EXPERIMENTAIS COM O SISTEMA HIBRIDO AG+RNA 124
Tabela 6.16: Resultados experimentais (conjunto de teste) com os melhores modelos (Box& Jenkins, RNAs e AG+RNA) para a serie Random Walk.
Erros Box & Jenkins RNA AG+RNA Melhor Modelo
MSE 0.0018 0.1313 0.0014 Box & JenkinsMAPE 6.70% 0.28% 6.9377% RNA
U de Theil 1.7633 1.0454 1.1276 RNAPOCID 54.55% 49.19% 48.2551% Box & JenkinsARV 0.1921 4.8108e-2 0.0956 RNAAIC -629.7357 -1600.3 -1562.4317 RNABIC -626.1305 -1482.9 -1390.6162 RNA
CAPITULO 7
UM NOVO METODO HIBRIDO INTELIGENTE PARA
A PREVISAO DE SERIES TEMPORAIS
Neste capıtulo e proposta uma nova metodologia para a previsao de series temporais
baseada em um sistema hıbrido inteligente composto pela combinacao de um algoritmo
genetico modificado (descrito no Capıtulo 6), redes neurais artificiais do tipo MLP, uma
busca evolutiva pelos retardos temporais relevantes para a serie e um teste estatıstico
para a determinacao do comportamento da serie.
Este novo metodo — The Time-lag Added Evolutionary Forecasting (TAEF) Me-
thod — apresenta-se como uma alternativa viavel para a previsao de series temporais,
alcancando altos desempenhos de previsao.
7.1 INTRODUCAO
Analisando os resultados obtidos atraves dos experimentos e metodologias abordados ate
o Capıtulo anterior, percebe-se que, de forma geral, os modelos lineares sao superados
pelos modelos gerados com o uso de tecnicas da Inteligencia Artificial (RNAs e AGs).
Nota-se tambem que os experimentos com a utilizacao unicamente das RNAs, que uti-
lizam metodos baseados em calculos numericos do gradiente descendente das funcoes de
erro para o processo de treinamento, de forma global, alcancaram os melhores resultados.
Os experimentos com o Sistema Hıbrido AG+RNA, que utiliza um procedimento
estocastico para o ajuste das RNAs, demonstraram, em linhas gerais, serem aptos na
escolha das configuracoes dos parametros da topologia das RNAs, porem inaptos para o
processo de treinamento devido ao vasto espaco de configuracoes para os pesos das RNAs.
Nos experimentos com o Sistema Hıbrido AG+RNA estudado foram dadas basica-
mente duas possibilidades de ajuste na topologia das redes: a selecao dos retardos tem-
porais relevantes dentro de um domınio de entradas pre-estabelecidas no inıcio dos expe-
rimentos, e a selecao da quantidade de neuronios na camada intermediaria efetivamente
125
7.2 UMA NOVA PROPOSTA: METODO TAEF 126
ativos. Ambas as escolhas foram estabelecidas atraves do processo de poda das conexoes
entre as camadas da rede.
Desta forma, o fato de se escolher convenientemente os parametros da RNA e de
se utilizar um metodo de treinamento para a RNA baseado no calculo do gradiente
descendente do erro de previsao sao procedimentos adequados para o sucesso da previsao
com a utilizacao das RNAs.
A ideia chave e combinar os pontos fortes de cada uma das tecnicas ja abordadas
na tentativa de criar uma nova metodologia aplicada ao problema de previsao de series
temporais de forma a obter melhores resultados de desempenho a um custo aceitavel.
7.2 UMA NOVA PROPOSTA: THE TIME-LAG ADDED EVOLUTIONARY FO-
RECASTING METHOD
Como ja discutido no Capıtulo 2, baseado no teorema de F. Takens [16] (Apendice A), o
parametro fundamental para a reconstrucao do espaco de fase de uma serie temporal e a
correta escolha dos retardos temporais relevantes (ou lags).
Seja M um espaco de fase que contem as dimensoes de interesse para a determinacao
do comportamento de um determinado fenomeno temporal. Seja ϕt(x) a trajetoria tem-
poral descrita pelo fenomeno de interesse sobre o espaco M e y(ϕt(x)) a observacao dos
pontos relativos a evolucao temporal deste fenomeno, ou seja, a propria serie temporal.
Desta forma o problema de previsao e a determinacao do correto mapeamento entre a
observacao dos pontos da evolucao temporal e o espaco de fase M, mapeamento este
definido por Φ(ϕ,y) : M → Rd+1, e dado por:
Φ(ϕ,y) =(y(x), y(ϕ(x)), . . . , y(ϕd(x))
)(.)
onde d/2 e a dimensao do espaco de fase M. Takens [16] provou que um sistema dinamico
que evolui no tempo pode ser mapeado a partir do seu espaco de fase, que para uma
serie temporal e constituıda por seus retardos temporais, de forma a necessitar de uma
quantidade mınima finita de dimensoes, d + 1.
O Time-lag Added Evolutionary Forecasting Method (metodo TAEF) tenta reconstruir
o espaco de fase de uma dada serie temporal realizando uma busca pela dimensionali-
dade mınima necessaria para a reproducao do fenomeno gerador da serie e seus valores
7.2 UMA NOVA PROPOSTA: METODO TAEF 127
subsequentes. E interessante ter a quantidade mınima possıvel de retardos temporais
(lags), visto que quanto maior esta quantidade, maior o custo associado ao treinamento
das RNAs.
O procedimento utilizado pelo metodo TAEF, esquematizado na Figura 7.1, utiliza
o AG modificado descrito na Secao 6.2 para a busca dos seguintes parametros de uma
RNA:
• Os retardos temporais relevantes, ou lags, sendo inicialmente definida uma
quantidade maxima de retardos temporais (Rmax) para a selecao do AG. Desta
forma, o numero de retardos temporais para cada indivıduo da populacao estara
contido no intervalo [1, Rmax];
• A quantidade de neuronios nas camadas intermediarias, onde a quantidade
maxima permitida (Nhmax) e estabelecida inicialmente pelo usuario. O AG ira
escolher para cada indivıduo a quantidade de neuronios das camadas intermediarias
contida no intervalo [1, Nhmax];
• O algoritmo de treinamento da RNA, onde sao pre-estabelecidos quatro di-
ferentes algoritmos: RproP [74], Levenberg-Marquardt [75], metodo do Gradiente
Conjugado Escalado [77], e o algoritmo Um Passo Secante [78]. Todos estes basea-
dos no metodo do gradiente descendente.
Ao inicializar o metodo TAEF, o usuario deve determinar o horizonte de predicao, a
quantidade inicial maxima de retardos temporais a serem investigados (Rmax), a quan-
tidade maxima de neuronios das camadas escondidas das RNAs (Nhmax), a quantidade
de iteracoes do metodo (Cont) e o valor mınimo aceitavel de fitness que deve ser al-
cancado por pelo menos um indivıduo da populacao, sendo este valor calculado pela
Equacao (.). Estes parametros, determinados pelo usuario, constituem apenas valores
iniciais que serao ajustados a medida que o metodo evolui em busca do melhor modelo
possıvel para a previsao da serie temporal.
Dados os valores iniciais para os parametros acima descritos, o metodo TAEF inicializa
um AG modificado, como descrito na Secao 6.2, para a realizacao da busca pela melhor
configuracao possıvel dos parametros das RNAs bem como o algoritmo de treinamento
aplicado. Uma vez o AG alcancando alguma condicao de parada, este ira testar se o
melhor indivıduo encontrado na populacao conseguiu obter sucesso quanto a meta esta-
belecida para seu valor de fitness. Caso o melhor indivıduo nao tenha conseguido alcancar
7.2 UMA NOVA PROPOSTA: METODO TAEF 128
Figura 7.1: Esquema do Metodo TAEF proposto para a solucao do problema de previsaode series temporais
tal meta, o metodo TAEF considera que uma possıvel causa e a baixa dimensionalidade
de Rmax (quantidade maxima de retardos temporais permitida), inviabilizando a recons-
trucao do espaco de fase gerador da serie de forma homeomorfica a original, segundo o
teorema de F. Takens [16]. Neste caso, o metodo TAEF incrementa em uma unidade a
dimensionalidade de busca dos retardos temporais (Rmax), e repete o procedimento em
uma nova iteracao.
Entretanto, se o melhor indivıduo tiver conseguido alcancar, ou ate mesmo superar
a meta inicialmente estabelecida pelo usuario para o menor valor de fitness aceitavel
(Fitmin), o metodo TAEF encara que uma solucao aceitavel, segundo os criterios do
7.2 UMA NOVA PROPOSTA: METODO TAEF 129
usuario, foi encontrada. Contudo, se o numero maximo de iteracoes (Cont) nao tiver
sido alcancado, o metodo TAEF considera a possibilidade de melhorar a propria meta
previamente estabelecia pelo usuario. Desta forma, o metodo ajusta o valor do parametro
de mınimo valor de fitness aceitavel (Fitmin) como sendo o proprio valor de fitness al-
cancado pelo melhor indivıduo da iteracao, e tambem verifica a quantidade de retardos
temporais utilizado por este indivıduo, ajustando o valor de dimensionalidade de busca
dos retardos (Rmax) para o valor do retardo temporal de mais alta ordem utilizado pelo
indivıduo. Este procedimento tenta buscar a mınima dimensionalidade necessaria para
a correta reconstrucao do espaco de fase gerador da serie temporal. Uma vez dados
estes ajustes, e repetido o procedimento de busca pelo melhor preditor. Este ultimo pro-
cedimento e repetido toda vez que o melhor indivıduo da populacao consegue superar o
fitness mınimo estabelecido para sua iteracao, gerando assim novas metas para a proxima
iteracao do metodo.
Caso o algoritmo, depois de reajustar os valores de fitness mınimo e da dimensionali-
dade de busca dos retardos temporais, nao consiga alcancar um indivıduo de desempenho
superior ou igual a meta estabelecida para sua iteracao, o metodo TAEF assume que o
espaco de busca dos retardos temporais foi restringido o suficiente para causar este pro-
blema. Desta forma, o metodo TAEF volta ao valor da dimensionalidade de busca dos
retardos temporais para o valor da iteracao anterior, incrementa-o de uma unidade e
repete o procedimento de busca.
Todos estes procedimentos sao encadeados pelo metodo TAEF ate que a sua condicao
de parada seja alcancada, no caso, o numero de iteracoes (Cont), retornando a melhor
solucao possıvel encontrada.
7.2.1 Experimentos Iniciais com o Metodo TAEF
Em uma primeira etapa, varios experimentos foram gerados com o metodo TAEF (Fer-
reira et al. [104, 105]). Varias configuracoes para as RNAs, totalizando quatro tipos de
estruturas, foram testadas:
• Rede Neural do tipo MLP com tres camadas e funcao de ativacao sigmoide logıstica
em todos os neuronios;
• Rede Neural do tipo MLP com tres camadas com funcao de ativacao sigmoide
logıstica para a camada intermediaria e funcao linear para a camada de saıda;
7.2 UMA NOVA PROPOSTA: METODO TAEF 130
• Rede Neural do tipo MLP com quatro camadas com funcao de ativacao sigmoide
logıstica para as camadas intermediarias e funcao linear para a camada de saıda;
• Rede Neural do tipo MLP com tres camadas com funcao de ativacao sigmoide
logıstica para a camada intermediaria e funcao linear para a camada de saıda,
acrescida com ligacoes diretas entra a camada de entrada e a camada de saıda.
A partir destas investigacoes foi possıvel observar que a topologia com os melhores
desempenhos foi a rede neural do tipo MLP de tres camadas com funcao de ativacao
sigmoide logıstica na camada intermediaria e funcao de ativacao linear na camada de
saıda. Desta forma, esta topologia foi adotada para as investigacoes subsequentes, com
horizonte unitario de previsao e os demais parametros abaixo especificados para os expe-
rimentos realizados.
Fitmin = 0.99;
Rmax = 5;
Nhmax = 15;
Cont = 10.
Os valores dos parametros para o AG foram os mesmos ja utilizados nos experimentos
da Secao 6.2.
7.2.1.1 Experimentos com a Serie do Mapa de Henon
Para a serie do mapa de Henon, o melhor indivıduo gerado pelo metodo TAEF selecionou
os lags 2, 3, 5 e 7 como os retardos temporais relevantes utilizando 14 neuronios na camada
escondida. O algoritmo de treinamento eleito foi o Levenberg-Marquardt.
Na Tabela 7.1 sao mostrados os valores para as medidas de desempenho alcancadas
pelo metodo TAEF para os conjuntos de treinamento, validacao e teste.
Na Tabela 7.2 e possıvel comparar o conjunto de resultados alcancados pelo metodo
TAEF (Tabela 7.1) com os experimentos ja exibidos nos Capıtulos anteriores (modelos
de Box & Jenkins, RNAs, Sistema Hıbrido AG+RNA). Em particular, a comparacao
com os experimentos das RNAs mostra que o metodo TAEF consegue obter um conjunto
global de valores semelhante para as medidas de desempenho. Contudo, o Metodo TAEF
apresenta a vantagem do procedimento totalmente automatizado de escolha e ajuste de
7.2 UMA NOVA PROPOSTA: METODO TAEF 131
Tabela 7.1: Resultados experimentais para a serie do Mapa de Henon — metodo TAEF.Erros Treinamento Validacao Teste
MSE 3.1393e-11 3.3011e-11 3.1678e-11MAPE (%) 0.0297 0.0322 0.0061Theil 9.2972e-10 5.1516e-10 1.9836e-10POCID (%) 100.00 100.00 100.00ARV 1.3304e-10 1.4453e-10 1.3932e-10AIC -120401.6280 -59863.3204 -55250.9695BIC -118717.9112 -58334.8237 -53722.5625
parametros.
Tabela 7.2: Resultados experimentais (conjunto de teste) com os melhores modelos (Box& Jenkins, RNAs, AG+RNA e TAEF) para a serie do Mapa de Henon.
Erros Box & Jenkins RNA AG+RNA TAEF Melhor Modelo
MSE 0.3625 4.0840e-9 0.0558 3.1678e-11 TAEFMAPE 404.53% 1.0349e-8% 1027.4527% 0.0061% RNA
U de Theil 2.2709 3.9090e-11 0.3495 1.9836e-10 TAEF e RNAPOCID 48.9489% 100.00% 62.1849% 100.00% TAEF e RNAARV 4.2811 7.8006e-11 0.0915 1.3932e-10 TAEF e RNAAIC -5045.4 -59657.5 -7168.0374 -55250.9695 TAEF e RNABIC -4940.2 -59241.3 -7024.7408 -53722.5625 TAEF e RNA
Um grafico comparativo entre os valores reais da serie (linha solida) e a previsao (linha
tracejada) gerada pelo metodo TAEF e exibido na Figura 7.2.
2400 2410 2420 2430 2440 2450 2460 2470 2480 2490−1.5
−1
−0.5
0
0.5
1
1.5
Pontos − Conjunto de Teste
Hen
on
Figura 7.2: Serie do mapa de Henon (linha solida) e a previsao (linha tracejada) geradapelo metodo TAEF para os ultimos 100 pontos do conjunto de teste.
7.2 UMA NOVA PROPOSTA: METODO TAEF 132
7.2.1.2 Experimentos com a Serie das Manchas Solares
Para a serie das manchas solares, o melhor indivıduo gerado pelo metodo TAEF selecionou
os retardos de 1 ao 4 como relevantes utilizando 4 neuronios na camada escondida, sendo
o algoritmo Levenberg-Marquardt eleito como algoritmo de treinamento mais apto.
Na Tabela 7.3 sao mostrados os valores para as medidas de desempenho relativas aos
conjuntos de treinamento, validacao e teste.
Tabela 7.3: Resultados experimentais para a serie das Manchas Solares — metodo TAEF.Erros Treinamento Validacao Teste
MSE 0.0038 0.0050 0.0070MAPE (%) 48.8039 74.2483 30.0661Theil 0.3602 0.7891 0.1763POCID (%) 76.4886 72.4638 84.0580ARV 0.1081 0.1803 0.1233AIC -772.4669 -344.2342 -321.5201BIC -750.8768 -328.2462 -305.5321
Na Tabela 7.4 e possıvel comparar o conjunto de resultados obtidos com o metodo
TAEF e os experimentos ja exibidos nos Capıtulos anteriores para esta serie. Embora os
experimentos com as RNAs ja tenham alcancado bons resultados, o metodo TAEF obtem
melhores resultados de forma global, inferior apenas na medida do MAPE e equivalente
na medida de POCID.
Tabela 7.4: Resultados experimentais (conjunto de teste) com os melhores modelos (Box& Jenkins, RNAs, AG+RNA e TAEF) para a series das Manchas Solares.
Erros Box & Jenkins RNA AG+RNA TAEF Melhor Modelo
MSE 0.0219 0.9205 0.0127 0.0070 TAEFMAPE 42.35% 2.41% 40.00% 30.0661% RNA
U de Theil 0.7805 0.3443 0.4588 0.1763 TAEFPOCID 75.000% 90.0000% 58.326% 84.0580% RNA e TAEFARV 0.4007 0.1418 0.1999 0.1233 TAEFAIC -92.8323 -280.9 -304.2590 -321.5201 TAEFBIC -71.5266 -196.0 -287.8757 -305.5321 TAEF
Um grafico comparativo entre os valores reais da serie das Manchas Solares (linha
solida) e a previsao (linha tracejada) gerada pelo metodo TAEF para o conjunto de teste
e exibido na Figura 7.3.
7.2 UMA NOVA PROPOSTA: METODO TAEF 133
0 10 20 30 40 50 60 700
50
100
150
200
Pontos − Conjunto de Teste
Man
chas
Sol
ares
Figura 7.3: Serie das Manchas Solares (linha solida) e a previsao (linha tracejada) geradapelo metodo TAEF para o conjunto de teste.
7.2.1.3 Experimentos com a Serie de Medidas do Brilho de uma Estrela
Para a serie de Medidas do Brilho de uma Estrela, o melhor indivıduo gerado pelo metodo
TAEF selecionou os retardos de 1 ao 9 como relevantes, utilizando 15 neuronios na camada
escondida, sendo mais uma vez o algoritmo de treinamento Levenberg-Marquardt eleito
como o mais apto ao problema.
Na Tabela 7.5 sao mostrados os valores para as medidas de desempenho de previsao
para os conjuntos de treinamento, validacao e teste alcancadas pelo metodo TAEF.
Tabela 7.5: Resultados experimentais para a serie de Medidas do Brilho de uma Estrela— metodo TAEF.
Erros Treinamento Validacao Teste
MSE 8.4979e-5 1.2123-4 1.3852e-4MAPE (%) 2.0218 3.3120 2.7834Theil 0.0057 0.0098 0.0371POCID (%) 81.3559 76.8707 77.3972ARV 0.0022 0.0021 0.0020AIC -2264.4389 -1888.4629 -1796.0131BIC -1068.3972 -1435.4545 -1234.2578
Comparando o conjunto de resultados do metodo TAEF, mostrados na Tabela 7.5,
com os experimentos ja exibidos nos Capıtulos anteriores, o metodo TAEF apresenta-se,
em geral, superior em desempenho de previsao, como exibe a Tabela 7.6.
Um grafico comparativo entre os valores reais da serie de Medidas do Brilho de uma
Estrela (linha solida) e a previsao (linha tracejada) gerada pelo metodo TAEF e exibidos
na Figura 7.4.
7.2 UMA NOVA PROPOSTA: METODO TAEF 134
Tabela 7.6: Resultados experimentais (conjunto de teste) com os melhores modelos (Box& Jenkins, RNAs, AG+RNA e TAEF) para a serie de medidas do brilho de uma estrela.
Erros Box & Jenkins RNA AG+RNA TAEF Melhor Modelo
MSE 3.9004e-4 0.0234 7.0158e-4 1.3852e-4 TAEFMAPE 9.36% 0.10% 11.8313% 2.7834% RNA
U de Theil 0.0679 0.0632 0.1910 0.0371 TAEFPOCID 100.00% 72.97% 48.3221% 77.3972% Box & JenkinsARV 0.0035 3.3357e-3 0.0006 0.0020 AG+RNAAIC -294.9564 -1193.9 -1079.3262 -1796.0131 TAEFBIC -22.6541 -1089.8 -1059.2730 -1234.2578 TAEF
0 20 40 60 80 100 120 140−10
0
10
20
30
40
Pontos − Conjunto de Teste
Bril
ho d
e um
a E
stre
la (
u.a.
)
Figura 7.4: Serie Brilho de uma Estrela (linha solida) e a previsao (linha tracejada)gerada pelo metodo TAEF para o conjunto de teste.
7.2.1.4 Experimentos com a Serie do Indice Dow Jones Industrial Average
Para a serie do Indice Dow Jones Industrial Average (DJIA), o melhor indivıduo gerado
pelo metodo TAEF selecionou os retardos 2, 4, 5, 6, 9 e 10 como os relevantes, utili-
zando 10 neuronios na camada escondida, sendo o Levenberg-Marquardt o algoritmo de
treinamento eleito como o mais apto para o problema.
Na Tabela 7.7 sao mostrados os valores para as medidas de desempenho obtidas pelo
metodo TAEF para os conjuntos de treinamento, validacao e teste para a serie DJIA.
Tabela 7.7: Resultados experimentais para a serie do Indice DJIA — metodo TAEF.Erros Treinamento Validacao Teste
MSE 6.6571e-4 8.7849e-4 8.4183e-4MAPE (%) 4.7184 3.7267 1.1529Theil 0.8075 0.0872 1.0006POCID (%) 49.6354 45.7386 47.5783ARV 0.0119 0.0513 0.0346AIC -5042.8450 -2375.4191 -2384.0349BIC -4074.0227 -1505.9199 -1514.5357
7.2 UMA NOVA PROPOSTA: METODO TAEF 135
Na Tabela 7.8 sao exibidos os melhores resultados para todos os experimentos rea-
lizados com a serie do Indice DJIA. Nota-se que os experimentos com as RNAs ainda
detem o melhor conjunto de resultados. Contudo, o metodo TAEF tem um comporta-
mento bastante semelhante aos experimentos com as RNAs, mostrando que mesmo com a
possibilidade de ajuste dos parametros e escolha do algoritmo de treinamento das RNAs,
nao foi possıvel a obtencao de um modelo de maior desempenho.
Tabela 7.8: Resultados experimentais (conjunto de teste) com os melhores modelos (Box& Jenkins, RNAs, AG+RNA e TAEF) para a serie do Indice DJIA.
Erros Box & Jenkins RNA AG+RNA TAEF Melhor Modelo
MSE 5.8033e-4 0.0827 9.0341e-4 8.4183e-4 Box & JenkinsMAPE 8.32% 0.37% 10.3436% 1.1529% RNA
U de Theil 1.2649 0.9878 1.0827 1.0006 RNA e TAEFPOCID 46.10% 46.74% 50.8475% 47.5783% AG+RNAARV 0.0392 3.4226e-2 0.0189 0.0346 AG+RNAAIC -1056.2 -2500.7 -2412.3142 -2384.0349 RNABIC -1052.2 -2471.5 -2227.1738 -1514.5357 RNA
Um grafico comparativo entre os valores reais da serie (linha solida) e a previsao (linha
tracejada) gerada pelo metodo TAEF e exibido na Figura 7.5. Observando a Figura 7.6,
e possıvel notar claramente que a previsao esta se comportando como um Random Walk,
de forma semelhante aos experimentos com as RNAs.
0 50 100 150 200 250 300 3507000
7500
8000
8500
9000
9500
10000
10500
Pontos − Conjunto de Teste
DJI
A
Figura 7.5: Serie DJIA (linha solida) e a previsao (linha tracejada) gerada pelo metodoTAEF para o conjunto de teste.
7.2 UMA NOVA PROPOSTA: METODO TAEF 136
260 270 280 290 300 310 320 330 340 3508000
8500
9000
9500
Pontos − Conjunto de Teste
DJI
A
Figura 7.6: Serie DJIA (linha solida) e a previsao (linha tracejada) gerada pelo metodoTAEF para os ultimos 100 pontos do conjunto de teste.
7.2.1.5 Experimentos com a Serie do Indice Nasdaq
Para a serie do Indice Nasdaq, o melhor indivıduo gerado pelo metodo TAEF selecionou
os retardos 3, 4, 6 e 8 como relevantes, utilizando 11 neuronios na camada escondida e o
algoritmo de treinamento Levenberg-Marquardt.
Na Tabela 7.9 sao mostrados os valores para as medidas de desempenho para os
conjuntos de treinamento, validacao e teste obtidas pelo metodo TAEF.
Tabela 7.9: Resultados experimentais para a serie do Indice Nasdaq — o metodo TAEF.Erros Treinamento Validacao Teste
MSE 2.3485e-6 4.0825e-5 2.1449e-5MAPE (%) 1.0019 0.2721 0.2012Theil 0.1213 0.1190 1.1441POCID (%) 60.9264 58.9828 52.7091ARV 0.0002 0.0008 0.0034AIC -54295.7920 -25834.4935 -22342.4331BIC -53245.3919 -24883.2474 -21391.1870
Na Tabela 7.10 sao expostos todos os melhores resultados ja realizados para a serie do
Indice Nasdaq. Embora o metodo TAEF apresente de forma geral os melhores resultados,
tem um comportamento semelhante aos experimentos com as RNAs, nao garantindo que
este possa gerar um modelo suficientemente superior as RNAs para justificar seu uso.
Um grafico comparativo entre os valores reais da serie (linha solida) e a previsao (linha
tracejada) gerada pelo metodo TAEF para o conjunto de teste e exibido na Figura 7.7. Na
Figura 7.8 e mostrada uma ampliacao do grafico da Figura 7.7 para os ultimos 100 pontos
do conjunto de teste, destacando o comportamento da previsao com uma defasagem de
um passo no tempo, semelhante aos experimentos das RNAs – um modelo do tipo Random
7.2 UMA NOVA PROPOSTA: METODO TAEF 137
Tabela 7.10: Resultados experimentais (conjunto de teste) com os melhores modelos (Box& Jenkins, RNAs, AG+RNA e TAEF) para a serie do Indice Nasdaq.
Erros Box & Jenkins RNA AG+RNA TAEF Melhor Modelo
MSE 2.4222e-5 0.0022 2.5983e-4 2.1449e-5 TAEFMAPE 0.50% 2.6988e-3% 1.9660% 0.2012% RNA
U de Theil 1.2702 1.1728 13.8660 1.1441 Modelos SemelhantesPOCID 50.4751% 53.06% 53.2541% 52.7091% AG+RNAARV 0.0162 3.4977e-3 0.0085 0.0034 Modelos SemelhantesAIC -8871.6 -22536.0 -17346.0409 -22342.4331 RNA e TAEFBIC -8619.2 -22363.1 -17212.9900 -21391.1870 RNA e TAEF
Walk.
0 200 400 600 800 1000 1200 1400 1600 1800 20006.5
7
7.5
8
8.5
9
Pontos − Conjunto de teste
Nas
daq
Figura 7.7: Serie do Indice Nasdaq (linha solida) e a previsao (linha tracejada) geradapelo metodo TAEF para o conjunto de teste.
2000 2010 2020 2030 2040 2050 2060 2070 2080 2090 21007.5
7.55
7.6
7.65
7.7
7.75
Pontos − Conjunto de teste
Nas
daq
Figura 7.8: Serie do Indice Nasdaq (linha solida) e a previsao (linha tracejada) geradapelo metodo TAEF para os ultimos 100 pontos do conjunto de teste.
7.2 UMA NOVA PROPOSTA: METODO TAEF 138
7.2.1.6 Experimentos com a Serie do Indice S&P500
Para a serie do Indice S&P500, o melhor indivıduo gerado pelo metodo TAEF selecionou
o retardo 1 como o unico retardo temporal relevante utilizando 3 neuronios na camada
escondida, sendo novamente o Levenberg-Marquardt eleito como o algoritmo de treina-
mento mais apto.
Na Tabela 7.11 sao mostrados os valores para as medidas de desempenho obtidas pelo
metodo TAEF para os conjuntos de treinamento, validacao e teste.
Tabela 7.11: Resultados experimentais para a serie do Indice S&P500 — o Metodo TAEF.Erros Treinamento Validacao Teste
MSE 1.1247e-4 1.4587e-4 7.4290e-4MAPE (%) 19.6258 1.6982 1.0431Theil 0.7006 2.3982 7.24123POCID (%) 51.9126 49.4505 50.5494ARV 0.0112 0.0264 0.0100AIC -1643.0710 -782.6145 -632.8550BIC -1579.8470 -729.7877 -580.0282
Comparando o conjunto de resultados mostrados na Tabela 7.11 com os experimen-
tos ja exibidos nos Capıtulos anteriores, exibidos na Tabela 7.12, as RNAs apresentam
novamente o melhor conjunto de resultados de desempenho de previsao, seguidas pelo
metodo TAEF.
Tabela 7.12: Resultados experimentais (conjunto de teste) com os melhores modelos (Box& Jenkins, RNAs, AG+RNA e TAEF) para a serie do Indice S&P500.
Erros Box & Jenkins RNA AG+RNA TAEF Melhor Modelo
MSE 2.1447e-4 0.0095 5.5643e-4 7.4290e-4 Box & JenkinsMAPE 1.24% 0.1000% 2.4029% 1.0431% RNA
U de Theil 1.4090 0.9166 5.4402 7.24123 RNA e Box & JenkinsPOCID 47.2222% 51.11% 74.7252% 50.5494% AG+RNAARV 0.1374 7.2728e-3 0.0682 0.0100 RNAAIC -310.5510 -741.0 -645.4452 -632.8550 RNABIC -307.9400 -561.9 -567.9658 -580.0282 TAEF
Um grafico comparativo entre os valores reais da serie (linha solida) e a previsao (linha
tracejada) gerada pelo metodo TAEF e exibido na Figura 7.9.
7.2 UMA NOVA PROPOSTA: METODO TAEF 139
0 10 20 30 40 50 60 70 80 907
7.5
8
8.5
9
Pontos − Conjunto de Teste
S&
P50
0
Figura 7.9: Serie do Indice S&P500 (linha solida) e a previsao (linha tracejada) geradapelo metodo TAEF para o conjunto de teste.
7.2.1.7 Experimentos com a Serie do Valor de Fechamento das Acoes da
Petrobras
Para a serie do Valor de Fechamento das Acoes da Petrobras, o melhor indivıduo gerado
pelo metodo TAEF selecionou retardos 3, 4 e 7 como relevantes, utilizando 17 neuronios
na camada escondida, elegendo o Levenberg-Marquardt como o algoritmo de treinamento
mais adequado ao problema.
Na Tabela 7.13 sao mostrados os valores para as medidas de desempenho alcancadas
pelo metodo TAEF para os conjuntos de treinamento, validacao e teste.
Tabela 7.13: Resultados experimentais para a serie do Valor de Fechamento das Acoesda Petrobras — metodo TAEF.
Erros Treinamento Validacao Teste
MSE 3.9424e-4 1.1270e-4 7.5951e-5MAPE (%) 8.3181 1.1718 0.5480Theil 7.2717 5.0869 1.2077POCID (%) 48.1731 53.3719 52.7938ARV 0.0047 0.0058 0.0050AIC -7513.9071 -4081.2006 -4286.4167BIC -5592.7234 -2384.2139 -2589.4300
Na Tabela 7.14 sao apresentados os melhores resultados obtidos com todos os ex-
perimentos realizados para a previsao da serie do Valor de Fechamento das Acoes da
Petrobras. De forma geral, o desempenho de previsao dos experimentos com as RNAs
e com o metodo TAEF apresentam-se semelhantes, onde cada uma das metodologias
alcancam melhores resultados para tres medidas de desempenho distintas. Assim, a con-
clusao plausıvel e de equivalencia de previsao entre os experimentos.
7.2 UMA NOVA PROPOSTA: METODO TAEF 140
Tabela 7.14: Resultados experimentais (conjunto de teste) com os melhores modelos (Box& Jenkins, RNAs, AG+RNA e TAEF) para a serie do Valor de Fechamento das Acoesda Petrobras.
Erros Box & Jenkins RNA AG+RNA TAEF Melhor Modelo
MSE 2.5532e-4 0.0095 1.3712e-4 7.5951e-5 TAEFMAPE 1.41% 0.1000% 0.9815% 0.5480% RNA
U de Theil 4.0261 1.5124 2.1875 1.2077 TAEFPOCID 49.0385% 51.64% 57.3791% 52.7938% AG+RNAARV 0.2080 0.0890 0.0951 0.0050 TAEFAIC -1723.1 -4713.4 -4555.0048 -4286.4167 RNABIC -1710.0 -4445.5 -4323.6674 -2589.4300 RNA
0 50 100 150 200 250 300 350 400 450 5003.4
3.6
3.8
4
4.2
Pontos − Conjunto de Teste
Pet
robr
asO
N
Figura 7.10: Serie de Valor de Fechamento das Acoes da Petrobras (linha solida) e aprevisao (linha traceja) gerada pelo metodo TAEF para o conjunto de teste.
Um grafico comparativo entre os valores reais da serie (linha solida) e a previsao (linha
tracejada) gerada pelo metodo TAEF para o conjunto de teste e exibido na Figura 7.10.
Na Figura 7.11 e mostrada uma ampliacao da Figura 7.10 para os ultimos 100 pontos
do conjunto de teste, exibindo um deslocamento de um passo entre os dados reais e a
previsao, caracterıstica esta de um modelo do tipo Random Walk.
420 430 440 450 460 470 480 490 500 510 5203.75
3.8
3.85
3.9
3.95
4
4.05
4.1
Pontos − Conjunto de Teste
Pet
robr
asO
N
Figura 7.11: Serie de Valor de Fechamento das Acoes da Petrobras (linha solida) e aprevisao gerada pelo metodo TAEF para os ultimos 100 pontos do conjunto de teste.
7.2 UMA NOVA PROPOSTA: METODO TAEF 141
7.2.1.8 Experimentos com a Serie Random Walk
Para a serie Random Walk, o melhor indivıduo gerado pelo metodo TAEF selecionou
os retardos temporais 2, 3 e 5 como os relevantes, utilizando 15 neuronios na camada
escondida, elegendo o Levenberg-Marquardt como o algoritmo de treinamento mais apto.
Na Tabela 7.15 sao mostrados os valores para as medidas de desempenho gerados pelo
metodo TAEF para os conjuntos de treinamento, validacao e teste.
Tabela 7.15: Resultados experimentais para a serie Random Walk — metodo TAEF.Erros Treinamento Validacao Teste
MSE 0.0009 0.0012 0.0009MAPE (%) 4.8453 11.9227 5.4631Theil 2.3202 1.5167 1.1016POCID (%) 51.3078 51.2097 51.4170ARV 0.0776 0.0141 0.0767AIC -3368.6889 -1532.2571 -1588.3290BIC -1681.9859 -869.9505 -854.5578
Na Tabela 7.16 sao apresentados os resultados dos melhores modelos alcancados nos
experimentos ja apresentados para a serie Random Walk. Novamente os experimentos
com as RNAs detem o melhor conjunto de valores para as medidas de desempenho,
seguidas pelo metodo TAEF.
Tabela 7.16: Resultados experimentais (conjunto de teste) com os melhores modelos (Box& Jenkins, RNAs, AG+RNA e TAEF) para a serie Random Walk.
Erros Box & Jenkins RNA AG+RNA TAEF Melhor Modelo
MSE 0.0018 0.1313 0.0014 0.0009 TAEFMAPE 6.70% 0.28% 6.9377% 5.4631% RNA
U de Theil 1.7633 1.0454 1.1276 1.1016 RNAPOCID 54.55% 49.19% 48.2551% 51.4170% Box & JenkinsARV 0.1921 4.8108e-2 0.0956 0.0767 RNAAIC -629.7357 -1600.3 -1562.4317 -1588.3290 RNABIC -626.1305 -1482.9 -1390.6162 -854.5578 RNA
Um grafico comparativo entre os valores reais da serie (linha solida) e a previsao (linha
tracejada) gerada pelo metodo TAEF para o conjunto de teste e exibido na Figura 7.12.
E possıvel notar claramente que o grafico da previsao apresenta-se deslocado no tempo de
um passo em relacao ao grafico dos valores reais da serie, explicando o baixo desempenho
exibidos pelas medidas da estatıstica U de Theil e pelo POCID.
7.2 UMA NOVA PROPOSTA: METODO TAEF 142
0 50 100 150 20040
60
80
100
120
140
Pontos − Conjunto de Teste
Ran
dom
Wal
k
Figura 7.12: Serie Random Walk (linha solida) e a previsao gerada pelo metodo TAEFpara o conjunto de teste.
7.2.2 Analise Comportamental das Series Temporais
A partir dos experimentos desenvolvidos para as series temporais estudadas e possıvel
construir um quadro comparativo entre as metodologias aplicadas a cada destas series
destacando a mais apta, como exibido na Tabela 7.17.
Tabela 7.17: Metodologias mais adequadas para cada serie temporal estudada.
Serie MetodologiaHenon → TAEF e RNA
Manchas Solares → TAEFBrilho de uma Estrela → TAEF
DJIA → RNANasdaq → TAEF e RNAS&P500 → RNA
Petrobras → RNA e TAEFRandom Walk → RNA
Observando-se os resultados obtidos nos experimentos realizados com o metodo TAEF,
pode-se notar duas situacoes bem distintas. A primeira situacao, referentes a serie do
Mapa de Henon, serie das Manchas Solares e serie de Medidas de Brilho de uma Estrela,
revela que o metodo proposto e capaz de ajustar os parametros pesquisados, conseguindo,
em media, obter melhores marcas de desempenho de previsao em comparacao aquelas
alcancadas pelas demais metodologias. Em especial, os valores obtidos para a estatıstica
U de Theil e para o POCID demonstram que os modelos gerados nesta primeira situacao
sao bem superiores em precisao quando comparados a modelos do tipo Random Walk
(medida da estatıstica U de Theil) e experimentos do tipo cara ou coroa (medida POCID).
A segunda situacao, observada para as series economicas e financeiras e para a serie
7.2 UMA NOVA PROPOSTA: METODO TAEF 143
Random Walk, e caracterizada por valores relativamente baixos do erro MSE, quando
comparados aos erros alcancados nos demais experimentos (Capıtulos 5 e 6), indicando um
melhor desempenho do sistema quanto ao ajuste da sua funcao de fitness (Equacao (.)).
Contudo, segundo as demais medidas de desempenho, e constatado que o desempenho
medio do metodo TAEF nao e habil para superar os resultados ja obtidos pela metodo-
logia das RNAs, alcancando apenas valores semelhantes.
Em particular, analisando as medidas de desempenho da estatıstica U de Theil e
POCID, para a segunda situacao, constata-se que os resultados obtidos sao bem inferiores
aos alcancados por modelos do tipo Random Walk e bem semelhantes a um modelo do
tipo cara ou coroa. Tais caracterısticas comportamentais fortalecem a suposicao de que
as series economicas e financeiras tendem a um modelo tipicamente de Random Walk,
como ja suposto no Capıtulo 4.
Dado que a serie estudada segue um modelo do tipo Random Walk, sua formulacao
generica, ja mostrada no Capıtulo 4 (Equacao (7.17)), pode ser escrita como:
Zt = Zt−1 + rt (.)
onde Zt e a observacao atual, Zt−1 e a observacao imediatamente antes da atual e rt e
um termo de ruıdo, com media zero e desvio padrao σa.
Com a previsao pretende-se na realidade construir uma estimativa para Zt, represen-
tada por Zt, baseada nos valores passados da serie, que para o caso de um modelo do
tipo Random Walk, e a componente Zt−1. Portanto, uma boa previsao e tida quando em
media o valor esperado da diferenca da estimativa da serie pela propria serie tende a zero,
E[Zt − Zt] → 0 (.)
o que leva ao desenvolvimento, supondo que E[rt] = 0 e E[rtrk] = 0 (∀ t 6= k),
E
[Zt − (Zt−1 + rt)
]→ 0
E[Zt] − E[Zt−1] − E[rt] → 0
E[Zt] − E[Zt−1] → 0
E[Zt] → E[Zt−1]
7.2 UMA NOVA PROPOSTA: METODO TAEF 144
Desta forma, mostra-se que a minimizacao do erro entre a estimativa e a serie real con-
duz naturalmente a uma previsao deslocada de um passo em relacao a serie original,
explicando o motivo das RNAs e do metodo TAEF convergirem ambos para este com-
portamento.
Apos o processo de treinamento, a RNA adquire a informacao do comportamento da
serie temporal. Considerando que o modelo da serie temporal tenda a um modelo do tipo
Random Walk e de se esperar que a informacao aprendida pela RNA seja que o valor
da serie para o tempo t e simplesmente o valor no tempo t − 1. Este comportamento e
exatamente observado no grafico de previsao para as series economicas-financeiras apre-
sentadas, bem como para a propria serie artificial de Random Walk. Sitte e Sitte [103]
mostraram que as RNAs, tanto do tipo MLP como redes recorrentes, apresentam este
mesmo tipo de comportamento para a previsao de series economicas e financeiras.
Entretanto, como exposto nos graficos dos lagplots, as series economicas e financeiras
apresentam estruturas indicativas de algum tipo de relacionamento nao-linear entre os
retardos temporais, mesmo que sobreposta a uma componente linear dominante. Por-
tanto, e de se esperar que as series economicas e financeiras tendam a um modelo do
tipo Random Walk, mas nao sejam exatamente regidas por tal tipo de modelo, apresen-
tando um comportamento nao-linear bastante sutil, facilmente mascarado por uma forte
componente de Random Walk.
E entao suposto que o metodo TAEF seja capaz de encontrar uma condicao quase-
otima (ou ate mesmo otima) de ajuste dos parametros das RNAs, de tal forma que
seja habil de absorver grande parte da (ou toda a) informacao contida nos dados, tanto
a linear como a nao-linear. O comportamento ja observado para as series economicas
e financeiras, com uma previsao deslocada de um passo, pode ser suposto pelo fato
da componente linear (ou de Random Walk) ser dominante em relacao a componente
nao-linear. Esta componente nao-linear pode, por exemplo, ser originada por alguma
correlacao de alta ordem sobre os dados muito menor que a correlacao com o primeiro
retardo temporal, ou, ate mesmo, sobre as componentes de ruıdo, com o aparecimento
de alguma heterocedasticidade [7, 8].
Este comportamento de deslocamento ou defasagem temporal observado nas previsoes
das series temporais, a partir de um segundo ponto de vista, pode ser encarado como um
ajuste de uma fase temporal relativa entre os dados reais e a previsao gerada. Como as
series temporais abordadas tem observacoes discretas no tempo, a fase temporal relativa
7.2 UMA NOVA PROPOSTA: METODO TAEF 145
sera quantizada no tempo, onde o seu elemento fundamental (ou quanta) de incremento
ou decremento sera a distancia temporal entre os pontos da serie, sendo este quanta a
unidade fundamental de tempo para o problema.
Como ja exibido nos graficos comparativos entre os dados reais das series e as pre-
visoes geradas pelo metodo TAEF, ha duas possibilidades: a primeira, para as series que
nao tendem a um modelo Random Walk, onde as previsoes encontram-se em fase; e a
segunda, para as series que tendem a um modelo do tipo Random Walk, onde as previsoes
encontram-se fora de fase, estando a rede defasada negativamente de um quanta, ou seja,
atrasada em sua previsao em uma unidade fundamental de tempo ou um passo. Para
esta ultima possibilidade, a fase pode ser ajustada com um mecanismo que considera
uma previsao de dois passos temporais. Inicialmente apresenta-se um padrao de entrada
a rede, que gera uma saıda (primeiro passo). Em seguida, esta saıda e combinada com
os dados da entrada, gerando um padrao de ajuste, que e apresentado novamente a rede,
que por sua vez gera uma nova saıda (segundo passo), corrigindo a fase em um quanta
temporal. Este procedimento de correcao de fase e ilustrado na Figura 7.13.
Figura 7.13: Procedimento de ajuste da fase da previsao gerada pelo metodo TAEF.
E importante salientar que o fato de ser possıvel o ajuste da fase relativa entre a
previsao e a serie real implica que o modelo gerado tende a um modelo do tipo Random
Walk, muito provavelmente devido a forte componente linear contida nas series, mas
que, de alguma forma, e capaz de aprender o relacionamento entre os pontos e nao
simplesmente indicar que o valor do tempo t e igual ao valor do tempo t − 1.
Com a implementacao do procedimento de ajuste de fase ao metodo TAEF, surge um
novo problema: como determinar se a serie tende ou nao a um modelo do tipo Random
Walk? Ou, de forma equivalente, como determinar se a RNA esta gerando uma previsao
7.2 UMA NOVA PROPOSTA: METODO TAEF 146
em fase ou fora de fase? Este problema foi resolvido aplicando-se os dois procedimentos
de previsao (em fase e fora de fase), ao conjunto de validacao, logo apos o termino do
processo de treinamento da RNA. Com os dois resultados, a previsao na suposicao de fase
e a previsao na suposicao fora de fase, e aplicado um teste estatıstico, teste t [106], onde
a hipotese nula e: o erro MSE da previsao em fase e menor que o erro MSE da previsao
fora de fase, sendo testados todos os pares de pontos (dados reais, dados previstos). A
hipotese alternativa e a suposicao contraria, ou seja, o erro MSE da previsao em fase e
maior que o erro MSE da previsao fora de fase.
Todo o procedimento de deteccao e ajuste da fase foi incorporado ao metodo TAEF,
onde o teste t utiliza um grau de confianca de 99% (α = 0.01). Uma vez a hipotese nula
sendo aceita, o metodo ira supor que a previsao esta em fase, nao sendo necessaria a in-
tervencao no ajuste da fase da previsao. Caso contrario, a hipotese nula sendo rejeitada,
o metodo TAEF ira supor que a previsao gerada esta fora de fase e realizara o procedi-
mento de ajuste de fase temporal da previsao. Na Figura 7.14 e mostrado o esquema do
metodo TAEF com a inclusao do teste comportamental para a determinacao da fase de
previsao.
Varios experimentos com esta nova funcionalidade do metodo TAEF foram realizados
com as series temporais ja apresentadas, comprovando a viabilidade da deteccao e do
ajuste de fase da previsao, como podera ser comprovado nos resultados experimentais
expostos na proxima Secao, aumentando consideravelmente o desempenho de previsao
do metodo proposto.
7.2.3 Experimentos com a Inclusao da Analise Comportamental ao Metodo TAEF
Nas subsecoes subsequentes sao expostos os resultados obtidos com a utilizacao do proce-
dimento de analise e ajuste da fase temporal incorporado ao metodo TAEF para as series
ja apresentadas. O mesmo procedimento de ajuste de fase tambem e aplicado diretamente
as RNAs afim de possibilitar uma validacao mais robusta do desempenho do metodo em
relacao aos demais modelos. O objetivo e descartar ou confirmar a possibilidade do ajuste
de fase ser suficiente para aprimorar o desempenho de um modelo mais simples como as
RNAs tıpicas.
7.2 UMA NOVA PROPOSTA: METODO TAEF 147
Figura 7.14: Esquema do metodo TAEF com a inclusao do teste comportamental para adeterminacao da fase de previsao
7.2.3.1 Experimentos com a Serie do Mapa de Henon
Para a serie do Mapa de Henon, o procedimento de analise da fase temporal da pre-
visao gerada pelo metodo TAEF indica uma previsao em fase, gerando os resultados ja
apresentados na Tabela 7.1.
Entretanto, para efeito de comparacao, foram recalculados os valores para as medidas
7.2 UMA NOVA PROPOSTA: METODO TAEF 148
de desempenho forcando a suposicao de previsao fora de fase. Os resultados para o
conjunto de teste sao apresentados na Tabela 7.18 tanto para o metodo TAEF como para
as RNAs. Estes resultados mostram que o metodo TAEF e capaz de escolher corretamente
a previsao em fase para a serie, sendo a melhor metodologia dentre as investigadas sob o
aspecto da capacidade de automacao do processo de previsao.
Tabela 7.18: Resultados experimentais para a serie do Mapa de Henon com as RNAs e ometodo TAEF na suposicao em fase e fora de fase para o conjunto de teste.
ErrosRNA TAEF
Em Fase Fora de Fase Em Fase Fora de FaseMSE 4.0840e-9 0.1588 3.1678e-11 1.0445
MAPE (%) 1.0349e-10 1227.5241 0.0061 305.0857Theil 3.9090e-10 0.9998 1.9836e-10 0.9996
POCID (%) 100.00 42.3823 100.00 41.5064ARV 7.8006e-11 2.6363 1.3932e-10 1.3187AIC -59657.5 -8746.5570 -55250.9695 556.6590BIC -59241.3 -7062.8850 -53722.5625 2084.9763
Um grafico comparativo entre os valores reais da serie (linha solida) e a previsao (linha
tracejada) gerada pelo metodo em ambas as situacoes de fase e exibido na Figura 7.15.
E possıvel notar claramente que o grafico de suposicao de fase apresenta uma previsao
bastante superior ao grafico que considera a situacao fora de fase.
7.2.3.2 Experimentos com a Serie das Manchas Solares
Para a serie das Manchas Solares, o procedimento de analise da fase temporal da previsao
gerada pelo metodo TAEF indica uma previsao em fase, alcancando os resultados ja
apresentados na Tabela 7.3.
Novamente, para efeito de comparativo, foram recalculados os valores para as medidas
de desempenho forcando a suposicao de previsao fora de fase. As medidas para o conjunto
de teste sao apresentadas na Tabela 7.19 tanto para o metodo TAEF como para as
RNAs. O procedimento de analise comportamental da fase temporal incorporado ao
metodo TAEF e habil para caracterizar corretamente a previsao em fase para a serie
das Manchas Solares, sendo o metodo TAEF, dentre os investigados, o que apresenta o
melhor desempenho.
Um grafico comparativo entre os valores reais da serie (linha solida) e a previsao
(linha tracejada) gerada pelo metodo TAEF em ambas as situacoes da fase e exibido na
7.2 UMA NOVA PROPOSTA: METODO TAEF 149
2400 2410 2420 2430 2440 2450 2460 2470 2480 2490−1.5
−1
−0.5
0
0.5
1
1.5Em Fase
Pontos − Conjunto de Teste
Hen
on
2400 2410 2420 2430 2440 2450 2460 2470 2480 2490−1.5
−1
−0.5
0
0.5
1
1.5Fora de Fase
Pontos − Conjunto de Teste
Hen
on
Figura 7.15: Serie do Mapa de Henon (linha solida) e as previsoes (linha tracejada)geradas pelo metodo TAEF para os ultimos 100 pontos do conjunto de teste. O graficosuperior e referente a suposicao de previsao em fase e o grafico inferior a suposicao deprevisao fora de fase.
Tabela 7.19: Resultados experimentais para a serie das Manchas Solares com as RNAs eo metodo TAEF na suposicao em fase e fora de fase para o conjunto de teste.
ErrosRNA TAEF
Em Fase Fora de Fase Em Fase Fora de FaseMSE 0.9205 1.0163 0.0070 0.0307
MAPE (%) 2.41 133.5613 30.0661 82.5523Theil 0.3443 1.3295 0.1763 1.2225
POCID (%) 90.00 61.7021 84.0580 65.2174ARV 0.1418 0.3020 0.1233 0.4125AIC -280.9 76.9087 -321.5201 -195.8776BIC -196.0 81.9688 -305.5321 -117.9137
Figura 7.16. E possıvel notar claramente que o grafico de suposicao de fase apresenta
uma previsao bastante superior ao grafico que considera a situacao fora de fase.
7.2.3.3 Experimentos com a Serie de Medidas do Brilho de uma Estrela
Para a serie de Medidas do Brilho de uma Estrela, o procedimento de analise da fase
temporal da previsao gerada pelo metodo TAEF indica novamente uma previsao em
7.2 UMA NOVA PROPOSTA: METODO TAEF 150
0 10 20 30 40 50 60 700
50
100
150
200Em Fase
Pontos − Conjunto de Teste
Man
chas
Sol
ares
0 10 20 30 40 50 60 70−50
0
50
100
150
200Fora de Fase
Pontos − Conjunto de Teste
Man
chas
Sol
ares
Figura 7.16: Serie das Manchas Solares (linha solida) e as previsoes (linha tracejada)geradas pelo metodo TAEF para o conjunto de teste. O grafico superior e referente asuposicao de previsao em fase e o grafico inferior a suposicao de previsao fora de fase.
fase, gerando os resultados ja apresentados na Tabela 7.5. Foram calculados tambem os
valores das medidas de desempenho para o conjunto de teste forcando a suposicao de
previsao fora de fase com a utilizacao tanto do metodo TAEF como das RNAs, sendo
estes apresentados na Tabela 7.20. O procedimento de analise comportamental da fase
de previsao novamente foi caracterizado corretamente pelo metodo TAEF.
Tabela 7.20: Resultados para a serie de Medidas do Brilho de uma Estrela com as RNAse o metodo TAEF na suposicao em fase e fora de fase para o conjunto de teste.
ErrosRNA TAEF
Em Fase Fora de Fase Em Fase Fora de FaseMSE 0.0234 0.8865 1.3852e-4 0.0087
MAPE (%) 0.1000 27.7194 2.7834 26.7629Theil 0.0632 2.2185 0.0371 2.3149
POCID (%) 72.97 66.1905 77.3972 73.7931ARV 3.3357e-3 0.7482 0.0020 0.6128AIC -1193.9 -188.4629 -1796.0131 -182.6801BIC -1089.8 306.7158 -1234.2578 833.1395
Um grafico comparativo entre os valores reais da serie (linha solida) e a previsao
(linha tracejada) gerada pelo metodo TAEF em ambas as situacoes da fase e exibido na
Figura 7.17. E possıvel notar claramente que o grafico de suposicao de fase apresenta
7.2 UMA NOVA PROPOSTA: METODO TAEF 151
uma previsao bastante superior ao grafico que considera a situacao fora de fase.
0 20 40 60 80 100 120 140−10
0
10
20
30
40Em Fase
Pontos − Conjunto de Teste
Bril
ho d
e um
a E
stre
la (
u.a.
)
0 20 40 60 80 100 120 1400
5
10
15
20
25
30
35Fora de Fase
Pontos − Conjunto de Teste
Bril
ho d
e um
a E
stre
la (
u.a.
)
Figura 7.17: Serie de Medidas do Brilho de uma Estrela (linha solida) e as previsoes(linha tracejada) geradas pelo metodo TAEF para o conjunto de teste. O grafico superiore referente a suposicao de previsao em fase e o grafico inferior a suposicao de previsaofora de fase.
7.2.3.4 Experimentos com a Serie do Indice Dow Jones Industrial Average
Para a serie do Indice Dow Jones Industrial Average, o procedimento de analise de fase
da previsao indica uma previsao fora de fase. Com esta suposicao o metodo TAEF aplica
o procedimento de correcao de fase, tentando corrigir tal distorcao.
Recalculando todos os valores para as medidas de desempenho na suposicao de pre-
visao fora de fase e comparando com os resultados em fase, e observada uma extrema
melhoria no desempenho de previsao com a utilizacao do metodo TAEF. Ja o modelo
da RNA nao e capaz de corrigir a distorcao de fase, funcionando como um modelo do
tipo Random Walk, como mostra a Tabela 7.21. Em particular, percebe-se que o modelo
do metodo TAEF (fora de fase) consegue obter um melhor desempenho que um modelo
do tipo Random Walk, evidenciado pelo valor da estatıstica U de Theil (0.0318), e bem
superior ao comportamento usual de um experimento do tipo cara ou coroa, com um
valor de POCID de 97.1429%.
7.2 UMA NOVA PROPOSTA: METODO TAEF 152
Tabela 7.21: Resultados experimentais para a serie do Indice DJIA com as RNAs e ometodo TAEF na suposicao de previsao em fase e fora de fase para o conjunto de teste.
ErrosRNA TAEF
Em Fase Fora de Fase Em Fase Fora de FaseMSE 0.0827 0.0830 8.4183e-4 2.6841e-5
MAPE (%) 0.3700 0.3788 1.1529 0.1993Theil 0.9878 0.9885 1.0006 0.0318
POCID (%) 46.7422 46.5909 47.5783 97.1429ARV 3.3877e-2 3.4204e-2 0.0346 0.0007AIC -2500.7 -2499.2 -2384.0349 -3408.4698BIC -2471.5 -2470.8 -1514.5357 -2713.3773
O procedimento de analise comportamental da fase de previsao novamente foi correto
em sua classificacao fora de fase. Um grafico comparativo entre os valores reais da serie
(linha solida) e a previsao (linha tracejada) gerada pelo metodo TAEF em ambas as
situacoes da fase e exibido na Figura 7.18. E possıvel notar a partir da Figura 7.19 que
o grafico de suposicao fora de fase apresenta uma previsao bastante superior ao grafico
que considera a situacao em fase.
0 50 100 150 200 250 300 3507000
7500
8000
8500
9000
9500
10000
10500Em Fase
Pontos − Conjunto de Teste
DJI
A
0 50 100 150 200 250 300 3507000
7500
8000
8500
9000
9500
10000
10500Fora de Fase
Pontos − Conjunto de Teste
DJI
A
Figura 7.18: Serie do Indice DJIA (linha solida) e as previsoes (linha tracejada) geradaspelo metodo TAEF para o conjunto de teste. O grafico superior e referente a suposicaode previsao em fase e o grafico inferior a suposicao de previsao fora de fase.
7.2 UMA NOVA PROPOSTA: METODO TAEF 153
260 270 280 290 300 310 320 330 340 3508000
8500
9000
9500Em Fase
Pontos − Conjunto de Teste
DJI
A
260 270 280 290 300 310 320 330 340 3508000
8500
9000
9500Fora de Fase
Pontos − Conjunto de Teste
DJI
A
Figura 7.19: Serie do Indice DJIA (linha solida) e as previsoes (linha tracejada) geradaspelo metodo TAEF para os ultimos 100 pontos do conjunto de teste. O grafico superiore referente a suposicao de previsao em fase e o grafico inferior a suposicao de previsaofora de fase.
7.2.3.5 Experimentos com a Serie do Indice Nasdaq
Para a serie do Indice Nasdaq, o procedimento de analise de fase temporal indica uma
previsao fora de fase, implicando no procedimento de correcao de fase para a tentativa
da correcao da distorcao.
Recalculando todos valores para as medidas de desempenho na suposicao de previsao
fora de fase e observada uma grande melhoria em relacao a situacao de previsao em fase
com a utilizacao do metodo TAEF. Para a RNA nenhuma melhoria e observada, como
mostra a Tabela 7.22.
O metodo TAEF (fora de fase) consegue um desempenho bastante superior a um
modelo do tipo Random Walk, como evidenciado pela estatıstica U de Theil (0.1726),
e bem superior ao comportamento tıpico de um experimento do tipo cara ou coroa,
alcancando um valor de POCID de 89.6338%.
Portanto, o procedimento de analise comportamental da fase de previsao incorporado
ao metodo foi capaz novamente de caracterizar corretamente a previsao. Este mesmo
procedimento aplicado a RNA nao apresentou nenhum benefıcio, caracterizando-a como
7.2 UMA NOVA PROPOSTA: METODO TAEF 154
Tabela 7.22: Resultados experimentais para a serie do Indice Nasdaq com as RNAs e ometodo TAEF na suposicao em fase e fora de fase fase para o conjunto de teste.
ErrosRNA TAEF
Em Fase Fora de Fase Em Fase Fora de FaseMSE 0.0022 0.0023 2.1449e-5 32374e-6
MAPE (%) 2.6988e-3 2.7001e-3 0.2012 0.0774Theil 1.1728 1.1759 1.1441 0.1726
POCID (%) 53.0641 53.9458 52.7091 89.6338ARV 3.4977e-3 3.5011e-3 0.0034 5.1500e-4AIC -22536.0 -22536.4 -22342.4331 -26310.0737BIC -22363.1 -22363.9 -21391.1870 -25358.8956
um modelo do tipo Random Walk.
Um grafico comparativo entre os valores reais da serie (linha solida) e a previsao
(linha tracejada) gerada pelo metodo TAEF em ambas as situacoes da fase e exibido na
Figura 7.20. Nota-se, a partir da Figura 7.21, que o grafico de suposicao fora de fase
apresenta uma previsao bastante superior ao grafico que considera a situacao em fase.
0 200 400 600 800 1000 1200 1400 1600 1800 20006.5
7
7.5
8
8.5
9Em Fase
Pontos − Conjunto de teste
Nas
daq
0 200 400 600 800 1000 1200 1400 1600 1800 20006.5
7
7.5
8
8.5
9Fora de Fase
Pontos − Conjunto de Teste
Nas
daq
Figura 7.20: Serie do Indice Nasdaq (linha solida) e as previsoes (linha tracejada) geradaspelo metodo TAEF para o conjunto de teste. O grafico superior e referente a suposicaode previsao em fase e o grafico inferior a suposicao de previsao fora de fase.
7.2 UMA NOVA PROPOSTA: METODO TAEF 155
2000 2010 2020 2030 2040 2050 2060 2070 2080 2090 21007.5
7.55
7.6
7.65
7.7
7.75Em Fase
Pontos − Conjunto de teste
Nas
daq
2000 2010 2020 2030 2040 2050 2060 2070 2080 2090 21007.5
7.55
7.6
7.65
7.7
7.75Fora de Fase
Pontos − Conjunto de Teste
Nas
daq
Figura 7.21: Serie do Indice Nasdaq (linha solida) e as previsoes (linha tracejada) geradaspelo metodo TAEF para os ultimos 100 pontos do conjunto de teste. O grafico superiore referente a suposicao de previsao em fase e o grafico inferior a suposicao de previsaofora de fase.
7.2.3.6 Experimentos com a Serie do Indice S&P500
Para a serie do Indice S&P500, o procedimento de analise da fase temporal da previsao
gerada indica uma previsao fora de fase, implicando no procedimento de correcao de fase.
Recalculando todos os valores para as medidas de desempenho na suposicao de pre-
visao fora de fase, nao se observa nenhuma melhoria significativa em relacao a situacao
de previsao em fase para ambos os metodos, sendo os valores alcancados para a carac-
terizacao fora de fase aproximadamente iguais aos valores obtidos para a suposicao em
fase. Todas as medidas de desempenho (conjunto de teste) para ambas as situacoes sao
apresentadas na Tabela 7.23.
O fato das medidas de desempenho nao alcancarem valores superiores em precisao
quando comparadas com a suposicao de previsao em fase pode ser explicado pela tendencia
existente na serie. Tal tendencia faz com que a previsao em fase se aproxime mais dos
pontos reais, diminuindo a distancia media entre os pontos reais e os pontos previstos.
Entretanto, para o metodo TAEF, quando observada a medida de POCID, a suposicao
em fase alcanca um valor de 50.5494%, contra um valor de 100.00% para a suposicao fora
7.2 UMA NOVA PROPOSTA: METODO TAEF 156
de fase. A medida ARV tambem indica que a suposicao fora de fase e mais adequada,
com um valor de 0.0012 contra 0.0100 para a suposicao em fase. Sob este angulo, o pro-
cedimento de analise comportamental da fase de previsao incorporado ao metodo TAEF
foi capaz novamente de caracterizar corretamente a previsao como fora de fase. Tal com-
portamento nao e observado para a RNA que apresenta desempenho insatisfatorio nas
duas hipoteses de previsao.
Tabela 7.23: Resultados experimentais para a serie do Indice S&P500 com as RNAs e ometodo TAEF nas suposicoes de previsao em fase e fora de fase para o conjunto de teste.
ErrosRNA TAEF
Em Fase Fora de Fase Em Fase Fora de FaseMSE 0.0095 0.0096 7.4290e-4 8.0263e-4
MAPE (%) 0.0100 0.0103 1.0431 1.0228Theil 0.9166 0.9179 7.24123 7.0883
POCID (%) 51.1111 50.9874 50.5494 100.00ARV 7.2728e-3 7.2875e-3 0.0100 0.0012AIC -741.0 -740.8 -632.8550 -628.6120BIC -561.9 -560.4 -580.0282 -585.9491
Um grafico comparativo entre os valores reais da serie (linha solida) e a previsao
(linha tracejada) gerada pelo metodo TAEF em ambas as situacoes da fase e exibido
na Figura 7.22. A partir deste, nota-se o problema da nao evolucao das medidas de
desempenho para a suposicao fora de fase gerada pela tendencia da serie.
7.2.3.7 Experimentos com a Serie do Valor de Fechamento das Acoes da
Petrobras
Para a serie do Valor de Fechamento das Acoes da Petrobras, o procedimento de analise
de fase indica uma previsao fora de fase, implicando no procedimento de correcao de fase.
Todas as medidas de desempenho para o conjunto de teste e para as situacoes em fase
e fora de fase sao apresentadas na Tabela 7.24. Observa-se que o metodo TAEF escolheu
corretamente a suposicao de previsao fora de fase como a melhor opcao. Ja para a RNA,
as duas suposicoes da fase nao apresentam nenhuma diferenca significativa, evidenciando
o comportamento do tipo Random Walk da rede.
Nota-se que o modelo atual para o metodo TAEF (fora de fase) apresenta um desem-
penho bastante superior a um modelo do tipo Random Walk, observando-se o valor da
estatıstica U de Theil (0.3023), e bem superior ao comportamento usual de um experi-
7.2 UMA NOVA PROPOSTA: METODO TAEF 157
0 10 20 30 40 50 60 70 80 907
7.5
8
8.5
9Em Fase
Pontos − Conjunto de Teste
S&
P50
0
0 10 20 30 40 50 60 70 80 907
7.5
8
8.5
9Fora de Fase
Pontos − Conjunto de Testes
S&
P50
0
Figura 7.22: Serie do Indice S&P500 (linha solida) e as previsoes (linha tracejada) geradaspelo metodo TAEF para o conjunto de teste. O grafico superior e referente a suposicaode previsao em fase, e o grafico inferior referente a suposicao de previsao fora de fase.
mento do tipo cara ou coroa, com o valor de POCID de 97.6834%.
Tabela 7.24: Resultados experimentais para a serie da Petrobras com as RNAs e o metodoTAEF nas suposicoes de previsao em fase e fora de fase para o conjunto de teste.
ErrosRNA TAEF
Em Fase Fora de Fase Em Fase Fora de FaseMSE 0.0095 0.0095 7.5951e-5 1.9049e-5
MAPE (%) 0.0100 0.0101 0.5480 0.2850Theil 1.5124 1.5130 1.2077 0.3023
POCID (%) 51.6378 51.6400 52.7938 97.6834ARV 0.0890 0.0895 0.0050 0.0019AIC -4713.4 -4713.4 -4286.4167 -4994.7414BIC -4445.5 -4445.5 -2589.4300 -3298.3765
E possıvel concluir que o procedimento de analise comportamental da fase de previsao
incorporado ao metodo TAEF foi capaz novamente de caracterizar e corrigir a fase da
previsao, o que nao ocorreu com o modelo da RNA.
Um grafico comparativo entre os valores reais da serie (linha solida) e a previsao
(linha tracejada) gerada pelo metodo TAEF em ambas as situacoes de fase e exibido na
Figura 7.23. Nota-se, a partir da Figura 7.24, que o grafico de suposicao fora de fase
7.2 UMA NOVA PROPOSTA: METODO TAEF 158
apresenta uma previsao superior ao grafico que considera a situacao em fase.
0 50 100 150 200 250 300 350 400 450 5003.4
3.6
3.8
4
4.2Em Fase
Pontos − Conjunto de Teste
Pet
robr
asO
N
0 50 100 150 200 250 300 350 400 450 5003.4
3.6
3.8
4
4.2Fora de Fase
Pontos − conjunto de Teste
Pet
robr
asO
N
Figura 7.23: Serie da Petrobras (linha solida) e a previsao gerada pelo metodo TAEF(linha tracejada) para o conjunto de teste. O grafico superior e referente a suposicao deprevisao em fase e o grafico inferior a suposicao de previsao fora de fase.
420 430 440 450 460 470 480 490 500 510 5203.75
3.8
3.85
3.9
3.95
4
4.05
4.1Em Fase
Pontos − Conjunto de Teste
Pet
robr
asO
N
420 430 440 450 460 470 480 490 500 5103.75
3.8
3.85
3.9
3.95
4
4.05
4.1Fora de Fase
Pontos − conjunto de Teste
Pet
robr
asO
N
Figura 7.24: Serie da Petrobras (linha solida) e as previsoes geradas pelo metodo TAEF(linha tracejada) para os ultimos 100 pontos do conjunto de teste. O grafico superior ereferente a suposicao de previsao em fase e o grafico inferior a de previsao fora de fase.
7.3 COMPARACOES COM OUTROS TRABALHOS 159
7.2.3.8 Experimentos com a Serie Random Walk
Para a serie Random Walk, o procedimento de analise da fase da previsao gerada indica
uma previsao fora de fase, o que leva a aplicacao do procedimento de correcao de fase.
Calculando os valores para as medidas de desempenho na suposicao de previsao fora de
fase para o conjunto de teste, e observada uma melhoria em relacao a situacao de previsao
em fase para o metodo TAEF. Ja para o modelo da RNA nenhuma diferenca significativa
e observada entre as suposicoes em fase e fora de fase. As medidas de desempenho para
as situacoes em fase e fora de fase sao apresentadas na Tabela 7.25.
Tabela 7.25: Resultados experimentais para a serie Random Walk com as RNAs e ometodo TAEF nas suposicoes de previsao em fase e fora de fase para o conjunto de teste.
ErrosRNAs TAEF
Em Fase Fora de Fase Em Fase Fora de FaseMSE 0.1313 0.1315 0.0009 9.9106e-5
MAPE (%) 0.2800 0.2875 5.4631 0.4345Theil 1.0454 1.050 1.1016 0.0784
POCID (%) 49.1935 49.2031 51.4170 97.5610ARV 4.8108e-2 4.7985 0.0767 0.0008AIC -1600.3 -1600.0 -1588.3290 -2037.1730BIC -1482.9 -1481.8 -854.5578 -1496.0464
E possıvel notar que o modelo atual do metodo TAEF (fora de fase) consegue ser
bem superior a propria suposicao do modelo Random Walk atraves do valor alcancado
pela estatıstica U de Theil (0.0784), e bem superior ao comportamento usual de um
experimento do tipo cara ou coroa, com um valor de POCID de 97.5610%. Este fato vem
a mostrar que o metodo TAEF consegue capturar o comportamento das componentes
aleatorias e caracterizar devidamente a serie.
Um grafico comparativo entre os valores reais da serie (linha solida) e a previsao
(linha tracejada) gerada pelo metodo TAEF em ambas as situacoes da fase e exibido na
Figura 7.25.
7.3 COMPARACOES COM OUTROS TRABALHOS
Os experimentos realizados permitiram evidenciar que o metodo TAEF consegue alcancar
um desempenho superior na resolucao do problema de previsao de series temporais, e, em
especial, para as series economicas e financeiras quando comparado as tecnicas examina-
7.3 COMPARACOES COM OUTROS TRABALHOS 160
0 50 100 150 20040
60
80
100
120
140Em Fase
Pontos − Conjunto de Teste
Ran
dom
Wal
k
0 50 100 150 20040
60
80
100
120
140Fora de Fase
Pontos − Conjunto de Teste
Ran
dom
Wal
k
Figura 7.25: Serie Random Walk (linha solida) e a previsao gerada pelo metodo TAEF(linha tracejada) para o conjunto de teste. O grafico superior e referente a suposicao deprevisao em fase e o grafico inferior a suposicao fora de fase.
das nos capıtulos anteriores.
Entretanto, uma vasta quantidade de trabalhos com diferentes tecnicas sao apresen-
tados na literatura com o mesmo fim, a previsao de series temporais. Desta forma,
naturalmente surge a indagacao de quao eficiente e o metodo TAEF frente aos outros
metodos e trabalhos existentes na literatura.
Para a serie do mapa de Henon, D. B. Murray [90] propos uma metodologia que, da
mesma forma que o metodo TAEF, tenta reconstruir o espaco de fase da serie atraves dos
retardos temporais relevantes. Murray, que utiliza uma serie do mapa de Henon identica
a utilizada aqui, em seu melhor caso, alcancou um erro MSE de 1.4e-5, desempenho bem
inferior ao valor de MSE de 3.1678e-11 alcancado pelo metodo TAEF para a mesma serie.
Para a serie das Manchas Solares N. Terui e H. K. Van Dijk [107] apresentaram
uma metodologia hıbrida que combinou modelos lineares e nao-lineares, dentre os quais,
modelos AR, TAR e Exp-AR. No trabalho de Terui e Dijk foi alcancado um valor de
MSE de 0.0390 para a previsao. Nas mesmas condicoes para a serie, o metodo TAEF
alcancou um MSE de 0.0086 para a previsao, sendo assim superior em desempenho ao
7.3 COMPARACOES COM OUTROS TRABALHOS 161
trabalho de Terui e Dijk.
Para a Serie do Indice Dow Jones Industrial Average, Li e Tsang [108] propuseram
uma metodologia chamada programacao genetica financeira (FGP - Financial Genetic
Programming) onde aplicaram a serie do Indice DJIA para a tomada de decisao de in-
vestimento baseada na previsao da serie. Seus resultados sao expressos em acertos ou
erros quanto a tomada de decisao, baseando-se em uma medida semelhante ao POCID,
alcancando uma taxa de acerto de 62.13%. Nesse sentido, considerando a medida de
POCID = 97.1429% alcancada pelo Metodo TAEF, ha um acrescimo muito significativo
na taxa de acerto para a tomada de decisao, tornando o metodo TAEF mais eficiente.
Para a serie S&P500, C. A. Casas [109] propos um trabalho baseado em redes neurais
para a previsao desta serie, alcancando um MSE de 0.0012. Vale ressaltar que neste
trabalho Casas utilizou um conjunto de dados com apenas 48 pontos, sendo 90% destes
utilizados para o treinamento e 10% para teste. Com uma serie bem mais complexa, e
com a utilizacao de tres conjuntos de dados (treinamento, validacao e teste), o metodo
TAEF apresentou resultados de previsao superiores, com um MSE de 8.0263e-4, calculado
sobre um conjunto muito maior de dados.
Para as demais series temporais investigadas nao foram encontrados trabalhos que
realizem experimentos de previsao. Entretanto, os valores alcancados, quando compara-
dos a modelos do tipo Random Walk (atraves da medida da estatıstica U de Theil) e
modelos medios (atraves da medida ARV), implicam que o metodo TAEF e uma opcao
valida de alto desempenho de previsao.
CAPITULO 8
INVESTIGACOES COMPLEMENTARES AO METODO
TAEF
Neste capıtulo e apresentado um conjunto adicional de experimentos com o metodo TAEF
utilizando varias series artificiais de alta complexidade.
Este novo grupo de experimentos vem a consolidar o desempenho de previsao ja
alcancado pelo metodo TAEF, comprovando a sua eficiencia para um grupo de carac-
terısticas nao-lineares de alta complexidade comumente encontradas em series temporais
do mundo real.
8.1 INTRODUCAO
Varios experimentos foram realizados com as series apresentadas no Capıtulo 4. Em
todos os casos o metodo TAEF apresentou-se como a opcao de melhor desempenho de
previsao.
Contudo, o conjunto de series apresentadas, embora sejam de alta complexidade e de
relevancia em situacoes do mundo real, nao apresentam todas as possıveis caracterısticas
que uma serie temporal pode vir a possuir, dentre as quais, tendencias, sazonalidades,
transientes, mudanca de modelos, dependencias entre os retardos temporais com decai-
mento exponencial, heterocedasticidade, dentre outras.
Desta forma, foi realizado um grupo de experimentos adicionais com o metodo TAEF
para a verificacao de seu desempenho com series artificiais de alta complexidade que
contenham varias das caracterısticas citadas acima, como:
1. Serie Random Walk com drift [110], sazonalidade e drift com sazonalidade;
2. Series com Heterocedasticidade, modelos GARCH [7,8];
3. Modelos SETAR [25];
162
8.2 FAMILIA DE SERIES DO TIPO RANDOM WALK 163
4. Modelos STAR [111].
8.2 FAMILIA DE SERIES DO TIPO RANDOM WALK
Como uma primeira aproximacao, modelos do tipo Random Walk sao utilizados para a
representacao de series economicas e financeiras [110]. Entretanto, as series economicas
e financeiras associadas a um modelo do tipo Random Walk quase sempre apresentam
caracterısticas adicionais, como tendencias e/ou sazonalidades.
Neste sentido, foram montadas artificialmente famılias de series temporais do tipo
Random Walk : 1. series do tipo Random Walk com drift – Equacao (.); 2. series do
tipo Random Walk com sazonalidade aditiva – Equacao (.); e 3. series do tipo Random
Walk com drift e sazonalidade aditiva – Equacao (.).
Zt = Zt−1 + θ + rt (.)
Zt = Zt−1 + sin(2πFt) + rt (.)
Zt = Zt−1 + θ + sin(2πFt) + rt (.)
onde θ e o termo de drift, F e o termo de frequencia e rt e o termo de ruıdo.
8.2.1 Famılia de Series Random Walk com Drift
A famılia de series do tipo Random Walk com drift e composta por seis series tem-
porais, onde o termo de drift (θ) variou no intervalo [0,1], assumindo os valores θ =
0.0, 0.2, 0.4, 0.6, 0.8, 1.0.
Todas as series geradas tem 1000 pontos, onde o primeiro ponto e sempre igual a zero
(Z0 = 0) e o termo de ruıdo guiado por uma distribuicao gaussiana de media zero e desvio
padrao 10 (rt ∼ N(0, 10)).
A Tabela 8.1 mostra os parametros escolhidos pelo metodo TAEF para cada uma das
series caracterizadas pelos seus respectivos termos de drift, sendo apresentados os retardos
8.2 FAMILIA DE SERIES DO TIPO RANDOM WALK 164
Tabela 8.1: Configuracoes escolhidas pelo metodo TAEF para a famılia de series do tipoRandom Walk com drift.
Serie Retardos Neuronios Escondidos Algoritmo Previsao
Drift 0.0 2,3,5 15 Levenberg-Marquardt Fora de FaseDrift 0.2 2,5,6,8,9,10 8 Gradiente Conjugado Fora de FaseDrift 0.4 2,3,4,5,7,8 2 Levenberg-Marquardt Fora de FaseDrift 0.6 2,3,6,7 10 Gradiente Conjugado Fora de FaseDrift 0.8 2,3,6,7 4 Levenberg-Marquardt Fora de FaseDrift 1.0 2,3,6,7,8,9 12 Levenberg-Marquardt Fora de Fase
temporais utilizados, a quantidade de neuronios escondidos, o algoritmo de aprendizagem
eleito e a classificacao da previsao em fase ou fora de fase.
Na Tabela 8.2 sao exibidos os resultados para as medidas de desempenho para todas
as series da famılia Random Walk com drift para ambos os casos de previsao em fase e
previsao fora de fase, onde as previsoes fora de fase apresentam-se superiores.
Tabela 8.2: Resultados experimentais para as series da famılia de Random Walk comdrift.
Series PrevisaoMedidas de Desempenho
MSE MAPE U of Theil POCID ARV AIC BIC
Drift 0.0Em Fase 0.0009 5.46% 1.1016 51.42% 0.0767 -1588.3 -79.4
Fora de Fase 2.7178 · 10−5 1.04% 0.0290 97.96% 0.0023 -2444.7 -2102.0
Drift 0.2Em Fase 0.0009 3.53% 0.4241 51.22% 0.0671 -1704.5 -1686.4
Fora de Fase 4.5431 · 10−5 0.6965% 0.0527 97.14% 0.0035 -2425.8 -2349.2
Drift 0.4Em Fase 0.0004 2.11% 0.2826 49.80% 0.0485 -1650.2 -680.7
Fora de Fase 4.9884 · 10−5 0.59% 0.1211 97.15% 0.0054 -2178.7 -1574.5
Drift 0.6Em Fase 0.0002 1.50% 0.0675 52.23% 0.0345 -1950.8 -1291.2
Fora de Fase 2.1655 · 10−5 0.44% 0.0960 97.97% 0.0029 -2530.8 -2255.8
Drift 0.8Em Fase 0.0001 1.26% 0.3778 52.63% 0.0275 -2145.2 -2038.9
Fora de Fase 3.7601 · 10−5 0.56% 0.2670 97.56% 0.0057 -2466.6 -2353.8
Drift 1.0Em Fase 9.3751 · 10−5 1.13% 2.7337 52.44% 0.0250 -2096.9 -1197.3
Fora de Fase 5.0811 · 10−5 0.68% 0.5278 96.73% 0.0084 -2238.3 -1801.3
Na Figura 8.1 sao apresentados graficos comparativos entre as series da famılia Ran-
dom Walk com drift (linhas solidas) e suas respectivas previsoes (linhas tracejadas) ge-
radas pelos modelos eleitos com o metodo TAEF. Para cada uma das series e mostrado
um grafico na hipotese de previsao em fase (grafico superior) e um grafico na hipotese de
previsao fora de fase (grafico inferior).
8.2 FAMILIA DE SERIES DO TIPO RANDOM WALK 165
0 50 100 150 200 250−50
0
50
100
150Em Fase
Conjunto de Teste
Ran
dom
Wal
k
0 50 100 150 200 250−50
0
50
100
150Fora de Fase
Ran
dom
Wal
k
Conjunto de Teste
(a) Drift = 0.0
0 50 100 150 200 25050
100
150
200
250
300Em Fase
Conjunto de Teste
Ran
dom
Wal
k D
rift 0
.3
0 50 100 150 200 25050
100
150
200
250
300Fora de Fase
Conjunto de Teste
Ran
dom
Wal
k D
rif 0
.2
(b) Drift = 0.2
0 50 100 150 200 250250
300
350
400
450
500
550 Em Fase
Conjunto de Teste
Ran
dom
Wal
k D
ritft
0.4
0 50 100 150 200 250250
300
350
400
450
500
550Fora de Fase
Ran
dom
Wal
k D
rift 0
.4
(c) Drift = 0.4
0 50 100 150 200 250400
450
500
550
600
650
700Em Fase
Conjunto de Teste
Ran
dom
Wal
k D
rift 0
.6
0 50 100 150 200 250400
450
500
550
600
650
700Fora de Fase
Conjunto de Teste
Ran
dom
Wal
k D
rift 0
.6
(d) Drift = 0.6
0 50 100 150 200 250550
600
650
700
750
800
850
900Em Fase
Conjunto de Teste
Ran
dom
Wal
k D
rift 0
.8
0 50 100 150 200 250550
600
650
700
750
800
850
900Fora de Fase
Conjunto de Teste
Ran
dom
Wal
k D
rift 0
.8
(e) Drift = 0.8
0 50 100 150 200 250700
800
900
1000
1100Em Fase
Conjunto de Teste
Ran
dom
Wal
k D
rift 1
.0
0 50 100 150 200 250700
800
900
1000
1100Fora de Fase
Conjunto de Teste
Ran
dom
Wal
k D
rift 1
.0
(f) Drift = 1.0
Figura 8.1: Series Random Walk com drift. Para todas as figuras, hipoteses de previsaoem fase (grafico superior) e previsao fora de fase (grafico inferior). As linhas solidas saoos dados reais e as linhas tracejadas sao as previsoes.
8.2 FAMILIA DE SERIES DO TIPO RANDOM WALK 166
8.2.2 Famılia de Series Random Walk com Sazonalidade Aditiva
A famılia de Series Random Walk com Sazonalidade e composta por cinco series, onde a
frequencia F assume os valores 17, 1
15, 1
30, 1
90e 1
180por unidade de tempo. Se a unidade de
tempo considerada for “dia”, obtem-se perıodos de uma semana, quinze dias, um mes,
tres meses e seis meses, respectivamente.
Todas as series geradas sao compostas por 1000 pontos, seguindo a Equacao (.),
com Z0 = 0 e termo de ruıdo (rt) guiado por uma distribuicao gaussiana de media nula
e desvio padrao 10 (rt ∼ N(0, 10)). A Tabela 8.3 mostra os valores dos parametros
escolhidos pelo metodo TAEF para cada uma das series.
Tabela 8.3: Configuracoes alcancadas pelo metodo TAEF para a famılia de Series RandomWalk com Sazonalidade Aditiva.
Frequencia Retardos Neuronios Escondidos Algoritmo Previsao17 3,8,9,10,11 1 Levenberg-Marquardt Fora de Fase115 3,4,6,10,12 6 Gradiente Conjugado Fora de Fase130 2,4,7,10,13 3 Levenberg-Marquardt Fora de Fase190 4,9,10 4 Levenberg-Marquardt Fora de Fase1
180 2,3,4,5,10,11,12 10 Gradiente Conjugado Fora de Fase
Na Tabela 8.4 sao exibidos os resultados obtidos pelo metodo TAEF para todas as
series da famılia para ambos os casos de hipoteses de previsao, em fase e fora de fase.
Tabela 8.4: Resultados obtidos pelo metodo TAEF para a famılia de Series Random Walkcom Sazonalidade Aditiva.
Frequencia HipoteseMedias de Desempenho
MSE MAPE U of Theil POCID ARV AIC BIC
17
Em Fase 0.0007 2.74% 1.0863 60.98% 0.0794 -1795.2 -1791.7Fora de Fase 0.0002 1.52% 0.2827 86.94% 0.0257 -2066.2 -2030.2
115
Em Fase 0.0008 3.01% 0.4611 67.07% 0.0767 -1672.0 -1445.6Fora de Fase 0.0004 2.10% 0.4500 88.57% 0.0377 -1862.7 -1669.0
130
Em Fase 0.0006 2.84% 1.4326 63.01% 0.0441 -1788.1 -1734.5Fora de Fase 0.0003 2.02% 0.4262 91.84% 0.0221 -1949.5 -1850.4
190
Em Fase 0.0003 2.29% 1.0901 57.89% 0.0103 -1952.2 -1837.8Fora de Fase 0.0001 1.40% 0.2812 94.72% 0.0034 -2210.6 -2115.9
1180
Em Fase 0.0001 3.12% 0.5251 71.54% 0.0518 -2030.0 -1430.9Fora de Fase 6.8244 · 10−4 1.26% 0.3851 96.32% 0.0012 -2177.7 -1767.7
A Figura 8.2 mostra alguns graficos comparativos entre os dados reais (linha solida)
e as respectivas previsoes (linha traceja) realizadas pelo metodo TAEF para os conjuntos
de testes de todas as series da famılia Random Walk com sazonalidade aditiva, tanto na
suposicao de previsao em fase quanto na fora de fase.
8.2 FAMILIA DE SERIES DO TIPO RANDOM WALK 167
0 50 100 150 200 250−20
−10
0
10
20
30
40
50Em Fase
Conjunto de Teste
Ran
dom
Wal
k (F
=1/
7)
0 50 100 150 200 250−20
−10
0
10
20
30
40
50Fora de Fase
Conjunto de Teste
Ram
dom
Wal
k (F
=1/
7)
(a) Frequencia = 1
7
0 50 100 150 200 250−20
0
20
40
60Em Fase
Conjunto de Teste
Ran
dom
Wal
k (F
=1/
15)
0 50 100 150 200 250−20
0
20
40
60Fora de Fase
Conjunto de Teste
Ran
dom
Wal
k (F
=1/
15)
(b) Frequencia = 1
15
0 50 100 150 200 250−20
0
20
40
60
80Em Fase
Conjunto de Teste
Ran
dom
Wal
k (F
=1/
30)
0 50 100 150 200 250−20
0
20
40
60
80Fora de Fase
Conjunto de Teste
Ran
dom
Wal
k (F
=1/
30)
(c) Frequencia = 1
30
0 50 100 150 200 250−20
0
20
40
60
80
100
120Em Fase
Conjunto de Teste
Ran
dom
Wal
k (F
=1/
90)
0 50 100 150 200 250−20
0
20
40
60
80
100
120Fora de Fase
Conjunto de Teste
Ran
dom
Wal
k (F
=1/
90)
(d) Frequencia = 1
90
0 50 100 150 200 250−50
0
50
100
150
200
250Em Fase
Conjunto de Teste
Ran
dom
Wal
k (F
=1/
180)
0 50 100 150 200 250−50
0
50
100
150
200
250Fora de Fase
Conjunto de Teste
Ram
dom
Wal
k (F
=1/
180)
(e) Frequencia = 1
180
Figura 8.2: Series Random Walk com Sazonalidade Aditiva. Sao exibidas as hipotesede previsao em fase (grafico superior) e previsao fora de fase (grafico inferior) para osconjuntos de teste. As linhas solidas sao os dados reais e as linhas tracejadas as previsoes.
8.2 FAMILIA DE SERIES DO TIPO RANDOM WALK 168
8.2.3 Famılia de Series Random Walk com Drift e Sazonalidade Aditiva
A famılia de Series Random Walk com drift e sazonalidade aditiva e composta por cinco
series temporais, de acordo com a Equacao (.), onde o termo de frequencia F assume
os mesmos valores da Secao 8.2.2 ( 17, 1
15, 1
30, 1
90e 1
180) e termo de drift constante, θ = 0.8.
Todas as series sao compostas por 1000 pontos gerados pela Equacao (.), com Z0 = 0
e termo de ruıdo guiado por uma distribuicao gaussiana de media zero e desvio padrao 10
(rt ∼ N(0, 10)). Na Tabela 8.5 sao exibidos os parametros escolhidos pelo metodo TAEF
para cada uma das series.
Tabela 8.5: Configuracoes alcancadas pelo metodo TAEF para a famılia de Series RandomWalk com Drift (θ = 0.8) e Sazonalidade Aditiva.
Frequencia Retardos Neuronios Escondidos Algoritmo Previsao17 8 19 Gradiente Conjugado Fora de Fase115 3,4,5,6,8,9 14 Levenberg-Marquardt Fora de Fase130 1 20 Levenberg-Marquardt Fora de Fase190 2,4,11,12,14,15 20 Levenberg-Marquardt Fora de Fase1
180 5,6,8,10,11,12 20 Levenberg-Marquardt Fora de Fase
Na Tabela 8.6 sao mostrados os resultados do metodo TAEF para todas as series da
famılia Random Walk com drift e sazonalidade aditiva, para o conjunto de teste.
Tabela 8.6: Resultados obtidos pelo metodo TAEF para o conjunto de teste das seriesda famılia Random Walk com Drift e Sazonalidade aditiva.
Frequencia HipoteseMedidas de Desempenho
MSE MAPE U of Theil POCID ARV AIC BIC
17
Em Fase 8.2950 · 10−4 0.87% 2.5866 56.85% 0.0183 -2163.9 3519.3Fora de Fase 5.2422 · 10−4 0.75% 0.0007 100.00% 0.0116 -2268.3 -1871.2
115
Em Fase 0.0003 0.54% 0.3451 69.23% 0.0078 -1925.8 -1779.9Fora de Fase 7.0000 · 10−5 0.24% 0.3064 88.21% 0.0016 -2851.7 -2666.8
130
Em Fase 0.0002 3.09% 0.3471 64.92% 0.0519 -1925.0 5846.3Fora de Fase 4.0000 · 10−5 0.19% 0.0062 100.00% 0.0003 -2855.4 -2390.5
190
Em Fase 6.5889 · 10−5 0.62% 7.4867 59.18% 0.0121 -1582.4 13888.4Fora de Fase 3.1126 · 10−5 0.49% 1.9211 80.33% 0.0075 -1756.7 12.5
1180
Em Fase 0.0002 1.12% 1.9050 70.73% 0.0174 -1259.3 1971.7Fora de Fase 9.2301 · 10−5 0.98% 0.9373 97.14% 0.0133 -1371.7 68.7
Na Figura 8.3 sao exibidos graficos comparativos entre os dados reais (linhas solidas)
e as suas respectivas previsoes (linhas tracejadas) realizadas pelo metodo TAEF para os
respectivos conjuntos de teste. Ambas as hipoteses de previsao em fase (grafico superior)
e previsao fora de fase (grafico inferior) sao mostradas.
8.2 FAMILIA DE SERIES DO TIPO RANDOM WALK 169
0 50 100 150 200 250600
650
700
750
800
850Em Fase
Conjunto de Teste
Ran
dom
Wal
k
0 50 100 150 200 250600
650
700
750
800
850Fora de Fase
Conjunto de Teste
Ran
dom
Wal
k
(a) Frequencia = 1
7
0 50 100 150 200 250600
650
700
750
800
850Em Fase
Conjunto de Teste
Ran
dom
Wal
k
0 50 100 150 200 250600
650
700
750
800
850Fora de Fase
Conjunto de Teste
Ran
dom
Wal
k
(b) Frequencia = 1
15
0 50 100 150 200 250600
650
700
750
800
850Em Fase
Conjunto de Teste
Ran
dom
Wal
k
0 50 100 150 200 250600
650
700
750
800
850Fora de Fase
Conjunto de Teste
Ran
dom
Wal
k
(c) Frequencia = 1
30
0 50 100 150 200 250650
700
750
800
850
900Em Fase
Conjunto de Teste
Ran
dom
Wal
k
0 50 100 150 200 250650
700
750
800
850
900Fora de Fase
Conjunto de Teste
Ran
dom
Wal
k
(d) Frequencia = 1
90
0 50 100 150 200 250650
700
750
800
850
900
950
1000Em Fase
Conjunto de Teste
Ran
dom
Wal
k
0 50 100 150 200 250650
700
750
800
850
900
950
1000Fora de Fase
Conjunto de Teste
Ran
dom
Wla
k
(e) Frequencia = 1
180
Figura 8.3: Series Random Walk com Drift e Sazonalidade Aditiva. Sao exibidos graficosna hipotese de previsao em fase (grafico superior) e fora de fase (grafico inferior) para osconjuntos de teste. As linhas solidas sao os dados reais e as linhas tracejadas as previsoes.
8.3 FAMILIA DE SERIES DOS MODELOS GARCH 170
8.3 FAMILIA DE SERIES DOS MODELOS GARCH
De forma simplista, os modelos GARCH (General Autoregressive Conditional Heterosce-
dasticity) sao relatados a situacoes onde ha a necessidade da descricao de uma funcao de
variancia dependente do tempo, isto e, algum processo de volatidade.
Os modelos GARCH foram desenvolvidos por Bollerslev [8] como uma generalizacao
de uma outra famılia de modelos, chamados modelos ARCH (Autoregressive Conditional
Heteroscedasticity) [7], no intuito de oferecer uma metodologia mais parcimoniosa e de
menor custo computacional como ja descrito no Capıtulo 2.
Os modelos GARCH sao usualmente aplicados a series de retornos. As series de
retornos sao simplesmente as diferencas entre os valores sobre o tempo t e o tempo t− 1
de uma dada serie temporal, caracterizando a variacao da serie entre duas observacoes
consecutivas. Quando este procedimento e aplicado as series economicas e financeiras,
como por exemplo dados historicos de cotacoes de acoes em bolsas de valores, este informa
o retorno (ganho ou perda) que a acao gerou.
Assim, faca uma serie de retorno ser dada por,
xt = C + rt (.)
onde C e uma constante e rt um termo de ruıdo branco, tambem chamado de inovacao.
A variacao condicional deste inovacao e, por definicao,
V art−1(xt) = Et−1(r2t ) = σ2
t (.)
onde Et−1 denota o valor esperado condicional sobre o passado do processo ate o tempo
t − 1.
O modelo generico GARCH(P, Q) para a variancia condicional das inovacoes e dado
por,
σ2t = κ +
P∑
i=1
giσ2t−i +
Q∑
j=1
ajr2t−j (.)
com os vınvulos,P∑
i=1
gi +
Q∑
j=1
aj < 1;
8.3 FAMILIA DE SERIES DOS MODELOS GARCH 171
κ > 0;
gi ≥ 0 para i = 1, 2, 3, . . . , P ;
aj ≥ 0 para j = 1, 2, 3, . . . , Q
Desta forma, quatro modelos GARCH foram criados GARCH(1,1), GARCH(1,2),
GARCH(2,1) and GARCH(2,2). Para todos os modelos gerados foi considerado o valor
da constante condicional como 1 (κ = 1). O modelo GARCH(1,1) foi ajustado com
g1 = 0.3 e a1 = 0.4; o modelo GARCH(1,2) com g1 = 0.3, a1 = 0.4 e a2 = 0.2; o modelo
GARCH(2,1) g1 = 0.39, g2 = 0.18 e a1 = 0.25; e o modelo GARCH(2,2) com g1 = 0.18,
g2 = 0.25, a1 = 0.1 e a2 = 0.34.
Seguindo estes modelos, foram criados conjuntos de dados contendo 1000 pontos cada.
A partir destes conjuntos, considerados como series de retornos, as series temporais foram
construıdas. O valor inicial considerado para a elaboracao de todas as series foi Z0 = 0
e todos os demais pontos foram dados por,
Zt = xt + Zt−1 (.)
onde xt e o ponto sobre o tempo t das series de retornos (Equacao (.)).
Na Tabela 8.7 sao exibidos os parametros eleitos pelo metodo TAEF para cada uma
das series geradas a partir dos modelos GARCH, onde a primeira coluna representa o
modelo de origem da serie.
Tabela 8.7: Configuracoes alcancadas pelo metodo TAEF para a famılia de Series dosModelos GARCH.
Serie Retardos Neuronios Escondidos Algoritmo Previsao
GARCH(1,1) 4,6,8,10,11 15 RProP Fora de FaseGARCH(1,2) 2,3,4,5 8 Gradiente Conjugado Fora de FaseGARCH(2,1) 4,5,6,8 15 Um Passo Secante Fora de FaseGARCH(2,2) 2 13 Um Passo Secante Fora de Fase
Na Tabela 8.8 sao mostrados os resultados alcancados pelo metodo TAEF para toda
a famılia de series dos modelos GARCH, considerando os respectivos conjuntos de testes.
Todas as medidas sao calculadas para ambas as suposicoes de previsao em fase e previsao
fora de fase. E possıvel notar que o metodo TAEF classifica corretamente a previsao das
series.
8.4 FAMILIA DE SERIES DOS MODELOS SETAR 172
Tabela 8.8: Resultados para as medidas de desempenho alcancados pelo metodo TAEFpara a famılia de Series dos Modelos GARCH.
Series HipoteseMedidas de Desempnho
MSE MAPE U of Theil POCID ARV AIC BIC
GARHC(1,1)Em Fase 0.0005 10.96% 0.3187 51.82% 0.0424 -1653.4 -204.5
Fora de Fase 2.100 · 10−5 2.58% 0.0403 95.53% 0.0017 -2447.4 -1969.4
GARHC(1,2)Em Fase 0.0009 3.28% 3.2783 50.00% 0.0258 -1650.8 -1227.4
Fora de Fase 6.0000 · 10−5 1.03% 0.0643 97.16% 0.0017 -2314.6 -2093.4
GARHC(2,1)Em Fase 0.0012 4.05% 22.6936 51.42% 0.0624 -1459.8 438.0
Fora de Fase 0.0004 2.38% 0.5457 93.09% 0.0226 -1712.1 -1247.6
GARHC(2,2)Em Fase 0.0011 20.97% 1.4075 52.63% 0.0601 -1611.6 -421.5
Fora de Fase 6.0000 · 10−6 2.90% 0.0136 100.00% 0.0008 -2901.7 -2721.4
Na Figura 8.4 sao expostos graficos comparativos entre as series geradas a partir dos
modelos GARCH (linhas solidas) e as respectivas previsoes (linhas tracejadas) geradas
pelo metodo TAEF, tanto na suposicao de previsao em fase (grafico superior) como na
previsao fora de fase (grafico inferior).
8.4 FAMILIA DE SERIES DOS MODELOS SETAR
Os modelos SETAR (Self-Exciting Threshold Autoregressive) assumem que o domınio
de uma variavel Zt pode ser dividido em varios subdomınios. Em cada um destes sub-
domınios, a variavel e regida por um modelo auto-regressivo linear. Sendo a variavel Zt
uma serie temporal, esta pode sofrer uma mudanca de modelo, dependendo dos valores
assumidos por um determinado retardo temporal Zt−β, sendo β uma constante.
Para medir a capacidade do Metodo TAEF de prever series com mudanca de modelos,
uma famılia de series do modelo SETAR, composta por quatro series, foi gerada. A
primeira serie (SETAR1) e dada por,
Zt =
0.95Zt−1 + rt, Se |Zt−1| ≥ 7
−0.95Zt−1 + rt, Caso Contrario.(.)
onde o primeiro termo e Z0 = 0 e o termo de ruıdo (rt) e guiado por uma distribuicao
gaussiana (rt ∼ N(0, 0.0625)).
A segunda serie da famılia (SETAR2) e dada pela Equacao (.),
8.4 FAMILIA DE SERIES DOS MODELOS SETAR 173
0 50 100 150 200 250−220
−200
−180
−160
−140
−120
−100
−80
Conjunto de Teste
GA
RC
H(1
,1)
0 50 100 150 200 250−220
−200
−180
−160
−140
−120
−100
−80Fora de Fase
Conjunto de Teste
GA
RC
H(1
,1)
(a) GARCH(1,1)
0 50 100 150 200 250−600
−400
−200
0
200Em Fase
Conjunto de Teste
GA
RC
H(1
,2)
0 50 100 150 200 250−600
−400
−200
0
200Fora de Fase
Conjunto de Teste
GA
RC
H(1
,2)
(b) GARCH(1,2)
0 50 100 150 200 250−400
−200
0
200
400
600Em Fase
Conjunto de Teste
GA
RC
H(2
,1)
0 50 100 150 200 250−400
−200
0
200
400
600Fora de Fase
Conjunto de Teste
GA
RC
H(2
,1)
(c) GARCH(2,1)
0 50 100 150 200 250−400
−350
−300
−250
−200
−150
−100Em Fase
Conjunto de Teste
GA
RC
H(2
,2)
0 50 100 150 200 250−400
−350
−300
−250
−200
−150
−100Fora de Fase
Conjunto de Teste
GA
RC
H(2
,2)
(d) GARCH(2,2)
Figura 8.4: Famılia de Series Temporais geradas com os modelos GARCH. As figurasmostram graficos comparativos entre os dados reais (linhas solidas) e suas respectivasprevisoes (linhas tracejadas) para o conjunto de teste.
Zt =
0.2 + 0.8Zt−1 + rt, if |Zt−1 − Zt−2| ≥ 0.2
0.2 − 0.4Zt−1 + rt, Caso Contrario.(.)
onde o primeiro e segundo termos sao Z0 = 0 e Z1 = 0.02, respectivamente, e o termo de
ruıdo (rt) e guiado por uma distribuicao gaussiana (rt ∼ N(0, 0.001)).
A terceira (SETAR3) e quarta (SETAR4) serie da famılia sao dadas respectivamente
pelas Equacoes (.) e (.),
8.4 FAMILIA DE SERIES DOS MODELOS SETAR 174
Zt =
0.5 + 0.8Zt−1 + rt, Se Zt−2 ≤ 0 e Zt−2 − Zt−1 > 0
0.5 − 0.8Zt−1 + rt, Se Zt−2 ≤ 0 e Zt−2 − Zt−1 ≤ 0
−0.5 + 0.8Zt−1 + rt, Se Zt−2 > 0 e Zt−2 − Zt−1 > 0
0.5 − 0.8Zt−1 + rt, Demais Casos.
(.)
Zt =
0.5 + 0.8Zt−1 + rt, Se Zt−3 − Zt−2 ≤ 0 e Zt−2 − Zt−1 > 0
0.5 − 0.8Zt−1 + rt, Se Zt−3 − Zt−2 ≤ 0 e Zt−2 − Zt−1 ≤ 0
−0.5 + 0.8Zt−1 + rt, Se Zt−3 − Zt−2 > 0 e Zt−2 − Zt−1 > 0
−0.5 − 0.8Zt−1 + rt, Demais Casos.
(.)
onde o primeiro, segundo e terceiro termos sao dados respectivamente por Z0 = 0, Z1 =
0.02 and Z3 = −0.01. O termo de ruıdo e guiado por uma distribuicao gaussiana –
rt ∼ N(0, 1).
Com todas as quatro Equacoes foram gerados 3000 pontos, onde somente os ultimos
1000 pontos foram utilizados para a confeccao das series da Famılia, de forma a evitar
qualquer efeito de transiente inicial.
Na Tabela 8.9 sao expostas as configuracoes alcancadas pelo metodo TAEF para cada
uma das quatro series do modelos SETAR.
Tabela 8.9: Configuracoes alcancadas pelo Metodo TAEF para a famılia de Series dosModelos SETAR.
Serie Retardos Neuronios Escondidos Algoritmo Previsao
SETAR1 3,6 4 Levenberg-Marquardt Em FaseSETAR2 8,9 8 Gradiente Conjugado Em FaseSETAR3 2,3,7,8 11 Gradiente Conjugado Em FaseSETAR4 2 14 Levenberg-Marquardt Fora de Fase
A Tabela 8.10 ilustra todos os resultados obtidos com o metodo TAEF para a famılia
das Series dos Modelos SETAR no contexto dos conjuntos de teste, mostrando todos os
valores para as medidas de desempenho, tanto na hipotese de previsao em fase como de
previsao fora de fase.
Na Figura 8.5 sao apresentados graficos comparativos entre os dados reais das series
(linhas solidas) e as previsoes (linhas tracejadas) geradas pelo metodo TAEF para os
respectivos conjuntos de teste em ambas as hipoteses de previsao em fase e fora de fase.
8.4 FAMILIA DE SERIES DOS MODELOS SETAR 175
Tabela 8.10: Resultados obtidos pelo metodo TAEF para a famılia das Series dos ModelosSETAR para os respectivos conjuntos de teste.
Series HipotesesMedidas de Desempenho
MSE MAPE U of Theil POCID ARV AIC BIC
SETAR1Em Fase 0.0032 9.43% 0.0033 73.68% 0.1191 -1393.6 -1271.3
Fora de Fase 0.0133 17.89% 0.8524 42.68% 0.4994 -1032.8 -956.2
SETAR2Em Fase 0.0094 124.51% 0.0875 73.28% 0.4195 -1091.5 -636.5
Fora de Fase 0.0257 108.04% 0.7186 32.11% 1.1603 -837.9 -689.0
SETAR3Em Fase 0.0147 29.53% 0.0011 78.54% 0.5379 -925.0 -265.4
Fora de Fase 0.0528 52.04% 0.7456 26.02% 1.8699 -604.3 -329.3
SETAR4Em Fase 0.0190 28.71% 1.0291 43.32% 0.7195 -909.2 111.0
Fora de Fase 0.0079 17.41% 0.3248 100.00% 0.3047 -1121.7 -954.88
0 50 100 150 200 250−2
−1
0
1
2
3Em Fase
Conjunto de Teste
SE
TA
R1
0 50 100 150 200 250−2
−1
0
1
2
3Fora de Fase
Conjunto de Teste
SE
TA
R1
(a) SETAR1
0 50 100 150 200 250−0.4
−0.2
0
0.2
0.4
0.6
0.8
1Em Fase
Conjunto de Teste
SE
TA
R2
0 50 100 150 200 250−0.4
−0.2
0
0.2
0.4
0.6
0.8
1Fora de Fase
Conjunto de Teste
SE
TA
R2
(b) SETAR2
0 50 100 150 200 250−5
0
5Em Fase
Conjunto de Teste
SE
TA
R3
0 50 100 150 200 250−5
0
5Fora de Fase
Conjunto de Teste
SE
TA
R3
(c) SETAR3
0 50 100 150 200 250−6
−4
−2
0
2
4
6Em Fase
Conjunto de Teste
SE
TA
R4
0 50 100 150 200 250−6
−4
−2
0
2
4
6Fora de Fase
Conjunto de Teste
SE
TA
R4
(d) SETAR4
Figura 8.5: Famılia das Series dos Modelos SETAR. Em todas as figuras sao expostas acomparacao entre os dados reais (linhas solidas) e as previsoes (linhas tracejadas) geradaspara o conjunto de teste. O graficos superiores representam a suposicao de previsao emfase e os inferiores a previsao fora de fase.
8.5 SERIE GERADA PELO MODELO STAR 176
8.5 SERIE GERADA PELO MODELO STAR
Uma possıvel variacao do modelo SETAR e o modelo STAR (Smooth Threshold Autore-
gressive), que segue a expressao geral,
Zt = α0 + α1 + (β0 + β1)F (Zt−d) + rt (.)
onde d, α0 e β0 sao constantes, α1 = (Zt−1Zt−2, . . . , Zt−p), β1 = (β11, β12, . . . , β1p) – vetor
de constantes, F (·) e uma funcao de transicao e rt e um termo de ruıdo.
De forma geral, um determinado fenomeno pode ser representado por um modelo
STAR se seus parametros sao tais que variam suavemente no tempo. O modelo STAR
utilizado nesta Tese e dado pela Equacao (.),
Zt = 0.3Zt−1 + 0.6Zt−2 + (0.1 − 0.9Zt−1 + 0.8Zt−2)
(1
1 + exp(−10Zt−1)
)+ rt. (.)
onde a funcao de transferencia utilizada foi a sigmoide logıstica.
Seguindo a Equacao (.) foram gerados 3000 pontos. Para se descartar qualquer
influencia devido a transientes iniciais, foram utilizados os ultimos 1000 pontos para a
confeccao da serie.
O metodo TAEF identificou os retardos temporais 2, 3, 4 e 6 como relevantes para a
descricao da serie gerada com o modelo STAR, definiu 5 neuronios na camada escondida
e elegeu como algoritmo de treinamento o Gradiente Conjugado Escalado, classificando
a previsao como em fase.
Na Tabela 8.11 sao exibidos os resultados obtidos pelo metodo TAEF para o conjunto
de teste em ambas as situacoes de previsao em fase e fora de fase.
Na Figura 8.6 sao mostrados graficos comparativos entre os dados reais (linha solida)
da serie do modelo STAR e a previsao (linha tracejada) gerada para o conjunto de teste.
8.6 COMENTARIOS SOBRE OS RESULTADOS 177
Tabela 8.11: Resultados experimentais obtidos pelo metodo TAEF para a Serie do ModeloSTAR para o conjunto de teste.
Medidas de DesempenhoResultados
Em Fase Fora de Fase
MSE 6.300 · 10−5 0.0458MAPE 1.67 % 44.57%
U of Theil 0.0055 99.32POCID 97.57% 6.91%ARV 0.0027 1.9366AIC -2312.1 -675.8BIC -1988.8 -481.9
0 50 100 150 200 250−0.6
−0.4
−0.2
0
0.2
0.4
0.6
0.8Em Fase
Conjunto de Teste
Mod
elo
ST
AR
0 50 100 150 200 250−0.6
−0.4
−0.2
0
0.2
0.4
0.6
0.8Fora de Fase
Conjunto de Teste
Mod
elo
ST
AR
(a) Conjunto de teste completo.
150 160 170 180 190 200 210 220 230 240 250−0.4
−0.2
0
0.2
0.4
0.6Em Fase
Conjunto de Teste
Mod
elo
ST
AR
150 160 170 180 190 200 210 220 230 240 250−0.4
−0.2
0
0.2
0.4
0.6Fora de Fase
Conjunto de Teste
Mod
elo
ST
AR
(b) Ultimos 100 pontos do conjunto de teste.
Figura 8.6: Graficos comparativos entre os valores reais (linha solida) da serie do modeloSTAR e a previsao (linha tracejada) gerada pelo metodo TAEF.
8.6 COMENTARIOS SOBRE OS RESULTADOS
Neste Capıtulo foram apresentados diversos modelos de alta complexidade utilizados para
a analise e previsao de series temporais. A partir destes modelos foram criadas varias
series temporais com caracterısticas de difıcil modelagem a partir de observacoes pontuais.
O metodo TAEF foi habil o suficiente para configurar as RNAs para a realizacao da
previsao das series criadas. Em todos os casos, o metodo TAEF classificou corretamente
as previsoes em fase e fora de fase, como comprovado com os resultados obtidos para as
medidas de desempenho.
Para as series cujos relacionamentos entre os dados se apresentam de forma muito
8.6 COMENTARIOS SOBRE OS RESULTADOS 178
complexa, onde a informacao tende a ser distribuıda igualmente sobre todas as suas
componentes (maximo valor de Entropia [112]), o metodo TAEF classifica a previsao
como fora de fase. Ja para as series que contem alguma estrutura mais definida de
relacionamento entre os dados (baixo valor de Entropia [112]) o metodo TAEF classifica
a previsao como em fase. A transicao entre estes dois comportamentos distintos pode ser
vista na Secao 8.4, onde com o aumento de complexidade nos modelos SETAR gerados,
o metodo TAEF passa da situacao de previsao em fase (series: SETAR1, SETAR2 e
SETAR3) para a situacao de previsao fora de fase (serie: SETAR4).
Os resultados apresentados neste Capıtulo indicam que o metodo TAEF e robusto
o suficiente para gerar modelos para a previsao de series temporais com caracterısticas
bastante complexas. Esses resultados complementam a analise experimental realizada no
Capıtulo anterior, possibilitando uma visao mais concreta das qualidades de previsao do
metodo proposto.
CAPITULO 9
SIMULACOES DE COMPRA E VENDA DE ACOES
Neste Capıtulo e desenvolvido um primeiro ensaio para a elaboracao de um sistema
de apoio a tomada de decisao baseado em previsao de series temporais. Para tanto, e
montado um esquema para compra e venda de acoes na bolsa de valores de Sao Paulo,
Bovespa, sendo simuladas operacoes com uma carteira de acoes reais.
As condicoes de compra e venda utilizadas nas simulacoes e seus respectivos resultados
comprovam a viabilidade de utilizacao do metodo TAEF em uma aplicacao pratica do
mundo real.
9.1 INTRODUCAO
Nos Capıtulos 7 e 8 foram apresentados um conjunto de experimentos com varias series
temporais de alto grau de complexidade, tanto do mundo real como artificiais. Em todos
os casos, o metodo TAEF apresentou-se como uma solucao de maior desempenho de
previsao.
Desta forma, o raciocınio imediato leva ao questionamento de qual seria o desempenho
do metodo TAEF em uma situacao de operacao no mercado. Na tentativa de responder
a essa questao e montado um procedimento para a simulacao de um processo de compra
e venda de acoes na bolsa de valores do estado de Sao Paulo, a Bovespa, levando em
consideracao os fatores reais requeridos pela Bovespa, como taxas e tributos, para a
efetuacao da negociacao com as acoes.
Nas secoes que se seguem sao exibidos os criterios e regras utilizados na elaboracao
do sistema de compra e venda de acoes baseado na previsao gerada com o metodo TAEF,
a carteira de acoes utilizada, bem como os resultados obtidos em termos de retorno de
capital com as acoes.
179
9.2 REGRAS DE COMPRA E VENDA 180
9.2 REGRAS DE COMPRA E VENDA
Toda decisao de compra e venda de acoes e tomada para uma previsao de horizonte
unitario, isto e, e assumido que o unico conhecimento e o valor da acao no fechamento
do proximo pregao da bolsa.
Levando em consideracao que o metodo TAEF gera um modelo de previsao nao per-
feito, o erro medio da previsao tambem sera utilizado para a definicao da estrategia de
compra e venda. Desta forma, podem-se criar duas regioes para a tomada de decisao:
1. Regiao segura: essa regiao de tomada de decisao ocorre quando o valor atual da
serie (Zt), com os custos operacionais, e a sua previsao (Zt+1) estao a uma distancia
superior ao erro MAPE do modelo gerado pelo metodo TAEF, ou seja,
Zt mais Custos /∈ [Zt+1 − MAPE · Zt+1, Zt+1 + MAPE · Zt+1]; (.)
2. Regiao nao-segura: essa regiao de tomada de decisao ocorre quando o valor
atual da serie (Zt), com os custos operacionais, e a sua previsao (Zt+1) estao a uma
distancia inferior ao erro MAPE do modelo gerado pelo metodo TAEF, ou seja,
Zt mais Custos ∈ [Zt+1 − MAPE · Zt+1, Zt+1 + MAPE · Zt+1]. (.)
Para a regiao segura, as regras de compra e venda sao definidas como,
• Regra de Compra: o sistema devera comprar se o valor atual (Zt) acrescido dos
custos operacionais for inferior ao valor de previsao diminuıdo pelo valor do erro de
previsao (Zt+1 − MAPE),
SE (Zt + Custos ) < (Zt+1 − MAPE)
ENTAO COMPRE
• Regra de Venda: o sistema devera vender se o valor atual (Zt) menos os custos
operacionais for superior ao valor de previsao mais o valor do erro de previsao
(Zt+1 + MAPE),
SE (Zt - Custos ) > (Zt+1 + MAPE)
ENTAO VENDA
9.3 CARTEIRA DE TITULOS UTILIZADA 181
Para a regiao nao-segura as regras de compra e venda necessitam de uma analise
mais sofisticada, como uma previsao de horizonte superior ou ate mesmo o auxılio de um
especialista humano.
9.3 CARTEIRA DE TITULOS UTILIZADA
Para a realizacao das simulacoes de compra e venda de acoes com o metodo TAEF foi
montada uma carteira de tıtulos composta por cinco acoes de empresas que compoem
o mercado na Bovespa mais o cambio Dolar-Real. As acoes utilizadas sao expostas
na Tabela 9.1, onde sao indicados os respectivos codigos de identificacao das acoes na
Bovespa.
Tabela 9.1: Quadro das Acoes utilizadas na composicao da Carteira de Tıtulos.
Codigo da Bovespa Nome da EmpresaGGBR4 GerdauPETR4 PetrobrasUNIP6 UniparUSIM5 UsiminasVALE5 Vale do Rio Doce
Todas as series temporais dos tıtulos que compoem a carteira (acoes mais cambio
Dolar-Real) sao compostas por observacoes diarias de 3 de janeiro de 2000 a 27 de junho de
2005. Estes pontos foram separados em dois conjuntos iniciais, sendo o primeiro, contendo
os dados dos anos de 2000 a 2004, utilizado para a criacao do modelo de previsao pelo
metodo TAEF, e o segundo, composto pelos dados do ano de 2005, aplicado a simulacao
de compra e venda.
9.4 SIMULACAO DE COMPRA E VENDA DE ACOES
Com a utilizacao da carteira de tıtulos descrita na Secao 9.3 e montado o procedimento de
compra e venda. Toda a simulacao tenta ser o mais fiel possıvel ao procedimento real no
corrente mercado, contudo e considerado que a negociacao de compra e venda da moeda
norte americana e realizada segundo os mesmos criterios utilizados nas negociacoes com
as acoes na Bovespa.
Os custos operacionais de compra e venda considerados sao os aplicados na Bovespa,
9.4 SIMULACAO DE COMPRA E VENDA DE ACOES 182
chamados de Emolumentos, 0.035% do valor da operacao, onde e assumida que apenas
uma ordem de compra e/ou venda e realizada por dia por tıtulo. Alem dos Emolumentos,
e necessaria a contratacao dos servicos de uma corretora credenciada junto a Bovespa.
Existem varias corretoras que trabalham recebendo as ordem de compra e venda de
acoes, com diferentes formas de taxacoes para este servico. Contudo, analisando as
corretoras mais populares, como por exemplo o Banco do Brasil, verifica-se que as taxas
de corretagens variam de 2% a 3% sobre o valor da operacao. Sera assumido para as
simulacoes o pior caso, ou seja, uma taxa de corretagem de 3%. Portanto, o custo total
para as operacoes sera de 3.035% do valor negociado, tanto na compra como na venda.
Segundo as regras descritas na Secao 9.2, o sistema de apoio a tomada de decisao
pode,
• Vender;
• Vender e Comprar;
• Comprar;
• Nao realizar nenhuma operacao.
Para a realizacao das operacoes, e montada uma estrutura com o lucro previsto para
a compra do tıtulo na regiao segura, venda do tıtulo na regiao segura, compra do tıtulo
na regiao nao-segura e venda do tıtulo na regiao nao segura. Esta estrutura e elaborada
de tal forma a garantir regioes disjuntas, ou seja, se um determinado tıtulo tem lucro na
regiao segura nao tera lucro na regiao nao-segura, e vice e versa.
A simulacao e realizada seguindo o procedimento descrito no Algoritmo 9.2. Inicial-
mente e definida o a quantidade disponıvel de recursos que poderao ser utilizados para
a compra dos tıtulos da carteira, variavel Saldo, que para as simulacoes realizadas foi
considerada igual a 100, tendo seu valor ajustado iteracao a iteracao dependendo das
operacoes de compra e venda.
Foi assumido que o Saldo sera dividido em dois montantes, um para ser utilizado na
compra das acoes na regiao segura, e o outro para a compra das acoes na regiao nao
segura. A divisao do Saldo nestes dois montantes e realizada por uma constante (Risco)
definida pelo usuario, que pode variar no intervalo [0,1]. Quanto mais conservador for o
usuario, mais proxima de 0 sera a variavel Risco, e quanto mais arrojado mais proxima
de 1.
9.4 SIMULACAO DE COMPRA E VENDA DE ACOES 183
beginSaldo(t) = 100; // Saldo inicial para compra de tıtulos no tempo t
Risco = 0.15; // Percentual do saldo para operac~oes na regi~ao n~ao segura
while Perıodo de Simulacao doRealiza a previsao t + 1 para todas as series da carteira;Constroi Estrutura de Lucro;if Tıtulo com lucro para operacao de venda na regiao segura then
Venda Tıtulo;Atualiza Saldo(t);
if Tıtulo com lucro para operacao de venda na regiao nao-segura then
if Existe tıtulo com lucro na regiao de compra segura thenVenda Tıtulo;Atualiza Saldo(t);
if Existe Tıtulo com lucro na regiao de compra segura then
for i=1 to 6 do// Para cada tıtulo da carteira
V alor Comprai = Saldo ∗ (1 − Risco) ∗ Lucro Compra Segurai�6
j=1Lucro Compra Seguraj
if Existe Tıtulo com lucro na regiao de compra nao segura then
for i=1 to 6 do// Para cada tıtulo da carteira
V alor Comprai = Saldo ∗ (Risco) ∗ Lucro Compra N ao Segurai�6
j=1Lucro Compra N ao Seguraj
Atualiza Saldo(t);
end
Algoritmo 9.1: Procedimento utilizado para a compra e venda de acoes.
Com a definicao de Saldo e Risco, comeca a simulacao propriamente dita. Dado que t
e o tempo presente, para cada previsao t+1 e construıda a estrutura Lucro para cada um
dos tıtulos da carteira. Se houver algum tıtulo na condicao de lucro para venda segura,
entao sera executada a sua venda e atualizado o valor do Saldo. Ja se houver algum tıtulo
na condicao de venda nao segura, e assumido que este so sera vendido se houver algum
outro tıtulo na condicao de compra segura, caso contrario nao sera realizada nenhuma
operacao com este tıtulo. Havendo tıtulos na condicao de compra segura, o montante
(Saldo ∗ (1 − Risco)) sera distribuıdo de forma ponderada entre estes tıtulos para suas
respectivas compras, onde o peso da ponderacao e o valor do lucro do proprio tıtulo
normalizado pelo somatorio dos lucros de todos os tıtulos com compra segura, como
descrito pela Equacao (.).
Comprai = Saldo ∗ (1 − Risco) ∗ Lucro Compra Segurai∑j={Carteira} Lucro Compra Seguraj
(.)
9.4 SIMULACAO DE COMPRA E VENDA DE ACOES 184
onde Comprai e o valor destinado para a operacao de compra do tıtulo i, Lucro Compra
Segura i e o lucro previsto para o tıtulo i e o termo de somatorio age sobre todos os tıtulos
da carteira, onde Lucro Compra Seguraj sera nulo caso o tıtulo j nao contenha lucro
com compra segura.
De forma semelhante, havendo tıtulos com compra nao segura, e calculado o montante
para compra de risco (Saldo∗Risco), onde tal quantia tambem sera distribuıda, de forma
ponderada, entre os tıtulos de risco para suas respectivas compras. A Equacao (.)
calcula a fatia do montante de risco para cada um dos tıtulos na condicao de compra nao
segura,
Compra N ao Segurai = Saldo∗Risco∗ Lucro Compra N ao Segurai∑j={Carteira} Lucro Compra N ao Seguraj
. (.)
9.4.1 Resultados das Simulacoes
Inicialmente os conjuntos das series temporais, para cada um dos tıtulos da carteira,
foram divididos nos conjuntos de ajustes e simulacao. Os conjuntos de ajustes (dados
referentes aos anos de 2000, 2001, 2002, 2003 e 2004) foram utilizados para a confeccao
dos modelos de previsao e os conjuntos de simulacao (dados referentes aos ano de 2005)
foram utilizados para a simulacao do processo de compra e venda. Na Tabela 9.2 sao
mostrados os erros MAPE alcancados pelo metodo TAEF e modelos de Box & Jenkins
(para o conjunto de teste) para cada um dos tıtulos.
Tabela 9.2: Quadro com os erros MAPE para cada um dos tıtulos utilizados na Carteira.
TıtuloMAPE
TAEF Box & JenkinsDolar 0.6047% 9.5432%
GGBR4 6.4559% 20.0497%PETR4 2.6093% 18.9978%UNIP6 4.8871% 20.1452%USIM5 3.6586% 17.5567%VALE5 2.7449% 19.3459%
Como base comparativa, foram considerados dois procedimentos alternativos ao metodo
TAEF. O primeiro foi o simples rateamento igualitario do saldo entre os tıtulos da carteira
e verificacao do retorno do investimento ao longo da simulacao. O segundo procedimento,
utilizou modelos de Box & Jenkins (otimizados segundo a previsao) aplicando-os as mes-
9.4 SIMULACAO DE COMPRA E VENDA DE ACOES 185
mas condicoes de compra e venda dos tıtulos utilizados pelo metodo TAEF.
Varios experimentos foram realizados variando o fator Risco no intervalo [0,1]. Nas
Figuras 9.1, 9.2 e 9.3 sao apresentados os resultados para as simulacoes com a utilizacao
do metodo TAEF (linha solida pontuada), modelos de Box & Jenkins (asteriscos) e a
simples compra das acoes (linha solida).
A partir dos graficos das Figuras 9.1, 9.2 e 9.3 e possıvel notar que o desempenho do
metodo TAEF e bem superior para pequenos valores do fator de Risco (de 5% a 15%).
Comportamento inverso e observado para os modelos de Box & Jenkins, que tem o seu
maximo de retorno para um fator de Risco em torno dos 100%. Considerando o ultimo
ponto do retorno acumulado percentual e possıvel construir um grafico do comportamento
dos desempenhos para o metodo TAEF e os modelos de Box & Jenkins (Figura 9.4).
0 10 20 30 40 50 60 70 80 90 100−500
0
500
1000
1500
2000
2500
3000
3500
4000
4500
Pontos diários (Pregões)
Ret
orno
Acu
mul
ado
Per
cent
ual
TAEF ARMA Serie Fator Risco = 0.0
(a) Fator Risco = 0.00
0 10 20 30 40 50 60 70 80 90 100−1000
0
1000
2000
3000
4000
5000
6000
7000
Pontos diários (Pregões)
Ret
orno
Acu
mul
ado
Per
cent
ual
TAEF ARMA Serie Fator Risco = 0.05
(b) Fator Risco = 0.05
Figura 9.1: Resultados das simulacoes de compra e venda de acoes com a utilizacao dometodo TAEF (linha solida com pontos), modelos de Box & Jenkins (asteriscos) e acompra simples das acoes (linhas solida).
9.4 SIMULACAO DE COMPRA E VENDA DE ACOES 186
0 10 20 30 40 50 60 70 80 90 100−1000
0
1000
2000
3000
4000
5000
6000
Pontos diários (Pregões)
Ret
orno
Acu
mul
ado
Per
cent
ual
TAEF ARMA Serie Fator Risco = 0.10
(a) Fator Risco = 0.10
0 10 20 30 40 50 60 70 80 90 100−1000
0
1000
2000
3000
4000
5000
6000
Pontos diários (Pregões)
Ret
orno
Acu
mul
ado
Per
cent
ual
TAEF ARMA Serie Fator Risco = 0.15
(b) Fator Risco = 0.15
0 10 20 30 40 50 60 70 80 90 100−500
0
500
1000
1500
2000
2500
3000
3500
4000
4500
Pontos diários (Pregões)
Ret
orno
Acu
mul
ado
Per
cent
ual
TAEF ARMA Serie Fator Risco = 0.20
(c) Fator Risco = 0.20
0 10 20 30 40 50 60 70 80 90 100−500
0
500
1000
1500
2000
2500
3000
3500
4000
Pontos diários (Pregões)
Ret
orno
Acu
mul
ado
Per
cent
ual
TAEF ARMA Serie Fator Risco = 0.25
(d) Fator Risco = 0.25
0 10 20 30 40 50 60 70 80 90 100−500
0
500
1000
1500
2000
2500
3000
3500
Pontos diários (Pregões)
Ret
orno
Acu
mul
ado
Per
cent
ual
TAEF ARMA Serie Fator Risco = 0.30
(e) Fator Risco = 0.30
0 10 20 30 40 50 60 70 80 90 100−500
0
500
1000
1500
2000
2500
3000
3500
Pontos diários (Pregões)
Ret
orno
Acu
mul
ado
Per
cent
ual
TAEF ARMA Serie Fator Risco = 0.35
(f) Fator Risco = 0.35
Figura 9.2: Resultados das simulacoes de compra e venda de acoes com a utilizacao dometodo TAEF (linha solida com pontos), modelos de Box & Jenkins (asteriscos) e acompra simples das acoes (linhas solida).
9.4 SIMULACAO DE COMPRA E VENDA DE ACOES 187
0 10 20 30 40 50 60 70 80 90 100−500
0
500
1000
1500
2000
2500
3000
Pontos diários (Pregões)
Ret
orno
Acu
mul
ado
Per
cent
ual
TAEF ARMA Serie Fator Risco = 0.40
(a) Fator Risco = 0.40
0 10 20 30 40 50 60 70 80 90 100−500
0
500
1000
1500
2000
2500
3000
Pontos diários (Pregões)
Ret
orno
Acu
mul
ado
Per
cent
ual
TAEF ARMA Serie Fator Risco = 0.45
(b) Fator Risco = 0.45
0 10 20 30 40 50 60 70 80 90 100−500
0
500
1000
1500
2000
2500
Pontos diários (Pregões)
Ret
orna
Acu
mul
ado
Per
cent
ual
TAEF ARMA Serie Fator Risco = 0.50
(c) Fator Risco = 0.50
0 10 20 30 40 50 60 70 80 90 100−500
0
500
1000
1500
2000
Pontos diários (Pregões)
Ret
orno
Acu
mul
ado
Per
cent
ual
TAEF ARMA Serie
Fator Risco = 0.60
(d) Fator Risco = 0.60
0 10 20 30 40 50 60 70 80 90 100−500
0
500
1000
1500
2000
2500
3000
Pontos diários (Pregões)
Ret
orno
Acu
mul
ado
Per
cent
ual
TAEF ARMA Serie Fator Risco = 0.70
(e) Fator Risco = 0.70
0 10 20 30 40 50 60 70 80 90 100−500
0
500
1000
1500
2000
2500
3000
3500
Pontos diários (Pregões)
Ret
orno
Acu
mul
ado
Per
cent
ual
TAEFARMASerie
Fator Risco = 1.00
(f) Fator Risco = 1.00
Figura 9.3: Resultados das simulacoes de compra e venda de acoes com a utilizacao dometodo TAEF (linha solida com pontos), modelos de Box & Jenkins (asteriscos) e acompra simples das acoes (linhas solida).
9.4 SIMULACAO DE COMPRA E VENDA DE ACOES 188
O fator de Risco criado e uma forma de automatizar a decisao a ser tomada quando
a previsao gerada se encontra na regiao nao-segura. Desta forma, a Figura 9.4 mostra o
quanto o investidor deve se arriscar para tirar o maximo de retorno dos metodos.
O fato das simulacoes com os modelos de Box & Jenkins terem seus retornos incre-
mentados com o aumento do fator de Risco indica que devido as altas taxas de erros,
apresentadas na Tabela 9.2, ha a necessidade de arriscar, uma vez que a grande maio-
ria das previsoes encontram-se na regiao nao-segura, vindo a justificar uma tendencia
exponencial no crescimento inicial do retorno, como apresentado na Figura 9.4.
Analisando a Figura 9.4 e possıvel observar que o metodo TAEF consegue ter aproxi-
madamente o dobro de desempenho quando comparado com os modelos de Box & Jenkins,
aliado ao fato de ser um metodo conservador (fator de Risco ∼ 5% a 10%), contra um
metodo extremamente arriscado (fator de Risco dos modelos de Box & Jenkins ∼ 100%).
Contudo, tomando uma postura conservadora (Risco = 0), visto que para uma si-
tuacao desconhecida o estado defensivo e naturalmente escolhido pela grande maioria
dos seres humanos, o metodo TAEF e muito superior aos modelos de Box & Jenkins,
com um desempenho de retorno financeiro da ordem de 400 vezes superior.
Portanto, as simulacoes realizadas indicam que o metodo TAEF e bem mais apro-
priado como base da elaboracao de um sistema de apoio a tomada de decisao para a com-
pra e venda de tıtulos em um mercado de valores, apresentando uma baixa necessidade de
intervencao humana, representada pelos baixos valores do Fator de Risco determinados
como otimos para o metodo.
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 10
500
1000
1500
2000
2500
3000
3500
4000
4500
Fator Risco
Ret
orno
Fin
al
TAEFBox & Jenkins
Figura 9.4: Valor do retorno acumulado percentual versus o Fator de Risco para asoperacoes de compra e venda: metodo TAEF (©) e modelos de Box & Jenkins (∗).
CAPITULO 10
CONCLUSOES
Neste Capıtulo final sao apresentadas as conclusoes dos estudos e investigacoes experi-
mentais realizadas para a resolucao do problema de previsao das series temporais.
Discussoes sobre a nova metodologia proposta — The Time-lag Added Evolutionary
Forecasting Method — sao apresentadas, considerando sua viabilidade em aplicacoes
praticas de previsao. Limitacoes do metodo e do trabalho desenvolvido nesta pesquisa
tambem sao discutidas.
Por fim, tambem sao apresentados possıveis desdobramentos para trabalhos futuros
que poderao contribuir para a evolucao do metodo TAEF, bem como para um melhor
entendimento do problema de previsao de series temporais.
10.1 CONCLUSOES
Nesta tese de doutoramento foi abordado o problema de previsao de series temporais
com o estudo de varias tecnicas da estatıstica e da inteligencia artificial. Os modelos
estatısticos comentados, lineares e nao-lineares, sao os mais populares encontrados na
literatura especializada, destacando-se os modelos de Box & Jenkins, que sao dentre todos
os mais difundidos e estudados. Desta forma, os modelos de Box & Jenkins apresentam-
se como um ponto de partida e de formalizacao dos estudos das leis que governam os
fenomenos geradores das series temporais.
Dentre os modelos da Inteligencia Artificial (IA), foram analisados aqueles encontra-
dos de forma mais comum nas aplicacoes de previsao de series temporais relatadas na
literatura especializada, as Rede Neurais Artificiais (RNAs) e os Algoritmos Geneticos
(AGs).
A previsao de uma serie temporal e a tentativa do mapeamento das informacoes
passadas nas informacoes futuras. As RNAs, devido a sua capacidade intrınseca de
mapear informacao, sao as tecnicas da IA mais utilizadas na previsao de series temporais.
189
10.1 CONCLUSOES 190
Os AGs tambem sao bastante utilizados para a previsao de series temporais, realizando
buscas para a determinacao de regras que geram os acontecimentos futuros a partir da
analise dos dados historicos de um fenomeno de interesse. Alem deste tipo de utilizacao,
os AGs tambem sao comumente aplicados como algoritmos de configuracao e ajuste de
parametros de modelos devido a sua capacidade de pesquisa em grandes espacos de busca,
tentando ajustar alguma expressao matematica aos dados de uma serie temporal. Em
particular, os AGs podem ser utilizados em conjunto com os modelos estatısticos nao-
lineares, proporcionando uma forma tecnicamente mais simples quando comparada as
formas convencionais aplicadas pela estatıstica para o ajuste de paramentos nao-lineares.
Em um primeiro instante, varias series temporais de relevancia na literatura e em
problemas do mundo real foram agrupadas para a consolidacao de um conjunto de dados
(benchmark) para a analise de desempenho dos modelos em estudo, formado por series
artificiais (serie do Mapa de Henon e serie Random Walk) e series reais, sendo estas
ultimas compostas por series de fenomenos naturais (serie das Manchas Solares — Sunspot
— e serie de Medidas do Brilho de uma Estrela) e series economico-financeiras (serie do
Indice Dow Jones Industrial Average, serie do Indice Nasdaq, serie do Indice S&P500 e
serie do Valor de Fechamento das Acoes da Petrobras).
Para o estabelecimento de um nıvel de referencia para o desempenho de previsao do
conjunto de series temporais, foram realizados experimentos com os modelos de Box &
Jenkins, visto que estes sao modelos lineares simples, totalmente entendidos e que, na
pratica, sao bastante utilizados. Os modelos gerados foram otimizados para a previsao.
Com a referencia estabelecida pelos experimentos de Box & Jenkins, foram montados
varios experimentos que utilizaram unicamente as RNAs do tipo MLP para a previsao
das series temporais. Os ajustes e configuracoes aplicados as RNAs foram escolhidos por
meio de tentativa e erro atraves de varios experimentos preliminares com o objetivo de
otimizar os modelos. Os resultados alcancados pelas RNAs, de forma geral, superam
expressivamente os resultados obtidos pelos experimentos de Box & Jenkins.
Analisando os experimentos, as RNAs, embora apresentem um desempenho superior
aos modelos de Box & Jenkins, ainda seguem a mesma tendencia comportamental apre-
sentada por Box & Jenkins, para as series economico-financeiras se comportam como um
modelo do tipo Random Walk, como relata a medida da estatıstica U de Theil, e um
experimento do tipo cara ou coroa para a determinacao da tendencia do proximo valor
futuro, como explicitado pela medida POCID.
10.1 CONCLUSOES 191
Este comportamento das RNAs (modelos do tipo Random Walk e experimentos do
tipo cara ou coroa) pode ser o reflexo da ma escolha dos parametros das RNAs. Para
tanto, foi construıdo um Sistema Hıbrido Inteligente (SHI) composto pela combinacao de
um AG modificado e RNAs. A ideia basica e utilizar o AG para uma escolha sub-otima,
ou ate mesmo otima, dos parametros utilizados pelas RNAs, inclusive os valores dos pesos
e a topologia da rede com a possibilidade de um processo de poda das conexoes.
Varios experimentos com o SHI foram realizados, mas o desempenho geral ficou um
pouco abaixo do alcancado pelos experimentos que utilizaram unicamente as RNAs. Este
comportamento de baixo desempenho de previsao do SHI vem provavelmente do fato
do espaco de estados possıveis para os pesos das RNAs constituir um universo de busca
extremamente vasto e de alta dimensionalidade, necessitando de um tempo muito extenso
para o correto treinamento das RNAs. Entretanto, embora o SHI tenha exibido um
desempenho inferior ao das RNAs, este obteve um desempenho superior aos experimentos
de Box & Jenkins, com uma configuracao bem mais compacta para as topologias da
RNAs. Contudo, o SHI ainda mantem o mesmo comportamento para as series economico-
financeiras, gerando modelos de previsao inferiores a modelos do tipo Random Walk.
Fazendo uma analise dos resultados obtidos com os experimentos realizados, e aliado
ao teorema de F. Takens [16], que prova a existencia de uma quantidade mınima necessaria
de retardos temporais para a reproducao do fenomeno gerador de uma serie temporal, foi
criado um novo metodo, chamado de Time-lag Added Evolutionary Forecasting Method,
ou simplesmente metodo TAEF, que realiza uma busca evolutiva pela dimensionalidade
mınima para a reconstrucao do espaco de estados da serie temporal, com a utilizacao
de um AG modificado que seleciona a topologia de uma RNA conjuntamente com o
algoritmo de treinamento aplicado para a previsao de series temporais.
Varios experimentos foram realizados com esta nova metodologia, que apresentaram
basicamente duas situacoes: para as dos fenomenos naturais, o metodo TAEF obteve
melhores resultados que as RNAs; entretanto, para as demais series (series economico-
financeiras e serie artificiais) o metodo TAEF apresenta um desempenho equivalente as
RNAs. Para as series economico-financeiras o metodo TAEF manteve um comportamento
tıpico de um modelo do tipo Random Walk e de um experimento do tipo cara ou coroa
para a determinacao da tendencia futura da serie. Tal comportamento, ja relatado na
literatura [103], e esperado quando a serie tende a um modelo do tipo Random Walk.
Entretanto, supondo que o modelo gerado e capaz de capturar informacao suficiente da
10.1 CONCLUSOES 192
serie, o comportamento do tipo Random Walk pode vir a ser devido a presenca de uma
componente linear auto-regressiva, com coeficiente em torno da unidade, que mascara
qualquer outra componente nao linear da serie. Se esta suposicao for verdadeira, existira
alguma forma de ajuste para a defasagem temporal entre a previsao e os dados reais,
criada pela forte tendencia de Random Walk.
Neste sentido, foi elaborado o procedimento de ajuste de fase temporal, sendo de-
senvolvida uma segunda versao do metodo TAEF, que a partir de um teste estatıstico
de hipotese determina se ha a necessidade ou nao de ajuste de fase. Tal procedimento
mostra-se habil para o ajuste da defasagem temporal entre os dados reais da serie tem-
poral e sua respectiva previsao.
Este mesmo procedimento de ajuste de fase tambem foi aplicado as RNAs, mas que
apresentou-se de forma nao habil para o ajuste de fase, mostrando que as RNAs ini-
ciais realmente se comportam com um modelo do tipo Random Walk, evidenciando a
importancia do correto ajuste dos parametros das RNAs gerado pelo metodo TAEF.
Desta forma, foram elaborados novos experimentos com series temporais artificiais de
alta complexidade para uma verificacao complementar ao metodo TAEF, apresentando
resultados de desempenho bastante satisfatorios.
Com o superior desempenho de previsao apresentado pelo metodo TAEF, foi cons-
truıdo um procedimento para a simulacao real de um sistema de apoio a tomada de
decisao baseado em previsao para a compra e venda de acoes da bolsa de valores do
estado de Sao Paulo, Bovespa. Com os resultados destas simulacoes, pode-se notar que
o metodo TAEF e capaz de dar subsıdios suficientes para superar em muito o mercado e
um processo de compra e venda de acoes baseado em modelos de Box & Jenkins, com a
necessidade de um risco muito baixo e a producao um retorno financeiro bem superior.
Desta forma, o metodo TAEF apresenta-se como uma nova metodologia viavel, tanto
cientificamente como de forma pratica, para a abordagem do problema de previsao de
series temporais e classificacao das series como modelos que tendem ou nao a um Random
Walk, sendo relatado em varios trabalhos publicados na literatura [104, 105, 113–117].
10.1.1 Contribuicoes da Tese
E possıvel enumerar as principais contribuicoes desta tese nos seguintes pontos:
10.1 CONCLUSOES 193
• Estudo de possıveis metodologias aplicadas para a previsao de series temporais em
um universo diversificado de fenomenos:
1. Fenomenos da Natureza;
2. Fenomenos Artificiais;
3. Fenomenos Economicos e Financeiros.
• Estudo comparativos entre as principais tecnicas encontradas na literatura para a
previsao de series temporais:
1. Modelos Box & Jenkins;
2. Tecnicas da IA:
– RNAs;
– AGs;
– Sistema Hıbrido AG + RNA.
• Identificacao de caracterısticas em comum entre os modelos gerados para as series
economicas e financeiras e um modelo do tipo Random Walk ;
• Desenvolvimento de um procedimento de busca evolutivo para a determinacao au-
tomatica:
1. Da dimensionalidade mınima de retardos temporais (baseado no teorema de
F. Takens [16]);
2. Dos parametros das RNAs.
• Desenvolvimento de um procedimento de teste comportamental para as series tem-
porais:
1. Serie temporal tende a um modelo do tipo Random Walk ; ou
2. Serie temporal nao tende a um modelo do tipo Random Walk.
• Desenvolvimento de uma nova metodologia hıbrida inteligente para a previsao de
series temporais:
1. O Metodo TAEF:
– Busca evolutiva pelos retardos temporais e demais parametros das RNAs;
– Busca evolutiva pelos retardos temporais e demais parametros das RNAs;
10.2 LIMITACOES DO TRABALHO 194
– Teste comportamental da serie estudada;
– Procedimento para o ajuste fino da fase de previsao.
• Investigacao detalha do metodo proposto;
• Proposta de um sistema de apoio a tomada de decisao aplicado ao mercado fi-
nanceiros, com a realizacao de simulacoes de compra e venda em uma carteira real
de acoes.
10.2 LIMITACOES DO TRABALHO
Embora o metodo TAEF tenha alcancado resultados expressivos, inclusive em com-
paracoes a outros trabalhos encontrados na literatura, como descrito na Secao 7.3, ainda
ha varios pontos em aberto que necessitam de um estudo cuidadoso e aprofundado.
Um desses pontos e a explicacao teorica do porque uma RNA apresentar dois compor-
tamentos tao distintos entre um modelo em fase e um modelo fora de fase, indicando a
possibilidade da existencia de algum fenomeno de transicao de fase descrito pelas RNAs.
Uma explicacao formal para este comportamento ainda e desconhecida.
Uma questao tambem importante a ser considerada e o conjunto de condicoes de pa-
rada utilizadas no metodo TAEF. Atualmente, a unica condicao de parada e a quantidade
de iteracoes realizadas, apos 10 iteracoes o metodo TAEF finaliza. Este procedimento,
embora seja muito simples de ser implementado, pode nao ser o mais adequado, neces-
sitando de um estudo bem mais aprimorado para a determinacao do correto ponto de
parada.
A propria natureza no metodo TAEF demonstra um custo relativamente alto para a
producao de um modelo de previsao baseado em RNAs. Nenhum estudo formal a respeito
do custo computacional (memoria e tempo) foi realizado, entretanto, em termos praticos,
o metodo TAEF com a utilizacao de computadores pessoais com processadores de clock
em torno de 2.0GHz e memoria de aproximadamente 512Mb, gasta em media duas horas
para o desenvolvimento de um modelo. Levando em consideracao uma aplicacao pratica
de compra e venda de acoes, um poder computacional razoavel e necessario para a infra-
estrutura operacional necessaria a criacao e manutencao dos modelos de previsao.
10.3 TRABALHOS FUTUROS 195
10.3 TRABALHOS FUTUROS
Uma extensao imediata do trabalho exposto e a investigacao teorica dos comportamen-
tos de previsao em fase e fora de fase, bem como o processo de transicao entre eles,
apresentados pelas RNAs submetidas ao metodo TAEF. Este tipo de analise pode vir a
evidenciar alguma propriedade ainda nao conhecida a respeito do comportamento descri-
tivo da dinamica de sistemas complexos por meio das RNAs.
Outro ponto interessante vem da analise dos proprios resultados obtidos com o metodo
TAEF. Construindo as series dos resıduos entre os dados reais e a previsao gerada pelo
metodo TAEF, observam-se dois comportamentos tıpicos:
1. Se a previsao esta em fase, a serie de resıduos tem uma distribuicao aproximada-
mente gaussiana com media zero e coeficientes de correlacao nulos, vindo a indicar
um termo realmente de ruıdo;
2. Ja para a previsao fora de fase, a serie de resıduos tem uma distribuicao nao gaus-
siana com media diferente de zero e coeficientes de correlacao nao nulos.
Portanto, o ajuste de fase pode ser na realidade o primeiro passo para a criacao de
uma teoria de pertubacao [118–121], comumente utilizada em outros ramos da ciencia,
como na fısica e quımica. Este tipo de teoria e semelhante a uma expansao em serie
de potencias, como na expansao de Taylor, onde cada termo acrescentado na expansao
introduz um fator de correcao que converge para a solucao real do problema. Para o caso
em particular, cada serie de resıduos e uma nova iteracao a ser introduzida ao metodo
TAEF, gerando novos termos de correcao para a previsao final.
Um ponto fundamental do trabalho apresentado e o fato da possibilidade de ajuste
de fase entre os dados reais e a previsao. Analisando a serie temporal como um sistema
dinamico em um certo espaco de fase generalizado M, as observacoes tidas da serie sao
na realidade a interseccao da trajetoria descrita pela evolucao do sistema com uma hiper-
superfıcie do espaco M, chamada de superfıcie de Poincare [21].
Supondo que o espaco M e formado por dimensoes complexas e a superfıcie de Poin-
care seja pertencente ao espaco real (valores observaveis), ha naturalmente uma perda
de fase de correlacao entre os pontos da trajetoria no espaco M e os observaveis reais,
visto que matematicamente o observavel de uma grandeza complexa e o seu modulo ao
quadrado, ou seja, dado um numero complexo,
10.4 TRABALHOS PUBLICADOS 196
F = Aeiφ
onde A e um termo real de amplitude, i e a constante complexa e φ um termo de fase.
O modulo ao quadrado de F e dado por,
|F |2 = FF † = AA† · ei(φ−φ) = A2
onde o sımbolo † representa o complexo conjugado. Logo, o termo de fase e naturalmente
eliminado pela observacao.
Este tipo de comportamento e comumente considerado na Mecanica Quantica que
considera a existencia de um emaranhado de possıveis estados correlacionados por uma
fase complexa. A Mecanica Quantica tambem afirma que, ao se interagir com o sistema,
o emaranhado de estados quanticos colapsa para um determinado estado de uma funcao
de onda, gerando o observavel nao mais correlacionado ao sistema original.
Assim, um ponto de interesse futuro e o estudo da computacao quantica [122,123], em
particular as redes neurais quanticas [124,125], para a analise do problema de previsao de
series temporais, em particular series economicas e financeiras, verificando as correlacoes
em estados complexos da representacao de informacao.
10.4 TRABALHOS PUBLICADOS
Com esta Tese foram gerados os seguintes trabalhos:
1. Um modelo de Previsao Baseado em Inteligencia Artificial na Gestao de Bibliotecas
Universitarias [126];
2. Combinacao de Redes Neurais Artificiais com Algoritmo Genetico Modificado para
a Previsao de Series Temporais [127];
3. Composicao de Redes Neurais Artificiais com Algoritmo Genetico Modificado para
a Previsao de Series Temporais [128];
4. A Hybrid Intelligence System Approach for Improving the Prediction of Real World
Time Series [104];
10.4 TRABALHOS PUBLICADOS 197
5. An ANN-GA Approach for Automatic Lag Search and Real World Time Series
Forecasting [105];
6. An ANN-GA Approach for Automatic Lag Search and Real Worlds Time Series
Forecasting [113];
7. A New Hybrid Approach for Enhanced Times Series Prediction [114];
8. Evolutionary Method for Real-Word Times Series Prediction [115];
9. A New Hybrid Method for Time Series Forecasting [116];
10. A New Intelligent Methodology for Times Series Forecasting [117];
APENDICE A
ENUNCIADO DOS TEOREMAS DE F. TAKENS
Neste Apendice sao enunciados os quatro teoremas de F. Takens, originalmente apresen-
tados no trabalho Detecting Strange Attractor in Turbulence [16].
Estes teoremas sao a justificativa teorica para a possibilidade da reconstrucao do
espaco de fase gerador de uma serie temporal. Esta possibilidade e a base do funcio-
namento do metodo desenvolvido nesta tese para a resolucao do problema de previsao de
series temporais.
A.1 SISTEMA DINAMICO COM UM OBSERVAVEL
Seja um espaco M compacto. Um sistema sobre M tera uma dinamica temporal, corres-
pondente a um ponto inicial x0 (x0 ∈ M), dada pela funcao ϕt(x0), que descrevera uma
trajetoria em M .
Um observavel e uma funcao suave y : M → R. O primeiro problema que Takens quiz
responder foi: se, para algum sistema dinamico fısico com evolucao temporal ϕt, uma vez
conhecida a trajetoria t 7→ y(ϕt(x)), com x ∈ M , como obter informacao a respeito da
dinamica original do sistema (e sua dimensionalidade)? Os proximos tres teoremas estao
correlacionados com este problema.
Teorema A.1. Seja M um espaco compacto de dimensao m. Para pares do tipo (ϕ, y),
onde ϕ : M → M e um difemorfısmo suave e y : M → R uma funcao suave, uma
propriedade generica para mapeamento Φ(ϕ, y) : M → (R)2m+1 e definida como:
Φ(ϕ,y)(x) =(y(x), (y(ϕ(x)), . . . , y(ϕ2m(x))
)
que e um mapeamento de dimensao embutida, ou um embutido, e e entendido “suave”
como pelo menos pertencente a classe C2.
Teorema A.2. Seja M um espaco compacto de dimensao m. Para pares (X,y), X um
campo vetorial suave (i.e., C2) e y um funcao suave sobre M, uma propriedade generica
198
A.1 SISTEMA DINAMICO COM UM OBSERVAVEL 199
e que ΦX,y : M → R2m+1, definido por ΦX,y(x) = (y(x), (y(ϕ1(x)), . . . , y(ϕ2m(x))) e um
embutido, onde ϕt e o fluxo de X.
Teorema A.3. Seja M um espaco compacto de dimensao m. Para pares (X,y), X um
campo vetorial suave e y uma funcao suave sobre M, uma propriedade generica do ma-
peamento ΦX,y : M → R2m+1, definido como,
ΦX,y(x) =
(y(x),
d
dt(y(ϕt(x)))
∣∣∣∣t=0
, . . . ,d2m
dt2m(y(ϕt(x)))
∣∣∣∣t=0
)
e um embebido. Aqui ϕt novamente denota o fluxo de X, entretanto ser suave e agora
entendido como pelo menos ser C2m+1.
A partir destes tres teoremas e possıvel se determinar como um sistema dinamico
com evolucao temporal ϕt e observavel y e determinado genericamente pelo conjunto
de todas as funcoes t 7→ y(ϕt(x)). Na pratica a seguinte situacao pode ocorrer: tem-se
um sistema dinamico com tempo contınuo, mas os valores dos observaveis y sao apenas
determinados para um conjunto discreto de observacoes. Aliado a este fato, de todas
as observacoes discretas do observavel ({y(ϕiα(x))}∞i=0, com x ∈ M) so e conhecida tal
sequencia para um ou poucos valores de x (dependendo da quantidade de experimentos),
e mesmo assim nao e conhecida a totalidade da sequencia, apenas uma sub-sequencia
de i = 1, 2, . . . , N , sendo N um numero grande porem finito. Desta forma, e possıvel
pensar, sobre consideracoes genericas, que a topologia e a dinamica do sistema sobre um
conjunto em um limite positivo,
L+(x) = {x′ ∈ M |∃ti → ∞ com ϕti → x′}
de x e determinada pela sequencia {y(ϕiα(x))}∞i=0. O que gera o proximo teorema e seu
subsequente corolario.
Teorema A.4. Seja M um espaco compacto, X um campo vetorial sobre M com fluxo
ϕt e p um ponto em M . Entao, existe um subconjunto de residual CX,p de numeros reais
positivos tal que α ∈ CX,p onde o conjunto dos limites positivos para p, para um fluxo ϕt
de X e para o difeomorfismo ϕα sao os mesmos. Em outras palavras, para α ∈ CX,p, tem-
se que cada ponto q ∈ M , o qual e o limite de uma sequencia ϕti(p), ti ∈ R, ti → +∞, e
o limite da sequencia ϕniα(p), ni ∈ N e ni → ∞.
Corolario A.1. Seja M um espaco compacto de dimensao m. Considere 4-tuplas, con-
sistindo de um campo vetorial X, uma funcao y, um ponto p e um numero real positivo
A.1 SISTEMA DINAMICO COM UM OBSERVAVEL 200
α. De forma generica (X, y, p, α) (mais precisamente: o par generico (X,Y) e α satis-
fazendo condicoes genericas dependendo de X e p), conjunto de limite positivo L+(p) e
“difeomorfico” com o conjunto de pontos limites da seguinte sequencia em R2m+1:
{(y (ϕk,α(p))) ,
(y(ϕ(k+1),α(p)
)), . . . ,
(y(ϕ(k+2m),α(p)
))}∞k=0
.
O significado do “difeomorfico” poderia ser: existe um embutido suave de M dentro de
R2m+1 mapeando L+(p) de forma bijetiva com o conjunto de pontos limites
Desta forma, o trabalho de Takens prova que e possıvel se construir um espaco de
fase composto com os retardos temporais relevantes de tal forma que este seja capaz de
reproduzir a dinamica original de uma serie temporal, que nada mais e que um conjunto
finito de observacoes da evolucao temporal de um sistema dinamico.
APENDICE B
EVOLUCAO DA POPULACAO DOS ALGORITMOS
GENETICOS
Dado um Algoritmo Genetico (AG), pode-se perguntar se ha a possibilidade de carac-
terizar matematicamente a evolucao temporal de sua populacao. Hollande [79] mostrou
que tal caracterizacao e possıvel atraves do uso do Teorema dos Esquemas.
O Teorema dos Esquemas e baseado no conceito dos esquemas, ou padroes, que des-
crevem um conjunto de strings de bits. De forma mais precisa, um esquema e qualquer
string composta por 0’s, 1’s e *’s. Cada esquema representa uma combinacao de 0’s e 1’s,
onde cada * e utilizado nas posicoes da string onde e irrelevante ter 0 ou 1. Por exemplo,
o esquema,
0 ∗ 10
representa o conjunto de strings: 0010 e 0110.
De forma inversa, cada string em um dado conjunto de strings pode ser vista como
uma representacao de diferentes esquemas que casam com ela. Por exemplo, dada a String
0010, esta pode ser representada por qualquer esquema que case com os bits 0010, como:
00**, *01*, ****, etc, totalizando 24 esquemas possıveis para esta representacao. Da
mesma maneira, a populacao de strings pode ser representada em termos de um conjunto
de esquemas e o numero de associacoes individuais com cada um desses esquemas.
Com a utilizacao da representacao dos indivıduos pelos esquemas, o Teorema dos
Esquemas caracteriza a evolucao da populacao do AG em termos do numero de instancias
que representam cada esquema.
B.1 O TEOREMA DOS ESQUEMAS
Seja m(s, t) o numero de instancias de um esquema s em uma populacao no tempo t (ou
seja, durante a t-esima geracao). O Teorema dos Esquemas ira descrever o valor esperado
201
B.1 O TEOREMA DOS ESQUEMAS 202
de m(s, t + 1) em termos de m(s, t).
Como explicitado no Capıtulo 3, a evolucao da populacao de um AG depende dos
procedimentos de selecao, recombinacao (operacao de cruzamento) e mutacao.
Considerando inicialmente o processo de selecao, seja f(h) a funcao de fitness de uma
string e f(t) a media da funcao de fitness sobre todas as strings da populacao no tempo t.
Seja N o numero total de indivıduos na populacao. Fazendo tambem h ∈ s∩pt, sendo
h um indivıduo que seja representado pelo esquema s e membro da populacao do AG no
tempo t (pt). E, por fim, seja u(s, t) o fitness medio das instancias do esquema s no tempo
t. Deseja-se calcular o valor esperado de m(s, t + 1), representado por E[m(s, t + 1)].
Assumindo que a probabilidade de selecao seja dada por,
Pr(h) =f(h)
∑N
i=1 f(hi)=
f(h)
Nf (t)(B.)
a probabilidade de selecao de um representante do esquema s e,
Pr(h ∈ s) =∑
h∈s∩pt
f(h)
Nf(t)=
u(s, t)
Nf(t)m(s, t). (B.)
Contudo, por definicao,
u(s, t) =
∑h∈s∩t
f(t)
m(s, t)(B.)
o que leva a interpretar a Equacao (B.) como a probabilidade de que um unico indivıduo
seja selecionado pelo AG, sendo este uma instancia do esquema s. Desta forma, o valor
esperado do numero de instancias de s resultante de N passos independentes de selecao,
que ira criar a nova geracao, e exatamente N vezes a Equacao (B.),
E[m(s, t + 1)] =u(s, t)
f(t)m(s, t) (B.)
A Equacao (B.) mostra que o numero de instancias de s, sobre a geracao t + 1, e
proporcional ao fitness medio u(s, t) das instancias deste mesmo esquema no tempo t, e
inversamente proporcional ao fitness medio f(t) de todos os membros da populacao no
tempo t.
A Equacao (B.) nao leva em consideracao as operacoes de cruzamento e mutacao.
B.1 O TEOREMA DOS ESQUEMAS 203
Todas as duas operacoes podem tanto criar novas instancias de s como tambem po-
dem destruir as existentes. Considerando apenas o efeito de destruicao de instancias, o
Teorema dos Esquemas tera um limite inferior para o valor esperado da frequencia dos
esquemas s, dado por,
E[m(s, t + 1)] ≥ u(s, t)
f(t)m(s, t)
(1 − pc
d(s)
l − 1
)(1 − pm)o(s) (B.)
onde pc e a probabilidade do operador de cruzamento (um ponto) ser aplicado a um
indivıduo arbitrario e pm a probabilidade que um bit arbitrario de um indivıduo qualquer
seja alterado (mutacao). o(s) e o numero de bits definidos no esquema s, d(s) e a distancia
entre o bit definido mais a esquerda e o mais a direita no esquema s e l e o comprimento
de um indivıduo da populacao.
A Equacao (B.) e o proprio Teorema dos Esquemas, onde o lado esquerdo e composto
por tres termos. O primeiro, identico ao da Equacao (B.), reflete o efeito do processo de
selecao, o segundo termo (termos central do lado esquerdo) descreve o efeito do operador
de cruzamento, em particular, descreve a probabilidade de um indivıduo representado
por um esquema s ainda ser representado pelo esquema s apos a aplicacao do operador
de cruzamento. Por fim, o ultimo termo (termo mais a direita) descreve a probabilidade
de um indivıduo representado pelo esquema s ainda ser representado pelo esquema s apos
a aplicacao da operacao de mutacao.
Desta forma, o Teorema dos Esquemas pode ser rigorosamente interpretado como
o estatuto que afirma que esquemas com um grande poder de ajuste (muitos *’s) irao
tender a crescer em influencia, especialmente aqueles esquemas cujos bits definidos sejam
proximos uns dos outros.
APENDICE C
VALORES DOS COEFICIENTES PARA OS MODELOS
DE BOX & JENKINS
Neste Apendice sao expostos os valores dos coeficientes auto-regressivos e de medias
moveis obtidos pelos experimentos realizados com os modelos de Box & Jenkins para
cada uma das series temporais apresentadas no Capıtulo 4.
C.1 SERIE DO MAPA DE HENON
Para a Serie do Mapa de Henon os experimentos com os modelos de Box & Jenkins
elegeram o modelo ARIMA(26,0,1). Os coeficientes auto-regressivos sao mostrados na
Tabela C.1, e o unico coeficiente de medias moveis assume o valor de 0.5000.
Tabela C.1: Parametros auto-regressivos selecionados para o modelo ARIMA(26,0,1)referentes a serie do Mapa de Henon, devendo ser lidos da esquerda para a direita, linhaa linha, do coeficiente 1 ao 26.
-0.0037 -0.2896 -0.0199 0.0336 -0.0070 -0.3755 -0.0072 -0.2015-0.1915 0.0013 -0.1527 -0.0058 0.0142 -0.0094 -0.0235 0.00083-0.0085 0.0205 -0.0230 0.0135 0.0113 0.0064 -0.0058 -0.00080.0379
C.2 SERIE DAS MANCHAS SOLARES
Para a serie das Manchas Solares os experimentos com os modelos de Box & Jenkins
selecionaram o modelo ARIMA(9,0,1), cujos coeficientes auto-regressivos sao mostrados
na Tabela C.2 e o unico coeficiente de medias moveis e 0.5000.
204
C.3 SERIE DE MEDIDAS DE BRILHO DE UMA ESTRELA 205
Tabela C.2: Parametros auto-regressivos selecionados para o modelo ARIMA(9,0,1) re-ferentes a serie das Manchas Solares, devendo ser lidos da esquerda para a direita, linhaa linha, do coeficiente 1 ao 9.
1.1939 -0.4251 -0.1600 0.1842 -0.1256 -0.0032 0.0153 0.03220.1559
C.3 SERIE DE MEDIDAS DE BRILHO DE UMA ESTRELA
Para a serie de Medidas de Brilho de uma Estrela, os experimentos de Box & Jenkins
selecionaram o modelo ARIMA(88,0,0), sendo assim constituıdo apenas por coeficientes
auto-regressivos, mostrados na Tabela C.3.
Tabela C.3: Parametros auto-regressivos selecionados para o modelo ARIMA(88,0,0)referentes a serie de Medidas de Brilho de uma Estrela, devendo ser lidos da esquerdapara a direita, linha a linha, do coeficiente 1 ao 88.
0.1786 0.0767 0.0918 0.1298 0.0106 -0.0080 -0.0615 -0.1085-0.0707 -0.2062 -0.0476 -0.0046 -0.0829 -0.1883 -0.1402 -0.0805-0.0397 -0.0039 -0.0724 0.0542 -0.0394 -0.0330 0.0204 0.3008-0.0652 -0.0451 -0.0377 0.0491 0.3532 -0.0377 -0.0548 -0.0989-0.0288 -0.0081 0.0519 0.1110 0.0789 0.1022 0.0080 0.03380.0243 0.0808 0.0012 0.0859 0.0334 -0.0026 -0.0048 -0.2078-0.1448 -0.0341 -0.0586 -0.0274 -0.2068 -0.0348 0.0010 -0.0626-0.0026 0.3634 -0.0218 0.0152 -0.0220 -0.0133 -0.0711 -0.0500-0.0285 0.0165 0.0489 0.0851 0.0345 -0.0261 0.0139 0.2473-0.0397 0.0941 0.0143 0.0576 -0.0958 -0.0054 0.1170 0.06070.0557 -0.0892 0.0192 0.0952 0.0688 0.0342 0.2147 0.1368
C.4 SERIE DO INDICE DOW JONES INDUSTRIAL AVERAGE
Para a serie do Indice Dow Jones Industrial Average os experimentos com os modelos
de Box & Jenkins selecionaram o modelo ARIMA(1,0,1), sendo constituıdo por apenas
dois coeficientes, um auto-regressivo com o valor de 0.9924 e um de medias moveis com
o valor de 0.5003.
C.5 SERIE DO INDICE NASDAQ
Para a serie do Indice Nasdaq os experimentos de Box & Jenkins elegeram o modelo
ARIMA(44,0,1), onde os coeficientes auto-regressivos sao expostos na Tabela C.4, e o
C.6 SERIE DO INDICE S&P500 206
coeficiente de medias moveis e dado por 0.4997.
Tabela C.4: Coeficientes auto-regressivos selecionados para o modelo ARIMA(44,0,1)referentes a serie do Indice Nasdaq, devendo ser lidos da esquerda para a direita, linha alinha, do coeficiente 1 ao 44.
.
0.1461 -0.1592 0.0210 0.0308 -0.0308 -0.0134 0.0305 -0.06740.0374 0.0382 -0.0251 0.0358 -0.0081 -0.0622 0.0549 -0.03670.0069 -0.0289 0.0862 -0.0540 -0.0408 0.0268 0.0118 0.0499-0.0734 0.0628 0.0169 -0.0265 0.0174 0.0202 -0.0719 0.05230.0111 -0.0481 0.0330 0.0058 -0.0781 0.0622 0.0174 -0.05150.0313 -0.0247 0.0652 -0.0374
C.6 SERIE DO INDICE S&P500
Para a serie do Indice S&P500 os experimentos de Box & Jenkins escolheram o modelo
ARIMA(1,0,1) como o mais indicado, contendo o coeficiente auto-regressivo dado por
0.9990 e o coeficiente de medias moveis dado por 0.5010.
C.7 SERIE DO VALOR DE FECHAMENTO DAS ACOES DA PETROBRAS
Para a serie do Valor de Fechamento das Acoes da Petrobras (PetrobrasON) os experi-
mentos com os modelos de Box & Jenkins elegeram o modelo ARIMA(2,0,1), onde os
coeficientes auto-regressivos sao 0.9136 e 0.0855, e o coeficiente de medias moveis e dado
por -0.1714.
C.8 SERIE RANDOM WALK
Para a serie Random Walk os experimentos de Box & Jenkins escolheram o modelo
ARIMA(1,0,1) com o mais apto, sendo o coeficiente auto-regressivo dado por 0.9783 e o
coeficiente de medias moveis dado por 0.4999.
APENDICE D
RESULTADOS EXPERIMENTAIS COM AS REDES
NEURAIS ARTIFICIAIS
Neste Apendice sao mostrados os resultados obtidos para todos os experimento de pre-
visao realizados unicamente com as Rede Neurais Artificiais.
Para cada uma das oito series temporais apresentadas no Capıtulo 4, foram realizadas
dez inicializacoes distintas para tres arquiteturas diferentes, totalizando 240 experimentos.
Para cada uma das series temporais e mostrado uma Tabela contendo todos os valores
das medidas de desempenho utilizadas (Secao 4.10) para cada uma das dez inicializacoes
das tres arquiteturas utilizadas, juntamente com os valores medios e do desvio padrao
para cada uma destas medidas nos conjuntos de treinamento, validacao e teste, sendo:
Tabela D.1 - Resultados para a serie de Henon:
Tabela D.2 - Resultados para a serie das Manchas Solares;
Tabela D.3 - Resultados para a serie de Medida de Brilho de uma Estrela;
Tabela D.4 - Resultados para a serie do Indice Dow Jones Industrial Average;
Tabela D.5 - Resultados para a serie do Indice Nasdaq;
Tabela D.6 - Resultados para a serie do Indice S&P500;
Tabela D.7 - Resultados para a serie do Valor de Fechamento das Acoes da Petrobras;
Tabela D.8 - Resultados para a serie Random Walk.
207
RE
SU
LTA
DO
SE
XP
ER
IME
NTA
ISC
OM
AS
RE
DE
SN
EU
RA
ISA
RT
IFIC
IAIS
208
Tabela D.1: Resultados experimentais para a previsao da serie do mapa de Henon utilizando RNAs. Para todas as medidasde desempenho sao calculadas as suas medias (x), desvios padroes (σx) e intervalos de confianca com um erro de 1% (limiteinferior – Conf−; e limite superior – Conf+). Em negrito e destacada a melhor inicializacao.
RNA x Conjunto de Treinamento Conjunto de Validacao Conjunto de Teste Ep.MSE MAPE Theil POCID ARV AIC BIC MSE MAPE Theil POCID ARV AIC BIC MSE MAPE Theil POCID ARV AIC BIC
4-1-1
1 0.1918 0.2612 0.1847 71.04 0.3671 -8238.7 -8186.0 0.2032 0.7565 0.1946 70.82 0.3878 -3968.1 -3920.3 0.1946 0.3120 0.1863 70.50 0.3717 -4076.1 -4028.3 172 0.1918 0.2607 0.1846 71.04 0.3671 -8239.6 -8187.0 0.2032 0.7592 0.1947 70.82 0.3878 -3968.1 -3920.3 0.1946 0.3120 0.1863 70.50 0.3717 -4076.5 -4028.8 143 0.1918 0.2612 0.1847 71.04 0.3671 -8238.8 -8186.1 0.2032 0.7565 0.1946 70.82 0.3878 -3968.1 -3920.3 0.1946 0.3120 0.1863 70.50 0.3717 -4076.1 -4028.4 194 0.1918 0.2613 0.1847 71.02 0.3671 -8239.2 -8186.6 0.2032 0.7557 0.1946 70.82 0.3878 -3968.1 -3920.3 0.1946 0.3120 0.1863 70.50 0.3717 -4076.4 -4028.6 255 0.1918 0.2604 0.1846 71.02 0.3671 -8239.1 -8186.5 0.2032 0.7615 0.1947 70.82 0.3878 -3968.1 -3920.3 0.1946 0.3120 0.1863 70.50 0.3717 -4076.3 -4028.5 166 0.1918 0.2613 0.1847 71.02 0.3671 -8238.8 -8186.2 0.2033 0.7553 0.1946 70.82 0.3878 -3968.1 -3920.3 0.1946 0.3120 0.1863 70.50 0.3717 -4076.3 -4028.4 257 0.1918 0.2613 0.1847 71.02 0.3671 -8239.2 -8186.6 0.2032 0.7554 0.1946 70.82 0.3878 -3968.1 -3920.3 0.1946 0.3120 0.1863 70.50 0.3717 -4076.3 -4028.6 228 0.1918 0.2612 0.1847 71.04 0.3671 -8238.7 -8186.1 0.2032 0.7567 0.1946 70.82 0.3878 -3968.1 -3920.3 0.1946 0.3120 0.1863 70.50 0.3717 -4076.3 -4028.6 199 0.1918 0.2612 0.1847 71.02 0.3671 -8239.2 -8186.5 0.2032 0.7568 0.1946 70.82 0.3878 -3968.1 -3920.3 0.1946 0.3120 0.1863 70.50 0.3717 -4076.1 -4028.6 2710 0.1918 0.2607 0.1846 71.04 0.3671 -8238.6 -8186.0 0.2032 0.7598 0.1947 70.82 0.3878 -3968.1 -3920.3 0.1946 0.3120 0.1863 70.50 0.3717 -4076.1 -4028.3 17x 0.1918 0.2611 0.1847 71.03 0.3671 -8239.0 -8186.4 0.2032 0.7573 0.1946 70.82 0.3878 -3968.1 -3920.3 0.1946 0.3120 0.1863 70.50 0.3717 -4076.3 -4076.3 20.1σx 0.0000 0.0003 4.8e-5 0.0105 0.0000 0.3178 0.3307 0.0000 2.0961e-3 4.8e-5 0.00 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.1434 0.1595 4.41
Conf.− 0.1918 0.2608 0.1846 71.021 0.3671 -8239.2 -8186.6 0.2032 0.7556 0.1946 70.82 0.3878 -3968.1 -3920.3 0.1946 0.3120 0.1863 70.50 0.3717 -4076.4 -4028.6 16.5Conf.+ 0.1918 0.2613 0.1847 71.039 0.3671 -8238.7 -8186.1 0.2032 0.7590 0.1947 70.82 0.3878 -3968.1 -3920.3 0.1946 0.3120 0.1863 70.50 0.3717 -4076.1 -4028.4 23.7
4-5-1
1 3.1294e-9 8.0834e-9 3.0128e-9 100.00 5.9891e-9 -97811 -97577 3.1634e-9 9.2714e-9 3.0210e-9 100.00 6.0361e-9 -48847 -48635 3.2001e-9 7.9040e-9 3.0633e-9 100.00 6.1124e-9 -48818 -48607 5002 4.0797e-9 1.3108e-8 3.9276e-9 100.00 7.8078e-9 -96485 -96252 4.2557e-9 2.7416e-8 4.0759e-9 100.00 8.1202e-9 -48106 -47894 4.0960e-9 2.7416e-8 4.0760e-9 100.00 7.8235e-9 -48201 -47990 5003 7.1305e-9 2.2262e-8 6.8674e-9 100.00 1.3646e-8 -93694 -93461 7.5604e-9 6.0160e-8 7.2410e-9 100.00 1.4426e-8 -46670 -46458 7.1319e-9 2.5772e-8 6.8272e-9 100.00 1.3622e-8 -46815 -46604 5004 6.5702e-9 2.4353e-8 6.3254e-9 100.00 1.2574e-8 -94103 -93870 6.9692e-9 2.8238e-8 6.6748e-9 100.00 1.3298e-8 -46873 -46662 6.8059e-9 2.8238e-8 6.5151e-9 100.00 1.3000e-8 -46932 -46721 5005 1.1735e-8 3.3023e-8 1.1298e-8 100.00 2.2459e-8 -91204 -90971 1.2063e-8 5.6545e-8 1.1553e-8 100.00 2.3017e-8 -45550 -45291 1.1836e-8 3.4920e-8 1.1330e-8 100.00 2.2607e-8 -45550 -45338 5006 3.0375e-8 7.6297e-8 2.9243e-8 100.00 5.8132e-8 -86451 -86218 3.3041e-8 1.1340e-7 3.1645e-8 100.00 6.3044e-8 -42984 -42773 3.1936e-8 7.3922e-8 3.0571e-8 100.00 6.1000e-8 -43069 -42858 5007 1.0792e-9 2.7330e-9 1.0389e-9 100.00 2.0653e-9 -103132 -102899 1.0745e-9 2.7061e-9 1.0295e-9 100.00 2.0510e-9 -51544 -51333 1.1037e-9 2.6087e-9 1.0566e-9 100.00 2.1082e-9 -51478 -51267 5008 1.4081e-8 3.6891e-8 1.3556e-8 100.00 2.8708e-8 -90294 -90061 1.5046e-8 5.4709e-8 1.4410e-8 100.00 2.8708e-8 -44950 -44738 1.4788e-8 3.5863e-8 1.4156e-8 100.00 2.8246e-8 -44993 -44782 5009 1.1871e-8 3.9646e-8 1.1428e-8 100.00 2.2719e-8 -91147 -90914 1.1842e-8 5.5078e-8 1.1341e-8 100.00 2.2595e-8 -45548 -45337 1.1710e-8 4.1740e-8 1.1210e-8 100.00 2.2367e-8 -45576 -45365 50010 8.9856e-9 2.9673e-8 8.6507e-9 100.00 1.7197e-8 -92539 -92306 9.5041e-9 5.7506e-8 9.1026e-9 100.00 1.8134e-8 -46098 -45886 9.0882e-9 3.1810e-8 8.6998e-9 100.00 1.7359e-8 -46210 -45998 500x 9.9037e-9 2.8607e-8 9.5346e-9 100.00 1.9100e-8 -93686.4 -93453.4 1.0452e-8 4.6503e-8 1.0010e-8 100.00 1.9943e-8 -46712.7 -46501.2 1.0170e-8 3.1019e-8 9.7350e-9 100.00 1.9425e-8 -46764.8 -46553.3 500σx 8.3072e-9 2.0749e-8 7.9975e-9 0.0000 1.6000e-8 4.6190e3 4.6190e3 9.0475e-7 3.1671e-8 8.6654e-9 0.0000 1.7263e-8 2.3589e3 2.3589e3 8.7536e-9 1.9392e-8 8.3795e-9 0.0000 1.6720e-8 2.3219e3 2.3219e3 0.00
Conf.− 3.1371e-9 1.1706e-8 3.0205e-9 100.00 6.0920e-9 -97448 -97215 3.0822e-9 2.0706e-8 2.9504e-9 100.00 5.8812e-9 -48636 -48422 3.0394e-9 1.5223e-8 2.9347e-9 100.00 5.8053e-9 -48655.4 -48444.3 500Conf.+ 1.6670e-8 4.5508e-8 1.6049e-8 100.00 3.2167e-8 -89923 -89690 1.7822e-8 7.2300e-8 1.7068e-8 100.00 3.4005e-8 -44798 -44579 1.7300e-8 4.6816e-8 1.6566E-8 100.00 3.3044e-8 -44873.0 -44661.7 500
4-10-1
1 3.9234e-9 1.0862e-10 3.7770e-11 100.00 7.5087e-11 -119637.4 -119178.9 4.0289e-9 1.1010e-10 3.8590e-11 100.00 7.6875e-11 -59691.4 -59275.2 4.0840e-9 1.0349e-10 3.9090e-11 100.00 7.8006e-11 -59657.5 -59241.3 5002 6.1288e-8 1.5018e-9 5.9004e-10 100.00 1.1729e-9 -105899.8 -105441.3 6.0041e-8 2.3907e-9 5.7505e-10 100.00 1.1456e-9 -52940.3 -52524.0 6.2322e-8 1.4488e-9 5.9659e-10 100.00 1.1904e-9 -52847.1 -52430.9 5003 2.5113e-7 6.9563e-9 2.4177e-9 100.00 4.8062e-9 -98850.6 -98392.1 2.7097e-7 1.4953e-8 2.5953e-9 100.00 5.1704e-9 -49174.3 -48758.1 2.6117e-7 7.7007e-9 2.5001e-9 100.00 4.9884e-9 -49266.4 -48850.2 5004 8.3116e-8 1.5103e-9 8.0018e-10 100.00 1.5907e-9 -104377.2 -103918.6 8.2924e-8 2.1065e-9 7.9421e-10 100.00 1.5822e-9 -52133.4 -51717.1 8.6476e-8 1.6839e-9 8.2781e-10 100.00 1.6517e-9 -52028.6 -51612.3 5005 5.9875e-8 1.2242e-9 5.7643e-10 100.00 1.1459e-9 -106016.5 -105557.9 6.1607e-8 1.4745e-9 5.9005e-10 100.00 1.1755e-9 -52876.0 -52459.7 6.1249e-8 1.2907e-9 5.8631e-10 100.00 1.1699e-9 -52890.5 -52474.3 5006 3.2717e-8 8.7035e-10 3.1498e-10 100.00 6.2614e-10 -109037.0 -108578.5 3.4071e-8 1.5570e-9 3.2632e-10 100.00 6.5009e-10 -54356.2 -53940.0 3.3988e-8 9.2560e-10 3.2536e-10 100.00 6.4919e-10 -54362.3 -53946.0 5007 1.4234e-8 5.9250e-10 1.3703e-10 100.00 2.7240e-10 -113196.8 -112738.3 1.5090e-8 6.2950e-10 1.4452e-10 100.00 2.8792e-10 -56391.5 -55975.2 1.4491e-8 5.6776e-10 1.3872e-10 100.00 2.7679e-10 -56492.5 -56076.3 5008 2.5552e-7 8.1940e-9 2.4600e-9 100.00 4.8902e-9 -98764.1 -98305.6 2.6352e-7 9.6488e-9 2.5239e-9 100.00 5.0282e-9 -49244.0 -48827.7 2.6109e-7 7.0695e-9 2.4993e-9 100.00 4.9869e-9 -49267.2 -48851.0 5009 8.1093e-8 1.7399e-9 7.8070e-10 100.00 1.5520e-9 -104500.4 -104041.8 7.9169e-8 2.2404e-9 7.5825e-10 100.00 1.5106e-9 -52249.2 -51832.9 8.2224e-8 1.9599e-9 7.8710e-10 100.00 1.5705e-9 -52154.6 -51738.3 50010 4.8544e-8 1.5411e-9 4.6735e-10 100.00 9.2904e-10 -107064.9 -106606.4 4.9490e-8 2.0145e-9 4.7399e-10 100.00 9.4430e-10 -53423.2 -53007.0 4.9405e-8 1.6190e-9 4.7294e-10 100.00 9.4367e-10 -53427.5 -53011.3 500x 8.9144e-8 2.4239e-9 8.5822e-10 100.00 1.7061e-9 -106734.5 -106276.0 9.2092e-8 3.7125e-9 8.8202e-10 100.00 1.7572e-9 -53247.9 -52831.7 9.1649e-8 2.4369e-9 8.7733e-10 100.00 1.7505e-9 -53239.4 -52823.2 500σx 9.0285e-8 2.7756e-9 8.6920e-10 0.0000 1.7279e-9 6.2459e3 6.2459e3 9.5720e-8 4.7505e-9 9.1677e-10 0.0000 1.8264e-9 3.1226e3 3.1226e3 9.3140e-8 2.6697e-9 8.9160e-10 0.0000 1.7790e-9 3.1190e3 3.1190e3 0.00
Conf.− 1.5603e-8 1.6303e-10 1.5021e-10 100.00 2.9861e-10 -111822.1 -111363.5 1.4124e-8 1.5699e-10 1.3526e-10 100.00 2.6946e-10 -55791.5 -55375.2 1.5782e-8 2.6235e-10 1.5107e-10 100.00 3.0145e-10 -55780.0 -55363.8 500Conf.+ 1.6268e-7 4.6848e-9 1.5662e-9 100.00 3.1135e-09 -101646.9 -101188.3 1.7006E-7 7.5820e-09 1.6288e-9 100.00 3.2449e-9 -50704.4 -50288.1 1.6752e-7 4.6115e-9 1.6036e-9 100.00 3.1996e-9 -50698.9 -50282.6 500
RE
SU
LTA
DO
SE
XP
ER
IME
NTA
ISC
OM
AS
RE
DE
SN
EU
RA
ISA
RT
IFIC
IAIS
209
Tabela D.2: Resultados experimentais para a previsao da serie das Manchas Solares utilizando RNAs. Para todas as medidasde desempenho sao calculadas as suas medias (x), desvios padroes (σx) e intervalos de confianca com um erro de 1% (limiteinferior – Conf−; e limite superior – Conf+). Em negrito e destacada a melhor inicializacao.
RNA x Conjunto de Treinamento Conjunto de Validacao Conjunto de Teste Ep.MSE MAPE Theil POCID ARV AIC BIC MSE MAPE Theil POCID ARV AIC BIC MSE MAPE Theil POCID ARV AIC BIC
3-1-1
1 0.5643 0.0377 0.4634 71.1268 0.1680 -728.4 -704.6 0.5711 0.0382 0.4747 67.6056 0.1876 -359.9 -340.2 0.0136 0.0368 0.5080 74.2857 0.2093 -293.2 -273.7 102 0.5558 0.0461 0.4565 71.1268 0.1655 -730.5 -706.7 0.5830 0.0478 0.4847 66.1972 0.1915 -358.4 -338.8 0.0137 0.0389 0.5127 72.8571 0.2112 -292.6 -273.0 123 0.5531 0.0437 0.4542 71.1268 0.1647 -731.2 -707.4 0.5830 0.0452 0.4847 66.1972 0.1915 -358.4 -338.8 0.0139 0.0389 0.5202 72.8571 0.2143 -291.6 -272.0 294 0.5729 0.0450 0.4705 70.4225 0.1706 -726.2 -702.4 0.5443 0.0446 0.4525 67.6056 0.1788 -363.4 -343.7 0.0139 0.0370 0.5209 75.7143 0.2146 -291.5 -271.9 95 0.5531 0.0436 0.4542 71.1268 0.1647 -731.2 -707.5 0.5830 0.0451 0.4847 66.1972 0.1915 -358.4 -338.8 0.0139 0.0389 0.5202 72.8571 0.2143 -291.6 -272.0 336 0.5561 0.0478 0.4567 71.1268 0.1656 -730.4 -706.7 0.5813 0.0499 0.4832 66.1972 0.1909 -358.6 -339.0 0.0140 0.0393 0.5241 72.8571 0.2159 -291.0 -271.5 127 0.5574 0.0396 0.4578 71.8310 0.1660 -730.1 -706.3 0.5835 0.0404 0.4850 67.6056 0.1916 -358.4 -338.7 0.0138 0.0381 0.5159 72.8571 0.2125 -292.1 -272.6 128 0.5530 0.0432 0.4541 71.1268 0.1647 -731.3 -707.5 0.5832 0.0446 0.4848 66.1972 0.1916 -358.4 -338.7 0.0139 0.0388 0.5202 72.8571 0.2143 -291.6 -272.0 139 0.5521 0.0415 0.4534 71.1268 0.1644 -731.5 -707.7 0.5844 0.0429 0.4858 66.1972 0.1920 -358.2 -338.6 0.0142 0.0391 0.5314 72.8571 0.2189 -290.0 -270.5 1510 0.5521 0.0416 0.4534 71.1268 0.1644 -731.5 -707.7 0.5844 0.0430 0.4858 66.1972 0.1919 -358.2 -338.6 0.0142 0.0391 0.5310 72.8571 0.2187 -290.1 -270.5 15x 0.5570 0.0430 0.4574 71.1268 0.1659 -730.2 -706.5 0.5781 0.0442 0.4806 66.6197 0.1899 -359.0 -339.4 0.0139 0.0385 0.5205 73.2857 0.2144 -291.5 -272.0 16.0σx 0.0067 0.0030 0.0055 0.3320 1.9879e-3 1.7012 1.7012 0.0125 0.0034 0.0104 0.6803 4.1011e-3 1.5946 1.5946 0.0002 0.0009 0.0073 0.9642 2.9985e-3 9.9605e-1 9.9605e-1 8.18
Conf.− 0.5515 0.0405 0.4529 70.8564 0.1642 -731.6 -707.8 0.5679 0.0414 0.4721 66.0656 0.1865 -360.3 -340.7 0.0138 0.0378 0.5145 72.5003 0.2120 -292.3 -272.8 9.3Conf.+ 0.5624 0.0454 0.4619 71.3972 0.1675 -728.8 -705.1 0.5883 0.0469 0.4891 67.1739 0.1932 -357.7 -338.1 0.0141 0.0392 0.5264 74.0711 0.2168 -290.7 -271.2 22.7
3-5-1
1 0.4389 0.0347 0.3604 76.7606 0.1307 -724.3 -621.3 0.5156 0.0360 0.4286 70.4225 0.1693 -327.3 -242.1 0.0117 0.0293 0.4378 87.1429 0.1803 -263.8 -179.0 182 0.4522 0.0378 0.3713 78.1690 0.1346 -720.0 -617.0 0.4861 0.0376 0.4041 73.2394 0.1597 -331.5 -246.3 0.0130 0.0338 0.4879 82.8571 0.2010 -256.1 -171.3 123 0.4357 0.0347 0.3578 77.4648 0.1298 -725.3 -622.3 0.4893 0.0371 0.4067 71.8310 0.1607 -331.0 -245.8 0.0128 0.0326 0.4793 81.4286 0.1974 -257.4 -172.5 274 0.4242 0.0338 0.3484 77.4648 0.1263 -729.2 -626.1 0.5040 0.0370 0.4190 73.2394 0.1655 -328.9 -243.7 0.0110 0.0284 0.4125 88.5714 0.1699 -268.0 -183.2 245 0.4425 0.0405 0.3634 76.7606 0.1318 -723.1 -620.1 0.5050 0.0419 0.4198 71.8310 0.1659 -328.8 -243.6 0.0109 0.0286 0.4084 87.1429 0.1682 -268.7 -183.9 156 0.4296 0.0373 0.3528 75.3521 0.1279 -727.4 -624.3 0.5198 0.0431 0.4321 67.6056 0.1707 -326.7 -241.5 0.9624 0.0261 0.3600 87.1429 0.1483 -277.7 -192.9 297 0.4570 0.0363 0.3753 77.4648 0.1361 -718.5 -615.5 0.5251 0.0368 0.4365 69.0141 0.1725 -325.9 -240.8 0.0110 0.0294 0.4129 85.7143 0.1701 -268.0 -183.1 138 0.4762 0.0419 0.3911 75.3521 0.1418 -712.6 -609.6 0.5229 0.0411 0.4347 67.6056 0.1718 -326.2 -241.1 0.0111 0.0301 0.4142 84.2857 0.1706 -267.7 -182.9 119 0.3823 0.0347 0.3140 76.7606 0.1139 -744.0 -641.0 0.5125 0.0465 0.4260 70.4225 0.1683 -327.7 -242.5 0.9205 0.0241 0.3443 90.0000 0.1418 -280.9 -196.0 2810 0.4458 0.0320 0.3661 78.1690 0.1327 -722.1 -619.0 0.4912 0.0327 0.4083 73.2394 0.1613 -330.8 -245.6 0.0130 0.0318 0.4864 82.8571 0.2003 -256.3 -171.5 16x 0.4384 0.0364 0.3601 76.9718 0.1306 -724.7 -621.6 0.5072 0.0390 0.4216 70.8451 0.1666 -328.5 -243.3 0.1978 0.0294 0.4244 85.7143 0.1748 -266.5 -181.6 19.3σx 0.0246 0.0031 0.0202 0.9987 7.3246e-3 8.2732 8.2732 0.0144 0.0041 0.0120 2.2071 4.7263e-3 2.0534 2.0534 0.3921 0.0029 0.0497 2.7766 2.0484e-2 8.4602 8.4602 7.02
Conf.− 0.4184 0.0339 0.3436 76.1584 0.1246 -731.4 -628.4 0.4954 0.0357 0.4118 69.0473 0.1627 -330.2 -245.0 0.1216 0.0270 0.3839 83.4526 0.1581 -273.4 -188.5 13.6Conf.+ 0.4585 0.0389 0.3765 77.7853 0.1365 -717.9 -614.9 0.5189 0.0423 0.4313 72.6428 0.1704 -326.8 -241.6 0.5171 0.0318 0.4649 87.9760 0.1915 -259.6 -174.7 25.0
3-10-1
1 0.4532 0.0321 0.3722 77.4648 0.1350 -669.7 -467.6 0.5134 0.0332 0.4267 69.0141 0.1686 -277.6 -110.5 0.0113 0.0297 0.4229 85.7143 0.1742 -216.3 -49.9 112 0.4250 0.0350 0.3490 75.3521 0.1266 -678.9 -476.8 0.5222 0.0412 0.4341 67.6056 0.1715 -276.3 -109.2 0.9175 0.0259 0.3432 84.2857 0.1414 -231.1 -64.7 193 0.4303 0.0329 0.3534 76.0563 0.1281 -677.1 -475.0 0.5305 0.0369 0.4410 73.2394 0.1742 -275.2 -108.1 0.9484 0.0256 0.3548 85.7143 0.1461 -228.7 -62.3 184 0.4450 0.0353 0.3655 75.3521 0.1325 -672.3 -470.2 0.5235 0.0377 0.4352 69.0141 0.1719 -276.2 -109.1 0.0101 0.0275 0.3784 84.2857 0.1559 -224.1 -57.7 145 0.4427 0.0358 0.3636 76.7606 0.1318 -673.0 -470.9 0.5168 0.0381 0.4296 71.8310 0.1697 -277.1 -110.0 0.0101 0.0266 0.3781 84.2857 0.1558 -224.2 -57.8 126 0.4341 0.0321 0.3565 76.0563 0.1293 -675.9 -473.8 0.5228 0.0361 0.4346 71.8310 0.1717 -276.3 -109.2 0.9623 0.0271 0.3600 82.8571 0.1483 -227.7 -61.3 127 0.4358 0.0322 0.3579 75.3521 0.1298 -675.3 -473.2 0.5341 0.0361 0.4440 70.4225 0.1754 -274.7 -107.6 0.0101 0.0267 0.3783 84.2857 0.1558 -224.2 -57.8 118 0.4173 0.0326 0.3427 75.3521 0.1243 -681.5 -479.4 0.5270 0.0403 0.4381 69.0141 0.1731 -275.7 -108.6 0.9095 0.0255 0.3402 85.7143 0.1401 -231.7 -65.3 139 0.3894 0.0306 0.3198 77.4648 0.1160 -691.4 -489.3 0.5522 0.0442 0.4590 70.4225 0.1814 -272.3 -105.2 0.8471 0.0238 0.3169 84.2857 0.1305 -236.8 -70.4 1510 0.4384 0.0317 0.3601 76.0563 0.1306 -674.5 -472.3 0.5373 0.0351 0.4467 73.2394 0.1765 -274.3 -107.2 0.9680 0.0265 0.3621 85.7143 0.1492 -227.3 -60.9 11x 0.4311 0.0330 0.3541 76.1268 0.1284 -677.0 -474.9 0.5280 0.0379 0.4389 70.5634 0.1734 -275.6 -108.5 0.5595 0.0265 0.3635 84.7143 0.1497 -227.2 -60.8 13.6σx 0.0179 0.0018 0.0147 0.8431 5.3066e-3 6.0819 6.0819 0.0112 0.0032 0.0094 1.9300 3.7091e-3 1.5216 1.5216 0.4737 0.0015 0.0287 0.9642 1.1823e-2 5.5417 5.5417 2.91
Conf.− 0.4166 0.0316 0.3421 75.4400 0.1241 -681.9 -479.8 0.5188 0.0353 0.4313 68.9913 0.1704 -276.8 -109.7 0.1736 0.0252 0.3401 83.9289 0.1401 -231.7 -65.3 11.2Conf.+ 0.4457 0.0344 0.3660 76.8135 0.1327 -672.0 -469.9 0.5371 0.0405 0.4465 72.1355 0.1764 -274.3 -107.2 0.9453 0.0277 0.3868 85.4997 0.1594 -222.7 -56.3 16.0
RE
SU
LTA
DO
SE
XP
ER
IME
NTA
ISC
OM
AS
RE
DE
SN
EU
RA
ISA
RT
IFIC
IAIS
210
Tabela D.3: Resultados experimentais para a previsao da serie de Medidas de Brilhos de uma Estrela utilizando RNAs. Paratodas as medidas de desempenho sao calculadas as suas medias (x), desvios padroes (σx) e intervalos de confianca com umerro de 1% (limite inferior – Conf−; e limite superior – Conf+). Em negrito e destacada a melhor inicializacao.
RNA x Conjunto de Treinamento Conjunto de Validacao Conjunto de Teste Ep.MSE MAPE Theil POCID ARV AIC BIC MSE MAPE Theil POCID ARV AIC BIC MSE MAPE Theil POCID ARV AIC BIC
3-1-1
1 0.0234 0.0007 0.0605 76.85 3.3887e-3 -2487.1 -2458.9 0.0256 0.0009 0.0658 73.65 3.7031e-3 -1220.5 -1196.4 0.0237 0.0009 0.0641 73.65 3.3790e-3 -1232.0 -1208.0 452 0.0234 0.0007 0.0605 76.85 3.3882e-3 -2487.1 -2458.9 0.0256 0.0009 0.0658 73.65 3.7029e-3 -1220.5 -1196.4 0.0237 0.0009 0.0640 73.65 3.3773e-3 -1232.1 -1208.0 343 0.0234 0.0007 0.0605 76.85 3.3883e-3 -2487.1 -2458.9 0.0256 0.0009 0.0658 73.65 3.7033e-3 -1220.5 -1196.4 0.0237 0.0009 0.0640 73.65 3.3769e-3 -1232.1 -1208.1 224 0.0234 0.0007 0.0605 76.85 3.3881e-3 -2487.1 -2458.9 0.0256 0.0009 0.0658 73.65 3.7032e-3 -1220.5 -1196.4 0.0237 0.0009 0.0640 73.65 3.3770e-3 -1232.1 -1208.1 125 0.0234 0.0007 0.0605 76.85 3.3882e-3 -2487.1 -2458.9 0.0256 0.0009 0.0658 73.65 3.7028e-3 -1220.5 -1196.5 0.0237 0.0009 0.0640 73.65 3.3776e-3 -1232.1 -1208.0 476 0.0234 0.0007 0.0605 76.85 3.3882e-3 -2487.1 -2458.9 0.0256 0.0009 0.0658 73.65 3.7028e-3 -1220.5 -1196.5 0.0237 0.0009 0.0640 73.65 3.3776e-3 -1232.1 -1208.0 557 0.0234 0.0007 0.0606 76.85 3.3887e-3 -2487.1 -2458.9 0.0256 0.0009 0.0658 73.65 3.7031e-3 -1220.5 -1196.4 0.0237 0.0009 0.0641 73.65 3.3790e-3 -1232.0 -1208.0 438 0.0234 0.0007 0.0605 76.85 3.3882e-3 -2487.1 -2458.9 0.0256 0.0009 0.0658 73.65 3.7028e-3 -1220.5 -1196.5 0.0237 0.0009 0.0640 73.65 3.3776e-3 -1232.1 -1208.0 509 0.0234 0.0007 0.0605 76.85 3.3881e-3 -2487.1 -2458.9 0.0256 0.0009 0.0658 73.65 3.7033e-3 -1220.5 -1196.4 0.0237 0.0009 0.0640 73.65 3.3769e-3 -1232.1 -1208.1 1410 0.0234 0.0007 0.0605 76.85 3.3882e-3 -2487.1 -2458.9 0.0256 0.0009 0.0658 73.65 3.7028e-3 -1220.5 -1196.5 0.0237 0.0009 0.0640 73.65 3.3776e-3 -1232.1 -1208.0 49x 0.0234 0.0007 0.0605 76.85 3.3883e-3 -2487.1 -2458.9 0.0256 0.0009 0.0658 73.65 3.7030e-3 -1220.5 -1196.4 0.0237 0.0009 0.0640 73.65 3.3777e-3 -1232.1 -1208.0 37.1σx 0.0000 0.0000 0.0000 0.0000 2.2336e-7 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 2.1318e-7 0.0000 0.0516 0.0000 0.0000 4.2e-5 0.0000 7.6920e-7 0.0422 0.0483 15.72
Conf.− 0.0234 0.0007 0.0605 76.85 3.3881e-3 -2487.1 -2458.9 0.0256 0.0009 0.0658 73.65 3.7028e-3 -1220.5 -1196.5 0.0237 0.0009 0.0640 73.65 3.3770e-3 -1232.1 -1208.1 24.29Conf.+ 0.0234 0.0007 0.0605 76.85 3.3885e-3 -2487.1 -2458.9 0.0256 0.0009 0.0658 73.65 3.7032e-3 -1220.5 -1196.4 0.0237 0.0009 0.0641 73.65 3.3783e-3 -1232.0 -1208.0 49.91
3-5-1
1 0.0229 0.0006 0.0592 76.85 3.3111e-3 -2454.0 -2331.8 0.0251 0.0009 0.0646 74.32 3.6364e-3 -1183.2 -1079.1 0.0235 0.0010 0.0635 72.97 3.3500e-3 -1193.3 -1089.2 1252 0.0232 0.0006 0.0598 76.85 3.3489e-3 -2450.6 -2328.4 0.0254 0.0009 0.0654 73.65 3.6836e-3 -1181.3 -1077.1 0.0235 0.0010 0.0635 72.97 3.3518e-3 -1193.2 -1089.1 233 0.0231 0.0006 0.0597 76.85 3.3422e-3 -2451.2 -2329.0 0.0252 0.0009 0.0649 73.65 3.6547e-3 -1182.4 -1078.3 0.0234 0.0010 0.0632 72.97 3.3357e-3 -1193.9 -1089.8 594 0.0231 0.0006 0.0596 76.85 3.3339e-3 -2452.0 -2329.8 0.0255 0.0009 0.0655 73.65 3.6897e-3 -1181.0 -1076.9 0.0235 0.0010 0.0637 72.97 3.3618e-3 -1192.8 -1088.6 155 0.0233 0.0006 0.0602 76.85 3.3669e-3 -2449.0 -2326.8 0.0255 0.0009 0.0657 73.65 3.6969e-3 -1180.7 -1076.6 0.0236 0.0009 0.0639 73.65 3.3690e-3 -1192.4 -1088.3 356 0.0233 0.0007 0.0602 76.85 3.3679e-3 -2448.9 -2326.7 0.0254 0.0009 0.0654 73.65 3.6797e-3 -1181.4 -1077.3 0.0236 0.0009 0.0638 73.65 3.3642e-3 -1192.6 -1088.5 137 0.0228 0.0006 0.0588 76.85 3.2911e-3 -2455.8 -2333.6 0.0249 0.0009 0.0641 74.32 3.6060e-3 -1184.4 -1080.3 0.0235 0.0010 0.0635 73.65 3.3509e-3 -1193.2 -1089.1 1368 0.0231 0.0006 0.0598 76.85 3.3448e-3 -2451.0 -2328.8 0.0253 0.0009 0.0651 73.65 3.6623e-3 -1182.1 -1078.0 0.0234 0.0010 0.0633 72.97 3.3387e-3 -1193.8 -1089.7 139 0.0232 0.0006 0.0599 76.85 3.3517e-3 -2450.4 -2328.2 0.0256 0.0009 0.0658 73.65 3.7031e-3 -1180.5 -1076.4 0.0236 0.0010 0.0638 72.97 3.3659e-3 -1192.6 -1088.5 1510 0.0231 0.0006 0.0596 76.85 3.3365e-3 -2451.7 -2329.5 0.0255 0.0009 0.0656 73.65 3.6956e-3 -1180.8 -1076.7 0.0236 0.0010 0.0640 72.97 3.3757e-3 -1192.1 -1088.0 20x 0.0231 0.0006 0.0597 76.85 3.3395e-3 -2451.5 -2329.3 0.0253 0.0009 0.0652 73.78 3.6708e-3 -1181.8 -1077.7 0.0235 0.0010 0.0636 73.17 3.3564e-3 -1193.0 -1088.9 45.4σx 0.0002 3.2e-5 0.0004 0.0000 2.3616e-5 2.1183 2.1182 0.0002 0.0000 0.0005 0.2825 3.1008e-5 1.2524 1.2570 7.9e-5 0.0000 0.0003 0.3285 1.3105e-5 0.5915 0.5959 47.06
Conf.− 0.0230 5.8424e-4 0.0593 76.85 3.3203e-3 -2453.2 -2331.0 0.0252 0.0009 0.0648 73.55 3.6455e-3 -1182.8 -1078.7 0.0235 0.0010 0.0634 72.90 3.3457e-3 -1193.5 -1089.4 7.07Conf.+ 0.0232 6.3576e-4 0.0600 76.85 3.3587e-3 -2449.7 -2327.5 0.0255 0.0009 0.0656 74.01 3.6961e-3 -1180.6 -1076.6 0.0236 0.0010 0.0638 73.44 3.3670e-3 -1192.5 -1088.4 83.73
3-10-1
1 0.0232 0.0006 0.0600 76.85 3.3574e-3 -2399.9 -2160.1 0.0255 0.0009 0.0655 73.65 3.6879e-3 -1131.1 -926.9 0.0235 0.0010 0.0637 72.97 3.3603e-3 -1142.8 -938.6 182 0.0231 0.0006 0.0595 76.85 3.3322e-3 -2402.1 -2162.4 0.0253 0.0009 0.0650 74.32 3.6590e-3 -1132.2 -928.0 0.0235 0.0010 0.0636 72.97 3.3521e-3 -1143.2 -939.0 543 0.0230 0.0006 0.0595 76.85 3.3271e-3 -2402.6 -2162.8 0.0254 0.0009 0.0653 74.32 3.6754e-3 -1131.6 -927.4 0.0236 0.0010 0.0638 72.97 3.3629e-3 -1142.7 -938.5 654 0.0233 0.0007 0.0602 76.85 3.3715e-3 -2398.6 -2158.9 0.0256 0.0009 0.0658 73.65 3.7033e-3 -1130.5 -926.3 0.0236 0.0009 0.0640 73.65 3.3747e-3 -1142.2 -938.0 175 0.0232 0.0006 0.0599 76.85 3.3512e-3 -2400.4 -2160.7 0.0253 0.0009 0.0652 73.65 3.6697e-3 -1131.8 -927.6 0.0234 0.0010 0.0634 72.97 3.3418e-3 -1143.6 -939.4 326 0.0231 0.0006 0.0597 76.85 3.3384e-3 -2401.6 -2161.8 0.0252 0.0009 0.0649 73.65 3.6522e-3 -1132.5 -928.3 0.0233 0.0010 0.0632 72.97 3.3319e-3 -1144.1 -939.9 357 0.0229 0.0006 0.0591 76.85 3.3057e-3 -2404.5 -2164.8 0.0250 0.0009 0.0642 74.32 3.6141e-3 -1134.1 -929.9 0.0234 0.0010 0.0634 72.97 3.3419e-3 -1143.6 -939.4 1498 0.0229 0.0006 0.0591 76.85 3.3096e-3 -2404.2 -2164.4 0.0251 0.0009 0.0647 74.32 3.6401e-3 -1133.0 -928.8 0.0235 0.0010 0.0637 72.97 3.3616e-3 -1142.8 -938.6 1229 0.0230 0.0006 0.0594 76.85 3.3226e-3 -2403.0 -2163.3 0.0252 0.0009 0.0648 74.32 3.6460e-3 -1132.8 -928.6 0.0234 0.0010 0.0634 72.97 3.3444e-3 -1143.5 -939.3 9810 0.0233 0.0006 0.0601 76.85 3.3624e-3 -2399.4 -2159.7 0.0255 0.0009 0.0656 73.65 3.6934e-3 -1130.9 -926.7 0.0235 0.0010 0.0637 72.97 3.3620e-3 -1142.7 -938.5 26x 0.0231 0.0006 0.0597 76.85 3.3378e-3 -2401.6 -2161.9 0.0253 0.0009 0.0651 73.99 3.6641e-3 -1132.1 -927.6 0.0235 0.0010 0.0636 73.04 3.3534e-3 -1443.1 -938.9 61.5σx 0.0001 3.2e-5 0.0004 0.0000 2.2379e-5 2.0150 2.0058 0.0002 0.0000 0.0005 0.3531 2.7268e-5 1.0947 1.0947 9.5e-5 0.0000 0.0002 0.2150 1.3100e-5 0.5750 0.5750 46.45
Conf.− 0.0230 5.8424e-4 0.0593 76.85 3.3196e-3 -2403.3 -2163.5 0.0252 0.0009 0.0647 73.6974 3.6419e-3 -1132.9 -928.7 0.0234 0.0010 0.0634 72.8628 3.3427e-3 -1143.6 -939.4 23.76Conf.+ 0.0232 6.3576e-4 0.0600 76.85 3.3560e-3 -2400.0 -2160.3 0.0255 0.0009 0.0655 74.2726 3.6863e-3 -1131.2 -927.0 0.0235 0.0010 0.0638 73.2132 3.3640e-3 -1142.7 -938.5 99.44
RE
SU
LTA
DO
SE
XP
ER
IME
NTA
ISC
OM
AS
RE
DE
SN
EU
RA
ISA
RT
IFIC
IAIS
211
Tabela D.4: Resultados experimentais para a previsao da serie do Indice Dow Jones Industrial Average utilizando RNAs.Para todas as medidas de desempenho sao calculadas as suas medias (x), desvios padroes (σx) e intervalos de confianca comum erro de 1% (limite inferior – Conf−; e limite superior – Conf+). Em negrito e destacada a melhor inicializacao.
RNA x Conjunto de Treinamento Conjunto de Validacao Conjunto de Teste Ep.MSE MAPE Theil POCID ARV AIC BIC MSE MAPE Theil POCID ARV AIC BIC MSE MAPE Theil POCID ARV AIC BIC
3-1-1
1 0.0674 0.0019 0.9842 50.1412 1.1465e-2 -5165.6 -5132.2 0.0848 0.0015 0.9940 45.8924 5.0697e-2 -2491.6 -2462.3 0.0831 0.0038 0.9924 46.7422 3.4035e-2 -2499.1 -2469.9 112 0.0685 0.0020 1.0009 50.1412 1.1659e-2 -5153.6 -5120.3 0.0849 0.0015 0.9942 46.4589 5.0705e-2 -2491.5 -2462.3 0.0828 0.0039 0.9899 46.1756 3.3949e-2 -2500.0 -2470.7 133 0.0705 0.0019 1.0291 50.5650 1.1988e-2 -5133.9 -5100.5 0.0850 0.0015 0.9954 45.3258 5.0765e-2 -2491.1 -2461.9 0.0840 0.0038 1.0033 46.7422 3.4408e-2 -2495.2 -2466.0 114 0.0670 0.0019 0.9789 50.5650 1.1402e-2 -5169.4 -5136.1 0.0855 0.0015 1.0013 45.3258 5.1068e-2 -2489.0 -2459.8 0.0838 0.0038 1.0009 47.0255 3.4327e-2 -2496.0 -2466.8 155 0.0681 0.0019 0.9952 50.5650 1.1593e-2 -5157.7 -5124.3 0.0850 0.0015 0.9962 45.3258 5.0808e-2 -2490.8 -2461.6 0.0827 0.0037 0.9878 46.7422 3.3877e-2 -2500.7 -2471.5 126 0.0670 0.0019 0.9789 50.5650 1.1402e-2 -5169.4 -5136.1 0.0855 0.0015 1.0013 45.3258 5.1069e-2 -2489.0 -2459.8 0.0838 0.0038 1.0009 47.0255 3.4328e-2 -2496.0 -2466.8 187 0.0674 0.0019 0.9843 50.5650 1.1465e-2 -5165.5 -5132.1 0.0848 0.0015 0.9941 45.3258 5.0700e-2 -2491.5 -2462.3 0.0830 0.0038 0.9912 47.0255 3.3995e-2 -2499.5 -2470.3 118 0.0670 0.0019 0.9789 50.5650 1.1403e-2 -5169.4 -5136.0 0.0854 0.0015 1.0008 45.3258 5.1042e-2 -2489.2 -2459.9 0.0839 0.0038 1.0026 47.0255 3.4384e-2 -2495.5 -2466.2 129 0.0673 0.0019 0.9831 50.5650 1.1451e-2 -5166.4 -5133.0 0.0850 0.0015 0.9958 45.6091 5.0789e-2 -2490.9 -2461.7 0.0845 0.0039 1.0098 46.7422 3.4634e-2 -2492.9 -2463.7 1210 0.0670 0.0019 0.9788 50.5650 1.1401e-2 -5169.5 -5136.1 0.0855 0.0015 1.0021 45.3258 5.1110e-2 -2488.7 -2459.5 0.0838 0.0038 1.0007 47.0255 3.4320e-2 -2496.1 -2466.9 15x 0.0677 0.0019 0.9892 50.4802 1.1523e-2 -5162.1 -5128.7 0.0851 0.0015 0.9975 45.5241 5.0875e-2 -2490.3 -2461.1 0.0835 0.0038 0.9979 46.8272 3.4226e-2 -2497.1 -2467.9 13.0σx 0.0011 0.0000 0.0159 0.1787 1.8562e-4 11.2650 11.2650 0.0003 0.0000 0.0034 0.3789 1.7423e-4 1.2111 1.2111 0.0006 5.6765e-5 0.0072 0.2687 2.4548e-4 2.5388 2.5388 2.31
Conf.− 0.0668 0.0019 0.9763 50.3347 1.1372e-2 -5171.2 -5137.9 0.0849 0.0015 0.9947 45.2155 5.0733e-2 -2491.3 -2462.1 0.0831 3.7638e-3 0.9921 46.6083 3.4026e-2 -2499.2 -2469.9 11.12Conf.+ 0.0686 0.0019 1.0022 50.6258 1.1674e-2 -5152.9 -5119.5 0.0854 0.0015 1.0003 45.8327 5.1017e-2 -2489.3 -2460.1 0.0840 3.8562e-3 1.0038 47.0461 3.4426e-2 -2495.0 -2465.8 14.88
3-5-1
1 0.0670 0.0019 0.9784 50.7062 1.1397e-2 -5129.7 -4985.1 0.0850 0.0015 0.9963 45.6091 5.0814e-2 -2450.7 -2324.1 0.0841 0.0038 1.0047 46.4589 3.4457e-2 -2454.7 -2328.1 112 0.0677 0.0019 0.9884 50.4237 1.1513e-2 -5122.6 -4977.9 0.0847 0.0015 0.9919 45.6091 5.0590e-2 -2452.3 -2325.7 0.0840 0.0038 1.0038 47.0255 3.4426e-2 -2455.0 -2328.4 113 0.0673 0.0019 0.9838 50.5650 1.1460e-2 -5125.9 -4981.2 0.0848 0.0015 0.9935 45.3258 5.0669e-2 -2451.8 -2325.2 0.0832 0.0038 0.9941 46.7422 3.4092e-2 -2458.5 -2331.9 114 0.0707 0.0021 1.0325 50.7062 1.2027e-2 -5091.6 -4946.9 0.0849 0.0015 0.9950 45.0425 5.0745e-2 -2451.2 -2324.6 0.0861 0.0041 1.0285 47.3088 3.5274e-2 -2446.4 -2319.8 115 0.0667 0.0019 0.9736 50.5650 1.1341e-2 -5133.2 -4988.6 0.0862 0.0015 1.0099 45.6091 5.1506e-2 -2446.0 -2319.4 0.0853 0.0039 1.0189 47.0255 3.4943e-2 -2449.8 -2323.1 146 0.0673 0.0019 0.9825 50.1412 1.1445e-2 -5126.8 -4982.1 0.0854 0.0015 1.0006 45.6091 5.1033e-2 -2449.2 -2322.6 0.0850 0.0039 1.0153 46.1756 3.4821e-2 -2451.0 -2324.4 667 0.0671 0.0019 0.9804 50.5650 1.1420e-2 -5128.4 -4983.7 0.0850 0.0015 0.9954 45.3258 5.0768e-2 -2451.1 -2324.5 0.0833 0.0038 0.9959 46.7422 3.4155e-2 -2457.8 -2331.2 158 0.0674 0.0019 0.9848 50.5650 1.1472e-2 -5125.1 -4980.5 0.0848 0.0015 0.9935 45.3258 5.0669e-2 -2451.8 -2325.2 0.0829 0.0038 0.9910 46.7422 3.3988e-2 -2459.6 -2333.0 119 0.0659 0.0019 0.9629 50.0000 1.1216e-2 -5141.1 -4996.5 0.0854 0.0015 1.0005 45.8924 5.1028e-2 -2449.3 -2322.7 0.0851 0.0039 1.0163 46.4589 3.4855e-2 -2450.6 -2324.0 4210 0.0671 0.0019 0.9808 50.5650 1.1425e-2 -5128.0 -4983.4 0.0852 0.0015 0.9986 45.3258 5.0927e-2 -2450.0 -2323.4 0.0846 0.0039 1.0113 46.7422 3.4682e-2 -2452.4 -2325.8 17x 0.0674 0.0019 0.9848 50.4802 1.1472e-2 -5125.2 -4980.6 0.0851 0.0015 0.9975 45.4674 5.0875e-2 -2450.3 -2323.7 0.0844 0.0039 1.0080 46.7422 3.4569e-2 -2453.6 -2327.0 20.9σx 0.0012 0.0000 0.0182 0.2326 2.1182e-4 12.8880 12.8880 0.0004 0.0000 0.0053 0.2407 2.6820e-4 1.8607 1.8607 0.0010 0.0001 0.0122 0.3271 4.1693e-4 4.2683 4.2683 18.46
Conf.− 0.0664 1.8684e-2 0.9700 50.2908 1.1299e-2 -5135.7 -4991.1 0.0848 0.0015 0.9932 45.2713 5.0656e-2 -2451.8 -2325.2 0.0835 0.0038 0.9981 46.4757 3.4230e-2 -2457.1 -2330.5 5.86Conf.+ 0.0684 1.9715e-2 0.9996 50.6697 1.1644e-2 -5114.7 -4970.1 0.0855 0.0015 1.0018 45.6635 5.1093e-2 -2448.8 -2322.2 0.0852 0.0039 1.0179 47.0087 3.4909e-2 -2450.1 -2323.5 35.94
3-10-1
1 0.0668 0.0019 0.9762 50.5650 1.1371e-2 -5081.4 -4797.6 0.0856 0.0015 1.0030 45.3258 5.1152e-2 -2398.4 -2150.1 0.0840 0.0038 1.0032 47.0255 3.4404e-2 -2405.3 -2156.9 112 0.0668 0.0019 0.9760 50.4237 1.1369e-2 -5081.5 -4797.7 0.0852 0.0015 0.9978 45.8924 5.0889e-2 -2400.2 -2151.9 0.0840 0.0038 1.0041 47.0255 3.4436e-2 -2404.9 -2156.6 133 0.0665 0.0019 0.9721 50.2825 1.1323e-2 -5084.4 -4800.6 0.0856 0.0015 1.0034 45.6091 5.1173e-2 -2398.3 -2149.9 0.0848 0.0038 1.0129 47.0255 3.4739e-2 -2401.8 -2153.5 234 0.0666 0.0019 0.9728 50.5650 1.1332e-2 -5083.8 -4800.1 0.0859 0.0015 1.0064 45.8924 5.1329e-2 -2397.2 -2148.8 0.0850 0.0039 1.0156 47.0255 3.4829e-2 -2400.9 -2152.6 135 0.0672 0.0019 0.9816 50.5650 1.1435e-2 -5077.4 -4793.7 0.0850 0.0015 0.9964 45.8924 5.0817e-2 -2400.7 -2152.4 0.0844 0.0039 1.0080 46.7422 3.4570e-2 -2403.5 -2155.2 136 0.0657 0.0019 0.9600 50.0000 1.1183e-2 -5093.2 -4809.4 0.0846 0.0015 0.9907 46.7422 5.0528e-2 -2402.7 -2154.4 0.0859 0.0040 1.0261 46.7422 3.5191e-2 -2397.2 -2148.9 227 0.0667 0.0019 0.9747 50.5650 1.1354e-2 -5082.4 -4798.7 0.0856 0.0015 1.0035 45.6091 5.1180e-2 -2398.2 -2149.9 0.0844 0.0039 1.0085 46.4589 3.4589e-2 -2403.4 -2155.0 208 0.0670 0.0019 0.9792 50.7062 1.1406e-2 -5079.2 -4795.5 0.0852 0.0015 0.9983 45.3258 5.0917e-2 -2400.0 -2151.7 0.0837 0.0038 1.0003 47.3088 3.4307e-2 -2406.3 -2157.9 119 0.0666 0.0019 0.9732 50.7062 1.1336e-2 -5083.5 -4799.8 0.0857 0.0015 1.0037 45.6091 5.1189e-2 -2398.1 -2149.8 0.0847 0.0038 1.0122 47.0255 3.4715e-2 -2402.1 -2153.7 1810 0.0666 0.0019 0.9736 50.5650 1.1341e-2 -5083.3 -4799.5 0.0855 0.0015 1.0013 45.6091 5.1066e-2 -2399.0 -2150.7 0.0847 0.0039 1.0119 47.0255 3.4705e-2 -2402.2 -2153.8 19x 0.0667 0.0019 0.9740 50.4944 1.1345e-2 -5083.0 -4799.3 0.0854 0.0015 1.0004 45.7507 5.1024e-2 -2399.3 -2151.0 0.0846 0.0039 1.0103 46.9405 3.4649e-2 -2402.8 -2154.4 16.3σx 0.0004 0.0000 0.0057 0.2132 6.6790e-5 4.1827 4.1827 0.0004 0.0000 0.0046 0.4062 2.3652e-4 1.6434 1.6434 0.0006 0.0001 0.0074 0.2332 2.5253e-4 2.5746 2.5746 4.60
Conf.− 0.0663 0.0019 0.9693 50.3207 1.1291e-2 -5086.4 -4802.7 0.0851 0.0015 0.9967 45.4199 5.0831e-2 -2400.6 -2152.3 0.0841 3.8030e-3 1.0043 46.7505 3.4443e-2 -2404.9 -2156.5 12.56Conf.+ 0.0670 0.0019 0.9786 50.6680 1.1399e-2 -5079.6 -4795.9 0.0857 0.0015 1.0042 46.0816 5.1217e-2 -2398.0 -2149.6 0.0851 3.9170e-3 1.0163 47.1305 3.4854e-2 -2400.6 -2152.3 20.04
RE
SU
LTA
DO
SE
XP
ER
IME
NTA
ISC
OM
AS
RE
DE
SN
EU
RA
ISA
RT
IFIC
IAIS
212
Tabela D.5: Resultados experimentais para a previsao da serie do Indice Nasdaq utilizando RNAs. Para todas as medidasde desempenho sao calculadas as suas medias (x), desvios padroes (σx) e intervalos de confianca com um erro de 1% (limiteinferior – Conf−; e limite superior – Conf+). Em negrito e destacada a melhor inicializacao.
RNA x Conjunto de Treinamento Conjunto de Validacao Conjunto de Teste Ep.MSE MAPE Theil POCID ARV AIC BIC MSE MAPE Theil POCID ARV AIC BIC MSE MAPE Theil POCID ARV AIC BIC
3-1-1
1 0.0002 2.6785e-5 0.8849 60.7932 1.7467e-4 -54544.8 -54500.7 0.0004 9.0041e-6 0.9795 58.8599 8.1251e-4 -26035.2 -25995.3 0.0028 3.3755e-5 1.4777 52.7791 4.4072e-3 -22089.3 -22049.4 5002 0.0002 2.6791e-5 0.8849 60.7932 1.7467e-4 -54544.8 -54500.7 0.0004 8.9693e-6 0.9746 58.8599 8.0843e-4 -26045.8 -26005.8 0.0027 3.2376e-5 1.4146 52.7791 4.2191e-3 -22181.1 -22141.2 4793 0.0002 2.6780e-5 0.8849 60.7932 1.7468e-4 -54544.8 -54500.7 0.0004 9.0327e-6 0.9835 58.8599 8.1585e-4 -26026.5 -25986.6 0.0029 3.4883e-5 1.5293 52.7791 4.5610e-3 -22017.0 -21977.1 5004 0.0002 2.6783e-5 0.8849 60.7932 1.7467e-4 -54544.8 -54500.7 0.0004 9.0136e-6 0.9809 58.8599 8.1362e-4 -26032.3 -25992.4 0.0028 3.4130e-5 1.4949 52.7791 4.4584e-3 -22064.9 -22025.0 5005 0.0002 2.6785e-5 0.8849 60.7932 1.7467e-4 -54544.8 -54500.7 0.0004 9.0051e-6 0.9797 58.8599 8.1263e-4 -26034.9 -25995.0 0.0028 3.3794e-5 1.4795 52.7791 4.4125e-3 -22086.7 -22046.8 5006 0.0002 2.6785e-5 0.8849 60.7932 1.7467e-4 -54544.8 -54500.7 0.0004 9.0024e-6 0.9793 58.8599 8.1231e-4 -26035.7 -25995.8 0.0028 3.3688e-5 1.4747 52.7791 4.3981e-3 -22093.6 -22053.7 5007 0.0004 7.1267e-5 1.3091 60.7932 2.5839e-4 -52895.6 -52851.5 0.0018 3.0952e-5 4.0425 59.1924 3.3532e-3 -23049.8 -23009.9 0.0884 0.0010 47.1960 52.8741 1.4076e-1 -14794.5 -14754.6 108 0.0002 2.6784e-5 0.8849 60.7932 1.7467e-4 -54544.8 -54500.7 0.0004 9.0079e-6 0.9801 58.8599 8.1296e-4 -26034.0 -25994.1 0.0028 3.3907e-5 1.4847 52.7791 4.4280e-3 -22079.4 -22039.4 5009 0.0002 2.6782e-5 0.8849 60.7932 1.7467e-4 -54544.8 -54500.7 0.0004 9.0189e-6 0.9816 58.8599 8.1424e-4 -26030.7 -25990.8 0.0028 3.4341e-5 1.5045 52.7791 4.4872e-3 -22051.4 -22011.5 50010 0.0002 2.6787e-5 0.8849 60.7932 1.7467e-4 -54544.8 -54500.7 0.0004 8.9895e-6 0.9775 58.8599 8.1080e-4 -26039.6 -25999.7 0.0027 3.3177e-5 1.4513 52.7791 4.3283e-3 -22127.3 -22087.4 500x 0.0002 3.1233e-5 0.9273 60.7932 1.8304e-4 -54379.9 -54335.8 0.0006 1.1200e-5 1.2859 58.8931 1.0667e-3 -25736.4 -25696.5 0.0113 0.0001 6.0507 52.7886 8.1565e-4 -21358.5 -21318.6 448.9σx 0.0000 1.4067e-5 0.1341 0.0000 2.6474e-5 521.53 521.53 0.0004 6.9404e-6 0.9686 0.1052 8.0341e-4 9.4400e2 9.4400e2 0.0271 0.0003 14.4570 0.0300 9.4846e-6 2.3068e3 2.3068e3 154.35
Conf.− 0.0002 1.9775e-5 0.8181 60.7932 1.6148e-4 -54804.7 -54760.6 0.0002 5.5463e-6 0.4970 58.8075 4.1224e-4 -26505.4 -26465.5 0.0107 9.1848e-5 5.7252 52.7641 8.0792e-4 -23237.5 -23197.6 323.17Conf.+ 0.0002 4.2691e-5 1.0366 60.7932 2.0461e-4 -53955.1 -53911.0 0.0009 1.6853e-5 2.0749 58.9788 1.7211e-3 -24967.5 -24927.6 0.0334 3.7929e-4 17.8267 52.8131 8.2337e-4 -19479.5 -19439.6 574.63
3-5-1
1 0.0002 2.6860e-5 0.8968 60.8169 1.7702e-4 -54448.5 -54257.5 0.0005 9.5200e-6 1.0501 58.7648 8.7108e-4 -25848.6 -25675.6 0.0054 6.4811e-5 2.9006 52.6841 8.6509e-3 -20628.9 -20455.9 142 0.0002 2.6640e-5 0.8863 60.7694 1.7494e-4 -54498.4 -54307.4 0.0004 8.8823e-6 0.9602 58.5748 7.9650e-4 -26037.1 -25864.1 0.0042 4.8946e-5 2.2209 53.0641 6.6236e-3 -21191.3 -21018.3 133 0.0014 0.0002 5.1768 60.8169 1.0218e-3 -47064.6 -46873.6 0.0004 9.2439e-6 0.9973 58.7648 8.2725e-4 -25957.3 -25784.3 0.0168 0.0002 8.9664 52.9216 2.6742e-2 -18252.2 -18079.2 124 0.0002 2.6715e-5 0.8846 60.8169 1.7462e-4 -54506.1 -54315.2 0.0004 9.0884e-6 0.9902 58.5748 8.2140e-4 -25972.2 -25799.3 0.0029 3.5576e-5 1.5579 52.9216 4.6463e-3 -21938.0 -21765.0 3715 0.0002 2.6654e-5 0.8845 60.8169 1.7458e-4 -54506.9 -54316.0 0.0004 8.8730e-6 0.9599 58.4798 7.9621e-4 -26037.9 -25864.9 0.0028 3.3244e-5 1.4704 53.0166 4.3853e-3 -22059.8 -21886.8 2566 0.0002 2.6614e-5 0.8843 60.7932 1.7454e-4 -54508.0 -54317.0 0.0004 8.8125e-6 0.9516 58.5748 7.8935e-4 -26056.1 -25883.1 0.0022 2.6988e-5 1.1728 53.0641 3.4977e-3 -22536.0 -22363.1 2307 0.0002 2.6726e-5 0.8846 60.7932 1.7462e-4 -54506.2 -54315.2 0.0004 9.0741e-6 0.9885 58.8124 8.1995e-4 -25976.0 -25803.0 0.0029 3.5020e-5 1.5327 52.8741 4.5713e-3 -21972.3 -21799.3 1548 0.0002 2.6629e-5 0.8876 60.8407 1.7519e-4 -54492.3 -54301.3 0.0004 8.9433e-6 0.9716 59.0974 8.0596e-4 -26012.2 -25839.2 0.0067 7.6983e-5 3.5577 52.8741 1.0611e-2 -20198.9 -20025.9 159 0.0002 2.6715e-5 0.8846 60.8169 1.7461e-4 -54506.2 -54315.2 0.0004 9.0521e-6 0.9849 58.6223 8.1700e-4 -25983.6 -25810.6 0.0027 3.3566e-5 1.4652 52.7791 4.3699e-3 -22067.2 -21894.2 17010 0.0002 2.6583e-5 0.8843 60.7932 1.7455e-4 -54507.8 -54316.8 0.0005 1.0120e-5 1.1402 58.7648 9.4584e-4 -25675.2 -25502.2 0.0272 0.0003 14.5123 52.8741 4.3282e-2 -17238.1 -17065.1 17x 0.0004 3.9543e-5 1.3154 60.8074 2.5965e-4 -53754.5 -53563.5 0.0004 9.1610e-6 0.9995 58.7031 8.2905e-4 -25955.6 -25782.6 0.0074 8.5464e-5 3.9357 52.9074 1.1738e-2 -20808.3 -20635.3 125.2σx 0.0004 4.0670e-5 1.3567 0.0200 2.6779e-4 2350.7 2350.7 4.21637e-5 3.9577e-7 0.0567 0.1778 4.7074e-5 114.63 114.63 0.0082 9.2480e-5 4.3789 0.1207 1.3058e-2 1782.5 1782.5 130.37
Conf.− 1.0900e-5 6.3035e-7 0.2103 60.7911 4.1515e-5 -55669.2 -55478.3 3.8566e-4 8.8386e-6 0.9532 58.5582 7.9071e-4 -26049.0 -25876.0 6.9652e-4 1.1230e-5 0.3689 52.8090 1.1002e-3 -22260.2 -22087.3 19.01Conf.+ 6.2910e-4 8.8658e-5 2.4206 60.8237 4.7778e-4 -51839.8 -51648.8 4.5434e-4 9.4833e-6 1.0457 58.8479 8.6740e-4 -25862.2 -25689.3 1.4063e-2 1.5980e-4 7.5025 53.0057 2.2376e-2 -19356.3 -19183.3 231.39
3-10-1
1 0.0002 2.6726e-5 0.8846 60.7932 1.7461e-4 -54456.3 -54081.7 0.0004 9.0906e-6 0.9908 58.8599 8.2191e-4 -25920.9 -25581.7 0.0029 3.5766e-5 1.5669 52.8741 4.6733e-3 -21875.8 -21536.5 982 0.0002 2.6726e-5 0.8847 60.8169 1.7462e-4 -54456.1 -54081.5 0.0004 9.0074e-6 0.9790 58.8124 8.1209e-4 -25946.3 -25607.0 0.0027 3.2784e-5 1.4320 52.7316 4.2709e-3 -22065.4 -21726.1 993 0.0002 2.6735e-5 0.8847 60.8169 1.7462e-4 -54456.1 -54081.5 0.0004 9.0640e-6 0.9872 59.0024 8.1890e-4 -25928.7 -25589.4 0.0029 3.4770e-5 1.5217 52.7791 4.5383e-3 -21937.5 -21598.3 4524 0.0002 2.6733e-5 0.8847 60.8169 1.7462e-4 -54456.1 -54081.5 0.0004 9.0476e-6 0.9848 58.9074 8.1688e-4 -25933.9 -25594.6 0.0028 3.4007e-5 1.4866 52.7316 4.4336e-3 -21986.7 -21647.4 305 0.0002 2.6726e-5 0.8846 60.8169 1.7461e-4 -54456.3 -54081.7 0.0004 8.9983e-6 0.9778 58.7173 8.1106e-4 -25948.9 -25609.6 0.0028 3.3597e-5 1.4706 52.6841 4.3858e-3 -22009.5 -21670.2 166 0.0002 2.6735e-5 0.8847 60.7932 1.7462e-4 -54456.1 -54081.5 0.0004 9.0968e-6 0.9918 58.9549 8.2268e-4 -25919.0 -25579.7 0.0032 3.8442e-5 1.6936 52.7791 5.0510e-3 -21712.1 -21372.8 277 0.0002 2.6736e-5 0.8846 60.8644 1.7461e-4 -54456.4 -54081.8 0.0004 9.0942e-6 0.9917 59.1449 8.2260e-4 -25919.2 -25579.9 0.0030 3.6116e-5 1.5833 52.8741 4.7221e-3 -21853.9 -21514.6 1198 0.0002 2.6733e-5 0.8846 60.8169 1.7461e-4 -54456.4 -54081.8 0.0004 9.0575e-6 0.9863 58.9074 8.1816e-4 -25930.6 -25591.3 0.0028 3.4536e-5 1.5108 52.8266 4.5059e-3 -21952.6 -21613.3 1209 0.0002 2.6670e-5 0.8845 60.8169 1.7459e-4 -54456.7 -54082.1 0.0004 8.8310e-6 0.9539 58.5273 7.9130e-4 -26000.9 -25661.6 0.0021 2.6569e-5 1.1460 53.0641 3.4178e-3 -22534.7 -22195.4 18410 0.0002 2.6717e-5 0.8845 60.8169 1.7459e-4 -54456.8 -54082.2 0.0004 9.0825e-6 0.9896 58.6698 8.2091e-4 -25923.5 -25584.2 0.0029 3.5093e-5 1.5353 52.7791 4.5789e-3 -21918.8 -21579.5 60x 0.0002 2.6724e-5 0.8846 60.8169 1.7461e-4 -54456.3 -54081.7 0.0004 9.0370e-6 0.9833 58.8504 8.1565e-4 -25937.2 -25597.9 0.0028 3.4168e-5 1.4947 52.8124 4.4578e-3 -21984.7 -21645.4 120.5σx 0.0000 1.9862e-8 0.0001 0.0194 1.1547e-8 2.6148e-1 2.6148e-1 0.0000 8.0160e-8 0.0114 0.1775 9.4846e-6 24.744 24.744 0.0003 3.0909e-6 0.1420 0.1075 4.2347e-4 2.1615e2 2.1615e2 127.54
Conf.− 0.0002 2.6708e-5 0.8846 60.8011 1.7460e-4 -54456.5 -54081.9 0.0004 8.9717e-6 0.9740 58.7058 8.0792e-4 -25957.3 -25618.1 0.0026 3.1650e-5 1.3790 52.7248 4.1128e-3 -22160.8 -21821.5 16.61Conf.+ 0.0002 2.6740e-5 0.8847 60.8327 1.7462e-4 -54456.1 -54081.5 0.0004 9.1023e-6 0.9926 58.9949 8.2337e-4 -25917.0 -25577.7 0.0030 3.6686e-5 1.6103 52.8999 4.8027e-3 -21808.6 -21469.3 224.39
RE
SU
LTA
DO
SE
XP
ER
IME
NTA
ISC
OM
AS
RE
DE
SN
EU
RA
ISA
RT
IFIC
IAIS
213
Tabela D.6: Resultados experimentais para a previsao da serie do Indice S&P500 utilizando RNAs. Para todas as medidasde desempenho sao calculadas as suas medias (x), desvios padroes (σx) e intervalos de confianca com um erro de 1% (limiteinferior – Conf−; e limite superior – Conf+). Em negrito e destacada a melhor inicializacao.
RNA x Conjunto de Treinamento Conjunto de Validacao Conjunto de Teste Ep.MSE MAPE Theil POCID ARV AIC BIC MSE MAPE Theil POCID ARV AIC BIC MSE MAPE Theil POCID ARV AIC BIC
3-1-1
1 0.0114 0.0048 0.9713 51.6484 1.1549e-2 -1650.2 -1624.9 0.0429 0.0007 2.8387 50.5495 8.2048e-2 -701.3 -680.1 0.0117 0.0128 112.7405 50.0000 8.9459e-1 -393.1 -372.0 132 0.0114 0.0048 0.9710 52.1978 1.1546e-2 -1650.2 -1625.0 0.0509 0.0009 3.3638 50.5495 9.7223e-2 -685.7 -664.5 0.0137 0.0150 132.0439 50.0000 1.0478 -378.7 -357.6 113 0.0113 0.0049 0.9693 51.6484 1.1525e-2 -1650.6 -1625.3 0.1404 0.0023 9.2777 50.5495 2.6816e-1 -592.3 -571.2 0.0312 0.0347 301.7119 50.0000 2.3941 -303.5 -282.4 144 0.0114 0.0048 0.9728 51.6484 1.1567e-2 -1649.9 -1624.6 0.0247 0.0004 1.6351 50.5495 4.7259e-2 -752.0 -730.9 0.6248 0.0068 60.3974 50.0000 4.7925e-1 -449.9 -428.8 155 0.0116 0.0050 0.9914 51.6484 1.1787e-2 -1646.4 -1621.2 0.0143 0.0003 0.9456 50.5495 2.7330e-2 -802.4 -781.3 0.0104 0.0001 1.0068 50.0000 7.9886e-3 -822.4 -801.4 106 0.0114 0.0048 0.9728 51.6484 1.1567e-2 -1649.9 -1624.6 0.0248 0.0004 1.6399 50.5495 4.7398e-2 -751.8 -730.6 0.6267 0.0069 60.5844 50.0000 4.8073e-1 -449.6 -428.5 167 0.0114 0.0050 0.9735 52.1978 1.1575e-2 -1649.8 -1624.5 0.0320 0.0006 2.1184 50.5495 6.1227e-2 -728.2 -707.1 0.8704 0.0095 84.1414 50.0000 6.6766e-1 -419.7 -398.6 118 0.1025 0.0195 8.7634 52.7473 1.0420e-1 -1247.6 -1222.4 0.1388 0.0024 9.1756 52.7473 2.6520e-1 -593.3 -572.2 0.0512 0.0567 495.0729 54.4444 3.9284 -258.4 -237.4 99 0.0115 0.0046 0.9850 52.1978 1.1711e-2 -1647.6 -1622.4 0.0598 0.0010 3.9550 50.5495 1.1431e-1 -670.8 -649.6 0.0146 0.0161 141.4013 50.0000 1.1220 -372.5 -351.4 1110 0.0115 0.0047 0.9850 51.6484 1.1711e-2 -1647.6 -1622.4 0.0242 0.0004 1.5979 50.5495 4.6185e-2 -754.1 -733.0 0.4866 0.0053 47.0358 50.0000 3.7323e-1 -472.6 -451.6 15x 0.0205 0.0063 1.7556 51.9231 2.0874e-2 -1609.0 -1583.7 0.0553 0.0009 3.6548 50.7692 1.0563e-1 -703.2 -682.1 0.2741 0.0164 143.6136 50.4444 1.1396 -432.0 -411.0 12.5σx 0.0288 0.0046 2.4623 0.3885 2.9278e-2 126.97 126.97 0.0465 0.0008 3.0733 0.6950 8.8829e-2 69.547 69.547 0.3384 0.0170 147.8101 1.4055 1.1729 152.54 152.54 2.42
Conf.− 0.0029 0.0025 0.2501 51.6067 2.9746e-3 -1712.4 -1687.2 0.0174 0.0003 1.1514 50.2032 3.3278e-2 -759.8 -738.7 0.0015 0.0026 23.2149 49.2996 0.1842 -556.3 -535.2 10.53Conf.+ 0.0440 0.0101 3.7612 52.2396 4.4722e-2 -1505.5 -1480.3 0.0932 0.0016 6.1581 51.3354 1.7799e-1 -646.5 -625.4 0.5497 0.0302 264.0124 51.5892 2.0949 -307.8 -286.7 14.47
3-5-1
1 0.0149 0.0075 1.2761 51.6484 1.5172e-2 -1560.3 -1450.8 0.0308 0.0005 2.0355 50.5495 5.8832e-2 -691.9 -600.3 0.7787 0.0085 75.2725 50.0000 0.5973 -389.8 -298.6 102 0.0194 0.0036 1.6591 51.6484 1.9726e-2 -1512.2 -1402.8 0.0300 0.0005 1.9850 50.5495 5.7371e-2 -694.2 -602.6 0.8746 0.0095 84.5456 47.7778 0.6709 -379.3 -288.0 93 0.0550 0.0172 4.7065 51.6484 5.5960e-2 -1321.4 -1212.0 0.0784 0.0013 5.1855 50.5495 1.4988e-1 -605.8 -514.3 0.0247 0.0274 239.0152 52.2222 1.8966 -284.7 -193.4 104 0.0369 0.0157 3.1537 53.2967 3.7497e-2 -1394.7 -1285.2 0.0696 0.0012 4.6030 50.5495 1.3304e-1 -616.8 -525.2 0.7131 0.0080 68.9327 50.0000 0.5470 -397.8 -306.6 95 0.0114 0.0048 0.9740 51.6484 1.1581e-2 -1609.7 -1500.2 0.0180 0.0003 1.1908 50.5495 3.4417e-2 -741.2 -649.6 0.3583 0.0039 34.6317 48.8889 0.2748 -460.5 -369.2 106 0.0114 0.0047 0.9746 51.6484 1.1587e-2 -1609.6 -1500.1 0.0149 0.0003 0.9830 50.5495 2.8412e-2 -758.8 -667.3 0.1910 0.0021 18.4607 50.0000 0.1465 -517.7 -426.4 237 0.0976 0.0204 8.3506 51.0989 9.9287e-2 -1216.5 -1107.0 0.0563 0.0012 3.7232 47.2527 1.0761e-1 -636.3 -544.8 0.5079 0.0054 49.0955 50.0000 0.3896 -428.7 -337.4 98 0.0193 0.0037 1.6494 51.6484 1.9612e-2 -1513.3 -1403.8 0.0287 0.0005 1.8952 49.4505 5.4776e-2 -698.4 -606.9 0.3375 0.0037 32.6204 50.0000 0.2588 -465.9 -374.6 109 0.0125 0.0053 1.0667 51.6484 1.2683e-2 -1593.0 -1483.6 0.0934 0.0015 6.1728 47.2527 1.7841e-1 -589.8 -498.2 0.0258 0.0286 249.4562 48.8889 1.9794 -280.8 -189.5 1110 0.1151 0.0278 9.8465 52.1978 1.1707e-1 -1186.3 -1076.9 0.0288 0.0005 1.9048 50.5495 5.5054e-2 -698.0 -606.4 0.9285 0.0102 89.7509 48.8889 0.7122 -373.8 -282.5 9x 0.0394 0.0111 3.3657 51.8132 4.0018e-2 -1451.7 -1342.2 0.0449 0.0008 2.9679 49.7802 8.5780e-2 -673.1 -581.6 0.4740 0.0107 94.1781 49.6667 0.7473 -397.9 -306.6 11.0σx 0.0381 0.0086 3.2598 0.5821 3.8759e-2 161.62 161.62 0.0275 0.0005 1.8150 1.3755 5.2458e-2 57.764 57.764 0.3388 0.0095 82.5274 1.1771 0.6549 75.553 75.553 4.27
Conf.− 0.0083 0.0041 0.7104 51.3391 8.4467e-3 -1583.3 -1473.9 0.0225 0.0004 1.4895 48.6598 4.3050e-2 -720.2 -628.6 0.1980 0.0030 26.9554 48.7079 0.2139 -459.4 -368.2 7.52Conf.+ 0.0704 0.0181 6.0210 52.2873 7.1588e-2 -1320.1 -1210.6 0.0672 0.0012 4.4463 50.9007 1.2851e-1 -626.1 -534.5 0.7500 0.0185 161.4008 50.6254 1.2807 -336.4 -245.1 14.48
3-10-1
1 0.0129 0.0058 1.1043 51.6484 1.3130e-2 -1536.7 -1322.0 0.0157 0.0003 1.0358 50.5495 2.9938e-2 -704.0 -524.4 0.0452 0.0005 4.3658 50.0000 3.4642e-2 -598.9 -419.9 92 0.0114 0.0047 0.9743 51.6484 1.1584e-2 -1559.6 -1344.9 0.0146 0.0003 0.9637 50.5495 2.7854e-2 -710.7 -531.1 0.1619 0.0018 15.6483 48.8889 1.2417e-1 -482.8 -303.7 113 0.0114 0.0047 0.9755 51.6484 1.1598e-2 -1559.4 -1344.7 0.0140 0.0003 0.9264 50.5495 2.6777e-2 -714.3 -534.7 0.0845 0.0009 8.1712 50.0000 6.4838e-2 -541.9 -362.8 134 0.0114 0.0047 0.9754 51.6484 1.1597e-2 -1559.4 -1344.7 0.0141 0.0003 0.9289 50.5495 2.6848e-2 -714.0 -534.4 0.1189 0.0013 11.4938 50.0000 9.1203e-2 -510.9 -331.8 105 0.0118 0.0045 1.0075 51.6484 1.1979e-2 -1553.5 -1338.8 0.0171 0.0003 1.1328 50.5495 3.2741e-2 -695.8 -516.2 0.1615 0.0018 15.6101 50.0000 1.2387e-1 -483.0 -303.9 106 0.0157 0.0079 1.3400 51.6484 1.5932e-2 -1501.3 -1286.6 0.0324 0.0006 2.1403 50.5495 6.1861e-2 -637.3 -457.6 0.3560 0.0040 34.4127 48.8889 2.7306e-1 -411.1 -232.0 97 0.0112 0.0046 0.9605 52.1978 1.1420e-2 -1562.2 -1347.5 0.0145 0.0003 0.9604 48.3516 2.7757e-2 -711.0 -531.4 0.0095 0.0001 0.9166 51.1111 7.2728e-3 -741.0 -561.9 898 0.0115 0.0051 0.9804 51.6484 1.1657e-2 -1558.5 -1343.8 0.0928 0.0016 6.1366 50.5495 1.7737e-1 -540.4 -360.7 0.0223 0.0246 215.5730 52.2222 1.7106 -244.1 -65.0 119 0.0114 0.0047 0.9771 51.6484 1.1617e-2 -1559.1 -1344.4 0.0140 0.0003 0.9231 50.5495 2.6680e-2 -714.6 -535.0 0.0505 0.0005 4.8828 50.0000 3.8745e-2 -588.8 -409.7 2110 0.0114 0.0048 0.9741 51.6484 1.1582e-2 -1559.7 -1345.0 0.0178 0.0003 1.1790 50.5495 3.4076e-2 -692.1 -512.5 0.3240 0.0035 31.3190 50.0000 2.4851e-1 -419.6 -240.6 12x 0.0120 0.0052 1.0269 51.7033 1.2210e-2 -1550.9 -1336.3 0.0247 0.0004 1.6327 50.3297 4.7190e-2 -683.4 -503.8 0.1334 0.0039 34.2393 50.1111 0.2717 -502.2 -323.1 19.5σx 0.0014 0.0011 0.1175 0.1738 1.3973e-3 18.912 18.912 0.0246 0.0004 1.6245 0.6950 4.6955e-2 55.398 55.398 0.1213 0.0074 64.6741 0.9729 0.5132 132.50 132.50 24.67
Conf.− 0.0109 0.0043 0.9312 51.5618 1.1071e-2 -1566.3 -1351.6 0.0047 0.0001 0.3094 49.7636 8.9428e-3 -728.5 -548.9 0.0346 0.0021 18.4410 49.3187 0.1463 -610.1 -431.1 0.59Conf.+ 0.0131 0.0060 1.1226 51.8449 1.3348e-2 -1535.5 -1320.8 0.0447 0.0008 2.9560 50.8959 8.5438e-2 -638.3 -458.7 0.2322 0.0099 86.9197 50.9036 0.6897 -394.3 -215.2 39.59
RE
SU
LTA
DO
SE
XP
ER
IME
NTA
ISC
OM
AS
RE
DE
SN
EU
RA
ISA
RT
IFIC
IAIS
214
Tabela D.7: Resultados experimentais para a previsao da serie do Valor de Fechamento das Acoes da Petrobras utilizandoRNAs. Para todas as medidas de desempenho sao calculadas as suas medias (x), desvios padroes (σx) e intervalos de confiancacom um erro de 1% (limite inferior – Conf−; e limite superior – Conf+). Em negrito e destacada a melhor inicializacao.
RNA x Conjunto de Treinamento Conjunto de Validacao Conjunto de Teste Ep.MSE MAPE Theil POCID ARV AIC BIC MSE MAPE Theil POCID ARV AIC BIC MSE MAPE Theil POCID ARV AIC BIC
3-1-1
1 0.0161 0.0008 0.9862 47.8386 4.6609e-3 -9091.0 -9055.3 0.0716 0.0008 10.6592 54.4231 3.6725e-2 -3761.3 -3729.8 0.1625 0.0017 25.8328 51.4451 1.5210 -3327.7 -3296.2 172 0.0161 0.0008 0.9862 47.8386 4.6609e-3 -9091.0 -9055.3 0.0716 0.0008 10.6592 54.4231 3.6725e-2 -3761.3 -3729.8 0.1625 0.0017 25.8329 51.4451 1.5210 -3327.7 -3296.2 203 0.0161 0.0008 0.9862 47.8386 4.6609e-3 -9091.0 -9055.3 0.0716 0.0008 10.6592 54.4231 3.6725e-2 -3761.3 -3729.8 0.1625 0.0017 25.8329 51.4451 1.5210 -3327.7 -3296.2 164 0.0161 0.0008 0.9862 47.8386 4.6609e-3 -9091.0 -9055.3 0.0716 0.0008 10.6592 54.4231 3.6725e-2 -3761.3 -3729.8 0.1625 0.0017 25.8329 51.4451 1.5210 -3327.7 -3296.2 165 0.0161 0.0008 0.9862 47.8386 4.6609e-3 -9091.0 -9055.3 0.0716 0.0008 10.6592 54.4231 3.6725e-2 -3761.3 -3729.8 0.1625 0.0017 25.8329 51.4451 1.5210 -3327.7 -3296.2 176 0.0161 0.0008 0.9864 47.9347 4.6618e-3 -9090.8 -9055.1 0.0543 0.0006 8.0913 54.4231 2.7877e-2 -3904.9 -3873.4 0.1205 0.0013 19.1639 51.4451 1.1283 -3483.0 -3451.4 117 0.0161 0.0008 0.9862 47.8386 4.6609e-3 -9091.0 -9055.3 0.0716 0.0008 10.6592 54.4231 3.6725e-2 -3761.3 -3729.8 0.1625 0.0017 25.8329 51.4451 1.5210 -3327.7 -3296.2 118 0.0161 0.0008 0.9862 47.8386 4.6609e-3 -9091.0 -9055.3 0.0716 0.0008 10.6592 54.4231 3.6725e-2 -3761.3 -3729.8 0.1625 0.0017 25.8329 51.4451 1.5210 -3327.7 -3296.2 159 0.0161 0.0008 0.9862 47.8386 4.6609e-3 -9091.0 -9055.3 0.0716 0.0008 10.6592 54.4231 3.6725e-2 -3761.3 -3729.8 0.1625 0.0017 25.8329 51.4451 1.5210 -3327.7 -3296.2 1410 0.0161 0.0008 0.9862 47.8386 4.6609e-3 -9091.0 -9055.3 0.0716 0.0008 10.6593 54.4231 3.6725e-2 -3761.3 -3729.8 0.1625 0.0017 25.8329 51.4451 1.5210 -3327.7 -3296.2 12x 0.0161 0.0008 0.9862 47.8482 4.6610e-3 -9091.0 -9055.3 0.0698 0.0008 10.4024 54.4231 3.5840e-2 -3775.7 -3744.1 0.1583 0.0017 25.1660 51.4451 1.4817 -3343.2 -3311.7 14.9σx 0.0000 0.0000 0.0001 0.0304 2.8460e-7 702.15 702.15 0.0055 0.0001 0.8121 0.0000 2.7980e-3 45.414 45.414 0.0133 0.0001 2.1089 0.0000 0.1242 49.105 49.105 2.92
Conf.− 0.0161 0.0008 0.9862 47.8235 4.6608e-3 -9091.0 -9055.3 0.0654 0.0007 9.7410 54.4231 3.3561e-2 -3812.6 -3781.1 0.1475 0.0016 23.4482 51.4451 1.3806 -3383.2 -3351.7 12.52Conf.+ 0.0161 0.0008 0.9863 47.8730 4.6612e-3 -9090.9 -9055.2 0.0743 0.0008 11.0639 54.4231 3.8119e-2 -3738.7 -3707.2 0.1691 0.0018 26.8838 51.4451 1.5829 -3303.2 -3271.7 17.28
3-5-1
1 0.0161 0.0008 0.9855 48.0307 4.6575e-3 -9051.7 -8897.1 0.0658 0.0007 9.7984 53.8462 3.3759e-2 -3765.2 -3628.5 0.1476 0.0016 23.4743 51.6378 1.3821 -3337.5 -3200.9 122 0.0180 0.0009 1.1053 47.5504 5.2239e-3 -8932.2 -8777.5 0.0715 0.0008 10.6430 54.2308 3.6669e-2 -3722.1 -3585.4 0.1834 0.0020 29.1678 53.7572 1.7173 -3224.5 -3087.9 113 0.0160 0.0007 0.9843 48.0307 4.6519e-3 -9053.0 -8898.3 0.0620 0.0007 9.2329 54.4231 3.1811e-2 -3796.1 -3659.5 0.1376 0.0015 21.8822 52.4085 1.2884 -3374.0 -3237.4 134 0.0389 0.0014 2.3882 47.9347 1.1287e-2 -8129.4 -7974.7 0.0224 0.0003 3.3418 54.2308 1.1514e-2 -4325.6 -4189.0 0.0109 0.0001 1.7292 51.8304 0.1018 -4693.8 -4557.2 125 0.0161 0.0008 0.9865 48.0307 4.6624e-3 -9050.7 -8896.0 0.0623 0.0007 9.2744 54.0385 3.1954e-2 -3793.8 -3657.1 0.1404 0.0015 22.3319 51.4451 1.3148 -3363.4 -3226.8 126 0.0160 0.0008 0.9839 47.8386 4.6500e-3 -9053.4 -8898.8 0.0876 0.0010 13.0557 53.6538 4.4981e-2 -3615.6 -3479.0 0.2089 0.0022 33.2149 52.0231 1.9556 -3157.0 -3020.4 117 0.0160 0.0007 0.9832 47.9347 4.6468e-3 -9054.1 -8899.5 0.0612 0.0007 9.1155 53.4615 3.1406e-2 -3802.8 -3666.2 0.1343 0.0014 21.3552 52.2158 1.2573 -3386.7 -3250.1 138 0.0160 0.0008 0.9847 48.0307 4.6538e-3 -9052.6 -8897.9 0.0533 0.0006 7.9463 54.2308 2.7378e-2 -3874.3 -3737.7 0.1148 0.0012 18.2520 52.4085 1.0746 -3468.3 -3331.7 129 0.0161 0.0008 0.9893 48.1268 4.6755e-3 -9047.7 -8893.1 0.0617 0.0007 9.1910 53.8462 3.1666e-2 -3798.5 -3661.9 0.1400 0.0015 22.2625 52.2158 1.3107 -3365.0 -3228.4 1210 0.0200 0.0012 1.2260 48.1268 5.7941e-3 -8824.2 -8669.5 0.0376 0.0004 5.6043 54.0385 1.9309e-2 -4056.2 -3919.6 0.0816 0.0009 12.9748 51.6378 0.7639 -3645.8 -3509.2 10x 0.0189 0.0009 1.1617 47.9635 5.4903e-3 -8924.9 -8770.2 0.0585 0.0007 8.7203 54.0000 3.0045e-2 -3855.0 -3718.4 0.1300 0.0014 20.6645 52.1580 1.2167 -3501.6 -3365.0 11.8σx 0.0071 0.0002 0.4383 0.1697 2.0717e-3 289.82 289.82 0.0179 0.0002 2.6633 0.2979 9.1759e-3 199.58 199.58 0.0542 0.0006 8.6185 0.6553 0.5074 438.79 438.79 0.92
Conf.− 0.0131 0.0007 0.8046 47.8252 3.8028e-3 -9161.0 -9006.3 0.0440 0.0005 6.5509 53.7573 2.2570e-2 -4017.6 -3881.0 0.0858 0.0009 13.6443 51.6242 0.8033 -3859.0 -3722.4 11.05Conf.+ 0.0247 0.0011 1.5187 48.1017 7.1778e-3 -8688.8 -8534.2 0.0731 0.0008 10.8897 54.2427 3.7519e-2 -3692.5 -3555.9 0.1741 0.0019 27.6847 52.6918 1.6300 -3144.2 -3007.6 12.55
3-10-1
1 0.0161 0.0008 0.9865 48.3189 4.6622e-3 -9000.7 -8697.3 0.0635 0.0007 9.4596 54.4231 3.2592e-2 -3733.5 -3465.5 0.1447 0.0015 23.0079 52.2158 1.3546 -3297.9 -3030.0 122 0.0272 0.0014 1.6681 48.2229 7.8838e-3 -8453.3 -8149.9 0.0265 0.0003 3.9419 53.8462 1.3581e-2 -4189.6 -3921.5 0.0576 0.0006 9.1606 52.0231 0.5394 -3776.8 -3508.8 103 0.0161 0.0008 0.9854 48.1268 4.6570e-3 -9001.9 -8698.5 0.0529 0.0006 7.8737 53.6538 2.7128e-2 -3829.1 -3561.1 0.1164 0.0012 18.5056 52.0231 1.0895 -3411.1 -3143.2 204 0.0162 0.0008 0.9944 48.1268 4.6995e-3 -8992.4 -8689.0 0.0294 0.0003 4.3866 54.2308 1.5113e-2 -4133.9 -3865.8 0.0602 0.0006 9.5643 51.6378 0.5631 -3754.4 -3486.4 95 0.0160 0.0007 0.9841 48.3189 4.6512e-3 -9003.2 -8699.8 0.0636 0.0007 9.4795 54.0385 3.2660e-2 -3732.4 -3464.4 0.1430 0.0015 22.7442 51.4451 1.3391 -3303.9 -3036.0 186 0.1602 0.0079 9.8342 48.4150 4.6478e-2 -6604.6 -6301.2 0.0543 0.0009 8.0869 53.8462 2.7862e-2 -3815.2 -3547.1 0.0095 0.0001 1.5124 51.6378 0.0890 -4713.4 -4445.5 97 0.0161 0.0008 0.9853 48.4150 4.6567e-3 -9001.9 -8698.5 0.0585 0.0007 8.7110 54.4231 3.0012e-2 -3776.5 -3508.4 0.1303 0.0014 20.7147 52.4085 1.2196 -3352.5 -3084.6 178 0.0165 0.0008 1.0122 48.0307 4.7837e-3 -8973.9 -8670.5 0.0369 0.0004 5.5009 54.2308 1.8953e-2 -4015.9 -3747.9 0.0834 0.0009 13.2636 52.4085 0.7809 -3584.3 -3316.4 109 0.0166 0.0008 1.0179 48.2229 4.8107e-3 -8968.0 -8664.6 0.0485 0.0006 7.2269 54.2308 2.4899e-2 -3873.8 -3605.7 0.1078 0.0012 17.1363 52.2158 1.0089 -3451.1 -3183.2 1010 0.0412 0.0020 2.5288 48.0307 1.1951e-2 -8019.8 -7716.4 0.0252 0.0003 3.7499 53.8462 1.2920e-2 -4215.6 -3947.5 0.0485 0.0005 7.7180 51.6378 0.4544 -3865.9 -3597.9 9x 0.0342 0.0017 2.0997 48.2229 9.9234e-3 -8602.0 -8298.6 0.0459 0.0006 6.8417 54.0769 2.3572e-2 -3931.5 -3663.5 0.0901 0.0010 14.3328 51.9653 0.8439 -3651.1 -3383.2 12.4σx 0.0450 0.0022 2.7635 0.1432 1.3061e-2 775.67 775.67 0.0152 0.0002 2.2574 0.2689 7.7775e-3 190.21 190.21 0.0455 0.0005 7.2323 0.3524 0.4258 426.56 426.56 4.25
Conf.− 0.0024 0.0001 0.1514 48.1062 7.1545e-4 -9233.8 -8930.4 0.0336 0.0004 5.0029 53.8579 1.7237e-2 -4086.5 -3818.4 0.0531 0.0006 8.4417 51.6783 0.4970 -3998.6 -3730.6 8.94Conf.+ 0.0709 0.0035 4.3507 48.3395 2.0562e-2 -7970.1 -7666.7 0.0583 0.0007 8.6805 54.2960 2.9907e-2 -3776.6 -3508.6 0.1272 0.0013 20.2239 52.2523 1.1907 -3303.7 -3035.8 15.86
RE
SU
LTA
DO
SE
XP
ER
IME
NTA
ISC
OM
AS
RE
DE
SN
EU
RA
ISA
RT
IFIC
IAIS
215
Tabela D.8: Resultados experimentais para a previsao da serie Random Walk utilizando RNAs. Para todas as medidas dedesempenho sao calculadas as suas medias (x), desvios padroes (σx) e intervalos de confianca com um erro de 1% (limiteinferior – Conf−; e limite superior – Conf+). Em negrito e destacada a melhor inicializacao.
RNA x Conjunto de Treinamento Conjunto de Validacao Conjunto de Teste Ep.MSE MAPE Theil POCID ARV AIC BIC MSE MAPE Theil POCID ARV AIC BIC MSE MAPE Theil POCID ARV AIC BIC
3-1-1
1 0.1203 0.0044 0.9831 45.3815 2.9491e-2 -3342.5 -3311.3 0.1319 0.0032 1.0089 52.4194 9.1516e-2 -1639.0 -1611.9 0.1368 0.0028 1.0896 48.7903 5.0140e-2 -1630.0 -1602.9 92 0.1204 0.0045 0.9836 45.3815 2.9507e-2 -3342.3 -3311.0 0.1316 0.0032 1.0062 52.4194 9.1274e-2 -1639.7 -1612.6 0.1373 0.0028 1.0937 48.7903 5.0329e-2 -1629.1 -1602.0 113 0.1203 0.0044 0.9831 45.3815 2.9491e-2 -3342.5 -3311.3 0.1319 0.0032 1.0089 52.4194 9.1516e-2 -1639.0 -1611.9 0.1368 0.0028 1.0893 48.7903 5.0129e-2 -1630.1 -1603.0 184 0.1204 0.0045 0.9833 45.3815 2.9497e-2 -3342.4 -3311.2 0.1317 0.0032 1.0069 52.4194 9.1342e-2 -1639.5 -1612.4 0.1377 0.0028 1.0964 48.7903 5.0452e-2 -1628.5 -1601.4 115 0.1204 0.0045 0.9834 45.3815 2.9501e-2 -3342.4 -3311.1 0.1314 0.0032 1.0051 52.4194 9.1174e-2 -1640.0 -1612.9 0.1355 0.0028 1.0796 48.7903 4.9681e-2 -1632.3 -1605.2 146 0.1421 0.0054 1.1611 44.9799 3.4830e-2 -3259.5 -3228.2 0.1285 0.0032 0.9829 52.8226 8.9162e-2 -1645.5 -1618.4 0.2141 0.0037 1.7052 48.3871 7.8472e-2 -1518.5 -1491.4 107 0.1204 0.0045 0.9832 45.3815 2.9495e-2 -3342.5 -3311.2 0.1317 0.0032 1.0069 52.4194 9.1338e-2 -1639.5 -1612.4 0.1374 0.0028 1.0943 48.7903 5.0358e-2 -1628.9 -1601.8 128 0.1266 0.0055 1.0344 45.1807 3.1029e-2 -3317.2 -3285.9 0.1311 0.0032 1.0025 52.0161 9.0936e-2 -1640.6 -1613.5 0.2005 0.0035 1.5966 48.3871 7.3473e-2 -1534.9 -1507.8 159 0.1203 0.0044 0.9831 45.3815 2.9491e-2 -3342.5 -3311.3 0.1319 0.0032 1.0088 52.4194 9.1507e-2 -1639.0 -1611.9 0.1368 0.0028 1.0896 48.7903 5.0144e-2 -1630.0 -1602.9 1410 0.1203 0.0044 0.9831 45.3815 2.9491e-2 -3342.5 -3311.3 0.1319 0.0032 1.0087 52.4194 9.1504e-2 -1639.1 -1612.0 0.1368 0.0028 1.0896 48.7903 5.0140e-2 -1630.0 -1602.9 13x 0.1232 0.0047 1.0062 45.3213 3.0182e-2 -3331.6 -3300.4 0.1314 0.0032 1.0046 52.4194 9.1127e-2 -1640.1 -1613.0 0.1510 0.0030 1.2024 48.7097 5.5332e-2 -1609.2 -1582.1 12.7σx 0.0069 0.0004 0.0568 0.1355 1.7027e-3 26.562 26.562 0.0010 0.0000 0.0079 0.1901 7.1503e-4 1.9712 1.9712 0.0299 0.0003 0.2378 0.1700 1.0944e-2 43.689 43.689 2.67
Conf.− 0.1175 0.0043 0.9599 45.2109 2.8795e-2 -3353.3 -3322.0 0.1305 0.0032 0.9982 52.2645 9.0544e-2 -1641.7 -1614.6 0.1266 0.0027 1.0087 48.5712 4.6417e-2 -1644.8 -1617.7 10.53Conf.+ 0.1288 0.0050 1.0524 45.4317 3.1569e-2 -3310.0 -3278.7 0.1322 0.0032 1.0110 52.5742 9.1709e-2 -1638.5 -1611.4 0.1753 0.0032 1.3961 48.8481 6.4246e-2 -1573.7 -1546.6 14.87
3-5-1
1 0.1240 0.0051 1.0129 45.1807 3.0386e-2 -3287.6 -3152.1 0.1292 0.0032 0.9877 52.4194 8.9596e-2 -1604.3 -1486.8 0.1427 0.0029 1.1365 48.3871 5.2302e-2 -1579.5 -1462.0 92 0.1199 0.0045 0.9798 44.3775 2.9393e-2 -3304.2 -3168.7 0.1317 0.0032 1.0074 52.8226 9.1387e-2 -1599.4 -1481.9 0.1356 0.0028 1.0803 49.1935 4.9715e-2 -1592.1 -1474.7 443 0.1203 0.0045 0.9825 45.3815 2.9474e-2 -3302.8 -3167.3 0.1316 0.0032 1.0061 52.4194 9.1262e-2 -1599.7 -1482.3 0.1359 0.0028 1.0822 48.7903 4.9799e-2 -1591.7 -1474.3 114 0.1200 0.0045 0.9800 45.3815 2.9399e-2 -3304.1 -3168.6 0.1316 0.0032 1.0061 53.6290 9.1266e-2 -1599.7 -1482.2 0.1366 0.0028 1.0881 49.5968 5.0073e-2 -1590.3 -1472.9 135 0.1206 0.0046 0.9848 45.1807 2.9541e-2 -3301.7 -3166.2 0.1306 0.0032 0.9987 52.4194 9.0592e-2 -1601.5 -1484.1 0.1374 0.0028 1.0943 48.7903 5.0358e-2 -1588.9 -1471.5 116 0.1200 0.0045 0.9801 44.9799 2.9400e-2 -3304.1 -3168.6 0.1312 0.0032 1.0033 53.2258 9.1009e-2 -1600.4 -1483.0 0.1313 0.0028 1.0454 49.1935 4.8108e-2 -1600.3 -1482.9 157 0.1205 0.0044 0.9846 45.1807 2.9535e-2 -3301.8 -3166.3 0.1312 0.0032 1.0033 52.0161 9.1013e-2 -1600.4 -1482.9 0.1304 0.0028 1.0389 48.7903 4.7807e-2 -1601.9 -1484.4 158 0.1204 0.0045 0.9833 45.3815 2.9496e-2 -3302.5 -3166.9 0.1310 0.0032 1.0017 52.4194 9.0868e-2 -1600.8 -1483.3 0.1345 0.0028 1.0715 49.1935 4.9307e-2 -1594.2 -1476.7 119 0.1202 0.0045 0.9815 45.1807 2.9443e-2 -3303.4 -3167.8 0.1319 0.0032 1.0085 53.6290 9.1483e-2 -1599.1 -1481.7 0.1327 0.0028 1.0567 48.7903 4.8629e-2 -1597.6 -1480.2 1310 0.1202 0.0045 0.9819 44.9799 2.9456e-2 -3303.1 -3167.6 0.1317 0.0032 1.0073 52.0161 9.1377e-2 -1599.4 -1481.9 0.1345 0.0028 1.0713 49.1935 4.9300e-2 -1594.2 -1476.8 14x 0.1206 0.0045 0.9851 45.1205 2.9552e-2 -3301.5 -3166.0 0.1312 0.0032 1.0030 52.7016 9.0985e-2 -1600.5 -1483.0 0.1352 0.0028 1.0765 48.9919 4.9540e-2 -1593.1 -1475.6 15.6σx 0.0012 0.0002 0.0099 0.3001 2.9778e-4 4.9670 4.9670 0.0008 0.0000 0.0062 0.6026 5.5954e-4 1.5390 1.5390 0.0035 0.0000 0.0277 0.3427 1.2769e-3 6.3658 6.3658 10.17
Conf.− 0.1196 0.0044 0.9771 44.8760 2.9310e-2 -3305.6 -3170.1 0.1305 0.0032 0.9980 52.2108 9.0530e-2 -1601.7 -1484.3 0.1323 0.0028 1.0539 48.7128 4.8500e-2 -1598.3 -1480.8 7.32Conf.+ 0.1216 0.0047 0.9932 45.3649 2.9795e-2 -3297.5 -3162.0 0.1318 0.0032 1.0080 53.1925 9.1441e-2 -1599.2 -1481.8 0.1380 0.0028 1.0991 49.2710 5.0580e-2 -1587.9 -1470.4 23.88
3-10-1
1 0.1207 0.0045 0.9859 45.3815 2.9576e-2 -3251.1 -2985.3 0.1315 0.0032 1.0054 52.0161 9.1197e-2 -1549.9 -1319.5 0.1326 0.0028 1.0559 48.7903 4.8592e-2 -1547.8 -1317.4 112 0.1203 0.0045 0.9831 45.3815 2.9491e-2 -3252.5 -2986.7 0.1314 0.0032 1.0050 52.0161 9.1161e-2 -1550.0 -1319.6 0.1355 0.0028 1.0793 48.7903 4.9670e-2 -1542.4 -1312.0 103 0.1196 0.0045 0.9773 44.1767 2.9317e-2 -3255.5 -2989.7 0.1303 0.0032 0.9965 51.6129 9.0393e-2 -1552.1 -1321.7 0.1277 0.0027 1.0170 48.7903 4.6801e-2 -1557.2 -1326.8 194 0.1196 0.0046 0.9769 44.1767 2.9306e-2 -3255.7 -2989.8 0.1302 0.0032 0.9959 51.6129 9.0336e-2 -1552.3 -1321.9 0.1267 0.0027 1.0087 48.7903 4.6421e-2 -1559.2 -1328.8 535 0.1213 0.0048 0.9912 44.5783 2.9733e-2 -3248.5 -2982.6 0.1305 0.0032 0.9980 53.6290 9.0527e-2 -1551.7 -1321.3 0.1307 0.0027 1.0407 49.1935 4.7894e-2 -1551.4 -1321.0 126 0.1193 0.0045 0.9746 43.7751 2.9237e-2 -3256.9 -2991.0 0.1302 0.0032 0.9953 52.0161 9.0281e-2 -1552.4 -1322.0 0.1290 0.0027 1.0272 49.1935 4.7271e-2 -1554.7 -1324.3 647 0.1200 0.0045 0.9802 45.1807 2.9404e-2 -3254.0 -2988.2 0.1316 0.0032 1.0061 53.2258 9.1262e-2 -1549.7 -1319.3 0.1344 0.0028 1.0703 49.1935 4.9254e-2 -1544.4 -1314.1 248 0.1201 0.0045 0.9814 45.3815 2.9440e-2 -3253.4 -2987.6 0.1320 0.0032 1.0092 53.6290 9.1548e-2 -1548.9 -1318.5 0.1345 0.0028 1.0713 49.1935 4.9298e-2 -1544.2 -1313.8 119 0.1204 0.0045 0.9834 44.3775 2.9500e-2 -3252.4 -2986.5 0.1308 0.0032 1.0005 52.0161 9.0755e-2 -1551.1 -1320.7 0.1418 0.0029 1.1294 49.5968 5.1975e-2 -1531.1 -1300.7 1310 0.1200 0.0045 0.9804 45.3815 2.9411e-2 -3253.9 -2988.1 0.1319 0.0032 1.0085 52.8226 9.1483e-2 -1549.1 -1318.7 0.1354 0.0028 1.0780 48.7903 4.9610e-2 -1542.7 -1312.3 13x 0.1201 0.0045 0.9815 44.7791 2.9442e-2 -3253.4 -2987.5 0.1310 0.0032 1.0020 52.4597 9.0894e-2 -1550.7 -1320.3 0.1328 0.0028 1.0578 49.0323 4.8679e-2 -1547.5 -1317.1 23.0σx 0.0006 0.0001 0.0048 0.6279 1.4413e-4 2.4402 2.4402 0.0007 0.0000 0.0054 0.7940 4.9050e-4 1.3438 1.3438 0.0045 6.7495e-5 0.0360 0.2819 1.6552e-3 8.4179 8.4179 19.37
Conf.− 0.1197 0.0045 0.9775 44.2677 2.9324e-2 -3255.4 -2989.5 0.1305 0.0032 0.9976 51.8129 9.0495e-2 -1551.8 -1321.4 0.1292 0.0027 1.0285 48.8026 4.7330e-2 -1554.4 -1324.0 7.22Conf.+ 0.1206 0.0046 0.9854 45.2905 2.9559e-2 -3251.4 -2985.6 0.1316 0.0032 1.0064 53.1064 9.1294e-2 -1549.6 -1319.2 0.1365 0.0028 1.0871 49.2619 5.0027e-2 -1540.7 -1310.3 38.78
APENDICE E
ESTRUTURAS DE CONEXOES PARA OS MELHORES
INDIVIDUOS DO SISTEMA HIBRIDO INTELIGENTE
— ALGORITMO GENETICO MODIFICADO COM
REDES NEURAIS ARTIFICIAIS
Neste Apendice sao expostas as estruturas de conexoes assumidas pelos melhores in-
divıduos eleitos pelo sistema hıbrido inteligente — Algoritmo Genetico Modificado com-
binado com as Rede Neurais Artificiais.
Todos os indivıduos gerados nos experimentos com o sistema hıbrido inteligente sao
Rede Neurais Artificiais de tres camadas contendo conexoes entre a primeira e a segunda
camada, e conexoes entre a segunda e terceira camada. Contudo devido ao processo de
poda realizado pelo Algoritmo Genetico, tais conexoes podem ou nao existir. Desta forma,
a arquitetura das RNAs sao representadas por duas matrizes de conexoes: a primeira para
o conjunto de conexoes entre a camada de entrada e a camada intermediaria, e a segunda
para o conjunto de conexoes entre a camada intermediaria e a camada de saıda da rede.
Cada elemento dessas matrizes de conexoes representa uma dada conexao, onde o
valor 0 significa que a conexao esta inativa o valor 1 significa que a conexao esta ativa.
Cada linha destas matrizes esta relacionada com um neuronio da camada de partida da
conexao e cada coluna com um neuronio da camada final da conexao. Assim, uma rede
m−n−1 tera duas matrizes, a primeira (m+1)×n e a segunda (n+1)×1, onde a linha
adicionada nas duas matrizes e referente as conexoes relativas aos bias para cada um
dos neuronios localizados na camada final das respectivas conexoes. Portanto, a conexao
do neuronio i (localizado na camada inicial da conexao) para o neuronio j (localizado
na camada terminal da conexao) existira se o elemento ij for 1, e nao existira caso o
elemento ij seja 0.
216
E.1 MELHORES INDIVIDUOS PARA A SERIE DO MAPA DE HENON 217
E.1 MELHORES INDIVIDUOS PARA A SERIE DO MAPA DE HENON
As matrizes de conexoes para o melhor indivıduo da serie do Mapa de Henon.
Arquitetura 4-5-1
REDE 1:
1 0 1 1 1
0 0 1 1 0
1 1 1 1 0
1 0 1 1 1
1 1 1 0 1
1
0
1
0
1
0
(E.)
E.2 MELHORES INDIVIDUOS PARA A SERIE DAS MANCHAS SOLARES
As matrizes de conexoes para o melhor indivıduo da serie das Manchas Solares.
Arquitetura 3-1-1
REDE 2:
0
1
1
1
[1
1
](E.)
E.3 MELHORES INDIVIDUOS PARA A SERIE DE MEDIDAS DO BRILHO DE
UMA ESTRELA
As matrizes de conexoes para o melhor indivıduo da serie de Medidas de Brilho de uma
Estrela.
Arquitetura 3-1-1
E.4 MELHORES INDIVIDUOS PARA A SERIE DO INDICE DOW JONES INDUSTRIAL AVERAGE218
REDE 2:
1
0
1
1
[1
1
](E.)
E.4 MELHORES INDIVIDUOS PARA A SERIE DO INDICE DOW JONES IN-
DUSTRIAL AVERAGE
As matrizes de conexoes para o melhor indivıduo da serie do Indice Dow Jones Industrial
Average.
Arquitetura 3-10-1
REDE 2:
0 1 0 1 1 1 1 1 0 1
0 1 1 1 0 0 1 1 1 1
1 1 1 1 1 1 1 0 1 1
1 1 0 1 0 1 1 0 1 0
1
1
1
1
1
0
0
1
1
1
1
(E.)
E.5 MELHORES INDIVIDUOS PARA A SERIE DO INDICE NASDAQ
As matrizes de conexoes para o melhor indivıduo da serie do Indice Nasdaq.
Arquitetura 3-5-1
E.6 MELHORES INDIVIDUOS PARA A SERIE DO INDICE S&P500 219
REDE 2:
1 0 1 1 0
0 1 1 1 1
1 1 1 1 0
0 1 1 1 1
1
0
1
1
1
0
(E.)
E.6 MELHORES INDIVIDUOS PARA A SERIE DO INDICE S&P500
As matrizes de conexoes para o melhor indivıduo da serie do Indice S&P500.
Arquitetura 3-5-1
REDE 2:
1 1 1 1 1
1 1 1 1 1
1 1 0 1 1
1 0 0 0 1
1
1
1
1
1
1
(E.)
E.7 MELHORES INDIVIDUOS PARA A SERIE DO VALOR DE FECHAMENTO
DAS ACOES DA PETROBRAS
As matrizes de conexoes para o melhor indivıduo da serie do Valor de Fechamento das
Acoes da Petrobras.
E.8 MELHORES INDIVIDUOS PARA A SERIE RANDOM WALK 220
E.7.1 Arquitetura 3-10-1
REDE 2:
1 1 0 0 1 1 1 1 1 1
1 0 1 1 1 1 1 0 1 1
1 1 1 0 1 1 1 1 1 1
1 1 1 1 1 1 1 1 1 1
1
1
1
1
0
0
1
1
1
1
1
(E.)
E.8 MELHORES INDIVIDUOS PARA A SERIE RANDOM WALK
As matrizes de conexoes para o melhor indivıduo da serie Random Walk.
Arquitetura 3-10-1
REDE 2:
0 1 0 1 1 1 1 1 1 0
1 1 0 1 1 1 1 0 0 0
1 1 1 1 0 1 1 0 0 1
0 1 1 1 1 1 1 1 1 0
1
0
1
1
1
1
1
1
1
1
1
(E.)
REFERENCIAS BIBLIOGRAFICAS
[1] George E. P. Box, Gwillym M. Jenkins, and Gregory C. Reinsel. Time Series
Analysis: Forecasting and Control. Prentice Hall, New Jersey, third edition, 1994.
[2] T. Subba Rao and M. M. Gabr. Introduction to Bispectral Analysis and Bilinear
Time Series Models, volume 24 of Lecture Notes in Statistics. Springer, Berlin,
1984.
[3] M. B. Priestley. Non-Linear and Non-Stacionary time Series Analysis. Academic
Press, 1988.
[4] T. Ozaki. Nonlinear Time Series Models and Dynamical Systems, volume 5 of Hand
Books of Statistics. Noth-Holland, Amsterdam, 1985.
[5] D. E. Rumelhart and J. L. McCleland. Parallel Distributed Processing, Explorations
in the Microstructure of Cognition, volume 1 & 2. MIT Press, 1987.
[6] J. G. De Gooijer and K. Kumar. Some recent developments in non-linear time series
modelling, testing, and forecasting. International Journal of Forecasting, 8:135–156,
1992.
[7] R. F. Engle. Autoregressive conditional heteroskedasticity with estimates of the
variance of uk onflation. Econometrica, 50:987–1008, 1982.
[8] T. Bollerslev. Generalized autoregressive conditional heteroskedasticity. Journal of
Econometrics, 31:307–328, 1986.
[9] M. P. Clements, P. H. Franses, and N. R. Swanson. Forecasting economic and
financial time-seires with non-linear models. International Journal of Forecasting,
20:169–183, 2004.
[10] G. Zhang, B. Eddy Patuwo, and M. Y. Hu. Forecasting with artificial neural
networks: The state of the art. International Journal of Forecasting, 14:35–62,
1998.
221
REFERENCIAS BIBLIOGRAFICAS 222
[11] C. T. Chan, C. H. Chuek, D. P. Mital, and T. T. Huat. Time series modelling
and forecasting using genetic algorithms. In L. C. Jain, editor, First Internatio-
nal Conference on Knowledge-Based Intelligent Electronic Systems, pages 260–268,
Adelaide, 1997.
[12] Andre Neubauer. Genetic algorithms for adaptive non-linear predictors. In IEEE
International Conference on Electronics, Circuits and Systems, volume 1, pages
209–212, 1998.
[13] R. J. Povinelli and Xin Feng. A new temporal patter identification method for
characterization and prediction of complex time series events. IEEE Transactions
on Knowledge and Data Engineering, 15(2):339–352, March/April 2003.
[14] Jerry M. Mendel. Fuzzy logic systems for engineering: A tutorial. In Proceedings
of the IEEE, volume 83, pages 345–377, 1995.
[15] Suran Goonatilake and Sukhdev Khebbal. Intelligence Hybrid Systems. John Wiley
& Son, 1995.
[16] Floris Takens. Detecting strange attractor in turbulence. In A. Dold and B. Eck-
mann, editors, Dynamical Systems and Turbulence, volume 898 of Lecture Notes in
Mathematics, pages 366–381, New York, 1980. Springer-Verlag.
[17] R. Savit and M. Green. Time series and dependent variables. Physica D, 50:95–116,
1991.
[18] H. Pi and C. Peterson. Finding the embedding dimension and variable dependences
in time series. Neural Computation, 6:509–520, 1994.
[19] N. Tanaka, H. Okamoto, and M. Naito. Estimating the active dimension of the
dynamics in a time series based on a information criterion. Physica D, 158:19–31,
2001.
[20] Donald B. Percival and Andrew T. Walden. Spectral Analysis for Physical Applica-
tions – Multitaper and Conventional Univariate Techniques. Cambridge University
Press, New York, 1998.
[21] Haolger Kantz and Thomas Schreiber. Nonlinear Time Series Analysis. Cambridge
University Press, New York, NY, USA, second edition, 2003.
REFERENCIAS BIBLIOGRAFICAS 223
[22] Pedro A. Morettin. Analise Harmonica de Processos Estocasticos. IMPA - Instituto
de Matematica Pura e Aplicada, Rio de Janeiro, 1979.
[23] Pedro A. Morettin e Clelia M. Toloi. Modelos para Previsao em Series Temporias,
volume 1 e 2. IMPA - Instituto de Matematica Pura e Aplicada, Sao Paulo, 1981.
[24] Pedro A. Morettin e Clelia M. Toloi. Series Temporais. Colecao Metodos Quanti-
tativos. Atual Editora, Sao Paulo, 2sd edition, 1987.
[25] Michalem P. Clements, Philip Hans Franses, Jeremy Smith, and Dick Van Dijk.
On setar non-linearity and forecasting. Journal of Forecasting, 22(5):359–375, Aug
2003.
[26] Mitja Perus. Multi-level synergetic computation in brain. Nonlinear Phenomena
in Complex Systems, 4(2):157–193, 2001.
[27] Simon Haykin. Redes Neurais - Princıpios e Pratica. Bookman, Porto Alegre -
Brasil, 2a edition, 2002.
[28] T. Kohonen. Self-organized formation of topologically connect feature maps. Bio-
logical Cybernetics, 43:5–69, 1982.
[29] Teuvo Kohonen. Self-Organization and Associative Memory. Springer-Verlog, Ber-
lin, 1984.
[30] J. J. Hopfield. Neural networks and physical systems with emergent coletive com-
putational abilities. In Proceedings of the National Academy of the Sciences of the
U.S.A., volume 79, pages 2554–2558, 1982.
[31] G. A. Carpenter and S. Grossberg. The art of adaptive pattern recognition by a
self-organizing neural network. Computer, 21(3):77–88, March 1988.
[32] Tom M. Mitchell. Machine Learning. WCB McGraw-Hill, Boston, 1997.
[33] P. A. Braga, A. P. L. F. Carvalho, and T. B. Ludemir. Redes Neurais Artificiais:
Teoria e Aplicacoes. LTC, Rio de Janeiro, 2000.
[34] H. White. Learning in artificial neural networks: A statistical prespective. Neural
Communication, 1:425–464, 1989.
[35] B. D. Ripley. Networks and Chaos-Statistical Probabilistic Aspects. Chapman-Hall,
London, 1993.
REFERENCIAS BIBLIOGRAFICAS 224
[36] B. Cheng and D. M. Titterington. Neural networks: A review from a statistical
perspective. Statistical Science, 9(1):2–54, 1994.
[37] B. Irie and S. Miyake. Capabilities of three-layers perceptrons. In Proceedings of
the IEEE International Conference on Neural Networks, volume I, pages 641–648,
1998.
[38] K. Hornik, M. Stinchcombe, and H. White. Multilayer feedforward networks are
universal approximators. Neural Networks, 2:359–366, 1989.
[39] G. Cybenko. Approximation by superpositions of a sigmoidal function. Mathema-
tical Control Signals Systems, 2:303–314, 1989.
[40] K. Funahashi. On the approximate realization of continuos mappings by neural
networks. Neural Networks, 2:183–192, 1989.
[41] k. Hornik. Approximation capabilities of multilayer feedforward neural networks.
Neural Networks, 4:251–257, 1991.
[42] K. Hornik. Some new results on neural networks approximation. Neural Networks,
6:1069–1072, 1993.
[43] C. W. J. Granger and T. Terasvirta. Modelling Nonlinear Economic Relationships.
Oxford University Press, Oxford, 1993.
[44] J. Park and I. W. Sandberg. Approximation and radial bases functions networks.
Neural Computation, 5:305–316, 1993.
[45] C. H. Chang, S. Chen, and B. Mulgrew. Gradient radial basis function networks for
nonlinear and nonstationnary time series prediction. IEEE Transations on Neural
Networks, 7(1):190–194, 1996.
[46] J. M. Gorriz, C. G. Puntonet, M. Salmeron, and J. J. G. de la Rosa. A new model
for time-series forecasting using radial base functions and exogenous data. Neural
Comput & Application, 13:101–111, 2004.
[47] X. Zhang and A. Beveniste. Wavelet networks. IEEE Transations on Neural Net-
works, 3(6):889–898, 1992.
[48] S. P. Cristea, R. Tuduce, and A. Cristea. Time series predicting with wavenet
neural networks. In Proceedings of the 5th Seminar on Neural Network Applications
Electral Engineering – NEURAL2000, pages 5–10, 2000.
REFERENCIAS BIBLIOGRAFICAS 225
[49] Lutz Prechelt. Proben1: A set of neural network benchmark problems and bench-
marking rules. Technical Report 21/94, 1994.
[50] D. E. Rumelhart and J. L. McClelland. Parallel Distributed Processing, volume 1:
Foundations. The MIT Press, 1986.
[51] J. Sietsma and R. Dow. Neural net pruning – why and how? In Proceedings of
the IEEE International Conference on Neural Networks, volume 1, pages 325–333,
1988.
[52] E. D. Karnin. A simple procedure for pruning back-propagation trained neural net-
works. In Proceedings of the IEEE International Conference on Neural Neteworks,
volume 1, pages 239–245, 1990.
[53] Andreas S. Weigend, David E. Rumelhart, and Bernardo A. Huberman. Generali-
zation by weight-elimination with application to forecasting. In Advances in Neural
Information Processing Systems – NIPS, volume 3, pages 875–882, 1991.
[54] R. Reed. Pruning algorithms - a survey. IEEE Transactions on Neural Networks,
4(5):740–747, 1993.
[55] M. Crottel, B. Girard, Y. Girard, M. Mangeas, and C. Muller. Neural modeling for
time series: a statistical stepwise method for weight elimination. IEEE Transactions
on Neural Networks, 6(6):1355–1364, 1995.
[56] A. Roy, L. S. Kim, and S. Mukhopadhyay. A polynomial time algorithm for the
construction and training of a class of multilayer perceptron. Neural Networks,
6:535–545, 1993.
[57] Z. Wang, C. D. Massimo, M. T. Tham, and A. J. Morris. A procedure for deter-
mining the topology of multilayer feedforward neural networks. Neural Networks,
7(2):291–300, 1994.
[58] N. Murata, S. Yoshizawa, and S. Amari. Network information criterion-determining
the number of hidden units for artificial neural netework model. IEEE Transactions
on Neural Networks, 5(6):865–872, 1994.
[59] D. Srinivasan, A. C. Liew, and C. S. Chang. A neural network short-time load
forecast. Electral Power Systems Research, 28:227–234, 1994.
REFERENCIAS BIBLIOGRAFICAS 226
[60] R. P. Lippmann. An introduction to computing with neural nets. IEEE ASSP
Magazine, pages 4–22, April 1987.
[61] A. Lapedes and R. Faber. How neural nets work. In D. Z. Anderson, editor,
Neural Information Processing Systems, pages 442–456, New York, 1988. Americam
Institute of Physics.
[62] F. S. Wong. Time series forecasting using backpropagation neural networks. Neu-
rocomputing, 2:147–159, 1991.
[63] Z. Tang and P. A. Fishwick. Feedforward neural nets as models for time series
forecasting. ORSA Journal on Computing, 5(4):374–385, 1993.
[64] C. De Groot and D. Wortz. Analysis of multivariate time series with connectionist
nets: a case study of two classical examples. Neurocomputing, 3:177–192, 1991.
[65] K. Chakrabort, K. Mehrotra, C. K. Mohan, and S. Ranka. Forecasting the behavior
of multivariate of time series using neural networks. Neural Networks, 5:961–970,
1992.
[66] R. Sharda and R. B. Patil. Connectionist approach to time series prediction: An
empirical test. Journal of Intelligent Manufacturing, 3:317–323, 1992.
[67] S. T. Cheng, D. C. Yu, and A. R. Moghaddamjo. Weather sensitive short-term load
forecasting using nonfully connected artificial neural networks. In Proceedings of the
IEEE/Power Engineering Society Summer Meeting, volume 91 SM 449-8 PWRS,
1991.
[68] K. A. Duliba. Constrasting neural nets with regression in predicting performance
in the transportation industry. In Proceedings of the Annual IEEE International
Conference on Systems Sciences, volume 25, pages 163–170, 1991.
[69] D. C. Pack, M. A. El-Sharkawi, and R. J. Marks II. An adaptively trained neural
network. IEEE Transactions on Neural Networks, 2(3):334–345, 1991.
[70] D. C. Pack, M. A. El-Sharkawi, R. J. Marks II, L. E. Atlas, and M. J. Damborg.
Electric load forecasting using an artificial neural network. IEEE Transactions on
Power Systems, 6(2):442–449, 1991.
[71] R. A. Jacobs. Incresed rates of convergence through learning rate adaptation.
Neural Networks, 1(4):295–308, 1998.
REFERENCIAS BIBLIOGRAFICAS 227
[72] S. E. Fahlman. An empirical study of learning speed in backpropagation networks.
Technical report, Carnegie Mellow University, 1988.
[73] S. Falhman. Faster-learning variations of back-propagation: An empirical study.
In D. Touretzky, G. Hilton, and T. Sejnowski, editors, Proceedings of the 1998
Connectionist Models Summer School, pages 38–51, 1989.
[74] M. Reidmiller and H. Braun. A direct adaptive method for faster backpropagation
learing: The rprop algorithm. In Proceedings of the IEEE Int. Conf. on Neural
Networks (ICNN), pages 586–591, San Francisco, 1993.
[75] J. J. Mor. The levenberg-marquardt algorithm: Implementation and theory. In
G. A. Watson, editor, Numerical Analysis, volume 630 of Lecture Notes in Mathe-
matics, pages 105–116, Berlin, 1977. Springer-Verlag.
[76] M. Hagan and M. Menhaj. Training feedforward networks with the marquardt
algorithm. IEEE Transactions on Neural Networks, 5(6):989–993, November 1994.
[77] M. F. Moller. A scaled conjugate gradient algorithm for fast supervised learning.
Neural Networks, 6:525–533, 1993.
[78] R. Battiti. One step secant conjugate gradient. Neural Computation, 4:141–166,
1992.
[79] John H. Holland. Adaptation in Natural and Artificial Systems. University of
Michigan Press, Michigan, 1975.
[80] John H. Holland. Genetic algorithms. Scientific Amerian, pages 66–72, july 1992.
[81] David E. Goldberg. Genetic Algorithms in Search, Optimization, and Machine
Learning. Addison-Wesley, 1989.
[82] Stan Franklin. Artificial Minds. MIT Press, 2001.
[83] M. Mitchell. An Introduction to Genetic Algorithms. MIT Press, Canbridge, 1999.
[84] F. H. F. Leung, H. K. Lam, S. H. Ling, and P. K. S. Tam. Tuning of the structure
and parametrs of the neural network using an improved genetic algorithm. IEEE
Transactions on Neural Networks, 14(1):79–88, January 2003.
[85] D. Dasgupta. Artificial Immune System and the Applications. Springr-Verlog,
Berlin, 1999.
REFERENCIAS BIBLIOGRAFICAS 228
[86] Donald Arthur Waterman. A guide to expert systems. Addison-Wesley, 1986.
[87] Maria Carolina Monard and Jose Augusto Baranauskas. Inducao de Regras e
Arvores de Decisao, chapter 5 - Sistemas Inteligentes – Fundamentos e Aplicacoes,
pages 115–139. Mallone, Sao Paulo, 2003.
[88] M. Henon. A two-dimensional mapping with a stranger attractor. Communications
in Mathematical Physics, 50(1):69–77, 1976.
[89] Derek Y. Chan and Dan Prager. Analysis of time series by neural networks. In
IEEE International Joint Conference on Neural Networks, volume 1, pages 355–360,
1991.
[90] D. B. Murray. Forecasting a chaotic time series using an improved metric for
embedding space. Physica D, 68:318–325, 1993.
[91] Vladimir Golovko ans Yury Savitsky and Nikolay Maniakov. Modeling nonlinear
dynamic using multilayer neural networks. In IEEE International Workshop on
Intelligence Data and Advanced Computing Systems: Technology and Applications,
pages 197–202, Foros - UKraine, 2001.
[92] K. W. Lau and Q. H. Wu. Local prediction of chaotic time series based on gaussian
processes. In Proceedings of the 2002 IEEE International Conference on Control
Applications, pages 1309–1313, Glasgow, Scotland, 2002.
[93] Miomir S. Stankovic, Branimir T. Todorovic, and Bojana M. Vidojkovic. Recon-
struction of chaotic dynamics using structurally adaptive radial basis function net-
works. In IEEE 6th Seminar on Neural Network Application in Electrical Enginee-
ring - NEUREL 2002, pages 33–36, Yugoslavia, 2002.
[94] S. H. Ling, H. K. Lam, F. H. F. Leung, and Y. S. Lee. A genetic algorithm based
neural-tuned neural network. In The 29th Annual Conference of the IEEE Industrial
Eletronics Society - IECON’03, volume 3, pages 2423–2428, 2003.
[95] L. J. Cao, K. S. Chua, and L. K. Guan. Combining kpca with support vector
machine for time series forecasting. In Proceeding IEEE International Conference
on Computational Intelligence for Financial Engineering, pages 325–329, 2003.
[96] A. Sfetsos and C. Siriopoulos. Time series forecasting with a hybrid clustering
scheme and pattern recognition. IEEE Transactions on Systems, Man, and Cyber-
netics - Part A: Systems and Humans, 34(3):399–405, May 2004.
REFERENCIAS BIBLIOGRAFICAS 229
[97] H. Joseph Newton. TimesLab: A Time Series Analysis Laboratory. Stati-
stics/Probability Series. Wadsworth & Brooks/Cole, 1998.
[98] Time series data library - http://www-personal.buseco.monash.edu.au/∼hyndman/
TSDL/.
[99] M. P. Clements and D. F. Hendry. On the limitations of comparing mean square
forecast errors. Journal of Forecasting, 12(8):617–637, Dec. 1993.
[100] T. H. Hann and E. Steurer. Much ado about nothing? exchange rate forecasting:
Neural networks vs. linear models using monthly and weekly data. Neurocomputing,
10:323–339, 1996.
[101] H. Akaike. A new look at the statistical model identification. IEEE Transactions
on Automatic Control, AC-19(6):716–723, 1974.
[102] Chris Chatfield. Time Series Forecasting. Chapman & Hall/CRC, London, 2001.
[103] Renate Sitte and Joaquin Sitte. Neural networks approach to the random walk
dilemma of financial time series. Applied Intelligence, 16(3):163–171, May 2002.
[104] Tiago A. E. Ferreira, Germano C. Vasconcelos, and Paulo J. L. Adeodato. A hybrid
intelligence system approach for improving the prediction of real world time series.
In IEEE Proceedings of the Congress on Evolutionary Computation, volume 1, pages
736–743, Portland, Oregon, 2004. IEEE.
[105] Tiago A. E. Ferreira, Germano C. Vasconcelos, and Paulo J. L. Adeodato. An
ann-ga approach for automatic lag search and real world time series forecasting. In
IEEE Proceedings of the 8th Brazilian Symposium on Neural Networks, Sao Luiz,
Maranhao, 2004. IEEE.
[106] Wilton de O. Bussab and Pedro A. Morettin. Estatıstica Basica. Editora Saraiva,
Sao Paulo, 5 edition, 2004.
[107] N. Teru and H. K. Van Dijk. Combined forecasts form linear and nonlinear time
series models. Intenational Journal od Forecasting, 18:421–438, 2002.
[108] J. li and E. P. K. Tsang. Investment decision making using fgp: a case study. In
IEEE Proceedings of Congress on Evolutionary Computation, volume 2, page 1259.
IEEE, 1999.
REFERENCIAS BIBLIOGRAFICAS 230
[109] C. A. Casas. Tatical asset allocation: an artificial neural network based model. In
IJCNN’2001, volume 3, pages 1844–1816. IEEE, 2001.
[110] T. C. Mills. The Econometric Modelling of Financial Time Series. Cambridge
University Press, Cambridge, 2003.
[111] Gianna Boero and Emanuela Marrocu. The performance of non-linear exchange
rate models: a forecasting comparison. Journal of Forecasting, 21(7):513–542, Nov.
2002.
[112] Thomas M. Cover and Joy A. Thomas. Elements of Information Theory. Wiley
series in telecommunications. John Wiley, New York, 1991.
[113] Tiago A. E. Ferreira, Germano C. Vasconcelos, and Paulo J. L. Adeodato. A new
evolutionary method for times series forescasting. In ACM Proceedings of Genetic
Evolutionary Computation Conference - GECCO 2005, Washington D.C., USA,
2005. ACM.
[114] Tiago A. E. Ferreira, Germano C. Vasconcelos, and Paulo J. L. Adeodato. A new
hybrid approach for enhanced times series prediction. In Anais do XXV Congresso
da Sociedade Brasileira de Computacao, pages 831–840, Sao Leopoldo / RS, 2005.
SBC.
[115] Tiago A. E. Ferreira, Germano C. Vasconcelos, and Paulo J. L. Adeodato. Evo-
lutionary method for real-word times series prediction. In Proceedings of the 8th
Join Conference on Information Sciences (JCIS’2005) – 4th International Work-
shop on Computational Intelligence in Economics and Finance (CIEF’2005), Salt
Lake City, Utah, USA, 2005.
[116] Tiago A. E. Ferreira, Germano C. Vasconcelos, and Paulo J. L. Adeodato. A new
hybrid method for time series forecasting. In Anais do VII Congresso Brasileiro de
Redes Neurias - CBRN 2005, Natal, RN, Brasil, 2005.
[117] Tiago A. E. Ferreira, Germano C. Vasconcelos, and Paulo J. L. Adeodato. A new
intelligent methodology for times series forecasting. New Mathematics and Natural
Computation (Artigo aceito para publicacao), 2005.
[118] L. Allen and J. H. Eberly. Optical Resonance and Two-Level Atoms. Dover, New
York, 1987.
REFERENCIAS BIBLIOGRAFICAS 231
[119] Gerhard Herzberg. Atomic Spectra and Atomic Structure. Dover, New York, 1944.
[120] Claude Cohen-Tannoudji, Bernard Diu, and Franck Laloe. Quantum Mechanics,
volume 1 & 2. John Wiley & Sons, New York, 1977.
[121] J. J. Sakurai. Modern Quantum Mechanics. Addison-Wesley, Massachusetts, 1994.
[122] D. Deutsch and R. Jozsa. Rapid solution of problems by quantum computation.
In Proceedings of Royal Society of London, volume 439 of Series A, pages 553–558,
1992.
[123] Mika Hirvensolo. Quantum Computing. Natural Computing Series. Springer, second
edition edition, 2004.
[124] Nouriaki Kouda, Nobuyuki Matsui, and Haruhiko Nishimura. A multi-layered feed-
forward network based on qubit neuron model. Systems and Computers in Japan,
35(13):43–51, 2004.
[125] Nouriaki Kouda, Nobuyuki Matsui, Haruhiko Nishimura, and Ferdinand Peper. An
examination of qubit neural network in controlling an inverted pendulum. Neural
Processing Letters, 22:277–290, 2005.
[126] Domingos V. Filho, Tiago A. E. Ferreira, Teresa B. Ludermir, and Meuser J. S.
Valenca. Um modelo de previsao baseado em inteligencia artificial na gestao de
bibliotecas universitarias. In Anais do XII Seminario Nacional de Bibliotecas Uni-
versitarias - XII SNBU 2002, Recife - PE, 2002.
[127] Paulo S. G. de Mattos Neto, Gustavo G. Petry, Joao P. de M. Ataide, and Tiago
A. E. Ferreira. Combinacao de redes neurais artificiais co algoritmo genetico modi-
ficado para a previsao de series temporais. In Anais do XXV Congresso Brasileirop
de Computacao - V ENIA, pages 952–961, Sao Leopoldo -RS, 2005. SBC.
[128] Paulo S. G. de Mattos Neto, Gustavo G. Petry, Joao P. de M. Ataide, and Tiago
A. E. Ferreira. Composicao de redes neurais artificiais com algoritmo genetico mo-
dificado para a previsao de series temporais. In Anais do VII Congresso Brasileiro
de Redes Neurais - VII CBRN, Natal - RN, 2005. Sociedade Brasileira de Redes
Neurais.
232
233