universidade federal de alfenas maria eugÊnia de … · “o Índice bovespa é o mais importante...
TRANSCRIPT
UNIVERSIDADE FEDERAL DE ALFENAS
MARIA EUGÊNIA DE OLIVEIRA BATISTA
PREVISÃO DOS ÍNDICES BOVESPA E PETROBRAS UTILIZANDO
MODELOS AR-ARCH E REDES NEURAIS ARTIFICIAIS NO PERÍODO DE
2005-2010
Varginha
2016
UNIVERSIDADE FEDERAL DE ALFENAS
MARIA EUGÊNIA DE OLIVEIRA BATISTA
PREVISÃO DOS ÍNDICES BOVESPA E PETROBRAS UTILIZANDO
MODELOS AR-ARCH E REDES NEURAIS ARTIFICIAIS NO PERÍODO DE
2005-2010
Trabalho de conclusão de curso apresentado
como parte dos requisitos para obtenção do título
de Bacharel em Ciências Econômicas com Ênfase
em Controladoria pela Universidade Federal de
Alfenas.
Orientador: Profº. Dra. Luciene Resende
Gonçalves.
RESUMO
Os índices do mercado acionário possuem grandes influências sobre a economia, pois são eles que
representam o desempenho de uma carteira de ações na qual estão representados importantes
empreendimentos do sistema econômico nacional servindo, assim, como uma medida sobre a situação
da economia. A previsão desses índices (também chamados de séries temporais financeiras) é
considerada importante no âmbito dos estudos realizados em finanças e no mercado acionário, mas
está longe de ser um tema simples e de soluções perfeitas. Diversas técnicas são utilizadas a fim de
prever o comportamento dos ativos. A partir desta discussão, a comparação entre dois métodos,
eficientes de acordo com a literatura, se faz necessário para que diminua o risco dos acionistas em
relação ao futuro. Portanto, o objetivo deste trabalho é analisar as previsões dos índices Bovespa e
Petrobras entre os anos de 2005 e 2015 utilizando modelos de séries temporais (AR-ARCH) e de redes
neurais artificiais (RNAs) a fim de auxiliar na tomada de decisão de acionistas proporcionando o
menor risco possível. Os dados foram retirados dos sites Ipeadata (2015) e Economática (2015) e as
análises foram feitas utilizando o software R e o software SPSS. Ambas metodologias se mostraram
adequadas, mas não totalmente suficientes para prever índices tão instáveis como os do mercado
acionário.
Palavras-chave: Bovespa, Petrobras, Séries Temporais, AR-ARCH, Redes Neurais.
SUMÁRIO
1. INTRODUÇÃO .................................................................................................................................. 6
2. REFERENCIAL TEÓRICO................................................................................................................ 7
2.1. Mercado de Capitais ........................................................................................................................6
2.1.1. Bolsa de Valores e Ibovespa.. .................................................................................................... 8
2.1.2. Índice Petrobras .......................................................................................................................... 9
2.2. Previsão de Séries Temporais ........................................................................................................ 10
3. MATERIAIS E MÉTODOS ............................................................................................................. 12
3.1. Materiais ........................................................................................................................................ 12
3.1.1. Modelos de Séries Temporais .................................................................................................. 12
3.1.1.1. Retornos (Rt) ..................................................................................................................... 12
3.1.1.2. Modelo Linear: ARIMA ................................................................................................... 14
3.1.1.3. Modelos não lineares: ARCH e GARCH ......................................................................... 15
3.1.2. Redes Neurais Artificiais .......................................................................................................... 17
3.1.2.1. Neurônio Artificial ........................................................................................................... 18
3.1.2.2. Arquitetura das redes neurais ........................................................................................... 19
3.1.2.3. Redes Perceptron multicamadas (PMC) .......................................................................... 20
3.2. Métodos e Hipótese.........................................................................................................................22
4. RESULTADOS ................................................................................................................................. 23
4.1. Análise descritiva dos dados ......................................................................................................... 23
4.2. Análise das previsões utilizando o modelo AR-ARCH................................................................. 25
4.3. Análise das previsões utilizando Redes Neurais Artificiais .......................................................... 29
5. CONCLUSÃO .................................................................................................................................. 33
6. REFERÊNCIAS ................................................................................................................................ 34
6
1. INTRODUÇÃO
Os índices do mercado acionário possuem grandes influências sobre a economia, pois
são eles que representam o desempenho de uma carteira de ações na qual estão representados
importantes empreendimentos do sistema econômico nacional servindo, assim, como uma
medida sobre a situação da economia. A previsão desses índices (também chamados de séries
temporais financeiras) é considerada importante no âmbito dos estudos realizados em finanças
e no mercado acionário, mas está longe de ser um tema simples e de soluções perfeitas. Os
mercados de capitais oscilam imediatamente às mudanças nas expectativas dos agentes.
Prever essas oscilações é ainda uma tarefa difícil para a estatística, economia, matemática e
áreas afins, porém, mesmo previsões com certo grau de erro podem ser de grande valor para
os investidores.
A análise de um modelo e método ideal serve como um suporte aos acionistas dentro
da Bovespa e aos detentores de curiosidades em relação ao mercado acionário brasileiro.
Além disso, séries econômico-financeiras possuem características únicas comparadas a outros
tipos de séries temporais. Elas possuem características dinâmicas e comportamento não-
linear, ou seja, “são sistemas em que as variáveis do ambiente possuem um complexo padrão
de inter-relacionamento que se altera ao longo do tempo” (COSTA, 2012).
De maneira geral, existem diversos modelos que realizam previsões de séries com
intensa inconstância, mas nem todas possuem resultados expressivos e confiáveis. Coelho et
al. (2008) argumenta que modelos mais tradicionais como os auto-regressivos de médias
móveis supondo heterocedasticidade condicional auto-regressiva (ARMA-GARCH) não
trazem resultados satisfatórios em relação às previsões. E que modelos mais atuais e
complexos obtiveram melhores resultados na área, como é o caso de previsões utilizando
Redes Neurais Artificiais (RNA). As características presentes nas redes neurais possibilitam
que se tornem uma importante ferramenta para gerar previsões em situações em que a
utilização de outras técnicas não seria tão eficiente. As redes neurais podem melhorar as
previsões porque levam em consideração mais informações do que outras técnicas são
capazes de processar (ROQUE, 2009).
Dessa forma este trabalho visa analisar, através de modelos de séries temporais AR-
ARCH e de redes neurais artificiais, as previsões do comportamento dos índices Bovespa e
Petrobras entre os anos de 2005 e 2015, e descrever a empregabilidade dos modelos para estas
previsões, com o objetivo de minimizar as incertezas dos investidores sobre o futuro cenário
do mercado acionário brasileiro.
7
O trabalho está disposto em cinco seções, sendo esta a primeira. A segunda e a terceira
apresentam conceitos básicos sobre o Ibovespa, Petrobras e sobre os modelos de séries
temporais e Redes Neurais Artificiais. Em seguida são apresentados o desenvolvimento destes
procedimentos e análise das previsões obtidas pelos diferentes modelos. Na quarta seção será
apresentada a conclusão, e, por fim, o referencial bibliográfico.
2. REFERENCIAL TEÓRICO
2.1.Mercado de Capitais
“O Mercado de Capitais pode ser definido como um conjunto que abrange as bolsas de
valores, sociedades corretoras e diversificadas instituições financeiras. Neste mercado, são
negociados títulos mobiliários que tem por objetivo gerar recursos financeiros para as
empresas” (QUIRINO, R. S. L., 2012). E, conforme Pinheiro (2009, p. 174)
o mercado de capitais pode ser definido como um conjunto de instituições e de
instrumentos que negociam com títulos e valores mobiliários, objetivando a
canalização dos recursos dos agentes compradores para os agentes vendedores.
Ou seja, o mercado de capitais representa um sistema de distribuição de valores
mobiliários que tem o propósito de viabilizar a capitalização das empresas e
dar liquidez aos títulos emitidos por elas.
Assim, o Mercado de Capitais, também chamado de Mercado de ações, tem por
objetivo o direcionamento de capital e poupança da sociedade para as empresas. Além disso,
ele é segmentado de duas formas, Mercado Primário e Secundário. Sendo que, conforme
Pinheiro (2009, p.175) “o mercado primário de ações é onde se negocia a subscrição (venda)
de novas ações ao público, ou seja, no qual a empresa obtém recursos para seus
empreendimentos”.
Já o Mercado Secundário é aquele em que se transferem os títulos entre os investidores
e/ou instituições, ou seja, representa a transação entre compradores e vendedores de ações,
não ocorrendo desta forma em alterações financeira na empresa que emitiu o título no
mercado primário (FORTUNA, 1997, p. 307). Conforme Pinheiro (2009, p. 175) “a função do
mercado secundário (...) é dar liquidez ao investidor, possibilitando que, no momento em que
realizar uma operação de venda, exista o comprador e vice-versa, o que viabilizará o
crescimento do mercado primário”.
8
2.1.1. Bolsa de Valores e Ibovespa
“O Índice Bovespa é o mais importante indicador do desempenho médio das cotações
do mercado de ações brasileiro, porque retrata o comportamento dos principais papeis
negociados na Bovespa” (FORTUNA, 2008, pág.622). A Bovespa (Bolsa de Valores de São
Paulo), portanto, é o maior centro de negociações de ações da América Latina (PIMENTA Jr.
e HIGUCHI, 2008).
A Bolsa de Valores teve inicio em 1890, com a criação da Bolsa Livre. A partir de
1960, a Bovespa passou a ter característica de bolsa de valores mutualizada e sem fins
lucrativos e recebeu este nome de Bolsa de Valores de São Paulo. A partir desta data, vários
acontecimentos ajudaram na sua ascensão e evolução até o mercado atual. Em 1980, criou-se
os fundos mútuos (ações e previdência) e houve o início da desmaterialização da custódia,
contribuindo para a agilidade no mercado, e assim, aumento da sua liquidez. Em 2000, a
Bovespa passou a ser o único mercado de bolsas para transação de renda variável no Brasil, e
neste mesmo ano houve a integração das maiores bolsas brasileiras. Em 2002 a Bolsa de
Valores de São Paulo passou a atuar na negociação títulos de rendas variáveis no mercado de
balcão organizado (MBO). Em agosto de 2007, a desmutualização foi aprovada e uma
restruturação societária possibilitou a criação da Bovespa Holding S.A, onde já em outubro
era possível a negociação de ações da Bovespa Holding no Novo Mercado. Em 2008 houve a
concretização da integração da BMF&FBOVESPA S.A (Bolsa de Valores, Mercadorias e
Futuros), e já nasceu como uma das maiores bolsas do mundo, em termos de valor de
mercado. (BMF&BOVESPA, 2015).
O cálculo do índice, segundo Fortuna (2008), é feito em tempo real pela Bovespa,
considerando todos os preços dos negócios efetuados no mercado à vista, com ações
componentes de sua carteira. A apuração pode ser feita a qualquer momento, seu valor é dado
pelo somatório dos pesos (quantidade teórica da ação multiplicada pelo último preço da
mesma) das ações integrantes de sua carteira teórica (FORTUNA, 2008).
Segundo Lemos (2006), o Ibovespa funciona como um direcionador, avaliando o
retorno das ações em suas carteiras e refletindo os ganhos de capital, dividendos e benefícios
que cada ação proporciona. O Ibovespa é relevante pelo fato de manter sua integridade e não
sofrer modificações desde sua implementação em 1968, por refletir o desempenho geral da
economia e por ser um indicador antecipado da atividade econômica nacional (PIMENTA Jr.
e HIGUCHI, 2008).
9
2.1.2. Índice Petrobras
O Índice Petrobras diz respeito às cotações da Petrobras dentro da bolsa de valores de
São Paulo (Bovespa). Este índice iniciou-se na Bovespa no momento em que a oferta pública
de ações da Petrobras foram comercializadas. Segundo Lemos (2006), as ações preferenciais
da Petrobras (PETR4) correspondem a uma das maiores participações no Índice Bovespa.
Além disso, a PETR4 pode indicar uma evolução na estrutura institucional e microestrutura
do mercado acionário brasileiro, sendo esta a verdadeira causa a explicar a tendência do
Ibovespa (LEMOS, 2006).
A história da Petrobras começou em 1953, quando o Presidente Getúlio Vargas
assinou a Lei 2004 que instituiu o monopólio de exploração do petróleo e seus derivados a
uma nova empresa, que recebeu o nome de Petróleo Brasileiro S.A – Petrobras. Esta criação
ocorreu depois de muitas discussões sobre qual seria a melhor política a ser adotada em
relação à exportação do petróleo. Nesta época, o consumo do petróleo era maior do que a
produção, com isso, houve uma intensificação da exploração e também uma especialização
dos técnicos a fim de obter expansão em um curto período de tempo. Com este propósito, em
1961, foi criada uma nova refinaria no Rio de Janeiro, a REDUC – Refinaria de Duque de
Caxias. Em 1963 surge o Centro de Pesquisa e Desenvolvimento (Cenpes), no Rio de Janeiro,
onde se tornou um dos mais importantes centros de pesquisa aplicada no mundo. Em 1968, a
primeira plataforma móvel de petróleo foi criada, localizada no mar de Sergipe. Com o passar
do tempo, várias bacias foram encontradas, e a expansão da exploração do petróleo foi
ocorrendo, possibilitando aumento produção e exportação do petróleo. Nos anos 80, a
Petrobras se tornou pioneira em águas profundas e foi descoberta a nova Bacia do Campo de
Merlim. Em 1997, houve uma queda do monopólio, e a empresa se torna uma das maiores
empresas de petróleo do mundo. A partir dos anos 2000, a Petrobras lançou um novo tipo de
gasolina, considerado a mais avançada no mundo. Foi inaugurada a primeira usina eólica da
empresa; e a Petrobras atingiu autossuficiência na produção de Petróleo e Gás. Nesta década
iniciou-se a produção de petróleo nas jazidas do pré-sal. Foram, então, anos de muitos
investimentos e grande importância na história econômica e sustentável da Petrobras
(PETROBRAS, 2015).
Atualmente a empresa está passando por uma crise de caráter interno e específico, ou
seja, escândalos de corrupção, superfaturamento de obras e lavagem de dinheiro, que
impactaram no valor das ações da companhia. Devido a atual crise, em janeiro de 2015, o
valor de mercado da companhia foi de 106,6 bilhões de reais, valor menor do que o atingido
10
na crise de 2008. Além da crise interna, a Petrobras como uma empresa de controle estatal,
está constantemente na pauta de discussão política e econômica. A interferência do governo
no preço dos derivados do petróleo interno afeta diretamente o fluxo de caixa da empresa e
impacta nos indicadores do país (FRAGA, L. S., et al., 2015).
Lemos (2006) ressalta que, a possibilidade de existir relação entre o Ibovespa e o
comportamento das ações da Petrobras pode ser levada em consideração pelo fato desta ação
ser representativa das mudanças institucionais observadas no mercado de ações do Brasil, por
exemplo, o respeito a acionistas minoritários, melhora no nível de governança corporativa,
etc. De outro modo, estabelece que a tendência do Ibovespa determine o comportamento dos
papeis PETR4, uma vez que, por exemplo, crises políticas e internacionais são captadas pelo
Ibovespa e afetam os papéis PETR4, sem, contudo, tais fatores estarem relacionados aos
fundamentos deste papel (LEMOS, 2006).
2.2. Previsão de Séries Temporais
“Prever o futuro: um grande sonho da humanidade desde tempos imemoriais.”
(COSTA, 2009). No mundo real, obter previsões é possível através de modelos matemáticos
que capturam o comportamento de determinados valores ou variáveis históricas e, a partir daí,
estimam seu comportamento futuro para facilitar tomada de decisões. Este trabalho trata-se
das previsões de séries temporais a fim de minimizar as incertezas existentes no mercado de
ações brasileiro.
Analisando estatisticamente, uma série temporal é qualquer conjunto de observações
ordenadas no tempo. (MORETTIN, 2006). Sandes, R. E. (2003) ressalta também que os
dados de séries temporais são dependentes, ou seja, as observações vizinhas são importantes
para a sua modelagem, e com isso, a ordem temporal dos fatos se torna crucial. Com o seu
estudo é possível analisar gráficos, descrever seu comportamento, como por exemplo,
verificar tendência e sazonalidade e também fazer previsões de valores futuros da série.
(MORETTIN, 2006).
A série temporal pode ser escrita como uma soma ou multiplicação de componentes,
como nas equações (1) e (2):
Zt = Tt + St + αt (1)
Zt = Tt St αt (2)
Onde
Zt = é a observação temporal no tempo t
11
Tt = é a componente de tendência que representa valores da série suavizados ao redor de uma
reta com inclinação positiva ou negativa;
St = é a componente sazonal que refere-se a um movimento oscilatório ligado a variações
periódicas;
αt = é a componente aleatória de média zero e variância constante σ2.
De acordo com Morettin e Toloi (2006), o principal interesse em considerar um
modelo do tipo (1) e (2) é estimar a sazonalidade (St) e a tendência (Tt) presentes em uma
série. Essas duas componentes fazem com que a série tenha comportamento não-estacionário.
A estacionariedade é uma condição exigida para modelagem desse tipo de dados e é
alcançada quando as componentes citadas são eliminadas.
Como a maior parte das séries encontradas na prática apresentam alguma forma de
não-estacionariedade, uma função muito útil que ajuda a identificar componentes não-
estacionárias é a função de autocorrelação.
Em uma série temporal a função de autocorrelação é utilizada para identificar suas
propriedades, medindo o grau de correlação entre as observações. É dada pela razão entre a
autocovariância e a variância. Segundo Gujarati e Porter (2011), a autocorrelação, ou função
de correlação amostral (FAC), é uma das principais formas de identificação do modelo, ou
seja, retrata a presença de estacionariedade na série, junto com a sua função de autocorrelação
parcial (FACP). “A FACP mede a correlação entre as observações da série temporal que estão
separadas por k períodos, depois de verificar as correlações nas defasagens intermediárias
(defasagens menor do que k)” (GUJARATI e PORTER, 2011). O resultado gráfico da
autocorrelação é chamado de correlograma, e também pode ser uma importante ferramenta
para identificar características da série temporal.
Existem diferentes modelos para adequar uma série temporal, e estes estão divididos
de acordo com o número de parâmetros envolvidos. Ou seja, modelos paramétricos e não-
paramétricos. Segundo Morettin e Toloi (2006), nos modelos paramétricos, a análise é feita
no domínio do tempo. Então, os modelos mais utilizados são os auto-regressivos e de médias
móveis (ARMA), os modelos auto-regressivos integrados e de médias móveis (ARIMA),
modelos de memória longa (ARFIMA), modelos estruturais e modelos não-lineares (ARCH-
GARCH). Agora, na classe dos modelos não-paramétricos (análise no domínio da
frequência), os mais utilizados são a função de autocovariância e sua transformada de Fourier,
o espectro.
Morettin e Toloi (2006) ainda ressaltam que, quando os dados originais não
apresentam resultados significativos para serem utilizados no modelo, é necessário realizar
12
algumas transformações nesses dados para que possa encontrar um modelo adequado para a
pesquisa. Geralmente as transformações ocorrem quando há necessidade de estabilizar a
variância ou tornar o efeito sazonal aditivo. Em alguns casos, fazer uma transformação
logarítmica dos dados pode ser adequado. Quando a série não está estacionária, a melhor
forma de corrigir este problema é aplicar a sua diferenciação nos dados originais. Cada série
possui uma transformação especifica, então, é necessário fazer um estudo sobre o que será
necessário para que, no futuro, ocorra uma adequação do modelo.
A maioria das séries temporais financeiras são passeios aleatórios; isto é, não são
estacionárias (GUJARATI e PORTER, 2011). Os autores ainda ressaltam que uma variância
não constante pode ter uma estrutura alto regressiva, onde, ao longo dos diferentes períodos
observados, a heterocedasticidade pode ser auto-correlacionada. Morettin e Toloi (2006)
também argumentam que, em algumas séries econômicas e financeiras, a utilização de
retornos torna-se crucial, em razão da presença de tendência, sazonalidade e não-linearidade.
Um modelo linear, como ARIMA, no entanto, não é adequado para descrever tal
comportamento.
Com isso, utilizam-se os retornos para que o modelo possa ser ajustado. Os modelos
utilizados são os não-lineares (ARCH e GARCH). Neste trabalho serão apresentados o
modelo linear ARIMA, e os modelos não lineares ARCH e GARCH.
3. MATERIAIS E MÉTODOS
3.1.Materiais
3.1.1. Modelos de Séries Temporais
3.1.1.1.Retornos (Rt)
A maior parte dos estudos financeiros concentra-se na análise de séries de retornos ao
invés do uso da série dos preços dos ativos. Um dos objetivos em finanças está relacionado à
avaliação de riscos de uma carteira de ativos financeiros. Este risco é medido em termos de
variação de preços dos ativos (MORETTIN, 2011). É preferível utilizar os retornos para a
modelagem, pois são livres de escala e possuem propriedades estatísticas mais interessantes,
como estacionariedade e ergodicidade (MORETTIN, 2011).
Segundo Rosa (2011), as séries de retornos apresentam algumas características específicas
que são chamados de fatos estilizados, tais como:
- ausência de autocorrelação;
13
- assimetria;
- excesso de curtose (caudas mais pesadas, comparativamente a distribuição normal);
- agrupamento de volatilidade;
- não-linearidade.
Normalmente, o retorno é expresso em porcentagem, relativo ao período, e é também
chamado de taxa de retorno.
Um retorno simples de período k é dado por
[ ]
, sendo (3)
Morettin (2011) afirma que uma série de retorno observada em instante de tempos
igualmente espaçados pode ser considerada parte de uma realização de um processo
estocástico. E para qualquer instante de tempo t1,...,tn e qualquer n≥1, as suas distribuições
devem satisfazer certas condições que, na prática, é difícil de conhecer. Então, para isso, é
necessário caracterizar o processo até determinada ordem, como a média dada por:
( ) ∫ ( )
(3.3)
ou a função de autocovariância,
( ) ( ) ( ) ( ), t1, t2 Z. (3.4)
Outras suposições são introduzidas, como estacionariedade, ergodicidade ou
normalidade do processo (MORETTIN, 2011). Além disso, um dos objetivos de utilização
dos retornos é a modelagem da volatilitade, que é o desvio padrão condicional de uma
variável. Esta volatilidade manifesta-se de várias maneiras em uma série financeira, e o seu
cálculo ocorre através de três enfoques:
- Equacionar um preço de mercado observado com o preço modelado de uma opção
(volatilidade implícita);
- Modelar diretamente a volatilidade da série de retornos, utilizando modelos como o
ARCH (volatilidade estatística);
- Modelar a volatilidade por meio de uma média de uma função dos últimos k retornos
(volatilidade histórica).
Neste trabalho será modelada a volatilidade por meio do modelo ARCH.
14
3.1.1.2.Modelo Linear: ARIMA
A metodologia de Box, Jenkins e Reisel (1994) é bastante utilizada na análise de
modelos paramétricos e consiste basicamente em ajustar o modelo ARIMA (p,d,q), ou seja,
modelos auto-regressivos integrados de médias móveis, a um conjunto de dados. (Morettin e
Toloi, 2006). Tais modelos se caracterizam, ainda, por serem simples e parcimoniosos; as
previsões são bastante precisas, comparando-se favoravelmente com os demais métodos de
previsão. Classificam-se em modelos lineares estacionários e não-estacionários.
Na metodologia de Box-Jenkins, os modelos são escolhidos através de alguma
estratégia, baseada em um ciclo iterativo, onde a estrutura do modelo segue os próprios dados.
Neste ciclo, primeiramente é utilizada uma classe geral de modelos que será considerada na
análise; em seguida, há identificação de qual modelo melhor se adéquam aqueles dados,
levando em consideração a análise da autocorrelação, autocorrelação parcial e outros critérios.
Na próxima etapa são identificados e estimados os parâmetros; e, por fim, o modelo é
diagnosticado e verificado através de uma análise dos resíduos para ver se há adequação do
modelo para que possa ser utilizado na pesquisa (MORETTIN e TOLOI, 2006).
O modelo ARIMA (p,d,q) corresponde a um modelo ARMA, mas a diferença é que a
sua série temporal será diferenciada d vezes. Ou seja, é uma série autorregressiva integrada de
médias móveis, em que p é a ordem da parte autorregressiva, d é o número de vezes que a
série será diferenciada antes de se tornar estacionária e q é a ordem de médias móveis. Se
d=0, a série se torna estacionária para o modelo ARMA (p,q) (GUJARATI e PORTER,
2011).
A equação do modelo ARIMA (p, d, q) é dada por:
( ) ( ) , (4)
em que
- ( ) (
) : é o polinômio autorregressivo de ordem p;
- ( ) (
) : é o polinômio de médias móveis de ordem q;
- B é o operador de retardo sendo , m é uma defasagem qualquer;
- é o operador diferença definido por ( ) ;
- d é o número de diferenças necessárias para deixar a série estacionária.
As condições de existência do modelo ARIMA (p, d, q) são a estacionariedade e
invertibilidade, isto é, as raízes de ( ) e ( ) devem estar fora do círculo unitário.
15
“Um processo ARIMA (p,0,0) significa um processo AR (p) puramente estacionário; um
ARIMA (0,0,q) significa um processo MA (q) puramente estacionário. Dados os valores de
p,d e q, é possível dizer qual processo está sendo modelado.” (GUJARATI e PORTER, 2011).
3.1.1.3.Modelos não lineares: ARCH e GARCH
Os modelos não-lineares são mais adequados para séries financeiras, que possuem
variância condicional evoluindo no tempo, dentre estes, os modelos ARCH (“autoregressive
conditional heterocedasticity”) e GARCH (“generalized ARCH”) serão utilizados. “O
objetivo será modelar o que se chama de volatilidade, que é a variância condicional de uma
variável, comumente um retorno.” (MORETTIN e TOLOI, 2006, pág. 361).
O modelo ARCH, auto-regressivo com heterocedasticidade condicional, tem como
idéia básica o retorno Rt ser não correlacionado serialmente, mas a volatilidade depender de
retornos passados por meio de uma função quadrática. O primeiro passo para a identificação
do modelo ARCH, é tentar ajustar um modelo ARMA, para que a correlação serial da série
seja removida, se caso existir (MORETIN e TOLOI, 2006). Os modelos ARCH permitem que
os erros sejam não correlacionados, mas dependentes, ou seja, (
) pode ser não
nula.
Um modelo ARCH de ordem m é definido por
√ (5.1)
sendo,
. (5.2)
ϵt é independente com média zero, α > 0, αi ≥ 0, i = 1, ... , m-1; αm > 0. Mas, na prática, supõe-
se que ( ) ou uma distribuição que descreva melhor as caudas pesadas de séries
financeiras.
No caso de séries financeiras, quanto mais restrições impõe-se ao processo de
retornos, mais restrições têm-se para os coeficientes do modelo (Morettin,2011).
O autor ainda ressalta que, quando admite-se que rt segue um modelo ARCH, as
caudas serão mais pesadas do que as da normal, caracterizando uma vantagem ao modelo.
Mas a sua desvantagem é que o modelo trata os retornos positivos e negativos de forma
similar, pois os quadrados dos retornos entram na mesma fórmula de volatilidade, e alguns
retornos grandes e isolados podem gerar superprevisões.
Ao supor que ( ), vê-se que Y é uma variável aleatória indicando que tem-se
um modelo AR(1) para , mas com erros não gaussianos. Para o modelo ARCH (m), tem-se
16
∑
, (5.3)
onde há um modelo AR(m) para , com inovações não gaussianas, se é gaussiano.
Além disso, pode-se demonstrar que os retornos rt também formam um ruído branco,
com variância dada por
( )
∑
. (5.4)
Para verificar se a série apresenta heterocedasticidade condicional, pode-se utilizar
dois testes, examinando a série rt.
(i) Teste de Box-Pierce-Ljung para ;
(ii) Teste de multiplicadores de Lagrange (ML).
Se eles forem significativos, conclui-se que há heterocedasticidade condicional na
série. Além disso, os estimadores dos parâmetros do modelo são obtidos pelo método da
máxima verossimilhança condicional.
Morettin (2011) ressalta que para um modelo ARCH(m), com normal ou t-Student,
os resíduos
√ (5.5)
(padronizados) são variáveis aleatórias independentes com distribuição normal padrão ou t-
Student.
Após realizar todos os procedimentos necessários dos modelos ARMA e ARCH, ou
seja, ajustar o modelo ARMA para remover a correlação serial da série, encontrar um
parâmetro adequado para o modelo ARCH(m) e retirar a heterocedasticidade condicional nos
resíduos, obtem-se, enfim, as previsões.
As previsões para a volatilidade utilizando o modelo ARCH(m) são obtidas logo em
seguida.
Assim
( )
(6)
é a previsão de , com origem fixada no instante t. As previsões passos à frente, com
origem em t, são dadas por:
( ) ∑ ( ) (6.1)
em que ( ) , se .
17
Morettin (2011) afirma que o modelo GARCH (generalized ARCH) pode ser usado
para descrever a volatilidade com menos parâmetros do que um modelo ARCH. E é definido
por
√ sendo, (6.2)
∑ ∑
(6.3)
em que são variáveis aleatórias independentes, com média zero,
∑ ( ) ( )
O autor ainda afirma que as vantagens e desvantagens são as mesmas em relação ao
modelo ARCH. A identificação da ordem de um modelo GARCH a ser ajustado a uma série
real usualmente é difícil, por isso, é recomendável a utilização de modelos com ordem baixa.
Morettin (2011) ressalta que as previsões da volatilidade podem ser calculadas
semelhante ao modelo ARMA, e são dadas por
( ) ( ) ( ) (6.4)
3.1.2. Redes Neurais Artificiais
Silva, et al. (2010, pág. 24) afirma que redes neurais artificiais são
modelos computacionais inspirados no sistema nervoso dos seres vivos.
Possuem a capacidade de aquisição e manutenção do conhecimento (baseado
em informações) e podem ser definidas como o conjunto de unidades de
processamento, caracterizadas por neurônios artificiais, que são interligados
por um grande número de interconexões (sinapses artificiais).
Conforme Silva, et al. (2010), as principais características das redes neurais estão
relacionadas a:
- Adaptar os parâmetros internos da rede a partir de padrões, amostras e medidas
relacionados ao comportamento do processo, adquirindo conhecimento por experimentação;
- Aprender a partir da interação com o ambiente por meio de um método de
treinamento, onde a rede extrai o relacionamento existente entre as variáveis;
- Após o treinamento, a rede é capaz de generalizar o conhecimento adquirido,
possibilitando realizar estimações e produzir a melhor resposta;
- A rede é capaz de se organizar internamente possibilitando o agrupamento de
padrões que possuem características em comum;
- É um sistema tolerante a falhas, a rede continua funcionando mesmo quando sua
estrutura interna é corrompida.
18
Devido à sua estrutura e paralelismo, as redes neurais artificiais se destacam na
solução de problemas, pois criam a possibilidade de um desempenho superior em relação aos
resultados baseados nos modelos convencionais. A primeira etapa da solução de problemas é
caracterizado por um processo de aprendizagem, onde as variáveis são apresentadas e
automaticamente são extraídas características para representar a informação fornecida e que
serão utilizadas para gerar os resultados (ROQUE, 2009).
3.1.2.1. Neurônio Artificial
Os neurônios artificiais são não lineares e realizam funções simples, como coletar os
sinais existentes em suas entradas, agregá-los de acordo com sua função operacional e
produzir uma resposta, levando em consideração sua função de ativação (SILVA, et al.,
2010). A estrutura do neurônio artificial foi desenvolvida a partir da estrutura de um sistema
nervoso biológico e do cérebro humano. Um modelo de neurônio artificial possui a estrutura
conforme a Figura 1:
Figura 1: Neurônio artificial
Fonte: Silva, et al. (2010)
Considerando a Figura 1, e de acordo com Silva, et al. (2010), o neurônio possui sete
elementos básicos:
- Os sinais de entrada {X1, X2,..., Xn}: representam os valores das variáveis;
- Pesos sinápticos {W1, W2,...,Wn}: valores que irão ponderam cada variável de entrada na
rede;
- Combinador linear {Σ}: irá agregar os sinais de entrada pelos respectivos pesos sinápticos a
fim de produzir um valor potencial de ativação;
19
- Limiar de ativação {θ}: variável que gera um valor de disparo em relação à saída do
neurônio;
- Potencial de ativação {u}: resultados da diferença entre Σ e θ;
- Função de ativação {g}: limita a saída de um neurônio dentro de um intervalo assumido;
- Sinal de saída {y}: valor final produzido pelo neurônio.
O resultado produzido pelo neurônio artificial é dado pela equação:
∑ (7)
( ) (7.1)
Assim, o funcionamento do neurônio artificial é dado através da apresentação de um
conjunto de valores, que serão multiplicados pelo seu peso sináptico e será obtido seu
potencial de ativação, possibilitando a aplicação da função apropriada para limitar a saída do
neurônio, e, por fim, produzir o valor final. Quando se estabelece uma estrutura e uma
arquitetura apropriada, ou seja, o número de camadas e o número de neurônios em cada
camada corretos, é possível estabelecer uma estrutura ótima para a RNA, possibilitando
melhores resultados e um menor erro.
3.1.2.2. Arquitetura das redes neurais
As RNAs podem obter diversas arquiteturas, e são elas que definem como os
neurônios serão dispostos um em relação aos outros. O treinamento de uma arquitetura
acontece de acordo com um conjunto de passos ordenados a fim de ajustar os pesos e os
limites dos neurônios para que a rede esteja sintonizada e as respostas sejam próximas dos
valores desejados (SILVA, et al, 2010).
Segundo Silva (2010), basicamente uma RNA pode ser divididas em três camadas:
a) Camada de entrada: responsável pelo recebimento dos dados do meio externo;
b) Camadas escondidas, intermediárias, ocultas ou invisíveis: responsáveis por extrair as
características relacionadas ao processo a ser inserido. Quase todo processo interno da
rede é feito nessas camadas;
c) Camada de saída: produz e apresenta os resultados finais da rede.
As principais arquiteturas de RNA podem ser dividas em: redes feedforward de
camada simples, redes feedforward de camadas múltiplas, redes recorrentes e redes
reticuladas. A arquitetura utilizada neste trabalho será a rede feedforward de camadas
múltiplas por possuírem uma ou mais camadas escondidas de neurônios (SILVA, et al, 2010),
como mostra a Figura 2:
20
Figura 2: Rede feedforward de camadas múltiplas
Fonte: SILVA, et al (2010).
Esta rede é formada por uma camada de entrada composta por n sinais, duas camadas
neurais escondidas de neurônios (n1 e n2), e uma camada neural de saída composta de m
neurônios, representando a saída dos valores (SILVA, et al, 2010). Entre os principais tipos de
rede com esta arquitetura se encontra o Perceptron multicamadas, que será utilizada neste
trabalho.
3.1.2.3.Redes Perceptron multicamadas (PMC)
Essas redes são a forma mais simples de configuração da rede neural artificial, pois
possuem pelo menos uma camada escondida (intermediária) de neurônios que está situada
entre as camadas de entrada e saída. Podem ser utilizadas em diversos procedimentos e áreas,
como exemplo: identificação e controle de processos; previsão de séries temporais; e
otimização de sistemas (SILVA, et al, 2010).
Além disso, as redes PMC possuem um treinamento que é efetivado de forma
supervisionada, ou seja, as informações se iniciam na camada de entrada, passam pelas
camadas intermediárias e são finalizadas pelas camadas neurais de saída. A sua aplicabilidade
se deu de forma mais concisa no momento em que um algoritmo de aprendizagem
denominado backpropagation, ou retropropagação do erro, surgiu, possibilitando um
treinamento dessas redes. (SILVA, et al, 2010).
Silva, et al (2010), ressalta que o treinamento por meio da retropropagação do erro é
feito em duas fases específicas, como mostra a Figura 3:
21
Figura 3: Fases de treinamento da rede PMC.
Fonte: Silva, et al (2010).
A primeira fase, segundo Silva, et al (2010) é a “propagação adiante” (forward), onde
os sinais {x1,x2,...xn} são inseridos na rede e propagados camada a camada até a produção das
respectivas saídas. Assim, essa fase visa apenas obter as respostas, levando em consideração
os valores atuais de pesos sinápticos e limiares de seus neurônios, que irão permanecer
inalterados durante sua execução. Como a rede é caracterizada por aprender com os erros, em
seguida, aplica-se a segunda fase denominada “propagação reversa” (backward), onde
ocorrerão os ajustes dos pesos sinápticos e limiares dos neurônios da rede, possibilitando o
ajuste automático dos neurônios em cada interação. Essas fases são importantes porque
possibilita a diminuição dos erros (n3) nos resultados finais da rede, em comparação com a
resposta desejada, e assim, é possível um melhor resultado na análise.
3.2. Métodos e hipótese
Os dados correspondem aos fechamentos diários das séries Ibovespa e Petrobras entre os
anos de 2005 e 2015, retirados do banco de dados dos sites Ipeadata (2015) e Economática
(2015). Os dados originais foram deflacionados no software R com o objetivo de retirar o
efeito da inflação dos resultados.
O trabalho é constituído pelo processamento e observação de dois procedimentos: análise
econométrica e de previsões utilizando a metodologia AR-ARCH e de redes neurais artificiais
(RNA).
Na primeira utilizou-se o software R, e teve como procedimento os passos a seguir:
22
1- Construção e análise dos gráficos das séries originais e cálculo dos retornos (por
possuírem melhores características na análise de dados financeiros), a fim de
modelar a volatilidade existente nas séries financeiras.
2- Geração da função de autocorrelação e autocorrelação parcial para a identificação
das componentes presentes e identificação do modelo a ser ajustado.
3- Ajuste do modelo ARIMA (p,d,q), que será o primeiro procedimento a ser
ajustado, onde serão testados diferentes modelos de ordens autoregressivas e de
médias móveis para obter o melhor resultado.
4- Obtenção do diagnóstico dos ajustes ARIMA através do teste de autocorrelação
residual, critério do menor valor de AIC e do teste Box Pierce, que, possibilitará o
ajuste do segundo modelo, pois a correlação serial da série estará removida.
5- Ajuste do modelo ARCH, segundo procedimento utilizado, com o objetivo de
modelar a volatilidade presente em retornos. Nesta etapa retira-se a
heterocedasticidade condicional nos resíduos, possibilitando o melhor ajuste do
modelo com base no teste de Box-Pierce-Ljung dos resíduos ao quadrado.
6- Através dos ajustes dos modelos, é possível a realização das previsões dos retornos
do Ibovespa e índice Petrobras.
O segundo método a ser utilizado é o de redes neurais artificiais (RNA) utilizando o
algoritmo de aprendizagem de retropropagação do erro, que será realizado no Software SPSS.
A sequência de passos abaixo mostra a metodologia utilizada para os ajustes:
1- Inicia-se carregando os dados iniciais e definindo os valores passados a ser utilizado
na predição (ou seja, suas defasagens).
2- Separação dos valores em três conjuntos: conjunto de treinamento, conjunto de
validação e conjunto de testes.
3- Obtenção do melhor número de defasagens a ser utilizadas através de tentativas, e
comparação das interações dos dados iniciais com as defasagens propostas. Neste
trabalho foram testadas até sete valores passados em relação aos dados originais, ou
seja, Dt-7.
4- Aplicação do critério de menor erro quadrático médio (EQMP) para a escolha do
melhor modelo, e obtenção das previsões.
O trabalho possui como hipótese obter comparações das previsões utilizando os modelos
AR-ARCH e de redes neurais. A escolha do melhor método de previsão será feita através do
menor valor de EQMP, valor este utilizado em comparações de modelos a fim de obter
23
significativas previsões dos índices Ibovespa e Petrobras e analisar a empregabilidade destes
métodos nos índices de mercados de capitais. Espera-se que o método de Redes Neurais
Artificiais apresente um menor EQMP, conforme alguns estudos empíricos estudados:
Quadro 1: Estudos sobre previsões utilizando a comparação entre Métodos Econométricos e RNAs.
Autores Objetivos e Conclusões
BATISTA, A. L. F. (2009)
Realizou uma análise comparativa das previsões de
vasões fluviais utilizando a metodologia de Box &
Jenkins e Redes Neurais Artificiais. Os resultados
mostraram que cada técnica possui vantagens e
desvantagens, e que ambas podem se ajustar ao conjunto
de dados proposto.
FILHO, E. L. S., et al. (2011)
Realizou a previsão dos retornos do Ibovespa com o
objetivo de comparação dos desempenhos de uma rede
neural artificial feedforward evolutiva (RNAE) e um
modelo AR+GARCH, para a previsão um passo à frente
de uma série temporal formada pelos retornos do
IBOVESPA. Neste estudo, a RNAE obteve melhores
resultados e ajustou-se melhor e capturando o
comportamento não linear dos retornos.
LIMA, F. G., et al. (2009)
Realizou a previsão de preços de commodities utilizando
modelos ARIMA-GARCH e redes neurais com ondaletas
e relatou que as redes neurais artificiais aparecem como
um método relevante para a previsão de séries temporais.
COSTA, A. F. (2012)
Este trabalho possui o propósito de desenvolver e aplicar
dois modelos de redes neurais artificiais dinâmicas, a
rede neural focada atrasada no tempo – FTDNN, e a rede
neural autorregressiva com entradas exógenas - NARX
para previsão de séries temporais financeiras, tendo como
padrão de referência de desempenho mínimo um modelo
estatístico tradicional do tipo ARMA-GARCH. Em
sentido amplo, os resultados obtidos indicam que a rede
NARX apresenta melhor desempenho preditivo que a
rede FTDNN. Fonte: Elaborado pela autora (2016).
4. RESULTADOS
4.1. Análise descritiva dos dados
De acordo com a Figura 4, correspondente aos dados originais dos Índices Bovespa e
Petrobras, percebe-se que eles possuem uma estrutura bastante semelhante. Este fato é
esperado, pois existem períodos de crescimento, decrescimento e picos. A Petrobras, uma das
24
maiores empresas listadas dentro da Bolsa de Valores, possui grande influencia. Dessa forma,
variações no seu índice pode influenciar nas variações do índice Bovespa.
Figura 4: Gráficos originais das séries de índices Bovespa e Petrobras.
Fonte: Elaborado pela autora (2016).
Além disso, pode-se dizer que o mercado de ações é extremamente influenciável em
relação a tudo que se ocorre no mundo, como crises externas, internas, acontecimentos
políticos e também choques na economia, tanto no Brasil, como em qualquer outro país.
O comportamento do gráfico dos índices acima indica que entre 1994 e 2007 houve
um período de ascensão; existem alguns decrescimentos, mas nenhum muito relevante. O
ponto mais perceptível de queda se dá no ano de 2008, momento em que ocorria a crise
imobiliária nos Estados Unidos.
A crise impactou diretamente em várias economias no mundo por conta da diminuição
da importação dos EUA. Houve uma saída de capitais e aumento dos preços dos bens
comercializados internacionalmente, que provocou uma desvalorização na taxa de câmbio e,
consequentemente, impactou na inflação, principalmente em economias com moedas
sobrevalorizadas, como é o caso do Brasil (CARCANHOLO, et al., 2008).
No Brasil, o impacto com a crise se deu de duas formas: pelos preços das commodities
(mercadorias), devido a sua alta dependência das exportações dos Estados Unidos, e dos
fluxos de capitais, que determina o déficit na conta corrente, necessária para manter altas as
taxas de investimentos e de crescimento econômico brasileiro (PASTORE e PLNOTTI,
2008). Além disso, segundo Alberini e Boguszewski (2008), o primeiro impacto foi registrado
pela Bolsa de Valores de São Paulo, que apresentou uma queda no segundo semestre de 2007
de quase 10 pontos ao longo de um dia, e, consequentemente, a Petrobras também sofreu os
impactos com a crise.
Outro ponto perceptível no gráfico do índice Petrobras corresponde ao final do período
analisado, entre fim de 2014 e início de 2015, período que correspondeu a uma queda do
25
índice por ter intensificado as denúncias de corrupção contra a empresa. Em janeiro de 2015,
a Petrobras, indicou que poderá não pagar dividendos de 2014 aos acionistas em função da
crise financeira e política na empresa, e traçou um panorama difícil para o futuro próximo,
frustrando expectativas de analistas e investidores e provocando queda nas ações (FRAGA, L.
S. et al., 2015).
Agora, na Tabela1 são apresentadas algumas características descritivas dos retornos:
Tabela1: Análise descritiva dos retornos Ibovespa e Petrobras.
Ibovespa Petrobras
Estatística Descritiva Valores Estatística Descritiva Valores
Média 0,00028 Média -0,00014
Mediana 0,00057 Mediana 0,00064
Mínimo -0,12096 Mínimo -0,14804
Máximo 0,13676 Máximo 0,14387
Desvio padrão 0,01841 Desvio padrão 0,02544 Fonte: Elaborado pela autora (2016).
Conforme a Tabela 1, os valores máximos e mínimos dos retornos do Ibovespa são,
respectivamente, -0,12096 e 0,13676, no período avaliado. Nota-se uma pequena variação
entre esses valores. A média, valor que aponta para onde mais se concentram os dados de uma
distribuição, corresponde ao valor 0,00028. O valor da mediana, medida de tendência central,
foi de 0,00057. Por fim, o desvio padrão, aquele que mostra o quanto de variação ou
“dispersão” existe em relação à média, é de 0,01841. Esses valores são esperados por se tratar
de uma série de retornos, ou seja, valores oscilando ao redor de zero mas com uma
variabilidade dependente no tempo chamada de volatilidade, a qual foi modelada por um
modelo ARCH. Para os valores da Petrobras, o desvio padrão corresponde à 0,02544; os
valores máximo e mínimo são 0,14387 e -0,14804; a média e a mediana são -0,00014 e
0,00064, respectivamente.
4.2. Análise das previsões utilizando o modelo AR-ARCH
Séries econômicas como o índice Ibovespa e Petrobras necessitam de algumas
transformações como correção pela inflação e cálculo de retornos antes de serem modeladas.
Os retornos são preferidos por serem livres de escala possuindo propriedades estatísticas mais
interessantes como a ergodicidade e a estacionariedade. Os comportamentos desses retornos
estão dispostos na Figura 5.
26
Figura 5: Retornos das séries Ibovespa e Petrobras.
Fonte: Elaborado pela autora (2016).
Inicialmente foi ajustado um modelo ARMA para remover a correlação serial. Depois
de calculados os retornos, iniciou-se o processo de ajuste dos índices. Como pode-se observar
na Figura 6, os gráficos de autocorrelação e autocorrelação parcial foram gerados para
detectar os parâmetros autoregressivos e de médias móveis e identificar os possíveis ajustes a
serem realizados no modelo ARIMA.
Figura 6: Autocorrelação Ibovespa e Petrobras
Fonte: Elaborado pela autora (2016).
Os gráficos indicam lags significativos nas ordens 3,16 e 20 para o Índice Bovespa, e
ordens 3 e 6 para o Petrobras. Estes indicativos são utilizados para realizar os possíveis
ajustes de médias móveis dos modelos.
Os gráficos de autocorrelação parcial, que sugerem os valores autoregressivos a serem
ajustados, indicam as ordens 3, 7, 16 e 20 para o Ibovespa, e 3 e 6 para o retorno Petrobras,
como mostra a Figura 7.
27
Figura 7: Função de Autocorrelação Parcial Ibovespa e Petrobras
Fonte: Elaborado pela autora (2016).
A partir das ordens sugeridas, iniciou as tentativas de ajustes dos modelos. No que se
refere ao ajuste dos retornos Ibovespa, o modelo mais indicado foi o AR incompleto com os
parâmetros autoregressivos de ordem 3, 7 e 16 significativos. Os retornos da Petrobras foram
ajustados por um modelo AR incompleto com os parâmetros autoregressivo de ordem 3 e 6 de
significativos. A adequação dos ajustes é comprovada através dos gráficos dos resíduos dos
retornos, como retrata a Figura 8. São através deles que percebe-se a perda de memória, isto é,
a perda da correlação serial.
Figura 8: Resíduos Ibovespa e Petrobras
Fonte: Elaborado pela autora (2016).
O próximo passo consistiu em calcular os resíduos ao quadrado e calcular o teste de
Box Pierce Ljung para identificar se há ou não variância condicional. Como os resíduos ao
quadrado não foram ruído branco, a volatilidade está presente. A identificação da ordem
ARCH foi feita por meio da função de autocorrelação dos resíduos ao quadrado, conforma
Figura 9:
28
Figura 9: Resíduos ao quadrado Ibovespa e Petrobras
Fonte: Elaborado pela autora (2016).
Os melhores ajustes obtidos nos modelos ARCH foram os correspondentes à
volatilidade (1) das duas séries, Ibovespa e Petrobras, ou seja, ambas as séries foram ajustadas
pelo modelo ARCH de ordem 1.
As estimativas dos modelos estão representadas na Tabela 2:
Tabela 2: Estimativas dos modelos AR incompleto- ARCH (1) do Ibovespa e Petrobras
Ibovespa Petrobras
Variável Coeficiente P-valor Variável Coeficiente P-valor
Ret. Ibovespa_3 -0,05939 0,0100** Ret. Petrobras_3 -0,0491 0,0425**
Ret. Ibovespa_7 -0,06728 0,0029*** Ret. Petrobras_6 -0,04332 0,0936*
Ret.Ibovespa_16 0,05615 0,0182**
*** significativo a 1% ** significativo a 5% * significativo a10%.
Fonte: Elaborado pela autora (2016).
Conforme indicado na Tabela 2, o modelo ajustado é significativo para calcular as
previsões. Assim, elas foram geradas e estão dispostas na Figura 10:
Figura 10: Previsões do Ibovespa e Petrobras utilizando modelos AR incompleto- ARCH (1)
Fonte: Elaborado pela autora (2016).
Através das análises, percebe-se que o modelo AR-ARCH foi significativo, mas não foi
um bom indicador de previsões.
29
4.3. Análise das previsões utilizando Redes Neurais Artificiais
A análise a partir de RNAs utilizando o algoritmo de aprendizagem de retropropagação
do erro foi feita utilizando os retornos dos índices Bovespa e Petrobras. Em relação ao índice
Bovespa, os testes realizados no software SPSS tiveram como resultado o menor erro
quadrático (EQS) obtido com a interação entre variável dependente Ibovespa e as covariáveis
representadas pelas defasagens de sétima ordem do índice, ou seja, valores passados do
Ibovespa (IBO t-1, IBO t-2, IBO t-3, IBO t-4, IBO t-5, IBO t-6, IBO t-7). No índice Petrobras, o
teste com o menor erro quadrático foi obtido a partir da interação entre os retornos com seis
defasagens, isto é, PET t-1, PET t-2, PET t-3, PET t-4, PET t-5, PET t-6.
O procedimento realizado foi caracterizado da seguinte maneira: primeiramente, consiste
em dividir a amostra em duas partes, sendo uma de treinamento e outra de teste. Na Tabela 3
estão indicados o número N de observações, bem como os valores percentuais das duas etapas
para os retornos Ibovespa e Petrobras.
Tabela 3: Resumo do processo de treinamento e teste do Ibovespa e Petrobras
IBOVESPA PETROBRAS
N % N %
Treinamento 1729 69,20% Treinamento 1783 69,30%
Teste 769 30,8% Teste 721 30,70%
Fonte: Elaborado pela autora (2016).
De acordo com a Tabela 3, percebe-se que a porcentagem de treinamento da rede
neural obtida no índice Bovespa foi de 69,2% dos seus valores, e 30,8% foram utilizados na
fase de teste da rede neural. Para a Petrobras, as porcentagens dos dados utilizados no
treinamento correspondem a 69,3%, e para o teste reservou-se 30,7% dos dados.
Além disso, o processo de análise das redes neurais possibilita observar a importância
normalizada das covariáveis inseridas nos modelos, isto é, indicam a contribuição das
variáveis defasadas na composição do modelo final a ser utilizado na obtenção das previsões
que estão descritas nas Figuras 11 e 12 com seus respectivos gráficos:
30
Figura 11: Importância das defasagens para o resultado final do Ibovespa
Fonte: Elaborado pela autora (2016).
Figura 12: Importância das defasagens para o resultado final da Petrobras
Fonte: Elaborado pela autora (2016).
De acordo com a Figura 12, a variável com maior participação nos resultados da
previsão do retorno do Ibovespa foi a defasagem de ordem 4, isto é, o valor do retorno de
quatro dias atrás corresponde a 21,7% de importância. Em seguida, o retorno do Ibovespa
com defasagem de ordem 3, valor de três dias antes, possui importância de 18,2%. As demais,
importância possuem descrição análoga.
Já para a Petrobras, Tabela 5, o terceiro passado foi mais importante, com 30,8% e a
sexta defasagem apresentou 20,20% de importância nos resultados finais. A menor
importância foi atribuída a dois dias anteriores com 13%.
Após as análises das importâncias das defasagens, a estrutura da rede neural é
constituída através do processo de tentativa e erro. A Figura 13 refere aos gráficos de
previsões resultantes da combinação mais indicada pelo método de tentativa e erro.
31
Figura 13: Comparação entre os retornos reais e previstos do índice Bovespa e Petrobras.
Fonte: Elaborado pela autora (2016).
De acordo com os gráficos das previsões, percebe-se que tanto o índice Bovespa, quanto
a Petrobras apresentaram resultados expressivos. As variações dos valores não foram muito
altas. Uma explicação para o fato seria que a previsão é feita em toda a amostra e elas
dependem dos valores passados. Assim, a força em obter uma previsão exata aumenta,
fazendo com que obtenha maior expressividade das previsões.
4.4. AR-ARCH X Redes Neurais Artificiais
Conforme mencionado no trabalho, objetivou-se comparar duas metodologias para a
análise das previsões dos retornos dos índices Bovespa e Petrobras. Após as análises são
apresentadas as comparações entre as metodologias AR-ARCH e Redes Neurais.
A modelagem baseada no modelo de série temporal mostrou-se adequada para
modelar o conjunto de dados neste trabalho, mas suas previsões não foram exatas. A
aplicação das Redes Neurais também se mostrou adequada ao conjunto de dados, e suas
previsões mostraram-se um pouco mais adequadas em comparação com a modelagem AR-
ARCH.
Ao aplicar a comparação através dos EQMPs dos modelos, encontramos os resultados
expostos na Tabela 4:
Tabela 4: Comparação entre os erros quadráticos médios ponderados dos modelos.
EQMP
Modelo Ibovespa Petrobras
AR-ARCH 0,0003437 0,0006364
Redes Neurais 0,0003340 0,0006370
Fonte: Elaborado pela autora (2016).
32
Como pode ser observado na Tabela 4, o desempenho dos modelos AR-ARCH e de
Redes Neurais como previsores se mostraram semelhantes. Para uma melhor visualização das
comparações das previsões entre os métodos, foi gerada a Figura 14.
Figura 14:Comparação entre os valores dos retornos reais e previsões dos métodos Box & Jenkins e RNAs.
Fonte: Elaborado pela autora (2016).
Na Figura 14, percebe-se que os valores das previsões das Redes Neurais Artificiais
possuem uma pequena diferença em relação às previsões dos modelos AR-GARCH. Mas,
através da comparação entre os valores de EQMP dos modelos, percebe-se que possuem
resultados muito semelhantes. Com este resultado pode-se dizer que ambos os modelos,
apesar de terem sido modelados de forma correta e apresentado resultados expressivos, suas
previsões não foram precisas a ponto de utiliza-las como métodos confiáveis de previsões em
séries financeiras.
Após as comparações entre RNAs e AR-ARCH, existem alguns prós e contras entre as
duas metodologias:
- Pode-se dizer que as Redes Neurais Artificiais é um sistema que leva em consideração
seus valores exatos, diferente da AR-ARCH, que leva em consideração a média dos valores
para realizar as previsões, por este motivo alguns resultados finais das RNAs são
considerados mais precisos e com um menor erro. Mas neste trabalho eles foram semelhantes
ao modelo AR-ARCH.
- Nas análises utilizando métodos de séries temporais é possível melhor visualização em
relação a todos os procedimentos durantes os ajustes e as análises de previsões, ou seja, é um
método em que se acompanham os acontecimentos. As RNAs são “caixas pretas”, onde é
possível visualizar somente o resultado final, pois o procedimento é feito automaticamente, e
não se sabe ao certo como ele é feito para gerar as previsões;
33
Mas, para efeitos de comparações entre as previsões dos diferentes modelos, pode-se
dizer que as Redes Neurais Artificiais atingiram um pouco melhor às expectativas. Este
resultado está de acordo com os artigos empíricos de BATISTA, A. L. F. (2009), FILHO, E. L.
S., et al. (2011), LIMA, F. G., et al. (2009) e COSTA, A. F. (2012) estudados neste trabalho,
onde o método de Redes Neurais Artificiais possui melhores previsões do que em comparação
com a metodologia de séries temporais.
5. CONCLUSÃO
Este trabalho teve como objetivo a realização de previsões dos retornos dos índices
Ibovespa e Petrobras utilizando duas metodologias distintas: a metodologia AR-ARCH e a de
Redes Neurais Artificias. Além disso, foi realizada uma comparação entre os dois métodos
utilizando seus valores dos Erros Quadráticos Médios Ponderados (EQMP) para concluir qual
metodologia possui maior exatidão no que se refere aos resultados das previsões. A escolha de
obter previsões dos retornos Ibovespa e Petrobras está relacionada ao fato dos mercados de
capitais oscilarem às mudanças nas expectativas dos agentes. E prever essas oscilações faz
com que os acionistas e detentores de curiosidades do mercado acionário encontrem um
suporte de decisões dentro da Bovespa.
A partir dos cálculos dos retornos para retirar a volatilidade presente nos índices
Bovespa e Petrobras, foi possível a obtenção e análises dos resultados com as duas
metodologias. Assim, pode-se dizer que a metodologia de séries temporais AR-ARCH,
através de tentativas de ajuste do modelo, obteve um ajuste significativo, mas suas previsões
não foram precisas. A metodologia de Redes Neurais Artificiais também obteve resultados
significativos e o nível de precisão das previsões foi um pouco maior.
Com as comparações entre as duas metodologias, pode-se dizer que o desempenho dos
modelos AR-ARCH e de Redes Neurais como previsores se mostraram semelhantes, e
comparando os resultados das previsões através dos gráficos (pode-se observá-los no Capítulo
4 – Figura 14), as Redes Neurais obteve um pequeno resultado mais expressivo em suas
previsões, estando de acordo com os outros artigos empíricos estudados neste trabalho, mas
ainda é considerada uma previsão pouco exata no que diz respeito à séries financeiras.
Portanto, conclui-se que mesmo as metodologias possuírem ajustes de modelos
significativos, suas previsões obtiveram resultados inferiores aos retornos originais dos
índices Bovespa e Petrobras. Assim, as empregabilidades destes modelos em previsões de
séries financeiras e econômicas podem ser consideradas falha. Uma explicação para o fato é
34
que os valores dos retornos do Ibovespa e Petrobras são muito voláteis e suas variações
diárias são muito grandes, assim, a dificuldade de se obter previsões mais próximas da
realidade são maiores e as metodologias não atendem todas as necessidades que as previsões
de retornos necessitam.
6. REFERÊNCIAS
BATISTA, A. L. F., Análise e previsões de vazões utilizando modelos de series temporais
e redes neurais artificiais. 2009. Dissertação de Mestrado (em engenharia de sistemas) –
Universidade Federal de Lavras.
BOX, G. E. P; JENKINS, G. M. and REINSEL, G., Time series analysis: forecasting and
control. 3a edição. Englewood Cliffs: Prentice Hall, 1994
BUENO, R. D. L.S., Econometria de Séries Temporais. 1 ed. São Paulo: Cengage Learning,
2008.
CARCANHOLO, et al., Crise financeira Internacional: Natureza e impacto. Rio de Janeiro,
2008.
COELHO, L.S., et al., Podemos prever a taxa de cambio brasileira? Evidência empírica
utilizando inteligência computacional e modelos econométricos, Revista Gest. Prod., São
Carlos, v. 15, n. 3, p. 635-647, set.-dez., 2008.
COSTA, A. F., Previsão de séries temporais financeiras por meio de redes neurais
dinâmicas e processos de transformação de dados: Uma abordagem empírico-
comparativa. Dissertação (Mestrado) – Universidade Estadual Paulista. Faculdade de
Engenharia, Bauru, 2012.
FILHO, E. L. S., et al. Previsão dos retornos do Ibovespa utilizando Redes Neurais Artificiais
feedforward evolutivas. Revista Produção Online. Florianópolis, v.11, n. 4, p. 1114-1140,
out./dez. 2011.
FORTUNA, E. Mercado Financeiro: Produtos e Serviços. 10 ed. Rio de Janeiro:
Qualitymark, 1997.
35
FORTUNA, E., Mercado Financeiro: produtos e serviços. 17 ed. Rio de Janeiro:
Qualitymark, 2008.
GUJARATI, Damonar N.; PORTER, Dawn C. Econometria Básica. 5 ed. Porto Alegre:
AMGH, 2011.
HILL, C. et al., Econometria. 1 ed. São Paulo: Saraiva, 1999.
LIMA, F. G., et al, Previsão de preços de commodities com modelos ARIMA-GARCH e
redes neurais com ondaletas: velhas tecnologias – novos resultados. Revista de
Administração, São Paulo, v.45, n.2, p.188-202, abr./maio/jun. 2010.
LEMOS, B.P., Comportamento Recente do Índice Bovespa. Rev. Economia & Tecnologia,
Curitiba, v.7, n.2, p. 163-173. 2006.
MORETTIN, P. A., Econometria Financeira. 2 ed. Egard Blucher, 2011. São Paulo.
MORETTIN, P. A.; TOLOI Clélia M. Análise de Séries Temporais. 2 ed. São Paulo: Egard
Blucher, 2006. São Paulo.
PASTORE, A.C.; PLNOTTI, M.C. A crise de 2008 e o Brasil. Rio de Janeiro, 2008.
Perfil e Histórico da Bovespa; Disponível em:
<http://ri.bmfbovespa.com.br/static/ptb/perfil-historico.asp?idioma=ptb>, Acesso em: 15 de
abril de 2015.
PIMENTA JUNIOR, T.; HIGUCHI, R. H. Variáveis macroeconômicas e o Ibovespa: um
estudo da relação de causalidade. 60 ed. [s.n]: REAd, 2008.
PINHEIRO, J. L., Mercado de Capitais: Fundamentos e Técnicas. 5 ed. São Paulo: Atlas,
2009.
QUIRINO, R. S. L., MERCADO DE CAPITAIS: A contabilidade como ferramenta de
análise para investimentos em bolsa de valores. Belo Horizonte, 2012.
R DEVELOPMENT CORE TEAM. R: a language and environment for statistical computing.
Vienna, 2009. Disponível em: < htpp://www.r-project.org>.
ROSA,J. M. C., Retornos: uma abordagem com o uso do pacote R, 18 de agosto de 2011.
36
RICARDO S. EHLERS., ANÁLISE DE SÉRIES TEMPORAIS. Laboratório de Estatística
e Geoinformação- Universidade Federal do Paraná, 2003.
ROQUE, R. C., Estudo sobre a empregabilidade da previsão do índice BOVESPA
usando Redes Neurais Artificiais. Departamento de Eletrônica e de Computação –
Universidade Federal do Rio de Janeiro. Fevereiro, 2009.
SILVA, I. N.; SPATTI, D. H.; FLAUZINO, R. A., Redes Neurais Artificiais para
engenharia e ciências aplicadas: Curso prático. São Paulo: Artliber, 2010.
SILVEIRA, V. G., et al., THE SCANDALS OF THE PETROBRAS AND THE
BRAZILIAN MARKET: Is there Dynamic Correlation?, Revista Business and
Management Review, vol. 05, june, 2015.
Trajetória da Petrobras. Disponível em: <http://www.petrobras.com.br/pt/quem-
somos/trajetoria/>, Acesso em: 15 de abril de 2015.