identificaÇÃo de fatores influentes no desempenho de...

80
REGIANE CRISTINA YAMANARI IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE UM GRUPO DE AÇÕES DO MERCADO FINANCEIRO Trabalho de Formatura apresentado à Escola Politécnica da Universidade de São Paulo para obtenção do diploma de Engenheiro de Produção São Paulo 2010

Upload: hatuyen

Post on 05-Dec-2018

216 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE …pro.poli.usp.br/wp-content/uploads/2012/pubs/identificacao-de... · IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE

REGIANE CRISTINA YAMANARI

IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE UM GRUPO DE AÇÕES DO MERCADO

FINANCEIRO

Trabalho de Formatura apresentado à

Escola Politécnica da Universidade de

São Paulo para obtenção do diploma

de Engenheiro de Produção

São Paulo

2010

Page 2: IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE …pro.poli.usp.br/wp-content/uploads/2012/pubs/identificacao-de... · IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE

REGIANE CRISTINA YAMANARI

IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE UM GRUPO DE AÇÕES DO MERCADO

FINANCEIRO

Trabalho de Formatura apresentado à

Escola Politécnica da Universidade de

São Paulo para obtenção do diploma

de Engenheiro de Produção

Professora: Linda Lee Ho

São Paulo

2010

Page 3: IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE …pro.poli.usp.br/wp-content/uploads/2012/pubs/identificacao-de... · IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE

FICHA CATALOGRÁFICA

Yamanari, Regiane Cristina

Identificação de fatores influentes no desempenho de um grupo de ações do mercado financeiro / R.C. Yamanari. -- São Paulo, 2010.

80 p.

Trabalho de Formatura - Escola Politécnica da Universidade de São Paulo. Departamento de Engenharia de Produção.

1.Ações 2.Mercado financeiro 3.Análise de regressão 4.Mode-

los de previsão I.Universidade de São Paulo. Escola Politécnica. Departamento de Engenharia de Produção II.t.

Page 4: IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE …pro.poli.usp.br/wp-content/uploads/2012/pubs/identificacao-de... · IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE

A minha família, meu namorado,

meus amigos e colegas de faculdade,

pelo incentivo e compreensão ao longo desta jornada.

Page 5: IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE …pro.poli.usp.br/wp-content/uploads/2012/pubs/identificacao-de... · IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE

AGRADECIMENTO

A minha família, por sempre me apoiar e incentivar em todos os momentos.

A professora Dra. Linda Lee Ho, pela paciência, pela atenção, pelos conselhos

valiosos e orientação durante a realização deste trabalho.

Ao meu namorado, Hugo, pelo apoio, pela companhia e pela paciência.

Aos amigos e colegas de faculdade, pelo suporte e incentivo mútuo ao longo de todos

estes anos.

Aos amigos e colegas de trabalho, pela possibilidade de realização do estágio, pela

confiança, pela orientação e pelos conhecimentos transmitidos.

Page 6: IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE …pro.poli.usp.br/wp-content/uploads/2012/pubs/identificacao-de... · IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE

RESUMO

Prever perfeitamente o comportamento do mercado de ações através de modelos

matemáticos é uma tarefa muito complicada devido ao número de fatores que o influenciam, à

aleatoriedade do comportamento destes fatores e à complexidade para identificá-los. Deste

modo, os analistas de ações tentam criar ferramentas mais simples que possam ajudá-los a

entender melhor esta dinâmica que é o comportamento das ações.

Neste trabalho, é proposto um modelo de previsão para um grupo de ações do mercado

financeiro para identificar a influência que a política monetária juntamente com as

características de cada uma das empresas dentro do grupo escolhido pode ter no desempenho

das ações. Para isto, tomou-se como base teórica os Modelos Lineares Generalizados e

realizou-se uma regressão Gamma para os dados analisados.

Palavras-chave: Ações, Mercado Financeiro, Análise de Regressão, Modelos de

Previsão.

Page 7: IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE …pro.poli.usp.br/wp-content/uploads/2012/pubs/identificacao-de... · IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE

ABSTRACT

Predicting the behavior of stocks using mathematical models is a difficult task given

the number of factors that can influence it, the randomness of the behavior of these factors

and the complexity to identify all of them. Therefore, equity analysts seek to create simpler

tools in order to help a better understanding of the stock dynamic.

In this paper, a prediction model is proposed for a group of stocks to identify how the

changes in monetary policy and the characteristics of each company within the group chosen

can influence the stock performance. The model was based on the Generalized Linear Models

and a Gamma regression was used for the data analysis.

Keywords: Stocks, Financial markets, Regression analysis, Prediction models.

Page 8: IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE …pro.poli.usp.br/wp-content/uploads/2012/pubs/identificacao-de... · IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE

LISTA DE FIGURAS

Figura 2.1.1 – Evolução da taxa de juros ao longo do tempo .................................................. 20

Figura 2.1.2 - Realocação dos setores em três grupos segundo o A.I.D. ................................. 27

Figura 2.1.3 - Distribuição dos retornos para ações de empresas do setor Varejo para os três

diferentes períodos do ciclo da taxa de juros (SELIC) ............................................................ 29

Figura 2.1.4 - Distribuição dos retornos para ações de empresas do setor Bancos e Instituições

Financeiras para os três diferentes períodos do ciclo da taxa de juros (SELIC) ...................... 29

Figura 3.2.1 - Distribuição de frequência dos retornos trimestrais .......................................... 39

Figura 4.1.1 – Variáveis estimadas versus variáveis observadas ............................................. 50

Figura 4.2.1 – Resíduos padronizados (I) ................................................................................ 57

Page 9: IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE …pro.poli.usp.br/wp-content/uploads/2012/pubs/identificacao-de... · IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE

LISTA DE TABELAS

Tabela 2.1.1 - Classificação da série da taxa de juros (SELIC) ............................................... 20

Tabela 2.1.2- Lista das classificações utilizadas por categoria ................................................ 23

Tabela 2.1.3 - Setores ordenados por média dos retornos das ações ........................................ 24

Tabela 2.1.4 - Resultado da Análise de Variância entre os grupos formados por G1 e por G2 a

G9 ............................................................................................................................................. 24

Tabela 2.1.5 – Valor de F para todas as partições possíveis (1ª iteração) ................................ 25

Tabela 2.1.6 - Valor de F para todas as partições possíveis (2ª iteração – Grupo 1) ............... 25

Tabela 2.1.7 - Valor de F para todas as partições possíveis (2ª iteração – Grupo 2) ............... 26

Tabela 2.1.8 - Valor de F para todas as partições possíveis (3ª iteração – Grupo 3 e 4) .......... 26

Tabela 3.1.1 –Lista de funções link canônicas ......................................................................... 38

Tabela 4.1.1 - Definição das variáveis do modelo ................................................................... 46

Tabela 4.1.2 – Valores dos parâmetros βi do modelo de previsão reduzido ............................ 48

Tabela 4.1.3 – Parâmetros estimados para períodos do ciclo monetário .................................. 50

Tabela 4.1.4 - Parâmetros estimados para os tamanhos das empresas ..................................... 51

Tabela 4.1.5 - Parâmetros estimados para os anos das observações ........................................ 52

Tabela 4.1.6 - Parâmetros estimados para os setores econômicos ........................................... 52

Tabela 4.1.7 - Parâmetros estimados para super-setores .......................................................... 53

Tabela 4.1.8 - Parâmetros estimados para os meses das observações ...................................... 54

Tabela 4.1.9 - Parâmetros estimados para as interações entre os setores econômicos e os

períodos do ciclo monetário ..................................................................................................... 54

Tabela 4.3.1 – Parâmetros considerados para o cálculo de previsão retorno trimestral (I) ...... 58

Tabela 4.3.2 – Parâmetros considerados para o cálculo de previsão retorno trimestral (II) .... 59

Page 10: IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE …pro.poli.usp.br/wp-content/uploads/2012/pubs/identificacao-de... · IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE

LISTA DE EQUAÇÕES

Equação 2.2.1 - Razão de preços por trimestre ........................................................................ 30

Equação 3.1.1- Definição de um modelo linear probabilístico ................................................ 33

Equação 3.1.2 – Valor esperado de Y ...................................................................................... 34

Equação 3.1.3 – Modelo linear com interação entre variáveis para o caso de duas variáveis . 34

Equação 3.1.4 – Definição de modelo linear generalizado ...................................................... 34

Equação 3.1.5 –Expressão geral da função densidade de probabilidade para membros da

família exponencial .................................................................................................................. 35

Equação 3.1.6 – Função densidade de probabilidade para uma variável normal aleatória ...... 35

Equação 3.1.7 –Definição da função densidade de probabilidade da distribuição da família

Gamma ..................................................................................................................................... 35

Equação 3.1.8- Definição da função Gamma .......................................................................... 36

Equação 3.1.9 – Definição da função link ............................................................................... 37

Equação 3.1.10 – Variável resposta para o modelo de regressão ............................................ 37

Equação 3.1.11 – Função link canônica ................................................................................... 37

Equação 3.2.1 – Forma exponencial do modelo de previsão de primeira ordem .................... 39

Equação 3.2.2 – Forma exponencial do modelo de previsão de segunda ordem ordem ......... 40

Equação 3.2.3 – Estatística do teste de hipótese ...................................................................... 41

Equação 3.2.1.1 - Definição de deviance ................................................................................. 42

Equação 3.2.2.1 – Definição de resíduo padronizado .............................................................. 43

Equação 4.1.1 – Modelo de previsão completo ....................................................................... 47

Equação 4.1.2 – Modelo de previsão reduzido ........................................................................ 47

Page 11: IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE …pro.poli.usp.br/wp-content/uploads/2012/pubs/identificacao-de... · IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE

SUMÁRIO

1. INTRODUÇÃO ................................................................................................................ 13

1.1 Descrição da empresa .................................................................................................... 13

1.2 Área de realização do estágio ........................................................................................ 14

1.3 Motivação para a realização do trabalho ....................................................................... 15

1.4 Objetivo do trabalho ...................................................................................................... 16

2. ANÁLISE PRELIMINAR ................................................................................................ 19

2.1 Escolha e classificação das ações .................................................................................. 19

2.2 Definição do retorno das ações ...................................................................................... 30

3. REVISÃO BIBLIOGRÁFICA .......................................................................................... 33

3.1 Modelos lineares generalizados ..................................................................................... 33

3.2 Definição do modelo de previsão .................................................................................. 38

3.2.1 Deviance e Akaike Information Criterion (AIC) ....................................................... 41

3.2.2 Resíduos padronizados .............................................................................................. 43

4. APLICAÇÃO .................................................................................................................... 45

4.1 Modelos lineares generalizados ..................................................................................... 45

4.2 Verificação da qualidade do modelo de previsão .......................................................... 55

4.3 Previsão para os próximos 3 meses ............................................................................... 57

5. CONCLUSÕES ................................................................................................................. 61

6. REFERÊNCIAS BIBLIOGRÁFICAS .............................................................................. 63

ANEXOS .................................................................................................................................. 65

Anexo A - Empresas escolhidas para a realização do trabalho ................................................ 65

Anexo B - Resultados da aplicação do método A.I.D. para agrupar setores semelhantes ....... 67

Anexo C - Síntese dos resultados obtidos no software R ......................................................... 72

Anexo D - Procedimento efetuado no software R para definir o modelo de previsão ............. 76

Anexo E - Representação gráfica dos resíduos padronizados .................................................. 79

Page 12: IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE …pro.poli.usp.br/wp-content/uploads/2012/pubs/identificacao-de... · IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE
Page 13: IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE …pro.poli.usp.br/wp-content/uploads/2012/pubs/identificacao-de... · IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE

13

1. INTRODUÇÃO

Este estudo foi desenvolvido juntamente com a empresa onde o autor deste trabalho

realiza atualmente seu estágio. Ele será apresentado em quatro partes. Primeiramente, serão

apresentados o contexto em que o trabalho foi desenvolvido e a motivação para a sua

realização. Em um segundo momento, far-se-á uma análise preliminar dos dados coletados,

classificando-os e definindo a estrutura inicial do problema a ser resolvido neste trabalho.

Em seguida, será exposta a base teórica para o desenvolvimento deste estudo, para

então aplicá-la aos dados analisados e construir o modelo de regressão. Ademais, serão feitos

os ajustes e análises para a verificação se o modelo definido está bem ajustado, ou seja, se as

estimativas calculadas pelo modelo são coerentes com os dados reais observados. Enfim, os

resultados obtidos serão interpretados e uma previsão, utilizando o modelo definido, será

realizada para o curto/médio prazo.

1.1 Descrição da empresa

Este estudo foi realizado no banco e prestador de serviços financeiros Morgan Stanley

cuja sede mundial se situa em Nova Iorque, nos Estados Unidos. No Brasil, as operações do

Morgan Stanley tiveram início em 1997, em São Paulo. Desde então, o grupo ampliou suas

operações no Brasil e atualmente conta com a colaboração de quase 200 funcionários. O

banco oferece diversos tipos de produtos através das seguintes divisões existentes no

escritório de São Paulo:

• Investment Banking: É a área do banco que possui um maior contato com clientes

corporativos. Nesta divisão são oferecidos serviços de reestruturação financeira,

operações de fusões e aquisições de empresas, coordenação de emissão de ações

no mercado financeiro, entre outros produtos.

• Equity Division: Trata-se da área que trabalha diretamente com o mercado de

ações. O departamento é subdividido em Equity Research, que trabalha com a

pesquisa e análise fundamentalista dos papéis listados na Bolsa de Valores, e em

Equity Trading, que lida com a negociação dos papéis listados no mercado.

• Fixed Income Division: Assim como existe a área especializada na análise e

negociação de ações, também existe no banco um setor especializado em renda

Page 14: IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE …pro.poli.usp.br/wp-content/uploads/2012/pubs/identificacao-de... · IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE

14

fixa. Entende-se por renda fixa papéis atrelados a taxa de juros fixada pelo Banco

Central, debêntures de empresas, entre outros.

• Brokerage House: Trata-se da corretora do Banco Morgan Stanley. A função da

corretora é efetuar as ordens de compra e/ou venda de seus clientes e oferecer

suporte e assessoria a estes. Além disso, a corretora pode também vender produtos

estruturados, oferecendo melhores retornos aos seus clientes. Através destas

operações de compra/venda, a corretora ganha uma pequena porcentagem dos

valores negociados.

• Administration: Existe todo um sistema de apoio às atividades principais do banco,

como o departamento de Recursos Humanos, de Tecnologia da Informação e o

Jurídico, todos de extrema importância para o funcionamento do banco.

1.2 .Área de realização do estágio

O estágio está sendo realizado na área de Equity Strategy (Estratégia para o mercado

de ações), que funcionalmente se encontra ligado ao departamento de Equity Research

(Pesquisa de mercado de ações). Na área de pesquisa, os analistas da área são divididos por

setor. Os principais setores são: 1) Varejo, 2) Bancos e Instituições Financeiras, 3) Energia e

Petróleo, 4) Transporte, Logística e Concessões, 5) Construtoras e Incorporadoras, 6)

Siderurgia, 7) Mineração, 8) Saúde, 9) Utilidade pública – empresas de geração e distribuição

de energia elétrica, e 10) Telecomunicações.

Para cada um dos setores há um analista-chefe que coordena os estudos e análises das

ações de empresas específicas de tal setor. Estes estudos são publicados em formato de

relatórios e distribuídos aos clientes da corretora do Banco Morgan Stanley. Os clientes da

corretora são principalmente os fundos de investimento e grandes investidores estrangeiros,

que utilizam os estudos desenvolvidos pelos analistas do banco para formar as suas opiniões

sobre o mercado financeiro e poder então definir melhores opções de investimento.

A partir dos estudos setoriais e das projeções macroeconômicas identificadas pelos

economistas do banco são feitas as principais análises da área de Equity Strategy. O

estrategista analisa globalmente os efeitos macroeconômicos no mercado de ações que não se

limita a um único setor específico. A comparação entre diferentes setores e papéis de

empresas preferidos de cada analista permite ao estrategista extrair informações importantes

para identificar oportunidades no mercado.

Page 15: IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE …pro.poli.usp.br/wp-content/uploads/2012/pubs/identificacao-de... · IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE

15

Como dito anteriormente, o principal produto da área de pesquisa e de estratégia são

os relatórios. Estes possuem periodicidades diferentes, ou seja, existem relatórios que são

publicados semanalmente, outros mensalmente e até mesmo trimestralmente. No relatório

semanal, analisam-se as principais mudanças de projeções e estimativas macro e

microeconômicas durante a semana anterior. O principal relatório é publicado mensalmente e

possui um tema diferente a cada mês dependendo dos fatos recentemente ocorridos ou que

poderão surgir. Além disso, existe outro onde se publica uma seleção de dez ações que,

segundo o estrategista-chefe, poderão apresentar retornos maiores que a média das ações

listadas durante o mês corrente, ou seja, trata-se de uma seleção de ações com objetivo de

retorno a curto prazo.

Foi neste contexto de estágio que se inspirou o tema central do presente trabalho de

formatura, a ser detalhado na seção 1.3.

1.3 .Motivação para a realização do trabalho

O papel da área de estratégia de um banco é tentar prever como os mercados se

comportarão principalmente no médio e longo prazos. Usualmente, como terminologia dessa

área, entende-se como curto prazo o período de até 1 mês; médio entre 1 e 3 meses e longo

para um prazo superior a 3 meses. Para tanto, um dos passos fundamentais é a análise dos

acontecimentos econômicos passados, a partir dos quais pode-se identificar padrões e

fenômenos reincidentes dentro de determinadas condições macroeconômicas. O

conhecimento desses eventos que se repetem e da forma como impactam os diferentes setores

econômicos é para o estrategista um instrumento poderoso que lhe dá pistas de como os

papéis das empresas se comportarão no futuro.

Um exemplo clássico de evento reincidente são os períodos de ciclo monetário de

redução, conservação e elevação da taxa de juros. A fim de melhor ilustrar esse ciclo, podem-

se tomar por base os fatos observados a partir do segundo semestre de 2008. Com o pedido de

concordata da Lehman Brothers, a crise financeira atingiu o seu ápice e, como consequência,

as economias globais entraram em recessão. Neste período, o mercado entrou em um regime

turbulento, observando-se uma alta volatilidade e tornando-se quase imprevisível. Criou-se

assim um contexto econômico altamente desafiador para o trabalho do analista de estratégia.

Neste contexto econômico, os países “desenvolvidos” presenciaram um verdadeiro

colapso em seus sistemas financeiros que atingiu a economia dos países emergentes alguns

Page 16: IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE …pro.poli.usp.br/wp-content/uploads/2012/pubs/identificacao-de... · IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE

16

meses depois, como o Brasil, embora em menor intensidade. Assim, para diminuir a falta de

liquidez nos mercados financeiros e seus efeitos recessivos na economia real, o Banco Central

do Brasil iniciou o corte da taxa básica de juros (SELIC) que, no início de janeiro de 2009,

encontrava-se no patamar de 13,75% a.a. (ao ano) e terminou o mês de julho de 2009 à 8,75%

a.a. Esta tendência também foi observada em outros países da América Latina, como Chile e

México. Sabe-se que uma taxa de juros mais baixa tem como consequência incentivar o

crédito às empresas, estimular a economia, além de causar um impacto positivo no aumento

de investimentos de longo prazo no país (Mankiw, 2005).

Após tomarem medidas para estimular o crescimento da economia e terminarem o

ciclo de redução da taxa básica de juros, tanto as economias mundiais quanto a brasileira

começaram a apresentar sinais de recuperação. Ao longo do ano de 2009, os dados relativos a

esta recuperação da economia global foram se tornando cada vez mais positivos. Desta forma,

os estímulos e medidas tomados pelos governos no ápice da crise puderam ser retirados (por

exemplo, a redução do imposto para a aquisição de certos bens de consumo), embora os juros

se mantivessem no mesmo patamar atenuado.

Enfim, no caso específico do Brasil, a retomada do crescimento do consumo interno,

da produção industrial e das exportações voltou a pressionar o perigo de alta inflação. Assim,

para controlá-la, espera-se que o Banco Central inicie um ciclo de elevação da taxa básica de

juros que terá continuidade, de acordo com as expectativas do mercado, ao longo de 2010 e

2011.

É neste contexto econômico, dentro da área de estratégia, que emergiu a necessidade

de observar e se possível conseguir prever o comportamento das ações nos diferentes períodos

do ciclo monetário assim como determinar outros fatores que possam influenciar o grupo de

ações que será analisado neste trabalho.

1.4 .Objetivo do trabalho

O objetivo do presente trabalho é identificar, a partir de dados históricos obtidos, a

influência que os ciclos monetários e as características de cada uma das empresas podem ter

no comportamento do preço das ações, analisado através do seu retorno. Tais ações não serão

estudadas individualmente, mas reunidas em grupos que possuam comportamentos

semelhantes de acordo com o cenário monetário definido. Desta forma, pode-se estabelecer

uma melhor estratégia de investimento no mercado de ações.

Page 17: IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE …pro.poli.usp.br/wp-content/uploads/2012/pubs/identificacao-de... · IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE

17

Além disso, definiu-se que será abordado somente as ações do tipo domésticas (ou

seja, empresas que não são produtoras nem exportadoras de commodities), que são ações de

empresas que possuem seu mercado principal no Brasil e por isso suas atividades estão

diretamente relacionadas com o nível da taxa básica de juros. Ao contrário de empresas do

tipo commodities que, por seus principais mercados estarem localizados no exterior

(normalmente na Europa, China e EUA), dependem principalmente do cenário internacional e

que, portanto, não sofrem forte influência da política monetária brasileira.

Este trabalho está organizado da seguinte forma:

• Análise preliminar dos dados: neste capítulo, serão definidas as empresas cujas

ações serão analisadas, o tipo de retorno das ações e os períodos do ciclo

monetário que serão posteriormente utilizados para desenvolver o trabalho.

• Revisão bibliográfica: nesta parte, serão apresentadas as teorias utilizadas como

base do estudo realizado; neste caso, será abordado o tema de modelos lineares

generalizados, principal assunto deste trabalho, e as considerações feitas para se

chegar ao modelo de previsão.

• Definição do modelo: Para definir o modelo de previsão, será aplicado o

procedimento apresentado na revisão bibliográfica. Assim, será feita uma

regressão Gamma aplicada aos dados analisados neste trabalho que se

classificaram como heterocedásticos. Além disso, serão detalhadas as etapas do

processo para definir o melhor modelo para o conjunto de dados deste trabalho.

Em seguida, será apresentada a equação de previsão e será feita uma análise e

interpretação dos parâmetros estimados. Finalmente, far-se-á uma aplicação do

modelo de previsão definido para estimar alguns valores de retornos para os

grupos de ações definidos.

• Conclusões: serão feitas as considerações finais sobre o trabalho, os resultados

obtidos e a utilidade de se criar um modelo de previsão como o desenvolvido neste

trabalho.

Page 18: IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE …pro.poli.usp.br/wp-content/uploads/2012/pubs/identificacao-de... · IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE

18

Page 19: IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE …pro.poli.usp.br/wp-content/uploads/2012/pubs/identificacao-de... · IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE

19

2. ANÁLISE PRELIMINAR

Neste capítulo, serão escolhidas as empresas cujas ações serão analisadas além de

classificá-las em três categorias estabelecidas para este estudo: setor econômico, super-setor e

tamanho da empresa. Também serão desenvolvidas neste capítulo a definição do retorno

trimestral das ações e a classificação dos períodos do ciclo monetário que serão

posteriormente utilizados para desenvolver o modelo de previsão, o principal objetivo deste

trabalho.

2.1 .Escolha e classificação das ações

Para o estudo proposto neste trabalho, escolheram-se 72 ações de empresas listadas na

BOVESPA, identificadas com o perfil do tipo doméstico. Trata-se de uma escolha por

conveniência que foi estabelecida em conjunto com o estrategista-chefe de ações para a

América Latina do Banco Morgan Stanley.

Primeiramente, obteve-se a série histórica de preços para cada um dos 72 papéis

escolhidos além da série histórica da taxa de juros (SELIC), esta última definida pelo Banco

Central através do Comitê de Política Monetária (Copom). A fonte de dados escolhida foi o

terminal da Bloomberg, devido à facilidade de se exportar dados para uma planilha em MS

Excel. A Bloomberg é atualmente um dos provedores de informação mais largamente

utilizados no mercado financeiro.

Coletaram-se as séries históricas de dados desde janeiro de 2002 até novembro de

2009 em uma frequência semanal, ou seja, utilizando apenas os preços de fechamento de

mercado do final da semana. Excluiu-se a possibilidade de coletar os dados em uma

frequência diária em razão da quantidade de dados a serem coletados. Além disso, acredita-se

que a frequência semanal seja suficiente para obter a informação que se procura analisar neste

trabalho de formatura.

Para este estudo, analisou-se a curva da taxa de juros observada no período de 2002 a

2009 e definiram-se três diferentes momentos da evolução da taxa de juros:

i) Corte: Período no qual se observa redução da taxa básica de juros;

ii) Estável: Período de sucessivos meses com taxa de juros constante;

iii) Subida: Período no qual se observa aumento da taxa básica de juros.

Page 20: IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE …pro.poli.usp.br/wp-content/uploads/2012/pubs/identificacao-de... · IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE

20

Assim, com a série histórica de taxa de juros desde 2002 e a definição dos três

diferentes momentos (corte/estável/subida), classificaram-se os diferentes períodos da série

como mostra a Tabela 2.1.1:

Tabela 2.1.1 - Classificação da série da taxa de juros (SELIC)

Período Classificação Janeiro-2002 a Outubro-2002 Corte

Outubro-2002 a Março-2003 Subida

Março-2003 a Julho-2003 Estável

Julho-2003 a Dezembro-2003 Corte

Dezembro-2003 a Setembro-2004 Estável

Setembro-2004 a Maio-2005 Subida

Maio-2005 a Setembro-2005 Estável

Setembro-2005 a Setembro-2007 Corte

Setembro-2007 a Abril-2008 Estável

Abril-2008 a Novembro-2008 Subida

Novembro-2008 a Janeiro-2009 Estável

Janeiro-2009 a Setembro-2009 Corte

Setembro-2009 a Junho-2010 Estável

A representação da Tabela 2.1.1 pode ser feita como mostra a Figura 2.1.1, onde se

observa a evolução da taxa básica de juros ao longo do tempo:

Figura 2.1.1 – Evolução da taxa de juros ao longo do tempo

5%

10%

15%

20%

25%

30%

jan-02 jan-03 jan-04 jan-05 jan-06 jan-07 jan-08 jan-09

CorteCorte

Corte

Corte

Subida

Subida

Subida

Estável

Estável

Estável

Estável

EstávelEstável

Tempo

Taxa de juros

Page 21: IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE …pro.poli.usp.br/wp-content/uploads/2012/pubs/identificacao-de... · IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE

21

Uma vez definida a classificação dos diferentes períodos do ciclo monetário como

estão representados na Tabela 2.1.1 e na Figura 2.1.1, analisar-se-á os retornos das ações em

cada uma destas três situações. Além disso, ressalta-se que será esta classificação a referência

que será considerada para a definição do modelo de previsão que será construído ao longo

deste trabalho.

As ações escolhidas foram classificadas de acordo com três critérios distintos segundo

setor econômico, super-setor e tamanho da empresa. O intuito desta diferenciação com

critérios distintos é isolar características atribuíveis a grupos de empresas para enfim melhor

observar como o impacto dos ciclos monetários no preço dos papéis pode variar segundo o

perfil das empresas.

Os setores econômicos estão divididos em nove neste trabalho: 1) Alimentos, bebidas

e tabaco, 2) Bancos e instituições financeiras, 3) Construção civil e engenharia, 4) Educação,

5) Infraestrutura, logística e concessões, 6) Saúde, 7) Telecomunicações, 8) Utilidade pública

e 9) Varejo.

De acordo com os critérios estabelecidos, a classificação das empresas segundo setores

econômicos apresentou as seguintes frequências para cada um dos setores:

• 5 empresas de alimentos, bebidas e tabaco;

• 12 empresas de bancos e instituições financeiras;

• 24 empresas de construção civil e engenharia;

• 3 empresas de educação;

• 9 empresas de infraestrutura, logística e concessões;

• 4 empresas de saúde;

• 4 empresas de telecomunicações;

• 7 empresas de utilidade pública;

• 4 empresas de varejo;

Já os super-setores são classificações mais abrangentes do que os setores econômicos,

e podem ser definidos como sendo 1) de crescimento ou 2) defensivo. Empresas de

crescimento geram elevados fluxos de caixa e lucro líquido e apresentam taxas de crescimento

acima do nível da economia como um todo (da mesma forma que apresentam redução maior

em seus lucros em caso de desaceleração econômica). Geralmente, tendem a ter rentáveis

oportunidades de reinvestimento de seu lucro. Por isso, este tipo de empresa na maior parte

Page 22: IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE …pro.poli.usp.br/wp-content/uploads/2012/pubs/identificacao-de... · IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE

22

das vezes paga poucos dividendos aos acionistas, optando por reinvestir o lucro da empresa

em outros projetos. Por outro lado, empresas defensivas são companhias que apresentam

lucros relativamente estáveis, independente do nível de crescimento da economia, ou seja,

seus lucros apresentam pequena sensibilidade a altos ou baixos níveis de crescimento

econômico. De acordo com este critério de super-setor, 45 empresas foram classificadas como

sendo empresas de crescimento enquanto as 27 restantes foram classificadas como empresas

defensivas.

O terceiro critério utilizado foi a classificação das empresas por tamanho feita segundo

a liquidez da ação da empresa na BOVESPA durante os três meses mais recentes. O indicador

de liquidez utilizado foi o volume diário médio de negociação. Por isso, foi necessário obter a

série histórica do volume diário de negociação dos papéis das 72 empresas escolhidas

utilizando o terminal da Bloomberg e as ordenar de forma decrescente segundo a sua liquidez.

Foram definidas três tamanhos de empresa : 1) Grandes, 2) Médias e 3) Pequenas empresas,

onde um terço das ações foram classificadas como de grandes empresas, outros um terço

como de médias empresas e o um terço restante como ações de pequenas empresas. As

empresas classificadas como grandes foram aquelas que apresentaram os 24 maiores volumes

médios diários de negociação entre as ações escolhidas (tais empresas tiveram o volume

médio diário de negociação superior a 14,5 bilhões de reais). As empresas classificadas como

médias apresentaram o volume médio de negociação diário entre 14,5 e 2,2 bilhões de reais. E

por fim, as pequenas empresas tiveram um volume médio de negociação diário inferior a 2,2

bilhões de reais. Por conta desse ajuste trimestral e da variação de liquidez das ações que pode

ocorrer, esta é a única classificação em que os grupos podem sofrer alterações na sua

composição ao longo do tempo.

As classes de cada uma das três variáveis categóricas estão descritas na Tabela 2.1.2.

A lista completa das 72 empresa escolhidas e as suas respectivas classificações podem ser

encontradas no Anexo A.

Page 23: IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE …pro.poli.usp.br/wp-content/uploads/2012/pubs/identificacao-de... · IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE

23

Tabela 2.1.2- Lista das classificações utilizadas por categoria

Super-setores Setores Tamanho

Ações de crescimento Alimentos, Bebidas e Tabaco Grandes empresas

Ações defensivas Bancos e Instituições Financeiras Médias empresas

Construção civil e Engenharia Pequenas empresas

Educação

Infraestrutura, Logística e Concessões

Saúde

Telecomunicações

Utilidade pública

Varejo

Em função do pequeno número de empresas em algumas das 9 categorias de setores

econômicos (como por exemplo educação, saúde, telecomunicações, varejo e alimentos,

bebidas e tabaco que apresentaram entre três a cinco empresas em cada setor), houve a

necessidade de reagrupar tais setores econômicos em grupos homogêneos segundo algum

critério. A técnica escolhida para aplicar o agrupamento foi a Automatic Interaction Detection

(A.I.D). Ela foi proposta por Morgan e Sonquist (Kass, 1974). Ademais, esta técnica é um

procedimento de agrupamento de dados utilizando partições binárias.

O princípio do A.I.D é dividir os dados analisados em dois subgrupos que modo que

sejam o mais diferentes possíveis de acordo com a variável de interesse definida e que

internamente, cada subgrupo seja o mais homogêneo possível. Em seguida, cada um dos

subgrupos é analisado independentemente do outro e dividido em mais dois subgrupos;

obtendo-se então ao final da segunda iteração 4 subgrupos. Este procedimento é continuado

até atender a algum critério pré-estabelecido. Assim, a fim de reduzir o número de categoria

de setor, empregou-se a técnica A.I.D. ao grupo de setores econômicos.

Calculou-se a média dos retornos trimestrais para cada um dos nove setores.

Tomando-se a média dos retornos como parâmetro, classificaram-se os grupos em ordem

decrescente de média, sendo G1 o setor econômico com maior média e G9 o setor com menor

média (vide Tabela 2.1.3).

Page 24: IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE …pro.poli.usp.br/wp-content/uploads/2012/pubs/identificacao-de... · IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE

24

Tabela 2.1.3 - Setores ordenados por média dos retornos das ações

Setor Nome Média

G1 Varejo 3,2%

G2 Construção civil e Engenharia 3,1%

G3 Infraestrutura, Logística e Concessões 3,0%

G4 Bancos e Instituições Financeiras 0,1%

G5 Alimentos, Bebidas e Tabaco -0,2%

G6 Saúde -1,2%

G7 Utilidade pública -1,5%

G8 Telecomunicações -2,2%

G9 Educação -2,4%

Com os setores ordenados, procurou-se a partição que fornecesse dois grupos o mais

distintos possíveis. Por exemplo, uma partição possível é separar um grupo A contendo o

setor G1 e um grupo B contendo os setores de G2 à G9. Para isto uma análise de variância foi

utilizada e cujo resultado está na Tabela 2.1.4.

Tabela 2.1.4 - Resultado da Análise de Variância entre os grupos formados por G1 e por G2 a G9

Realizou-se o mesmo teste para todas as partições possíveis, conforme a descrição dos

grupos A e B definidos na Tabela 2.1.5. Nesta tabela, as estatísticas F para cada partição

foram também incluídas.

Análise de variancia: um fator

DetalhesGrupos Tamanho amostra Soma Média Variancia

Colonne 1 393 12,7547033 0,03245472 0,00827542Colonne 2 2651 0,73144867 0,00027591 0,01781305

Análise de VarianciaCausas da Variação SQ GL QM F P F crítico (5%)Tratamentos 0,354402978 1 0,35440298 21,3701683 3,9438E-06 3,844517334Resíduos 50,44854331 3042 0,01658401

Total 50,80294629 3043

Page 25: IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE …pro.poli.usp.br/wp-content/uploads/2012/pubs/identificacao-de... · IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE

25

Tabela 2.1.5 – Valor de F para todas as partições possíveis (1ª iteração)

# Componentes do Grupo A Componentes do Grupo B Estatística F

1 G1 G2, G3, G4, G5, G6, G7, G8, G9 21,4

2 G1, G2 G3, G4, G5, G6, G7, G8, G9 47,5

3 G1, G2, G3 G4, G5, G6, G7, G8, G9 75,9

4 G1, G2, G3, G4 G5, G6, G7, G8, G9 63,3

5 G1, G2, G3, G4, G5 G6, G7, G8, G9 55,2

6 G1, G2, G3, G4, G5, G6 G7, G8, G9 44,2

7 G1, G2, G3, G4, G5, G6, G7 G8, G9 26,6

8 G1, G2, G3, G4, G5, G6, G7, G8 G9 6,3

Como pode ser observado na Tabela 2.1.5, o maior F obtido foi 75,9 que corresponde

aos grupos formados por: G1 a G3 (Grupo A) e G4 a G9 (Grupo B) e portanto, podem ser

considerados como os dois grupos o mais distintos possíveis entre os grupos analisados.

Assim, a primeira divisão resultou nos grupos:

a. Grupo 1: G1, G2 e G3;

b. Grupo 2: G4, G5, G6, G7, G8 e G9.

Efetuou-se em seguida testes entre os setores do Grupo 1 e entre os setores do Grupo 2

da mesma forma realizada anteriormente. O teste é interrompido quando os F’s obtidos não

forem mais significativos (i.e. abaixo do F crítico – que neste caso foi realizado com α igual à

5% e cujo valor é de 3,84).

Para o grupo formado por G1, G2 e G3, o resultado das análises de variância estão na

Tabela 2.1.6. Observa-se que nenhum dos F’s obtidos é maior que o F crítico. Por esta razão,

não se pode separar o Grupo 1, formado pelos setores G1, G2 e G3, em mais subgrupos.

Tabela 2.1.6 - Valor de F para todas as partições possíveis (2ª iteração – Grupo 1)

# Componentes do Grupo A1 Componentes do Grupo B1 Estatística F

1 G1 G2, G3 0,04

2 G1, G2 G3 0,002

Da mesma forma, para o Grupo 2 formado por G4, G5, G6, G7, G8 e G9 foram

efetuadas análises de variâncias, cujos valores de F estão expostos na Tabela 2.1.7.

Page 26: IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE …pro.poli.usp.br/wp-content/uploads/2012/pubs/identificacao-de... · IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE

26

Tabela 2.1.7 - Valor de F para todas as partições possíveis (2ª iteração – Grupo 2)

# Componentes do Grupo A2 Componentes do Grupo B2 Estatística F

1 G4 G5, G6, G7, G8, G9 6,9

2 G4, G5 G6, G7, G8, G9 14,2

3 G4, G5, G6 G7, G8, G9 12,9

4 G4, G5, G6, G7 G8, G9 9,6

5 G4, G5, G6, G7, G8 G9 2,5

De acordo com os resultados da Tabela 2.1.7, o Grupo 2 dividiu-se em dois grupos de

setores:

• Grupo 3: G4 e G5;

• Grupo 4: G6, G7, G8 e G9.

O mesmo algoritmo foi reaplicado aos grupos 3 e 4. Observa-se na Tabela 2.1.8 as

partições possíveis e a estatística F de cada uma delas. Assim, pode-se verificar que não

houve mais partições pois os valores de F são menores que o valor de F crítico.

Tabela 2.1.8 - Valor de F para todas as partições possíveis (3ª iteração – Grupo 3 e 4)

# Componentes do Grupo A3 Componentes do Grupo B3 Estatística F

1 G4 G5 0,47

2 G6 G7, G8, G9 0,79

3 G6, G7 G8, G9 1,40

4 G6, G7, G8 G9 0,46

Na Figura 2.1.2, resume-se o agrupamento de setores realizado utilizando o método

A.I.D. As ações classificadas primeiramente em 9 setores foram realocadas em 3 grupos da

seguintes forma:

• Grupo SI: i) Varejo (G1), ii) Construção civil e engenharia (G2) e iii)

Infraestrutura, logística e concessões (G3);

• Grupo SII: i) Bancos e instituições financeiras (G4) e ii) Alimentos, bebidas e

tabaco (G5);

• Grupo SIII: i) Saúde (G6), ii) Utilidade pública (G7), iii) Telecomunicações

(G8) e iv) Educação (G9).

Page 27: IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE …pro.poli.usp.br/wp-content/uploads/2012/pubs/identificacao-de... · IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE

27

Figura 2.1.2 - Realocação dos setores em três grupos segundo o A.I.D.

Desta forma, como ilustra a Figura 2.1.2, o resultado da aplicação do método A.I.D

mostra que se pode considerar os setores de varejo, de construção civil e engenharia e de

infraestrutura como um único grupo de retorno trimestral médio igual a 3,1%. Da mesma

forma, observa-se que o outro grupo será composto pelos setores bancos e instituições

financeiras e alimentos, bebidas e tabaco. Enfim, o terceiro grupo de setores é formado por

empresas da área da saúde, utilidade pública, telecomunicações e educação.

Em um primeiro momento, este agrupamento pode parecer estranho por incluir, por

exemplo, infraestrutura e varejo no mesmo grupo, setores que aparentemente são

completamente diferentes. Porém, observando a sensibilidade à variação da taxa de juros,

ambos são impactados negativamente quando ocorre o seu aumento da seguinte forma:

quando a taxa de juros aumenta, os bancos cobram mais caro os empréstimos feitos aos

varejistas e também ao consumidor. O consumidor, por pagar mais juros aos bancos, pega

menos crédito e consequentemente gasta menos. Os varejistas também pagam mais caro para

obter empréstimos, por isso, caso queiram financiar as compras de seus clientes (as famosas

parcelas mensais e carnês), terão que repassar este custo dos juros a seus clientes e não

poderão oferecer condições tão boas de pagamentos aos consumidores. Como consequência,

haverá menos consumo e, portanto, menos receita para a empresa varejista.

Construção civil e engenhariaInfraestrutura, logística econcessões

Bancos e instituiçõesfinanceiras Utilidade públicaAlimentos, bebidas Telecomunicaçõese tabaco Educação

Y = 0,4%

F = 14,2

Saúde

Varejo

F = 75,9

Y1 = 3,1% Y2 = -1,1%

Y3 = -0,1% Y4 = -1,1%

Page 28: IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE …pro.poli.usp.br/wp-content/uploads/2012/pubs/identificacao-de... · IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE

28

No caso das empresas ligadas a infraestrutura e logística, os investimentos nesta área

requerem elevado aporte de capital e um longo prazo para recuperar o capital investido. Como

uma parte deste capital necessário para o investimento é proveniente da contração de dívida,

quanto maior os juros, maior o custo de capital de dívida da empresa/projeto. Assim, em um

ambiente de alta taxa de juros, empresas ligadas a este setor tendem a diminuir os seus

investimentos, e portanto, apresentam menor crescimento. Conclui-se, enfim, que empresas de

ambos setores de varejo e de infraestrutura seguem uma mesma tendência de crescimento

afetados pela variação da taxa de juros.

Outros dois setores agrupados no mesmo grupo são bancos e instituições financeiras e

alimentos, bebidas e tabaco (com média de retorno de -0,1%). Ambos podem não ser

impactados de forma negativa pelo aumento da taxa de juros já que no caso dos bancos, a sua

receita está ligada ao recebimento de juros dos empréstimos concedidos e que esta aumenta

com a elevação da taxa de juros. No caso das empresas de alimentos, bebidas e tabaco, pode-

se associar o mesmo pensamento, pois o consumidor não financia suas compras de itens de

supermercado e não deixa de consumir produtos básicos por causa do nível da taxa de juros.

O outro grupo é composto pelos setores de saúde, educação, utilidade pública e

telecomunicações, que embora não pareça intuitivamente um grupo homogêneo, apresentaram

médias de retornos semelhantes. Além disso, nota-se que as atividades destes setores são

menos sensíveis a variação do crescimento da economia do país.

Para complementar a análise feita anteriormente dos setores e principalmente para

observar o comportamento dos retornos das ações em cada um dos períodos do ciclo

monetário, traçaram-se gráficos das distribuições dos retornos trimestrais para cada um dos

setores.

A Figura 2.1.3 ilustra a distribuição dos retornos trimestrais de ações de empresas do

setor de varejo divididos nos três diferentes períodos do ciclo monetário. A partir deste

gráfico, pode-se verificar que em períodos de corte de taxa de juros as ações deste setor

apresentaram retornos positivos em uma frequência maior que em períodos de subida da taxa

de juros. Isto pode ser explicado pela alta relação que o desempenho das empresas do setor de

varejo possuem com a facilidade de obtenção de crédito, como abordado anteriormente.

Por outro lado, observa-se na Figura 2.1.4 uma distribuição diferente da apresentada

na Figura 2.1.3. Em períodos de alta de juros as ações de empresas do setor bancário

Page 29: IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE …pro.poli.usp.br/wp-content/uploads/2012/pubs/identificacao-de... · IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE

29

apresentaram retornos positivos em uma frequência maior que em períodos de corte de taxa

de juros. Isso pode ser explicado pelo fato de parte da receita destas instituições ser

diretamente ligada a taxa juros, ou seja, quanto maior os juros no mercado, maior serão os

juros cobrados por estas instituições aos clientes e conseqüentemente maiores serão as

receitas geradas.

Figura 2.1.3 - Distribuição dos retornos para ações de empresas do setor Varejo para os três diferentes períodos do ciclo da taxa de juros (SELIC)

Figura 2.1.4 - Distribuição dos retornos para ações de empresas do setor Bancos e Instituições Financeiras para os três diferentes períodos do ciclo da taxa de juros (SELIC)

0%

10%

20%

30%

40%

50%

-24% -18% -12% -6% 0% 6% 12% 18% 24%

Corte Estável Subida

0%

10%

20%

30%

40%

-6% -4% -2% 0% 2% 4% 6%

Corte Estável Subida

Page 30: IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE …pro.poli.usp.br/wp-content/uploads/2012/pubs/identificacao-de... · IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE

30

Outra constatação que se pode notar a partir dos gráficos é que as distribuições dos

retornos não são simétricas. Algumas possuem assimetria com tendência positiva e outros

negativa. Assim, acredita-se que uma das idéias iniciais de definir o modelo utilizando

modelos lineares, ou seja, assumindo que os retornos possuem distribuição normal, possa não

ser eficiente para se encontrar um modelo adequado para este trabalho.

Por constatar este problema que pode ocorrer ao assumir os dados segundo uma

distribuição normal, pensou-se em uma maneira de calcular os retornos trimestrais sem que

estes apresentem formas negativas. Tal fato poderia restringir as possibilidades de abordar o

problema utilizando outras distribuições já que uma grande parte das distribuições não

assumem valores negativos. Desta forma, foi definido o cálculo do retorno que será utilizado

na modelagem deste trabalho.

2.2 . Definição do retorno das ações

Como discutido anteriormente, há uma restrição quanto ao valor que os retornos das

ações podem assumir: estes não devem ser negativos. Assim, neste trabalho, ao invés de se

calcular o retorno como porcentagem de redução ou aumento do preço da ação (o que teria

como consequência a obtenção de valores negativos), o retorno de uma ação será considerado

como a razão do preço em uma data (t+13) pelo preço na data referência (t), onde t é

expressado em semanas. Assume-se que um ano possui 52 semanas e como três meses

correspondem a um quarto de um ano, o número de semanas em três meses será considerado

como 13. Assim, considerando-se os retornos trimestrais (ou 13 semanas), a razão R na

semana t, é definida como mostra a Equação 2.2.1.

ttt PPR /13+=

Equação 2.2.1 - Razão de preços por trimestre

Assim, caso Rt seja maior que 1, evidencia-se uma valorização do preço do papel no

trimestre e, portanto, o acionista obteve lucro. Caso contrário, se Rt for menor que 1, há uma

desvalorização do ativo em questão, o que corresponde a um prejuízo para o acionista.

Ao calcular o retorno da ações desta forma, garante-se a obtenção de somente valores

positivos de entrada no modelo do problema. Este fato garante flexibilidade para trabalhar

com uma grande variedade de distribuições para testar o modelo (ex. Distribuição binomial,

Poisson, Gamma, exponencial, etc.) e não restringe o teste do modelo a aplicação da

Page 31: IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE …pro.poli.usp.br/wp-content/uploads/2012/pubs/identificacao-de... · IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE

31

distribuição normal que nem sempre é a mais adequada, podendo comprometer a qualidade

dos resultados.

Por isso, calcular-se-á o retorno pela razão entre preços, de forma a obter liberdade

para testar o modelo com diferentes distribuições, caso seja necessário.

Page 32: IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE …pro.poli.usp.br/wp-content/uploads/2012/pubs/identificacao-de... · IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE

32

Page 33: IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE …pro.poli.usp.br/wp-content/uploads/2012/pubs/identificacao-de... · IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE

33

3. REVISÃO BIBLIOGRÁFICA

Neste capítulo serão abordados os temas que servirão de base para o desenvolvimento

do modelo de previsão para as ações escolhidas no capítulo 2.

Em um primeiro momento, serão abordados os modelos lineares generalizados, a sua

estrutura e as distribuições da família exponencial, em especial a distribuição Gamma, e será

apresentado o conceito de função link e a sua ligação com a definição do modelo de previsão.

Em seguida, serão detalhados os passos para a definição do modelo de previsão e

quais as equações consideradas neste processo. Enfim, serão apresentados alguns indicadores

que serão utilizados para testar a significância dos parâmetros estimados e a qualidade do

modelo de previsão definido.

3.1 Modelos lineares generalizados

Segundo Myers, Montgomery e Vining (2002), um modelo é uma forma abstrata de

representar a realidade e de fazer uma aproximação mais simples de um fenômeno complexo.

Modelos podem ser classificados como determinísticos ou probabilísticos. Em um modelo

determinístico, as variáveis respostas são geralmente definidas por conjunto de equações. São

exemplos de modelos determinísticos equações relacionadas à ciência, como a lei dos gases

ideais ou a primeira lei da termodinâmica. Por outro lado, em um modelo probabilístico, as

respostas apresentam variações devido ao fato de existirem variáveis aleatórias ou então

conter variáveis impactadas de certa forma por elementos aleatórios.

Um modelo linear probabilístico pode ser definido como mostra a Equação 3.1.1:

εββββ +++++= ppo xxxY ...2211

Equação 3.1.1- Definição de um modelo linear probabilístico

Onde Y é a variável resposta e x1, x2, x3,.., xp, é um conjunto de covariáveis, β0, β1,

β2,..., βp, são um conjunto de parâmetros desconhecidos e ε é uma variável aleatória

relacionada ao erro. Para escrever o modelo que estima o valor esperado de Y, considera-se o

valor esperado para erro ε geralmente como nulo. Assim, o valor esperado de Y no modelo de

regressão linear é definido como:

Page 34: IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE …pro.poli.usp.br/wp-content/uploads/2012/pubs/identificacao-de... · IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE

34

( ) ppo xxxYE ββββ ++++= ...2211

Equação 3.1.2 – Valor esperado de Y

Além disso, se existe interação entre as covariáveis do modelo, no caso de duas

variáveis, pode-se escrever a equação da seguinte forma:

εββββ ++++= 21122211 xxxxY o

Equação 3.1.3 – Modelo linear com interação entre variáveis para o caso de duas variáveis

O modelo linear apresentado na Equação 3.1.2 é chamado de modelo linear de

primeira ordem ou também de modelo com os efeitos principais (“main-effects model”) e o

modelo da Equação 3.1.3 de modelos de interação de segunda ordem.

Quando se trabalha com modelos de regressão lineares (e também não lineares),

assume-se que a variável resposta Y segue uma distribuição normal. Porém, existem casos

onde esta condição não é satisfeita e que a premissa de normalidade da amostra é irreal. Desta

forma, foi desenvolvida a teoria dos modelos lineares generalizados (GLM).

Se yi é uma variável resposta, para i = 1,2,...,n, então o GLM é definido como:

( ) ( )[ ]== ii yEgg µ xi‘β

Equação 3.1.4 – Definição de modelo linear generalizado

Onde o vetor xi é o vetor de covariáveis para a i-ésima observação e β é o vetor de

parâmetros ou coeficientes de regressão. Todo modelo linear generalizado possui três

componentes:

• uma distribuição da variável resposta;

• um estimador linear (“predictor linear”) onde as covariáveis de regressão xi

são consideradas;

• uma função link g que conecta o estimador linear à média natural da variável

resposta.

Os modelos lineares generalizados foram desenvolvidos para se permitir estruturar

modelos de regressão para dados que seguem uma distribuição mais abrangente, a chamada

família exponencial. A família exponencial inclui as distribuições normal, binomial, Poisson,

exponencial, Gamma e outras.

Page 35: IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE …pro.poli.usp.br/wp-content/uploads/2012/pubs/identificacao-de... · IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE

35

Um conceito importante sobre os modelos lineares generalizados são as distribuições

da família exponencial. Os membros de uma família exponencial têm todos funções densidade

de probabilidade para uma variável resposta y que pode ser expressada como mostra a

Equação 3.1.5.

( ) ( )( ) ( )

+−= φφ

θθφθ ,exp;; yca

byyf

Equação 3.1.5 –Expressão geral da função densidade de probabilidade para membros da família exponencial

Onde, na Equação 3.1.5, a(.), b(.) e c(.) são funções específicas. O parâmetro θ é o

parâmetro natural e o φ é chamado de parâmetro de dispersão. Para alguns membros da

família exponencial, como a binomial e a Poisson, o valor de φ é 1.

A distribuição normal, por exemplo, faz parte da família exponencial. Assim, a função

densidade de probabilidade para uma variável normal aleatória y com parâmetros µ e σ é

definida como mostra a Equação 3.1.6:

( ) [ ]σπσ

µσµ⋅

−−=

2

1

2exp;;

2

2yyf

Equação 3.1.6 – Função densidade de probabilidade para uma variável normal aleatória

Outro membro da família exponencial é a distribuição Gamma, que por possui dois

parâmetros r e λ, assume formas assimétricas e por isso possui uma maior flexibilidade para

modelar.

A função densidade de probabilidade da distribuição Gamma pode ser definida para

uma variável y contínua, onde r>0 e λ>0, é dada como:

1/1

)(

1)( −−

Γ= ry

r

yer

yf λ

λ

Equação 3.1.7 –Definição da função densidade de probabilidade da distribuição da família Gamma

Onde )(rΓ é a função gamma definida, para r>0, como mostra a Equação 3.1.8:

Page 36: IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE …pro.poli.usp.br/wp-content/uploads/2012/pubs/identificacao-de... · IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE

36

∫∞

−−=Γ0

1)( dxexr xr

Equação 3.1.8- Definição da função Gamma

E a média e a variância das função Gamma são definidas como: ( ) λrGammaE = e

( ) 2λrGammaVar = .

Ao colocar a função de densidade na forma de uma distribuição da família

exponencial como mostra a Equação 3.1.5, chega-se às seguintes equações:

rλθ 1−=

λµ r=

( ) 1−= ra φ

( ) ( )θθ −−= lnb

( ) ( ) ( ) yrrrrc ln1lnln −+Γ−=φ

O parâmetro r é escalar e quando assume o valor 1 a distribuição Gamma se reduz a

uma distribuição exponencial. Assume-se que o valor de r é constante em uma regressão de

um conjunto de dados, o que implica que a média varia de acordo com o parâmetro λ. Em

geral, o parâmetro r pode ser estimado através de métodos de máxima verossimilhança.

Considerando-se a função densidade de probabilidade para a família exponencial

como apresentada na Equação 3.1.5, a estrutura formalizada dos modelos lineares

generalizados é definida da seguinte forma:

i. Existem y1, y2,..., yn observações independentes com médias µ1, µ2,..., µn

respectivamente;

ii. A observação yi segue uma das distribuições da família exponencial;

iii. Existe um conjunto de covariáveis de regressão x1, x2,..., xk;

iv. O modelo de previsão é construído baseando-se no estimador linear (“linear

predictor”), definido como =η x’β ∑=

+=k

iii x

10 ββ ;

Page 37: IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE …pro.poli.usp.br/wp-content/uploads/2012/pubs/identificacao-de... · IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE

37

v. O modelo é definido através do uso da função link, como mostra a Equação

3.1.9:

( )ii g µη = , i = 1,2,...,n

Equação 3.1.9 – Definição da função link

O termo link (em inglês significa elo, vínculo) é utilizado devido ao fato desta

função ser a ligação entre a média e o estimador linear. Assim, a variável resposta esperada

para o modelo de regressão é definida como:

( ) ( ) 11 −− == ggyE ii η ( xi’β)

Equação 3.1.10 – Variável resposta para o modelo de regressão

Em uma regressão linear múltipla o modelo == ii ηµ xi’β, onde i = 1,2,...,n,

sugere um caso especial, onde ( ) iig µµ = , e assim a função link utilizada neste caso é a

função link identidade.

Maiores detalhes sobre a estrutura dos modelos lineares generalizados podem ser

encontrados no McCullagh e Nelder (1987). Existem várias possíveis escolhas da função link.

Se for escolhida uma função link com propriedade mostrada na Equação 3.1.11, ηi é chamada

de função link canônica.

ii θη =

Equação 3.1.11 – Função link canônica

Na Tabela 3.1.1 mostram-se as funções link canônicas para as distribuições mais

recorrentes e empregadas nos modelos lineares generalizados.

Page 38: IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE …pro.poli.usp.br/wp-content/uploads/2012/pubs/identificacao-de... · IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE

38

Tabela 3.1.1 –Lista de funções link canônicas

Distribuição Função link canônica

Normal ii µη = (link identidade)

Binomial

−=

i

ii P

P

1lnη (link logística)

Poisson ( )ii µη ln= (log link ou link logarítmica)

Exponencial i

i µη 1= (link recíproco)

Gamma i

i µη 1= (link recíproco)

Além da função link canônica, existem outras funções link que podem ser usadas em

modelos lineares generalizados. Algumas destas funções são:

a. Função link probit: ( )[ ]ii yE1−Φ=η , onde Φ representa a função de

distribuição acumulada da normal.

b. Função link log-log complementar: ( )[ ]ii µη −= 1lnln

c. Função link power family: ( )

=≠

=0,ln

0,

λµλµη

λ

se

se

i

ii

A escolha da função link mais adequada para o problema analisado é muito importante

pois usá-la de forma incorreta pode resultar em problemas significativos no modelo de

regressão ajustado.

3.2 Definição do modelo de previsão

Nesta trabalho considerou-se a utilização da distribuição Gamma entre todas as outras

distribuições da família exponencial. Isto foi feito pois ao representar graficamente os

retornos, observou-se que a curva de distribuição das frequências possui uma forma

assimétrica e que portanto a distribuição Gamma se encaixaria melhor devido aos seus dois

parâmetros λ e r.

Page 39: IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE …pro.poli.usp.br/wp-content/uploads/2012/pubs/identificacao-de... · IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE

39

Figura 3.2.1 - Distribuição de frequência dos retornos trimestrais

Para um parâmetro canônico =θ x’β, tem-se a seguinte equação para a média:

=−1µ x’β

A função link canônica no caso da distribuição exponencial e Gamma é a função link

recíproca (como mostra a Tabela 3.1.1). Observa-se que ao usar a função link canônica, a

média pode assumir valores negativos, o que não deve ocorrer em uma distribuição Gamma.

Ao contrário da função link recíproca, com a função log link, embora ela não seja uma função

link canônica, não se obtém valores negativos para as estimativas. Assim, para uma

distribuição Gamma a função log link foi escolhida e deste modo:

=)ln(µ x’β

e==µ

θ 1 xi’β

Desta forma, o modelo de previsão de primeira ordem terá forma exponencial (função

log link) e apresentará a forma como mostra a Equação 3.2.1:

)...exp()( 2211 nno xxxyE ββββµ ++++==

Equação 3.2.1 – Forma exponencial do modelo de previsão de primeira ordem

0%

10%

20%

30%

-55% -44% -33% -22% -11% 0% 11% 22% 33% 44% 55% 66%

Page 40: IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE …pro.poli.usp.br/wp-content/uploads/2012/pubs/identificacao-de... · IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE

40

Onde, as covariáveis xi do modelo deste trabalho são as variáveis categóricas descritas

anteriormente no capítulo 2.

Existem várias formas de representar variáveis categóricas num modelo de regressão.

Para exemplificar, considere o ciclo monetário que assume três categorias: corte, estável e

subida. Neste trabalho o ciclo monetário estará representado por duas variáveis x1 e x2. Assim,

para se estimar um ponto para uma empresa j em um instante t:

• Se este instante t está dentro de um período de taxa de juros estável, então o

valor de x1 será 1 e o valor de x2 será zero. Desta forma, o parâmetro estimado

β1 associado ao x1 será considerado no cálculo do retorno da ação da empresa j

no instante t (x1=1, x2=0);

• Da mesma forma, se t se encontra em um período de aumento de taxa de juros,

o coeficiente β2 associado ao x2 será considerado no cálculo do valor de Y(t)

pois x1 terá valor igual a zero e x2 terá valor igual a 1 (x1=0, x2=1);

• E enfim, se t se encontra em um período de corte de taxa de juros, ambos x1 e

x2 serão nulos, pois o valor estimado para a situação de um período de corte de

juros já está incluído no valor de β0 (x1=0, x2=0);.

Inicialmente será considerado o modelo de previsão de primeira ordem sem considerar

as interações entre as covariáveis. Porém, acredita-se que tais interações existam e por isso,

elas serão incluídas na Equação 3.2.1 posteriormente. Na procura do melhor modelo para o

problema proposto, analisaram-se tais interações e as que foram consideradas não-

significativas foram excluídas do modelo. Assim, a equação do modelo pode ser escrita como

mostra na Equação 3.2.2:

)......exp()( 1)1(311321122211 ppppnno xxxxxxxxxyE −−++++++++== βββββββµ

Equação 3.2.2 – Forma exponencial do modelo de previsão de segunda ordem ordem

Uma vez estabelecido um modelo, é necessário testá-lo para saber o quão ajustado e

adequado está em relação aos valores reais observados. Para isto, testes de hipóteses serão

feitos para verificar se os parâmetros estimados do modelo são significativos. Este

procedimento é uma das etapas mais importantes para a definição do modelo mais adequado.

Page 41: IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE …pro.poli.usp.br/wp-content/uploads/2012/pubs/identificacao-de... · IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE

41

A realização de testes de hipóteses para cada coeficiente de regressão (βi)

individualmente é útil na determinação do valor de cada variável de regressão do modelo e na

verificação dos níveis de significância de cada um dos parâmetros estimados. Assim, através

destes testes, pode-se analisar se o modelo fica melhor ajustado com a inclusão de certas

variáveis ou se a exclusão de outras variáveis que estavam inicialmente sendo consideradas

melhoram o modelo ajustado.

As hipóteses para testar a significância de um dos coeficientes de regressão (βi) é

definido por:

0:

0:

1

0

≠=

i

i

H

H

ββ

Se H0 não é rejeitado, então pode-se excluir xi do modelo. Defini-se a estatística do

teste para esta hipótese, como mostra a Equação 3.2.3:

)(0ie

i

bs

bt =

Equação 3.2.3 – Estatística do teste de hipótese

Onde bi é o coeficiente de regressão que estima o valor do parâmetro βi e se(bi) é uma

estimativa do erro padrão de bi. A hipótese nula H0 é rejeitada se 1,2/0 −−≥ kntt α , no caso deste

trabalho 1,96, o que corresponde a um nível de significância α de 5%. Vale lembrar que este

teste se trata de um teste marginal, pois o coeficente de regressão bi depende dos outros

coeficientes de regressão xj (i ≠ j) que também estão no modelo.

Durante o processo de definição do modelo, além de analisar individualmente as

estimativas dos parâmetros (bi), a fim de verificar a qualidade do teste, pode-se também

observar o comportamento da deviance que será definida na Seção 3.2.1.

3.2.1 Deviance e Akaike Information Criterion (AIC)

O cálculo da deviance quando se procura definir um modelo é uma das opções que

existem para testar a qualidade do modelo analisado. Existem alguns testes e formas de

analisar a deviance, que usa o critério da razão da verossimilhança. A deviance permite

avaliar se dois modelos são equivalentes ou não.

Page 42: IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE …pro.poli.usp.br/wp-content/uploads/2012/pubs/identificacao-de... · IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE

42

Será denominado o modelo completo, um modelo com m parâmetros independentes da

regressão de tal forma que, feita a estimativa dos parâmetros do modelo, restem zero graus de

liberdade disponíveis; o modelo reduzido será aquele com número de parâmetros igual a p

(onde p < m); e o modelo nulo é um modelo com ausência de covariáveis.

A deviance do modelo de regressão é definida como mostra a Equação 3.2.1.1:

( )( )

−=

PD

ςβςβ ln2)(

Equação 3.2.1.1 - Definição de deviance

Onde ς (β) é o valor da função de verossimilhança do modelo ajustado (com número

de parâmetros menor que m) com β substituído pelas estimativas de máxima verossimilhança

(MLE) e ς (P) é o valor da função de verossimilhança para o modelo completo no qual m

parâmetros são estimados.

Pode-se demonstrar que D(β) segue uma distribuição 2pm−χ com (m-p) graus de

liberdade, onde m é o número de parâmetros estimados no modelo completo e p é o número

de parâmetros estimados no caso do modelo ajustado.

Um valor pequeno da deviance D(β) implica que o modelo ajustado não é

significamente pior do que o modelo completo. Neste caso, utilizando o princípio da

parsimônia, que diz que quando duas soluções para o mesmo problema são quase idênticas

deve-se optar pela opção mais simples, a solução do modelo ajustado será a escolhida pois é

mais simples e fornece a mesma qualidade para o modelo de previsão do que o modelo

completo. Assim, conclui-se que quanto menor o valor da deviance, melhor é o modelo

ajustado.

Outra regra simples para analisar a qualidade do modelo é utilizar a razão

deviance/(m-p); quando esta razão é muito elevada, pode ser um sinal de falta de ajuste do

modelo.

Segundo Hair et al (1998), outra medida de ajuste que pode ser utilizada na

comparação de modelos é o Akaike Information Criterion (AIC), que é calculado como:

⋅+= 22χAIC número de parâmetros estimados

Page 43: IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE …pro.poli.usp.br/wp-content/uploads/2012/pubs/identificacao-de... · IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE

43

Um valor de AIC próximo a zero indica um melhor ajuste do modelo segundo o

princípio da parsimônia. Um valor pequeno do AIC ocorre quando valores pequenos do χ2 são

obtidos com menor número de coeficientes estimados. Isto mostra não apenas um bom ajuste

do modelo em relação as covariáveis estimadas versus observadas, mas também a escolha de

um modelo mais simples.

3.2.2 Resíduos padronizados

Além da análise da deviance do modelo, pode-se calcular os resíduos do modelo

ajustado. Os resíduos são as diferenças entre os valores reais da amostra e os valores obtidos

através do modelo. Muitos analistas preferem trabalhar com resíduos padronizados ao invés

de trabalhar com os resíduos absolutos (mínimos quadrados), pois, geralmente, os resíduos

padronizados oferecem mais informação agregadas do que os resíduos absolutos.

O resíduo padronizado é definido como mostra a equação 3.2.2.1, onde i = 1,2,...,n e

EMS=σ̂ . Lembre-se que MSE é o erro quadrático médio, ou seja, mede a média dos

quadradros dos erros entre o valor estimado e o valor real.

σ̂i

i

ed =

Equação 3.2.2.1 – Definição de resíduo padronizado

Os resíduos padronizados têm média zero e variância aproximadamente unitária;

consequentemente, eles são úteis para procurar pontos discrepantes na amostra. Segundo

Myers, Montgomery e Vining (2002), para um modelo de previsão aderente, os valores destes

resíduos devem estar entre -3 e 3; pontos fora deste intervalo devem ser analisados

cuidadosamente e deve-se tentar entender os motivos destes pontos estarem apresentando

estas discrepâncias.

Assim, quando os parâmetros do modelo estiverem testados e definidos e os resíduos e

deviance convergirem para um modelo adequado, o modelo de previsão estará então pronto.

No capítulo 4 apresentar-se-á uma aplicação da teoria exposta neste capítulo aos dados

específicos deste trabalho.

Page 44: IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE …pro.poli.usp.br/wp-content/uploads/2012/pubs/identificacao-de... · IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE

44

Page 45: IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE …pro.poli.usp.br/wp-content/uploads/2012/pubs/identificacao-de... · IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE

45

4. APLICAÇÃO

Neste capítulo será aplicado o procedimento abordado no capítulo 3. Será proposta

uma regressão Gamma aplicada aos dados analisados neste trabalho que se classificaram

como heterocedásticos.

Em um primeiro momento, serão explicadas as premissas assumidas e as

considerações feitas para modelar o problema. Além disso, serão detalhadas as etapas do

processo para definir o melhor modelo para o conjunto de dados deste trabalho. Em seguida,

será apresentada a equação de previsão e será feita uma análise e interpretação dos parâmetros

estimados.

Neste processo, serão analisados os valores da deviance e os níveis descritivos do teste

de hipótese 0:0 =iH β para cada um dos parâmetros estimados. Também serão analisados os

resíduos padronizados do modelo final.

Finalmente, far-se-á uma aplicação do modelo de previsão definido para estimar

alguns valores de retornos para os grupos de ações definidos.

Como observação, vale ressaltar que a modelagem do problema foi realizada no

programa R, uma linguagem e ambiente desenvolvido para modelagens e análises estatísticas.

Escolheu-se este programa para o desenvolvimento deste trabalho pelo fato de ser gratuito e

por oferecer uma vasta variedade de funções estatísticas (modelos lineares e não lineares, os

clássicos testes estatísticos, análises temporais, entre outros). Detalhes do passo-a-passo da

programação do modelo de regressão no R estão nos Anexos C e D.

4.1 Modelos lineares generalizados

Como abordado no capítulo 3 deste trabalho, os dados de retorno das ações possuem

uma distribuição assimétrica. Desta forma, o uso da distribuição normal fica comprometido,

pois resultará em modelos que não correspondem com o que se espera como estimativas para

o retorno das ações. Por isso, escolheu-se utilizar a distribuição Gamma, que por possuir dois

parâmetros r e λ na sua composição, pode assumir diversas formas e, portanto, apresentar uma

distribuição assimétrica.

Pelo mesmo motivo, optou-se por uma abordagem baseada em modelos lineares

generalizados ao invés de modelos lineares; enquanto os últimos assumem apenas distribuição

Page 46: IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE …pro.poli.usp.br/wp-content/uploads/2012/pubs/identificacao-de... · IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE

46

normal, os modelos lineares generalizados podem assumir outros tipos de distribuição da

família exponencial, tal como a distribuição Gamma.

Na Tabela 4.1.1 estão apresentadas as covariáveis xi com suas respectivas definições:

Tabela 4.1.1 - Definição das variáveis do modelo

Critério de classificação Covariável e definição

11 =x se ciclo = taxa de juros estável

Ciclo monetário 12 =x se ciclo = subida de taxa de juros

021 == xx se ciclo = corte de taxa de juros

13 =x se setor for SII

Setor econômico 14 =x se setor for SIII

043 == xx se setor for SI

Super-setor 15 =x se super-setor = crescimento

05 =x se super-setor = defensivo

16 =x se tamanho = empresas médias

Tamanho 17 =x se tamanho = empresas pequenas

076 == xx se tamanho = empresas grandes

18 =x se for 2ª semana do mês

19 =x se for 3ª semana do mês

Semana do mês 110 =x se for 4ª semana do mês

111 =x se for 5ª semana do mês

0111098 ==== xxxx se for 1ª semana do mês

112 =x se ano for 2003

113 =x se ano for 2004

114 =x se ano for 2005

Ano 115 =x se ano for 2006

116 =x se ano for 2007

117 =x se ano for 2008

118 =x se ano for 2009

018171615141312 ======= xxxxxxx se ano for 2002

119 =x se mês for Outubro

120 =x se mês for Novembro

Mês do ano 121 =x se mês for Dezembro

122 =x se mês for Fevereiro

123 =x se mês for Março

124 =x se mês for Abril

125 =x se mês for Maio

Page 47: IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE …pro.poli.usp.br/wp-content/uploads/2012/pubs/identificacao-de... · IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE

47

126 =x se mês for Junho

Mês do ano 127 =x se mês for Julho

128 =x se mês for Agosto

129 =x se mês for Setembro

0... 2928212019 ====== xxxxx se mês for Janeiro

Neste trabalho, será considerado como modelo completo aquele que contém os efeitos

principais e as interações de segunda ordem. Este modelo é expresso como mostra a Equação

4.1.1:

+++= ∑∑∑

= >=

28

1

2929

1

expi

iij

jiiji

iioi exxxY βββ

Equação 4.1.1 – Modelo de previsão completo

Foram efetuados testes de hipótese: 0:0 =iH β onde i = 1,2,..,29 e 0:0 =ijH β onde i

= 1,2,..,28, j = 2,3,...,29 e i ≠ j, relativo aos parâmetros do modelo exposto na Equação 4.1.1.

Constatou-se que algumas interações não foram significativas, sendo o modelo da Equação

4.1.1 reduzido no modelo da Equação 4.1.2:

+++++= ∑∑∑∑∑∑∑∑

== == == ==

4

355

11

8

29

12

2

1

29

19

2

1

7

3

29

1

expi

iii j

jiiji j

jiiji j

jiiji

iioi xxxxxxxxxY ββββββ

Equação 4.1.2 – Modelo de previsão reduzido

Note que na Equação 4.1.2:

• ∑=

29

1iii xβ : refere-se aos efeitos principais;

• ∑∑= =

2

1

7

3i jjiij xxβ : refere-se às interações entre i) os ciclos e setores econômicos,

ii) os ciclos e super-setor e iii) os ciclos e tamanhos das empresas;

• ∑∑= =

2

1

29

19i jjiij xxβ : refere-se às interações entre os ciclos e os meses;

• ∑∑= =

11

8

29

12i jjiij xxβ : refere-se às interações entre i) as semanas e anos e ii) as

semanas e meses;

Page 48: IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE …pro.poli.usp.br/wp-content/uploads/2012/pubs/identificacao-de... · IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE

48

• ∑=

4

355

iii xxβ : refere-se às interações entre setores econômicos e super-setor.

A tabela com as estimativas dos parâmetros do modelo (Equação 4.1.2) é

relativamente extensa e não será reproduzida neste capítulo. No entanto, ela está no Anexo C.

Para melhor entendimento e interpretação dos resultados obtidos, serão consideradas

apenas as estimativas dos parâmetros de efeitos principais, apresentadas na Tabela 4.1.2.

Tabela 4.1.2 – Valores dos parâmetros βi do modelo de previsão reduzido

Critério de classificação

Covariável e definição Parâmetro

β0 -0.099485

Ciclo monetário

11 =x se ciclo = taxa de juros estável β1 -0.221265

12 =x se ciclo = subida de taxa de juros β2 -0.073917

Setor econômico

13 =x se setor for SII β3 -0.029927

14 =x se setor for SIII β4 -0.053791

Super-setor 15 =x se super-setor = crescimento β5 0.087393

Tamanho 16 =x se tamanho = empresas médias β6 0.016476

17 =x se tamanho = empresas pequenas β7 0.043408

18 =x se for 2ª semana do mês β8 -0.012198

Semana do mês

19 =x se for 3ª semana do mês β9 0.059443

110 =x se for 4ª semana do mês β10 0.024507

111 =x se for 5ª semana do mês β11 -0.131152

112 =x se ano for 2003 β12 0.327370

113 =x se ano for 2004 β13 0.247110

114 =x se ano for 2005 β14 0.386759

Ano 115 =x se ano for 2006 β15 0.179707

116 =x se ano for 2007 β16 0.233808

117 =x se ano for 2008 β17 0.294731

118 =x se ano for 2009 β18 0.496813

119 =x se mês for Outubro β19 0.023120

120 =x se mês for Novembro β20 -0.024696

Mês do ano 121 =x se mês for Dezembro β21 -0.028273

122 =x se mês for Fevereiro β22 0.017708

123 =x se mês for Março β23 0.077288

124 =x se mês for Abril β24 -0.024722

125 =x se mês for Maio β25 -0.069889

126 =x se mês for Junho β26 -0.125272

Page 49: IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE …pro.poli.usp.br/wp-content/uploads/2012/pubs/identificacao-de... · IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE

49

127 =x se mês for Julho β27 -0.009147

128 =x se mês for Agosto β28 -0.052485

129 =x se mês for Setembro β29 -0.011160

Para melhor entendimento da Equação 4.1.2, pode-se usar o seguinte exemplo. Se,

para uma estimativa, xi é nulo para todo i = 1,2,...,29, então o valor do retorno trimestral é

exp(-0,0994) igual a 0,9053. Este valor significa um retorno trimestral de -9,47% na situação

de corte de taxa de juros, no ano de 2002, no mês de janeiro, na primeira semana do mês, para

uma ação de uma empresa pertencente ao grupo de setores SI, ao super-setor defensivo e de

uma empresa de tamanho grande.

Se for modificado, em relação ao exemplo anterior, apenas o setor econômico e o

super-setor de SI para SIII e de Defensivo para Crescimento, ou seja, x4 =1 e x5 = 1, então a

estimativa de retorno médio segundo a Equação 4.1.2 será dada por:

( )545;455440exp xxxx ββββ +++

= exp[-0,0994+(-0,0538)+0,0874+(-0,0584)]

= exp[-0,1242]

= 0.8832

Este valor obtido equivale a um retorno trimestral médio de -11,68% na situação de

corte de taxa de juros, no ano de 2002, no mês de janeiro, na primeira semana do mês, para

uma ação de uma empresa pertencente ao grupo de setores SIII, ao super-setor de crescimento

e de uma empresa de tamanho grande.

Conclui-se que nas condições especificadas anteriormente (durante corte de taxa de

juros, na primeira semana do mês de janeiro, para empresas grandes), empresas do setor

econômico do grupo SI e que são defensivas têm um retorno esperado maior que as empresas

do setor econômico do grupo SIII e que são de crescimento.

Desta forma, podem-se obter todos os valores esperados para os retornos das ações a

partir da Equação 4.1.2 para então compará-los aos valores reais observados. Os pontos

estimados contra os pontos reais observados podem ser visualizados na Figura 4.1.1.

Page 50: IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE …pro.poli.usp.br/wp-content/uploads/2012/pubs/identificacao-de... · IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE

50

Figura 4.1.1 – Variáveis estimadas versus variáveis observadas

A seguir será feita uma interpretação das estimativas dos parâmetros βi. O modelo

reduzido (Equação 4.1.2) é composto por 136 parâmetros e para não tornar a análise muito

repetitiva escolheram-se alguns parâmetros considerados interessantes e que pudessem

contribuirr para um melhor entendimento do modelo de previsão.

Tabela 4.1.3 – Parâmetros estimados para períodos do ciclo monetário

Covariável e definição Parâmetro Estimativa do parâmetro

Pr (>|t|)

11 =x se ciclo = taxa de juros estável β1 -0.221265 < 2e-16 12 =x se ciclo = subida de taxa de juros β2 -0.073917 0.006491

Em relação aos períodos do ciclo monetário observa-se que os parâmetros para

períodos de subida de taxa de juros (x2) e de taxa de juros estável (x1) são, conforme a Tabela

4.1.3, negativos (-0,0739 e -0,2213 respectivamente), ou seja, em comparação ao período de

corte de taxa de juros o retorno da ação é reduzido de exp(-0,0739) = 0,9287 e exp(-0,2213).=

0,8015, o que significa que o desempenho das ações nestes períodos pode ser pior. Além

disso, os valores de p (conforme Tabela 4.1.3) são bem pequenos, isso mostra que estes

parâmetros são significativos.

É normal que em um ambiente de alta taxa de juros os investidores prefiram aumentar

a sua exposição em ativos atrelados à taxa de juros, como, por exemplo, os títulos de dívida

emitidos pelo governo, pois estes oferecem um alto retorno com relativamente baixo risco.

0

0,4

0,8

1,2

1,6

2

0,0 0,5 1,0 1,5 2,0 2,5Valor observado

Valor estimado

Page 51: IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE …pro.poli.usp.br/wp-content/uploads/2012/pubs/identificacao-de... · IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE

51

Quando a taxa de juros inicia um período de redução, os ativos atrelados a taxa de juros

oferecem menor retorno, e como os investidores têm uma meta de retorno e precisam garanti-

la, recorrem ao mercado de ações que oferece um maior retorno, porém com maior risco. Este

é um dos fatores que podem explicar os dois parâmetros negativos.

Além disso, como mencionado no início deste trabalho, uma taxa de juros baixa tem

como consequência incentivar o crédito às empresas, estimular a economia, além de causar

um impacto positivo no aumento de investimentos de longo prazo no país. Da mesma forma

que uma elevada taxa de juros faz com que os investimentos diretos diminuam e

consequentemente reduzam o crescimento da economia. Assim, em um ambiente de elevação

da taxa de juros as empresas tendem a investir menos e por isso a crescer menos. Oferecendo

menos crescimento e retorno ao acionista, os investidores analisam outros tipos de

investimento que o mercado de ações.

A estimativa do parâmetro referente ao período de taxa de juros estável é menor que o

parâmetro referente ao período de alta de taxa de juros. Uma explicação para este fato é que

todo período de taxa de juros estável está na iminência de aumento ou redução da taxa de

juros, principalmente no Brasil, onde são raros os momentos em que a taxa de juros

permanece constante sem pressão para reduzi-la ou aumentá-la. E como se sabe bem, o que os

investidores menos gostam no mercado de ações é a indefinição, o que pode explicar a

magnitude do valor do parâmetro obtido.

Tabela 4.1.4 - Parâmetros estimados para os tamanhos das empresas

Covariável e definição Parâmetro Estimativa do parâmetro

Pr (>|t|)

16 =x se tamanho = empresas médias β6 0.016476 0.021537 17 =x se tamanho = empresas pequenas β7 0.043408 5.82e-08

Em relação ao tamanho da empresa, as estimativas dos parâmetros para as pequenas e

médias empresas são positivos, conforme a Tabela 4.1.4: exp(0,0434) = 1,0444 e exp(0,0165)

= 1,0166 respectivamente; todos significativos. Assim, é esperado que ambos contribuam

positivamente para um retorno maior que o observado para as grandes empresas. Sabe-se que

empresas grandes oferecem menor risco de não honrarem as suas contas e de falirem; e como

quase tudo no mercado financeiro pode ser explicado pelo equilíbrio de risco-retorno, neste

caso não deixa de ser diferente. Empresas maiores, por possuírem menores riscos de não

Page 52: IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE …pro.poli.usp.br/wp-content/uploads/2012/pubs/identificacao-de... · IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE

52

cumprirem suas metas, são ativos menos arriscados e por isso oferecem em média menor

retorno que empresas médias e pequenas.

Tabela 4.1.5 - Parâmetros estimados para os anos das observações

Covariável e definição Parâmetro Estimativa do parâmetro

Pr (>|t|)

112 =x se ano for 2003 β12 0.327370 < 2e-16 113 =x se ano for 2004 β13 0.247110 < 2e-16 114 =x se ano for 2005 β14 0.386759 < 2e-16 115 =x se ano for 2006 β15 0.179707 < 2e-16 116 =x se ano for 2007 β16 0.233808 < 2e-16 117 =x se ano for 2008 β17 0.294731 < 2e-16 118 =x se ano for 2009 β18 0.496813 < 2e-16

Ao analisar as contribuições dos anos ao retorno, observa-se que as estimativas dos

parâmetros são positivas, conforme a Tabela 4.1.5. O ano tomado como referência é 2002,

ano em que ocorreram as eleições presidenciais em que o atual presidente Luis Inácio Lula da

Silva foi eleito. É de se esperar que os valores dos parâmetros dos outros anos sejam todos

positivos em relação a 2002. Ano de eleição é sempre um ano de indecisão em que o

investidor olha com cautela para o país. Em 2002, quando Lula começou a liderar as

pesquisas de intenção de voto, o investidor receoso do que poderia ocorrer com Lula

assumindo a presidência, retirou seus investimentos financeiros no país e consequentemente

os mercados despencaram.

A menor estimativa do parâmetro para os anos é o de 2006, também ano de eleição.

Embora em 2006 a reeleição de Lula já fosse o cenário mais provável, e mesmo os

investidores já conhecendo o perfil e o jeito de governar de Lula, eles continuaram cautelosos.

Como mencionado anteriormente, períodos de indecisão são sempre complicados para os

investidores.

Tabela 4.1.6 - Parâmetros estimados para os setores econômicos

Covariável e definição Parâmetro Estimativa do parâmetro

Pr (>|t|)

13 =x se setor for SII β3 -0.029927 0.007819 14 =x se setor for SIII β4 -0.053791 1.39e-07

Page 53: IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE …pro.poli.usp.br/wp-content/uploads/2012/pubs/identificacao-de... · IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE

53

Em relação aos setores econômicos, as estimativas dos parâmetros para as empresas

dos setores do grupo SII e do grupo SIII são negativos, conforme a Tabela 4.1.6: -0,0299 e -

0,0538 respectivamente, ou seja, em comparação aos setores do grupo SI o retorno da ação é

reduzido de exp(-0,0299) = 0,9705 e exp(-0,0538) = 0,9476. Lembrando-se, como definido no

capítulo 2, que o grupo SI inclui os setores de varejo, construção civil e infraestrutura,

logística e concessões, o grupo SII inclui os setores de bancos e instituições financeiras e de

alimentos, bebidas e tabaco e o grupo SIII inclui os setores de educação, saúde, utilidade

pública e telecomunicações.

Setores como o de utilidade pública e de telecomunicações apresentam menor

sensibilidade à variação da taxa de crescimento da economia do país. Como nos últimos 8

anos o Brasil apresentou um crescimento anual médio do PIB de 3,4%, é de se esperar que os

setores com maior sensibilidade à variação da taxa de crescimento do PIB tenham apresentado

maior crescimento de seus lucros neste período, como é o caso das empresas do setor de

varejo e de construção civil (que estão no grupo SI). Assim, comparado a setores menos

expostos a este crescimento, como é o caso de setores como o de utilidade pública, educação e

bebidas, alimentos e tabaco, os setores incluídos no grupo SI apresentaram maior crescimento

e, consequentemente, maior retorno de suas ações. Portanto, os dois coeficientes negativos

também são coerentes.

Tabela 4.1.7 - Parâmetros estimados para super-setores

Covariável e definição Parâmetro Estimativa do parâmetro

Pr (>|t|)

15 =x se super-setor = crescimento β5 0.087393 < 2e-16

Em relação ao parâmetro relacionado ao super-setor, pode-se interpretar do mesmo

modo como se procedeu para os parâmetros estimados dos setores econômicos. O PIB do

Brasil crescendo em média 3,4% ao ano, as empresas do tipo crescimento apresentarão maior

crescimento e, portanto, maiores retornos do que as empresas do tipo defensivas, como se

pode confirmar pela estimativa do parâmetro do super-setor de crescimento, conforme a

Tabela 4.1.7.

Page 54: IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE …pro.poli.usp.br/wp-content/uploads/2012/pubs/identificacao-de... · IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE

54

Tabela 4.1.8 - Parâmetros estimados para os meses das observações

Covariável e definição Parâmetro Estimativa do parâmetro

Pr (>|t|)

119 =x se mês for Outubro β19 0.023120 0.385605 120 =x se mês for Novembro β20 -0.024696 0.366069 121 =x se mês for Dezembro β21 -0.028273 0.297328 122 =x se mês for Fevereiro β22 0.017708 0.469441 123 =x se mês for Março β23 0.077288 0.001530 124 =x se mês for Abril β24 -0.024722 0.311363 125 =x se mês for Maio β25 -0.069889 0.003659 126 =x se mês for Junho β26 -0.125272 2.19e-07 127 =x se mês for Julho β27 -0.009147 0.702456 128 =x se mês for Agosto β28 -0.052485 0.026800 129 =x se mês for Setembro β29 -0.011160 0.663901

Conforme a Tabela 4.1.8, as estimativas dos parâmetros referentes aos meses são

positivos apenas para Fevereiro, Março e Outubro, ou seja, apenas estes 3 meses apresentam

em média retornos maiores que o mês de Janeiro. Isto implica que o primeiro trimestre do ano

apresenta um retorno médio maior que os outros períodos do ano. Além disso, embora alguns

dos parâmetros não tenham apresentado valores significativos, eles apresentaram uma

importante interação com a variável relacionada aos períodos do ciclo monetário (conforme a

Equação 4.1.2).

Tabela 4.1.9 - Parâmetros estimados para as interações entre os setores econômicos e os períodos do ciclo monetário

Covariável e definição Parâmetro Estimativa do parâmetro

Pr (>|t|)

11 =x se ciclo = taxa de juros estável &

13 =x se setor for SII β1;3 0.064206 9.64e-08

12 =x se ciclo = subida de taxa de juros &

13 =x se setor for SII β2;3 0.158902 < 2e-16

11 =x se ciclo = taxa de juros estável &

14 =x se setor for SIII β1;4 0.039554 0.002746

12 =x se ciclo = subida de taxa de juros &

14 =x se setor for SIII β2;4 0.189300 < 2e-16

Page 55: IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE …pro.poli.usp.br/wp-content/uploads/2012/pubs/identificacao-de... · IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE

55

Outros aspectos relativos aos parâmetros referem-se às interações entre setor

econômico e períodos do ciclo monetário (vide Tabela 4.1.9). As estimativas dos parâmetros

referentes ao período de subida da taxa de juros nos setores SII e SIII são elevados: 0,1589 e

0,1893 respectivamente, assim, em comparação aos setores do grupo SI no período de subida

de taxa de juros, estes dois grupos contribuem de forma a aumentar o retorno da ação de

exp(0,1589) = 1,1722 e exp(0,1893) = 1,2084 respectivamente. Lembrando-se que, conforme

definido no Capítulo 2, o grupo de setores SI inclui os setores de varejo, construção civil e

infraestrutura, logística e concessões.

Algumas breves análises das estimativas dos parâmetros que se acredita serem

pertinentes para este estudo foram feitas nesta seção. Outras informações, não abordadas nesta

seção, são possíveis de se obter analisando detalhadamente os resultados do Anexo C.

4.2 Verificação da qualidade do modelo de previsão

A fim de verificar a qualidade do modelo previsão definido, alguns indicadores foram

considerados:

• O nível de significância de cada um dos parâmetros estimados bi;

• O valor da deviance residual (se ela diminui em relação ao valor da deviance

nula);

• O valor do AIC.

No modelo final, a grande parte dos valores do nível de significância dos parâmetros βi

são inferiores ao nível de significância, como se pode observar no Anexo C.

Nota-se que, com exceção de categorias de Semana e de Mês, todos outros parâmetros

individuais possuem um nível de significância abaixo dos 5% e que, portanto os valores são

significantes para o modelo definido. Embora os valores dos níveis de significância (p) sejam

elevados para as covariáveis Mês e Semana, eles não foram excluídos do modelo de previsão,

pois possuem interações com os períodos do ciclo monetário que não podem ser descartados e

simplesmente ignorados. Além disso, retirá-los do modelo de previsão faz com que o valor da

deviance residual aumente significativamente. Estes valores relacionados à interação entre as

covariáveis podem ser vistos no Anexo C.

Page 56: IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE …pro.poli.usp.br/wp-content/uploads/2012/pubs/identificacao-de... · IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE

56

Como já mencionado anteriormente, a diferença entre a deviance nula e a deviance

residual foi observada a cada vez que se compilava os dados no software R. A diferença entre

dois valores deve ser a maior possível. Os valores obtidos para o modelo de previsão final

foram:

• Deviance do modelo nulo: 1990,06 – com 14934 graus de liberdade;

• Deviance do modelo final: 1191,94 – com 135 graus de liberdade; produzindo

• Deviance residual: 798,12 - com 14799 graus de liberdade

Outro indicador seria um coeficiente semelhante ao R2, denominado coeficiente de

determinação, dos modelos lineares, dado por [(1990,06 – 798,12)/1990,06] = 0,6.

O AIC é outra ferramenta utilizada para escolher o melhor modelo entre outros vários

modelos. Não é possível dizer se um modelo é bom ou não apenas analisando o seu AIC. O

que se pode afirmar observando o AIC é que ele é pior ou melhor em relação a um outro

modelo: o melhor modelo é aquele que possui menor valor do AIC.

O AIC observado para o modelo de previsão final foi de 20,59.

Segundo Myers, Montgomery e Vining (2002), para se obter um modelo de previsão

aderente, os valores dos resíduos padronizados devem estar entre -3 e 3; além disso, afirmam

que pontos fora deste intervalo devem ser analisados cuidadosamente e deve-se tentar

entender os motivos destes pontos estarem apresentando estas discrepâncias.

Na Figura 4.2.1 estão representados apenas um terço dos resíduos padronizados, os

outros dois gráficos dos resíduos estão no Anexo E.

Page 57: IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE …pro.poli.usp.br/wp-content/uploads/2012/pubs/identificacao-de... · IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE

57

Figura 4.2.1 – Resíduos padronizados (I)

Foram observados 14950 retornos trimestrais ao todo e apenas 3,6% deles não ficaram

dentro do intervalo de -2 a 2. Se o intervalo é estendido para -3 a 3, o valor passa para menos

de 1%.

Desta forma, também através da análise dos resíduos padronizados, o modelo de

previsão definido se mostra consistente.

4.3 Previsão para os próximos 3 meses

A partir do modelo de previsão definido, serão projetados retornos para alguns

cenários. Escolheu-se o retorno para os próximos três meses já que este modelo de previsão

pode ser definido como um modelo de curto/médio prazo. Desta forma, será considerado para

esta estimativa o ano de 2009 (ano mais recente analisado), o mês será junho, a semana será a

terceira do mês e o período do ciclo monetário será o período de subida, já que nas duas

últimas reuniões do COPOM (reuniões no fim de Abril de 2010 e no início de junho de 2010)

a taxa básica de juros aumentou em 0,5% e 0,75% respectivamente e ela ainda encontra-se

em tendência de subida até o final do ano de 2010 segundo as expectativas do mercado.

Em um primeiro momento, será calculado o retorno trimestral previsto para as

empresas pertencentes simultaneamente as seguintes categorias: i) Setor: SIII, ii) Super-setor:

defensivo e iii) Tamanho: grandes empresas.

-4

-3

-2

-1

0

1

2

3

4

5

0 1000 2000 3000 4000 5000Observações

Resíduo padronizado

Page 58: IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE …pro.poli.usp.br/wp-content/uploads/2012/pubs/identificacao-de... · IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE

58

Tabela 4.3.1 – Parâmetros considerados para o cálculo de previsão retorno trimestral (I)

Covariável e definição Parâmetro Estimativa do parâmetro

β0 -0,09949 12 =x se ciclo = subida de taxa de juros β2 -0,07392

14 =x se setor for SIII β4 -0,05379

19 =x se for 3ª semana do mês β9 0,05944

118 =x se ano for 2009 β18 0,49681

126 =x se mês for Junho β26 -0,12527

12 =x se ciclo = subida de taxa de juros &

14 =x se setor for SIII β2;4 0,18930

12 =x se ciclo = subida de taxa de juros &

126 =x se mês for Junho β2;26 -0,36600

19 =x se for 3ª semana do mês &

126 =x se mês for Junho β9;26 -0,02398

19 =x se for 3ª semana do mês &

118 =x se ano for 2009 β9;18 0,05539

A partir do modelo de previsão determinado anteriormente (Equação 4.1.2), chegou-se

a uma estimativa cujo valor é exp(0,058505) = 1,06025 que representa um retorno trimestral

médio positivo de 6,025% (com intervalo entre -9% e +24%).

Este valor do retorno é coerente com aquilo que foi analisado anteriormente: em

períodos de subida de taxa de juros, os retornos são mais baixos do que em períodos de corte

de juros e poderiam até ser negativos, como já discutido anteriormente. No entanto, como

neste caso trata-se de empresas defensivas, o efeito negativo da alta de juros é atenuado pelo

fato de empresas defensivas apresentarem melhores desempenhos em períodos de alta de taxa

de juros que empresas de crescimento. Além disso, os setores que compõem o grupo SIII são

setores menos expostos à variação do crescimento da economia, e isto contribuiu para que o

retorno trimestral fosse positivo.

Analisando um outro caso onde as categorias são : i) Setor: SI, ii) Super-setor:

crescimento e iii) Tamanho: pequenas empresas, e os outros parâmetros são os mesmos do

exemplo anterior, as variáveis são definidas como mostra a Tabela 4.3.2:

Page 59: IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE …pro.poli.usp.br/wp-content/uploads/2012/pubs/identificacao-de... · IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE

59

Tabela 4.3.2 – Parâmetros considerados para o cálculo de previsão retorno trimestral (II)

Covariável e definição Parâmetro Estimativa do parâmetro

β0 -0,0995 12 =x se ciclo = subida de taxa de juros β2 -0,0739

15 =x se super-setor = crescimento β5 0,0874

17 =x se tamanho = empresas pequenas β7 0,0434

19 =x se for 3ª semana do mês β9 0,0594

118 =x se ano for 2009 β18 0,4968

126 =x se mês for Junho β26 -0,1253

12 =x se ciclo = subida de taxa de juros &

15 =x se super-setor = crescimento

β2;5 -0,0948

12 =x se ciclo = subida de taxa de juros &

126 =x se mês for Junho

β2;26 -0,3660

12 =x se ciclo = subida de taxa de juros &

17 =x se tamanho = empresas pequenas

β2;7 -0,2036

19 =x se for 3ª semana do mês &

126 =x se mês for Junho

β9;26 -0,0240

19 =x se for 3ª semana do mês &

118 =x se ano for 2009

β9;18

0,0554

Neste segundo exemplo, chega-se ao valor de exp(-0,244571) = 0,7830 que representa

um retorno trimestral médio negativo de 21,7% (intervalo entre -33% a -8%).

Comparado ao exemplo anterior, este mostrou um retorno médio bem pior. Como

neste caso estão sendo consideradas empresas do Setor SI (Varejo, construção civil e

infraestrutura) e de crescimento, pode-se dizer que o resultado obtido é coerente, já que o

período considerado para esta previsão é o de subida de taxa de juros. Como discutido

anteriormente, empresas do setor SI e de crescimento são mais sensíveis às variações do

crescimento da economia do país e às mudanças da taxa de juros.

Pode-se concluir através deste exemplo que, em condições semelhantes, a escolha do

tipo de ação a ser investida é muito importante e que em cada circunstância, existe um tipo de

ação que apresentará um retorno maior. Neste caso, espera-se que nos próximos três meses, as

ações de empresas pertencentes ao grupo SIII (Utilidade pública, saúde, educação e

telecomunicações), que sejam do tipo defensivas e grandes, apresentem retornos

significativamente maiores que aquelas pertencentes ao grupo SI (varejo, construção civil e

infraestrutura) e que sejam do tipo de crescimento e pequenas (+5% contra -22%).

Page 60: IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE …pro.poli.usp.br/wp-content/uploads/2012/pubs/identificacao-de... · IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE

60

Page 61: IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE …pro.poli.usp.br/wp-content/uploads/2012/pubs/identificacao-de... · IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE

61

5. CONCLUSÕES

No intuito de se criar ferramentas mais simples que possam ajudar os analistas do

mercado financeiro a entender melhor a dinâmica dos papéis das empresas, buscou-se estudar

neste trabalho de formatura a influência que os diferentes períodos do ciclo monetário podem

ter no desempenho das ações.

Ao invés de estudar o comportamento dos papéis individualmente, as ações foram

analisadas em conjunto de forma a identificar tendências comuns entre elas. Assim, criou-se

um modelo de previsão para um grupo de 72 ações a fim de determinar o valor médio do

retorno das ações de acordo com algumas características definidas: setores econômicos,

super-setor e tamanho da empresa.

Um dos fatores incluído do modelo de previsão, os períodos do ciclo monetário,

mostrou-se pertinente para o modelo de previsão e apresentou interações significativas com as

características definidas. Pôde-se obter tal resultado, pois o modelo de previsão construído

além de considerar os efeitos principais também considerou as interações de segunda ordem.

Os parâmetros estimados para o modelo de previsão referente aos períodos do ciclo

monetário mostraram-se significativos e condizentes com o que se esperava intuitivamente.

No modelo, o parâmetro referente ao período de aumento da taxa de juros diminui o retorno

médio esperado em relação ao período de redução da taxa de juros, o que era o esperado pois,

num ambiente de aumento da taxa de juros os investidores devem preferir aumentar a sua

exposição em ativos atrelados aos juros e não ao mercado de ações. Por outro lado, quando a

taxa de juros inicia um período de redução, os ativos atrelados a ela oferecem menor retorno,

e assim, os investidores recorrem ao mercado de ações que pode oferecer um retorno maior.

Um fato interessante observado e, em um primeiro momento, não intuitivo, foi a

influência dos meses no valor do retorno médio esperado. Verificou-se que o primeiro

trimestre do ano apresenta retorno médio esperado maior que os outros períodos do ano.

Tentando procurar uma explicação para tal fato, chegou-se a conclusão de que como no início

do ano a maior parte dos fundos de investimento definem suas metas para o ano, buscando no

mercado novas oportunidades de investimento e refazendo posições desfeitas no final do ano

anterior, o mercado de ações apresenta retornos maiores que no resto do ano. As posições

desfeitas se devem ao que é chamado no mercado de “realização de lucro”, ou seja, ao possuir

um ativo que se valorizou ao longo do ano, no final deste, para reconhecer o ganho ao

Page 62: IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE …pro.poli.usp.br/wp-content/uploads/2012/pubs/identificacao-de... · IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE

62

desempenho anual, vende-se o ativo; este movimento em massa faz com que o mercado

apresente uma tendência de queda.

Enfim, através do modelo de previsão definido, foram calculadas duas previsões para

os próximos três meses. Para cada previsão foi considerado um grupo de ações diferente. O

resultado obtido foi coerente e mostrou como que em condições semelhantes os retornos

obtidos podem ser muito diferentes de acordo com as características da ação escolhida e o

quão importante é o processo de escolha do tipo de ação a ser investida de acordo com a

situação considerada.

Os resultados obtidos neste estudo foram portanto coerentes e satisfatórios. Desse

modo, espera-se que o método utilizado para definir o modelo de previsão deste trabalho não

se restrinja apenas aos fatores aqui apresentados e possa servir de base para estudos de

influência de outros fatores no desempenho das ações das empresas.

Page 63: IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE …pro.poli.usp.br/wp-content/uploads/2012/pubs/identificacao-de... · IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE

63

6. REFERÊNCIAS BIBLIOGRÁFICAS

MANKIW, N. Gregory. Princípios de Macroeconomia. 3ª ed. São Paulo : Pioneira Thomson Learning, 2005.

PINHO, D. Benevides, VASCONCELLOS M.A.S et al. Manual de Economia. 5ª.ed. São Paulo: Editora Saraiva, 2007.

DRAPER, N.R.; SMITH, H. Applied Regression Analysis. 3ª ed. New York: Wiley, 1998.

BANCO CENTRAL DO BRASIL. Disponível em<www.bcb.gov.br/?copom> – Consulta em 14.02.2010.

MCCULLOCH, C.E.; SEARLE, S.R.; NEUHAUS J.M. Generalized, linear, and mixed models. 2a ed. Hoboken, N.J.: Wiley, 2008.

MCCULLAGH, P.; NELDER, J.A.. Generalized linear models. 2a ed. London, New York: Chapman & Hall, 1989.

MYERS, R.H.; MONTGOMERY, D.C.; VINING, G.G. Generalized linear models – with application in engineering and the sciences. New York: Wiley, 2002.

KASS, G.V. Significance testing in automatic interaction detection (A.I.D.). University of the Witwatersrand, 1974. Disponível em <http://mephisto.unige.ch/pub/publications/early_trees/kass_AIDtesting_Applied_stat75.pdf>.

SONQUIST, J.A; BAKER, E.I.; MORGAN, J.N. Searching for structure. Ann Arbor, Survey Research Center, 1973.

DEMIDENKO, E. Mixed models: theory and applications. Hoboken, N.J., Wiley - Interscience, 2004.

VONESH, E.F.; CHINCHILLI, V.M. Linear and nonlinear models for the analysis of repeated measurements. New York: M.Dekker, 1997.

ZEGER, S.L.; LIANG, K.Y.; DIGGLE, P. Analysis of longitudinal data. Oxford: Clarendon Press, 1994.

SINGER, J.M.; PAULINO, C.D. Análise de dados categorizados. 1ª ed. São Paulo: Edgard Blücher, 2006.

HAIR, J.H et al. Multivariate data analysis. 5ª ed. Upper Saddle River, N.J.: Prentice-Hall, 1998.

Page 64: IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE …pro.poli.usp.br/wp-content/uploads/2012/pubs/identificacao-de... · IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE

64

Page 65: IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE …pro.poli.usp.br/wp-content/uploads/2012/pubs/identificacao-de... · IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE

65

ANEXOS

Anexo A - Empresas escolhidas para a realização do trabalho

Empresa Super-setor Setor Tamanho

JBS Defensivo Alimentos, Bebidas e Tabaco Médio

TIM Part. Crescimento Telecomunicações Médio

Tractebel Defensivo Utilidade pública Médio

Dasa Defensivo Saúde Médio

Localiza Crescimento Infraestrutura, Logística e Concessões Médio

Marfrig Defensivo Alimentos, Bebidas e Tabaco Médio

Brasil Malls Crescimento Construção civil e Engenharia Médio

Construtora Tenda Crescimento Construção civil e Engenharia Médio

Banrisul Crescimento Bancos e Instituições Financeiras Médio

Abyara Crescimento Construção civil e Engenharia Médio

Agra Crescimento Construção civil e Engenharia Médio

Brookfield Crescimento Construção civil e Engenharia Médio

Sul America Crescimento Bancos e Instituições Financeiras Médio

Log-in Logistica Defensivo Infraestrutura, Logística e Concessões Pequeno

Obrascon Duarte Defensivo Infraestrutura, Logística e Concessões Pequeno

Amil Defensivo Saúde Médio

JHSF Participações Crescimento Construção civil e Engenharia Médio

Klabin Segall SA Crescimento Construção civil e Engenharia Médio

Banco Industrial e Comercial Crescimento Bancos e Instituições Financeiras Pequeno

American Banknote SA Crescimento Bancos e Instituições Financeiras Pequeno

Multiplan Crescimento Construção civil e Engenharia Médio

Estácio Participações Sa Defensivo Educação Pequeno

Odontoprev Defensivo Saúde Pequeno

Panamericano Crescimento Bancos e Instituições Financeiras Médio

Tegma Defensivo Infraestrutura, Logística e Concessões Pequeno

EZ TEC Empreendimentos Crescimento Construção civil e Engenharia Pequeno

Anhanguera Educacional Participações SADefensivo Educação Pequeno

Lopes Consultoria de Imoveis Crescimento Construção civil e Engenharia Pequeno

Medial Defensivo Saúde Médio

Camargo Correa Crescimento Construção civil e Engenharia Pequeno

Iguatemi Crescimento Construção civil e Engenharia Médio

Kroton Educacional SA Defensivo Educação Pequeno

Rodobens Crescimento Construção civil e Engenharia Pequeno

Even Crescimento Construção civil e Engenharia Médio

Banco ABC Brasil Crescimento Bancos e Instituições Financeiras Pequeno

Banco Daycoval Crescimento Bancos e Instituições Financeiras Pequeno

Santos BRP Defensivo Infraestrutura, Logística e Concessões Pequeno

Cyrela Commercial properties Crescimento Construção civil e Engenharia Pequeno

São Carlos Crescimento Construção civil e Engenharia Pequeno

Tecnisa Crescimento Construção civil e Engenharia Pequeno

General Shopping Brasil SA Crescimento Construção civil e Engenharia Pequeno

Banco Sofisa Crescimento Bancos e Instituições Financeiras Pequeno

João Fortes Engenharia Crescimento Construção civil e Engenharia Pequeno

Triunfo Defensivo Infraestrutura, Logística e Concessões Pequeno

Banco Indusval Crescimento Bancos e Instituições Financeiras Pequeno

Page 66: IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE …pro.poli.usp.br/wp-content/uploads/2012/pubs/identificacao-de... · IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE

66

Empresa Super-setor Setor Tamanho

Itau Unibanco Crescimento Bancos e Instituições Financeiras Grande

Bradesco Crescimento Bancos e Instituições Financeiras Grande

Ambev Defensivo Alimentos, Bebidas e Tabaco Grande

Cemig Defensivo Utilidade pública Grande

Tele Norte Leste Defensivo Telecomunicações Grande

Vivo Crescimento Telecomunicações Grande

Perdigao Defensivo Alimentos, Bebidas e Tabaco Grande

Banco do Brasil Crescimento Bancos e Instituições Financeiras Grande

Gafisa Crescimento Construção civil e Engenharia Grande

Cyrela Crescimento Construção civil e Engenharia Grande

ALL Crescimento Infraestrutura, Logística e Concessões Grande

CBD Defensivo Varejo Grande

Copel Defensivo Utilidade pública Grande

CPFL Defensivo Utilidade pública Grande

Renner Crescimento Varejo Grande

Cesp Defensivo Utilidade pública Grande

MRV Crescimento Construção civil e Engenharia Grande

PDG Realty Crescimento Construção civil e Engenharia Grande

Americanas Crescimento Varejo Grande

Eletropaulo Defensivo Utilidade pública Médio

LLX Crescimento Infraestrutura, Logística e Concessões Grande

Eletrobras Defensivo Utilidade pública Médio

B2W Crescimento Varejo Grande

CCR Defensivo Infraestrutura, Logística e Concessões Grande

Souza Cruz Defensivo Alimentos, Bebidas e Tabaco Médio

GVT Crescimento Telecomunicações Grande

Rossi Crescimento Construção civil e Engenharia Grande

Page 67: IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE …pro.poli.usp.br/wp-content/uploads/2012/pubs/identificacao-de... · IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE

67

Anexo B - Resultados da aplicação do método A.I.D. para agrupar setores semelhantes

Primeira iteração: G1 a G9.

G1 / G2-G9ANOVA: um fator

Relatório detalhadoGrupos Tamanho da amostra Soma Média VariânciaColuna 1 393 12,75470334 0,032454716 0,008275424Coluna 2 2651 0,731448669 0,000275914 0,017813048

ANOVAFonte de variações Soma dos quadrados GL Média dos quadrados F Probabilidade V crítico de FIntergrupo 0,354402978 1 0,354402978 21,37016828 3,94383E-06 3,844517334Intragrupo 50,44854331 3042 0,016584005

Total 50,80294629 3043

G1-G2/G3-G9ANOVA: um fator

Relatório detalhadoGrupos Tamanho da amostra Soma Média VariânciaColuna 1 786 24,82605432 0,031585311 0,030680029Coluna 2 2258 -11,33990231 -0,0050221 0,011492151

ANOVAFonte de variações Soma dos quadrados GL Média dos quadrados F Probabilidade V crítico de FIntergrupo 0,781339657 1 0,781339657 47,51617144 6,60542E-12 3,844517334Intragrupo 50,02160663 3042 0,016443658

Total 50,80294629 3043

G1-G3/G4-G9ANOVA: um fator

Relatório detalhadoGrupos Tamanho da amostra Soma Média VariânciaColuna 1 1109 34,44529264 0,031059777 0,028092101Coluna 2 1935 -20,95914064 -0,010831597 0,009534521

ANOVAFonte de variações Soma dos quadrados GL Média dos quadrados F Probabilidade V crítico de FIntergrupo 1,237134965 1 1,237134965 75,92662082 4,74964E-18 3,844517334Intragrupo 49,56581133 3042 0,016293824

Total 50,80294629 3043

G1-G4/G5-G9ANOVA: um fator

Relatório detalhadoGrupos Tamanho da amostra Soma Média VariânciaColuna 1 1502 34,71724237 0,02311401 0,021105415Coluna 2 1542 -21,23109036 -0,013768541 0,011738281

ANOVAFonte de variações Soma dos quadrados GL Média dos quadrados F Probabilidade V crítico de FIntergrupo 1,0350267 1 1,0350267 63,26467429 2,52544E-15 3,844517334Intragrupo 49,76791959 3042 0,016360263

Total 50,80294629 3043

Page 68: IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE …pro.poli.usp.br/wp-content/uploads/2012/pubs/identificacao-de... · IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE

68

G1-G5/G6-G9ANOVA: um fator

Relatório detalhadoGrupos Tamanho da amostra Soma Média VariânciaColuna 1 1895 33,85403195 0,017864925 0,018126656Coluna 2 1149 -20,36787994 -0,017726614 0,013558325

ANOVAFonte de variações Soma dos quadrados GL Média dos quadrados F Probabilidade V crítico de FIntergrupo 0,906104167 1 0,906104167 55,24134913 1,37803E-13 3,844517334Intragrupo 49,89684212 3042 0,016402644

Total 50,80294629 3043

G1-G6/G7-G9ANOVA: um fator

Relatório detalhadoGrupos Tamanho da amostra Soma Média VariânciaColuna 1 2137 30,99594365 0,014504419 0,017437067Coluna 2 907 -17,50979164 -0,019305173 0,014160611

ANOVAFonte de variações Soma dos quadrados GL Média dos quadrados F Probabilidade V crítico de FIntergrupo 0,727858598 1 0,727858598 44,21651475 3,47175E-11 3,844517334Intragrupo 50,07508769 3042 0,016461239

Total 50,80294629 3043

G1-G7/G8-G9ANOVA: um fator

Relatório detalhadoGrupos Tamanho da amostra Soma Média VariânciaColuna 1 2530 24,92367999 0,009851257 0,016033411Coluna 2 514 -11,43752798 -0,022252 0,019130918

ANOVAFonte de variações Soma dos quadrados GL Média dos quadrados F Probabilidade V crítico de FIntergrupo 0,440288336 1 0,440288336 26,59425001 2,67064E-07 3,844517334Intragrupo 50,36265795 3042 0,016555772

Total 50,80294629 3043

G1-G8/G9ANOVA: um fator

Relatório detalhadoGrupos Tamanho da amostra Soma Média VariânciaColuna 1 2923 16,44979264 0,005627709 0,016592541Coluna 2 121 -2,963640628 -0,024492898 0,018451062

ANOVAFonte de variações Soma dos quadrados GL Média dos quadrados F Probabilidade V crítico de FIntergrupo 0,105413677 1 0,105413677 6,325128436 0,011955048 3,844517334Intragrupo 50,69753261 3042 0,016665856

Total 50,80294629 3043

Page 69: IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE …pro.poli.usp.br/wp-content/uploads/2012/pubs/identificacao-de... · IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE

69

Segunda iteração: G1 a G3

Segunda iteração: G4 a G9

G1/G2-G3ANOVA: um fator

Relatório detalhadoGrupos Tamanho da amostra Soma Média VariânciaColuna 1 393 12,75470334 0,032454716 0,008275424Coluna 2 716 21,6905893 0,030294119 0,038994261

ANOVAFonte de variações Soma dos quadrados GL Média dos quadrados F Probabilidade V crítico de FIntergrupo 0,001184463 1 0,001184463 0,042127106 0,837415409 3,84987258Intragrupo 31,12486324 1107 0,028116408

Total 31,1260477 1108

G1-G2/G3ANOVA: um fator

Relatório detalhadoGrupos Tamanho da amostra Soma Média VariânciaColuna 1 716 22,37394166 0,031248522 0,014387012Coluna 2 393 12,07135098 0,030715906 0,053161383

ANOVAFonte de variações Soma dos quadrados GL Média dos quadrados F Probabilidade V crítico de FIntergrupo 7,19785E-05 1 7,19785E-05 0,002559925 0,959656817 3,84987258Intragrupo 31,12597572 1107 0,028117413

Total 31,1260477 1108

G4/G5-G9ANOVA: um fator

Relatório detalhadoGrupos Tamanho da amostra Soma Média VariânciaColuna 1 393 0,271949724 0,000691984 0,00072853Coluna 2 1542 -21,23109036 -0,013768541 0,011738281

ANOVAFonte de variações Soma dos quadrados GL Média dos quadrados F Probabilidade V crítico de FIntergrupo 0,065488355 1 0,065488355 6,8894685 0,008738814 3,84627382Intragrupo 18,37427527 1933 0,009505574

Total 18,43976362 1934

G4-G5/G6-G9ANOVA: um fator

Relatório detalhadoGrupos Tamanho da amostra Soma Média VariânciaColuna 1 786 -0,591260697 -0,00075224 0,003490866Coluna 2 1149 -20,36787994 -0,017726614 0,013558325

ANOVAFonte de variações Soma dos quadrados GL Média dos quadrados F Probabilidade V crítico de FIntergrupo 0,134477354 1 0,134477354 14,20052774 0,00016925 3,84627382Intragrupo 18,30528627 1933 0,009469884

Total 18,43976362 1934

Page 70: IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE …pro.poli.usp.br/wp-content/uploads/2012/pubs/identificacao-de... · IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE

70

Terceira iteração: G4 a G5

G4-G6/G7-G9ANOVA: um fator

Relatório detalhadoGrupos Tamanho da amostra Soma Média VariânciaColuna 1 1028 -3,449348993 -0,003355398 0,005343396Coluna 2 907 -17,50979164 -0,019305173 0,014160611

ANOVAFonte de variações Soma dos quadrados GL Média dos quadrados F Probabilidade V crítico de FIntergrupo 0,12258252 1 0,12258252 12,93605224 0,000330408 3,84627382Intragrupo 18,3171811 1933 0,009476038

Total 18,43976362 1934

G4-G7/G8-G9ANOVA: um fator

Relatório detalhadoGrupos Tamanho da amostra Soma Média VariânciaColuna 1 1421 -9,521612651 -0,006700642 0,006010081Coluna 2 514 -11,43752798 -0,022252 0,019130918

ANOVAFonte de variações Soma dos quadrados GL Média dos quadrados F Probabilidade V crítico de FIntergrupo 0,091287823 1 0,091287823 9,617112807 0,00195556 3,84627382Intragrupo 18,3484758 1933 0,009492228

Total 18,43976362 1934

G4-G8/G9ANOVA: um fator

Relatório detalhadoGrupos Tamanho da amostra Soma Média VariânciaColuna 1 1814 -17,99550001 -0,009920342 0,00893632Coluna 2 121 -2,963640628 -0,024492898 0,018451062

ANOVAFonte de variações Soma dos quadrados GL Média dos quadrados F Probabilidade V crítico de FIntergrupo 0,024088688 1 0,024088688 2,528467413 0,111972289 3,84627382Intragrupo 18,41567494 1933 0,009526992

Total 18,43976362 1934

G4/G5ANOVA: um fator

Relatório detalhadoGrupos Tamanho da amostra Soma Média VariânciaColuna 1 393 0,271949724 0,000691984 0,00072853Coluna 2 393 -0,863210421 -0,002196464 0,006257924

ANOVAFonte de variações Soma dos quadrados GL Média dos quadrados F Probabilidade V crítico de FIntergrupo 0,001639426 1 0,001639426 0,469315471 0,49350474 3,853346999Intragrupo 2,738690245 784 0,003493227

Total 2,740329671 785

Page 71: IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE …pro.poli.usp.br/wp-content/uploads/2012/pubs/identificacao-de... · IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE

71

Terceira iteração: G6 a G9

G6/G7-G9ANOVA: um fator

Relatório detalhadoGrupos Tamanho da amostra Soma Média VariânciaColuna 1 242 -2,858088296 -0,011810282 0,011305861Coluna 2 907 -17,50979164 -0,019305173 0,014160611

ANOVAFonte de variações Soma dos quadrados GL Média dos quadrados F Probabilidade V crítico de FIntergrupo 0,010730827 1 0,010730827 0,791312866 0,373889967 3,849578695Intragrupo 15,55422577 1147 0,01356079

Total 15,5649566 1148

G6-G7/G8-G9ANOVA: um fator

Relatório detalhadoGrupos Tamanho da amostra Soma Média VariânciaColuna 1 635 -8,930351953 -0,014063546 0,009040613Coluna 2 514 -11,43752798 -0,022252 0,019130918

ANOVAFonte de variações Soma dos quadrados GL Média dos quadrados F Probabilidade V crítico de FIntergrupo 0,019046738 1 0,019046738 1,405296199 0,236084357 3,849578695Intragrupo 15,54590986 1147 0,01355354

Total 15,5649566 1148

G6-G8/G9ANOVA: um fator

Relatório detalhadoGrupos Tamanho da amostra Soma Média VariânciaColuna 1 1028 -17,40423931 -0,016930194 0,012993805Coluna 2 121 -2,963640628 -0,024492898 0,018451062

ANOVAFonte de variações Soma dos quadrados GL Média dos quadrados F Probabilidade V crítico de FIntergrupo 0,006191739 1 0,006191739 0,456458131 0,499420124 3,849578695Intragrupo 15,55876486 1147 0,013564747

Total 15,5649566 1148

Page 72: IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE …pro.poli.usp.br/wp-content/uploads/2012/pubs/identificacao-de... · IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE

72

Anexo C - Síntese dos resultados obtidos no software R

Call: glm(formula = Y ~ Ciclo + Setorr + Ssetor + Tam + Ciclo * Setorr +

Ciclo * Ssetor + Ciclo * Tam + Ssetor * Setorr + Semana + Ano + Mes + Ciclo * Mes +

Mes * Semana + Semana * Ano, family = Gamma(link = log), data = dados)

Deviance Residuals:

Min 1Q Median 3Q Max

-1.44361 -0.14991 -0.02497 0.10534 2.01213

Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) -0.099485 0.025812 -3.854 0.000117 *** CicloEstavel -0.221265 0.021126 -10.474 < 2e-16 *** CicloSubida -0.073917 0.027153 -2.722 0.006491 ** SetorrSII -0.029927 0.011250 -2.660 0.007819 ** SetorrSIII -0.053791 0.010208 -5.270 1.39e-07 *** SsetorGR 0.087393 0.009156 9.545 < 2e-16 *** TamMC 0.016476 0.007168 2.299 0.021537 * TamSC 0.043408 0.007998 5.427 5.82e-08 *** SemanaS2 -0.012198 0.030811 -0.396 0.692187 SemanaS3 0.059443 0.030812 1.929 0.053718 . SemanaS4 0.024507 0.031033 0.790 0.429704 SemanaS5 -0.131152 0.051157 -2.564 0.010365 * AnoA2003 0.327370 0.024144 13.559 < 2e-16 *** AnoA2004 0.247110 0.024013 10.291 < 2e-16 *** AnoA2005 0.386759 0.023374 16.547 < 2e-16 *** AnoA2006 0.179707 0.021273 8.448 < 2e-16 *** AnoA2007 0.233808 0.019604 11.927 < 2e-16 *** AnoA2008 0.294731 0.020654 14.270 < 2e-16 *** AnoA2009 0.496813 0.020138 24.671 < 2e-16 *** MesM10 0.023120 0.026647 0.868 0.385605 MesM11 -0.024696 0.027322 -0.904 0.366069 MesM12 -0.028273 0.027128 -1.042 0.297328 MesM2 0.017708 0.024479 0.723 0.469441 MesM3 0.077288 0.024385 3.170 0.001530 ** MesM4 -0.024722 0.024419 -1.012 0.311363 MesM5 -0.069889 0.024044 -2.907 0.003659 ** MesM6 -0.125272 0.024160 -5.185 2.19e-07 *** MesM7 -0.009147 0.023944 -0.382 0.702456 MesM8 -0.052485 0.023699 -2.215 0.026800 * MesM9 -0.011160 0.025681 -0.435 0.663901 CicloEstavel:SetorrSII 0.064206 0.012032 5.336 9.64e-08 *** CicloSubida:SetorrSII 0.158902 0.013533 11.742 < 2e-16 *** CicloEstavel:SetorrSIII 0.039554 0.013205 2.995 0.002746 ** CicloSubida:SetorrSIII 0.189300 0.014901 12.704 < 2e-16 ***

Page 73: IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE …pro.poli.usp.br/wp-content/uploads/2012/pubs/identificacao-de... · IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE

73

Coefficients: Estimate Std. Error t value Pr(>|t|) CicloEstavel:SsetorGR -0.070230 0.011022 -6.372 1.92e-10 *** CicloSubida:SsetorGR -0.094764 0.012432 -7.623 2.63e-14 *** CicloEstavel:TamMC -0.037762 0.011409 -3.310 0.000935 *** CicloSubida:TamMC -0.157112 0.012831 -12.244 < 2e-16 *** CicloEstavel:TamSC -0.102465 0.012502 -8.196 2.69e-16 *** CicloSubida:TamSC -0.203604 0.014034 -14.508 < 2e-16 *** SetorrSII:SsetorGR -0.058936 0.011747 -5.017 5.30e-07 *** SetorrSIII:SsetorGR -0.058395 0.011910 -4.903 9.53e-07 *** CicloEstavel:MesM10 -0.110152 0.028102 -3.920 8.91e-05 *** CicloSubida:MesM10 -0.134267 0.031596 -4.249 2.16e-05 *** CicloEstavel:MesM11 0.047460 0.025025 1.897 0.057909 . CicloSubida:MesM11 0.069501 0.035312 1.968 0.049068 * CicloEstavel:MesM12 0.098692 0.024957 3.954 7.71e-05 *** CicloSubida:MesM12 0.095159 0.034697 2.743 0.006103 ** CicloEstavel:MesM2 0.103190 0.023630 4.367 1.27e-05 *** CicloSubida:MesM2 0.073972 0.031071 2.381 0.017291 * CicloEstavel:MesM3 0.109791 0.022947 4.785 1.73e-06 *** CicloSubida:MesM3 -0.091417 0.036169 -2.527 0.011499 * CicloEstavel:MesM4 0.121539 0.024580 4.945 7.71e-07 *** CicloSubida:MesM4 0.019274 0.030086 0.641 0.521776 CicloEstavel:MesM5 0.264946 0.026202 10.112 < 2e-16 *** CicloSubida:MesM5 -0.097924 0.028675 -3.415 0.000640 *** CicloEstavel:MesM6 0.347973 0.025755 13.511 < 2e-16 *** CicloSubida:MesM6 -0.366004 0.030398 -12.040 < 2e-16 *** CicloEstavel:MesM7 0.328478 0.024981 13.149 < 2e-16 *** CicloSubida:MesM7 -0.895471 0.030240 -29.612 < 2e-16 *** CicloEstavel:MesM8 0.309630 0.027413 11.295 < 2e-16 *** CicloSubida:MesM8 -1.018005 0.030244 -33.660 < 2e-16 *** CicloEstavel:MesM9 0.151757 0.026481 5.731 1.02e-08 *** CicloSubida:MesM9 -0.784578 0.032052 -24.478 < 2e-16 *** SemanaS2:MesM10 0.155262 0.030422 5.104 3.37e-07 *** SemanaS3:MesM10 0.027878 0.030467 0.915 0.360190 SemanaS4:MesM10 0.069418 0.030698 2.261 0.023755 * SemanaS5:MesM10 0.021447 0.045755 0.469 0.639263 SemanaS2:MesM11 0.037969 0.030321 1.252 0.210505 SemanaS3:MesM11 0.024393 0.030303 0.805 0.420845 SemanaS4:MesM11 0.025630 0.030545 0.839 0.401426 SemanaS5:MesM11 0.143312 0.054584 2.626 0.008660 ** SemanaS2:MesM12 0.003404 0.030208 0.113 0.910291 SemanaS3:MesM12 -0.047703 0.030218 -1.579 0.114443 SemanaS4:MesM12 -0.014031 0.030490 -0.460 0.645394 SemanaS5:MesM12 0.028528 0.050829 0.561 0.574629 SemanaS2:MesM2 0.001406 0.029234 0.048 0.961646 SemanaS3:MesM2 -0.047367 0.029196 -1.622 0.104747 SemanaS4:MesM2 -0.026247 0.029531 -0.889 0.374134 SemanaS5:MesM2 0.046520 0.053519 0.869 0.384734 SemanaS2:MesM3 -0.002636 0.029160 -0.090 0.927963 SemanaS3:MesM3 -0.093057 0.029135 -3.194 0.001406 **

Page 74: IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE …pro.poli.usp.br/wp-content/uploads/2012/pubs/identificacao-de... · IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE

74

SemanaS4:MesM3 -0.074220 0.029457 -2.520 0.011760 * SemanaS5:MesM3 -0.039176 0.052445 -0.747 0.455076 SemanaS2:MesM4 -0.004514 0.029007 -0.156 0.876344 SemanaS3:MesM4 -0.074772 0.029512 -2.534 0.011299 * SemanaS4:MesM4 -0.065992 0.029807 -2.214 0.026844 * SemanaS5:MesM4 0.080563 0.056537 1.425 0.154192 SemanaS2:MesM5 0.008660 0.028904 0.300 0.764465 SemanaS3:MesM5 -0.126501 0.028938 -4.371 1.24e-05 *** SemanaS4:MesM5 -0.081116 0.029257 -2.773 0.005570 ** SemanaS5:MesM5 -0.062062 0.039065 -1.589 0.112158 SemanaS2:MesM6 0.038792 0.028881 1.343 0.179235 SemanaS3:MesM6 -0.023976 0.028868 -0.831 0.406249 SemanaS4:MesM6 -0.021920 0.029180 -0.751 0.452554 SemanaS5:MesM6 0.100949 0.054122 1.865 0.062172 . SemanaS2:MesM7 -0.057758 0.028730 -2.010 0.044411 * SemanaS3:MesM7 -0.122572 0.028676 -4.274 1.93e-05 *** SemanaS4:MesM7 -0.116260 0.028971 -4.013 6.02e-05 *** SemanaS5:MesM7 -0.102732 0.040380 -2.544 0.010965 * SemanaS2:MesM8 0.039591 0.028475 1.390 0.164437 SemanaS3:MesM8 0.045354 0.029614 1.531 0.125671 SemanaS4:MesM8 -0.007721 0.029890 -0.258 0.796157 SemanaS5:MesM8 0.089740 0.044925 1.998 0.045787 * SemanaS2:MesM9 0.060320 0.030965 1.948 0.051431 . SemanaS3:MesM9 0.002418 0.030975 0.078 0.937770 SemanaS4:MesM9 0.148746 0.030945 4.807 1.55e-06 *** SemanaS5:MesM9 0.128142 0.056993 2.248 0.024567 * SemanaS2:AnoA2003 -0.009162 0.032609 -0.281 0.778744 SemanaS3:AnoA2003 -0.031199 0.032631 -0.956 0.339033 SemanaS4:AnoA2003 0.001948 0.032707 0.060 0.952501 SemanaS5:AnoA2003 0.140934 0.050400 2.796 0.005176 ** SemanaS2:AnoA2004 -0.028200 0.032347 -0.872 0.383325 SemanaS3:AnoA2004 -0.028176 0.032354 -0.871 0.383845 SemanaS4:AnoA2004 0.060684 0.032392 1.873 0.061030 . SemanaS5:AnoA2004 0.129771 0.052045 2.493 0.012662 * SemanaS2:AnoA2005 -0.014284 0.030865 -0.463 0.643512 SemanaS3:AnoA2005 -0.030251 0.030940 -0.978 0.328215 SemanaS4:AnoA2005 -0.026087 0.030990 -0.842 0.399922 SemanaS5:AnoA2005 0.027836 0.053848 0.517 0.605214 SemanaS2:AnoA2006 -0.012036 0.029673 -0.406 0.685018 SemanaS3:AnoA2006 -0.028495 0.029692 -0.960 0.337224 SemanaS4:AnoA2006 -0.013691 0.029655 -0.462 0.644319 SemanaS5:AnoA2006 0.069488 0.048244 1.440 0.149789 SemanaS2:AnoA2007 -0.017069 0.027124 -0.629 0.529173 SemanaS3:AnoA2007 -0.041404 0.027133 -1.526 0.127036 SemanaS4:AnoA2007 -0.034196 0.027112 -1.261 0.207218 SemanaS5:AnoA2007 0.079660 0.039739 2.005 0.045024 * Coefficients: Estimate Std. Error t value Pr(>|t|) SemanaS2:AnoA2008 0.009954 0.026229 0.380 0.704304 SemanaS3:AnoA2008 0.005106 0.026333 0.194 0.846268

Page 75: IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE …pro.poli.usp.br/wp-content/uploads/2012/pubs/identificacao-de... · IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE

75

SemanaS4:AnoA2008 -0.016794 0.026333 -0.638 0.523642 SemanaS5:AnoA2008 0.099514 0.042985 2.315 0.020622 * SemanaS2:AnoA2009 0.002890 0.027891 0.104 0.917474 SemanaS3:AnoA2009 0.055394 0.028276 1.959 0.050129 . SemanaS4:AnoA2009 0.044773 0.028375 1.578 0.114612 SemanaS5:AnoA2009 0.070349 0.047219 1.490 0.136284

Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

(Dispersion parameter for Gamma family taken to be 0.0613073)

Null deviance: 1990.06 on 14934 degrees of freedom

Residual deviance: 798.12 on 14799 degrees of freedom

AIC: 20.594

Page 76: IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE …pro.poli.usp.br/wp-content/uploads/2012/pubs/identificacao-de... · IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE

76

Anexo D - Procedimento efetuado no software R para definir o modelo de previsão

Definidos os dados de entrada no programa, definiu-se em seguida a função a ser

utilizada para modelar os dados. No aplicativo R, escolheu-se a função GLM (“generalized

linear model”), que segundo o R, é definida com os seguintes parâmetros:

fitted.model <- glm ( formula, family = family.generator, data = data.frame )

Na função glm, o termo formula indica a equação que se deseja modelar, incluindo

neste termo, as covariáveis e as interações entre elas; o termo family indica a família de

distribuição que no caso deste trabalho será a família de distribuições gamma; e, o termo data,

indica os dados que pretende-se analisar com a função, no caso deste trabalho, os dados de

entrada descritos anteriormente. Ao definir a família de distribuição Gamma na função glm,

pode-se especificar também a função link, que neste caso, é a função log link.

Nesta etapa de definição do modelo focou-se na programação do problema no pacote

estatístico R. O modelo de função do R é o glm como apresentado anteriormente.

No argumento formula da função glm é inserida a equação com a variável resposta e

as covariáveis que são consideradas no modelo. Inicialmente inseriu-se o modelo completo,

com todas as covariáveis e com todas interações de segunda ordem entre estas covariáveis.

A função glm ficou escrita da seguinte forma:

Analise.fitted <- glm ( Y ~ Ciclo + Setorr + Ssetor + Tam + Semana + Ano + Mes +

Ciclo*Setorr + Ciclo*Ssetor + Ciclo*Tam + Ciclo*Mes + Ciclo*Semana + Ciclo*Ano +

Setorr*Ssetor + Setorr*Tam + Setorr*Semana + Setorr*Mes + Setorr*Ano + Ssetor*Tam +

Ssetor*Semana + Ssetor*Mes + Ssetor*Ano + Tam*Semana + Tam*Mes + Tam*Ano +

Semana*Mes + Semana*Ano + Mes*Ano, family = Gamma (link = log), data = dados)

Onde as covariáveis que compõem a equação principal são detalhadas da seguinte

forma:

• Y: é a variável resposta que se deseja prever, ou seja, é o retorno dos preços

das ações analisadas;

Page 77: IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE …pro.poli.usp.br/wp-content/uploads/2012/pubs/identificacao-de... · IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE

77

• Ciclo: é covariável que é definida pela classificação dos ciclos monetários. Os

períodos do ciclo monetário foram divididos em três (corte, subida e estável);

• Setorr: é a covariável relacionada ao setor da empresa. Utilizou-se a

classificação de SI, SII e SIII. No grupo SI encontram-se os setores de varejo,

construção civil e infraestrutura, logística e concessões. No grupo SII, estão

agrupados o setor bancos e instituições financeiras e empresas do setor de

alimentos, bebidas e tabaco. Enfim, no grupo SIII, encontram-se os setores de

empresas relacionadas à saúde, utilidade pública, telecomunicações e

educação;

• Ssetor: é a covariável dos super-setores. Os super-setores podem ser definidos

como sendo de crescimento ou defensivos;

• Tam: é a covariável do tamanho das empresas. Uma empresa pode ser

classificada como pequena, média ou grande segundo o critério utilizado neste

trabalho;

• Ano: é a covariável que identifica o ano em que a observação foi realizada.

Nesta análise, foram medidos os retornos de 2002 a 2009, por isso, esta

covariável pode assumir os valores A2002, A2003, A2004, A2005, A2006,

A2007, A2008 e A2009;

• Mês: é a covariável que identifica o mês em que a observação foi realizada.

Assim, esta covariável pode assumir os valores M1, M2, M3, M4, M5, M6,

M7, M8, M9, M10, M11, M12;

• Semana: é a covariável que identifica em qual semana do mês a observação foi

realizada. Assim, esta covariável pode assumir os valores S1, S2, S3, S4 e S5.

De forma simplificada, as etapas realizadas para determinar a equação do modelo de

previsão foram as seguintes:

a) Compila-se no software R a função glm com as covariáveis e interações na sua

forma mais completa;

b) Identifica-se os paramêtros bi’s que são menos significativos (através do nível

de significância α do teste de hipótese, ou p-value);

Page 78: IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE …pro.poli.usp.br/wp-content/uploads/2012/pubs/identificacao-de... · IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE

78

c) Exclui-se a interação de covariáveis com menor nível de significância e

compila-se novamente no R a função glm sem a interação excluída;

d) Se a deviance residual do teste diminuir ou se manter constante e se os valores

dos parâmetros bi continuarem tão significativos como antes da exclusão da

interação analisada, pode-se excluir definitivamente esta interação da equação

de previsão;

e) Caso a deviance residual aumente, isto significa que o modelo está pior sem a

interação excluída, por isso, ela deve ser incorporada novamente à equação de

previsão.

Este procedimento foi realizado diversas vezes até que a exclusão de qualquer uma das

interações restantes causasse o aumento da deviance residual. Assim, chegou-se a seguinte

equação para a função glm:

Analise.fitted <- glm (Y ~ Ciclo + Setorr + Ssetor + Tam + Semana + Ano + Mes +

Ciclo*Setorr + Ciclo*Ssetor + Ciclo*Tam + Ssetor*Setorr + Ciclo*Mes + Mes*Semana +

Semana*Ano, family = Gamma (link = log), data = dados)

Page 79: IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE …pro.poli.usp.br/wp-content/uploads/2012/pubs/identificacao-de... · IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE

79

Anexo E - Representação gráfica dos resíduos padronizados

Figura E.1 - Resíduos padronizados (I)

Figura E.2 - Resíduos padronizados (II)

-4

-3

-2

-1

0

1

2

3

4

5

0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000

-8

-6

-4

-2

0

2

4

6

8

10

5000 5500 6000 6500 7000 7500 8000 8500 9000 9500 10000

Page 80: IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE …pro.poli.usp.br/wp-content/uploads/2012/pubs/identificacao-de... · IDENTIFICAÇÃO DE FATORES INFLUENTES NO DESEMPENHO DE

80

Figura E.3 – Resíduos padronizados (III)

-8

-6

-4

-2

0

2

4

6

10000 10500 11000 11500 12000 12500 13000 13500 14000 14500 15000