análise de componentes principais dinâmicos aplicados à … · elas representam tudo o que de...
Post on 13-Dec-2018
216 Views
Preview:
TRANSCRIPT
Análise de Componentes Principais
Dinâmicos Aplicados à Estrutura a
Termo da Taxa de Juros
Paulo Henrique Mascitelli
Orientador: Prof. Getúlio Borges da Silveira
Rio de Janeiro – Rj
2008
2
Paulo Henrique Mascitelli
Análise de Componentes Principais
Dinâmicos Aplicados à Estrutura a
Termo da Taxa de Juros
Tese submetida ao corpo docente do programa de pós-graduação do Instituto de Economia da Universidade Federal do Rio de Janeiro, como parte dos requisitos necessários à obtenção do grau de Mestre.
Banca Examinadora:
___________________________________________________________
Prof. GETÚLIO BORGES DA SILVEIRA (ORIENTADOR)
___________________________________________________________
Prof. OCTÁVIO MANUEL BESSADA LION
___________________________________________________________
Prof. MANUEL ALCINO RIBEIRO DA FONSECA
Rio de Janeiro – RJ
2008
3
Dedico esta tese as minhas filhas Livia e Luiza e a minha esposa Eneida. Elas representam tudo o que de melhor aconteceu em minha vida e foram as melhores fontes de inspiração e motivação.
Dedico também aos meus pais que sempre me apoiaram.
4
AGRADECIMENTOS
Agradeço ao Professor Getúlio Borges da Silveira, que é um verdadeiro exemplo de
empenho e competência na arte de ensinar.
Agradeço ao Professor Octávio Manuel Bessada Lion que esteve sempre pronto a
incentivar e a colaborar em tudo que foi preciso.
Agradeço aos meus colegas de trabalho que muito me ajudaram durante o período que
estive cursando o mestrado.
Agradeço a todos os professores e alunos da pós-graduação em economia da UFRJ,
com os quais convivi, e que foram, de fato, pessoas que me inspiraram tanto por sua
sabedoria, companheirismo e dedicação.
Agradeço a Alan Cosme Rodrigues da Silva pela valiosa ajuda na obtenção dos dados.
5
Análise de Componentes Principais
Dinâmicos Aplicados à Estrutura a
Termo da Taxa de Juros
RESUMO
O objetivo desta tese é estudar a variação da Estrutura a Termo da Taxa de Juros
no Brasil usando técnicas de análise de dados funcionais. A análise de dados
funcionais pode ser dividida em duas partes. A primeira consiste na obtenção de
funções relacionando taxas de juros de títulos de renda fixa sem pagamento de cupons
com suas maturidades. Na segunda parte, é empregada a técnica de análise de
componentes principais aplicados a dados funcionais com a finalidade de auxiliar a
interpretação da função de covariância das curvas. Os resultados são comparados com
trabalhos anteriores de (Litterman & Scheinkman, 1991) e (Silveira & Lion, 2003). A
presença de inércia, que restringiria o uso da análise de componentes principais, já
apontada por (Silveira & Lion, 2003) também é verificada. Como uma possível solução
para o problema da inércia, a análise dos componentes principais é usada para a
primeira diferença da ETTJ.
6
Dynamic Principal Component
Analysis Applied to the Yield Curve
ABSTRACT
The purpose of this thesis is to study the variation of the Yield Curve in Brasil using
techniques of functional data analysis. The functional data analysis can be divided in
two parts. The first one consists in obtaining the functions relating the yields of zero
coupon bounds with their maturities. On the second part, it’s employed the technique of
principal component analysis applied to functional data in order to help the interpretation
of de covariance function. The results are compared with papers written before by
(Litterman & Scheinkman, 1991) and (Silveira & Lion, 2003). The presence of inertia,
which restricts the use o principal component analysis, already pointed by (Silveira &
Lion, 2003) is verified. As a possible solution for the problem of inertia, the principal
components analysis is used to the first difference of the yield curve.
7
1 INTRODUÇÃO. 9
2 A ETTJ. 11
2.1 Conceitos Preliminares. 11
2.1.1 TAXAS DE JUROS. 11
2.1.2 TÍTULOS DE RENDA FIXA. 11
2.1.3 SWAP. 12
2.2 A Importância da ETTJ. 12
2.2.1 INVESTIMENTOS. 13
2.2.2 POLÍTICA ECONÔMICA. 13
2.2.3 MERCADO FINANCEIRO. 14
3 OBTENDO A FUNÇÃO ETTJ. 15
3.1 Exposição Teórica. 16
3.1.1 FUNÇÕES BASE. 17
3.1.2 CUBIC SPLINES. 18
3.1.3 PROCESSO DE SUAVIZAÇÃO POR SPLINES. 19
3.1.4 PROPRIEDADES DA CSN. 22
3.1.5 ESTIMANDO A FUNÇÃO 27
3.1.6 ESCOLHA DE . 28
3.1.7 RESULTADO DA ESTIMAÇÃO DE . 30
3.2 Estimação da ETTJ. 31
4 FUNDAMENTOS TEÓRICOS DA ANÁLISE DE COMPONENTES PRINCIPAIS. 34
4.1 Obtenção dos Componentes Principais para o Modelo Multivariado. 36
4.2 Obtenção dos Componentes Principais para o Modelo de Dados Funcionais. 38
4.3 Métodos Computacionais. 41
4.3.1 CONVERSÃO DE FUNÇÕES EM DADOS DISCRETOS. 41
4.3.2 ABORDAGEM DA EXPANSÃO EM FUNÇÕES BASE. 43
5 A ACP APLICADA A ETTJ. 45
5.1 A ACP para 2007. 45
5.1.1 1a COMPONENTE PRINCIPAL. 48
8
5.1.2 2ª COMPONENTE PRINCIPAL. 51
5.1.3 3ª COMPONENTE PRINCIPAL. 52
5.2 A ACP para 2005 e 2006. 53
5.3 O Problema da Independência das observações. 56
6 CONSIDERAÇÕES FINAIS. 61
APÊNDICE A 64
A.1 Revisão de conceitos. 64
A.1.1 ESPAÇO VETORIAL COM PRODUTO INTERNO. 64
A.1.2 ESPAÇOS DE HILBERT. 65
A.1.3 AUTOVALORES E AUTOVETORES E MATRIZES SIMÉTRICAS. 66
BIBLIOGRAFIA 68
9
1 INTRODUÇÃO.
O conhecimento da Estrutura a Termo da Taxa de Juros (ETTJ) é de grande
importância para o investimento, para política econômica, para a precificação de ativos
e para formação de carteiras. No entanto, existem grandes dificuldades tanto de
observação quanto de análise dos fatores que determinam a ETTJ. As dificuldades de
observação derivam do fato que somente para alguns prazos existem negociações em
volume suficiente para que as taxas possam ser avaliadas. Por outro lado, as
dificuldades de análise surgem porque as variações na ETTJ podem ser bastante
complexas não se restringindo apenas a movimentos de subida ou de descida. A
Análise de Componentes Principais (ACP) aplicadas a dados funcionais derivados de
observações discretas das taxas de juros é um forte instrumento para o estudo da
ETTJ.
Historicamente, os fundamentos matemáticos da Análise de Componentes
Principais (ACP) foram introduzidos por Pearson em 1901 e, em 1933, Hotteling
reapresentou a ACP em formatos mais próximos dos que são utilizados atualmente.
Desde então, a ACP vem sendo largamente utilizada no campo das ciências sociais
para quantificar e identificar fatores que não podem ser diretamente mensurados.
(Litterman & Scheinkman, 1991) foram os primeiros a propor a decomposição da
ETTJ em componentes principais. Eles argumentaram e demonstraram que a análise
da Duration para diversificação de carteiras pode levar a perdas relevantes porque
formas mais complexas do que movimentos verticais da ETTJ não são contabilizadas.
10
(Litterman & Scheinkman, 1991) demonstraram que pelo menos 96% das
variações na ETTJ podem ser explicadas por apenas três componentes principais. No
entanto, a ACP foi aplicada a observações discretas das taxas de juros.
(Silveira & Lion, 2003) sustentaram que a ETTJ é uma função que associando,
para cada prazo de vencimento de títulos de renda fixa, que não pague cupons1, uma
taxa de juros. Aplicando a ACP às curvas obtidas pela interpolação dos pontos
observados é possível conseguir ganhos tanto de precisão quanto de interpretação dos
resultados uma vez que mais informação estará sendo incorporada à análise.
O objetivo deste trabalho será proceder a ACP para ETTJ como proposto por
(Litterman & Scheinkman, 1991) acrescentando as técnicas de análise de dados
funcionais2 usadas por (Silveira & Lion, 2003) em seu estudo sobre a ETTJ no Brasil.
O segundo capítulo apresenta a ETTJ e discute sua importância tanto para a
economia quanto para as finanças. O terceiro capítulo trata da origem dos dados
utilizados e das técnicas de tratamento necessárias para a obtenção da forma funcional
da ETTJ. O quarto capítulo é uma exposição dos fundamentos teóricos do cálculo dos
componentes principais a partir de dados funcionais. No quinto capítulo os resultados
são apresentados e interpretados. Finalmente, no sexto capítulo, apresentamos as
considerações finais.
1 Cupons são pagamentos intermediários feitos em períodos regulares previamente estabelecidos antes do vencimento do título. 2 Traducão da expressão em inglês Functional Data Analysys empregada por (Ramsay & Silverman, 1997) para denominar um conjunto técnicas empregadas no tratamento de dados que apresentam algum tipo de relação funcional suave sem a presença de descontinuidades ou saltos. A palavra funcional se refere aos dados e não à análise.
11
2 A ETTJ.
2.1 Conceitos Preliminares.
2.1.1 TAXAS DE JUROS.
Segundo Keynes, a taxa de juros é um prêmio pago ao emprestador pela
renúncia da liquidez durante um determinado período. Do ponto de vista do investidor é
uma taxa de retorno alternativa ao uso do capital próprio.
Taxas de juros dependem de diversos fatores associados a características
peculiares ao tomador do empréstimo. Para delimitar o escopo deste trabalho, é
conveniente especificar que estamos nos referindo à taxa DI que é a média das taxas
de juros de operações de um dia apuradas nos financiamentos diários do Sistema
Especial de Liquidação e Custódia (SELIC) para Títulos Públicos Federais, expressa
em taxa efetiva anual, base 252 dias úteis.
2.1.2 TÍTULOS DE RENDA FIXA.
São títulos cujos fluxos de pagamentos são conhecidos no momento da
contratação. Por exemplo, no Brasil, uma Letra do Tesouro Nacional (LTN) é um título
do governo federal que estabelece o pagamento do valor de face somente no
vencimento. O valor da LTN depende das previsões para a Taxa DI no vencimento do
papel. A LTN é um título de renda fixa sem pagamento de cupom.
12
Chamaremos de Taxa Pré a taxa de juros de uma LTN e chamaremos de zero
cupom um título de renda fixa que pague um valor predeterminado somente no
vencimento como a LTN.
2.1.3 SWAP.
Um contrato de SWAP é uma troca do perfil de obrigações. Um dos mais
importantes é o que permite a troca de obrigações com taxas pós-fixadas por taxas pré-
fixadas e vice-versa. Diariamente, operações de SWAP de Taxa DI (pós-fixada) com
Taxas Pré são realizadas na BMF (Bolsa de Mercadorias e Futuros 3).
2.2 A Importância da ETTJ.
A ETTJ é uma função que relaciona para cada prazo até o vencimento de um
título zero cupom uma taxa de juros. Em termos matemáticos:
Equação 1
As Taxas Pré, nas operações de SWAP, representam as expectativas das Taxas
DI no dia do vencimento. Então os pontos da ETTJ podem ser obtidos das taxas
negociadas nos contratos de SWAP e, por um processo de interpolação, da
Equação 1 é estimada.
3 As taxas pré para diferentes prazos de vencimento de contratos de SWAP podem ser extraídas no Sistema de Recuperação de Informações da BMF no site www.bmf.com.br.
13
2.2.1 INVESTIMENTOS.
Descontada a correção relativa ao risco4 envolvido da obrigação subjacente, a
ETTJ expressa as expectativas do mercado sobre o futuro da taxa de juros. Estas
expectativas são determinantes do investimento e do nível de atividade visto que a taxa
de juros de longo prazo é o custo de oportunidade do investimento em capital.
2.2.2 POLÍTICA ECONÔMICA.
Figura 1: ETTJ após expectativa de redução da arrecadação de tributos.
4 Como o tomador de uma LTN é o governo, em condições normais pode-se considerar que o risco específico é reduzido. No caso das operações de SWAP de taxas de juros pré e pós os valores observados devem refletir somente a expectativa da taxa de juros.
14
Quaisquer que sejam os objetivos de política econômica, a ETTJ deve ser
considerada pelos seus efeitos sobre o nível de atividade e, via consumo, sobre a
inflação. Eventos como o que ocorreu na semana de 10 a 14 de dezembro no Brasil,
após ter sido decidido o fim da cobrança da Contribuição Provisória sobre
Movimentações Financeiras (CPMF) implicando em uma previsão de redução da
arrecadação na ordem de 40 bilhões de reais e fazendo com que as expectativas de
juros futuros fossem elevadas (ver Figura 15), sugerem que mesmo a política fiscal
pode ter influência sobre a ETTJ.
Além disso, o custo de refinanciamento da dívida publica dependem diretamente
das taxas de juros da ETTJ.
2.2.3 MERCADO FINANCEIRO.
A ETTJ é também importante para os investidores do mercado financeiro porque
serve como referência para calculo dos retornos esperados de operações financeiras
mais elaboradas como operações que envolvam risco de crédito, com pagamento de
cupom, ou com taxas pós-fixadas. Conforme apresentado por (Litterman &
Scheinkman, 1991), uma vez que a ACP é capaz de captar variações da taxa de juros
não detectáveis por pela análise da Duration, ela pode ser utilizada com vantagens na
diversificação de carteiras para redução do risco específico. Além disso, a ETTJ
também pode ser útil na avaliação de outros ativos como no modelo apresentado por
(Bessada) de precificação de opções sobre títulos de renda fixa. 5 No eixo das abscissas, os prazos até o vencimento foram reduzidos para uma escala de 0 a 1 mantendo a compatibilidade com (Silveira & Lion, 2003).
15
3 OBTENDO A FUNÇÃO ETTJ.
O objetivo deste capítulo será descrever quais foram os métodos de interpolação
empregados para obter as formas funcionais da ETTJ. Dados funcionais se referem à
estrutura intrínseca das variáveis. Na prática, o que pode ser observado são pares de
valores dos prazos até o vencimento e das taxas de juros e o que se quer _e
uma função que permita avaliar para todo e qualquer como na Equação 1. O gráfico
da Figura 2, sugere que a hipótese de funcionalidade da ETTJ é bastante razoável.
Figura 2: Taxas de SWAP observadas no dia 21/03/2007
16
Primeiro, será apresentada uma exposição teórica dos métodos empregados na
obtenção de curvas a partir de dados discretos e em seguida serão mostrados os
resultados da técnica aplicada à ETTJ e feitas alguns comentários.
3.1 Exposição Teórica.
Vamos temporariamente deixar a ETTJ de lado por enquanto para trabalhar com
uma função hipotética cujos resultados serão controlados. Suponha que:
Equação 2
Onde é um termo aleatório como o que aparece nas regressões lineares
decorrente, por exemplo, de erros de medição. Supondo, também, que é dado
por:
Equação 3
O objetivo é encontrar o valor de . No entanto, somente são observados
pares ordenados .
No gráfico da Figura 3, a curva em azul é e os pontos representam pares
de valores que foram obtidos por:
Equação 4
17
Sendo que cada foi gerado por um processo randômico com distribuição
Normal(0; 2). Como é conhecida, a eficiência do método será mais evidente.
Figura 3: Pontos observados e curva esperada
3.1.1 FUNÇÕES BASE.
Para estimar , primeiro será preciso escolher um grupo de funções
primitivas , que serão chamadas de funções base, de tal modo que:
Equação 5
A escolha das funções base vai depender, sobretudo, das características da
variável em estudo. Por exemplo, se é esperado que esta apresente algum tipo de
18
comportamento periódico, o mais indicado é expandir em Série de Fourier porque
as funções base seriam senos e cossenos. Por motivos que serão expostos mais
adiante, adotaremos cubic splines como funções base6.
3.1.2 CUBIC SPLINES.
Suponha que deva ser estimada no intervalo de domínio , tome
tal que . Os pontos são chamamos
de nós. Se:
• Em cada subintervalo for um
polinômio de grau 3;
• , e forem funções contínuas em todo intervalo
;
Então é uma cubic spline.
Além disso, dizemos que é uma cubic spline natural (CSN) se:
• Ela for uma cubic spline;
• Atender as chamadas condições naturais de fronteira:
Equação 6
Uma forma possível de apresentação para uma função cubic spline pode ser:
6 Para uma discussão mais detalhada sobre funções base, ver (Ramsay & Silverman, 1997).
19
Onde , , e são constantes e sendo .
Mais adiante, será apresentada uma série de propriedades interessantes da
CSN.
3.1.3 PROCESSO DE SUAVIZAÇÃO POR SPLINES.
A curva vermelha da Figura 4 passa por todos os pontos observados .
No entanto, é fácil ver que ela é uma estimativa ruim de . Esta deficiência ocorre
porque a curva estimada apresenta uma variabilidade excessiva.
Figura 4: Curva com perfeita aderência aos dados
20
Conforme já mencionado, supomos que o processo de geração dos dados
possui algum grau de suavização, isto é que o valor teórico de ou da taxa de juros no
caso da ETTJ pode ser determinado por um processo contínuo sem a presença de
variações bruscas em um curto espaço de tempo. Esta premissa é conveniente para
nossos propósitos porque eliminando as perturbações locais obtemos uma função que
aproxima melhor o processo de geração dos dados.
Temos dois objetivos que "rivalizam" entre si na determinação de . Por um
lado queremos que explique o máximo possível , por outro, não desejamos
saltos muito fortes em . Estes dois aspectos podem ser observados no erro
quadrático médio (EQM7). O EQM é dado por:
Equação 7
O primeiro termo do EQM é o quadrado do viés e representa o quanto o quanto
as estimativas estão próximas dos dados. A variância de pode ser vista como uma
medida da pobreza das estimativas. Se for elevada, pouco se pode inferir
sobre o comportamento de .
Analogamente ao EQM, definimos (Soma dos quadrados dos resíduos
penalizados) como sendo:
Equação 8
7 Ver, por exemplo, (Davison, 2003).
21
Onde o primeiro termo é a soma dos quadrados dos resíduos, é um
termo de suavização associado à curvatura de , normalmente definido como:
Equação 9
e é um parâmetro de suavização tal que:
Minimizando a Equação 8 os dois objetivos "rivais" se refletem no processo. Se,
tornamos a primeira parcela arbitrariamente pequena, a segunda parcela referente à
curvatura aumenta. Por outro lado, se a variância é pequena a soma dos quadrados
dos desvios aumenta.
O motivo para definir o termo de penalização como sendo a integral do quadrado
da segunda derivada (Equação 9) é que esta é uma boa medida da curvatura. Existem
outras definições possíveis como, por exemplo, usar a quarta derivada ao invés da
segunda derivada de . No entanto, estas outras definições se aplicam quando há
interesse de estimar não somente a função, mas também suas derivadas. Este não é o
caso da ETTJ. Portanto, a segunda derivada não só é suficiente, é, também, mais
indicado porque torna o cálculo mais simples evitando que erros sejam introduzidos
estimando derivadas de ordens mais altas. Além disso, conforme será demonstrado, a
seguir, a Equação 9 implica que a curva interpoladora de menor variância seja uma
CSN.
22
3.1.4 PROPRIEDADES DA CSN.
Seja uma CSN definida no intervalo por:
• os nós da CSN. Sendo que , e ;
• O vetor tal que ;
• O vetor tal que e .
Defina e as matrizes e como sendo:
onde
23
onde
Como para todo , é uma matriz estritamente diagonal
dominante. Pode se demonstrar, por meio de álgebra linear, que é estritamente
positiva definida8.
Defina:
Equação 10
Teorema 1:
Os vetores e especificam uma CSN se, e somente se:
Como conseqüência do Teorema 1 é possível afirmar que:
Equação 11
Teorema 2:
Conhecidos os valores , existe somente uma CSN tal que:
.
8 Ver e.g. (Todd, 1962).
24
Prova: Seja o vetor formado pelos valores . Neste caso . Como é
estritamente positiva definida, pelo Teorema 1:, . Como e estão
determinados, pela volta do Teorema 1, a CSN está determinada.
De fato, como, em um determinado intervalo , é um polinômio de
grau 3, então é possível afirmar que é uma reta dada por:
Equação 12
Como e são conhecidos, integrando a Equação 12 duas vezes é
possível obter a seguinte expressão para :
Equação 13
para
Chamando de e o valor da primeira derivada calculada no
interior do intervalo e derivando a Equação 13 obtemos:
Equação 14
25
Equação 15
Como a CSN foi definida pelos vetores e , então e
ficam imediatamente atendidas. Para que e especifiquem
uma CSN, resta somente provar que . Logo, pela Equação 14 e
Equação 15:
Equação 16
Equação 17
Igualando a Equação 16 e a Equação 17 e fazendo os ajustes necessários
obtemos precisamente do Teorema 1:.
Finalmente uma importante propriedade da CSN é dada pelo seguinte teorema:
Teorema 3:
Seja:
• uma CSN que interpola os pontos para todo ;
• e uma função tal que para todo .
Então valendo a igualdade somente se .
Prova:
26
Equação 18
Como valendo a igualdade somente se , basta provar que
é igual a zero e ficará provado o Teorema 3. Integrando por partes e
lembrando as condições naturais de fronteira da Equação 6, vem:
é igual a zero no primeiro e no último intervalo e constante nos demais.
Logo:
lembrando que para todo , uma vez, que por definição,
para todo .
27
3.1.5 ESTIMANDO A FUNÇÃO
Agora que conhecemos as propriedades da CSN, estamos prontos para
demonstrar um método de cálculo para estimar .
Primeiro, um resumo das propriedades da CSN mantendo as definições já
apresentadas anteriormente:
i) Os vetores e definem uma CSN, se e somente se . Como
conseqüência, podemos usar para estimar da
definição de na Equação 8;
ii) Conhecidos , existe somente uma CSN tal que .
iii) De todas as curvas interpolando os pontos , a CSN é a que apresenta
menor valor para e, portanto, menor .
Estas propriedades são importantes, pois:
a) Delimitam o conjunto de funções a serem pesquisadas. Uma vez que
definimos igual à norma ao quadrado da derivada segunda,
sabemos que uma CSN será a curva que minimiza .
b) Basta encontrar o vetor e depois calcular .
c) Finalmente, pode ser obtida de forma única pela Equação 13.
Tomando , podemos reescrever a Equação 8 como sendo:
28
Fazendo
Basta minimizar o termo que depende de . Como é estritamente positiva
definida, é sempre positivo exceto para:
Equação 19
Na prática existem outros algoritmos mais eficientes computacionalmente para
estimar do que a Equação 199.
3.1.6 ESCOLHA DE .
A Equação 19 nos mostra que o valor estimado de e como conseqüência
também de pode ser expresso como uma função de . Logo . A
matriz é conhecida como matriz chapéu porque transforma os valores observados
9 Ver (Green & Silverman, 2000)
29
nos seus valores preditos . O objetivo será escolher tal que estimado
( ) tenha o maior poder de preditivo possível. Para isso, vamos usar o conceito de
cross-validation (CV) que pode ser mais bem compreendido pelas seguintes etapas:
a) Defina como sendo a estimativa de sem considerar a i-
ésima observação.
b) Encontre para todos os pontos observados.
c) Obter CV através de:
Equação 20
Selecionamos o valor de que apresentar o melhor resultado, isto é, que faça
com que o CV seja mínimo. No entanto, não há como garantir que CV possua um
único mínimo e, portanto, é necessário ser cuidadoso nos processos de minimização do
CV. Apesar da Equação 20 sugerir o contrário, não será preciso estimar vezes
para calcular o CV. Ele pode ser obtido pela seguinte fórmula10:
Equação 21
Onde corresponde a digonal principal da matriz chapéu .
10 Para demonstração ver (Green & Silverman, 2000)
30
Outra medida popular da eficácia de é o generalized cross-validation (GCV)
que pode ser calculado pela fórmula:
Equação 22
Onde é o traço da matriz .
A idéia é aproximar pela sua média.
3.1.7 RESULTADO DA ESTIMAÇÃO DE .
Figura 5: Curva estimada x curva esperada.
Para estimarmos g(x) tivemos que fazer as seguintes escolhas:
a) Funções base – CSN;
31
b) ;
c) tal que o GCV seja mínimo.
Além disso, foram escolhidos os nós ( ) da CSN. Neste caso, o critério
dependeu de avaliações visuais das curvas e da concentração das observações.
A Figura 5 mostra que os resultados obtidos são bastante satisfatórios quando
comparamos a curva estimada com a curva esperada .
GCV 1 4,98
0,9 4,83 0,8 4,69 0,7 4,54 0,6 4,39 0,5 4,23 10-6 19,74
Tabela 1: λ x GCV
A Tabela 1 mostra o GCV para diversas escolhas de . Na última linha da
tabela, o valor de corresponde função estimada no gráfico da Figura 4.
Nota-se que o GCV foi bem mais elevado.
3.2 Estimação da ETTJ.
A Tabela 2 mostra os prazos até o vencimento em dias úteis e as taxas
negociadas em contratos de SWAP (Taxa DI x PRÉ) em 21/03/2007. Estes pares
32
ordenados das observações foram usados para traçar o gráfico da Figura 6.
Como se pode notar, os pontos observados da ETTJ encontram-se bastante alinhados
e, portanto, não há necessidade de introduzir uma penalidade elevada para sua
estimação. Fazendo , obtemos o gráfico da Figura 6.
33
Tabela 2: Pontos da ETTJ observados em 21/03/2008
Figura 6: Curva estimada da ETTJ para 21/03/2007
34
4 FUNDAMENTOS TEÓRICOS DA ANÁLISE DE COMPONENTES PRINCIPAIS.
Para uma revisão de conceitos e notações matemáticas utilizadas na ACP ver
Apêndice.
A ACP foi originalmente concebida por Pearson em 1901 e, posteriormente,
desenvolvida por Hotelling em 1933. Basicamente a ACP consiste em uma técnica
estatística que permite reduzir um modelo multivariado a um conjunto de poucas
componentes, não correlacionadas, que carregam a maior parte da informação contida
no modelo original.
Figura 7: Dispersão dos valores observados
A Figura 7 da uma visão intuitiva da ACP. Claramente a direção do eixo maior
da elipse tem um poder explicativo máximo da variação dos pontos observados. A idéia
por trás da ACP é fazer uma rotação dos eixos originais na direção de maior
variabilidade.
35
Os modelos de dados multivariados procuram expressar cada observação da
variável como uma combinação linear de p variáveis independentes x:
Neste trabalho estamos interessados em um tipo um pouco diferente de ACP no
qual as observações são as funções estimadas. A diferença do modelo multivariado
para o modelo funcional é que, no primeiro, temos p vetores de valores observados
discretos e, no segundo, temos curvas estimadas pela interpolação de splines
conforme exposto no terceiro capítulo.
No caso da ETTJ, muitas de suas características podem ser facilmente
verificadas simplesmente observando as curvas estimadas do segundo capítulo. Por
exemplo, na Figura 6, a curva é negativamente inclinada. Isto ocorreu porque, em
março de 2007, a taxa de juros de curto prazo estava elevada e havia expectativa de
queda. No entanto, existem outros aspectos, que não estão disponíveis de forma tão
clara. Observando as curvas isoladamente não será tarefa fácil compreender como a
ETTJ variou durante o ano de 2007. Além disso, a análise das matrizes de covariância
e de correlação, tanto no modelo clássico multivariado quanto no modelo funcional,
pode não evidenciar interpretações facilmente extraídas da ACP. A ACP se encaixa
admiravelmente como ferramenta de estudo da estrutura de covariância
complementando ou, até mesmo, substituindo de maneira muito mais clara e
informativa o exame direto da função de covariância.
36
4.1 Obtenção dos Componentes Principais para o Modelo Multivariado.
Suponha que sejam n vetores de variáveis observadas e
defina:
a) tal que . é igual a
centrado na média.
b)
Para encontrar a primeira componente principal temos que resolver:
Equação 23
O vetor é o primeiro componente principal. Se definirmos
uma matriz tal que suas linhas são formadas por ocorrências dos vetores ,
então:
37
Substituindo na Equação 23 temos
é o estimador da matriz de covariância de .
Os demais componentes principais podem ser obtidos repetindo o procedimento
de maximização da Equação 23 e acrescentando a restrição de ortogonalidade com as
componentes principais já obtidas. Logo, se , então:
Chamamos de Escores de Componentes Principais (ECP) do
k-ésimo componente principal.
A restrição de norma unitária para os vetores de componentes principais é
necessária para delimitar o problema não permitindo que possa assumir
valores arbitrariamente grandes.
A idéia é encontrar a forma mais forte e, portanto, mais importante das variáveis
observadas.
38
Na obtenção dos componentes principais subseqüentes acrescentam-se
restrições de ortogonalidade (produto interno igual a zero) com os componentes
principais já obtidos para garantir que as próximas componentes principais representem
inovações.
Logicamente, a cada componente principal obtido, o valor maximizado será cada
vez menor permitindo aferir o percentual explicado por cada componente. Observe que
esta definição de componentes principais não possui solução única. Para ver isto,
basta notar que se é um componente principal, então também o será.
Sabemos que é uma matriz simétrica e não negativa definida. Logo, se
são os seus autovalores e os respectivos autovetores
normalizados, então para todo .
Além disso, cada autovalor é um estimador à variância de . Logo:
é o percentual da variação explicada pelo componente principal de ordem .
4.2 Obtenção dos Componentes Principais para o Modelo de Dados Funcionais.
No caso da ETTJ queremos obter os componentes principais de um conjunto de
funções observadas. Quando passamos do modelo discreto para o modelo funcional,
devemos fazer algumas substituições usuais da passagem de observações discretas
para contínuas. Onde aparece somatório no modelo discreto, no modelo funcional,
39
passará a ser integral e o produto interno euclidiano é substituído pela definição do
produto interno de funções (ver Apêndice A.1.1).
Logo, supondo pertencendo à classe de funções geradas por um processo
estocástico atendendo condições de regularidade11, tomando valores no intervalo
e tais que , defina:
a)
b) Usando a definição funcional do produto interno, tome:
Então :
Equação 24
A função é o primeiro componente principal. Se
é a função de covariância de , então
Onde o operador de variância é dado por:
11 Contínuos em média quadrática.
40
Pode-se mostrar que o primeiro componente principal satisfaz:
Vimos que no modelo multivariado, o primeiro componente principal é o
autovetor normalizado da matriz de covariância de associado ao maior autovalor.
Analogamente, no espaço de funções é a autofunção associada ao maior autovalor
do operador
Os demais componentes principais podem ser obtidos repetindo o procedimento
de maximização da Equação 24 acrescentando a restrição de ortogonalidade com as
componentes principais já obtidas. Logo, se é a k-ésima componente principal,
então:
Pode-se demonstrar que, atendida condições de regularidade em um espaço
vetorial completo12, as componentes principais correspondem às autofunções do
operador associadas aos autovalores em ordem decrescente como no modelo
multivariado. É fácil ver que o operador faz o papel da matriz de covariância de .
12 Espaços de Hilbert.
41
A ACP pode ser vista como a análise dos autovalores e autovetores da matriz de
covariância no caso multivariado ou dos autovalores e autofunções do operador de
covariância no caso funcional.
4.3 Métodos Computacionais.
Uma vez que, em termos teóricos, já podemos calcular os componentes
principais de dados funcionais, precisamos agora dispor de um método computacional
capaz de lidar com esse tipo de informação. A seguir apresentamos duas
possibilidades.
4.3.1 CONVERSÃO DE FUNÇÕES EM DADOS DISCRETOS.
Uma primeira abordagem consiste, simplesmente, em transformar os dados
funcionais em um conjunto de N valores discretos com espaçamento tão reduzido
quanto se queira. Fazendo N grande é possível mapear, com precisão os valores
funcionais estimados pelo processo spline do Capítulo 2 no intervalo de interesse .
Este procedimento fornecerá uma matriz Z que poderá ser inserida na ACP
multivariado.
O objetivo será estimar as funções de componentes principais que, como
vimos correspondem às autofunções do operador .
Escolha dividindo o intervalo em subintervalos igualmente
espaçados. Suponha funções . Estimamos vetores tal
42
que . Forme a matriz tal que suas linhas são
formadas pelos vetores
Defina o vetor de valores estimados de tal que . Após
encontrar , vamos obter por interpolação.
Obtenha a matriz . Os elementos de são
.
Defina onde é a amplitude do intervalo .
Para cada que pode ser aproximado por
. Logo:
A Erro! Fonte de referência não encontrada. pode ser reescrita como:
Equação 25
Além disso que pode ser aproximado por . Logo:
Equação 26
43
Para resolver a Equação 25, basta encontrar os autovalores e os respectivos
autovetores normalizados de . Dada a restrição de norma unitária da Equação 26
fazemos .
4.3.2 ABORDAGEM DA EXPANSÃO EM FUNÇÕES BASE.
Dadas as definições do início da Seção 4.2 e suponha que cada função possa
ser expressa por:
onde é um vetor cujos elementos são funções base.
Se , e uma matriz de coeficientes tal que:
A função de covariância em termos matriciais será:
Definições:
a) é uma autofunção tal que:
b) é uma matriz com elementos:
44
Logo:
Substituindo na Erro! Fonte de referência não encontrada.:
Equação 27
Note que:
Além disso e serão ortogonais se, e somente se, .
Fazendo e substituindo na Equação 27, ficamos com uma
equação de autovalores e autovetores ortonormais:
Equação 28
Finalmente para encontrar os componentes principais, basta resolver a Equação
28 e fazer . Nos casos mais gerais, devemos recorrer a métodos de
integração numérica para encontrar . Se as funções base forem splines, então, como
para todo então W será uma matriz diagonal com elementos
da diagonal .
45
5 A ACP APLICADA A ETTJ.
Agora que já dispomos de embasamento teórico, é hora de aplicar ACP para os
dados coletados da ETTJ.
5.1 A ACP para 2007.
A partir de 21 de junho de 1999 o Brasil passou a adotar o regime de metas para
inflação como diretriz da política monetária. Desde então, o Comitê de Política
Monetária (COPOM) que é formado pelos membros da Diretoria Colegiada do Banco
Central do Brasil se reúne em datas previamente agendadas para decidir a meta da
taxa de juros visando manter a taxa de inflação dentro dos limites definidos pelo
Conselho Monetário Nacional (CMN). Assim, as sinalizações dadas pelo Banco Central
e da economia a respeito da taxa de inflação no período que antecede as reuniões do
COPOM e as próprias taxas definidas nas reuniões ordinárias do COPOM passaram a
ser os principais eventos responsáveis pelas variações na ETTJ. A Tabela 3 apresenta
um histórico parcial das taxas de juros fixadas pelo COPOM.
A consistência da política monetária de metas para inflação, a prosperidade da
economia mundial, e a ausência de choques, tanto domésticos como internacionais,
compuseram o cenário econômico do Brasil nos últimos anos. A estabilidade externa
aliada a fundamentos econômicos internos sólidos desde meados de 2005 criou um
ambiente propício para queda da taxa de juros e foi o que aconteceu. A ETTJ
negativamente inclinada no início do ano de 2007 já refletia as expectativas de redução
da taxa de juros. No final do ano, quando a taxa já havia declinado para níveis
46
historicamente baixos, as expectativas se inverteram e a ETTJ passou a ser
positivamente inclinada (ver Figura 8). Mesmo esta análise superficial é suficiente para
demonstrar que o movimento da ETTJ é complexo e não pode ser resumido
simplesmente afirmando que "a taxa aumentou" ou "a taxa diminuiu". É preciso
reconhecer que existem variações da ETTJ que não ocorrem na curva como um todo
porque as expectativas de curto e longo prazo não são igualmente determinadas.
Reunião Data Meta SELIC (% a.a.)
103ª 15/12/2004 17,75
104ª 19/1/2005 18,25
105ª 16/2/2005 18,75
106ª 16/3/2005 19,25
107ª 20/4/2005 19,5
108ª 18/5/2005 19,75
109ª 15/6/2005 19,75
110ª 20/7/2005 19,75
111ª 17/8/2005 19,75
112ª 14/9/2005 19,5
113ª 19/10/2005 19
114ª 23/11/2005 18,5
115ª 14/12/2005 18
116ª 18/1/2006 17,25
117ª 8/3/2006 16,5
118ª 19/4/2006 15,75
119ª 31/5/2006 15,25
120ª 19/7/2006 14,75
121ª 30/8/2006 14,25
122ª 18/10/2006 13,75
123ª 29/11/2006 13,25
124ª 24/1/2007 13
125ª 7/3/2007 12,75
126ª 18/4/2007 12,5
127ª 6/6/2007 12
128ª 18/7/2007 11,5
129ª 5/9/2007 11,25
130ª 17/10/2007 11,25
131ª 5/12/2007 11,25
Tabela 3: Histórico de taxas de juros definidas pelo COPOM
47
Figura 8: ETTJ no início e final do ano de 2007
Figura 9: Componentes Principais da ETTJ em 2007
48
Na Figura 9, um gráfico com as 3 primeiras componentes principais , e é
apresentado. As curvas obtidas são bastante semelhantes aos resultados
apresentados por (Litterman & Scheinkman, 1991).
5.1.1 1a COMPONENTE PRINCIPAL.
Cada componente principal pode ser vista como uma função de pesos das
funções ETTJ observadas. A primeira componente principal, , da Figura 9 apresenta
valores mais elevados para maturidades maiores. Isto significa que, em 2007, a
variação da ETTJ é mais bem explicada atribuindo um peso maior ás taxas de mais
longo prazo. (Litterman & Scheinkman, 1991) chamaram a 1a Componente Principal de
nível porque ela representa variações praticamente constantes ao longo da curva.
Estas variações representam os movimentos paralelos da ETTJ.
Uma técnica interessante para interpretar os componentes principais pode ser
observada na Figura 10. Nela, a linha contínua é a média das curvas ETTJ de 2007 e
as curvas formadas pelos sinais " " e " " são obtidas somando e subtraindo,
respectivamente, os múltiplos dos valores de . As características de nível expostas
acima podem ser facilmente verificadas no gráfico da Figura 10.
A Figura 11 mostra a 1a componente principal de 2007 considerando um conjunto
maior de maturidades. Na Figura 10 a maior maturidade considerada é de até 3 anos
enquanto que na Figura 11 os dados são de maturidades mais longas até 15 anos. As
diferenças mais importantes entre os dois gráficos são:
49
Figura 10: 1a Componente Principal - 2007.
Figura 11: 1a Componente Principal 2007 - maturidades até 15 anos.
50
• Na Figura 11, a 1ª componente principal para prazos mais longos continua
sendo maior do que no curto prazo porém ela se aproxima mais de uma
constante.
• O percentual explicado pela 1ª componente passa de 81,1% para 97,7%.
Uma possível explicação para valores inferiores da 1ª componente no curto
prazo, também observados por (Silveira & Lion, 2003), pode ser atribuída à maior
incerteza das taxas de longo prazo fazendo com que estas possuam maior
variabilidade. Além disso, a incerteza reduz a possibilidade de distinção entre prazos
muito longos o que faz com que a ETTJ se mova paralelamente para maturidades
maiores. Assim, quando são consideradas taxas mais longas, a 1ª componente, ou
nível, tende a explicar mais as variações da ETTJ.
Vamos optar pela ACP somente das curvas com maturidades até 3 anos por 3
motivos:
• A característica observada de deslocamento paralelo da ETTJ no longo
prazo causada pela dificuldade dos agentes em distinguir prazos longos
elevando o percentual explicado pela 1ª componente pode sugerir
erroneamente que a 2ª e a 3ª componentes não são importantes.
• Como as taxas de prazo mais longo são menos negociadas, os pontos
observados são mais espaçados introduzindo variações indesejadas nas
curvas estimadas, podendo, inclusive, ocasionar problemas de ponto de
alavanca.
• Para manter a compatibilidade com as bases de dados de 2005 e 2006.
51
5.1.2 2ª COMPONENTE PRINCIPAL.
(Litterman & Scheinkman, 1991) deram o nome de inclinação para a 2ª
Componente Principal. Esta interpretação é facilmente verificada na Figura 12
observando que a curva formada por sinais " " é uma rotação da curva ETTJ média. A
maior parte da variação da ETTJ explicada pela 2ª componente pode ser obtida
atribuindo pesos de sinais contrários e crescentes para a ETTJ de curto e longo prazo.
A 2ª componente principal é capaz de explicar 18,8% da variação da ETTJ em 2007.
Figura 12: 2ª Componente Principal – 2007.
52
5.1.3 3ª COMPONENTE PRINCIPAL.
A 3ª Componente Principal foi denominada curvatura. Conforme demonstrado
por (Litterman & Scheinkman, 1991), ela está principalmente associada à volatilidade.
Na Figura 13, podemos ver que as curvas formadas por sinais " " e " " têm,
respectivamente, o efeito de diminuir e aumentar a curvatura da ETTJ média. Observa-
se que o percentual de variação explicado ficou em 0,1% o que é muito pequeno.
Percebe-se, também, que no curtíssimo prazo (até aproximadamente 6 meses), a 3ª
componente é desprezível.
Figura 13: 3ª Componente Principal - 2007.
O percentual explicado pelos 3 primeiros componentes principais totaliza próximo
de 100%. A variação da ETTJ pode ser explicada por apenas 3 componentes
principais.
53
5.2 A ACP para 2005 e 2006.
Os componentes principais em 2005 e 2006 confirmam as interpretações de
2007.
Tanto em 2005 quanto em 2006, a 1ª componente principal da ETTJ é
praticamente constante ao longo de toda a curva o que reforça sua interpretação de
nível. O percentual explicado pelas 3 primeiras componentes se mantém próximo a
100% durante todo o período.
Figura 14: 1ª Componente Principal - 2005.
54
Figura 15: 2ª Componente Principal - 2005.
Figura 16: 3ª Componente Principal - 2005.
55
Figura 17: 1ª Componente Principal - 2006.
Figura 18: 2ª Componente Principal - 2006.
56
Figura 19: 3ª Componente Principal - 2006.
5.3 O Problema da Independência das observações.
A validade dos resultados obtidos pela ACP depende da hipótese de
independência das curvas ETTJ. Como estas curvas são elementos de uma série
temporal, é natural supor que existe correlação entre elas. Para demonstrar que as
curvas ETTJ não são independentes foram plotadas, na Figura 20, elipses que
delimitam intervalos de confiança de 90% 13 da distribuição conjunta dos ECPs da 1ª e
2ª componentes principais. Nota-se que as elipses descrevem uma trajetória indicando
a presença de inércia entre as observações.
13 Intervalos de confiança construídos usando estatísticas de Wald e supondo distribuição conjunta assintoticamente normal multivariada.
57
(Silveira & Lion, 2003) já haviam apontado este problema. Eles sugeriram como
alternativa estimar os componentes principais da primeira diferença. De fato, supondo
que exista uma forte correlação entre a ETTJ e a ETTJ defasada de um dia, poder-se-ia
eliminar a autocorrelação trabalhando com a primeira diferença da ETTJ:
Nas Figuras 21, 22 e 23 estão apresentados os resultados da ACP para primeira
diferença da ETTJ no período de 2005 a 2007. Assim como em (Silveira & Lion, 2003)
os gráficos da ACP para primeira diferença repetem, em termos gerais, as mesmas
interpretações apresentadas para a ACP da ETTJ. De fato, é possível verificar na
Figura 24 que na primeira diferença, a inércia foi removida.
58
Figura 20: Presença de inércia indicando existência de autocorrelação entre as curvas ETTJ observadas. As elipses compreendem ao período entre as reuniões do COPOM realizadas entre 2005 a 2007. O número no centro de cada elipse é a reunião do COPOM (ver Tabela 3).
59
Figura 21: 1ª Componente Principal da primeira diferença da ETTJ - 2005 a 2007.
Figura 22: 2ª Componente Principal da primeira diferença da ETTJ - 2005 a 2007.
60
Figura 23: 3ª Componente Principal da primeira diferença da ETTJ - 2005 a 2007.
Figura 24: A inércia presente na Figura 20 não aparece quando a ACP é aplicada à primeira diferença da ETTJ.
61
6 CONSIDERAÇÕES FINAIS.
As técnicas de análise de dados funcionais empregadas consistiram em duas
partes claramente definidas:
i) Obtenção da série temporal de curvas ETTJ.
ii) ACP.
A primeira etapa para obter as curvas ETTJ foi escolher a segunda derivada
como medida de curvatura e forma de penalização da variação na Equação 8. Como o
interesse é somente na forma funcional da ETTJ e não em suas derivadas, não há
necessidade de estimar penalidades mais complexas tais como a quarta derivada por
exemplo.
Uma vez que a segunda derivada foi a forma de penalização escolhida ficou
determinado que as funções base interpolantes fossem cubic splines porque, conforme
o Teorema 3, esta é a interpolação mais eficiente já que é a que apresenta a menor
curvatura para o mesmo viés.
A seguir, o parâmetro de suavização foi determinado de forma a minimizar o
GCV e estimar a curva usando a Equação 19 ou algum outro método
computacionalmente mais eficiente. A escolha de pode não ser uma tarefa das mais
simples porque o GCV pode não possuir um único mínimo. Além disso, muitas curvas
devem ser estimadas e a escolha de um valor de para uma curva pode não ser a
melhor para outra. Em parte a estimativa das curvas depende da análise visual.
Com as curvas ETTJ estimadas, o próximo passo foi proceder a ACP para dados
funcionais. A ACP é uma técnica cujos principais objetivos são reduzir o número de
62
variáveis e auxiliar na interpretação da matriz de variância-covariância. A ACP para
dados funcionais difere da ACP para dados multivariados porque no primeiro a
informação é contínua e no segundo temos uma coleção de variáveis discretas.
Modelo Multivariado Modelo de Dados Funcionais
Elementos Observados vetores p-dimensionais:
Coleção de funções:
Escores dos Componentes Principais
1ª Componente Principal
Encontrar o vetor tal
que seja máximo sujeito à
.
Encontrar a função tal que
seja
máximo sujeito à .
k-ésima Componente Principal
Encontrar o vetor tal
que seja máximo sujeito à
e à
para todo .
Encontrar a função tal que
seja
máximo sujeito à e à
para todo .
Solução As componentes principais são respectivamente os autovetores
associados aos autovalores
da matriz Var(x)
As componentes principais são respectivamente as autofunções
do operador de
covariância
Quadro 1: Resumo da ACP modelo mulivariado e dados funcionais.
63
O Quadro 1 mostra um resumo comparativo entre os modelos multivariados e
funcionais.
Os componentes principais obtidos confirmam os resultados da ACP tanto de
(Litterman & Scheinkman, 1991) quanto de (Silveira & Lion, 2003) cabendo apenas
alguns comentários:
• O percentual explicado pelas 3 primeiras componentes principais, no período
de 2005 a 2007, ficou sempre muito próximo de 100%, sendo que as 2
primeiras componentes são capazes de explicar perto de 99% da variação
da ETTJ. (Litterman & Scheinkman, 1991) demonstraram que a escolha de
uma carteira de títulos levando em conta somente a Duration está exposta a
riscos devido a variações da ETTJ não consideradas por esta estratégia de
diversificação. A Duration é capaz de captar somente movimentos paralelos
da ETTJ como, aproximadamente, a primeira componente. Para o período
apurado, considerando títulos com vencimento até 3 anos, uma carteira de
títulos estaria 100% protegida se reproduzisse os 3 primeiros componentes e
estaria 99% protegida se reproduzisse os 2 primeiros componentes.
• As componentes principais obtidas são empíricas e servem para
compreender como a ETTJ variou no período de 2005 a 2007.
• A variação da ETTJ pode ser resumida em movimentos de aumento e
diminuição das taxas que explicam a maior parte da variação, em
movimentos de rotação das curvas explicam em torno de 12,3% da variação
na ETTJ e mudanças na curvatura que explicam apenas uma pequena parte.
64
APÊNDICE A
A.1 Revisão de conceitos.
Suposições iniciais:
• onde é um corpo consistentemente definido;
• .
A.1.1 ESPAÇO VETORIAL COM PRODUTO INTERNO.
Denotamos o produto interno entre e , por . Por definição, o produto
interno deverá atender às seguintes propriedades:
Simetria: ;
Positividade: valendo a igualdade se, e somente se, ;
Bilinearidade:
Definição de norma como produto interno:
Equação 29
Exemplos de produto interno.
65
O produto interno Euclidiano: Se e y são dois vetores de mesma dimensão tais
que e , definimos o produto interno Euclidiano
entre eles como sendo:
Equação 30
O produto interno entre funções: Definimos produto interno entre duas funções
e contínuas com domínio contido no intervalo , assumindo valores e
como sendo:
Equação 31
A.1.2 ESPAÇOS DE HILBERT.
Seqüências - Convergência: suponha que é uma seqüência de
elementos de um espaço vetorial normado . Dizemos que a seqüência converge para
quando:
Seqüência de Cauchy : é uma seqüência de Cauchy quando:
66
Se, no espaço vetorial , toda seqüência de Cauchy é convergente e se a norma
em é induzida por um produto interno, então é um espaço de Hilbert. Espaços
vetoriais com produto interno Euclidiano e espaços de funções contínuas com produto
interno definido pela Equação 31 são exemplos de Espaços de Hilbert.
A.1.3 AUTOVALORES E AUTOVETORES E MATRIZES SIMÉTRICAS.
Teorema 4
Sejam
Então:
Teorema 5
Se A é uma matriz simétrica p×p, então existe uma matriz U, não singular, cujas
colunas são autovetores normalizados de A, tal que:
onde D é uma matriz diagonal cujos elementos da diagonal são os autovalores da
matriz A.
OBS: , logo é uma matriz ortogonal.
Suponha uma matriz simétrica . Desejamos encontrar:
67
Equação 32
Suponha que são os autovalores de e são os
respectivos autovetores normalizados14 de . Tome uma matriz cujas colunas são os
autovetores , e uma matriz diagonal cujos elementos da diagonal são .
Pelo Teorema 5, temos que e .
Tomando :
e
Assim, é possível reescrever a Equação 32 como:
Expandindo , vem:
Como os autovalores, por suposição, são ordenados do maior para o menor, é
fácil ver que é a solução procurada. Portanto, basta fazer .
Também é fácil encontrar a solução para os seguintes problemas de
maximização:
Basta fazer .
14 Tais que .
68
BIBLIOGRAFIA
Davison, A. (2003). Statistical Models pp 300-301. New York: Cambridge
University Press.
Green, P., & Silverman, B. (2000). Nonparametric Regression and Generalized
Linear Models(A Roughness Penalty Approach), pp 1-60. Boca Raton: CRC Press .
Lion, O. (s.d.). Um Estudo Sobre a Modelagem da Estrutura a Termo das Taxas
de Juros e a Precificação de Opções Sobre Títulos de Renda Fixa. Banco Central .
Litterman, R., & Scheinkman, J. (1991). Common Factors Affecting Bond
Returns. The Journal of Fixed Income , pp. 54-61.
Ramsay, J., & Silverman, B. (1997). Functional Data Analysis. New York:
Springer Verlag New York, Inc.
Silveira, G. B., & Lion, O. (Maio de 2003). Análise de Componentes Principais e
Dados Funcionais: Uma aplicação às Estruturas a Termo de Taxa de Juros. Banco
Central do Brasil .
Todd, J. (1962). Survey of Numerical Analysis. New York: McGraw-Hill.
top related