FUNDAÇÃO GETULIO VARGAS
ESCOLA DE ECONOMIA DE SÃO PAULO
JOÃO GABRIEL COSTA FRANCISCANGELO
VANTAGENS E DESVANTAGENS DO MODELO DINÂMICO DE NELSON-SIEGEL:
APLICAÇÃO AO MERCADO BRASILEIRO
SÃO PAULO
2015
JOÃO GABRIEL COSTA FRANCISCANGELO
VANTAGENS E DESVANTAGENS DO MODELO DINÂMICO DE NELSON-SIEGEL:
APLICAÇÃO AO MERCADO BRASILEIRO
Dissertação apresentada à Escola de
Economia de São Paulo da Fundação Getúlio
Vargas, como requisito para obtenção do
título de Mestre em Economia.
Campo de conhecimento:
Finanças Quantitativas
Orientador:
Prof. Dr. Juan Carlos Ruilova Terán
SÃO PAULO
2015
Franciscangelo, Joao Gabriel Costa
VANTAGENS E DESVANTAGENS DO MODELO DINÂMICO DE NELSONSIEGEL: APLICAÇÃO AO MERCADO BRASILEIRO / João Gabriel Costa
Franciscangelo. - 2015.
68 f.
Orientador: Juan Carlos Ruilova Téran
Dissertação (MPFE) - Escola de Economia de São Paulo.
1. Mercado financeiro - Brasil. 2. Taxas de juros - Brasil. 3. Kalman, Filtragem de.
4. Métodos de espaço de estados. I. Ruilova Téran. II. Dissertação (MPFE) - Escola
de Economia de São Paulo. III. Título.
CDU 336.781.5(81)
JOÃO GABRIEL COSTA FRANCISCANGELO
VANTAGENS E DESVANTAGENS DO MODELO DINÂMICO DE NELSON-SIEGEL:
APLICAÇÃO AO MERCADO BRASILEIRO
Dissertação apresentada à Escola de
Economia de São Paulo da Fundação Getúlio
Vargas, como requisito para obtenção do
título de Mestre em Economia.
Campo de conhecimento:
Finanças Quantitativas
Data de aprovação:
___ / ___ / ___
Banca Examinadora:
______________________________
Prof. Dr. Juan Carlos Ruilova Terán
(Orientador)
FGV – EESP
______________________________
Prof. Dr. Rogério Mori
FGV – EESP
______________________________
Prof. Dr. Flavio Henn Ferreira
Itaú BBA
AGRADECIMENTOS
Ao professor Juan Carlos Ruilova Téran, pela orientação no trabalho.
Aos demais professores do mestrado, pelos conhecimentos compartilhados ao longo
curso.
À minha mãe Livia e aos meus demais familiares, pelo apoio e incentivo durante
toda minha vida.
RESUMO
A modelagem da estrutura a termo da taxa juros tem grande relevância para o
mercado financeiro, isso se deve ao fato de ser utilizada na precificação de títulos de
crédito e derivativos, ser componente fundamental nas políticas econômicas e auxiliar
a criação de estratégias trading.
A classe de modelos criada por Nelson-Siegel (1987), foi estendida por diversos
autores e atualmente é largamente utilizada por diversos bancos centrais ao redor do
mundo. Nesse trabalho utilizaremos a extensão proposta por Diebold e Li (2006)
aplicada para o mercado brasileiro, os parâmetros serão calibrados através do Filtro
de Kalman e do Filtro de Kalman Estendido, sendo que o último método permitirá
estimar com dinamismo os quatros parâmetros do modelo.
Como mencionado por Durbin e Koopman (2012), as fórmulas envolvidas no filtro de
Kalman e em sua versão estendida não impõe condições de dimensão constante do
vetor de observações. Partindo desse conceito, a implementação dos filtros foi feita
de forma a possibilitar sua aplicação independentemente do número de observações
da curva de juros em cada instante de tempo, dispensando a necessidade de
interpolar os dados antes da calibração. Isso ajuda a refletir mais fielmente a realidade
do mercado e relaxar as hipóteses assumidas ao interpolar previamente para obter
vértices fixos.
Também será testada uma nova proposta de adaptação do modelo de Nelson-Siegel,
nela o parâmetro de nível será condicionado aos títulos terem vencimento antes ou
depois da próxima reunião do Copom.
O objetivo é comparar qualidade da predição entre os métodos, pontuando quais são
as vantagens e desvantagens encontradas em cada um deles.
Palavras-chave: Modelo dinâmico de Nelson-Siegel; Espaço de Estados; Filtro de
Kalman; Filtro de Kalman Estendido;
ABSTRACT
Modeling the term structure of interest rates has high relevance to the financial market,
due to the fact of its utilization for pricing bonds and derivatives, being a fundamental
component in the economic policies and assisting in the development of trading
strategies.
The class of models created by Nelson-Siegel(1987), was extended by many authors
and currently is largely used by several centel banks around the world. In this work the
extension proposed by Diebold and Li (2006) was applied to the brazilian market, the
parameters were calibrated using the Kalman Filter and the Kalman Filter Extended,
the last method allowing the estimation with dinamism of all the four parameters used
in the model.
As mentioned by Durbin and Koopman (2012), the equations contained in the Kalman
filter and its extended version do not enforce conditions of constant dimensions in the
observations vector. Based on this concept, the filters implementation were made
allowing its application independent on the number of observations on each time
instant, avoiding the need of previous interporlation of data. It helps the model to reflect
more faithfully the markets reality and relax the assumed hypotheses to obtain fixed
vértices through interpolation.
A new propose of adaptation will be tested in the Nelson-Siegel model, where the level
parameter will be conditioned to the bond’s maturities happened before or after the
next Copom’s meeting.
The objective is to compare the prediction quality across the methods, pointing the
benefits and drawbacks observed on each one of them.
Palavras-chave: Dinamic Nelson-Siegel Model; State Space; Kalman Filter; Extended
Kalman Filter;
Sumário
1.
INTRODUÇÃO ............................................................................................................................ 12
2.
REVISÃO DA LITERATURA .................................................................................................... 16
2.1.
MODELO DE NELSON-SIEGEL...................................................................................... 16
2.1.1.
2.2.
REPRESENTAÇÃO DE ESPAÇO DE ESTADOS ........................................................ 18
2.2.1.
2.3.
3.
EXTENSÃO DE DIEBOLD E LI................................................................................ 16
MODELO DE NELSON-SIEGEL EM ESPAÇO DE ESTADOS .......................... 18
TÉCNICAS DE FILTRAGEM ............................................................................................ 19
2.3.1.
FILTRO DE KALMAN ................................................................................................ 20
2.3.2.
FILTRO DE KALMAN ESTENDIDO ........................................................................ 21
METODOLOGIA E DADOS ...................................................................................................... 24
3.1.
MODELO TEÓRICO UTILIZADO .................................................................................... 24
3.1.1 REPRESENTAÇÕES DO MODELO EM ESTRUTURA LINEAR E NÃO-LINEAR 25
3.1.2 ADAPTAÇÃO DO MODELO ........................................................................................... 26
3.2.
ESTIMAÇÃO DOS PARÂMETROS................................................................................. 28
3.2.1.
FILTRO DE KALMAN ................................................................................................ 29
3.2.2.
FILTRO DE KALMAN ESTENDIDO ........................................................................ 29
3.2.3.
ESTIMAÇÃO POR MÁXIMA VEROSSIMILHANÇA ............................................. 30
3.2.4 ESTIMAÇÃO EM DOIS PASSOS................................................................................ 30
3.3 DADOS UTILIZADOS ............................................................................................................. 31
3.3.1 INTERPOLAÇÃO DOS DADOS..................................................................................... 32
3.3.2 SELEÇÃO DAS AMOSTRAS ......................................................................................... 33
3.4 MÉTRICAS DE COMPARAÇÃO ........................................................................................... 34
4.
RESULTADOS ............................................................................................................................ 36
4.1 RESULTADOS KF ................................................................................................................... 36
4.2 RESULTADOS KFi .................................................................................................................. 41
4.3 RESULTADOS KFc ................................................................................................................. 47
4.4 RESULTADOS KFd................................................................................................................. 50
4.5 RESULTADOS EKF ................................................................................................................ 54
4.6 RESULTADOS KFp................................................................................................................. 58
4.7 RESULTADOS KFr ................................................................................................................. 59
4.8 RESULTADOS CONSOLIDADOS ........................................................................................ 59
5. CONCLUSÃO ................................................................................................................................. 62
6. REFERÊNCIAS BIBLIOGRÁFICAS............................................................................................ 64
LISTA DE FIGURAS
Figura 1: Peso dos fatores em função das variações de λt. ...................................... 17
Figura 2: Histórico taxa Selic nos últimos 3 anos. ..................................................... 27
Figura 3: Representação de salto na estrutura termo da taxa de juros. .................... 27
Figura 4: Comparação da estimação em dois passos com o filtro de Kalman na
amostra 1. ................................................................................................................. 31
Figura 5:Taxas observadas e interpoladas nos vértices fixos para amostra 4. ......... 33
Figura 6: Representação das amostras utilizadas. .................................................... 34
Figura 7: EQM da curva no desenvolvimento e na validação nas 4 amostras para o
modelo KF. ................................................................................................................ 37
Figura 8: EQM da curva no condicionado ao tempo de uso na validação para o modelo
KF. ............................................................................................................................. 38
Figura 9: Parâmetros (𝜇) que guiam a dinâmica das variáveis de estado para o modelo
KF. ............................................................................................................................. 39
Figura 10: Parâmetros (Φ) que guiam a dinâmica das variáveis de estado do modelo
KF. ............................................................................................................................. 39
Figura 11: Parâmetros (𝑄, 𝐻) que guiam a dinâmica das variáveis de estado no modelo
KF. ............................................................................................................................. 40
Figura 12: EQM da curva no desenvolvimento e na validação nas 4 amostras no
modelo KFi. ............................................................................................................... 41
Figura 13: EQM da curva no condicionado ao tempo de uso na validação no modelo
KFi. ............................................................................................................................ 42
Figura 14: Parâmetros 𝜇 que guiam a dinâmica das variáveis de estado no modelo
KFi. ............................................................................................................................ 43
Figura 15: Parâmetros (Φ) que guiam a dinâmica das variáveis de estado no modelo
KFi. ............................................................................................................................ 43
Figura 16: Parâmetros (𝑄, 𝐻) que guiam a dinâmica das variáveis de estado no modelo
KFi. ............................................................................................................................ 44
Figura 17: EQM por faixa de maturidade na amostra 1. ............................................ 45
Figura 18: EQM por faixa de maturidade na amostra 2 ............................................. 45
Figura 19: EQM por faixa de maturidade na amostra 3. ............................................ 46
Figura 20: EQM por faixa de maturidade na amostra 4 ............................................. 46
Figura 21: EQM da curva no desenvolvimento e na validação nas 4 amostras no
modelo KFc. .............................................................................................................. 48
Figura 22: EQM da curva no condicionado ao tempo de uso na validação para o
modelo KFc. .............................................................................................................. 48
Figura 23: Parâmetros (𝜇) que guiam a dinâmica das variáveis de estado no modelo
KFc. ........................................................................................................................... 49
Figura 24: Parâmetros (Φ) que guiam a dinâmica das variáveis de estado no modelo
KFc. ........................................................................................................................... 49
Figura 25: Parâmetros (𝑄, 𝐻) que guiam a dinâmica das variáveis de estado no modelo
KFc. ........................................................................................................................... 50
Figura 26: EQM da curva no desenvolvimento e na validação nas 4 amostras para o
modelo KFd. .............................................................................................................. 51
Figura 27: EQM da curva no condicionado ao tempo de uso na validação para o
modelo KFd. .............................................................................................................. 52
Figura 28: Parâmetros (𝜇) que guiam a dinâmica das variáveis de estado no modelo
KFd. ........................................................................................................................... 53
Figura 29: Parâmetros (Φ) que guiam a dinâmica das variáveis de estado no modelo
KFd. ........................................................................................................................... 53
Figura 30: Parâmetros (𝑄, 𝐻) que guiam a dinâmica das variáveis de estado no modelo
KFd. ........................................................................................................................... 54
Figura 31: EQM da curva no desenvolvimento e na validação nas 4 amostras para o
modelo EKF............................................................................................................... 55
Figura 32: EQM da curva no condicionado ao tempo de uso na validação para o
modelo EKF............................................................................................................... 56
Figura 33: Parâmetros (𝜇) que guiam a dinâmica das variáveis de estado no modelo
EKF. .......................................................................................................................... 56
Figura 34: Parâmetros (Φ) que guiam a dinâmica das variáveis de estado no modelo
EKF. .......................................................................................................................... 57
Figura 35: Parâmetros (𝑄, 𝐻) que guiam a dinâmica das variáveis de estado no modelo
EKF. .......................................................................................................................... 57
Figura 36: Variável de decaimento (λ) ajustada e predita na amostra 4 no modelo EKF.
.................................................................................................................................. 58
Figura 37: Média do EQM nas 4 amostras no desenvolvimento e na validação para
cada modelo. ............................................................................................................. 61
Figura 38: Evolução do EQM dado o horizonte de aplicação do modelo no período de
validação, média em todas as amostras. .................................................................. 61
LISTA DE TABELAS
Tabela 1: EQM e EM durante os períodos de desenvolvimento e validação em cada
uma das amostras para o modelo KF. ...................................................................... 37
Tabela 2: Parâmetro de decaimento em cada uma das amostras com o modelo KF.
.................................................................................................................................. 40
Tabela 3: EQM e EM durante os períodos de desenvolvimento e validação em cada
uma das amostras para o modelo KFi. ...................................................................... 41
Tabela 4: Parâmetro de decaimento em cada uma das amostras com o modelo KFi.
.................................................................................................................................. 47
Tabela 5: EQM e EM durante os períodos de desenvolvimento e validação em cada
uma das amostras para o modelo KFc. ..................................................................... 47
Tabela 6: Parâmetro de decaimento em cada uma das amostras com o modelo KFc.
.................................................................................................................................. 50
Tabela 7: EQM e EM durante os períodos de desenvolvimento e validação em cada
uma das amostras para o modelo KFd. .................................................................... 51
Tabela 8: Parâmetro de decaimento em cada uma das amostras com o modelo KFd.
.................................................................................................................................. 54
Tabela 9: EQM e EM durante os períodos de desenvolvimento e validação em cada
uma das amostras para o modelo EKF. .................................................................... 55
Tabela 10: EQM e EM durante os períodos de desenvolvimento e validação em cada
uma das amostras para o modelo KF. ...................................................................... 59
Tabela 11: EQM e EM durante os períodos de desenvolvimento e validação em cada
uma das amostras para o modelo KF. ...................................................................... 59
Tabela 12: EQM durante os períodos de desenvolvimento e validação da amostra 1,
para todo os modelos. ............................................................................................... 60
Tabela 13: EQM durante os períodos de desenvolvimento e validação da amostra 2,
para todo os modelos. ............................................................................................... 60
Tabela 14: EQM durante os períodos de desenvolvimento e validação da amostra 3,
para todo os modelos. ............................................................................................... 60
Tabela 15: EQM durante os períodos de desenvolvimento e validação da amostra 4,
para todo os modelos. ............................................................................................... 60
Tabela 16: Média do EM durante os períodos de desenvolvimento e validação em
todas as amostras, para todo os modelos. ................................................................ 60
12
1. INTRODUÇÃO
Em meados da década de 1970, as taxas de juros deixaram de ser vistas como
mercados separados para cada maturidade, foi então introduzida a visão de uma
curva que passa pelas taxas para cada uma das maturidades. A partir desse
momento, acadêmicos iniciaram estudos que se estendem até hoje com o objetivo de
ajustar e prever essa curva conhecida como a estrutura a termo da taxa de juros
(ETTJ).
Os primeiros esforços nessa área resultaram na classe de modelos de equilíbrio que
surgiram com Vasicek (1977), ao considerar a ETTJ seguia um processo de OrnsteinUhlenbeck, aperfeiçoamentos das fragilidades observadas nesse modelo foram
apresentados ao longo do tempo, exemplos são Cox, Ingersoll e Ross (1985) e Duffie
e Kan (1996).
Outra linha desenvolvida são os modelos de não-arbitragem, que tem como objetivo
ajustar a ETTJ em um mundo neutro ao risco. Essa característica é muito útil na
precificação de derivativos, entre os trabalhos que seguem essa linha estão os de Ho
e Lee (1986), e Hull e White (1990). Em contrapartida de sua eficiência na precificação
de derivativos, esses modelos não conseguem ser utilizados para previsão da curva
de juros devido a sua base em teorias “neutras ao risco” que desconsideram a
dinâmica observada.
A deficiência na previsão da curva também é observada para os modelos de equilíbrio,
também conhecidos como modelos afins, que não conseguiram superar a capacidade
de previsão de passeios aleatórios no estudo de Duffee (2002). Os modelos de
equilíbrio têm foco em modelar as dinâmicas das taxas instantâneas, depois as taxas
para outras maturidades podem ser derivadas sobre várias premissas sobre prêmio
de risco.
Foi declarada por Milton Friedman (1977, p .22) a necessidade de buscar modelos
mais parcimoniosos para a ETTJ através de formas funcionais com um número
reduzido de parâmetros. Seguindo essa linha, Nelson-Siegel (1987) propôs uma nova
13
classe de modelos que não se enquadrava entre as duas já mencionadas
anteriormente. Ele apresentou um modelo de três fatores, com estrutura flexível o
suficiente para representar a gama de formas observadas para curva de juros.
Incialmente os parâmetros podiam ser interpretados como os componentes de curto,
médio e longo prazo da ETTJ. Diversas extensões desse modelo foram apresentadas,
entre elas está Diebold e Li (2006), que após realizarem alterações nos fatores
conseguiram trazer a interpretação de nível, inclinação e curvatura para os parâmetros
do modelo, além de testarem a capacidade de predição dessa estrutura através da
modelagem da dinâmica dos parâmetros ao longo do tempo com um modelo autoregressivo de primeira ordem, para facilitar o processo de estimação dinâmica o
parâmetro de decaimento foi mantido constante, sendo possível representar o modelo
através de uma estrutura linear.
Outra extensão muito difundida foi apresentada por Svensson (1994), ele adicionou
um novo parâmetro de curvatura tornando a estrutura mais flexível. Atualmente o
modelo de Nelson-Siegel e suas extensões são utilizados por diversos bancos
centrais, uma vez que a ETTJ é utilizada como um indicador de política monetária,
pois através dela conseguimos além de acompanhar a política atual ter um indicador
transparente dos possíveis próximos movimentos que serão tomados. Além disso
ETTJ também é utilizada na precificação de títulos de crédito e derivativos. No Brasil
por exemplo, diariamente são divulgados pela Anbima os parâmetros do modelo de
Nelson-Siegel Svensson para IPCA e títulos públicos prefixados.
Na literatura são relatados diversas estratégias e problemas na calibração do modelo
dinâmico, onde os parâmetros variam no tempo. Uma abordagem usual para mitigar
complicações na estimação consiste em fixar os parâmetros necessários para que o
modelo possa ser escrito através de uma estrutura linear assim como feito por Diebold
e Li (2006), e estimar os demais parâmetros através de mínimos quadrados ordinários.
Essa abordagem traz a facilidade de trabalhar com um modelo linear, mas ainda
continua existindo dificuldades causadas pela multicolinearidade dos parâmetros.
Quando trabalhamos com estimação de parâmetros dinamicamente, uma ferramenta
largamente difundida na literatura são as técnicas de filtragem, sendo mais especifico
no contexto do nosso problema aparecem o filtro de Kalman e o Filtro de Kalman
14
Estendido. Koopman, Mallee e Wel (2010) utilizaram ambos esses filtros aplicados
nos dados mensais da U.S. treasury yield.
Nesse trabalho utilizaremos a versão de Diebold e Li (2006) para ajustar a curva de
prefixados do mercado brasileiro, seguiremos duas abordagens de estimação, a
primeira será utilizar o Filtro de Kalman mantendo o parâmetro de decaimento
constante para que tenhamos um modelo de espaço de estados linear, a segunda
abordagem permitirá que todos os parâmetros variem ao longo do tempo o que exigira
a aplicação do Filtro de Kalman Estendido que foi construído para modelo de espaço
de estados não-lineares.
Foi realizado também um estudo para evidenciar a vantagem da aplicação de uma
técnica de filtragem com relação a estimação em duas etapas, que estima primeiro os
parâmetros no tempo e depois tenta modelar sua dinâmica.
Ambos os filtros serão implementados de forma que possam ser aplicados
diretamente independente da variação de dimensão da nossa variável observada ao
longo do tempo, isso vai permitir mensurar os impactos de uma interpolação prévia
dos dados antes da estimação. Essa flexibilidade dos algoritmos desses filtros de não
dependerem de uma variável resposta com dimensão constante foi ressaltada por
Durbin e Koopman (2012).
No contexto da abordagem linear testaremos uma nova adaptação para o modelo,
será inserido mais uma variável de nível no modelo. O objetivo de ter duas variáveis
de nível é que cada uma delas esteja ativa em um instante do tempo, ou seja, uma
ficará ativa antes da próxima reunião do Copom e outra após a reunião. Essa
abordagem busca incorpora no modelo o possível salto que ocorre na taxa devido a
decisão dessa reunião.
O objetivo deste trabalho é comparar o desempenho dos diferentes métodos de
estimação, observando os resultados dentro e fora da amostra e concluir quais as
vantagens e desvantagens de cada uma das abordagens. Também será feito em cada
exercício de interpolar os dados antes da estimação para avaliar se introduz algum
viés no ajuste e na predição.
15
Nos próximos capítulos deste trabalho serão apresentados a revisão da literatura
relacionada às ferramentas aplicadas na dissertação, uma descrição detalhada da
metodologia e dos dados utilizados, em seguida serão apresentados os resultados
obtidos, e por fim uma conclusão sobre o trabalho.
16
2. REVISÃO DA LITERATURA
Nesse capitulo serão descritos o modelo de Nelson-Siegel (1987) e suas extensões,
o conceito da representação de modelos na estrutura de espaço de estados, a
definição de filtragem e os filtros de Kalman e Kalman Estendido.
2.1.
MODELO DE NELSON-SIEGEL
O Modelo de Nelson-Siegel criou a classe de modelos paramétricos para estrutura a
termo da taxa de juros, ele é constituído pelos parâmetros {𝑏1𝑡 , 𝑏2𝑡, 𝑏3𝑡 , 𝜆𝑡 }, onde os
três primeiros representam componentes de longo, curto e médio prazo como descrito
em Nelson-Siegel(1987), já o último tem como função determinar em quanto tempo a
curva atingirá seu ponto de máximo, sendo chamado de decaimento por alguns
autores. Os fatores que acompanham os parâmetros têm como objetivo criar um
modelo capaz de ajustar uma ampla gama de formas (monótona, arqueada e em
forma de S) que são observadas nas ETTJs.
𝑦𝑡 (𝜏) = 𝑏1𝑡 + 𝑏2𝑡
1−𝑒 −𝜆𝑡 𝜏
𝜆𝑡 𝜏
- 𝑏3𝑡 𝑒 −𝜆𝑡𝜏
(2.1)
Essa estrutura parcimoniosa e suas extensões são largamente utilizadas atualmente,
o Banco de Compensações Internacionais (BIS, 2005) apontou que nove dos treze
bancos centrais que reportavam suas curvas a eles utilizavam alguma derivação da
estrutura acima. A seguir descreveremos as extensões do modelo original que serão
utilizadas na dissertação.
2.1.1. EXTENSÃO DE DIEBOLD E LI
Diebold e Li (2006), reescreveram o modelo criando a seguinte relação entre os
parâmetros originais e os da extensão proposta.
𝑏1𝑡 = 𝛽1𝑡
𝑏2𝑡 = 𝛽2𝑡 + 𝛽3𝑡
𝑏3𝑡 = 𝛽3𝑡
17
Através dessa transformação nos parâmetros, eles conseguiram trazer uma
interpretação econômica de nível, inclinação e curvatura para os parâmetros
respectivamente.
Figura 1: Peso dos fatores em função das variações de λt.
Observando a Figura 1, fica claro que se tratarmos o 𝜆 como um valor constante ou
com pequena variação o comportamento dos fatores ao longo do tempo é intuitivo
com relação interpretação econômica que lhes foi atribuída pelos autores.
Diversos autores mencionam que dependendo do valor de lambda escolhido é
observada alta correlação entre os parâmetros de inclinação e curvatura, entre eles
estão de Pooter (2007) e Hurn, Lindsay and Pavlov (2005).
Vale ressaltar que essas alterações nos parâmetros proposta por Diebold e Li (2006)
com relação ao modelo original não diferenciam a curva ajustada em relação ao
modelo original, a manipulação realizada foi feita apenas pela conveniência na
interpretação dos parâmetros. Abaixo está a forma funcional proposta.
𝑦𝑡 (𝜏) = 𝛽1𝑡 + 𝛽2𝑡
1−𝑒 −𝜆𝑡 𝜏
𝜆𝑡 𝜏
1−𝑒 −𝜆𝑡 𝜏
+ 𝛽3𝑡 (
𝜆𝑡 𝜏
− 𝑒 −𝜆𝑡𝜏 )
(2.2)
Além do avanço na interpretação do modelo eles também comprovaram a eficácia da
estrutura parcimoniosa criada por Nelson-Siegel na predição das taxas, para isso eles
modelaram a dinâmica dos parâmetros calibrados através de um processo autoregressivo de primeira ordem, os resultados apontaram que o modelo tem capacidade
de predição superior a alguns modelos comparados, principalmente quando
observamos projeções de longo prazo
18
Muitos autores documentaram os resultados das séries de tempo dos parâmetros
estimados onde é observada grande instabilidade, chegando a apresentar o
parâmetro de nível com valores negativos violando a intuição econômica, entre esses
autores estão Barrett, Gosnell e Heutson (1995), Fabozzi, Martellini e Priaulet (2005),
Diebold e Li (2006), Gurkaynak, Sack e Wright (2006) e de Pooter (2007).
2.2.
REPRESENTAÇÃO DE ESPAÇO DE ESTADOS
A estrutura de espaço de estados se propõe através de um sistema matricial composto
por variáveis estado representar a relação das variáveis não observadas com as
observadas ao longo do tempo. Ele tem sua importância ressaltada em aplicações
nas quais é preciso modelar parâmetros que variam a longo do tempo, nas quais é
justificada a maior dificuldade de implementação frente aos benefícios obtidos.
A Engenharia de Controle desde os anos 50 utiliza os modelos de espaço de estado
para representar modelos matemáticos de um sistema físico que relaciona variáveis
de entrada e saída através de equações diferencias de primeira ordem. Uma
vantagem observada na representação de espaço de estados é facilidade de aplicar
métodos computacionais, entre esses métodos estão a técnicas de filtragem que
serão definidas a frente nesse trabalho.
Nesse trabalho apresentaremos duas ferramentas desenvolvidas com a utilização da
representação de espaço de estados para modelar a dinâmica dos parâmetros ao
longo do tempo, a primeira é o filtro de Kalman que é aplicado a modelo lineares, a
segunda é o filtro de Kalman estendido que é aplicado para aproximar modelos nãolineares.
2.2.1. MODELO DE NELSON-SIEGEL EM ESPAÇO DE ESTADOS
19
Diebold, Rudebusch e Aruoba (2006) introduziram a possibilidade de inserir o modelo
de Nelson-Siegel dentro de uma estrutura de espaço de estados, isso gera a
possibilidade de estimar os parâmetros dinamicamente em um único passo, gerando
um avanço em relação ao trabalho de Diebold e Li (2006) onde é necessária a
estimação em dois passos.
Nesse caso para inserir o modelo na estrutura de espaço de estados devemos
considerar 𝛽𝑡 como um vetor latente e reescrevemos a equação 2.2 como:
𝑦𝑡 = Λ(𝜆)𝛽𝑡 + 𝜀𝑡 ,
𝜀𝑡 ~𝑁(0, Σ𝜀 )
(2.3)
Com 𝑦𝑡 e 𝜀𝑡 sendo respectivamente os vetores de observações e erros, Λ(𝜆) sendo
uma matriz 𝑁 × 3 onde estão contidos cada um dos 3 fatores para as N observações
no instante de tempo 𝑡.
1,
𝑗 = 1,
1−𝑒 −𝜆𝑡
Λ(𝜆)𝑖𝑗 =
,
𝜆𝑡
1−𝑒 −𝜆𝑡 − 𝜆𝑡𝑒 −𝜆𝑡
{
𝜆𝑡
𝑗 = 2,
,
(2.4)
𝑗 = 3.
A série temporal do vetor 𝛽𝑡 pode ser modelada através de um modelo de vetor autoregressivo (VAR) como exposto na equação abaixo.
𝛽𝑡+1 = (𝐼 − Φ)𝜇 + Φ𝛽𝑡 + 𝜂𝑡 ,
𝜂𝑡 ~𝑁(0, Σ𝜂 )
(2.5)
Onde 𝜇 é vetor que representa a média de longo prazo dos parâmetros, Φ é a matriz
de coeficientes e Σ𝜂 é a matriz de variância. Temos a condição inicial que 𝛽0 ~ 𝑁(𝜇, Σ𝛽 )
onde Σ𝛽 atende à seguinte relação Σ𝛽 − ΦΣ𝛽 Φ′ = Σ𝜂 , como mencionado por
Koopman, Mallee e Van Der Wel (2010).
2.3.
TÉCNICAS DE FILTRAGEM
20
Filtragem consiste em um processo iterativo que nos permite estimar os parâmetros
de um modelo que dependem do histórico dos dados observáveis e não observáveis.
Áreas onde esse conceito é amplamente difundido e utilizado são econometria,
tecnologias espaciais e militares. O primeiro trabalho sobre filtragem foi apresentado
por Wiener (1949), ele era aplicado para processo contínuos e estacionários.
Nesse trabalho aplicaremos os métodos do Filtro de Kalman e o Filtro de Kalman
Estendido para estimação do modelo de Nelson-Siegel para que possamos mensurar
quais foram os benefícios e possíveis deficiências das diferentes abordagens que
apresentamos nesse trabalho. A seguir vamos apresentar o filtro de Kalman
original(1960) e sua versão estendida.
2.3.1. FILTRO DE KALMAN
O Filtro de Kalman(1960) foi desenvolvido originalmente com o objetivo de predizer a
trajetória de balas lançadas por misseis, ao longo do tempo essa técnica foi difundida
e aplicada em diversas áreas do conhecimento, entre elas está a estimação de
modelos econométricos.
Ele se aplica a modelos lineares com resíduos gaussianos, mas foi demonstrado que
ele continua sendo um estimador ótimo mesmo quando a condição de normalidade
dos resíduos é violada, como demonstrado por Anderson e Moore (1979, p. 29-32).
Essa aplicação do filtro se dá através da representação dos modelos através da
estrutura de espaço de estados, que pode ser definida como uma abordagem onde o
sistema em estudo é determinado por uma série de vetores não observáveis que são
guiados por um processo estocástico e associados a uma série de observações, essa
definição é apresentada por Dubin e Koopman (2012). Considerando o modelo de
espaço de estados:
𝑦𝑡 = 𝑍𝑡 𝛼𝑡 + 𝜀𝑡 ,
𝜀 ~ 𝑁(0, 𝐻𝑡 )
(2.6)
𝛼𝑡+1 = 𝑇𝑡 𝛼𝑡 + 𝜂𝑡 ,
𝜂 ~ 𝑁(0, 𝑄𝑡 )
(2.7)
21
Com informações disponíveis até 𝑡, sendo 𝛼𝑡 /𝑌𝑡−1 pertence a uma distribuição normal
com média 𝑎𝑡 e matriz de covariância 𝑃𝑡 . O algoritmo do filtro de Kalman que é aplicado
para obter estimativas de 𝑎𝑡+1 e 𝑃𝑡+1 pela sequência de equações apresentada a
seguir.
𝑣𝑡 = 𝑦𝑡 − 𝐸(𝑦𝑡 ⁄𝑌𝑡−1 ) = 𝑦𝑡 − 𝑍𝑎𝑡/𝑡−1
(2.8)
𝐹𝑡 = 𝑉𝑎𝑟(𝑣𝑡 ⁄𝑌𝑡−1 ) = 𝑍𝑃𝑡/𝑡−1 𝑍 ′ + 𝐻
(2.9)
𝑎𝑡/𝑡 = 𝐸(𝛼𝑡 ⁄𝑌𝑡 ) = 𝑎𝑡/𝑡−1 + 𝑃𝑡/𝑡−1 𝑍 ′ 𝐹𝑡−1 𝑣𝑡
(2.10)
𝑃𝑡/𝑡 = 𝑉𝑎𝑟(𝛼𝑡 ⁄𝑌𝑡 ) = 𝑃𝑡/𝑡−1 − 𝑃𝑡/𝑡−1 𝑍 ′ 𝐹𝑡−1 𝑍𝑃𝑡/𝑡−1
(2.11)
𝑎𝑡+1 = 𝐸(𝛼𝑡+1 /𝑌𝑡 ) = 𝑇𝑎𝑡/𝑡
(2.12)
𝑃𝑡+1 = 𝑉𝑎𝑟(𝛼𝑡+1 /𝑌𝑡 ) = 𝑇𝑃𝑡/𝑡 𝑇 ′ + 𝑄
(2.13)
Através dos valores observados em 𝑡, calculamos os erros da média e da matriz de
covariância através das equações 2.8 e 2.9, depois atualizamos nosso sistema com
as equações 2.10 e 2.11 obtendo 𝑎𝑡/𝑡 e 𝑃𝑡/𝑡 ,
com as equações 2.12 e 2.13
conseguimos gerar uma predição dos valores de 𝑎𝑡+1 e 𝑃𝑡+1 condicionados a
informação disponível no instante 𝑡. Executamos esse algoritmo de forma iterativa
com as novas informações disponibilizadas ao longo do tempo.
2.3.2. FILTRO DE KALMAN ESTENDIDO
Quando observamos não linearidades nas equações de medidas, o filtro de Kalman
não pode mais ser aplicado diretamente. Para tratar essa limitação uma possível
abordagem é a utilização de uma aproximação linear, o filtro de Kalman estendido é
mencionado por Goodwin e Sin (2009) como uma possível solução para essa
limitação.
Considerando o modelo de espaço de estados abaixo, onde as equações são nãolineares e os ruídos não são necessariamente normais. Assumindo que 𝑍𝑡 (𝛼𝑡 ) e 𝑇𝑡 (𝛼𝑡 )
22
são funções diferenciáveis de 𝛼𝑡 , além disso tomamos como premissa que os ruídos
não apresentam correlação serial ou mutual.
𝑦𝑡 = 𝑍𝑡 (𝛼𝑡 ) + 𝜀𝑡 ,
𝜀 ~ [0, 𝐻𝑡 ]
𝛼𝑡+1 = 𝑇𝑡 (𝛼𝑡 ) + 𝜂𝑡 ,
(2.14)
𝜂 ~ [0, 𝑄𝑡 ]
(2.15)
A adaptação do Filtro de Kalman original consiste basicamente na realização de uma
expansão por series de Taylor dos componentes que apresentam comportamento não
linear, para isso precisamos garantir que eles são diferenciáveis.
𝑍𝑡̇ =
𝜕𝑍𝑡 (𝛼𝑡 )
𝑇𝑡̇ =
𝜕𝑇𝑡 (𝛼𝑡 )
𝜕𝛼′𝑡
𝜕𝛼′𝑡
|
(2.16)
𝛼𝑡 =𝑎𝑡
|
(2.17)
𝛼𝑡 =𝑎𝑡
Utilizando uma aproximação de primeira ordem chegamos nas equações abaixo:
𝑍𝑡 (𝛼𝑡 ) = 𝑍𝑡 (𝑎𝑡 ) + 𝑍̇𝑡 (𝛼𝑡 − 𝑎𝑡 )
(2.18)
𝑇𝑡 (𝛼𝑡 ) = 𝑇𝑡 (𝑎𝑡 ) + 𝑇̇𝑡 (𝛼𝑡 − 𝑎𝑡 )
(2.19)
Ao substituir as equações acima nas equações de espaço de estados podemos
chegar no algoritmo de Filtro de Kalman Estendido.
𝑣𝑡 = 𝑦𝑡 − 𝐸(𝑦𝑡 ⁄𝑌𝑡−1 ) = 𝑦𝑡 − 𝑍(𝑎𝑡/𝑡−1 )
(2.20)
𝐹𝑡 = 𝑉𝑎𝑟(𝑣𝑡 ⁄𝑌𝑡−1 ) = 𝑍̇𝑃𝑡/𝑡−1 𝑍̇ ′ + 𝐻
(2.21)
𝑎𝑡/𝑡 = 𝐸(𝛼𝑡 ⁄𝑌𝑡 ) = 𝑎𝑡/𝑡−1 + 𝑃𝑡/𝑡−1 𝑍̇ ′ 𝐹𝑡−1 𝑣𝑡
(2.22)
𝑃𝑡/𝑡 = 𝑉𝑎𝑟(𝛼𝑡 ⁄𝑌𝑡 ) = 𝑃𝑡/𝑡−1 − 𝑃𝑡/𝑡−1 𝑍̇ ′ 𝐹𝑡−1 𝑍̇𝑃𝑡/𝑡−1
(2.23)
𝛼𝑡+1 = 𝐸(𝛼𝑡+1 /𝑌𝑡 ) = 𝑇𝑎𝑡/𝑡
(2.24)
𝑃𝑡+1 = 𝑉𝑎𝑟(𝛼𝑡+1 /𝑌𝑡 ) = 𝑇̇𝑃𝑡/𝑡 𝑇̇ ′ + 𝑄
(2.25)
23
Assim como no algoritmo original do Filtro de Kalman, através dos valores observados
em 𝑡, calculamos os erros da média e da matriz de covariância através das equações
2.20 e 2.21, depois atualizamos nosso sistema com as equações 2.22 e 2.23 obtendo
𝑎𝑡/𝑡 e 𝑃𝑡/𝑡 , com as equações 2.24 e 2.25 conseguimos gerar uma predição dos valores
de 𝛼𝑡+1 e 𝑃𝑡+1 condicionados a informação disponível no instante 𝑡. Executamos esse
algoritmo de forma iterativa com as novas informações disponibilizadas ao longo do
tempo.
24
3. METODOLOGIA E DADOS
Nessa seção serão detalhados o modelo teórico utilizado, suas diferentes formas de
estimação, os diferentes tratamentos dos dados de entrada e as métricas aplicadas
para comparação das diferentes abordagens com relação ao ajuste e principalmente
a predição.
Iniciaremos revisitando a expansão do modelo de Nelson-Sigel realizada por Diebold
e Li (2006) e como representa-la na estrutura de espaço de estados partindo da
mesma forma que foi exposto no por Diebold, Rudebush e Aruoba (2006) mostrando
as condições que diferenciam esse ser linear ou não-linear. Será detalhada também
a adaptação proposta para incorporar a possibilidade de saltos na curva devido as
decisões do Copom. Depois seguiremos com as técnicas de estimação aplicadas para
o modelo espaço de estados linear e o não-linear através do filtro de Kalman e do
Filtro de Kalman Estendido respectivamente.
Por fim será exposto quais os dados utilizados, detalhando fonte, período e diferentes
tratamentos utilizados.
Todas os métodos descritos nessa seção foram implementados no MATLAB.
3.1.
MODELO TEÓRICO UTILIZADO
Como apresentado por Diebold e Li (2006) o modelo de Nelson-Siegel é capaz através
da manipulação de parâmetros e seus fatores, atribuir a interpretação de nível,
inclinação e curvatura para os parâmetros 𝛽1, 𝛽2 e 𝛽3 respectivamente.
Modelo Nelson-Siegel (1987):
𝑦𝑡 (𝜏) = 𝑏1𝑡 + 𝑏2𝑡
1−𝑒 −𝜆𝑡 𝜏
𝜆𝑡 𝜏
- 𝑏3𝑡 𝑒 −𝜆𝑡𝜏
(3.1)
Extensão Diebold e Li (2006):
𝑦𝑡 (𝜏) = 𝛽1𝑡 + 𝛽2𝑡
1−𝑒 −𝜆𝑡 𝜏
𝜆𝑡 𝜏
1−𝑒 −𝜆𝑡 𝜏
+ 𝛽3𝑡 (
𝜆𝑡 𝜏
− 𝑒 −𝜆𝑡𝜏 )
(3.2)
Devido a sua vantagem interpretativa utilizaremos a forma funcional representada na
equação (3.2) nesse trabalho. Como consequência do objetivo de estimar o modelo
25
com dinamismo nos parâmetros, foi conveniente representar o modelo através da
estrutura de espaço de estados, viabilizando a aplicação das ferramentas de filtragem.
Se faz necessária a utilização de duas diferentes representações uma linear para
aplicação do filtro de Kalman e outra não-linear para aplicação do Filtro de Kalman
Estendido. Em ambas, vamos assumir que as variáveis de estado do modelo são
guiadas por processo vetor auto-regressivo (VAR) de primeira ordem, onde o
dinamismo dos parâmetros no instante 𝑡 + 1, depende apenas dos valores
observados dos parâmetros no instante 𝑡.
3.1.1 REPRESENTAÇÕES DO MODELO EM ESTRUTURA LINEAR E
NÃO-LINEAR
Nelson-Siegel na estrutura linear de espaço de estados:
𝜀𝑡 ~𝑁(0, Σε )
𝑦𝑡 = Λ𝛽𝑡 + 𝜀𝑡
𝑡 = 1, … , 𝑇
(3.3)
Com 𝑦𝑡 = [𝑦𝑡 (𝜏1 ), … , 𝑦𝑡 (𝜏𝑁 )]′ sendo o vetor de observações da taxa de juros e 𝜀𝑡 =
[𝜀𝑡 (𝜏1 ), … , 𝜀𝑡 (𝜏𝑁 )]′ o vetor de erros. Temos Λ uma matriz 𝑁 × 3 com os fatores que
multiplicam o vetor de parâmetros 𝛽𝑡 = [𝛽1𝑡, 𝛽2𝑡, 𝛽3𝑡 ]′
1
Λ=
⋮
(
1
1−𝑒 −𝜆𝜏1
1−𝑒 −𝜆𝜏1 − 𝜆𝜏1 𝑒 −𝜆𝜏1
𝜆𝜏1
𝜆𝜏𝑖
⋮
⋮
1−𝑒 −𝜆𝜏𝑁
1−𝑒 −𝜆𝜏𝑁 − 𝜆𝜏𝑁 𝑒 −𝜆𝜏𝑁
𝜆𝜏𝑁
𝜆𝜏𝑁
(3.4)
)
Vale lembrar que para mantermos a estrutura linear o parâmetro 𝜆, que está contido
nos fatores que compõe a matriz Λ, deve ser considerado uma constante.
O vetor de parâmetros 𝛽𝑡 é modelado pela equação abaixo que representa o processo
VAR mencionado anteriormente.
𝛽𝑡+1 = (𝐼 − Φ)𝜇 + Φ𝛽𝑡 + 𝜂𝑡
𝜂𝑡 ~ 𝑁(0, Ση )
(3.5)
Sendo 𝜇 o vetor médio, Φ a matriz de coeficientes e Ση a matriz de variância. Como
condições iniciais temos que 𝛽0 ~ 𝑁(𝜇, Σ𝛽 ), onde a matriz Σ𝛽 é escolhida atendendo a
igualdade Σ𝛽 − ΦΣ𝛽 Φ = Σ𝜂 .
26
Nelson-Siegel na estrutura não-linear de espaço de estados:
A alteração da estrutura apresentada acima que permite colocar o modelo em uma
estrutura não linear consiste basicamente em considerar 𝜆 como o quarto parâmetro
do modelo, a seguir apresentamos como ficam as equações alteradas.
𝜀𝑡 ~𝑁(0, Σε )
𝑦𝑡 = Λ(𝜆𝑡 )𝛽𝑡 + 𝜀𝑡
𝑡 = 1, … , 𝑇
(3.6)
Agora a matriz Λ tem os fatores que compõe com dependência do parâmetro 𝜆𝑡 .
1
Λ(λt ) =
⋮
(
1
1−𝑒 −𝜆𝑡 𝜏1
1−𝑒 −𝜆𝑡 𝜏1 − 𝜆𝑡 𝜏1 𝑒 −𝜆𝑡 𝜏1
𝜆𝑡 𝜏1
𝜆𝑡 𝜏𝑖
⋮
⋮
1−𝑒 −𝜆𝑡 𝜏𝑁
1−𝑒 −𝜆𝑡 𝜏𝑁 − 𝜆𝑡 𝜏𝑁 𝑒 −𝜆𝑡 𝜏𝑁
𝜆𝑡 𝜏𝑁
𝜆𝑡 𝜏𝑁
(3.7)
)
Agora consideraremos nosso vetor de parâmetros de 𝛼𝑡 = [𝛽1𝑡, 𝛽2𝑡, 𝛽3𝑡, 𝜆𝑡 ]′ e sendo
modelado por um processo VAR, da mesma forma que foi feito na estrutura linear.
𝛼𝑡+1 = (𝐼 − Φ)𝜇 + Φ𝛼𝑡 + 𝜂𝑡
𝜂𝑡 ~ 𝑁(0, Ση )
(3.8)
Na matriz Φ foi imposta a condição de que o parâmetro 𝜆𝑡+1 só fosse influenciado pelo
parâmetro 𝜆𝑡−1 , que por sua vez não influenciaria nenhum dos demais parâmetros.
Essa abordagem foi utilizada pois reduz o número de parâmetros a ser estimado pela
verossimilhança.
3.1.2 ADAPTAÇÃO DO MODELO
Nesse trabalho realizamos uma adaptação do modelo contemplando uma
característica marcante do mercado brasileiro, a possível mudança da taxa Selic nas
reuniões do Comitê de Política Monetária (Copom). Se observamos o histórico da
Selic nos últimos 3 anos (gráfico 3.1), fica evidente a grande volatilidade da taxa de
juros brasileira, isso milita para que tenhamos um modelo com flexibilidade para
incorporar esses eventos de mudança uma vez que sabemos as datas nas quais ele
ocorre.
27
15
14
Taxa Selic (%)
13
12
11
10
9
8
7
01/05/2015
01/03/2015
01/01/2015
01/11/2014
01/09/2014
01/07/2014
01/05/2014
01/03/2014
01/01/2014
01/11/2013
01/09/2013
01/07/2013
01/05/2013
01/03/2013
01/01/2013
01/11/2012
01/09/2012
01/07/2012
01/05/2012
01/03/2012
01/01/2012
6
Data
Figura 2: Histórico taxa Selic nos últimos 3 anos.
Podemos interpretar que o dia seguinte a reunião do Copom é um possível salto na
curva do DI, uma vez que o principal direcionador do DI é a taxa Selic. Abaixo temos
um exemplo de como ficaria nossa curva incorporando esse salto, que representa a
expectativa do mercado com relação a decisão da reunião.
Figura 3: Representação de salto na estrutura termo da taxa de juros.
Para possibilitar que o modelo seja capaz de incorporar esse tipo de comportamento,
foi feita uma alteração em sua forma funcional. Ela consiste em fazer com que o
28
modelo tenha um diferente parâmetro representando o nível condicionado ao
vencimento do título ser antes ou depois da reunião.
Nessa adaptação vamos contemplar apenas a próxima reunião agendada, abaixo é
apresentada a forma funcional do modelo adaptado.
𝑦𝑡 (𝜏) = 𝕀𝑎 𝛽1𝑎𝑡 + 𝕀𝑑 𝛽1𝑑𝑡 + 𝛽2𝑡
1−𝑒 −𝜆𝑡 𝜏
𝜆𝑡 𝜏
1−𝑒 −𝜆𝑡 𝜏
+ 𝛽3𝑡 (
𝜆𝑡 𝜏
− 𝑒 −𝜆𝑡𝜏 )
𝕀𝑎 = {
1, 𝑠𝑒 𝑣𝑒𝑛𝑐𝑖𝑚𝑒𝑛𝑡𝑜 𝑎𝑐𝑜𝑛𝑡𝑒𝑐𝑒 𝑎𝑛𝑡𝑒𝑠 𝑑𝑜 𝐶𝑜𝑝𝑜𝑚
0, 𝑠𝑒 𝑣𝑒𝑛𝑐𝑖𝑚𝑒𝑛𝑡𝑜 𝑎𝑐𝑜𝑛𝑡𝑒𝑐𝑒 𝑑𝑒𝑝𝑜𝑖𝑠 𝑑𝑜 𝐶𝑜𝑝𝑜𝑚
𝕀𝑏 = {
0, 𝑠𝑒 𝑣𝑒𝑛𝑐𝑖𝑚𝑒𝑛𝑡𝑜 𝑎𝑐𝑜𝑛𝑡𝑒𝑐𝑒 𝑎𝑛𝑡𝑒𝑠 𝑑𝑜 𝐶𝑜𝑝𝑜𝑚
1, 𝑠𝑒 𝑣𝑒𝑛𝑐𝑖𝑚𝑒𝑛𝑡𝑜 𝑎𝑐𝑜𝑛𝑡𝑒𝑐𝑒 𝑑𝑒𝑝𝑜𝑖𝑠 𝑑𝑜 𝐶𝑜𝑝𝑜𝑚
(3.9)
Essa adaptação pode ser representada da mesma forma que o modelo linear pela
equação 3.3, precisamos apenas adaptar a matriz Λ, agora com dimensão 𝑁 × 4, e o
vetor 𝛽, com dimensão 4 × 1 como mencionado abaixo.
Λ=
(
𝕀𝑎
𝕀𝑏
⋮
⋮
𝕀𝑎
𝕀𝑏
1 − 𝑒 −𝜆𝜏1
𝜆𝜏1
⋮
1 − 𝑒 −𝜆𝜏𝑁
𝜆𝜏𝑁
1 − 𝑒 −𝜆𝜏1 − 𝜆𝜏1 𝑒 −𝜆𝜏1
𝜆𝜏𝑖
⋮
−𝜆𝜏𝑁
1−𝑒
− 𝜆𝜏𝑁 𝑒 −𝜆𝜏𝑁
)
𝜆𝜏𝑁
𝛽1𝑎
𝛽
𝛽 = [ 1𝑏 ]
𝛽2
𝛽3
3.2.
ESTIMAÇÃO DOS PARÂMETROS
Após construir a representação de espaço de estados dos modelos linear, linear
adaptado e não-linear utilizados no trabalho devem ser estimados os parâmetros que
compõe cada uma das estruturas, nessa seção serão descritos como foram aplicados
os Filtros de Kalman e Kalman Estendido em conjunto a maximização da
verossimilhança para estimação dos de cada um dos componentes dos modelos.
Ambos os filtros foram implementados sem impor condição de dimensão constante
dos vetores de observações, essa possibilidade foi mencionada por Durbin e
Koopman (2012).
29
3.2.1. FILTRO DE KALMAN
Nessa seção será descrita a aplicação de Filtro de Kalman na versão linear do modelo
de Nelson-Siegel composto pelas equações 3.3 e 3.5. Para aplicação do filtro são
necessárias as estimativas dos parâmetros 𝐻, 𝑄, 𝜇, Φ e dos chutes inicias 𝑎1/0 e 𝑃1/0 ,
como optamos pela versão linear precisamos também do valor de 𝜆 fixo que será
utilizado. Abaixo estão representadas o conjunto de equações utilizadas no filtro, os
parâmetros de entrada foram estimados através da maximização da verossimilhança
como será detalhado na seção 3.2.3.
𝑣𝑡 = 𝑦𝑡 − 𝐸(𝑦𝑡 ⁄𝑌𝑡−1 ) = 𝑦𝑡 − Λ𝑎𝑡/𝑡−1
(3.10)
𝐹𝑡 = 𝑉𝑎𝑟(𝑣𝑡 ⁄𝑌𝑡−1 ) = Λ𝑃𝑡/𝑡−1 Λ′ + 𝐻
(3.11)
𝑎𝑡/𝑡 = 𝐸(𝛼𝑡 ⁄𝑌𝑡 ) = 𝑎𝑡/𝑡−1 + 𝑃𝑡/𝑡−1 Λ′ 𝐹𝑡−1 𝑣𝑡
(3.12)
𝑃𝑡/𝑡 = 𝑉𝑎𝑟(𝛼𝑡 ⁄𝑌𝑡 ) = 𝑃𝑡/𝑡−1 − 𝑃𝑡/𝑡−1 Λ′ 𝐹𝑡−1Λ𝑃𝑡/𝑡−1
(3.13)
𝑎𝑡+1 = 𝐸(𝛼𝑡+1 /𝑌𝑡 ) = (𝐼 − Φ)𝜇 + Φ𝑎𝑡/𝑡
(3.14)
𝑃𝑡+1 = 𝑉𝑎𝑟(𝛼𝑡+1 /𝑌𝑡 ) = Φ𝑃𝑡/𝑡 Φ′ + 𝑄
(3.15)
3.2.2. FILTRO DE KALMAN ESTENDIDO
Nessa seção será descrita a aplicação de Filtro de Kalman Estendido para estimação
da versão não linear do modelo de Nelson-Siegel composto pelas equações 3.6 e 3.8.
Para aplicação do filtro são necessárias as estimativas dos parâmetros 𝐻, 𝑄, 𝜇, Φ e dos
chutes inicias 𝑎1/0 e 𝑃1/0 . Abaixo estão representadas o conjunto de equações
utilizadas no filtro, os parâmetros de entrada foram estimados através da maximização
da verossimilhança como será detalhado na seção 3.2.3.
𝑣𝑡 = 𝑦𝑡 − 𝐸(𝑦𝑡 ⁄𝑌𝑡−1 ) = 𝑦𝑡 − Λ(𝜆𝑡 )𝑎𝑡/𝑡−1 = 𝑦𝑡 − Z(𝑎𝑡/𝑡−1 )
(3.16)
𝐹𝑡 = 𝑉𝑎𝑟(𝑣𝑡 ⁄𝑌𝑡−1 ) = Ż𝑃𝑡/𝑡−1 Ż ′ + 𝐻
(3.17)
𝑎𝑡/𝑡 = 𝐸(𝛼𝑡 ⁄𝑌𝑡 ) = 𝑎𝑡/𝑡−1 + 𝑃𝑡/𝑡−1 Ż ′ 𝐹𝑡−1 𝑣𝑡
(3.18)
30
𝑃𝑡/𝑡 = 𝑉𝑎𝑟(𝛼𝑡 ⁄𝑌𝑡 ) = 𝑃𝑡/𝑡−1 − 𝑃𝑡/𝑡−1 Ż ′ 𝐹𝑡−1 Ż𝑃𝑡/𝑡−1
(3.19)
𝛼𝑡+1 = 𝐸(𝛼𝑡+1 /𝑌𝑡 ) = (𝐼 − Φ)𝜇 + Φ𝑎𝑡/𝑡
(3.20)
𝑃𝑡+1 = 𝑉𝑎𝑟(𝛼𝑡+1 /𝑌𝑡 ) = Φ𝑃𝑡/𝑡 Φ′ + 𝑄
(3.21)
3.2.3. ESTIMAÇÃO POR MÁXIMA VEROSSIMILHANÇA
Para executar a estimação ambas as versões do filtro exigem alguns parâmetros de
entrada além dos dados observados. São eles 𝜇 e Φ, os parâmetros que descrevem
o processos que vai guiar as variáveis de estado como podemos observar nas
equações 3.5 e 3.8, também precisamos das matrizes de variância dos resíduos das
variáveis de estado e das variáveis observadas, sendo elas 𝑄 e 𝐻 respectivamente.
Nesse trabalho vamos assumir que 𝑄 e 𝐻 são matrizes diagonais, com a diferença
que 𝑄 assumirá valores diferentes para cada elemento da diagonal e 𝐻 será composta
pelo mesmo valor sempre.
Os parâmetros 𝜇, Φ, 𝑄 e 𝐻 foram estimados através da maximização da
verossimilhança. O cálculo da verossimilhança para o filtro pode ser feito pela
equação abaixo com mostrado por Durbin e Koopman (2012).
log 𝐿(𝑌𝑛 ) = −
np
2
log 2𝜋 − ∑𝑛𝑡=1 (log|𝐹𝑡 | + 𝑣𝑡′ 𝐹𝑡−1 𝑣𝑡 )
(3.22)
Essa forma é válida quando assumimos que 𝑝(𝑦𝑡 /𝑌𝑡−1 ) = 𝑁(𝑍𝑎𝑡 , 𝐹𝑡 ).
Para maximização da verossimilhança foi utilizada a função fminunc do MATLAB, para
viabilizar a aplicação dela foram realizadas as transformações necessárias nas
variáveis para uma vez que esse algoritmo realiza uma otimização sem restrições.
3.2.4 ESTIMAÇÃO EM DOIS PASSOS
Nessa seção vamos comentar uma abordagem usual de estimação do modelo
dinâmico de Nelson-Siegel, vamos mostrar os resultados da comparação dele com o
31
Filtro Kalmam, ilustrando o motivo de utilizarmos a abordagem de filtragem para esse
trabalho.
A estimação em dois passos consiste em fixando o parâmetro 𝜆 aplicar uma regressão
linear em cada um dos dias que temos observações disponíveis, assim obtemos as
variáveis de estado ajustadas. Após obter as variáveis ajustados seguimos para o
segundo passo, ajustar um modelo vetor auto-regressivo de primeira ordem para gerar
as variáveis preditas.
É interessante pontuar qual principal diferença entre uma técnica de filtragem para a
estimação em dois passos, quando realizamos a filtragem o objetivo é criar variáveis
preditas que gerem o melhor ajuste da curva observada, já a abordagem em dois
passos busca as variáveis preditas que proporcionem o melhor ajuste das variáveis
de estados ajustadas. Com isso o modelo perde toda a informação contida na
diferença entre a curva observada e a curva gerada pelas variáveis ajustadas.
Abaixo mostramos um teste realizado mostrando que mesmo dentro da amostra de
calibragem a abordagem de dois passos gera um maior erro quadrático médio (𝐸𝑄𝑀).
1,80E-05
1,60E-05
1,40E-05
EQM
1,20E-05
1,00E-05
8,00E-06
6,00E-06
4,00E-06
2,00E-06
0,00E+00
Dois passos
Filtro de Kalman
Método de estimação
Figura 4: Comparação da estimação em dois passos com o filtro de Kalman na amostra 1.
3.3 DADOS UTILIZADOS
32
Foram utilizados os dados do futuro de DI do período de 19/10/2012 até 26/03/2015,
nas seções abaixo serão apresentados a metodologia de interpolação dos dados, que
foi utilizada para realizar a comparação entre as estimações dos modelos com dados
observados e com dados interpolados, também será detalhada como foram
construídas as amostras para desenvolvimento e validação dos modelos.
3.3.1 INTERPOLAÇÃO DOS DADOS
Como mencionado anteriormente nesse trabalho, a pratica usual para estimação do
modelo dinâmico de Nelson-Siegel parte dos dados interpolados, para que todos os
dias tenhamos a taxa para maturidades fixas e assim as dimensões de todas as
matrizes envolvidas no filtro não variem.
Nesse trabalho realizamos a implementação do filtro sem condições de dimensões
constantes para as matrizes de dados observados, isso nos permitirá realizar a
estimação dos modelos com os dados observados e com os interpolados e comparar
os resultados.
A interpolação consiste em projetar a taxa para um vértice onde não temos
observação, para isso utilizamos dois os pares de maturidade e taxa observados, são
eles o imediatamente anterior e o posterior. Foi utilizada a interpolação log-linear, por
ser aquela com maior sentido econômico dado o regime composto de capitalização
aplicado no mercado brasileiro.
A equação abaixo apresenta como interpolamos a taxa 𝑦 na maturidade 𝑥 partindo
dos pares (𝑥1 , 𝑦1 ) e (𝑥2 , 𝑦2 ) onde 𝑥1 < 𝑥 < 𝑥2 . Note que ela é chamada interpolação
log-linear, pois se aplicarmos o logaritmo em ambos os lados da equação temos a
equação de uma reta.
𝑥−𝑥1
𝑦=
𝑦 𝑥2−𝑥1
𝑦1 (𝑦2 )
1
(3.23)
Temos uma variação no cálculo da interpolação quando precisamos interpolar o
primeiro ponto, caso ele seja menor que a primeira observação, utilizamos as duas
primeiras observações para interpolar o primeiro ponto, ela é realizada utilizando
exatamente a mesma equação dos demais casos.
33
Nesse trabalho interpolamos nossas curvas em 20 vértices, sendo eles 1, 2, 3, 4, 6,
9, 12, 15, 18, 24, 30, 36, 42, 48, 54, 60, 72, 84, 96 e 108 meses até o vencimento.
Vale ressaltar que quais e quantos vértices são escolhidos influenciam diretamente o
resultado do modelo. O gráfico abaixo mostra para uma de nossas amostras a
diferença entre os dados brutos e interpolados, podemos notar que dependendo dos
vértices escolhidos acabamos censurando alguns dados. No nosso caso as taxas para
vencimentos superiores a 2500 dias não são consideradas, vamos mostrar como isso
influencia o resultado do modelo, seus benefícios e desvantagens.
Figura 5:Taxas observadas e interpoladas nos vértices fixos para amostra 4.
3.3.2 SELEÇÃO DAS AMOSTRAS
Utilizamos amostras de 200 dias para a estimação dos parâmetros e aplicação do
filtro, essas foram chamadas de amostras de desenvolvimento. Para avaliar a
capacidade de predição do modelo foram selecionados os 100 dias consecutivos a
cada uma das amostras de desenvolvimento, essas foram chamadas de amostras de
validação.
O modelo foi estimado em 4 amostras, a fragmentação dos dados em diferentes
amostras sequenciais e parcialmente sobrepostas foi uma ferramenta utilizada para
avaliar a robustez dos resultados e a possível existência de uma dinâmica no tempo
34
dos parâmetros de entrada dos filtros. A figura abaixo representa as amostras de
desenvolvimento e validação do modelo.
Amostra1
Amostra2
Amostra3
Amostra4
Desenvolvimento
19/10/2012 - 14/08/2013
Validação
15/08/2013 - 09/01/2014
Desenvolvimento
22/03/2013 - 09/01/2014
Validação
10/01/2014 - 05/06/2014
Desenvolvimento
15/08/2013 - 5/6/2014
Validação
06/06/2014 - 28/10/2014
Desenvolvimento
10/01/2014 - 28/10/2014
Validação
29/10/2014 - 26/03/2015
Figura 6: Representação das amostras utilizadas.
3.4 MÉTRICAS DE COMPARAÇÃO
Todos os modelos serão comparados entre si e também com a eficiência de utilizar
curva ajustada do dia atual como predição da curva do próximo dia. Para isso foi
utilizada a curva ajustada obtida pelo filtro de Kalman aplicado diretamente nos dados
observados.
𝑎𝑡+1 = 𝐸(𝛼𝑡 /𝑌𝑡 ) = 𝑎𝑡/𝑡
Os modelos também serão comparados com um passeio aleatório, definido pela
equação abaixo, onde 𝜀 ~ 𝑈(min Δ𝑎𝑡/𝑡 , max Δ𝑎𝑡/𝑡 ), sendo o mínimo e o máximo será
observado entre os parâmetros ajustados pelo Filtro de Kalman na amostra de
desenvolvimento.
𝑎𝑡+1 = 𝐸(𝛼𝑡 /𝑌𝑡 ) = 𝑎𝑡/𝑡 + 𝜀
Os modelos serão comparados através das métricas 𝐸𝑄𝑀 e 𝐸𝑀, onde uma delas tem
como objetivo mensurar a magnitude dos erros e a outra um possível viés
respectivamente. As fórmulas para o cálculo de cada uma estão abaixo, considerando
o valor observado como 𝜃 e o estimado como 𝜃̂.
̂
∑𝑁
𝑖=1(𝜃𝑖 − 𝜃𝑖 )
̂
𝐸𝑄𝑀(𝜃) =
𝑁
2
35
𝐸𝑀(𝜃̂) =
̂
∑𝑁
𝑖=1(𝜃𝑖 − 𝜃𝑖 )
𝑁
Serão avaliadas a diferença entre os erros para os modelos nas amostras de
desenvolvimento e validação, e a evolução dos erros ao longo horizonte de projeção.
Serão avaliados os erros diretamente na curva observada e nas variáveis de estado
também, considerando o descolamento entre variável projetada e variável ajustada
após observação da curva.
36
4. RESULTADOS
Para melhor entendimento dos resultados apresentados abaixo cada um dos modelos
será referenciado da seguinte forma:
- KF é o modelo de Nelson-Siegel estimado através do Filtro de Kalman com os dados
observados.
- KFi é o modelo de Nelson-Siegel estimado através do Filtro de Kalman com os dados
interpolados.
- KFd é o modelo de Nelson-Siegel adaptado com duas variáveis de nível, uma ativa
antes da próxima reunião do Copom e outra depois, estimado através do Filtro de
Kalman com os dados observados.
- KFc é o modelo de Nelson-Siegel estimado através do Filtro de Kalman com os
dados observados, excluindo aqueles com maturidades superiores a 2500 dias uteis.
- EKF é o modelo de Nelson-Siegel estimado com o Filtro de Kalman Estendido,
deixando o parâmetro de decaimento (𝜆) dinâmico, com os dados brutos.
- KFr é um dos modelos que será usado para comparação com os demais, ele assume
que a curva ajusta produzida pelo KF é a previsão para a curva de amanhã.
- KFp é o outro modelo que será utilizado para comparação, ele assume que os
parâmetros têm como dinâmica um passeio aleatório.
Incialmente será apresentada a avaliação dos modelos individualmente e depois
serão realizadas comparações consolidadas entre eles.
4.1 RESULTADOS KF
Primeiramente observamos o EQM e EM entre a curva predita e as taxas observadas
ao longo dos dias em cada uma das amostras, para tentar entender se o modelo
mantém o nível de qualidade observado no desenvolvimento nos dias da validação.
Após isso observamos os EQM entre os parâmetros preditos e os ajustados após a
observação para cada um dos dias, tentando buscar um maior entendimento do
resultado anterior. Os resultados obtidos foram sumarizados na tabela abaixo.
37
Modelo KF
Amostra 1
Amostra 2
Amostra 3
Amostra 4
Curva (taxa observada)
Parâmetros
Beta1
( variáveis de
Beta2
estado)
Beta3
Curva (taxa observada)
Parâmetros
Beta1
( variáveis de
Beta2
estado)
Beta3
Curva (taxa observada)
Parâmetros
Beta1
( variáveis de
Beta2
estado)
Beta3
Curva (taxa observada)
Parâmetros
Beta1
( variáveis de
Beta2
estado)
Beta3
Erro Quadrático Médio
Desenvolvimento
Validação
1.27E-06
1.78E-06
1.00E-06
1.52E-06
1.14E-06
1.75E-06
4.83E-06
5.72E-06
1.77E-06
1.43E-06
9.47E-07
1.13E-06
1.17E-06
1.51E-06
1.07E-05
5.18E-06
1.37E-06
2.06E-06
6.39E-07
1.91E-06
7.80E-07
2.03E-06
5.13E-06
6.73E-06
1.36E-06
5.22E-06
1.82E-06
3.63E-06
1.82E-06
2.46E-06
3.91E-06
2.82E-05
Erro Médio
Desenvolvimento
Validação
5.81E-06
1.87E-04
-8.09E-06
3.46E-04
2.37E-05
-5.26E-04
2.41E-05
3.30E-04
-1.81E-05
3.04E-04
-3.66E-06
7.42E-04
-1.35E-05
-8.65E-04
-3.09E-05
7.66E-05
1.04E-06
-1.05E-05
-3.45E-05
5.28E-05
6.07E-05
4.02E-05
2.34E-05
-5.04E-04
-4.02E-06
-1.72E-03
-9.73E-06
-1.09E-03
-3.21E-07
3.71E-04
4.36E-05
-4.52E-03
Tabela 1: EQM e EM durante os períodos de desenvolvimento e validação em cada uma das
amostras para o modelo KF.
6,0E-06
5,0E-06
4,0E-06
3,0E-06
2,0E-06
1,0E-06
0,0E+00
Amostra 1
Amostra 2
EQM Desenv
Amostra 3
Amostra 4
EQM Valid
Figura 7: EQM da curva no desenvolvimento e na validação nas 4 amostras para o modelo KF.
Observando as métricas de erro nas quatro amostras, notamos que o nível de
distorção entre os erros entre o desenvolvimento e validação não é muito grande, com
exceção da amostra 4 onde o EQM aumenta quase que 5 vezes e além disso
observamos um viés negativo no EM.
Fica nítido também que o parâmetro mais sensível é a curvatura, sendo ele quem
refletiu de forma mais direta o aumento dos erros de projeção da curva.
38
No gráfico abaixo vemos o EQM no período de validação para cada uma das
amostras, condicionada ao número de dias que o modelo será utilizado para projetar
a curva, nele conseguimos ver que além do grande descolamento já observado na
amostra 4 existe também uma tendência crescente mais forte que nas outras
amostras.
6,0E-06
5,0E-06
EQM
4,0E-06
3,0E-06
2,0E-06
1,0E-06
0,0E+00
10
20
30
40
50
60
70
80
90
100
Dias de utilização do modelo
Amostra 1
Amostra 2
Amostra 3
Amostra 4
Figura 8: EQM da curva no condicionado ao tempo de uso na validação para o modelo KF.
A utilização de quatro amostras sequenciais e parcialmente sobrepostas nos permite
analisar os parâmetros de entrada do filtro, estimados pela verossimilhança, esses
podem evidenciar a necessidade dinâmica nos mesmos e ajudar na compreensão dos
resultados acima.
39
2
1,5
1
0,5
0
-0,5
-1
amostra1
amostra2
µ1
amostra3
µ2
amostra4
µ3
Figura 9: Parâmetros (𝜇) que guiam a dinâmica das variáveis de estado para o modelo KF.
1,2
1
0,8
0,6
0,4
0,2
0
-0,2
-0,4
-0,6
amostra1
amostra2
amostra3
Ф11
Ф12
Ф13
Ф21
Ф23
Ф31
Ф32
Ф33
amostra4
Ф22
Figura 10: Parâmetros (𝛷) que guiam a dinâmica das variáveis de estado do modelo KF.
40
0,0014%
0,0012%
0,0010%
0,0008%
0,0006%
0,0004%
0,0002%
0,0000%
amostra1
amostra2
Q11
Q22
amostra3
Q33
amostra4
H
Figura 11: Parâmetros (𝑄, 𝐻) que guiam a dinâmica das variáveis de estado no modelo KF.
Notamos que em todos os parâmetros relacionados a curvatura apresentam maior
instabilidade. Ao analisar os parâmetros da matriz Φ, nas primeiras amostras
observamos algo próximo de uma matriz diagonal, que é o equivalente a pensarmos
que cada um dos parâmetros segue um processo independente auto-regressivo de
primeira ordem. Na amostra quatro os elementos fora da diagonal, principalmente
aqueles que tem relação de algum parâmetro com a curvatura mudam de forma
significante, podendo ser esse um dos motivadores da mudança na qualidade dos
resultados da projeção nessa amostra.
O conjunto dos resultados corrobora para um possível overfitting durante o
desenvolvimento nessa amostra.
Abaixo temos um gráfico com a variação do parâmetro 𝜆 entre as amostras, isso pode
evidenciar a necessidade utilizar um modelo que permita dinamismo nesse parâmetro
também. A ponderação entre a necessidade, as desvantagens e os benefícios dessa
abordagem serão feitas quando observarmos os resultados do filtro de Kalman
Estendido.
Parâmetro amostra 1 amostra 2 amostra 3 amostra 4
λ
0.004391427 0.002412 0.002508 0.006218
Tabela 2: Parâmetro de decaimento em cada uma das amostras com o modelo KF.
41
4.2 RESULTADOS KFi
Como essa versão do modelo usa exatamente a mesma estrutura do modelo
anterior, tendo como única diferença a interpolação dos dados observados antes da
aplicação do filtro, serão expostas as mesmas análises da seção anterior buscando
entender a diferença nos resultados.
Modelo KFi
Amostra 1
Amostra 2
Amostra 3
Amostra 4
Curva (taxa observada)
Parâmetros
Beta1
( variáveis de
Beta2
estado)
Beta3
Curva (taxa observada)
Parâmetros
Beta1
( variáveis de
Beta2
estado)
Beta3
Curva (taxa observada)
Parâmetros
Beta1
( variáveis de
Beta2
estado)
Beta3
Curva (taxa observada)
Parâmetros
Beta1
( variáveis de
Beta2
estado)
Beta3
Erro Quadrático Médio
Desenvolvimento
Validação
1.32E-06
1.84E-06
1.04E-06
1.64E-06
1.23E-06
1.97E-06
4.61E-06
5.47E-06
1.94E-06
1.27E-06
1.81E-06
1.53E-06
2.00E-06
1.81E-06
4.43E-06
3.29E-06
1.17E-06
1.90E-06
1.22E-06
2.53E-06
1.32E-06
2.28E-06
3.30E-06
5.68E-06
1.42E-06
1.55E-06
1.83E-06
2.21E-06
1.85E-06
2.39E-06
3.77E-06
5.38E-06
Erro Médio
Desenvolvimento
Validação
-5.19E-05
1.47E-04
1.36E-05
3.84E-04
-1.34E-06
-5.92E-04
1.42E-06
2.31E-04
-3.81E-05
2.34E-04
1.77E-06
7.68E-04
-4.75E-06
-8.34E-04
2.55E-05
-5.26E-04
-1.41E-04
-1.14E-04
-4.73E-05
5.81E-05
1.76E-05
-9.31E-05
6.54E-05
-6.94E-04
-6.56E-05
-1.14E-04
3.21E-05
1.24E-04
-7.02E-06
-4.18E-04
5.21E-05
-1.27E-04
Tabela 3: EQM e EM durante os períodos de desenvolvimento e validação em cada uma das
amostras para o modelo KFi.
2,5E-06
2,0E-06
1,5E-06
1,0E-06
5,0E-07
0,0E+00
Amostra 1
Amostra 2
EQM Desenv
Amostra 3
Amostra 4
EQM Valid
Figura 12: EQM da curva no desenvolvimento e na validação nas 4 amostras no modelo KFi.
Observando as métricas de erro nas quatro amostras, notamos que o nível de EQM e
distorção entre os erros entre o desenvolvimento e validação são muito próximos e
42
um pouco menores aos do modelo KF, com exceção da amostra 4 aonde o modelo
KF sofreu uma grande queda de desempenho enquanto o KFi continuou aderente.
Sua aderência também está refletida nos resultados de EQM condicionado ao tempo
de utilização, uma vez que os resultados são mais estáveis como observado no gráfico
abaixo.
5,0E-06
4,5E-06
4,0E-06
EQM
3,5E-06
3,0E-06
2,5E-06
2,0E-06
1,5E-06
1,0E-06
5,0E-07
0,0E+00
10
20
30
40
50
60
70
80
90
100
Dias de utilização do modelo
Amostra 1
Amostra 2
Amostra 3
Amostra 4
Figura 13: EQM da curva no condicionado ao tempo de uso na validação no modelo KFi.
Notamos pelo EQM que o modelo KFi parece superior ao KF, nesse momento é
importante lembrar que o desempenho do modelo KFi é fortemente dependente dos
vértices escolhidos para estimação, temos aqui um indicio que foram escolhidos
pontos que tornam a curva mais parcimoniosa gerando um modelo com preditividade
mais estável inclusive em momentos aonde temos uma grande volatilidade na
componente de curvatura. As análises a seguir nos ajudarão a fortalecer essa
hipótese.
43
2
1,5
1
0,5
0
-0,5
amostra1
amostra2
µ1
amostra3
µ2
amostra4
µ3
Figura 14: Parâmetros (𝜇) que guiam a dinâmica das variáveis de estado no modelo KFi.
1,2
1
0,8
0,6
0,4
0,2
0
-0,2
amostra1
amostra2
amostra3
Ф11
Ф12
Ф13
Ф21
Ф23
Ф31
Ф32
Ф33
amostra4
Ф22
Figura 15: Parâmetros (𝛷) que guiam a dinâmica das variáveis de estado no modelo KFi.
44
0,000007
0,000006
0,000005
0,000004
0,000003
0,000002
0,000001
0
amostra1
amostra2
Q11
Q22
amostra3
Q33
amostra4
H
Figura 16: Parâmetros (𝑄, 𝐻) que guiam a dinâmica das variáveis de estado no modelo KFi.
Os resultados acima mostram uma estabilidade entre as amostras superior ao
observado no modelo KF, esses resultados indicam que os parâmetros que guiam a
dinâmica das variáveis de estado não tenham necessidade de serem modeladas
dinamicamente e indicando que quando observamos instabilidade isso possa ser sinal
de alguma deficiência na estimação, como por exemplo overfitting.
Relembrando a informação contida no gráfico 3.2, conseguimos estruturar melhor
nosso raciocínio, concluindo que o KF tenta modelar a curva completa, ou seja, os
dados observados contemplam vértices mais longos. Encontrar uma estrutura de
parâmetros que forneça um bom ajuste para esses vértices mais longos acaba
penalizando a preditividade do modelo. Para confirmar essa hipótese temos o modelo
KFc que foi construído com os dados observados, mas desconsiderando os vértices
mais longo, seus resultados serão apresentados na próxima seção.
Além disso também observamos o 𝐸𝑄𝑀 por faixa de maturidade, ou seja,
particionamos cada uma das curvas observadas em 8 intervalos para identificar como
cada uns dos modelos desempenha em cada intervalo. Os gráficos abaixo mostram
os resultados.
45
3,0E-06
2,5E-06
EQM
2,0E-06
1,5E-06
1,0E-06
5,0E-07
0,0E+00
até 63 dias 64-126 dias 127-252
dias
253-504
dias
505-756
dias
757-1512 1513-2268 mais que
dias
dias
2268 dias
Faixa de maturidade
KF (desenvolvimento)
KFi (desenvolvimento)
KF (validação)
KFi (validação)
Figura 17: EQM por faixa de maturidade na amostra 1.
3,5E-06
3,0E-06
EQM
2,5E-06
2,0E-06
1,5E-06
1,0E-06
5,0E-07
0,0E+00
até 63 dias 64-126 dias 127-252
dias
253-504
dias
505-756
dias
757-1512 1513-2268 mais que
dias
dias
2268 dias
Faixa de maturidade
KF (desenvolvimento)
KFi (desenvolvimento)
KF (validação)
KFi (validação)
Figura 18: EQM por faixa de maturidade na amostra 2
46
3,5E-06
3,0E-06
EQM
2,5E-06
2,0E-06
1,5E-06
1,0E-06
5,0E-07
0,0E+00
até 63 dias 64-126 dias 127-252
dias
253-504
dias
505-756
dias
757-1512 1513-2268 mais que
dias
dias
2268 dias
Faixa de maturidade
KF (desenvolvimento)
KFi (desenvolvimento)
KF (validação)
KFi (validação)
Figura 19: EQM por faixa de maturidade na amostra 3.
4,5E-06
4,0E-06
3,5E-06
EQM
3,0E-06
2,5E-06
2,0E-06
1,5E-06
1,0E-06
5,0E-07
0,0E+00
até 63 dias 64-126 dias 127-252
dias
253-504
dias
505-756
dias
757-1512 1513-2268 mais que
dias
dias
2268 dias
Faixa de maturidade
KF (desenvolvimento)
KFi (desenvolvimento)
KF (validação)
KFi (validação)
Figura 20: EQM por faixa de maturidade na amostra 4
Pela análise dos gráficos fica evidente que o modelo KF apresenta um desempenho
superior nas maturidades mais longas no desenvolvimento, isso é uma consequência
da utilização desses dados na estimação, mas em alguns casos como no da amostra
4 esse benefício de ter um modelo melhor ajustado no desenvolvimento acaba
gerando uma estrutura menos preditiva na amostra de validação.
47
Os resultados do modelo KFc serão utilizados para avaliar se quando partimos de
dados referentes ao mesmo trecho da curva quais os benefícios e desvantagens de
interpolar os dados
Voltamos também a analisar a variação do parâmetro de decaimento (𝜆) entre as
amostras. Existe uma variação relativa significante desse parâmetro no tempo porem
com comportamento diferente do observado no KF.
Parâmetro amostra 1 amostra 2 amostra 3 amostra 4
λ
0.00448 0.005757 0.00781 0.006647
Tabela 4: Parâmetro de decaimento em cada uma das amostras com o modelo KFi.
4.3 RESULTADOS KFc
Como mencionado na seção anterior essa versão do modelo foi construída para testar
se a busca por um ajuste para os vértices mais longos compromete a preditividade do
modelo, abaixo apresentamos o desempenho do modelo nas métricas de erro.
Modelo KFc
Amostra 1
Amostra 2
Amostra 3
Amostra 4
Curva (taxa observada)
Parâmetros
Beta1
( variáveis de
Beta2
estado)
Beta3
Curva (taxa observada)
Parâmetros
Beta1
( variáveis de
Beta2
estado)
Beta3
Curva (taxa observada)
Parâmetros
Beta1
( variáveis de
Beta2
estado)
Beta3
Curva (taxa observada)
Parâmetros
Beta1
( variáveis de
Beta2
estado)
Beta3
Erro Quadrático Médio
Desenvolvimento
Validação
1.27E-06
1.77E-06
1.02E-06
1.58E-06
1.17E-06
1.85E-06
4.81E-06
5.62E-06
1.87E-06
1.39E-06
1.62E-06
1.36E-06
1.76E-06
1.63E-06
5.16E-06
3.29E-06
1.11E-06
1.85E-06
1.13E-06
2.50E-06
1.16E-06
2.16E-06
3.49E-06
6.44E-06
1.39E-06
1.46E-06
1.77E-06
2.09E-06
1.69E-06
2.17E-06
4.26E-06
5.96E-06
Erro Médio
Desenvolvimento
Validação
-3.10E-06
1.71E-04
-1.20E-06
3.82E-04
1.59E-05
-5.77E-04
-4.29E-05
1.50E-04
-2.29E-05
3.37E-04
-3.32E-05
7.04E-04
1.53E-05
-8.03E-04
3.12E-05
-3.48E-04
3.10E-05
-2.57E-05
1.68E-05
1.10E-04
2.59E-05
-8.77E-05
3.62E-05
-7.44E-04
3.91E-05
-4.62E-05
3.67E-05
1.25E-04
-1.93E-05
-3.67E-04
5.85E-05
-2.13E-04
Tabela 5: EQM e EM durante os períodos de desenvolvimento e validação em cada uma das
amostras para o modelo KFc.
48
2,0E-06
1,8E-06
1,6E-06
1,4E-06
1,2E-06
1,0E-06
8,0E-07
6,0E-07
4,0E-07
2,0E-07
0,0E+00
Amostra 1
Amostra 2
Amostra 3
EQM Desenv
Amostra 4
EQM Valid
Figura 21: EQM da curva no desenvolvimento e na validação nas 4 amostras no modelo KFc.
3,5E-06
3,0E-06
EQM
2,5E-06
2,0E-06
1,5E-06
1,0E-06
5,0E-07
0,0E+00
10
20
30
40
50
60
70
80
90
100
Dias de utilização do modelo
Amostra 1
Amostra 2
Amostra 3
Amostra 4
Figura 22: EQM da curva no condicionado ao tempo de uso na validação para o modelo KFc.
Como esperado a grande distorção do EQM médio na amostra 4, foi mitigada quando
deixamos de utilizar as observações dos vértices mais longos na estimação do
modelo. Com relação as métricas de erro de observamos que o modelo estimado com
dados brutos tem desempenho marginalmente superior, reforçando a ideia de utilizar
dados interpolados não traz nenhuma vantagem na estimação do modelo e ainda gera
uma dependência muito grande entre o resultado e os vértices escolhidos.
Também percebemos que a estimação do modelo deve ser coerente com sua
aplicação, por exemplo se o objetivo for montar uma estratégia de negociação de
49
títulos com vencimento nos vértices mais longos o modelo KFc apresentaria
resultados piores que o modelo KF, apesar de ser melhor em uma visão agregada.
Abaixo são apresentados os gráficos com os parâmetros que guiam as variáveis de
estado, vale ressaltar que elas são visivelmente mais estáveis que as dos demais
modelos.
2
1,5
1
0,5
0
-0,5
amostra1
amostra2
µ1
amostra3
µ2
amostra4
µ3
Figura 23: Parâmetros (𝜇) que guiam a dinâmica das variáveis de estado no modelo KFc.
1,2
1
0,8
0,6
0,4
0,2
0
-0,2
amostra1
amostra2
amostra3
Ф11
Ф12
Ф13
Ф21
Ф23
Ф31
Ф32
Ф33
amostra4
Ф22
Figura 24: Parâmetros (𝛷) que guiam a dinâmica das variáveis de estado no modelo KFc.
50
0,000007
0,000006
0,000005
0,000004
0,000003
0,000002
0,000001
0
amostra1
amostra2
Q11
Q22
amostra3
Q33
amostra4
H
Figura 25: Parâmetros (𝑄, 𝐻) que guiam a dinâmica das variáveis de estado no modelo KFc.
Observamos também a dinâmica do parâmetro de decaimento entra as amostras, ele
apresenta uma tendência de alta mesmo com os demais parâmetros aparentemente
estáveis.
Parâmetro amostra 1 amostra 2 amostra 3 amostra 4
λ
0.004553 0.005255 0.007861 0.006856
Tabela 6: Parâmetro de decaimento em cada uma das amostras com o modelo KFc.
4.4 RESULTADOS KFd
A seguir vamos avaliar os resultados da adaptação proposta, buscando entender
quais benefícios e fragilidades que ela apresenta.
51
Modelo KFd
Amostra 1
Amostra 2
Amostra 3
Amostra 4
Curva (taxa observada)
Nível A
Parâmetros
Nível B
( variáveis de
Inclinação
estado)
Curvatura
Curva (taxa observada)
Nível A
Parâmetros
Nível B
( variáveis de
Inclinação
estado)
Curvatura
Curva (taxa observada)
Nível A
Parâmetros
Nível B
( variáveis de
Inclinação
estado)
Curvatura
Curva (taxa observada)
Nível A
Parâmetros
Nível B
( variáveis de
Inclinação
estado)
Curvatura
Erro Quadrático Médio
Desenvolvimento
Validação
1.42E-06
3.65E-06
4.26E-07
2.94E-06
1.44E-06
5.47E-06
1.49E-06
5.91E-06
5.91E-06
4.83E-06
1.84E-06
1.27E-06
8.86E-07
7.95E-07
1.52E-06
1.06E-06
1.84E-06
1.32E-06
1.07E-05
5.35E-06
1.09E-06
1.82E-06
3.58E-07
5.66E-07
1.10E-06
2.54E-06
1.04E-06
2.01E-06
3.69E-06
7.32E-06
1.49E-06
2.79E-06
8.05E-07
3.68E-06
2.16E-06
4.31E-06
1.84E-06
4.48E-06
5.43E-06
8.10E-06
Erro Médio
Desenvolvimento
Validação
2.09E-05
-6.17E-04
2.13E-05
-1.10E-03
3.20E-05
-1.20E-03
-2.75E-05
1.53E-03
-1.62E-05
2.34E-04
2.56E-05
-3.53E-05
8.65E-05
4.35E-05
8.88E-05
5.36E-05
-1.09E-04
1.27E-04
-3.00E-05
-6.00E-04
-4.87E-06
1.87E-04
-1.46E-05
-4.22E-05
-1.22E-05
2.73E-04
3.28E-05
2.34E-05
-2.32E-05
-6.18E-04
7.49E-05
7.53E-04
3.98E-05
1.20E-03
3.37E-05
1.06E-03
3.41E-05
-1.24E-03
1.55E-04
1.08E-03
Tabela 7: EQM e EM durante os períodos de desenvolvimento e validação em cada uma das
amostras para o modelo KFd.
4,0E-06
3,5E-06
3,0E-06
2,5E-06
2,0E-06
1,5E-06
1,0E-06
5,0E-07
0,0E+00
Amostra 1
Amostra 2
EQM Desenv
Amostra 3
Amostra 4
EQM Valid
Figura 26: EQM da curva no desenvolvimento e na validação nas 4 amostras para o modelo KFd.
52
7,0E-06
6,0E-06
EQM
5,0E-06
4,0E-06
3,0E-06
2,0E-06
1,0E-06
0,0E+00
10
20
30
40
50
60
70
80
90
100
Dias de utilização do modelo
Amostra 1
Amostra 2
Amostra 3
Amostra 4
Figura 27: EQM da curva no condicionado ao tempo de uso na validação para o modelo KFd.
Pelos gráficos acima percebemos que no caso do modelo incluindo dois interceptos
tivemos um avanço com relação ao modelo KF, nas amostras 2, 3 e 4. Vale ressaltar
que na amostra 4, ele não apresentou uma grande distorção entre o desenvolvimento
e a validação como o KF, ficando mais próximo dos resultados a apresentados pelos
modelos KFi e KFc. Esse resultado traz uma evidência que o desempenho baixo do
modelo KF na amostra 4 seja devido a uma variação na estrutura da curva
(principalmente nos vértices longos como vimos anteriormente) que ao ser capturada
apenas pelos 3 parâmetros gerou um modelo pouco preditivo.
Aqui temos um indício que a inclusão de parâmetros adicionais pode reforçar a
estrutura do modelo, ou seja, é possível conseguir uma estrutura mais preditiva sem
precisar excluir um trecho da curva como fazemos nos modelos KFi e KFc. Um
exemplo de abordagem que adiciona parâmetros ao modelo é a adaptação proposta
por Svesson (1994).
A adaptação proposta nesse trabalho trouxe ganhos de desempenho em algumas
amostras, ela gera evidências de que essa possa ser uma boa abordagem para o
mercado brasileiro, lembrando que ela precisa ser aprimorada. Existe a possibilidade
de incorporar por exemplo o efeito não só de uma reunião copom, talvez de todas
aquelas que o mercado tinha informação naquela data, aqui mantivemos os demais
parâmetros com o mesmo comportamento, vale investigar abordagens.
53
É importante mencionar os resultados observados na amostra 1, quando o modelo
KFd apresentou uma deterioração muito grande de sua capacidade preditiva na
amostra de validação. A diferença desse resultado com os observados nos demais é
tivemos um aumento do EQM em todos os parâmetros e não só na curvatura. Abaixo
estão listadas as análises realizadas sobre estabilidade dos parâmetros estimados
pela verossimilhança para guiar as variáveis de estado, com esses resultados
buscamos entender melhor o que observamos nas métricas de erro que foram
expostas anteriormente.
2,5
2
1,5
1
0,5
0
-0,5
-1
amostra 1
amostra 2
µ1
amostra 3
µ2
µ3
amostra 4
µ4
Figura 28: Parâmetros (𝜇) que guiam a dinâmica das variáveis de estado no modelo KFd.
2,5
2
1,5
1
0,5
0
-0,5
-1
-1,5
amostra 1
amostra 2
amostra 3
amostra 4
Ф11
Ф12
Ф13
Ф14
Ф21
Ф22
Ф23
Ф24
Ф31
Ф32
Ф33
Ф34
Ф41
Ф42
Ф43
Ф44
Figura 29: Parâmetros (𝛷) que guiam a dinâmica das variáveis de estado no modelo KFd.
54
0,000014
0,000012
0,00001
0,000008
0,000006
0,000004
0,000002
0
amostra 1
Q11
amostra 2
Q22
amostra 3
Q33
Q44
amostra 4
H
Figura 30: Parâmetros (𝑄, 𝐻) que guiam a dinâmica das variáveis de estado no modelo KFd.
Como observamos nos gráficos acima o modelo apresentam grande instabilidade nos
parâmetros que as variáveis de estado, fica o alerta que precisamos buscar
parcimônia entre número de parâmetros e overfiting.
Como já realizado para os modelos KF e KFi, avaliamos a variação do parâmetro de
decaimento (𝜆) entre as amostras, para verificar a adequação de fixar esse parâmetro
constante no modelo.
Parâmetro amostra 1 amostra 2 amostra 3 amostra 4
λ
0.004411 0.002395 0.007968 0.006156
Tabela 8: Parâmetro de decaimento em cada uma das amostras com o modelo KFd.
4.5 RESULTADOS EKF
Nessa seção são apresentados os resultados do modelo EKF que tem como
diferencial ser estimado permitindo que o parâmetro de decaimento também tenha
dinâmica no tempo. A seguir temos os gráficos que representam o desempenho desse
modelo de acordo com as métricas 𝐸𝑄𝑀 e 𝐸𝑀.
55
Modelo EKF
Amostra 1
Amostra 2
Amostra 3
Amostra 4
Curva (taxa observada)
Nível
Parâmetros
Inclinação
( variáveis de
Curvatura
estado)
Decaimento
Curva (taxa observada)
Nível
Parâmetros
Inclinação
( variáveis de
Curvatura
estado)
Decaimento
Curva (taxa observada)
Nível
Parâmetros
Inclinação
( variáveis de
Curvatura
estado)
Decaimento
Curva (taxa observada)
Nível
Parâmetros
Inclinação
( variáveis de
Curvatura
estado)
Decaimento
Erro Quadrático Médio
Desenvolvimento
Validação
1.99E-06
3.69E-06
4.90E-07
7.42E-07
5.02E-07
6.91E-07
2.52E-05
5.61E-05
1.26E-08
5.76E-09
7.15E-06
7.54E-06
5.74E-07
3.98E-07
5.58E-07
2.99E-07
5.68E-05
6.75E-05
4.94E-07
1.97E-07
1.93E-06
5.58E-06
1.12E-06
2.64E-06
8.54E-07
1.86E-06
3.19E-05
1.87E-04
1.30E-07
5.97E-08
1.06E-05
1.12E-05
1.98E-06
1.54E-05
1.18E-06
2.41E-06
2.23E-04
7.33E-04
1.48E-06
2.18E-07
Erro Médio
Desenvolvimento
Validação
5.76E-05
1.55E-04
-3.01E-05
2.82E-05
7.88E-05
5.50E-05
2.74E-04
3.99E-04
6.19E-06
9.68E-06
9.63E-04
1.79E-03
-5.11E-05
-3.32E-05
1.01E-04
1.58E-05
6.12E-04
6.05E-03
3.95E-04
2.54E-04
-1.85E-04
-2.21E-04
-5.78E-05
8.48E-05
1.13E-05
6.59E-05
-8.12E-04
-3.46E-03
-2.04E-05
5.82E-05
1.98E-04
5.52E-04
9.95E-05
-3.17E-03
5.53E-05
-9.63E-04
2.44E-03
2.63E-02
7.36E-05
-3.22E-06
Tabela 9: EQM e EM durante os períodos de desenvolvimento e validação em cada uma das
amostras para o modelo EKF.
1,2E-05
1,0E-05
8,0E-06
6,0E-06
4,0E-06
2,0E-06
0,0E+00
Amostra 1
Amostra 2
EQM Desenv
Amostra 3
Amostra 4
EQM Valid
Figura 31: EQM da curva no desenvolvimento e na validação nas 4 amostras para o modelo EKF.
56
2,5E-05
EQM
2,0E-05
1,5E-05
1,0E-05
5,0E-06
0,0E+00
10
20
30
40
50
60
70
80
90
100
Dias de utilização do modelo
Amostra 1
Amostra 2
Amostra 3
Amostra 4
Figura 32: EQM da curva no condicionado ao tempo de uso na validação para o modelo EKF.
Através dos resultados fica evidente que o patamar dos erros para o modelo EKF é
muito superior aos observados em todos os modelos anteriores em todas as amostras.
Na sequência serão apresentadas as análises realizadas com os parâmetros
utilizados para guiar a dinâmica das variáveis de estado, essa informação será
utilizada para entender melhor os resultados das métricas de erro já apresentados.
2
1,5
1
0,5
0
-0,5
-1
amostra 1
amostra 2
µ1
amostra 3
µ2
µ3
amostra 4
µ4
Figura 33: Parâmetros (𝜇) que guiam a dinâmica das variáveis de estado no modelo EKF.
57
2
1,5
1
0,5
0
-0,5
-1
-1,5
amostra 1
amostra 2
amostra 3
amostra 4
Ф11
Ф12
Ф13
Ф21
Ф22
Ф23
Ф31
Ф32
Ф33
Ф44
Figura 34: Parâmetros (𝛷) que guiam a dinâmica das variáveis de estado no modelo EKF.
0,0005
0,00045
0,0004
0,00035
0,0003
0,00025
0,0002
0,00015
0,0001
0,00005
0
amostra 1
Q11
amostra 2
Q22
amostra 3
Q33
Q44
amostra 4
H
Figura 35: Parâmetros (𝑄, 𝐻) que guiam a dinâmica das variáveis de estado no modelo EKF.
O objetivo de calibrar o EKF é conseguir permitir que o parâmetro de decaimento varie
ao longo do tempo, durante esse trabalho usamos nossas amostras sequências para
evidenciar essa necessidade, como foi mostrado no resultado de todos os modelos
acima. No gráfico abaixo fica evidente que nossa aplicação do filtro de Kalman
Estendido não foi a capaz de refletir essa dinâmica na variável de estado. Vale
ressaltar que as séries abaixo têm mais de 90% de correlação, ou seja, nossa predição
varia no sentido correto, mas a magnitude dessa variação é tão pequena que o
resultado é visualmente constante quando comparado a variação na variável ajustada
dada as observações.
58
0,0095
0,0085
0,0075
0,0065
0,0055
0,0045
1
10
19
28
37
46
55
64
73
82
91
100
109
118
127
136
145
154
163
172
181
190
199
208
217
226
235
244
253
262
271
280
289
0,0035
Decaimento (predito)
Decaimento (ajustado)
Figura 36: Variável de decaimento (λ) ajustada e predita na amostra 4 no modelo EKF.
O comportamento da variável ajustada e a qualidade do ajuste da curva dadas as
observações mostram que o filtro de de Kalmam Estendido é eficiente, mas existe
uma dificuldade para calibrar os parâmetros que guiam as variáveis de estado através
da verossimilhança. Esse problema já foi reportado por alguns autores ..., além da
não-linearidade, violação da normalidade também é mencionada a forte correlação
entre as variáveis como motivador de deficiência, observamos correlações superiores
a 90% entre as variáveis em nossas amostras de desenvolvimento.
4.6 RESULTADOS KFp
Abaixo estão listados de forma breve os resultados do modelo KFp que será
utilizado adiante para comparação com os demais.
59
Modelo KFp
Amostra 1
Amostra 2
Amostra 3
Amostra 4
Curva (taxa observada)
Parâmetros
Nível
( variáveis de Inclinação
estado)
Curvatura
Curva (taxa observada)
Parâmetros
Nível
( variáveis de Inclinação
estado)
Curvatura
Curva (taxa observada)
Parâmetros
Nível
( variáveis de Inclinação
estado)
Curvatura
Curva (taxa observada)
Parâmetros
Nível
( variáveis de Inclinação
estado)
Curvatura
Erro Quadrático Médio
Desenvolvimento
Validação
8.53E-06
8.37E-06
5.59E-06
5.55E-06
7.99E-06
6.31E-06
3.34E-05
3.02E-05
8.16E-06
3.13E-06
3.49E-06
1.74E-06
5.00E-06
1.62E-06
5.98E-05
1.54E-05
6.22E-06
1.18E-05
3.00E-06
8.32E-06
2.95E-06
6.82E-06
4.08E-05
2.69E-05
1.43E-05
1.30E-05
1.18E-05
1.07E-05
1.12E-05
9.04E-06
2.81E-05
3.30E-05
Erro Médio
Desenvolvimento
Validação
-2.01E-04
-1.07E-04
-1.18E-04
9.76E-05
-1.83E-04
-3.58E-04
-5.65E-05
-2.93E-04
-5.99E-05
2.69E-04
-2.41E-04
2.04E-04
-3.79E-05
1.11E-05
1.02E-03
2.45E-04
-5.10E-06
-4.84E-04
-3.52E-06
-2.91E-04
-2.00E-05
-3.27E-04
5.98E-05
-1.33E-04
-2.70E-04
3.66E-04
-2.74E-04
2.83E-04
-1.27E-04
3.02E-04
3.15E-04
-1.12E-04
Tabela 10: EQM e EM durante os períodos de desenvolvimento e validação em cada uma das
amostras para o modelo KF.
4.7 RESULTADOS KFr
Abaixo estão listados de forma breve os resultados do modelo KFr que será utilizado
adiante para comparação com os demais.
Modelo KFr
Amostra 1
Amostra 2
Amostra 3
Amostra 4
Curva (taxa observada)
Parâmetros
Nível
( variáveis de Inclinação
estado)
Curvatura
Curva (taxa observada)
Parâmetros
Nível
( variáveis de Inclinação
estado)
Curvatura
Curva (taxa observada)
Parâmetros
Nível
( variáveis de Inclinação
estado)
Curvatura
Curva (taxa observada)
Parâmetros
Nível
( variáveis de Inclinação
estado)
Curvatura
Erro Quadrático Médio
Desenvolvimento
Validação
1.30E-06
1.74E-06
1.05E-06
1.47E-06
1.18E-06
1.52E-06
4.89E-06
5.53E-06
1.82E-06
1.26E-06
1.00E-06
6.03E-07
1.19E-06
8.52E-07
1.08E-05
5.34E-06
1.38E-06
1.95E-06
6.51E-07
1.89E-06
7.85E-07
2.03E-06
5.18E-06
5.80E-06
1.39E-06
1.50E-06
1.87E-06
2.14E-06
1.87E-06
2.19E-06
4.14E-06
5.79E-06
Erro Médio
Desenvolvimento
Validação
-1.34E-04
-1.23E-04
-1.33E-04
-1.72E-04
7.33E-05
1.03E-05
-1.62E-04
3.00E-04
-1.72E-04
4.17E-05
-2.07E-04
1.32E-04
5.90E-05
-2.20E-04
1.88E-05
1.83E-04
-4.78E-05
-7.92E-06
-3.93E-05
9.33E-05
-7.26E-05
-1.11E-04
1.61E-04
-3.22E-04
2.02E-05
-1.66E-04
9.22E-05
-7.78E-05
-1.11E-04
-1.16E-04
-1.85E-04
-6.23E-05
Tabela 11: EQM e EM durante os períodos de desenvolvimento e validação em cada uma das
amostras para o modelo KF.
4.8 RESULTADOS CONSOLIDADOS
60
As tabelas apresentadas a seguir comparam através do 𝐸𝑄𝑀 e do 𝐸𝑀 os modelos
listados acima.
Métrica
EQM Desenvolvimento
EQM Validação
KF
1.27E-06
1.78E-06
KFi
1.32E-06
1.84E-06
Amostra1
KFd
1.42E-06
3.65E-06
EKF
1.99E-06
3.69E-06
KFr
1.30E-06
1.74E-06
KFp
8.53E-06
8.37E-06
KFc
1.27E-06
1.77E-06
Tabela 12: EQM durante os períodos de desenvolvimento e validação da amostra 1, para todo os
modelos.
Métrica
EQM Desenvolvimento
EQM Validação
KF
1.77E-06
1.43E-06
KFi
1.94E-06
1.27E-06
Amostra2
KFd
1.84E-06
1.27E-06
EKF
7.15E-06
7.54E-06
KFr
1.82E-06
1.26E-06
KFp
8.16E-06
3.13E-06
KFc
1.87E-06
1.39E-06
Tabela 13: EQM durante os períodos de desenvolvimento e validação da amostra 2, para todo os
modelos.
Métrica
EQM Desenvolvimento
EQM Validação
KF
1.37E-06
2.06E-06
KFi
1.17E-06
1.90E-06
Amostra3
KFd
1.09E-06
1.82E-06
EKF
1.93E-06
5.58E-06
KFr
1.38E-06
1.95E-06
KFp
6.22E-06
1.18E-05
KFc
1.11E-06
1.85E-06
Tabela 14: EQM durante os períodos de desenvolvimento e validação da amostra 3, para todo os
modelos.
Métrica
EQM Desenvolvimento
EQM Validação
KF
1.36E-06
5.22E-06
KFi
1.42E-06
1.55E-06
Amostra4
KFd
1.49E-06
2.79E-06
EKF
1.06E-05
1.12E-05
KFr
1.39E-06
1.50E-06
KFp
1.43E-05
1.30E-05
KFc
1.39E-06
1.46E-06
Tabela 15: EQM durante os períodos de desenvolvimento e validação da amostra 4, para todo os
modelos.
Métrica
EM Desenvolvimento
EM Validação
KF
-3.83E-06
-3.09E-04
Média em todas as amostras
KFi
KFd
EKF
-7.41E-05
2.91E-05
2.58E-04
3.80E-05
7.20E-05
5.70E-04
KFr
-8.32E-05
-6.38E-05
KFp
-1.34E-04
1.11E-05
KFc
1.10E-05
1.09E-04
Tabela 16: Média do EM durante os períodos de desenvolvimento e validação em todas as amostras,
para todo os modelos.
O gráfico abaixo sumariza os resultados observados nas tabelas acima, mostrando
que nenhum dos modelos consegue ter um poder preditivo significantemente superior
a simples utilização da curva do dia atual como estimativa para o próximo dia.
61
3,0E-06
2,5E-06
2,0E-06
1,5E-06
1,0E-06
5,0E-07
5,4E-06
7,0E-06
9,3E-06
9,1E-06
0,0E+00
EQM Desenv
KF
KFi
EQM Valid
KFd
EKF
KFr
KFc
KFp
Figura 37: Média do EQM nas 4 amostras no desenvolvimento e na validação para cada modelo.
Buscando entender com mais detalhes a capacidade de predição de cada um desses
modelos foi avaliado como EQM evolui se um modelo calibrado em 200 dias como
esse for em horizontes de tempo variando de 10 até 100 dias.
0,0011%
0,0009%
EQM
0,0007%
0,0005%
0,0003%
0,0001%
-0,0002%
KF
10
20
30
40
50
60
70
80
90
100
Dias de utilização do modelo
KFi
KFd
EKF
KFr
KFc
KFp
Figura 38: Evolução do EQM dado o horizonte de aplicação do modelo no período de validação,
média em todas as amostras.
62
5. CONCLUSÃO
Através do conjunto de modelos calibrados e das análises realizadas conseguimos
entender melhor as vantagens e desvantagens da utilização do modelo dinâmico de
Nelson-Siegel.
Sobre os dados, concluímos que a interpolação dos dados não traz vantagens na
estimação do modelo e pode embutir um viés no mesmo dependendo dos vértices
escolhidos para estimação. Entendendo que a melhor abordagem é a utilização dos
dados brutos, colocamos como ressalva a necessidade de um prévio mapeamento
de qual será a aplicação do modelo calibrado, por exemplo a utilização das
observações das maturidades mais longas acaba tornando o modelo menos
preditivo para as maturidades curtas.
Sobre o período para calibração, notamos que quando partimos para abordagem de
fixar o parâmetro de decaimento o parâmetro de curvatura principalmente tende a
absorver as variações que deveriam ocorrer no parâmetro fixado, mas precisamos
ter parcimônia sobre a duração da robustez dessa compensação, os modelos não
aparentam uma degradação rápida do seu desempenho. Devemos, no entanto, nos
atentar a possível perda de interpretação dos parâmetros e a possíveis distorções
causadas pelos efeitos de correlação que são largamente comentados na literatura.
Uma abordagem que intuitivamente tornaria o modelo robusto por mais tempo, seria
a estimação de todos os parâmetros com dinâmica, mas como vimos os resultados
do modelo EKF foram insatisfatórios frente aos demais, esse resultado corroborou
com o relatado por diversos autores ao comentar da dificuldade de calibração do
modelo em um estrutura não-linear.
Sobre o poder preditivo do modelo, primeiramente verificamos que a abordagem de
filtragem é muito mais eficiente que a estimação em dois passos, depois realizando
comparação dos diversos modelos estimados contra um passeio aleatório
mostramos que a preditividade é significativamente superior.
Porem a comparação da predição com a simples utilização da curva ajustada do
dia anterior mostrou que para o horizonte de um dia nossos resultados foram apenas
marginalmente superiores, mas vale ressaltar que essa última comparação é um
63
resultado pontual referente a aplicação de um VAR(1) para as dinâmica variáveis de
estados do mercadora brasileiro em um período específico.
Sobre a adaptação proposta, vimos que ela tem uma capacidade preditiva razoável,
podendo gerar uma interpretação dos parâmetros mais próxima aos fatores que
realmente guiam a taxa no nosso mercada. Fica como ressalva a necessidade de ter
parcimônia com relação ao número de parâmetros, podendo gerar uma
especificação sobre ajustada a amostra e por consequência um modelo pouco
preditivo, também é importante atentar a correlação entre os parâmetros.
Em linhas gerais, observamos que o modelo dinâmico de Nelson-Siegel combinado
com o Filtro de Kalman é uma estrutura eficiente e preditiva, porém muito sensível
demandando uma atenção com relação a estrutura de correlação dos parâmetros,
horizonte de maturidades utilizadas e período de calibragem. Por fim é importante
lembrar da dependência relativa a eficiência do algoritmo de otimização aplicado
calibrar os parâmetros, uma vez que é recorrente na literatura que a sensibilidade
aos chutes iniciais pode perturbar a calibração.
64
6. REFERÊNCIAS BIBLIOGRÁFICAS
AFONSO, António; MARTINS, Manuel M. F. Level, slope, curvature of the sovereign
yield curve, and fiscal behaviour. Journal of Banking & Finance, n. 1276, 2010.
ANDERSON, B. D. O.; MOORE, J. B. Optimal filtering. Prentice-Hall, 1979.
BARRETT, W. R.; GOSNELL, T. F. Jr; HEUSON, A. J. Yield Curve Shifts and the
Selection of Immunization Strategies, Journal of Fixed Income, Vol. 5, No. 2, 1995.
BIS. Zero-Coupon Yield Curves: Technical Documentation. BIS Papers 25, Bank for
International Settlements, 2005.
BJÖRK, T.; CHRISTENSEN, B. J. Interest rate dynamics and consistent forward rate
curves. Mathematical Finance, v. 9, n. 4, p. 323-348, 1999.
BLISS, Robert R. Movements in the term structure of interest rates. Federal Reserve
Bank of Atlanta Review, 1997.
BOLDER, D.; STRÉLISKI, D. Yield Curve Modelling at the Bank of Canada, Bank of
Canada Technical Report, n. 84, 1999
CALDEIRA, J. F.; LAURINI, M. P.; PORTUGAL, M. S. Inferência bayesiana aplicada
ao modelo dinâmico de Nelson-Siegel com volatilidade estocástica nos fatores.
Revista Brasileira de Econometria, v. 30, n. 1, p. 123-161. 2010.
CALDEIRA, J. F; MOURA, G. V.; PORTUGAL, M. S. Efficient Yield Curve Estimation
and Forecasting in Brazil. Revista EconomiA, v. 11, n. 1, p. 27-51. 2010.
CALDEIRA, J. F.; MOURA, G. V.; SANTOS, A. A. P. Otimização de Carteiras de
Renda Fixa: Uma Abordagem Baseada em Modelos Fatoriais Dinâmicos
Heterocedásticos. Texto para discussão, Universidade Federal de Santa Catarina;
Florianópolis, 2012.
COMMANDEUR, Jacques J. F.; KOOPMAN, Siem Jan. An introduction to state space
time series analysis. Oxford University Press, 2007.
COX, J. C.; INGERSOLL, J. E.; ROSS, S. A. A theory of the term structure of interest
rates. Econometrica, v. 52, n. 2, p. 385-407, 1985.
65
DIEBOLD, Francis X.; LI, Canlin. Forecasting the term structure of government bond
yields. Journal of Econometrics, v. 130, n. 2, p. 337-364, 2006.
DIEBOLD, Francis X.; RUDEBUSCH, Glenn D.; ARUOBA, S. Boragan. The
macroeconomy and the yield curve: a dynamic latent factor approach. Journal of
econometrics, v. 131, n. 1-2, p. 309-338, 2006.
DUFFEE, G. R. Term premia and interest rates forecasts in affine models. Journal of
Finance, v. 57, n. 1, p. 405-443, 2002.
DUFFIE, D.; KAN, R. A Yield-Factor Model of Interest Rates, Mathematical Finance,
6, 379-406, 1996.
DURBIN, J.; KOOPMAN, S. J. Time series analysis by state space methods. 2nd. ed.
Oxford University Press, 2012.
FABOZZI, F. J.; MARTELLINI, L.; PRIAULET. P. Advanced Bond Portfolio
Management, Wiley Finance ,2005.
FRIEDMAN, Milton. Time perspective in demand for money. University of Chicago,
1977.
GILLI, M; GROBE, S; SCHUMANN, E. Calibrating the Nelson-Siegel-Svensson model.
COMISEF Working Paper Series 031, 2010.
GOODWIN, G. C.; SIN, K. S. Adaptative Filtering Prediction and Control, Dover
Publications, 2009.
GURKAYNAK, R. S.; SACK, B.; WRIGHT, J. H. The U.S. Treasury Yield Curve: 1961
to the Present, 2006.
HAMILTON, James D. Time Series Analysis. Princeton University Press, 1994.
HARVEY, Andrew. Forecasting, structural time series models and the Kalman Filter.
Cambridge University, 1989.
HARVEY, Andrew. Forecasting with unobserved components time series models.
North-Holland, 2006.
HO, Thomas S. Y.; Lee, Sang-Bin. Term structure movements and pricing interest rate
contingent claims. The Journal of Finance, v. 41, n. 5, p. 1011-1029, 1986.
66
HULL, J.; WHITE, A. Pricing interest rate derivative securities. The Review of Financial
Studies, v. 3, n. 4, p. 573-592, 1990.
HURN, A. S.; LINDSAY, K. A.; PAVLOV, V. Smooth estimation of yield curves by
Laguerre functions , 2005.
KALMAN, R. E. A New Approach to Linear Filtering and Predction Problems, Research
Institute for Advanced Study, Baltimore, Md, 1960.
KALMAN, R. E.; BUCY, R. S. New Results in Linear Filtering and Prediction Theory.
Journal of Basic Engineering, v. 83, p. 95-108, 1961.
KOOPMAN, Siem Jan; MALEE, Max; Van der Wel, Michael. Analyzing the term
structure of interest rates using the dynamic Nelson-Siegel model with time-varying
parameters. Journal of Business and Economic Statistics, v. 28, n. 33, p. 329-343,
2010.
LÜTKEPOHL, Helmut. New introduction to multiple time series analysis. Springer,
2007.
MULLER, B. B. Modelo Nelson-Siegel Dinâmico da Estrutura a Termo da Taxa de
Juros com Fatores Exógenos Macroeconômicos Uma aplicação ao mercado
brasileiro, FGV-EESP, 2014.
NELSON, C. R.; SIEGEL, A. F. Parsimonious modeling of yield curves. Journal of
business, v. 60, n. 4, p. 473-489. 1987.
POOTER, Michiel De. Examining the Nelson-Siegel Class of Term Structure Models.
Tinbergen Institute Discussion Paper. 2007.
SIEGEL, AF; NELSON, CR. Long-term behavior of yield curves. The Journal of
Financial and Quantitative Analysis, n. 1789, 1988.
SVENSSON, L. E. O. Estimating and Interpreting Forward Interest Rates: Sweden
1992-1994. p. 49, 1994.
TUSELL-PALMER, F. Kalman Filtering in R. Journal of Statistical Software, v. 39, n. 2,
2011.
VASICEK, O. An equilibrium characterization of the term structure. Journal of Financial
Economics, v. 5, n. 2, p. 177-188, 1977.
67
WIENER, Norbert. Extrapolation, Interpolation and Smoothing of Stationary Time
Series, 1949.
Download

Dissertação João final - Sistema de Bibliotecas FGV