FUNDAÇÃO GETULIO VARGAS ESCOLA DE ECONOMIA DE SÃO PAULO JOÃO GABRIEL COSTA FRANCISCANGELO VANTAGENS E DESVANTAGENS DO MODELO DINÂMICO DE NELSON-SIEGEL: APLICAÇÃO AO MERCADO BRASILEIRO SÃO PAULO 2015 JOÃO GABRIEL COSTA FRANCISCANGELO VANTAGENS E DESVANTAGENS DO MODELO DINÂMICO DE NELSON-SIEGEL: APLICAÇÃO AO MERCADO BRASILEIRO Dissertação apresentada à Escola de Economia de São Paulo da Fundação Getúlio Vargas, como requisito para obtenção do título de Mestre em Economia. Campo de conhecimento: Finanças Quantitativas Orientador: Prof. Dr. Juan Carlos Ruilova Terán SÃO PAULO 2015 Franciscangelo, Joao Gabriel Costa VANTAGENS E DESVANTAGENS DO MODELO DINÂMICO DE NELSONSIEGEL: APLICAÇÃO AO MERCADO BRASILEIRO / João Gabriel Costa Franciscangelo. - 2015. 68 f. Orientador: Juan Carlos Ruilova Téran Dissertação (MPFE) - Escola de Economia de São Paulo. 1. Mercado financeiro - Brasil. 2. Taxas de juros - Brasil. 3. Kalman, Filtragem de. 4. Métodos de espaço de estados. I. Ruilova Téran. II. Dissertação (MPFE) - Escola de Economia de São Paulo. III. Título. CDU 336.781.5(81) JOÃO GABRIEL COSTA FRANCISCANGELO VANTAGENS E DESVANTAGENS DO MODELO DINÂMICO DE NELSON-SIEGEL: APLICAÇÃO AO MERCADO BRASILEIRO Dissertação apresentada à Escola de Economia de São Paulo da Fundação Getúlio Vargas, como requisito para obtenção do título de Mestre em Economia. Campo de conhecimento: Finanças Quantitativas Data de aprovação: ___ / ___ / ___ Banca Examinadora: ______________________________ Prof. Dr. Juan Carlos Ruilova Terán (Orientador) FGV – EESP ______________________________ Prof. Dr. Rogério Mori FGV – EESP ______________________________ Prof. Dr. Flavio Henn Ferreira Itaú BBA AGRADECIMENTOS Ao professor Juan Carlos Ruilova Téran, pela orientação no trabalho. Aos demais professores do mestrado, pelos conhecimentos compartilhados ao longo curso. À minha mãe Livia e aos meus demais familiares, pelo apoio e incentivo durante toda minha vida. RESUMO A modelagem da estrutura a termo da taxa juros tem grande relevância para o mercado financeiro, isso se deve ao fato de ser utilizada na precificação de títulos de crédito e derivativos, ser componente fundamental nas políticas econômicas e auxiliar a criação de estratégias trading. A classe de modelos criada por Nelson-Siegel (1987), foi estendida por diversos autores e atualmente é largamente utilizada por diversos bancos centrais ao redor do mundo. Nesse trabalho utilizaremos a extensão proposta por Diebold e Li (2006) aplicada para o mercado brasileiro, os parâmetros serão calibrados através do Filtro de Kalman e do Filtro de Kalman Estendido, sendo que o último método permitirá estimar com dinamismo os quatros parâmetros do modelo. Como mencionado por Durbin e Koopman (2012), as fórmulas envolvidas no filtro de Kalman e em sua versão estendida não impõe condições de dimensão constante do vetor de observações. Partindo desse conceito, a implementação dos filtros foi feita de forma a possibilitar sua aplicação independentemente do número de observações da curva de juros em cada instante de tempo, dispensando a necessidade de interpolar os dados antes da calibração. Isso ajuda a refletir mais fielmente a realidade do mercado e relaxar as hipóteses assumidas ao interpolar previamente para obter vértices fixos. Também será testada uma nova proposta de adaptação do modelo de Nelson-Siegel, nela o parâmetro de nível será condicionado aos títulos terem vencimento antes ou depois da próxima reunião do Copom. O objetivo é comparar qualidade da predição entre os métodos, pontuando quais são as vantagens e desvantagens encontradas em cada um deles. Palavras-chave: Modelo dinâmico de Nelson-Siegel; Espaço de Estados; Filtro de Kalman; Filtro de Kalman Estendido; ABSTRACT Modeling the term structure of interest rates has high relevance to the financial market, due to the fact of its utilization for pricing bonds and derivatives, being a fundamental component in the economic policies and assisting in the development of trading strategies. The class of models created by Nelson-Siegel(1987), was extended by many authors and currently is largely used by several centel banks around the world. In this work the extension proposed by Diebold and Li (2006) was applied to the brazilian market, the parameters were calibrated using the Kalman Filter and the Kalman Filter Extended, the last method allowing the estimation with dinamism of all the four parameters used in the model. As mentioned by Durbin and Koopman (2012), the equations contained in the Kalman filter and its extended version do not enforce conditions of constant dimensions in the observations vector. Based on this concept, the filters implementation were made allowing its application independent on the number of observations on each time instant, avoiding the need of previous interporlation of data. It helps the model to reflect more faithfully the markets reality and relax the assumed hypotheses to obtain fixed vértices through interpolation. A new propose of adaptation will be tested in the Nelson-Siegel model, where the level parameter will be conditioned to the bond’s maturities happened before or after the next Copom’s meeting. The objective is to compare the prediction quality across the methods, pointing the benefits and drawbacks observed on each one of them. Palavras-chave: Dinamic Nelson-Siegel Model; State Space; Kalman Filter; Extended Kalman Filter; Sumário 1. INTRODUÇÃO ............................................................................................................................ 12 2. REVISÃO DA LITERATURA .................................................................................................... 16 2.1. MODELO DE NELSON-SIEGEL...................................................................................... 16 2.1.1. 2.2. REPRESENTAÇÃO DE ESPAÇO DE ESTADOS ........................................................ 18 2.2.1. 2.3. 3. EXTENSÃO DE DIEBOLD E LI................................................................................ 16 MODELO DE NELSON-SIEGEL EM ESPAÇO DE ESTADOS .......................... 18 TÉCNICAS DE FILTRAGEM ............................................................................................ 19 2.3.1. FILTRO DE KALMAN ................................................................................................ 20 2.3.2. FILTRO DE KALMAN ESTENDIDO ........................................................................ 21 METODOLOGIA E DADOS ...................................................................................................... 24 3.1. MODELO TEÓRICO UTILIZADO .................................................................................... 24 3.1.1 REPRESENTAÇÕES DO MODELO EM ESTRUTURA LINEAR E NÃO-LINEAR 25 3.1.2 ADAPTAÇÃO DO MODELO ........................................................................................... 26 3.2. ESTIMAÇÃO DOS PARÂMETROS................................................................................. 28 3.2.1. FILTRO DE KALMAN ................................................................................................ 29 3.2.2. FILTRO DE KALMAN ESTENDIDO ........................................................................ 29 3.2.3. ESTIMAÇÃO POR MÁXIMA VEROSSIMILHANÇA ............................................. 30 3.2.4 ESTIMAÇÃO EM DOIS PASSOS................................................................................ 30 3.3 DADOS UTILIZADOS ............................................................................................................. 31 3.3.1 INTERPOLAÇÃO DOS DADOS..................................................................................... 32 3.3.2 SELEÇÃO DAS AMOSTRAS ......................................................................................... 33 3.4 MÉTRICAS DE COMPARAÇÃO ........................................................................................... 34 4. RESULTADOS ............................................................................................................................ 36 4.1 RESULTADOS KF ................................................................................................................... 36 4.2 RESULTADOS KFi .................................................................................................................. 41 4.3 RESULTADOS KFc ................................................................................................................. 47 4.4 RESULTADOS KFd................................................................................................................. 50 4.5 RESULTADOS EKF ................................................................................................................ 54 4.6 RESULTADOS KFp................................................................................................................. 58 4.7 RESULTADOS KFr ................................................................................................................. 59 4.8 RESULTADOS CONSOLIDADOS ........................................................................................ 59 5. CONCLUSÃO ................................................................................................................................. 62 6. REFERÊNCIAS BIBLIOGRÁFICAS............................................................................................ 64 LISTA DE FIGURAS Figura 1: Peso dos fatores em função das variações de λt. ...................................... 17 Figura 2: Histórico taxa Selic nos últimos 3 anos. ..................................................... 27 Figura 3: Representação de salto na estrutura termo da taxa de juros. .................... 27 Figura 4: Comparação da estimação em dois passos com o filtro de Kalman na amostra 1. ................................................................................................................. 31 Figura 5:Taxas observadas e interpoladas nos vértices fixos para amostra 4. ......... 33 Figura 6: Representação das amostras utilizadas. .................................................... 34 Figura 7: EQM da curva no desenvolvimento e na validação nas 4 amostras para o modelo KF. ................................................................................................................ 37 Figura 8: EQM da curva no condicionado ao tempo de uso na validação para o modelo KF. ............................................................................................................................. 38 Figura 9: Parâmetros (𝜇) que guiam a dinâmica das variáveis de estado para o modelo KF. ............................................................................................................................. 39 Figura 10: Parâmetros (Φ) que guiam a dinâmica das variáveis de estado do modelo KF. ............................................................................................................................. 39 Figura 11: Parâmetros (𝑄, 𝐻) que guiam a dinâmica das variáveis de estado no modelo KF. ............................................................................................................................. 40 Figura 12: EQM da curva no desenvolvimento e na validação nas 4 amostras no modelo KFi. ............................................................................................................... 41 Figura 13: EQM da curva no condicionado ao tempo de uso na validação no modelo KFi. ............................................................................................................................ 42 Figura 14: Parâmetros 𝜇 que guiam a dinâmica das variáveis de estado no modelo KFi. ............................................................................................................................ 43 Figura 15: Parâmetros (Φ) que guiam a dinâmica das variáveis de estado no modelo KFi. ............................................................................................................................ 43 Figura 16: Parâmetros (𝑄, 𝐻) que guiam a dinâmica das variáveis de estado no modelo KFi. ............................................................................................................................ 44 Figura 17: EQM por faixa de maturidade na amostra 1. ............................................ 45 Figura 18: EQM por faixa de maturidade na amostra 2 ............................................. 45 Figura 19: EQM por faixa de maturidade na amostra 3. ............................................ 46 Figura 20: EQM por faixa de maturidade na amostra 4 ............................................. 46 Figura 21: EQM da curva no desenvolvimento e na validação nas 4 amostras no modelo KFc. .............................................................................................................. 48 Figura 22: EQM da curva no condicionado ao tempo de uso na validação para o modelo KFc. .............................................................................................................. 48 Figura 23: Parâmetros (𝜇) que guiam a dinâmica das variáveis de estado no modelo KFc. ........................................................................................................................... 49 Figura 24: Parâmetros (Φ) que guiam a dinâmica das variáveis de estado no modelo KFc. ........................................................................................................................... 49 Figura 25: Parâmetros (𝑄, 𝐻) que guiam a dinâmica das variáveis de estado no modelo KFc. ........................................................................................................................... 50 Figura 26: EQM da curva no desenvolvimento e na validação nas 4 amostras para o modelo KFd. .............................................................................................................. 51 Figura 27: EQM da curva no condicionado ao tempo de uso na validação para o modelo KFd. .............................................................................................................. 52 Figura 28: Parâmetros (𝜇) que guiam a dinâmica das variáveis de estado no modelo KFd. ........................................................................................................................... 53 Figura 29: Parâmetros (Φ) que guiam a dinâmica das variáveis de estado no modelo KFd. ........................................................................................................................... 53 Figura 30: Parâmetros (𝑄, 𝐻) que guiam a dinâmica das variáveis de estado no modelo KFd. ........................................................................................................................... 54 Figura 31: EQM da curva no desenvolvimento e na validação nas 4 amostras para o modelo EKF............................................................................................................... 55 Figura 32: EQM da curva no condicionado ao tempo de uso na validação para o modelo EKF............................................................................................................... 56 Figura 33: Parâmetros (𝜇) que guiam a dinâmica das variáveis de estado no modelo EKF. .......................................................................................................................... 56 Figura 34: Parâmetros (Φ) que guiam a dinâmica das variáveis de estado no modelo EKF. .......................................................................................................................... 57 Figura 35: Parâmetros (𝑄, 𝐻) que guiam a dinâmica das variáveis de estado no modelo EKF. .......................................................................................................................... 57 Figura 36: Variável de decaimento (λ) ajustada e predita na amostra 4 no modelo EKF. .................................................................................................................................. 58 Figura 37: Média do EQM nas 4 amostras no desenvolvimento e na validação para cada modelo. ............................................................................................................. 61 Figura 38: Evolução do EQM dado o horizonte de aplicação do modelo no período de validação, média em todas as amostras. .................................................................. 61 LISTA DE TABELAS Tabela 1: EQM e EM durante os períodos de desenvolvimento e validação em cada uma das amostras para o modelo KF. ...................................................................... 37 Tabela 2: Parâmetro de decaimento em cada uma das amostras com o modelo KF. .................................................................................................................................. 40 Tabela 3: EQM e EM durante os períodos de desenvolvimento e validação em cada uma das amostras para o modelo KFi. ...................................................................... 41 Tabela 4: Parâmetro de decaimento em cada uma das amostras com o modelo KFi. .................................................................................................................................. 47 Tabela 5: EQM e EM durante os períodos de desenvolvimento e validação em cada uma das amostras para o modelo KFc. ..................................................................... 47 Tabela 6: Parâmetro de decaimento em cada uma das amostras com o modelo KFc. .................................................................................................................................. 50 Tabela 7: EQM e EM durante os períodos de desenvolvimento e validação em cada uma das amostras para o modelo KFd. .................................................................... 51 Tabela 8: Parâmetro de decaimento em cada uma das amostras com o modelo KFd. .................................................................................................................................. 54 Tabela 9: EQM e EM durante os períodos de desenvolvimento e validação em cada uma das amostras para o modelo EKF. .................................................................... 55 Tabela 10: EQM e EM durante os períodos de desenvolvimento e validação em cada uma das amostras para o modelo KF. ...................................................................... 59 Tabela 11: EQM e EM durante os períodos de desenvolvimento e validação em cada uma das amostras para o modelo KF. ...................................................................... 59 Tabela 12: EQM durante os períodos de desenvolvimento e validação da amostra 1, para todo os modelos. ............................................................................................... 60 Tabela 13: EQM durante os períodos de desenvolvimento e validação da amostra 2, para todo os modelos. ............................................................................................... 60 Tabela 14: EQM durante os períodos de desenvolvimento e validação da amostra 3, para todo os modelos. ............................................................................................... 60 Tabela 15: EQM durante os períodos de desenvolvimento e validação da amostra 4, para todo os modelos. ............................................................................................... 60 Tabela 16: Média do EM durante os períodos de desenvolvimento e validação em todas as amostras, para todo os modelos. ................................................................ 60 12 1. INTRODUÇÃO Em meados da década de 1970, as taxas de juros deixaram de ser vistas como mercados separados para cada maturidade, foi então introduzida a visão de uma curva que passa pelas taxas para cada uma das maturidades. A partir desse momento, acadêmicos iniciaram estudos que se estendem até hoje com o objetivo de ajustar e prever essa curva conhecida como a estrutura a termo da taxa de juros (ETTJ). Os primeiros esforços nessa área resultaram na classe de modelos de equilíbrio que surgiram com Vasicek (1977), ao considerar a ETTJ seguia um processo de OrnsteinUhlenbeck, aperfeiçoamentos das fragilidades observadas nesse modelo foram apresentados ao longo do tempo, exemplos são Cox, Ingersoll e Ross (1985) e Duffie e Kan (1996). Outra linha desenvolvida são os modelos de não-arbitragem, que tem como objetivo ajustar a ETTJ em um mundo neutro ao risco. Essa característica é muito útil na precificação de derivativos, entre os trabalhos que seguem essa linha estão os de Ho e Lee (1986), e Hull e White (1990). Em contrapartida de sua eficiência na precificação de derivativos, esses modelos não conseguem ser utilizados para previsão da curva de juros devido a sua base em teorias “neutras ao risco” que desconsideram a dinâmica observada. A deficiência na previsão da curva também é observada para os modelos de equilíbrio, também conhecidos como modelos afins, que não conseguiram superar a capacidade de previsão de passeios aleatórios no estudo de Duffee (2002). Os modelos de equilíbrio têm foco em modelar as dinâmicas das taxas instantâneas, depois as taxas para outras maturidades podem ser derivadas sobre várias premissas sobre prêmio de risco. Foi declarada por Milton Friedman (1977, p .22) a necessidade de buscar modelos mais parcimoniosos para a ETTJ através de formas funcionais com um número reduzido de parâmetros. Seguindo essa linha, Nelson-Siegel (1987) propôs uma nova 13 classe de modelos que não se enquadrava entre as duas já mencionadas anteriormente. Ele apresentou um modelo de três fatores, com estrutura flexível o suficiente para representar a gama de formas observadas para curva de juros. Incialmente os parâmetros podiam ser interpretados como os componentes de curto, médio e longo prazo da ETTJ. Diversas extensões desse modelo foram apresentadas, entre elas está Diebold e Li (2006), que após realizarem alterações nos fatores conseguiram trazer a interpretação de nível, inclinação e curvatura para os parâmetros do modelo, além de testarem a capacidade de predição dessa estrutura através da modelagem da dinâmica dos parâmetros ao longo do tempo com um modelo autoregressivo de primeira ordem, para facilitar o processo de estimação dinâmica o parâmetro de decaimento foi mantido constante, sendo possível representar o modelo através de uma estrutura linear. Outra extensão muito difundida foi apresentada por Svensson (1994), ele adicionou um novo parâmetro de curvatura tornando a estrutura mais flexível. Atualmente o modelo de Nelson-Siegel e suas extensões são utilizados por diversos bancos centrais, uma vez que a ETTJ é utilizada como um indicador de política monetária, pois através dela conseguimos além de acompanhar a política atual ter um indicador transparente dos possíveis próximos movimentos que serão tomados. Além disso ETTJ também é utilizada na precificação de títulos de crédito e derivativos. No Brasil por exemplo, diariamente são divulgados pela Anbima os parâmetros do modelo de Nelson-Siegel Svensson para IPCA e títulos públicos prefixados. Na literatura são relatados diversas estratégias e problemas na calibração do modelo dinâmico, onde os parâmetros variam no tempo. Uma abordagem usual para mitigar complicações na estimação consiste em fixar os parâmetros necessários para que o modelo possa ser escrito através de uma estrutura linear assim como feito por Diebold e Li (2006), e estimar os demais parâmetros através de mínimos quadrados ordinários. Essa abordagem traz a facilidade de trabalhar com um modelo linear, mas ainda continua existindo dificuldades causadas pela multicolinearidade dos parâmetros. Quando trabalhamos com estimação de parâmetros dinamicamente, uma ferramenta largamente difundida na literatura são as técnicas de filtragem, sendo mais especifico no contexto do nosso problema aparecem o filtro de Kalman e o Filtro de Kalman 14 Estendido. Koopman, Mallee e Wel (2010) utilizaram ambos esses filtros aplicados nos dados mensais da U.S. treasury yield. Nesse trabalho utilizaremos a versão de Diebold e Li (2006) para ajustar a curva de prefixados do mercado brasileiro, seguiremos duas abordagens de estimação, a primeira será utilizar o Filtro de Kalman mantendo o parâmetro de decaimento constante para que tenhamos um modelo de espaço de estados linear, a segunda abordagem permitirá que todos os parâmetros variem ao longo do tempo o que exigira a aplicação do Filtro de Kalman Estendido que foi construído para modelo de espaço de estados não-lineares. Foi realizado também um estudo para evidenciar a vantagem da aplicação de uma técnica de filtragem com relação a estimação em duas etapas, que estima primeiro os parâmetros no tempo e depois tenta modelar sua dinâmica. Ambos os filtros serão implementados de forma que possam ser aplicados diretamente independente da variação de dimensão da nossa variável observada ao longo do tempo, isso vai permitir mensurar os impactos de uma interpolação prévia dos dados antes da estimação. Essa flexibilidade dos algoritmos desses filtros de não dependerem de uma variável resposta com dimensão constante foi ressaltada por Durbin e Koopman (2012). No contexto da abordagem linear testaremos uma nova adaptação para o modelo, será inserido mais uma variável de nível no modelo. O objetivo de ter duas variáveis de nível é que cada uma delas esteja ativa em um instante do tempo, ou seja, uma ficará ativa antes da próxima reunião do Copom e outra após a reunião. Essa abordagem busca incorpora no modelo o possível salto que ocorre na taxa devido a decisão dessa reunião. O objetivo deste trabalho é comparar o desempenho dos diferentes métodos de estimação, observando os resultados dentro e fora da amostra e concluir quais as vantagens e desvantagens de cada uma das abordagens. Também será feito em cada exercício de interpolar os dados antes da estimação para avaliar se introduz algum viés no ajuste e na predição. 15 Nos próximos capítulos deste trabalho serão apresentados a revisão da literatura relacionada às ferramentas aplicadas na dissertação, uma descrição detalhada da metodologia e dos dados utilizados, em seguida serão apresentados os resultados obtidos, e por fim uma conclusão sobre o trabalho. 16 2. REVISÃO DA LITERATURA Nesse capitulo serão descritos o modelo de Nelson-Siegel (1987) e suas extensões, o conceito da representação de modelos na estrutura de espaço de estados, a definição de filtragem e os filtros de Kalman e Kalman Estendido. 2.1. MODELO DE NELSON-SIEGEL O Modelo de Nelson-Siegel criou a classe de modelos paramétricos para estrutura a termo da taxa de juros, ele é constituído pelos parâmetros {𝑏1𝑡 , 𝑏2𝑡, 𝑏3𝑡 , 𝜆𝑡 }, onde os três primeiros representam componentes de longo, curto e médio prazo como descrito em Nelson-Siegel(1987), já o último tem como função determinar em quanto tempo a curva atingirá seu ponto de máximo, sendo chamado de decaimento por alguns autores. Os fatores que acompanham os parâmetros têm como objetivo criar um modelo capaz de ajustar uma ampla gama de formas (monótona, arqueada e em forma de S) que são observadas nas ETTJs. 𝑦𝑡 (𝜏) = 𝑏1𝑡 + 𝑏2𝑡 1−𝑒 −𝜆𝑡 𝜏 𝜆𝑡 𝜏 - 𝑏3𝑡 𝑒 −𝜆𝑡𝜏 (2.1) Essa estrutura parcimoniosa e suas extensões são largamente utilizadas atualmente, o Banco de Compensações Internacionais (BIS, 2005) apontou que nove dos treze bancos centrais que reportavam suas curvas a eles utilizavam alguma derivação da estrutura acima. A seguir descreveremos as extensões do modelo original que serão utilizadas na dissertação. 2.1.1. EXTENSÃO DE DIEBOLD E LI Diebold e Li (2006), reescreveram o modelo criando a seguinte relação entre os parâmetros originais e os da extensão proposta. 𝑏1𝑡 = 𝛽1𝑡 𝑏2𝑡 = 𝛽2𝑡 + 𝛽3𝑡 𝑏3𝑡 = 𝛽3𝑡 17 Através dessa transformação nos parâmetros, eles conseguiram trazer uma interpretação econômica de nível, inclinação e curvatura para os parâmetros respectivamente. Figura 1: Peso dos fatores em função das variações de λt. Observando a Figura 1, fica claro que se tratarmos o 𝜆 como um valor constante ou com pequena variação o comportamento dos fatores ao longo do tempo é intuitivo com relação interpretação econômica que lhes foi atribuída pelos autores. Diversos autores mencionam que dependendo do valor de lambda escolhido é observada alta correlação entre os parâmetros de inclinação e curvatura, entre eles estão de Pooter (2007) e Hurn, Lindsay and Pavlov (2005). Vale ressaltar que essas alterações nos parâmetros proposta por Diebold e Li (2006) com relação ao modelo original não diferenciam a curva ajustada em relação ao modelo original, a manipulação realizada foi feita apenas pela conveniência na interpretação dos parâmetros. Abaixo está a forma funcional proposta. 𝑦𝑡 (𝜏) = 𝛽1𝑡 + 𝛽2𝑡 1−𝑒 −𝜆𝑡 𝜏 𝜆𝑡 𝜏 1−𝑒 −𝜆𝑡 𝜏 + 𝛽3𝑡 ( 𝜆𝑡 𝜏 − 𝑒 −𝜆𝑡𝜏 ) (2.2) Além do avanço na interpretação do modelo eles também comprovaram a eficácia da estrutura parcimoniosa criada por Nelson-Siegel na predição das taxas, para isso eles modelaram a dinâmica dos parâmetros calibrados através de um processo autoregressivo de primeira ordem, os resultados apontaram que o modelo tem capacidade de predição superior a alguns modelos comparados, principalmente quando observamos projeções de longo prazo 18 Muitos autores documentaram os resultados das séries de tempo dos parâmetros estimados onde é observada grande instabilidade, chegando a apresentar o parâmetro de nível com valores negativos violando a intuição econômica, entre esses autores estão Barrett, Gosnell e Heutson (1995), Fabozzi, Martellini e Priaulet (2005), Diebold e Li (2006), Gurkaynak, Sack e Wright (2006) e de Pooter (2007). 2.2. REPRESENTAÇÃO DE ESPAÇO DE ESTADOS A estrutura de espaço de estados se propõe através de um sistema matricial composto por variáveis estado representar a relação das variáveis não observadas com as observadas ao longo do tempo. Ele tem sua importância ressaltada em aplicações nas quais é preciso modelar parâmetros que variam a longo do tempo, nas quais é justificada a maior dificuldade de implementação frente aos benefícios obtidos. A Engenharia de Controle desde os anos 50 utiliza os modelos de espaço de estado para representar modelos matemáticos de um sistema físico que relaciona variáveis de entrada e saída através de equações diferencias de primeira ordem. Uma vantagem observada na representação de espaço de estados é facilidade de aplicar métodos computacionais, entre esses métodos estão a técnicas de filtragem que serão definidas a frente nesse trabalho. Nesse trabalho apresentaremos duas ferramentas desenvolvidas com a utilização da representação de espaço de estados para modelar a dinâmica dos parâmetros ao longo do tempo, a primeira é o filtro de Kalman que é aplicado a modelo lineares, a segunda é o filtro de Kalman estendido que é aplicado para aproximar modelos nãolineares. 2.2.1. MODELO DE NELSON-SIEGEL EM ESPAÇO DE ESTADOS 19 Diebold, Rudebusch e Aruoba (2006) introduziram a possibilidade de inserir o modelo de Nelson-Siegel dentro de uma estrutura de espaço de estados, isso gera a possibilidade de estimar os parâmetros dinamicamente em um único passo, gerando um avanço em relação ao trabalho de Diebold e Li (2006) onde é necessária a estimação em dois passos. Nesse caso para inserir o modelo na estrutura de espaço de estados devemos considerar 𝛽𝑡 como um vetor latente e reescrevemos a equação 2.2 como: 𝑦𝑡 = Λ(𝜆)𝛽𝑡 + 𝜀𝑡 , 𝜀𝑡 ~𝑁(0, Σ𝜀 ) (2.3) Com 𝑦𝑡 e 𝜀𝑡 sendo respectivamente os vetores de observações e erros, Λ(𝜆) sendo uma matriz 𝑁 × 3 onde estão contidos cada um dos 3 fatores para as N observações no instante de tempo 𝑡. 1, 𝑗 = 1, 1−𝑒 −𝜆𝑡 Λ(𝜆)𝑖𝑗 = , 𝜆𝑡 1−𝑒 −𝜆𝑡 − 𝜆𝑡𝑒 −𝜆𝑡 { 𝜆𝑡 𝑗 = 2, , (2.4) 𝑗 = 3. A série temporal do vetor 𝛽𝑡 pode ser modelada através de um modelo de vetor autoregressivo (VAR) como exposto na equação abaixo. 𝛽𝑡+1 = (𝐼 − Φ)𝜇 + Φ𝛽𝑡 + 𝜂𝑡 , 𝜂𝑡 ~𝑁(0, Σ𝜂 ) (2.5) Onde 𝜇 é vetor que representa a média de longo prazo dos parâmetros, Φ é a matriz de coeficientes e Σ𝜂 é a matriz de variância. Temos a condição inicial que 𝛽0 ~ 𝑁(𝜇, Σ𝛽 ) onde Σ𝛽 atende à seguinte relação Σ𝛽 − ΦΣ𝛽 Φ′ = Σ𝜂 , como mencionado por Koopman, Mallee e Van Der Wel (2010). 2.3. TÉCNICAS DE FILTRAGEM 20 Filtragem consiste em um processo iterativo que nos permite estimar os parâmetros de um modelo que dependem do histórico dos dados observáveis e não observáveis. Áreas onde esse conceito é amplamente difundido e utilizado são econometria, tecnologias espaciais e militares. O primeiro trabalho sobre filtragem foi apresentado por Wiener (1949), ele era aplicado para processo contínuos e estacionários. Nesse trabalho aplicaremos os métodos do Filtro de Kalman e o Filtro de Kalman Estendido para estimação do modelo de Nelson-Siegel para que possamos mensurar quais foram os benefícios e possíveis deficiências das diferentes abordagens que apresentamos nesse trabalho. A seguir vamos apresentar o filtro de Kalman original(1960) e sua versão estendida. 2.3.1. FILTRO DE KALMAN O Filtro de Kalman(1960) foi desenvolvido originalmente com o objetivo de predizer a trajetória de balas lançadas por misseis, ao longo do tempo essa técnica foi difundida e aplicada em diversas áreas do conhecimento, entre elas está a estimação de modelos econométricos. Ele se aplica a modelos lineares com resíduos gaussianos, mas foi demonstrado que ele continua sendo um estimador ótimo mesmo quando a condição de normalidade dos resíduos é violada, como demonstrado por Anderson e Moore (1979, p. 29-32). Essa aplicação do filtro se dá através da representação dos modelos através da estrutura de espaço de estados, que pode ser definida como uma abordagem onde o sistema em estudo é determinado por uma série de vetores não observáveis que são guiados por um processo estocástico e associados a uma série de observações, essa definição é apresentada por Dubin e Koopman (2012). Considerando o modelo de espaço de estados: 𝑦𝑡 = 𝑍𝑡 𝛼𝑡 + 𝜀𝑡 , 𝜀 ~ 𝑁(0, 𝐻𝑡 ) (2.6) 𝛼𝑡+1 = 𝑇𝑡 𝛼𝑡 + 𝜂𝑡 , 𝜂 ~ 𝑁(0, 𝑄𝑡 ) (2.7) 21 Com informações disponíveis até 𝑡, sendo 𝛼𝑡 /𝑌𝑡−1 pertence a uma distribuição normal com média 𝑎𝑡 e matriz de covariância 𝑃𝑡 . O algoritmo do filtro de Kalman que é aplicado para obter estimativas de 𝑎𝑡+1 e 𝑃𝑡+1 pela sequência de equações apresentada a seguir. 𝑣𝑡 = 𝑦𝑡 − 𝐸(𝑦𝑡 ⁄𝑌𝑡−1 ) = 𝑦𝑡 − 𝑍𝑎𝑡/𝑡−1 (2.8) 𝐹𝑡 = 𝑉𝑎𝑟(𝑣𝑡 ⁄𝑌𝑡−1 ) = 𝑍𝑃𝑡/𝑡−1 𝑍 ′ + 𝐻 (2.9) 𝑎𝑡/𝑡 = 𝐸(𝛼𝑡 ⁄𝑌𝑡 ) = 𝑎𝑡/𝑡−1 + 𝑃𝑡/𝑡−1 𝑍 ′ 𝐹𝑡−1 𝑣𝑡 (2.10) 𝑃𝑡/𝑡 = 𝑉𝑎𝑟(𝛼𝑡 ⁄𝑌𝑡 ) = 𝑃𝑡/𝑡−1 − 𝑃𝑡/𝑡−1 𝑍 ′ 𝐹𝑡−1 𝑍𝑃𝑡/𝑡−1 (2.11) 𝑎𝑡+1 = 𝐸(𝛼𝑡+1 /𝑌𝑡 ) = 𝑇𝑎𝑡/𝑡 (2.12) 𝑃𝑡+1 = 𝑉𝑎𝑟(𝛼𝑡+1 /𝑌𝑡 ) = 𝑇𝑃𝑡/𝑡 𝑇 ′ + 𝑄 (2.13) Através dos valores observados em 𝑡, calculamos os erros da média e da matriz de covariância através das equações 2.8 e 2.9, depois atualizamos nosso sistema com as equações 2.10 e 2.11 obtendo 𝑎𝑡/𝑡 e 𝑃𝑡/𝑡 , com as equações 2.12 e 2.13 conseguimos gerar uma predição dos valores de 𝑎𝑡+1 e 𝑃𝑡+1 condicionados a informação disponível no instante 𝑡. Executamos esse algoritmo de forma iterativa com as novas informações disponibilizadas ao longo do tempo. 2.3.2. FILTRO DE KALMAN ESTENDIDO Quando observamos não linearidades nas equações de medidas, o filtro de Kalman não pode mais ser aplicado diretamente. Para tratar essa limitação uma possível abordagem é a utilização de uma aproximação linear, o filtro de Kalman estendido é mencionado por Goodwin e Sin (2009) como uma possível solução para essa limitação. Considerando o modelo de espaço de estados abaixo, onde as equações são nãolineares e os ruídos não são necessariamente normais. Assumindo que 𝑍𝑡 (𝛼𝑡 ) e 𝑇𝑡 (𝛼𝑡 ) 22 são funções diferenciáveis de 𝛼𝑡 , além disso tomamos como premissa que os ruídos não apresentam correlação serial ou mutual. 𝑦𝑡 = 𝑍𝑡 (𝛼𝑡 ) + 𝜀𝑡 , 𝜀 ~ [0, 𝐻𝑡 ] 𝛼𝑡+1 = 𝑇𝑡 (𝛼𝑡 ) + 𝜂𝑡 , (2.14) 𝜂 ~ [0, 𝑄𝑡 ] (2.15) A adaptação do Filtro de Kalman original consiste basicamente na realização de uma expansão por series de Taylor dos componentes que apresentam comportamento não linear, para isso precisamos garantir que eles são diferenciáveis. 𝑍𝑡̇ = 𝜕𝑍𝑡 (𝛼𝑡 ) 𝑇𝑡̇ = 𝜕𝑇𝑡 (𝛼𝑡 ) 𝜕𝛼′𝑡 𝜕𝛼′𝑡 | (2.16) 𝛼𝑡 =𝑎𝑡 | (2.17) 𝛼𝑡 =𝑎𝑡 Utilizando uma aproximação de primeira ordem chegamos nas equações abaixo: 𝑍𝑡 (𝛼𝑡 ) = 𝑍𝑡 (𝑎𝑡 ) + 𝑍̇𝑡 (𝛼𝑡 − 𝑎𝑡 ) (2.18) 𝑇𝑡 (𝛼𝑡 ) = 𝑇𝑡 (𝑎𝑡 ) + 𝑇̇𝑡 (𝛼𝑡 − 𝑎𝑡 ) (2.19) Ao substituir as equações acima nas equações de espaço de estados podemos chegar no algoritmo de Filtro de Kalman Estendido. 𝑣𝑡 = 𝑦𝑡 − 𝐸(𝑦𝑡 ⁄𝑌𝑡−1 ) = 𝑦𝑡 − 𝑍(𝑎𝑡/𝑡−1 ) (2.20) 𝐹𝑡 = 𝑉𝑎𝑟(𝑣𝑡 ⁄𝑌𝑡−1 ) = 𝑍̇𝑃𝑡/𝑡−1 𝑍̇ ′ + 𝐻 (2.21) 𝑎𝑡/𝑡 = 𝐸(𝛼𝑡 ⁄𝑌𝑡 ) = 𝑎𝑡/𝑡−1 + 𝑃𝑡/𝑡−1 𝑍̇ ′ 𝐹𝑡−1 𝑣𝑡 (2.22) 𝑃𝑡/𝑡 = 𝑉𝑎𝑟(𝛼𝑡 ⁄𝑌𝑡 ) = 𝑃𝑡/𝑡−1 − 𝑃𝑡/𝑡−1 𝑍̇ ′ 𝐹𝑡−1 𝑍̇𝑃𝑡/𝑡−1 (2.23) 𝛼𝑡+1 = 𝐸(𝛼𝑡+1 /𝑌𝑡 ) = 𝑇𝑎𝑡/𝑡 (2.24) 𝑃𝑡+1 = 𝑉𝑎𝑟(𝛼𝑡+1 /𝑌𝑡 ) = 𝑇̇𝑃𝑡/𝑡 𝑇̇ ′ + 𝑄 (2.25) 23 Assim como no algoritmo original do Filtro de Kalman, através dos valores observados em 𝑡, calculamos os erros da média e da matriz de covariância através das equações 2.20 e 2.21, depois atualizamos nosso sistema com as equações 2.22 e 2.23 obtendo 𝑎𝑡/𝑡 e 𝑃𝑡/𝑡 , com as equações 2.24 e 2.25 conseguimos gerar uma predição dos valores de 𝛼𝑡+1 e 𝑃𝑡+1 condicionados a informação disponível no instante 𝑡. Executamos esse algoritmo de forma iterativa com as novas informações disponibilizadas ao longo do tempo. 24 3. METODOLOGIA E DADOS Nessa seção serão detalhados o modelo teórico utilizado, suas diferentes formas de estimação, os diferentes tratamentos dos dados de entrada e as métricas aplicadas para comparação das diferentes abordagens com relação ao ajuste e principalmente a predição. Iniciaremos revisitando a expansão do modelo de Nelson-Sigel realizada por Diebold e Li (2006) e como representa-la na estrutura de espaço de estados partindo da mesma forma que foi exposto no por Diebold, Rudebush e Aruoba (2006) mostrando as condições que diferenciam esse ser linear ou não-linear. Será detalhada também a adaptação proposta para incorporar a possibilidade de saltos na curva devido as decisões do Copom. Depois seguiremos com as técnicas de estimação aplicadas para o modelo espaço de estados linear e o não-linear através do filtro de Kalman e do Filtro de Kalman Estendido respectivamente. Por fim será exposto quais os dados utilizados, detalhando fonte, período e diferentes tratamentos utilizados. Todas os métodos descritos nessa seção foram implementados no MATLAB. 3.1. MODELO TEÓRICO UTILIZADO Como apresentado por Diebold e Li (2006) o modelo de Nelson-Siegel é capaz através da manipulação de parâmetros e seus fatores, atribuir a interpretação de nível, inclinação e curvatura para os parâmetros 𝛽1, 𝛽2 e 𝛽3 respectivamente. Modelo Nelson-Siegel (1987): 𝑦𝑡 (𝜏) = 𝑏1𝑡 + 𝑏2𝑡 1−𝑒 −𝜆𝑡 𝜏 𝜆𝑡 𝜏 - 𝑏3𝑡 𝑒 −𝜆𝑡𝜏 (3.1) Extensão Diebold e Li (2006): 𝑦𝑡 (𝜏) = 𝛽1𝑡 + 𝛽2𝑡 1−𝑒 −𝜆𝑡 𝜏 𝜆𝑡 𝜏 1−𝑒 −𝜆𝑡 𝜏 + 𝛽3𝑡 ( 𝜆𝑡 𝜏 − 𝑒 −𝜆𝑡𝜏 ) (3.2) Devido a sua vantagem interpretativa utilizaremos a forma funcional representada na equação (3.2) nesse trabalho. Como consequência do objetivo de estimar o modelo 25 com dinamismo nos parâmetros, foi conveniente representar o modelo através da estrutura de espaço de estados, viabilizando a aplicação das ferramentas de filtragem. Se faz necessária a utilização de duas diferentes representações uma linear para aplicação do filtro de Kalman e outra não-linear para aplicação do Filtro de Kalman Estendido. Em ambas, vamos assumir que as variáveis de estado do modelo são guiadas por processo vetor auto-regressivo (VAR) de primeira ordem, onde o dinamismo dos parâmetros no instante 𝑡 + 1, depende apenas dos valores observados dos parâmetros no instante 𝑡. 3.1.1 REPRESENTAÇÕES DO MODELO EM ESTRUTURA LINEAR E NÃO-LINEAR Nelson-Siegel na estrutura linear de espaço de estados: 𝜀𝑡 ~𝑁(0, Σε ) 𝑦𝑡 = Λ𝛽𝑡 + 𝜀𝑡 𝑡 = 1, … , 𝑇 (3.3) Com 𝑦𝑡 = [𝑦𝑡 (𝜏1 ), … , 𝑦𝑡 (𝜏𝑁 )]′ sendo o vetor de observações da taxa de juros e 𝜀𝑡 = [𝜀𝑡 (𝜏1 ), … , 𝜀𝑡 (𝜏𝑁 )]′ o vetor de erros. Temos Λ uma matriz 𝑁 × 3 com os fatores que multiplicam o vetor de parâmetros 𝛽𝑡 = [𝛽1𝑡, 𝛽2𝑡, 𝛽3𝑡 ]′ 1 Λ= ⋮ ( 1 1−𝑒 −𝜆𝜏1 1−𝑒 −𝜆𝜏1 − 𝜆𝜏1 𝑒 −𝜆𝜏1 𝜆𝜏1 𝜆𝜏𝑖 ⋮ ⋮ 1−𝑒 −𝜆𝜏𝑁 1−𝑒 −𝜆𝜏𝑁 − 𝜆𝜏𝑁 𝑒 −𝜆𝜏𝑁 𝜆𝜏𝑁 𝜆𝜏𝑁 (3.4) ) Vale lembrar que para mantermos a estrutura linear o parâmetro 𝜆, que está contido nos fatores que compõe a matriz Λ, deve ser considerado uma constante. O vetor de parâmetros 𝛽𝑡 é modelado pela equação abaixo que representa o processo VAR mencionado anteriormente. 𝛽𝑡+1 = (𝐼 − Φ)𝜇 + Φ𝛽𝑡 + 𝜂𝑡 𝜂𝑡 ~ 𝑁(0, Ση ) (3.5) Sendo 𝜇 o vetor médio, Φ a matriz de coeficientes e Ση a matriz de variância. Como condições iniciais temos que 𝛽0 ~ 𝑁(𝜇, Σ𝛽 ), onde a matriz Σ𝛽 é escolhida atendendo a igualdade Σ𝛽 − ΦΣ𝛽 Φ = Σ𝜂 . 26 Nelson-Siegel na estrutura não-linear de espaço de estados: A alteração da estrutura apresentada acima que permite colocar o modelo em uma estrutura não linear consiste basicamente em considerar 𝜆 como o quarto parâmetro do modelo, a seguir apresentamos como ficam as equações alteradas. 𝜀𝑡 ~𝑁(0, Σε ) 𝑦𝑡 = Λ(𝜆𝑡 )𝛽𝑡 + 𝜀𝑡 𝑡 = 1, … , 𝑇 (3.6) Agora a matriz Λ tem os fatores que compõe com dependência do parâmetro 𝜆𝑡 . 1 Λ(λt ) = ⋮ ( 1 1−𝑒 −𝜆𝑡 𝜏1 1−𝑒 −𝜆𝑡 𝜏1 − 𝜆𝑡 𝜏1 𝑒 −𝜆𝑡 𝜏1 𝜆𝑡 𝜏1 𝜆𝑡 𝜏𝑖 ⋮ ⋮ 1−𝑒 −𝜆𝑡 𝜏𝑁 1−𝑒 −𝜆𝑡 𝜏𝑁 − 𝜆𝑡 𝜏𝑁 𝑒 −𝜆𝑡 𝜏𝑁 𝜆𝑡 𝜏𝑁 𝜆𝑡 𝜏𝑁 (3.7) ) Agora consideraremos nosso vetor de parâmetros de 𝛼𝑡 = [𝛽1𝑡, 𝛽2𝑡, 𝛽3𝑡, 𝜆𝑡 ]′ e sendo modelado por um processo VAR, da mesma forma que foi feito na estrutura linear. 𝛼𝑡+1 = (𝐼 − Φ)𝜇 + Φ𝛼𝑡 + 𝜂𝑡 𝜂𝑡 ~ 𝑁(0, Ση ) (3.8) Na matriz Φ foi imposta a condição de que o parâmetro 𝜆𝑡+1 só fosse influenciado pelo parâmetro 𝜆𝑡−1 , que por sua vez não influenciaria nenhum dos demais parâmetros. Essa abordagem foi utilizada pois reduz o número de parâmetros a ser estimado pela verossimilhança. 3.1.2 ADAPTAÇÃO DO MODELO Nesse trabalho realizamos uma adaptação do modelo contemplando uma característica marcante do mercado brasileiro, a possível mudança da taxa Selic nas reuniões do Comitê de Política Monetária (Copom). Se observamos o histórico da Selic nos últimos 3 anos (gráfico 3.1), fica evidente a grande volatilidade da taxa de juros brasileira, isso milita para que tenhamos um modelo com flexibilidade para incorporar esses eventos de mudança uma vez que sabemos as datas nas quais ele ocorre. 27 15 14 Taxa Selic (%) 13 12 11 10 9 8 7 01/05/2015 01/03/2015 01/01/2015 01/11/2014 01/09/2014 01/07/2014 01/05/2014 01/03/2014 01/01/2014 01/11/2013 01/09/2013 01/07/2013 01/05/2013 01/03/2013 01/01/2013 01/11/2012 01/09/2012 01/07/2012 01/05/2012 01/03/2012 01/01/2012 6 Data Figura 2: Histórico taxa Selic nos últimos 3 anos. Podemos interpretar que o dia seguinte a reunião do Copom é um possível salto na curva do DI, uma vez que o principal direcionador do DI é a taxa Selic. Abaixo temos um exemplo de como ficaria nossa curva incorporando esse salto, que representa a expectativa do mercado com relação a decisão da reunião. Figura 3: Representação de salto na estrutura termo da taxa de juros. Para possibilitar que o modelo seja capaz de incorporar esse tipo de comportamento, foi feita uma alteração em sua forma funcional. Ela consiste em fazer com que o 28 modelo tenha um diferente parâmetro representando o nível condicionado ao vencimento do título ser antes ou depois da reunião. Nessa adaptação vamos contemplar apenas a próxima reunião agendada, abaixo é apresentada a forma funcional do modelo adaptado. 𝑦𝑡 (𝜏) = 𝕀𝑎 𝛽1𝑎𝑡 + 𝕀𝑑 𝛽1𝑑𝑡 + 𝛽2𝑡 1−𝑒 −𝜆𝑡 𝜏 𝜆𝑡 𝜏 1−𝑒 −𝜆𝑡 𝜏 + 𝛽3𝑡 ( 𝜆𝑡 𝜏 − 𝑒 −𝜆𝑡𝜏 ) 𝕀𝑎 = { 1, 𝑠𝑒 𝑣𝑒𝑛𝑐𝑖𝑚𝑒𝑛𝑡𝑜 𝑎𝑐𝑜𝑛𝑡𝑒𝑐𝑒 𝑎𝑛𝑡𝑒𝑠 𝑑𝑜 𝐶𝑜𝑝𝑜𝑚 0, 𝑠𝑒 𝑣𝑒𝑛𝑐𝑖𝑚𝑒𝑛𝑡𝑜 𝑎𝑐𝑜𝑛𝑡𝑒𝑐𝑒 𝑑𝑒𝑝𝑜𝑖𝑠 𝑑𝑜 𝐶𝑜𝑝𝑜𝑚 𝕀𝑏 = { 0, 𝑠𝑒 𝑣𝑒𝑛𝑐𝑖𝑚𝑒𝑛𝑡𝑜 𝑎𝑐𝑜𝑛𝑡𝑒𝑐𝑒 𝑎𝑛𝑡𝑒𝑠 𝑑𝑜 𝐶𝑜𝑝𝑜𝑚 1, 𝑠𝑒 𝑣𝑒𝑛𝑐𝑖𝑚𝑒𝑛𝑡𝑜 𝑎𝑐𝑜𝑛𝑡𝑒𝑐𝑒 𝑑𝑒𝑝𝑜𝑖𝑠 𝑑𝑜 𝐶𝑜𝑝𝑜𝑚 (3.9) Essa adaptação pode ser representada da mesma forma que o modelo linear pela equação 3.3, precisamos apenas adaptar a matriz Λ, agora com dimensão 𝑁 × 4, e o vetor 𝛽, com dimensão 4 × 1 como mencionado abaixo. Λ= ( 𝕀𝑎 𝕀𝑏 ⋮ ⋮ 𝕀𝑎 𝕀𝑏 1 − 𝑒 −𝜆𝜏1 𝜆𝜏1 ⋮ 1 − 𝑒 −𝜆𝜏𝑁 𝜆𝜏𝑁 1 − 𝑒 −𝜆𝜏1 − 𝜆𝜏1 𝑒 −𝜆𝜏1 𝜆𝜏𝑖 ⋮ −𝜆𝜏𝑁 1−𝑒 − 𝜆𝜏𝑁 𝑒 −𝜆𝜏𝑁 ) 𝜆𝜏𝑁 𝛽1𝑎 𝛽 𝛽 = [ 1𝑏 ] 𝛽2 𝛽3 3.2. ESTIMAÇÃO DOS PARÂMETROS Após construir a representação de espaço de estados dos modelos linear, linear adaptado e não-linear utilizados no trabalho devem ser estimados os parâmetros que compõe cada uma das estruturas, nessa seção serão descritos como foram aplicados os Filtros de Kalman e Kalman Estendido em conjunto a maximização da verossimilhança para estimação dos de cada um dos componentes dos modelos. Ambos os filtros foram implementados sem impor condição de dimensão constante dos vetores de observações, essa possibilidade foi mencionada por Durbin e Koopman (2012). 29 3.2.1. FILTRO DE KALMAN Nessa seção será descrita a aplicação de Filtro de Kalman na versão linear do modelo de Nelson-Siegel composto pelas equações 3.3 e 3.5. Para aplicação do filtro são necessárias as estimativas dos parâmetros 𝐻, 𝑄, 𝜇, Φ e dos chutes inicias 𝑎1/0 e 𝑃1/0 , como optamos pela versão linear precisamos também do valor de 𝜆 fixo que será utilizado. Abaixo estão representadas o conjunto de equações utilizadas no filtro, os parâmetros de entrada foram estimados através da maximização da verossimilhança como será detalhado na seção 3.2.3. 𝑣𝑡 = 𝑦𝑡 − 𝐸(𝑦𝑡 ⁄𝑌𝑡−1 ) = 𝑦𝑡 − Λ𝑎𝑡/𝑡−1 (3.10) 𝐹𝑡 = 𝑉𝑎𝑟(𝑣𝑡 ⁄𝑌𝑡−1 ) = Λ𝑃𝑡/𝑡−1 Λ′ + 𝐻 (3.11) 𝑎𝑡/𝑡 = 𝐸(𝛼𝑡 ⁄𝑌𝑡 ) = 𝑎𝑡/𝑡−1 + 𝑃𝑡/𝑡−1 Λ′ 𝐹𝑡−1 𝑣𝑡 (3.12) 𝑃𝑡/𝑡 = 𝑉𝑎𝑟(𝛼𝑡 ⁄𝑌𝑡 ) = 𝑃𝑡/𝑡−1 − 𝑃𝑡/𝑡−1 Λ′ 𝐹𝑡−1Λ𝑃𝑡/𝑡−1 (3.13) 𝑎𝑡+1 = 𝐸(𝛼𝑡+1 /𝑌𝑡 ) = (𝐼 − Φ)𝜇 + Φ𝑎𝑡/𝑡 (3.14) 𝑃𝑡+1 = 𝑉𝑎𝑟(𝛼𝑡+1 /𝑌𝑡 ) = Φ𝑃𝑡/𝑡 Φ′ + 𝑄 (3.15) 3.2.2. FILTRO DE KALMAN ESTENDIDO Nessa seção será descrita a aplicação de Filtro de Kalman Estendido para estimação da versão não linear do modelo de Nelson-Siegel composto pelas equações 3.6 e 3.8. Para aplicação do filtro são necessárias as estimativas dos parâmetros 𝐻, 𝑄, 𝜇, Φ e dos chutes inicias 𝑎1/0 e 𝑃1/0 . Abaixo estão representadas o conjunto de equações utilizadas no filtro, os parâmetros de entrada foram estimados através da maximização da verossimilhança como será detalhado na seção 3.2.3. 𝑣𝑡 = 𝑦𝑡 − 𝐸(𝑦𝑡 ⁄𝑌𝑡−1 ) = 𝑦𝑡 − Λ(𝜆𝑡 )𝑎𝑡/𝑡−1 = 𝑦𝑡 − Z(𝑎𝑡/𝑡−1 ) (3.16) 𝐹𝑡 = 𝑉𝑎𝑟(𝑣𝑡 ⁄𝑌𝑡−1 ) = Ż𝑃𝑡/𝑡−1 Ż ′ + 𝐻 (3.17) 𝑎𝑡/𝑡 = 𝐸(𝛼𝑡 ⁄𝑌𝑡 ) = 𝑎𝑡/𝑡−1 + 𝑃𝑡/𝑡−1 Ż ′ 𝐹𝑡−1 𝑣𝑡 (3.18) 30 𝑃𝑡/𝑡 = 𝑉𝑎𝑟(𝛼𝑡 ⁄𝑌𝑡 ) = 𝑃𝑡/𝑡−1 − 𝑃𝑡/𝑡−1 Ż ′ 𝐹𝑡−1 Ż𝑃𝑡/𝑡−1 (3.19) 𝛼𝑡+1 = 𝐸(𝛼𝑡+1 /𝑌𝑡 ) = (𝐼 − Φ)𝜇 + Φ𝑎𝑡/𝑡 (3.20) 𝑃𝑡+1 = 𝑉𝑎𝑟(𝛼𝑡+1 /𝑌𝑡 ) = Φ𝑃𝑡/𝑡 Φ′ + 𝑄 (3.21) 3.2.3. ESTIMAÇÃO POR MÁXIMA VEROSSIMILHANÇA Para executar a estimação ambas as versões do filtro exigem alguns parâmetros de entrada além dos dados observados. São eles 𝜇 e Φ, os parâmetros que descrevem o processos que vai guiar as variáveis de estado como podemos observar nas equações 3.5 e 3.8, também precisamos das matrizes de variância dos resíduos das variáveis de estado e das variáveis observadas, sendo elas 𝑄 e 𝐻 respectivamente. Nesse trabalho vamos assumir que 𝑄 e 𝐻 são matrizes diagonais, com a diferença que 𝑄 assumirá valores diferentes para cada elemento da diagonal e 𝐻 será composta pelo mesmo valor sempre. Os parâmetros 𝜇, Φ, 𝑄 e 𝐻 foram estimados através da maximização da verossimilhança. O cálculo da verossimilhança para o filtro pode ser feito pela equação abaixo com mostrado por Durbin e Koopman (2012). log 𝐿(𝑌𝑛 ) = − np 2 log 2𝜋 − ∑𝑛𝑡=1 (log|𝐹𝑡 | + 𝑣𝑡′ 𝐹𝑡−1 𝑣𝑡 ) (3.22) Essa forma é válida quando assumimos que 𝑝(𝑦𝑡 /𝑌𝑡−1 ) = 𝑁(𝑍𝑎𝑡 , 𝐹𝑡 ). Para maximização da verossimilhança foi utilizada a função fminunc do MATLAB, para viabilizar a aplicação dela foram realizadas as transformações necessárias nas variáveis para uma vez que esse algoritmo realiza uma otimização sem restrições. 3.2.4 ESTIMAÇÃO EM DOIS PASSOS Nessa seção vamos comentar uma abordagem usual de estimação do modelo dinâmico de Nelson-Siegel, vamos mostrar os resultados da comparação dele com o 31 Filtro Kalmam, ilustrando o motivo de utilizarmos a abordagem de filtragem para esse trabalho. A estimação em dois passos consiste em fixando o parâmetro 𝜆 aplicar uma regressão linear em cada um dos dias que temos observações disponíveis, assim obtemos as variáveis de estado ajustadas. Após obter as variáveis ajustados seguimos para o segundo passo, ajustar um modelo vetor auto-regressivo de primeira ordem para gerar as variáveis preditas. É interessante pontuar qual principal diferença entre uma técnica de filtragem para a estimação em dois passos, quando realizamos a filtragem o objetivo é criar variáveis preditas que gerem o melhor ajuste da curva observada, já a abordagem em dois passos busca as variáveis preditas que proporcionem o melhor ajuste das variáveis de estados ajustadas. Com isso o modelo perde toda a informação contida na diferença entre a curva observada e a curva gerada pelas variáveis ajustadas. Abaixo mostramos um teste realizado mostrando que mesmo dentro da amostra de calibragem a abordagem de dois passos gera um maior erro quadrático médio (𝐸𝑄𝑀). 1,80E-05 1,60E-05 1,40E-05 EQM 1,20E-05 1,00E-05 8,00E-06 6,00E-06 4,00E-06 2,00E-06 0,00E+00 Dois passos Filtro de Kalman Método de estimação Figura 4: Comparação da estimação em dois passos com o filtro de Kalman na amostra 1. 3.3 DADOS UTILIZADOS 32 Foram utilizados os dados do futuro de DI do período de 19/10/2012 até 26/03/2015, nas seções abaixo serão apresentados a metodologia de interpolação dos dados, que foi utilizada para realizar a comparação entre as estimações dos modelos com dados observados e com dados interpolados, também será detalhada como foram construídas as amostras para desenvolvimento e validação dos modelos. 3.3.1 INTERPOLAÇÃO DOS DADOS Como mencionado anteriormente nesse trabalho, a pratica usual para estimação do modelo dinâmico de Nelson-Siegel parte dos dados interpolados, para que todos os dias tenhamos a taxa para maturidades fixas e assim as dimensões de todas as matrizes envolvidas no filtro não variem. Nesse trabalho realizamos a implementação do filtro sem condições de dimensões constantes para as matrizes de dados observados, isso nos permitirá realizar a estimação dos modelos com os dados observados e com os interpolados e comparar os resultados. A interpolação consiste em projetar a taxa para um vértice onde não temos observação, para isso utilizamos dois os pares de maturidade e taxa observados, são eles o imediatamente anterior e o posterior. Foi utilizada a interpolação log-linear, por ser aquela com maior sentido econômico dado o regime composto de capitalização aplicado no mercado brasileiro. A equação abaixo apresenta como interpolamos a taxa 𝑦 na maturidade 𝑥 partindo dos pares (𝑥1 , 𝑦1 ) e (𝑥2 , 𝑦2 ) onde 𝑥1 < 𝑥 < 𝑥2 . Note que ela é chamada interpolação log-linear, pois se aplicarmos o logaritmo em ambos os lados da equação temos a equação de uma reta. 𝑥−𝑥1 𝑦= 𝑦 𝑥2−𝑥1 𝑦1 (𝑦2 ) 1 (3.23) Temos uma variação no cálculo da interpolação quando precisamos interpolar o primeiro ponto, caso ele seja menor que a primeira observação, utilizamos as duas primeiras observações para interpolar o primeiro ponto, ela é realizada utilizando exatamente a mesma equação dos demais casos. 33 Nesse trabalho interpolamos nossas curvas em 20 vértices, sendo eles 1, 2, 3, 4, 6, 9, 12, 15, 18, 24, 30, 36, 42, 48, 54, 60, 72, 84, 96 e 108 meses até o vencimento. Vale ressaltar que quais e quantos vértices são escolhidos influenciam diretamente o resultado do modelo. O gráfico abaixo mostra para uma de nossas amostras a diferença entre os dados brutos e interpolados, podemos notar que dependendo dos vértices escolhidos acabamos censurando alguns dados. No nosso caso as taxas para vencimentos superiores a 2500 dias não são consideradas, vamos mostrar como isso influencia o resultado do modelo, seus benefícios e desvantagens. Figura 5:Taxas observadas e interpoladas nos vértices fixos para amostra 4. 3.3.2 SELEÇÃO DAS AMOSTRAS Utilizamos amostras de 200 dias para a estimação dos parâmetros e aplicação do filtro, essas foram chamadas de amostras de desenvolvimento. Para avaliar a capacidade de predição do modelo foram selecionados os 100 dias consecutivos a cada uma das amostras de desenvolvimento, essas foram chamadas de amostras de validação. O modelo foi estimado em 4 amostras, a fragmentação dos dados em diferentes amostras sequenciais e parcialmente sobrepostas foi uma ferramenta utilizada para avaliar a robustez dos resultados e a possível existência de uma dinâmica no tempo 34 dos parâmetros de entrada dos filtros. A figura abaixo representa as amostras de desenvolvimento e validação do modelo. Amostra1 Amostra2 Amostra3 Amostra4 Desenvolvimento 19/10/2012 - 14/08/2013 Validação 15/08/2013 - 09/01/2014 Desenvolvimento 22/03/2013 - 09/01/2014 Validação 10/01/2014 - 05/06/2014 Desenvolvimento 15/08/2013 - 5/6/2014 Validação 06/06/2014 - 28/10/2014 Desenvolvimento 10/01/2014 - 28/10/2014 Validação 29/10/2014 - 26/03/2015 Figura 6: Representação das amostras utilizadas. 3.4 MÉTRICAS DE COMPARAÇÃO Todos os modelos serão comparados entre si e também com a eficiência de utilizar curva ajustada do dia atual como predição da curva do próximo dia. Para isso foi utilizada a curva ajustada obtida pelo filtro de Kalman aplicado diretamente nos dados observados. 𝑎𝑡+1 = 𝐸(𝛼𝑡 /𝑌𝑡 ) = 𝑎𝑡/𝑡 Os modelos também serão comparados com um passeio aleatório, definido pela equação abaixo, onde 𝜀 ~ 𝑈(min Δ𝑎𝑡/𝑡 , max Δ𝑎𝑡/𝑡 ), sendo o mínimo e o máximo será observado entre os parâmetros ajustados pelo Filtro de Kalman na amostra de desenvolvimento. 𝑎𝑡+1 = 𝐸(𝛼𝑡 /𝑌𝑡 ) = 𝑎𝑡/𝑡 + 𝜀 Os modelos serão comparados através das métricas 𝐸𝑄𝑀 e 𝐸𝑀, onde uma delas tem como objetivo mensurar a magnitude dos erros e a outra um possível viés respectivamente. As fórmulas para o cálculo de cada uma estão abaixo, considerando o valor observado como 𝜃 e o estimado como 𝜃̂. ̂ ∑𝑁 𝑖=1(𝜃𝑖 − 𝜃𝑖 ) ̂ 𝐸𝑄𝑀(𝜃) = 𝑁 2 35 𝐸𝑀(𝜃̂) = ̂ ∑𝑁 𝑖=1(𝜃𝑖 − 𝜃𝑖 ) 𝑁 Serão avaliadas a diferença entre os erros para os modelos nas amostras de desenvolvimento e validação, e a evolução dos erros ao longo horizonte de projeção. Serão avaliados os erros diretamente na curva observada e nas variáveis de estado também, considerando o descolamento entre variável projetada e variável ajustada após observação da curva. 36 4. RESULTADOS Para melhor entendimento dos resultados apresentados abaixo cada um dos modelos será referenciado da seguinte forma: - KF é o modelo de Nelson-Siegel estimado através do Filtro de Kalman com os dados observados. - KFi é o modelo de Nelson-Siegel estimado através do Filtro de Kalman com os dados interpolados. - KFd é o modelo de Nelson-Siegel adaptado com duas variáveis de nível, uma ativa antes da próxima reunião do Copom e outra depois, estimado através do Filtro de Kalman com os dados observados. - KFc é o modelo de Nelson-Siegel estimado através do Filtro de Kalman com os dados observados, excluindo aqueles com maturidades superiores a 2500 dias uteis. - EKF é o modelo de Nelson-Siegel estimado com o Filtro de Kalman Estendido, deixando o parâmetro de decaimento (𝜆) dinâmico, com os dados brutos. - KFr é um dos modelos que será usado para comparação com os demais, ele assume que a curva ajusta produzida pelo KF é a previsão para a curva de amanhã. - KFp é o outro modelo que será utilizado para comparação, ele assume que os parâmetros têm como dinâmica um passeio aleatório. Incialmente será apresentada a avaliação dos modelos individualmente e depois serão realizadas comparações consolidadas entre eles. 4.1 RESULTADOS KF Primeiramente observamos o EQM e EM entre a curva predita e as taxas observadas ao longo dos dias em cada uma das amostras, para tentar entender se o modelo mantém o nível de qualidade observado no desenvolvimento nos dias da validação. Após isso observamos os EQM entre os parâmetros preditos e os ajustados após a observação para cada um dos dias, tentando buscar um maior entendimento do resultado anterior. Os resultados obtidos foram sumarizados na tabela abaixo. 37 Modelo KF Amostra 1 Amostra 2 Amostra 3 Amostra 4 Curva (taxa observada) Parâmetros Beta1 ( variáveis de Beta2 estado) Beta3 Curva (taxa observada) Parâmetros Beta1 ( variáveis de Beta2 estado) Beta3 Curva (taxa observada) Parâmetros Beta1 ( variáveis de Beta2 estado) Beta3 Curva (taxa observada) Parâmetros Beta1 ( variáveis de Beta2 estado) Beta3 Erro Quadrático Médio Desenvolvimento Validação 1.27E-06 1.78E-06 1.00E-06 1.52E-06 1.14E-06 1.75E-06 4.83E-06 5.72E-06 1.77E-06 1.43E-06 9.47E-07 1.13E-06 1.17E-06 1.51E-06 1.07E-05 5.18E-06 1.37E-06 2.06E-06 6.39E-07 1.91E-06 7.80E-07 2.03E-06 5.13E-06 6.73E-06 1.36E-06 5.22E-06 1.82E-06 3.63E-06 1.82E-06 2.46E-06 3.91E-06 2.82E-05 Erro Médio Desenvolvimento Validação 5.81E-06 1.87E-04 -8.09E-06 3.46E-04 2.37E-05 -5.26E-04 2.41E-05 3.30E-04 -1.81E-05 3.04E-04 -3.66E-06 7.42E-04 -1.35E-05 -8.65E-04 -3.09E-05 7.66E-05 1.04E-06 -1.05E-05 -3.45E-05 5.28E-05 6.07E-05 4.02E-05 2.34E-05 -5.04E-04 -4.02E-06 -1.72E-03 -9.73E-06 -1.09E-03 -3.21E-07 3.71E-04 4.36E-05 -4.52E-03 Tabela 1: EQM e EM durante os períodos de desenvolvimento e validação em cada uma das amostras para o modelo KF. 6,0E-06 5,0E-06 4,0E-06 3,0E-06 2,0E-06 1,0E-06 0,0E+00 Amostra 1 Amostra 2 EQM Desenv Amostra 3 Amostra 4 EQM Valid Figura 7: EQM da curva no desenvolvimento e na validação nas 4 amostras para o modelo KF. Observando as métricas de erro nas quatro amostras, notamos que o nível de distorção entre os erros entre o desenvolvimento e validação não é muito grande, com exceção da amostra 4 onde o EQM aumenta quase que 5 vezes e além disso observamos um viés negativo no EM. Fica nítido também que o parâmetro mais sensível é a curvatura, sendo ele quem refletiu de forma mais direta o aumento dos erros de projeção da curva. 38 No gráfico abaixo vemos o EQM no período de validação para cada uma das amostras, condicionada ao número de dias que o modelo será utilizado para projetar a curva, nele conseguimos ver que além do grande descolamento já observado na amostra 4 existe também uma tendência crescente mais forte que nas outras amostras. 6,0E-06 5,0E-06 EQM 4,0E-06 3,0E-06 2,0E-06 1,0E-06 0,0E+00 10 20 30 40 50 60 70 80 90 100 Dias de utilização do modelo Amostra 1 Amostra 2 Amostra 3 Amostra 4 Figura 8: EQM da curva no condicionado ao tempo de uso na validação para o modelo KF. A utilização de quatro amostras sequenciais e parcialmente sobrepostas nos permite analisar os parâmetros de entrada do filtro, estimados pela verossimilhança, esses podem evidenciar a necessidade dinâmica nos mesmos e ajudar na compreensão dos resultados acima. 39 2 1,5 1 0,5 0 -0,5 -1 amostra1 amostra2 µ1 amostra3 µ2 amostra4 µ3 Figura 9: Parâmetros (𝜇) que guiam a dinâmica das variáveis de estado para o modelo KF. 1,2 1 0,8 0,6 0,4 0,2 0 -0,2 -0,4 -0,6 amostra1 amostra2 amostra3 Ф11 Ф12 Ф13 Ф21 Ф23 Ф31 Ф32 Ф33 amostra4 Ф22 Figura 10: Parâmetros (𝛷) que guiam a dinâmica das variáveis de estado do modelo KF. 40 0,0014% 0,0012% 0,0010% 0,0008% 0,0006% 0,0004% 0,0002% 0,0000% amostra1 amostra2 Q11 Q22 amostra3 Q33 amostra4 H Figura 11: Parâmetros (𝑄, 𝐻) que guiam a dinâmica das variáveis de estado no modelo KF. Notamos que em todos os parâmetros relacionados a curvatura apresentam maior instabilidade. Ao analisar os parâmetros da matriz Φ, nas primeiras amostras observamos algo próximo de uma matriz diagonal, que é o equivalente a pensarmos que cada um dos parâmetros segue um processo independente auto-regressivo de primeira ordem. Na amostra quatro os elementos fora da diagonal, principalmente aqueles que tem relação de algum parâmetro com a curvatura mudam de forma significante, podendo ser esse um dos motivadores da mudança na qualidade dos resultados da projeção nessa amostra. O conjunto dos resultados corrobora para um possível overfitting durante o desenvolvimento nessa amostra. Abaixo temos um gráfico com a variação do parâmetro 𝜆 entre as amostras, isso pode evidenciar a necessidade utilizar um modelo que permita dinamismo nesse parâmetro também. A ponderação entre a necessidade, as desvantagens e os benefícios dessa abordagem serão feitas quando observarmos os resultados do filtro de Kalman Estendido. Parâmetro amostra 1 amostra 2 amostra 3 amostra 4 λ 0.004391427 0.002412 0.002508 0.006218 Tabela 2: Parâmetro de decaimento em cada uma das amostras com o modelo KF. 41 4.2 RESULTADOS KFi Como essa versão do modelo usa exatamente a mesma estrutura do modelo anterior, tendo como única diferença a interpolação dos dados observados antes da aplicação do filtro, serão expostas as mesmas análises da seção anterior buscando entender a diferença nos resultados. Modelo KFi Amostra 1 Amostra 2 Amostra 3 Amostra 4 Curva (taxa observada) Parâmetros Beta1 ( variáveis de Beta2 estado) Beta3 Curva (taxa observada) Parâmetros Beta1 ( variáveis de Beta2 estado) Beta3 Curva (taxa observada) Parâmetros Beta1 ( variáveis de Beta2 estado) Beta3 Curva (taxa observada) Parâmetros Beta1 ( variáveis de Beta2 estado) Beta3 Erro Quadrático Médio Desenvolvimento Validação 1.32E-06 1.84E-06 1.04E-06 1.64E-06 1.23E-06 1.97E-06 4.61E-06 5.47E-06 1.94E-06 1.27E-06 1.81E-06 1.53E-06 2.00E-06 1.81E-06 4.43E-06 3.29E-06 1.17E-06 1.90E-06 1.22E-06 2.53E-06 1.32E-06 2.28E-06 3.30E-06 5.68E-06 1.42E-06 1.55E-06 1.83E-06 2.21E-06 1.85E-06 2.39E-06 3.77E-06 5.38E-06 Erro Médio Desenvolvimento Validação -5.19E-05 1.47E-04 1.36E-05 3.84E-04 -1.34E-06 -5.92E-04 1.42E-06 2.31E-04 -3.81E-05 2.34E-04 1.77E-06 7.68E-04 -4.75E-06 -8.34E-04 2.55E-05 -5.26E-04 -1.41E-04 -1.14E-04 -4.73E-05 5.81E-05 1.76E-05 -9.31E-05 6.54E-05 -6.94E-04 -6.56E-05 -1.14E-04 3.21E-05 1.24E-04 -7.02E-06 -4.18E-04 5.21E-05 -1.27E-04 Tabela 3: EQM e EM durante os períodos de desenvolvimento e validação em cada uma das amostras para o modelo KFi. 2,5E-06 2,0E-06 1,5E-06 1,0E-06 5,0E-07 0,0E+00 Amostra 1 Amostra 2 EQM Desenv Amostra 3 Amostra 4 EQM Valid Figura 12: EQM da curva no desenvolvimento e na validação nas 4 amostras no modelo KFi. Observando as métricas de erro nas quatro amostras, notamos que o nível de EQM e distorção entre os erros entre o desenvolvimento e validação são muito próximos e 42 um pouco menores aos do modelo KF, com exceção da amostra 4 aonde o modelo KF sofreu uma grande queda de desempenho enquanto o KFi continuou aderente. Sua aderência também está refletida nos resultados de EQM condicionado ao tempo de utilização, uma vez que os resultados são mais estáveis como observado no gráfico abaixo. 5,0E-06 4,5E-06 4,0E-06 EQM 3,5E-06 3,0E-06 2,5E-06 2,0E-06 1,5E-06 1,0E-06 5,0E-07 0,0E+00 10 20 30 40 50 60 70 80 90 100 Dias de utilização do modelo Amostra 1 Amostra 2 Amostra 3 Amostra 4 Figura 13: EQM da curva no condicionado ao tempo de uso na validação no modelo KFi. Notamos pelo EQM que o modelo KFi parece superior ao KF, nesse momento é importante lembrar que o desempenho do modelo KFi é fortemente dependente dos vértices escolhidos para estimação, temos aqui um indicio que foram escolhidos pontos que tornam a curva mais parcimoniosa gerando um modelo com preditividade mais estável inclusive em momentos aonde temos uma grande volatilidade na componente de curvatura. As análises a seguir nos ajudarão a fortalecer essa hipótese. 43 2 1,5 1 0,5 0 -0,5 amostra1 amostra2 µ1 amostra3 µ2 amostra4 µ3 Figura 14: Parâmetros (𝜇) que guiam a dinâmica das variáveis de estado no modelo KFi. 1,2 1 0,8 0,6 0,4 0,2 0 -0,2 amostra1 amostra2 amostra3 Ф11 Ф12 Ф13 Ф21 Ф23 Ф31 Ф32 Ф33 amostra4 Ф22 Figura 15: Parâmetros (𝛷) que guiam a dinâmica das variáveis de estado no modelo KFi. 44 0,000007 0,000006 0,000005 0,000004 0,000003 0,000002 0,000001 0 amostra1 amostra2 Q11 Q22 amostra3 Q33 amostra4 H Figura 16: Parâmetros (𝑄, 𝐻) que guiam a dinâmica das variáveis de estado no modelo KFi. Os resultados acima mostram uma estabilidade entre as amostras superior ao observado no modelo KF, esses resultados indicam que os parâmetros que guiam a dinâmica das variáveis de estado não tenham necessidade de serem modeladas dinamicamente e indicando que quando observamos instabilidade isso possa ser sinal de alguma deficiência na estimação, como por exemplo overfitting. Relembrando a informação contida no gráfico 3.2, conseguimos estruturar melhor nosso raciocínio, concluindo que o KF tenta modelar a curva completa, ou seja, os dados observados contemplam vértices mais longos. Encontrar uma estrutura de parâmetros que forneça um bom ajuste para esses vértices mais longos acaba penalizando a preditividade do modelo. Para confirmar essa hipótese temos o modelo KFc que foi construído com os dados observados, mas desconsiderando os vértices mais longo, seus resultados serão apresentados na próxima seção. Além disso também observamos o 𝐸𝑄𝑀 por faixa de maturidade, ou seja, particionamos cada uma das curvas observadas em 8 intervalos para identificar como cada uns dos modelos desempenha em cada intervalo. Os gráficos abaixo mostram os resultados. 45 3,0E-06 2,5E-06 EQM 2,0E-06 1,5E-06 1,0E-06 5,0E-07 0,0E+00 até 63 dias 64-126 dias 127-252 dias 253-504 dias 505-756 dias 757-1512 1513-2268 mais que dias dias 2268 dias Faixa de maturidade KF (desenvolvimento) KFi (desenvolvimento) KF (validação) KFi (validação) Figura 17: EQM por faixa de maturidade na amostra 1. 3,5E-06 3,0E-06 EQM 2,5E-06 2,0E-06 1,5E-06 1,0E-06 5,0E-07 0,0E+00 até 63 dias 64-126 dias 127-252 dias 253-504 dias 505-756 dias 757-1512 1513-2268 mais que dias dias 2268 dias Faixa de maturidade KF (desenvolvimento) KFi (desenvolvimento) KF (validação) KFi (validação) Figura 18: EQM por faixa de maturidade na amostra 2 46 3,5E-06 3,0E-06 EQM 2,5E-06 2,0E-06 1,5E-06 1,0E-06 5,0E-07 0,0E+00 até 63 dias 64-126 dias 127-252 dias 253-504 dias 505-756 dias 757-1512 1513-2268 mais que dias dias 2268 dias Faixa de maturidade KF (desenvolvimento) KFi (desenvolvimento) KF (validação) KFi (validação) Figura 19: EQM por faixa de maturidade na amostra 3. 4,5E-06 4,0E-06 3,5E-06 EQM 3,0E-06 2,5E-06 2,0E-06 1,5E-06 1,0E-06 5,0E-07 0,0E+00 até 63 dias 64-126 dias 127-252 dias 253-504 dias 505-756 dias 757-1512 1513-2268 mais que dias dias 2268 dias Faixa de maturidade KF (desenvolvimento) KFi (desenvolvimento) KF (validação) KFi (validação) Figura 20: EQM por faixa de maturidade na amostra 4 Pela análise dos gráficos fica evidente que o modelo KF apresenta um desempenho superior nas maturidades mais longas no desenvolvimento, isso é uma consequência da utilização desses dados na estimação, mas em alguns casos como no da amostra 4 esse benefício de ter um modelo melhor ajustado no desenvolvimento acaba gerando uma estrutura menos preditiva na amostra de validação. 47 Os resultados do modelo KFc serão utilizados para avaliar se quando partimos de dados referentes ao mesmo trecho da curva quais os benefícios e desvantagens de interpolar os dados Voltamos também a analisar a variação do parâmetro de decaimento (𝜆) entre as amostras. Existe uma variação relativa significante desse parâmetro no tempo porem com comportamento diferente do observado no KF. Parâmetro amostra 1 amostra 2 amostra 3 amostra 4 λ 0.00448 0.005757 0.00781 0.006647 Tabela 4: Parâmetro de decaimento em cada uma das amostras com o modelo KFi. 4.3 RESULTADOS KFc Como mencionado na seção anterior essa versão do modelo foi construída para testar se a busca por um ajuste para os vértices mais longos compromete a preditividade do modelo, abaixo apresentamos o desempenho do modelo nas métricas de erro. Modelo KFc Amostra 1 Amostra 2 Amostra 3 Amostra 4 Curva (taxa observada) Parâmetros Beta1 ( variáveis de Beta2 estado) Beta3 Curva (taxa observada) Parâmetros Beta1 ( variáveis de Beta2 estado) Beta3 Curva (taxa observada) Parâmetros Beta1 ( variáveis de Beta2 estado) Beta3 Curva (taxa observada) Parâmetros Beta1 ( variáveis de Beta2 estado) Beta3 Erro Quadrático Médio Desenvolvimento Validação 1.27E-06 1.77E-06 1.02E-06 1.58E-06 1.17E-06 1.85E-06 4.81E-06 5.62E-06 1.87E-06 1.39E-06 1.62E-06 1.36E-06 1.76E-06 1.63E-06 5.16E-06 3.29E-06 1.11E-06 1.85E-06 1.13E-06 2.50E-06 1.16E-06 2.16E-06 3.49E-06 6.44E-06 1.39E-06 1.46E-06 1.77E-06 2.09E-06 1.69E-06 2.17E-06 4.26E-06 5.96E-06 Erro Médio Desenvolvimento Validação -3.10E-06 1.71E-04 -1.20E-06 3.82E-04 1.59E-05 -5.77E-04 -4.29E-05 1.50E-04 -2.29E-05 3.37E-04 -3.32E-05 7.04E-04 1.53E-05 -8.03E-04 3.12E-05 -3.48E-04 3.10E-05 -2.57E-05 1.68E-05 1.10E-04 2.59E-05 -8.77E-05 3.62E-05 -7.44E-04 3.91E-05 -4.62E-05 3.67E-05 1.25E-04 -1.93E-05 -3.67E-04 5.85E-05 -2.13E-04 Tabela 5: EQM e EM durante os períodos de desenvolvimento e validação em cada uma das amostras para o modelo KFc. 48 2,0E-06 1,8E-06 1,6E-06 1,4E-06 1,2E-06 1,0E-06 8,0E-07 6,0E-07 4,0E-07 2,0E-07 0,0E+00 Amostra 1 Amostra 2 Amostra 3 EQM Desenv Amostra 4 EQM Valid Figura 21: EQM da curva no desenvolvimento e na validação nas 4 amostras no modelo KFc. 3,5E-06 3,0E-06 EQM 2,5E-06 2,0E-06 1,5E-06 1,0E-06 5,0E-07 0,0E+00 10 20 30 40 50 60 70 80 90 100 Dias de utilização do modelo Amostra 1 Amostra 2 Amostra 3 Amostra 4 Figura 22: EQM da curva no condicionado ao tempo de uso na validação para o modelo KFc. Como esperado a grande distorção do EQM médio na amostra 4, foi mitigada quando deixamos de utilizar as observações dos vértices mais longos na estimação do modelo. Com relação as métricas de erro de observamos que o modelo estimado com dados brutos tem desempenho marginalmente superior, reforçando a ideia de utilizar dados interpolados não traz nenhuma vantagem na estimação do modelo e ainda gera uma dependência muito grande entre o resultado e os vértices escolhidos. Também percebemos que a estimação do modelo deve ser coerente com sua aplicação, por exemplo se o objetivo for montar uma estratégia de negociação de 49 títulos com vencimento nos vértices mais longos o modelo KFc apresentaria resultados piores que o modelo KF, apesar de ser melhor em uma visão agregada. Abaixo são apresentados os gráficos com os parâmetros que guiam as variáveis de estado, vale ressaltar que elas são visivelmente mais estáveis que as dos demais modelos. 2 1,5 1 0,5 0 -0,5 amostra1 amostra2 µ1 amostra3 µ2 amostra4 µ3 Figura 23: Parâmetros (𝜇) que guiam a dinâmica das variáveis de estado no modelo KFc. 1,2 1 0,8 0,6 0,4 0,2 0 -0,2 amostra1 amostra2 amostra3 Ф11 Ф12 Ф13 Ф21 Ф23 Ф31 Ф32 Ф33 amostra4 Ф22 Figura 24: Parâmetros (𝛷) que guiam a dinâmica das variáveis de estado no modelo KFc. 50 0,000007 0,000006 0,000005 0,000004 0,000003 0,000002 0,000001 0 amostra1 amostra2 Q11 Q22 amostra3 Q33 amostra4 H Figura 25: Parâmetros (𝑄, 𝐻) que guiam a dinâmica das variáveis de estado no modelo KFc. Observamos também a dinâmica do parâmetro de decaimento entra as amostras, ele apresenta uma tendência de alta mesmo com os demais parâmetros aparentemente estáveis. Parâmetro amostra 1 amostra 2 amostra 3 amostra 4 λ 0.004553 0.005255 0.007861 0.006856 Tabela 6: Parâmetro de decaimento em cada uma das amostras com o modelo KFc. 4.4 RESULTADOS KFd A seguir vamos avaliar os resultados da adaptação proposta, buscando entender quais benefícios e fragilidades que ela apresenta. 51 Modelo KFd Amostra 1 Amostra 2 Amostra 3 Amostra 4 Curva (taxa observada) Nível A Parâmetros Nível B ( variáveis de Inclinação estado) Curvatura Curva (taxa observada) Nível A Parâmetros Nível B ( variáveis de Inclinação estado) Curvatura Curva (taxa observada) Nível A Parâmetros Nível B ( variáveis de Inclinação estado) Curvatura Curva (taxa observada) Nível A Parâmetros Nível B ( variáveis de Inclinação estado) Curvatura Erro Quadrático Médio Desenvolvimento Validação 1.42E-06 3.65E-06 4.26E-07 2.94E-06 1.44E-06 5.47E-06 1.49E-06 5.91E-06 5.91E-06 4.83E-06 1.84E-06 1.27E-06 8.86E-07 7.95E-07 1.52E-06 1.06E-06 1.84E-06 1.32E-06 1.07E-05 5.35E-06 1.09E-06 1.82E-06 3.58E-07 5.66E-07 1.10E-06 2.54E-06 1.04E-06 2.01E-06 3.69E-06 7.32E-06 1.49E-06 2.79E-06 8.05E-07 3.68E-06 2.16E-06 4.31E-06 1.84E-06 4.48E-06 5.43E-06 8.10E-06 Erro Médio Desenvolvimento Validação 2.09E-05 -6.17E-04 2.13E-05 -1.10E-03 3.20E-05 -1.20E-03 -2.75E-05 1.53E-03 -1.62E-05 2.34E-04 2.56E-05 -3.53E-05 8.65E-05 4.35E-05 8.88E-05 5.36E-05 -1.09E-04 1.27E-04 -3.00E-05 -6.00E-04 -4.87E-06 1.87E-04 -1.46E-05 -4.22E-05 -1.22E-05 2.73E-04 3.28E-05 2.34E-05 -2.32E-05 -6.18E-04 7.49E-05 7.53E-04 3.98E-05 1.20E-03 3.37E-05 1.06E-03 3.41E-05 -1.24E-03 1.55E-04 1.08E-03 Tabela 7: EQM e EM durante os períodos de desenvolvimento e validação em cada uma das amostras para o modelo KFd. 4,0E-06 3,5E-06 3,0E-06 2,5E-06 2,0E-06 1,5E-06 1,0E-06 5,0E-07 0,0E+00 Amostra 1 Amostra 2 EQM Desenv Amostra 3 Amostra 4 EQM Valid Figura 26: EQM da curva no desenvolvimento e na validação nas 4 amostras para o modelo KFd. 52 7,0E-06 6,0E-06 EQM 5,0E-06 4,0E-06 3,0E-06 2,0E-06 1,0E-06 0,0E+00 10 20 30 40 50 60 70 80 90 100 Dias de utilização do modelo Amostra 1 Amostra 2 Amostra 3 Amostra 4 Figura 27: EQM da curva no condicionado ao tempo de uso na validação para o modelo KFd. Pelos gráficos acima percebemos que no caso do modelo incluindo dois interceptos tivemos um avanço com relação ao modelo KF, nas amostras 2, 3 e 4. Vale ressaltar que na amostra 4, ele não apresentou uma grande distorção entre o desenvolvimento e a validação como o KF, ficando mais próximo dos resultados a apresentados pelos modelos KFi e KFc. Esse resultado traz uma evidência que o desempenho baixo do modelo KF na amostra 4 seja devido a uma variação na estrutura da curva (principalmente nos vértices longos como vimos anteriormente) que ao ser capturada apenas pelos 3 parâmetros gerou um modelo pouco preditivo. Aqui temos um indício que a inclusão de parâmetros adicionais pode reforçar a estrutura do modelo, ou seja, é possível conseguir uma estrutura mais preditiva sem precisar excluir um trecho da curva como fazemos nos modelos KFi e KFc. Um exemplo de abordagem que adiciona parâmetros ao modelo é a adaptação proposta por Svesson (1994). A adaptação proposta nesse trabalho trouxe ganhos de desempenho em algumas amostras, ela gera evidências de que essa possa ser uma boa abordagem para o mercado brasileiro, lembrando que ela precisa ser aprimorada. Existe a possibilidade de incorporar por exemplo o efeito não só de uma reunião copom, talvez de todas aquelas que o mercado tinha informação naquela data, aqui mantivemos os demais parâmetros com o mesmo comportamento, vale investigar abordagens. 53 É importante mencionar os resultados observados na amostra 1, quando o modelo KFd apresentou uma deterioração muito grande de sua capacidade preditiva na amostra de validação. A diferença desse resultado com os observados nos demais é tivemos um aumento do EQM em todos os parâmetros e não só na curvatura. Abaixo estão listadas as análises realizadas sobre estabilidade dos parâmetros estimados pela verossimilhança para guiar as variáveis de estado, com esses resultados buscamos entender melhor o que observamos nas métricas de erro que foram expostas anteriormente. 2,5 2 1,5 1 0,5 0 -0,5 -1 amostra 1 amostra 2 µ1 amostra 3 µ2 µ3 amostra 4 µ4 Figura 28: Parâmetros (𝜇) que guiam a dinâmica das variáveis de estado no modelo KFd. 2,5 2 1,5 1 0,5 0 -0,5 -1 -1,5 amostra 1 amostra 2 amostra 3 amostra 4 Ф11 Ф12 Ф13 Ф14 Ф21 Ф22 Ф23 Ф24 Ф31 Ф32 Ф33 Ф34 Ф41 Ф42 Ф43 Ф44 Figura 29: Parâmetros (𝛷) que guiam a dinâmica das variáveis de estado no modelo KFd. 54 0,000014 0,000012 0,00001 0,000008 0,000006 0,000004 0,000002 0 amostra 1 Q11 amostra 2 Q22 amostra 3 Q33 Q44 amostra 4 H Figura 30: Parâmetros (𝑄, 𝐻) que guiam a dinâmica das variáveis de estado no modelo KFd. Como observamos nos gráficos acima o modelo apresentam grande instabilidade nos parâmetros que as variáveis de estado, fica o alerta que precisamos buscar parcimônia entre número de parâmetros e overfiting. Como já realizado para os modelos KF e KFi, avaliamos a variação do parâmetro de decaimento (𝜆) entre as amostras, para verificar a adequação de fixar esse parâmetro constante no modelo. Parâmetro amostra 1 amostra 2 amostra 3 amostra 4 λ 0.004411 0.002395 0.007968 0.006156 Tabela 8: Parâmetro de decaimento em cada uma das amostras com o modelo KFd. 4.5 RESULTADOS EKF Nessa seção são apresentados os resultados do modelo EKF que tem como diferencial ser estimado permitindo que o parâmetro de decaimento também tenha dinâmica no tempo. A seguir temos os gráficos que representam o desempenho desse modelo de acordo com as métricas 𝐸𝑄𝑀 e 𝐸𝑀. 55 Modelo EKF Amostra 1 Amostra 2 Amostra 3 Amostra 4 Curva (taxa observada) Nível Parâmetros Inclinação ( variáveis de Curvatura estado) Decaimento Curva (taxa observada) Nível Parâmetros Inclinação ( variáveis de Curvatura estado) Decaimento Curva (taxa observada) Nível Parâmetros Inclinação ( variáveis de Curvatura estado) Decaimento Curva (taxa observada) Nível Parâmetros Inclinação ( variáveis de Curvatura estado) Decaimento Erro Quadrático Médio Desenvolvimento Validação 1.99E-06 3.69E-06 4.90E-07 7.42E-07 5.02E-07 6.91E-07 2.52E-05 5.61E-05 1.26E-08 5.76E-09 7.15E-06 7.54E-06 5.74E-07 3.98E-07 5.58E-07 2.99E-07 5.68E-05 6.75E-05 4.94E-07 1.97E-07 1.93E-06 5.58E-06 1.12E-06 2.64E-06 8.54E-07 1.86E-06 3.19E-05 1.87E-04 1.30E-07 5.97E-08 1.06E-05 1.12E-05 1.98E-06 1.54E-05 1.18E-06 2.41E-06 2.23E-04 7.33E-04 1.48E-06 2.18E-07 Erro Médio Desenvolvimento Validação 5.76E-05 1.55E-04 -3.01E-05 2.82E-05 7.88E-05 5.50E-05 2.74E-04 3.99E-04 6.19E-06 9.68E-06 9.63E-04 1.79E-03 -5.11E-05 -3.32E-05 1.01E-04 1.58E-05 6.12E-04 6.05E-03 3.95E-04 2.54E-04 -1.85E-04 -2.21E-04 -5.78E-05 8.48E-05 1.13E-05 6.59E-05 -8.12E-04 -3.46E-03 -2.04E-05 5.82E-05 1.98E-04 5.52E-04 9.95E-05 -3.17E-03 5.53E-05 -9.63E-04 2.44E-03 2.63E-02 7.36E-05 -3.22E-06 Tabela 9: EQM e EM durante os períodos de desenvolvimento e validação em cada uma das amostras para o modelo EKF. 1,2E-05 1,0E-05 8,0E-06 6,0E-06 4,0E-06 2,0E-06 0,0E+00 Amostra 1 Amostra 2 EQM Desenv Amostra 3 Amostra 4 EQM Valid Figura 31: EQM da curva no desenvolvimento e na validação nas 4 amostras para o modelo EKF. 56 2,5E-05 EQM 2,0E-05 1,5E-05 1,0E-05 5,0E-06 0,0E+00 10 20 30 40 50 60 70 80 90 100 Dias de utilização do modelo Amostra 1 Amostra 2 Amostra 3 Amostra 4 Figura 32: EQM da curva no condicionado ao tempo de uso na validação para o modelo EKF. Através dos resultados fica evidente que o patamar dos erros para o modelo EKF é muito superior aos observados em todos os modelos anteriores em todas as amostras. Na sequência serão apresentadas as análises realizadas com os parâmetros utilizados para guiar a dinâmica das variáveis de estado, essa informação será utilizada para entender melhor os resultados das métricas de erro já apresentados. 2 1,5 1 0,5 0 -0,5 -1 amostra 1 amostra 2 µ1 amostra 3 µ2 µ3 amostra 4 µ4 Figura 33: Parâmetros (𝜇) que guiam a dinâmica das variáveis de estado no modelo EKF. 57 2 1,5 1 0,5 0 -0,5 -1 -1,5 amostra 1 amostra 2 amostra 3 amostra 4 Ф11 Ф12 Ф13 Ф21 Ф22 Ф23 Ф31 Ф32 Ф33 Ф44 Figura 34: Parâmetros (𝛷) que guiam a dinâmica das variáveis de estado no modelo EKF. 0,0005 0,00045 0,0004 0,00035 0,0003 0,00025 0,0002 0,00015 0,0001 0,00005 0 amostra 1 Q11 amostra 2 Q22 amostra 3 Q33 Q44 amostra 4 H Figura 35: Parâmetros (𝑄, 𝐻) que guiam a dinâmica das variáveis de estado no modelo EKF. O objetivo de calibrar o EKF é conseguir permitir que o parâmetro de decaimento varie ao longo do tempo, durante esse trabalho usamos nossas amostras sequências para evidenciar essa necessidade, como foi mostrado no resultado de todos os modelos acima. No gráfico abaixo fica evidente que nossa aplicação do filtro de Kalman Estendido não foi a capaz de refletir essa dinâmica na variável de estado. Vale ressaltar que as séries abaixo têm mais de 90% de correlação, ou seja, nossa predição varia no sentido correto, mas a magnitude dessa variação é tão pequena que o resultado é visualmente constante quando comparado a variação na variável ajustada dada as observações. 58 0,0095 0,0085 0,0075 0,0065 0,0055 0,0045 1 10 19 28 37 46 55 64 73 82 91 100 109 118 127 136 145 154 163 172 181 190 199 208 217 226 235 244 253 262 271 280 289 0,0035 Decaimento (predito) Decaimento (ajustado) Figura 36: Variável de decaimento (λ) ajustada e predita na amostra 4 no modelo EKF. O comportamento da variável ajustada e a qualidade do ajuste da curva dadas as observações mostram que o filtro de de Kalmam Estendido é eficiente, mas existe uma dificuldade para calibrar os parâmetros que guiam as variáveis de estado através da verossimilhança. Esse problema já foi reportado por alguns autores ..., além da não-linearidade, violação da normalidade também é mencionada a forte correlação entre as variáveis como motivador de deficiência, observamos correlações superiores a 90% entre as variáveis em nossas amostras de desenvolvimento. 4.6 RESULTADOS KFp Abaixo estão listados de forma breve os resultados do modelo KFp que será utilizado adiante para comparação com os demais. 59 Modelo KFp Amostra 1 Amostra 2 Amostra 3 Amostra 4 Curva (taxa observada) Parâmetros Nível ( variáveis de Inclinação estado) Curvatura Curva (taxa observada) Parâmetros Nível ( variáveis de Inclinação estado) Curvatura Curva (taxa observada) Parâmetros Nível ( variáveis de Inclinação estado) Curvatura Curva (taxa observada) Parâmetros Nível ( variáveis de Inclinação estado) Curvatura Erro Quadrático Médio Desenvolvimento Validação 8.53E-06 8.37E-06 5.59E-06 5.55E-06 7.99E-06 6.31E-06 3.34E-05 3.02E-05 8.16E-06 3.13E-06 3.49E-06 1.74E-06 5.00E-06 1.62E-06 5.98E-05 1.54E-05 6.22E-06 1.18E-05 3.00E-06 8.32E-06 2.95E-06 6.82E-06 4.08E-05 2.69E-05 1.43E-05 1.30E-05 1.18E-05 1.07E-05 1.12E-05 9.04E-06 2.81E-05 3.30E-05 Erro Médio Desenvolvimento Validação -2.01E-04 -1.07E-04 -1.18E-04 9.76E-05 -1.83E-04 -3.58E-04 -5.65E-05 -2.93E-04 -5.99E-05 2.69E-04 -2.41E-04 2.04E-04 -3.79E-05 1.11E-05 1.02E-03 2.45E-04 -5.10E-06 -4.84E-04 -3.52E-06 -2.91E-04 -2.00E-05 -3.27E-04 5.98E-05 -1.33E-04 -2.70E-04 3.66E-04 -2.74E-04 2.83E-04 -1.27E-04 3.02E-04 3.15E-04 -1.12E-04 Tabela 10: EQM e EM durante os períodos de desenvolvimento e validação em cada uma das amostras para o modelo KF. 4.7 RESULTADOS KFr Abaixo estão listados de forma breve os resultados do modelo KFr que será utilizado adiante para comparação com os demais. Modelo KFr Amostra 1 Amostra 2 Amostra 3 Amostra 4 Curva (taxa observada) Parâmetros Nível ( variáveis de Inclinação estado) Curvatura Curva (taxa observada) Parâmetros Nível ( variáveis de Inclinação estado) Curvatura Curva (taxa observada) Parâmetros Nível ( variáveis de Inclinação estado) Curvatura Curva (taxa observada) Parâmetros Nível ( variáveis de Inclinação estado) Curvatura Erro Quadrático Médio Desenvolvimento Validação 1.30E-06 1.74E-06 1.05E-06 1.47E-06 1.18E-06 1.52E-06 4.89E-06 5.53E-06 1.82E-06 1.26E-06 1.00E-06 6.03E-07 1.19E-06 8.52E-07 1.08E-05 5.34E-06 1.38E-06 1.95E-06 6.51E-07 1.89E-06 7.85E-07 2.03E-06 5.18E-06 5.80E-06 1.39E-06 1.50E-06 1.87E-06 2.14E-06 1.87E-06 2.19E-06 4.14E-06 5.79E-06 Erro Médio Desenvolvimento Validação -1.34E-04 -1.23E-04 -1.33E-04 -1.72E-04 7.33E-05 1.03E-05 -1.62E-04 3.00E-04 -1.72E-04 4.17E-05 -2.07E-04 1.32E-04 5.90E-05 -2.20E-04 1.88E-05 1.83E-04 -4.78E-05 -7.92E-06 -3.93E-05 9.33E-05 -7.26E-05 -1.11E-04 1.61E-04 -3.22E-04 2.02E-05 -1.66E-04 9.22E-05 -7.78E-05 -1.11E-04 -1.16E-04 -1.85E-04 -6.23E-05 Tabela 11: EQM e EM durante os períodos de desenvolvimento e validação em cada uma das amostras para o modelo KF. 4.8 RESULTADOS CONSOLIDADOS 60 As tabelas apresentadas a seguir comparam através do 𝐸𝑄𝑀 e do 𝐸𝑀 os modelos listados acima. Métrica EQM Desenvolvimento EQM Validação KF 1.27E-06 1.78E-06 KFi 1.32E-06 1.84E-06 Amostra1 KFd 1.42E-06 3.65E-06 EKF 1.99E-06 3.69E-06 KFr 1.30E-06 1.74E-06 KFp 8.53E-06 8.37E-06 KFc 1.27E-06 1.77E-06 Tabela 12: EQM durante os períodos de desenvolvimento e validação da amostra 1, para todo os modelos. Métrica EQM Desenvolvimento EQM Validação KF 1.77E-06 1.43E-06 KFi 1.94E-06 1.27E-06 Amostra2 KFd 1.84E-06 1.27E-06 EKF 7.15E-06 7.54E-06 KFr 1.82E-06 1.26E-06 KFp 8.16E-06 3.13E-06 KFc 1.87E-06 1.39E-06 Tabela 13: EQM durante os períodos de desenvolvimento e validação da amostra 2, para todo os modelos. Métrica EQM Desenvolvimento EQM Validação KF 1.37E-06 2.06E-06 KFi 1.17E-06 1.90E-06 Amostra3 KFd 1.09E-06 1.82E-06 EKF 1.93E-06 5.58E-06 KFr 1.38E-06 1.95E-06 KFp 6.22E-06 1.18E-05 KFc 1.11E-06 1.85E-06 Tabela 14: EQM durante os períodos de desenvolvimento e validação da amostra 3, para todo os modelos. Métrica EQM Desenvolvimento EQM Validação KF 1.36E-06 5.22E-06 KFi 1.42E-06 1.55E-06 Amostra4 KFd 1.49E-06 2.79E-06 EKF 1.06E-05 1.12E-05 KFr 1.39E-06 1.50E-06 KFp 1.43E-05 1.30E-05 KFc 1.39E-06 1.46E-06 Tabela 15: EQM durante os períodos de desenvolvimento e validação da amostra 4, para todo os modelos. Métrica EM Desenvolvimento EM Validação KF -3.83E-06 -3.09E-04 Média em todas as amostras KFi KFd EKF -7.41E-05 2.91E-05 2.58E-04 3.80E-05 7.20E-05 5.70E-04 KFr -8.32E-05 -6.38E-05 KFp -1.34E-04 1.11E-05 KFc 1.10E-05 1.09E-04 Tabela 16: Média do EM durante os períodos de desenvolvimento e validação em todas as amostras, para todo os modelos. O gráfico abaixo sumariza os resultados observados nas tabelas acima, mostrando que nenhum dos modelos consegue ter um poder preditivo significantemente superior a simples utilização da curva do dia atual como estimativa para o próximo dia. 61 3,0E-06 2,5E-06 2,0E-06 1,5E-06 1,0E-06 5,0E-07 5,4E-06 7,0E-06 9,3E-06 9,1E-06 0,0E+00 EQM Desenv KF KFi EQM Valid KFd EKF KFr KFc KFp Figura 37: Média do EQM nas 4 amostras no desenvolvimento e na validação para cada modelo. Buscando entender com mais detalhes a capacidade de predição de cada um desses modelos foi avaliado como EQM evolui se um modelo calibrado em 200 dias como esse for em horizontes de tempo variando de 10 até 100 dias. 0,0011% 0,0009% EQM 0,0007% 0,0005% 0,0003% 0,0001% -0,0002% KF 10 20 30 40 50 60 70 80 90 100 Dias de utilização do modelo KFi KFd EKF KFr KFc KFp Figura 38: Evolução do EQM dado o horizonte de aplicação do modelo no período de validação, média em todas as amostras. 62 5. CONCLUSÃO Através do conjunto de modelos calibrados e das análises realizadas conseguimos entender melhor as vantagens e desvantagens da utilização do modelo dinâmico de Nelson-Siegel. Sobre os dados, concluímos que a interpolação dos dados não traz vantagens na estimação do modelo e pode embutir um viés no mesmo dependendo dos vértices escolhidos para estimação. Entendendo que a melhor abordagem é a utilização dos dados brutos, colocamos como ressalva a necessidade de um prévio mapeamento de qual será a aplicação do modelo calibrado, por exemplo a utilização das observações das maturidades mais longas acaba tornando o modelo menos preditivo para as maturidades curtas. Sobre o período para calibração, notamos que quando partimos para abordagem de fixar o parâmetro de decaimento o parâmetro de curvatura principalmente tende a absorver as variações que deveriam ocorrer no parâmetro fixado, mas precisamos ter parcimônia sobre a duração da robustez dessa compensação, os modelos não aparentam uma degradação rápida do seu desempenho. Devemos, no entanto, nos atentar a possível perda de interpretação dos parâmetros e a possíveis distorções causadas pelos efeitos de correlação que são largamente comentados na literatura. Uma abordagem que intuitivamente tornaria o modelo robusto por mais tempo, seria a estimação de todos os parâmetros com dinâmica, mas como vimos os resultados do modelo EKF foram insatisfatórios frente aos demais, esse resultado corroborou com o relatado por diversos autores ao comentar da dificuldade de calibração do modelo em um estrutura não-linear. Sobre o poder preditivo do modelo, primeiramente verificamos que a abordagem de filtragem é muito mais eficiente que a estimação em dois passos, depois realizando comparação dos diversos modelos estimados contra um passeio aleatório mostramos que a preditividade é significativamente superior. Porem a comparação da predição com a simples utilização da curva ajustada do dia anterior mostrou que para o horizonte de um dia nossos resultados foram apenas marginalmente superiores, mas vale ressaltar que essa última comparação é um 63 resultado pontual referente a aplicação de um VAR(1) para as dinâmica variáveis de estados do mercadora brasileiro em um período específico. Sobre a adaptação proposta, vimos que ela tem uma capacidade preditiva razoável, podendo gerar uma interpretação dos parâmetros mais próxima aos fatores que realmente guiam a taxa no nosso mercada. Fica como ressalva a necessidade de ter parcimônia com relação ao número de parâmetros, podendo gerar uma especificação sobre ajustada a amostra e por consequência um modelo pouco preditivo, também é importante atentar a correlação entre os parâmetros. Em linhas gerais, observamos que o modelo dinâmico de Nelson-Siegel combinado com o Filtro de Kalman é uma estrutura eficiente e preditiva, porém muito sensível demandando uma atenção com relação a estrutura de correlação dos parâmetros, horizonte de maturidades utilizadas e período de calibragem. Por fim é importante lembrar da dependência relativa a eficiência do algoritmo de otimização aplicado calibrar os parâmetros, uma vez que é recorrente na literatura que a sensibilidade aos chutes iniciais pode perturbar a calibração. 64 6. REFERÊNCIAS BIBLIOGRÁFICAS AFONSO, António; MARTINS, Manuel M. F. Level, slope, curvature of the sovereign yield curve, and fiscal behaviour. Journal of Banking & Finance, n. 1276, 2010. ANDERSON, B. D. O.; MOORE, J. B. Optimal filtering. Prentice-Hall, 1979. BARRETT, W. R.; GOSNELL, T. F. Jr; HEUSON, A. J. Yield Curve Shifts and the Selection of Immunization Strategies, Journal of Fixed Income, Vol. 5, No. 2, 1995. BIS. Zero-Coupon Yield Curves: Technical Documentation. BIS Papers 25, Bank for International Settlements, 2005. BJÖRK, T.; CHRISTENSEN, B. J. Interest rate dynamics and consistent forward rate curves. Mathematical Finance, v. 9, n. 4, p. 323-348, 1999. BLISS, Robert R. Movements in the term structure of interest rates. Federal Reserve Bank of Atlanta Review, 1997. BOLDER, D.; STRÉLISKI, D. Yield Curve Modelling at the Bank of Canada, Bank of Canada Technical Report, n. 84, 1999 CALDEIRA, J. F.; LAURINI, M. P.; PORTUGAL, M. S. Inferência bayesiana aplicada ao modelo dinâmico de Nelson-Siegel com volatilidade estocástica nos fatores. Revista Brasileira de Econometria, v. 30, n. 1, p. 123-161. 2010. CALDEIRA, J. F; MOURA, G. V.; PORTUGAL, M. S. Efficient Yield Curve Estimation and Forecasting in Brazil. Revista EconomiA, v. 11, n. 1, p. 27-51. 2010. CALDEIRA, J. F.; MOURA, G. V.; SANTOS, A. A. P. Otimização de Carteiras de Renda Fixa: Uma Abordagem Baseada em Modelos Fatoriais Dinâmicos Heterocedásticos. Texto para discussão, Universidade Federal de Santa Catarina; Florianópolis, 2012. COMMANDEUR, Jacques J. F.; KOOPMAN, Siem Jan. An introduction to state space time series analysis. Oxford University Press, 2007. COX, J. C.; INGERSOLL, J. E.; ROSS, S. A. A theory of the term structure of interest rates. Econometrica, v. 52, n. 2, p. 385-407, 1985. 65 DIEBOLD, Francis X.; LI, Canlin. Forecasting the term structure of government bond yields. Journal of Econometrics, v. 130, n. 2, p. 337-364, 2006. DIEBOLD, Francis X.; RUDEBUSCH, Glenn D.; ARUOBA, S. Boragan. The macroeconomy and the yield curve: a dynamic latent factor approach. Journal of econometrics, v. 131, n. 1-2, p. 309-338, 2006. DUFFEE, G. R. Term premia and interest rates forecasts in affine models. Journal of Finance, v. 57, n. 1, p. 405-443, 2002. DUFFIE, D.; KAN, R. A Yield-Factor Model of Interest Rates, Mathematical Finance, 6, 379-406, 1996. DURBIN, J.; KOOPMAN, S. J. Time series analysis by state space methods. 2nd. ed. Oxford University Press, 2012. FABOZZI, F. J.; MARTELLINI, L.; PRIAULET. P. Advanced Bond Portfolio Management, Wiley Finance ,2005. FRIEDMAN, Milton. Time perspective in demand for money. University of Chicago, 1977. GILLI, M; GROBE, S; SCHUMANN, E. Calibrating the Nelson-Siegel-Svensson model. COMISEF Working Paper Series 031, 2010. GOODWIN, G. C.; SIN, K. S. Adaptative Filtering Prediction and Control, Dover Publications, 2009. GURKAYNAK, R. S.; SACK, B.; WRIGHT, J. H. The U.S. Treasury Yield Curve: 1961 to the Present, 2006. HAMILTON, James D. Time Series Analysis. Princeton University Press, 1994. HARVEY, Andrew. Forecasting, structural time series models and the Kalman Filter. Cambridge University, 1989. HARVEY, Andrew. Forecasting with unobserved components time series models. North-Holland, 2006. HO, Thomas S. Y.; Lee, Sang-Bin. Term structure movements and pricing interest rate contingent claims. The Journal of Finance, v. 41, n. 5, p. 1011-1029, 1986. 66 HULL, J.; WHITE, A. Pricing interest rate derivative securities. The Review of Financial Studies, v. 3, n. 4, p. 573-592, 1990. HURN, A. S.; LINDSAY, K. A.; PAVLOV, V. Smooth estimation of yield curves by Laguerre functions , 2005. KALMAN, R. E. A New Approach to Linear Filtering and Predction Problems, Research Institute for Advanced Study, Baltimore, Md, 1960. KALMAN, R. E.; BUCY, R. S. New Results in Linear Filtering and Prediction Theory. Journal of Basic Engineering, v. 83, p. 95-108, 1961. KOOPMAN, Siem Jan; MALEE, Max; Van der Wel, Michael. Analyzing the term structure of interest rates using the dynamic Nelson-Siegel model with time-varying parameters. Journal of Business and Economic Statistics, v. 28, n. 33, p. 329-343, 2010. LÜTKEPOHL, Helmut. New introduction to multiple time series analysis. Springer, 2007. MULLER, B. B. Modelo Nelson-Siegel Dinâmico da Estrutura a Termo da Taxa de Juros com Fatores Exógenos Macroeconômicos Uma aplicação ao mercado brasileiro, FGV-EESP, 2014. NELSON, C. R.; SIEGEL, A. F. Parsimonious modeling of yield curves. Journal of business, v. 60, n. 4, p. 473-489. 1987. POOTER, Michiel De. Examining the Nelson-Siegel Class of Term Structure Models. Tinbergen Institute Discussion Paper. 2007. SIEGEL, AF; NELSON, CR. Long-term behavior of yield curves. The Journal of Financial and Quantitative Analysis, n. 1789, 1988. SVENSSON, L. E. O. Estimating and Interpreting Forward Interest Rates: Sweden 1992-1994. p. 49, 1994. TUSELL-PALMER, F. Kalman Filtering in R. Journal of Statistical Software, v. 39, n. 2, 2011. VASICEK, O. An equilibrium characterization of the term structure. Journal of Financial Economics, v. 5, n. 2, p. 177-188, 1977. 67 WIENER, Norbert. Extrapolation, Interpolation and Smoothing of Stationary Time Series, 1949.