Insper Instituto de Ensino e Pesquisa Programa de Mestrado Profissional em Economia Decio Albert da Silva Santos PREVISÃO DE VOLATILIDADE: A VOLATILIDADE IMPLÍCITA COMO VARIÁVEL EXPLICATIVA DA VARIÂNCIA CONDICIONAL EM MODELOS GARCH São Paulo 2012 Decio Albert da Silva Santos Previsão de Volatilidade: A Volatilidade Implícita como Variável Explicativa da Variância Condicional em Modelos GARCH Dissertação apresentada ao Programa de Mestrado Profissional em Economia do Insper Instituto de Ensino e Pesquisa, como parte dos requisitos para a obtenção do título de Mestre em Economia. Área de concentração: Finanças e Macroeconomia Aplicadas Orientador: Prof. Dr. Antonio Zoratto Sanvicente – Insper São Paulo 2012 FOLHA DE APROVAÇÃO Decio Albert da Silva Santos Previsão de Volatilidade: A Volatilidade Implícita como Variável Explicativa da Variância Condicional em Modelos GARCH Dissertação apresentada ao Programa de Mestrado Profissional em Economia do Insper Instituto de Ensino e Pesquisa, como requisito parcial para obtenção do título de Mestre em Economia. Área de concentração: Finanças e Macroeconomia Aplicadas Aprovado em: Banca Examinadora Prof. Dr. Antonio Zoratto Sanvicente Orientador Instituição: Insper Instituto de Ensino e Pesquisa Assinatura: _________________________ Profa. Dra. Adriana Bruscato Instituição: Insper Instituto de Ensino e Pesquisa Assinatura: _________________________ Prof. Dr. Roberto Borges Kerr Instituição: Universidade Presbiteriana Mackenzie Assinatura: _________________________ RESUMO SANTOS, Decio Albert da Silva. Previsão de Volatilidade: A Volatilidade Implícita como Variável Explicativa da Variância Condicional em Modelos GARCH. 2012. 58 f. Dissertação (Mestrado) – Insper Instituto de Ensino e Pesquisa, São Paulo, 2012. A previsão de volatilidade é um assunto de grande interesse no mercado financeiro. Os modelos GARCH e a volatilidade implícita são bastante utilizados para este fim. Neste trabalho, a volatilidade implícita foi utilizada como uma variável explicativa da variância condicional de modelos GARCH, com o objetivo de aumentar o poder de previsão do modelo. Foram utilizados dados do mercado de ações brasileiro, mais precisamente do índice de ações Ibovespa, no período de abril de 2000 a junho de 2011. A volatilidade implícita foi extraída das opções de compra do Ibovespa utilizando o modelo de precificação de opções de Black e Scholes. As previsões dos modelos propostos no trabalho foram comparadas com previsões de modelos GARCH tradicionais, realizadas em quatro períodos diferentes e em previsões fora da amostra de estimação dos modelos. Os resultados obtidos indicaram que o uso da volatilidade implícita como variável explicativa da variância condicional em modelos GARCH não aumenta o poder de previsão em comparação com os modelos GARCH tradicionais. Sendo GARCH(1,1) o modelo com os melhores resultados nas previsões de volatilidade. Palavras-chave: Volatilidade implícita; GARCH; Variável explicativa; Previsão. Abstract SANTOS, Decio Albert da Silva. Volatility Forecasting: Implied Volatility as an Explanatory Variable of Conditional Variance in GARCH Models. 2012. 58 f. Dissertation (Mastership) – Insper Instituto de Ensino e Pesquisa, São Paulo, 2012. Volatility forecasting is a topic of great interest in financials markets. Implied volatility and GARCH models are widely used for this purpose. In this dissertation, the implied volatility was used as an explanatory variable of the conditional variance in GARCH models, in order to increase the predictive power of the model. Data were obtained for the Brazilian stock market, specifically the Ibovespa stock index in the period April 2000 to June 2011. Implied volatilities were extracted from the Ibovespa call options using the Black and Scholes option pricing model. The predictions of the models proposed in the study were compared with traditional GARCH model predictions, made in four different periods and with out-of-sample forecasts from the models. The results obtained indicated that the use of implied volatility as an explanatory variable of the conditional variance in GARCH models does not increase the predictive power compared to traditional GARCH models. As GARCH (1,1) model with the best results in forecasts of volatility Keywords: Implied volatility; GARCH; Explanatory variable; Forecasting. Sumário 1 Introdução ............................................................................................................. 6 2 Revisão Bibliográfica ............................................................................................ 9 3 Modelos de Volatilidade ...................................................................................... 12 4 3.1 Modelos ARCH ............................................................................................ 13 3.2 Modelos GARCH .......................................................................................... 14 3.3 Modelos EGARCH ....................................................................................... 15 3.4 Modelos TARCH .......................................................................................... 16 3.5 Volatilidade Implícita .................................................................................... 16 3.6 Modelos GARCH-VI, EGARCH-VI e TARCH-VI .......................................... 17 Dados ................................................................................................................. 18 4.1 5 6 Série de Volatilidades Implícitas .................................................................. 22 Metodologia ........................................................................................................ 23 5.1 Estimação dos Modelos ............................................................................... 27 5.2 Previsão e Resultados ................................................................................. 34 Conclusão ........................................................................................................... 39 Referências ............................................................................................................... 41 APÊNDICE A – Séries de Opções de Compra do Ibovespa ..................................... 43 APÊNDICE B – Testes-Q e Correlogramas dos Resíduos Padronizados e Resíduos Padronizados ao Quadrado dos Modelos Estimados ................................................ 46 6 1 Introdução A relação inversa entre risco e retorno faz parte de um dos conceitos-chave da teoria moderna de finanças. O risco pode ser associado à noção de variabilidade de preços, comumente chamada de volatilidade. Saber como medir e prever a volatilidade tem sido um dos temas mais discutidos nas áreas de precificação de ativos e gerenciamento de risco. Andersen et al. (2005, p. 7) mostra algumas aplicações do uso de volatilidade em finanças de forma mais detalhada. Em finanças, a forma mais comum e simples de se representar a volatilidade é através do desvio padrão ( , igual à raiz quadrada da variância ) dos retornos de um ativo. Sem a necessidade de supormos uma distribuição de probabilidades, podemos usar o estimador da variância ( ) para obtermos uma estimação para a volatilidade de um ativo: R N ˆ 2 t 1 Onde t R N 1 2 (1) é o retorno do ativo no tempo t, ̅ é o retorno médio entre os instantes t=1 e t=N. Existem vários modelos para estimar e prever a volatilidade, destacando-se dois grandes grupos: modelos que usam séries de tempo e modelos de volatilidade implícita. No primeiro grupo, inicialmente temos os modelos que usam o desvio padrão histórico como base. O mais simples desta categoria é o Modelo de Passeio Aleatório, utilizando o desvio padrão no tempo anterior para prever o próximo. Em seguida, temos: a) modelo de Média Histórica, que simplesmente calcula a média das volatilidades anteriores; b) modelo de Média Móvel Histórica, diferenciando-se do anterior por não usar todo o histórico de volatilidades; c) modelo de Alisamento Exponencial, semelhante ao modelo de Média Histórica, dando maior peso às informações mais recentes; e d) modelo de Médias Móveis Exponencialmente Ponderadas (EWMA, em inglês), que é o modelo de Média Móvel com ponderação exponencial. Nesta categoria também temos os modelos autorregressivos (AR). Esses modelos fazem uma regressão simples usando as volatilidades passadas e 7 um termo de erro, expressando a volatilidade como uma função dessas variáveis. Na maioria dos casos, os modelos são puramente autorregressivos, mas também podemos encontrar modelos onde termos de erros passados são incluídos (ARMA), outros ainda onde há diferenciação (ARIMA) e outras variantes. Trabalhos baseados nestes modelos normalmente se resumem a buscar melhores métodos de ponderação, janelas de tempo ou número de defasagens dos parâmetros, geralmente tentando achar os melhores resultados, minimizando erros de previsão em testes dentro da amostra. Cabe citar, devido à grande visibilidade, que o Riskmetrics1 utiliza o modelo EWMA. Ainda dentro do grupo de modelos que utilizam séries de tempo, há os modelos de Volatilidade Estocástica e a família de modelos de Heteroscedasticidade Condicional Autorregressiva (ARCH, em inglês). Os modelos ARCH foram introduzidos inicialmente por Engle (1982). Estes modelos não usam simplesmente os desvios padrão calculados numa amostra; ao invés disso, formulam uma variância condicional dos retornos via estimação por Máxima Verossimilhança. No primeiro modelo proposto por Engle, o modelo ARCH(q), a variância é uma função dos “q” retornos passados ao quadrado. Bollerslev (1986) e Taylor (1986), de forma independente, propuseram os modelos de Heteroscedasticidade Condicional Autorregressiva Generalizados (GARCH, em inglês). Os modelos GARCH(p,q), adicionalmente ao modelo ARCH(q), admitem “p” defasagens da variância condicional na formulação, sendo assim mais abrangentes que os modelos ARCH. Mais genericamente, os modelos de Volatilidade Estocástica introduzem inovação na formulação da volatilidade. Essas inovações podem ter ou não relação com os retornos e permitem que os modelos de Volatilidade Estocástica capturem características como curtose e assimetria, incluindo saltos, tornando-se assim modelos mais próximos da realidade observada. Entretanto, essas características em geral dificultam a sua implementação, principalmente por resultarem em modelos de volatilidade sem uma fórmula fechada, não permitindo, por exemplo, o uso de estimadores de Máxima Verossimilhança. Alguns métodos de estimação alternativos 1 Riskmetrics atualmente é uma agência de serviços em governança corporativa e gestão de riscos norte americana que faz parte do grupo MSCI, empresa de índices de mercado. Inicialmente surgiu como um modelo de variância, de mesmo nome, criado pela necessidade de um relatório diário de medida e explicação de riscos do J. P. Morgan, em 1989. Em 1998 se tornou uma empresa externa ao J. P. Morgan. 8 foram propostos, por exemplo, por Harvey, Ruiz e Shephard (1994), usando estimação através do Método dos Momentos Generalizados (GMM), e por Jacquier, Polson e Rossi (1994), usando Cadeias de Markov. Note-se que os modelos GARCH também fazem parte dos modelos de Volatilidade Estocástica. Os modelos de volatilidade implícita são baseados em modelos de precificação de ativos que utilizam a volatilidade do ativo a ser precificado como um parâmetro de entrada do modelo. Esses modelos de precificação partem de hipóteses sobre a volatilidade do ativo que geralmente não são observadas na prática. Ao invés de usar o modelo para calcular o preço do ativo, toma-se o preço negociado pelo mercado e calcula-se a volatilidade que seria responsável por este preço observado. Esta volatilidade calculada é chamada de volatilidade implícita, sendo constantemente utilizada, diretamente, como uma previsão da volatilidade ou, indiretamente, como variável explicativa em modelos de previsão de volatilidade, como os citados anteriormente. Neste trabalho, a volatilidade implícita é utilizada como uma variável explicativa em modelos da família GARCH2, para previsão de volatilidade no mercado de ações brasileiro, mais precisamente do índice de ações da BM&FBovespa3, o IBovespa. São estimados modelos tradicionais da família GARCH e modelos, propostos neste trabalho, que incluem a volatilidade implícita. São feitas previsões de volatilidades de ambos, com o objetivo de verificar se a volatilidade implícita traz algum benefício na previsão de volatilidades quando utilizada como variável explicativa em modelos da família GARCH. A seguir, no capítulo 2, é feita uma revisão bibliográfica descrevendo brevemente os resultados de alguns trabalhos na área de previsão de volatilidade e de trabalhos que usaram a volatilidade implícita nessa previsão. No capítulo 3 são apresentados os modelos de volatilidade utilizados neste trabalho, destacando-se os modelos propostos que utilizam a volatilidade implícita como variável explicativa em modelos GARCH. No capítulo 4 é apresentada a base de dados utilizada neste trabalho, além da metodologia de construção da série de volatilidades implícitas necessária para os 2 O termo GARCH, quando citado sem fazer menção aos parâmetros do modelo, por exemplo, GARCH(p,q), estará se referindo genericamente aos modelos da família GARCH e suas variantes, entre elas EGARCH e TARCH. Da mesma forma o termo GARCH-VI, que será visto mais à frente, também estará se referindo genericamente aos modelos apresentados neste trabalho: GARCHVI(p,q,r), EGARCH-VI(p,q,r) e TARCH-VI(p,q,r). 3 A BM&FBovespa é a única bolsa de valores, mercadorias e futuros em operação no Brasil. 9 modelos propostos. No capítulo 5 é apresentada a metodologia utilizada para estimação, previsão e avaliação dos modelos e também os resultados obtidos para os modelos. O capítulo 6 traz a conclusão deste trabalho, após a análise dos resultados obtidos. 2 Revisão Bibliográfica Na literatura existem vários trabalhos na área de estimação e previsão de volatilidade. Esses trabalhos normalmente fazem comparações entre modelos buscando qual o melhor segundo algum critério. A seguir é feita uma breve descrição de alguns desses trabalhos para o mercado brasileiro e também de alguns trabalhos de outros países. No trabalho de Pereira et al. (1999) foram feitas avaliações sobre o poder de estimação de volatilidade de modelos da família ARCH, modelos de volatilidade estocástica e modelos SWARCH, para os retornos de três séries diferentes (Telebras PN, C-Bond e Taxa de Câmbio R$/US$) no período de agosto de 1994 a julho de 1998. O modelo de volatilidade estocástica foi o modelo com melhor desempenho segundo o critério de classificação utilizado, que usa uma média ponderada de cinco diferentes critérios estatísticos de desempenho. Morais e Portugal (1999) fizeram um estudo de modelos de volatilidade determinística e modelos de volatilidade estocástica para estimação e previsão da volatilidade dos retornos do Ibovespa em períodos de crise: a crise do México, a crise asiática e a moratória russa. Os modelos determinísticos estudados foram os modelos da família GARCH. A conclusão foi a de que, de maneira geral, ambos os tipos de modelos fornecem boas previsões da volatilidade do Ibovespa. Gabe e Portugal (2004) analisaram o desempenho de previsões de volatilidade no mercado brasileiro para ações da Telemar S.A. no período de setembro de 1998 a outubro de 2002. Foram comparados os modelos de média móvel igualmente ponderada, GARCH, EGARCH, FIGARCH e volatilidade implícita. O resultado encontrado foi o de que o modelo de volatilidade implícita não apresentou vantagem na previsão de volatilidade quando comparado aos outros modelos, sendo o modelo 10 FIGARCH o mais indicado para previsão de volatilidade futura, segundo esse estudo. Hansen e Lunde (2005) compararam 330 modelos de previsão de volatilidade da família ARCH, com o objetivo de verificar se modelos mais sofisticados são superiores ao modelo GARCH(1,1). Usaram dados de taxa de câmbio entre o Marco Alemão e o Dólar e também retornos das ações da IBM. Eles não encontraram evidências que o modelo GARCH(1,1) foi superado por modelos mais sofisticados para a taxa de câmbio. Por outro lado, para os retornos da ações da IBM, encontraram evidências conclusivas que o modelo GARCH(1,1) é inferior, sugerindo o uso de especificações que acomodem o efeito alavancagem. Galdi e Pereira (2007) apresentaram um estudo em que o desempenho de modelos de volatilidade foi avaliado através do uso da métrica de risco denominada Valor em Risco (VaR). Os modelos utilizados no trabalho foram o EWMA, modelos GARCH e modelos de volatilidade estocástica. As estimações foram feitas para a série de retornos das ações Petrobras PN, abrangendo o período de janeiro de 1995 a janeiro de 2006. Os modelos estimados foram submetidos a testes de extrapolação do VaR dentro da amostra. Segundo os autores, o modelo de melhor resultado foi o EWMA. Santos e Ziegelmann (2008) compararam o desempenho de modelos GARCH e modelos aditivos semi-paramétricos para estimação e previsão de volatilidade do Ibovespa, no período de 1995 a 2007, ressaltando os períodos de crise em 2001, 2002 e 2007. Concluíram que os modelos aditivos são capazes de estimar e prever a volatilidade adequadamente, mas não são concorrentes dos modelos paramétricos e devem ser utilizados como um modelo complementar na previsão de volatilidade. No estudo, o modelo TARCH(3,2) foi superior nos resultados quando os modelos foram comparados através de medidas de erro de previsão. Cavaleri (2008) fez uma comparação de modelos de previsão de volatilidade e combinações desses modelos. A combinação de modelos tem “a finalidade de agregar as características mais relevantes de cada um dos modelos utilizados em uma determinada situação” (Cavaleri, 2008, p. 30). Os modelos utilizados foram os modelos da família GARCH, o modelo EWMA e modelos de volatilidade estocástica. As técnicas de combinação utilizadas foram a combinação por média aritmética, a combinação com pesos fixos e a combinação com pesos móveis. O estudo utilizou 11 dados do Ibovespa, do índice Dow Jones e do IGP-M, no período de janeiro de 2002 a dezembro de 2007 para as duas primeiras séries e no período de janeiro de 1995 a março de 2008 para a terceira. Cavaleri (2008) concluiu que as técnicas de combinação melhoram a previsão de volatilidade quando comparadas aos modelos individuais. Oliveira (2008) fez um estudo sobre a modelagem da volatilidade de retornos usando dados de alta frequência. O estudo foi feito sobre a série de ações Petrobras PN no período de 3 de janeiro de 2005 a 13 de abril de 2005, totalizando 120 mil observações. No estudo foram utilizados modelos da família GARCH, com o objetivo de verificar a presença de memória longa e outros fenômenos. As presenças de memória longa e de sazonalidade intradiária foram confirmadas. Vicente e Guedes (2010), em seus estudos, tiveram como objetivo determinar se a volatilidade implícita contém informação sobre a volatilidade futura. O trabalho foi realizado utilizando séries de opções de compra da Petrobras no período de janeiro de 2006 a dezembro de 2008. A volatilidade implícita foi calculada com base no modelo de precificação de opções de Black e Scholes. A conclusão obtida foi a de que opções out-of-the-money4 contêm mais informação adicional sobre a volatilidade futura, ao contrário das opções in-the-money5 e at-the-money6. Lamoureux e Lastrapes (1993) realizaram um estudo sobre o poder de previsão da volatilidade futura pela volatilidade implícita. Utilizaram séries de opções de dez ações negociadas na Chicago Board Options Exchange, no período de 1982 a 1984. Concluíram que a volatilidade implícita é viesada e ineficiente, não tendo nenhuma informação adicional sobre a volatilidade futura em comparação com modelos que utilizam a volatilidade passada. Christensen e Prabhala (1998) também realizaram estudo sobre o poder de previsão da volatilidade implícita sobre a volatilidade futura. Eles utilizaram opções sobre o índice S&P100 no período de novembro de 1983 a maio de 1995. Os resultados encontrados foram os de que a volatilidade implícita apresentou resultados melhores do que modelos de volatilidade histórica na previsão de volatilidades futuras. 4 Out-of-the-money (OTM) é o termo utilizado quando o preço do ativo subjacente está abaixo do preço de exercício de uma opção de compra ou acima do preço de exercício de uma opção de venda. 5 In-the-money (ITM) é o termo utilizado quando o preço do ativo subjacente está acima do preço de exercício de uma opção de compra ou abaixo do preço de exercício de uma opção de venda. 6 At-the-money (ATM) é o termo utilizado quando o preço do ativo subjacente é igual ao preço de exercício de uma opção de compra ou de venda. 12 Doidge e Wei (1998) verificaram a eficiência do mercado de opções canadense utilizando estratégias delta neutral straddle7 com opções do índice Toronto 35, no período de 1988 a 1995. Apesar do objetivo principal do trabalho não ser a previsão de volatilidade, para implementar a estratégia proposta um dos modelos utilizados fez uso da volatilidade implícita como variável explicativa em um modelo GARCH, como também é proposto neste trabalho. Vasilellis e Meade (1996), em trabalho semelhante ao que foi posteriormente realizado por Cavaleri (2008), realizaram comparações entre modelos de previsão de volatilidade e modelos combinados, para doze empresas listadas na London Stock Exchange no período de março de 1986 a setembro de 1991. Da mesma forma, concluíram que os modelos combinados, que incluem volatilidade implícita, possuem maior poder de previsão da volatilidade. Hol e Koopman (2002) compararam previsões com modelos de volatilidade estocástica e modelos de volatilidade estocástica que incluem a volatilidade implícita como variável explicativa. O estudo foi realizado sobre o índice S&P100 no período de janeiro de 1986 a junho de 2001. De maneira geral, os modelos de volatilidade estocástica que incluíam a volatilidade implícita como variável explicativa tiveram melhores resultados na previsão de volatilidades. 3 Modelos de Volatilidade Até o início dos anos 80, a maioria dos modelos existentes, utilizados para modelar a volatilidade de séries financeiras, considerava que a variância de um conjunto de dados era constante. A modelagem era feita, normalmente, utilizando modelos lineares e autorregressivos, condicionados, principalmente, aos retornos da série financeira. Entretanto, na prática, estes modelos não conseguiam bons resultados, posto que claramente a hipótese de variância constante não era observada. Uma série financeira pode ter momentos de alta volatilidade e momentos de baixa volatilidade, além de ser observado que momentos de alta volatilidade tendem a ser 7 Delta neutral straddle é uma estratégia de investimento do mercado de opções que consiste na compra simultânea de uma opção de compra e uma opção de venda. Esta estratégia é uma aposta de alta volatilidade do preço do ativo subjacente. O termo delta neutral se refere ao fato da estratégia proteger o investimento contra variações no preço do ativo subjacente. O delta de uma opção mede a variação do preço da opção em função do preço do ativo subjacente. 13 seguidos por alta volatilidade e momentos de baixa volatilidade tendem a ser seguidos por baixa volatilidade, característica conhecida como agrupamento de volatilidade. Neste capítulo são apresentados os modelos de volatilidade utilizados neste trabalho. 3.1 Modelos ARCH Engle (1982) apresentou um modelo paramétrico em que a média e a variância de uma série temporal são modeladas simultaneamente, com a variância sendo condicionada aos choques passados, permitindo que ela varie ao longo do tempo e sendo capaz de capturar os agrupamentos de volatilidade. Este modelo foi chamado de Autoregressive Conditional Heteroskedasticity (ARCH), ou Heteroscedasticidade Condicional Autorregressiva, em português. Um modelo ARCH(q) pode ser representado como segue: r m i 1 j 1 y t c i y t i j t j t (2) q t2 i t2i (3) i 1 Onde: ∑ A equação (2) expressa a média condicional da série de retornos ( ), representada por um modelo autorregressivo e de média móvel ARMA(r, m), que poderia incluir também variáveis exógenas. A equação (3) representa a variância condicional dependente de q inovações passadas. As restrições dos coeficientes serem maiores que zero garantem que a variância seja positiva. A restrição que diz que o somatório dos coeficientes das 14 inovações tem que ser menor que um garante à variância condicional tendência para convergir para uma constante, que representa a variância incondicional. Segundo Bollerslev et al. (1992), a variância incondicional é dada pela seguinte equação: 2 (4) q 1 i i 1 3.2 Modelos GARCH Frequentemente, os modelos ARCH apresentam uma ordem (q) elevada, o que pode causar dificuldades na estimação de seus vários parâmetros. Bollerslev (1986) acrescenta termos da variância passada à equação de variância do modelo ARCH. Ao acrescentar termos passados da própria variância, o modelo tende a ficar com ordem menor, diminuindo a quantidade de parâmetros a serem estimados. Este modelo foi chamado de Generalized Autoregressive Conditional Heteroskedasticity (GARCH), ou Heteroscedasticidade Condicional Autorregressiva Generalizada, em português. A equação (5) apresenta a equação da variância condicional de um modelo GARCH(p, q) com a inclusão das variâncias passadas. A modificação no modelo ocorre apenas na equação da variância condicional, e a equação da média condicional pode ser representada pela equação (2) do modelo ARCH. p j 2 t j 1 Onde: ∑ ∑ q 2 t j i t2i i 1 (5) 15 Novamente, a restrição sobre o somatório dos parâmetros diz respeito à tendência a uma variância incondicional constante, que neste caso é representada pela equação (6): 2 q p i 1 j 1 (6) 1 i j O modelo GARCH é uma generalização do modelo ARCH. O modelo ARCH é um caso especial do modelo GARCH onde não há termos da variância passada na equação da variância condicional. Assim, os modelos da família ARCH fazem parte dos modelos da família GARCH. 3.3 Modelos EGARCH Nelson (1991) propôs uma variação do modelo GARCH, o Exponential Generalized Autoregressive Conditional Heteroskedasticity (EGARCH), ou Heteroscedasticidade Condicional Autorregressiva Generalizada Exponencial, em português. No modelo proposto por Nelson é possível separar os efeitos positivos e negativos das inovações, assim como a amplitude das mesmas. A equação (7) apresenta a equação do logaritmo da variância condicional de um modelo EGARCH(p, q): Log ( t2 ) j Log ( t2 j ) i t i t i E t i p q j 1 i 1 (7) Onde: Nos modelos EGARCH não é necessária a restrição de não negatividade dos parâmetros e , uma vez que está sendo modelado o logaritmo da variância condicional, que permite valores negativos. O parâmetro positivos e negativos das inovações e o parâmetro das inovações. determina os efeitos determina o efeito da amplitude 16 3.4 Modelos TARCH Zakoian (1994) propôs um modelo alternativo ao GARCH, chamado Threshold Autoregressive Conditional Heteroskedasticity (TARCH), ou Heteroscedasticidade Condicional Autorregressiva com Limiar, em português. Assim como o EGARCH, no TARCH é possível separar os efeitos positivos e negativos das inovações. A especificação do modelo é feita para o desvio padrão condicional (raiz quadrada da variância condicional). A equação (8) apresenta o desvio padrão condicional segundo um modelo TARCH(p,q): p q q j 1 i 1 i 1 t j t j i ti i ti (8) Onde: representa as inovações positivas representa as inovações negativas 3.5 Volatilidade Implícita A volatilidade implícita de um ativo é calculada utilizando como base um modelo de precificação de ativos. Um dos modelos mais utilizados para o cálculo da volatilidade implícita é o modelo de precificação de opções de compra européias proposto por Black e Scholes (1973). A equação (9) apresenta a fórmula do modelo de precificação de Black e Scholes, que recebeu o nome de Fórmula de Black-Scholes: c S 0 N (d1 ) Ke rT N (d 2 ) d1 Ln( S 0 K ) (r 2 2)T T d 2 d1 T Onde: c é o preço da opção de compra européia; (9) 17 S0 é o preço atual do ativo subjacente; K é o preço de exercício da opção; T é o tempo até o vencimento da opção; r é a taxa livre de risco; é a variância do ativo subjacente, constante até T, e N(x) é a função de distribuição de probabilidade acumulada de uma distribuição normal padrão. Nota-se que é o único parâmetro que não é diretamente observado. O cálculo da volatilidade implícita é feito observando-se o preço negociado de uma dada opção e calculando-se o valor de que, segundo a equação (9), seria responsável pelo preço negociado. A volatilidade implícita é a raiz quadrada do calculado. A volatilidade implícita costuma ser utilizada como uma previsão da volatilidade do ativo subjacente até a data T. Entretanto, como existem várias séries de opções para um mesmo ativo subjacente e nem todas as hipóteses do modelo de Black e Scholes são observadas na prática, é possível obter volatilidades implícitas diferentes para um mesmo período, criando, muitas vezes, a necessidade de alguma manipulação antes de serem utilizadas. 3.6 Modelos GARCH-VI, EGARCH-VI e TARCH-VI Nesta seção são apresentados os modelos GARCH-VI, EGARCH-VI e TARCH-VI. O sufixo “VI” diz respeito à modificação existente nos modelos: a inclusão da volatilidade implícita na equação da variância condicional. A equação (10) apresenta a equação da variância condicional do modelo GARCHVI(p,q,r): p j 2 t Onde j 1 2 t j q r i 1 l 1 i t2i lt2l (10) é a volatilidade implícita e r é o número de defasagens da volatilidade implícita presentes no modelo. 18 Da mesma forma, a equação (11) apresenta a equação do logaritmo da variância condicional do modelo EGARCH-VI(p,q,r) e a equação (12) apresenta a equação do desvio padrão condicional do modelo TARCH-VI(p,q,r). Log ( t2 ) j Log ( t2 j ) i t i t i E t i p q j 1 i 1 p q q r j 1 i 1 i 1 l 1 t j t j i ti i ti lt l r l 1 l Log (t2l ) (11) (12) 4 Dados Os dados utilizados neste trabalho são de duas categorias diferentes. Foi utilizada uma série diária de preços de fechamento do Ibovespa, que é o índice de ações da BM&FBovespa, e uma série diária de taxas anuais da Selic, ambas obtidas no sistema Economatica8. Foram utilizadas também séries diárias de preços de opções de compra do Ibovespa, obtidas na página da BM&FBovespa na internet. De ambas as fontes foram extraídas informações no período compreendido entre abril de 2000 e junho de 2011. Uma visão geral da série de preços do Ibovespa, no período utilizado neste trabalho, pode ser vista na Figura 1. 8 O sistema Economatica é uma ferramenta de apoio a investidores desenvolvido pela Economatica Software de Apoio a Investidores Ltda. 19 80000 70000 60000 50000 40000 30000 20000 10000 0 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 Figura 1: Série de preços do Ibovespa Fonte: Economatica Nos modelos utilizados neste trabalho é utilizada a série de retornos 9 do Ibovespa. Os retornos foram calculados de acordo com a equação (13): Rt Ln( Pt ) Ln( Pt 1 ) (13) O retorno calculado da forma apresentada na equação (13) é conhecido como logretorno, ou retorno contínuo. Sem considerar hipóteses de distribuições, utilizando retornos calculados desta maneira elimina-se o risco de termos preços negativos numa situação de previsão de retornos futuros. A Figura 2 mostra a evolução dos retornos do Ibovespa no período escolhido. 9 Neste trabalho, constantemente será feita menção à série de retornos do Ibovespa. Essa nomenclatura será usada para simplificação, uma vez que o nome exato seria “série de log-retornos”, conforme visto a seguir. 20 0,15 0,1 0,05 0 -0,05 -0,1 -0,15 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 Figura 2: Retornos do Ibovespa Fonte: Economatica A Tabela 1 mostra algumas estatísticas descritivas da série de retornos do Ibovespa, resumindo algumas de suas principais características. Tabela 1 – Estatística descritiva da série de retornos diários do Ibovespa, no período de abril/2000 a junho de 2011 Estatística Valor Média 0,000510 Mediana 0,001249 Máximo 0,136794 Mínimo -0,120961 Desvio-padrão 0,019446 Assimetria -0,102007 Curtose 6,903603 Fonte: Economatica 21 Nota-se uma curtose elevada na distribuição dos retornos do Ibovespa. Para efeito de comparação, uma distribuição normal tem curtose de valor igual a 3 (Martins e Domingues, 2011, p. 104). Essa característica evidencia que a distribuição tem mais ocorrências nas extremidades da distribuição, efeito popularmente chamado de “caudas grossas” ou “caudas pesadas”. A curtose elevada é muito comum em séries de retornos do mercado de ações. A série diária de taxas anuais da Selic foi a série escolhida para representar a taxa livre de risco do mercado. Não há um consenso sobre qual deve ser a taxa livre de risco a ser utilizada no Brasil. Além da Selic, há os que defendem a taxa de CDI (Certificado de Depósito Interbancário) ou também a taxa de juros da caderneta de poupança. Varga (2001) defende que a taxa mais adequada ao Brasil é a Selic e ainda acrescenta que basicamente não há diferenças ao escolher entre Selic e CDI. Em mercados estrangeiros costuma ser usada a taxa de um título do governo 10. A Figura 3 mostra a evolução da série no período utilizado neste trabalho. 30 25 20 15 10 5 0 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 Figura 3: Taxas Anuais (%) da Selic Fonte: Economatica Com relação às séries de preços de opções, no período selecionado foram extraídos dados referentes a 936 séries de opções de compra do Ibovespa, divididas em 67 vencimentos diferentes. No Apêndice A é possível verificar os vencimentos e quantidades de séries em cada vencimento. 10 Nos Estados Unidos é utilizada a taxa do título do governo de 10 anos. 22 A base de dados que a BM&FBovespa disponibiliza em sua página na internet contém várias informações sobre as séries de opções negociadas. Dentre as várias informações foram extraídas as seguintes: data de negociação, data de vencimento, código de negociação, preço de fechamento da opção, preço de exercício e volume negociado. Esses dados, juntamente com os preços do Ibovespa e a taxa livre de risco, foram utilizados na construção de uma série diária de volatilidades implícitas, segundo a Fórmula de Black-Scholes, equação (9). 4.1 Série de Volatilidades Implícitas Os modelos propostos neste trabalho (GARCH-VI, EGARCH-VI e TARCH-VI) necessitam de uma série de volatilidades implícitas, no caso, uma série diária de volatilidades implícitas de opções de compra do Ibovespa. Primeiramente, foram calculadas as volatilidades implícitas de todas as séries de opções de compra do Ibovespa selecionadas neste trabalho, para todos os dias em que cada série foi negociada. A volatilidade implícita foi calculada de acordo com a metodologia descrita na seção 3.5, com base no modelo de precificação de opções de compra de Black e Scholes, equação (9). Após o cálculo, as volatilidades implícitas foram agrupadas de acordo com as datas de vencimento de suas opções. Para cada grupo foi gerada uma série diária de volatilidades implícitas, iniciando na primeira negociação de uma opção do grupo e terminando na data de vencimento do grupo. Como para cada dia da série do grupo pode haver mais de uma volatilidade implícita calculada, devido à existência de opções com preços de exercícios diferentes com mesmo vencimento, a volatilidade implícita de certo dia foi calculada através da média das volatilidades implícitas, ponderada pelos volumes das três séries de opções com maior volume negociado neste dia. Foram descartados os cinco últimos dias de volatilidades implícitas de cada grupo, como sugerido por Cabedo e Moya (2005, p. 69), uma vez que a volatilidade implícita próxima ao vencimento pode sofrer interferências que não representam de fato o que está ocorrendo com o ativo subjacente. Por fim, as séries de volatilidades implícitas de cada grupo foram unificadas de modo que, após o fim de uma série de certo vencimento, é dada sequência com as 23 volatilidades implícitas do grupo com vencimento seguinte. A série de volatilidades implícitas gerada tem início em 13 de abril de 2000 e término em 07 de junho de 2011. Este período também limita a série de retornos do Ibovespa durante o desenvolvimento do trabalho. A Figura 4 mostra a série diária de volatilidades implícitas, em base anual, gerada. 1,2 1 0,8 0,6 0,4 0,2 0 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 Figura 4: Série diária volatilidades implícitas, em base anual. 5 Metodologia Com o objetivo de comparar os modelos GARCH tradicionais com os modelos GARCH-VI propostos neste trabalho, esses modelos foram estimados em determinados períodos. Em seguida foram feitas previsões para períodos imediatamente seguintes aos estimados. Essas previsões foram comparadas segundo medidas de erro de previsão e foi escolhido o melhor modelo em cada período, para que seja possível chegar-se a uma conclusão sobre o desempenho dos modelos propostos. As estimações foram feitas em quatro períodos distintos de 24 meses. Para cada estimação foram feitas previsões com três horizontes de tempos diferentes, de 10, 20 e 40 dias. As previsões foram feitas em períodos imediatamente seguintes aos períodos de estimação. A Tabela 2 apresenta o início e fim de cada período de estimação, assim como o início e o fim de cada período de previsão. 24 Tabela 2 – Períodos de Estimação e Previsão dos Modelos Estimação Previsão Início Fim Observações Período 1 13/abr/2000 12/abr/2002 493 14/abr/2002 26/abr/2002 13/mai/2002 11/jun/2002 Período 2 01/jul/2003 30/jun/2005 500 01/jul/2005 14/jul/2005 28/jul/2005 25/ago/2005 Período 3 01/set/2006 29/ago/2008 489 01/set/2008 12/set/2008 26/set/2008 24/out/2008 Período 4 09/abr/2009 493 11/abr/2011 26/abr/2011 10/mai/2011 07/jun/2011 08/abr/2011 Início 10 dias 20 dias 40 dias Os períodos 1 e 4 foram escolhidos apenas por serem o início e fim, respectivamente, da amostra de dados utilizada neste trabalho. O período 3 foi escolhido, propositalmente, para que as previsões coincidam com o início da crise de 2008, período em que o mercado de ações estava bastante volátil e em declínio. Em contraposição, o período 2 foi escolhido por ser um momento de alta do mercado de ações. As tabelas 3, 4, 5 e 6 apresentam as estatísticas descritivas dos períodos 1, 2, 3 e 4, respectivamente. Nota-se que os períodos, individualmente, apresentam curtose menor que a curtose da amostra como um todo, em especial a curtose do período 2, que está mais próxima a curtose de uma curva normal. O período 3, que antecede a crise de 2008, ainda não sofre os efeitos típicos de uma crise: retornos negativos e alta volatilidade. Apenas o período 1 apresentou média dos retornos negativa, sendo também o período com maior desvio padrão. O período 2 apresentou a maior média dos retornos diários e menor assimetria e o período 4 apresentou o menor desvio padrão. 25 Tabela 3 - Estatística descritiva da série de retornos diários do Ibovespa, período 1. Estatística Valor Média -0,000348 Mediana -0,000837 Máximo 0,073353 Mínimo -0,096342 Desvio-padrão 0,020467 Assimetria -0,126425 Curtose 4,092174 Fonte: Economatica Tabela 4 - Estatística descritiva da série de retornos diários do Ibovespa, período 2. Estatística Valor Média 0,001316 Mediana 0,001558 Máximo 0,051589 Mínimo -0,063390 Desvio-padrão 0,016676 Assimetria Curtose Fonte: Economatica -0,0239944 3,598468 26 Tabela 5 - Estatística descritiva da série de retornos diários do Ibovespa, período 3. Estatística Valor Média 0,000879 Mediana 0,001864 Máximo 0,061420 Mínimo -0,068565 Desvio-padrão 0,017624 Assimetria -0,362953 Curtose 3,998567 Fonte: Economatica Tabela 6 - Estatística descritiva da série de retornos diários do Ibovespa, período 4. Estatística Valor Média 0,000896 Mediana 0,001514 Máximo 0,063793 Mínimo -0,048646 Desvio-padrão 0,014169 Assimetria -0,063554 Curtose 4,792797 Fonte: Economatica Usando a mesma ideia de comparação realizada no trabalho de Hansen e Lunde (2005), em cada período foram estimados modelos da família GARCH: GARCH(1,1), EGARCH(1,1) e TARCH(1,1). E modelos da família GARCH-VI: GARCH-VI(1,1,1), EGARCH-VI(1,1,1) e TARCH-VI(1,1,1). Para decidir qual modelo teve melhor resultado em cada previsão foram utilizadas as medidas de erro de previsão Raiz do Erro Quadrático Médio (REQM, ou RMSE em 27 inglês)11, Erro Absoluto Médio (EAM, ou MAE em inglês)12 e a estatística U de Theil13. As medidas REQM e EAM são bastante semelhantes e dependem da escala da variável em questão, sendo que a medida REQM penaliza mais os grandes desvios14. Para essas duas medidas, quanto menor o valor obtido melhor é a previsão do modelo e, para verificar se os valores dessas medidas de erro de previsão são significativamente diferentes entre os modelos, foi realizado o teste de Diebold-Mariano15. A estatística U de Theil é independente de escala, assumindo valores entre zero e um, sendo que zero indica que os valores previstos foram iguais aos valores reais e um indica o extremo oposto. Em cada previsão, o modelo com o menor valor de REQM, EAM e/ou Theil é eleito o modelo com a melhor previsão para o período. 5.1 Estimação dos Modelos As Figuras 5, 6, 7 e 8 mostram os correlogramas dos retornos do Ibovespa nos períodos 1, 2, 3 e 4, respectivamente. Um correlograma pode auxiliar na determinação da equação da média condicional a ser utilizada nos modelos que serão estimados. 11 Para um período de previsão definido por t= i, i+1, ..., i+h, REQM 1 ih yˆ t yt 2 , onde h 1 t i yt é o valor real e ŷt é o valor previsto no instante t. 12 Para um período de previsão definido por t= i, i+1, ..., i+h, EAM valor real e 13 14 ŷt é o valor previsto no instante t. Para um período de previsão definido por t= i, i+1, ..., i+h, onde 1 ih yˆ t yt , onde yt é o h 1 t i U 1 ih yˆ t yt 2 h 1 t i 1 ih 2 1 ih 2 ˆ y yt t h 1 h 1 t i t i , yt é o valor real e ŷt é o valor previsto no instante t. Devido à sua forma quadrática, quanto maior a diferença entre o valor previsto e o valor realizado, maior será a contribuição da diferença no somatório. 15 O teste proposto por Diebold e Mariano (1995) é feito sob a hipótese nula de que os valores das medidas de erro de previsão não são diferentes. 28 O correlograma do período 1 sugere que a equação da média condicional pode ser estimada com pelo menos duas especificações: a) sem termos autorregressivos e de média móvel e b) incluindo termo autorregressivo de quinta ordem16. Figura 5: Correlograma dos retornos diários do Ibovespa no período 1. Para os períodos 2 e 3, os correlogramas sugerem que as equações da média condicional podem ser estimadas sem termos autorregressivos e de média móvel. Figura 6: Correlograma dos retornos diários do Ibovespa no período 2. 16 Como os dados são diários, isso sugere que havia sazonalidade semanal nos retornos. 29 Figura 7: Correlograma dos retornos diários do Ibovespa no período 3. No período 4, persiste a sugestão de estimação da equação da média condicional sem termos autorregressivos e de média móvel. Mas, existe a possibilidade da estimação com termo autorregressivo de sétima ordem ser adequada. Figura 8: Correlograma dos retornos diários do Ibovespa no período 4. Foi aplicado o Teste ARCH-LM17 nas equações da média condicional sugeridas pelos correlogramas para verificar a necessidade da estimação de modelos de heteroscedasticidade condicional. O resultado, resumido na Tabela 7, rejeita a hipótese de inexistência de efeitos ARCH e justifica a necessidade dos modelos de heteroscedastidade condicional para todas as equações sugeridas. 17 O Teste ARCH-LM identifica a heteroscedasticidade condicional autorregressiva nos resíduos de um modelo estimado. A hipótese nula do teste é a de não existência de efeitos ARCH até a ordem q q nos resíduos e pode ser realizado pela regressão: et2 0 s et2 s t . s 1 30 Tabela 7 – Testes ARCH-LM Equações Estatística Período 1 Período 2 Período 3 Período 4 C C AR(5) C C C C AR(7) Estatística 3,679485 3,503102 2,937718 4,206731 3,209807 2,786041 F (0,0000) (0,0001) (0,0006) (0,0009) (0,0002) (0,0011) Obs*R² 41,46798 39,62028 33,71522 20,40001 36,57721 32,07017 (0,0000) (0,0001) (0,0007) (0,0011) (0,0003) (0,0013) Nota: a) valores entre parênteses indicam a probabilidade de não rejeição da hipótese nula. b) “C” indica equação com apenas uma constante, sem termos autorregressivo ou de média móvel. c) “AR(5)” e “AR(7)” indicam equação com uma constante e termo autorregressivo (AR) de ordem indicada entre parênteses. Na estimação dos modelos, a distribuição dos erros foi alternada entre Distribuição Normal, Distribuição T-Student e Distribuição de Erros Generalizada (GED, sigla em inglês). Para seguir para a etapa de previsões, determinou-se que um modelo deve ter coeficientes significativos e também capturar o efeito ARCH da série, passando por um novo Teste ARCH-LM, e também deve ter as equações da média e da variância condicionais bem especificadas, verificadas pelos Teste-Q e correlogramas dos resíduos padronizados e resíduos padronizados ao quadrado. Para estar bem especificado, a estatística Q do modelo não deve ser significante em todas as defasagens, assim como a autocorrelação (AC) e autocorrelação parcial (PAC). As tabelas 8, 9, 10 e 11 apresentam os modelos estimados nos períodos 1, 2, 3 e 4. Além dos coeficientes há também as estatísticas referentes ao Teste ARCH-LM aplicado ao modelo estimado para confirmar a extinção do efeito ARCH: estatística F e Obs*R². No Apêndice B estão os resultados dos Teste-Q e correlogramas dos resíduos padronizados e resíduos padronizados ao quadrado dos modelos estimados. A Erro! Fonte de referência não encontrada. apresenta os modelos estimados no período 1. Para a família GARCH os modelos obtidos foram: GARCH(1,1) e EGARCH(1,1). Ambos com a especificação do termo autorregressivo de quinta 31 ordem na equação da média condicional, conforme sugerido pelo correlograma da Figura 5. Para a família GARCH-VI, nenhum modelo foi obtido nas estimações. Tabela 8 – Coeficientes dos modelos estimados no período 1. Família GARCH GARCH (1,1) EGARCH (1,1) Distribuição t-Student t-Student C (média) -0,00026* (-0,31998) -0,000473* (-0,579645) AR(5) -0,114178 (-2,39953) -0,096417 (-2,109847) C (variância) 0,000072* (1,131364) -1,5027* (-1,578746) 0,748356 (4,037723) 0,825393 (7,065719) Família GARCH-VI TARCH (1,1) GARCHVI(1,1,1) EGARCHVI(1,1,1) TARCHVI(1,1,1) 0,071978* (1,656283) -0,114488 (-2,631342) 0,163822 (1,894725) Estatística F Obs*R² 0,985356 (0,4618) 0,858703 (0,5896) 11,85355 (0,4575) 10,36313 (0,5841) Notas: a) estatística Z entre parênteses. b) valores seguidos de asterisco indicam coeficientes não significativos. c) células em branco significam que o coeficiente da linha correspondente não faz parte do modelo na respectiva coluna. d) coluna em branco significa que o modelo não pode ser estimado. e) nas estatísticas F e Obs*R², o valor entre parênteses é a probabilidade de não rejeição da hipótese nula. A Tabela 9 apresenta os modelos estimados no período 2. Para a família GARCH os modelos obtidos foram: GARCH(1,1) e EGARCH(1,1). Para a família GARCH-VI, foi obtido o modelo EGARCH-VI(1,1,1). 32 Tabela 9 - Coeficientes dos modelos estimados no período 2. Família GARCH Família GARCH-VI GARCH (1,1) EGARCH (1,1) TARCH (1,1) GARCHVI(1,1,1) EGARCHVI(1,1,1) Distribuição Normal Normal t-Student C (média) 0,001691 (2,454734) 0,00148 (2,161615) 0,001542 (2,132701) C (variância) 0,000005* (1,168788) -4,496418 (-4,35841) -3,481825 (-3,41961) TARCHVI(1,1,1) 0,212814 (1,998442) 0,945197 (29,74631) 0,44671 (3,569056) 0,499461 (3,90874) -0,357938 (-5,63282) -0,29632 (-3,99404) -0,09608* (-1,02585) -0,12014* (-1,32855) 0,440558 (0,9467) 1,641453 (0,0771) 1,121647 (0,3399) 5,371601 (0,9444) 19,43076 (0,0786) 13,44707 (0,3374) 0,036052* (1,645175) Estatística F Obs*R² Notas: a) estatística Z entre parênteses. b) valores seguidos de asterisco indicam coeficientes não significativos. c) células em branco significam que o coeficiente da linha correspondente não faz parte do modelo na respectiva coluna. d) coluna em branco significa que o modelo não pode ser estimado. e) nas estatísticas F e Obs*R², o valor entre parênteses é a probabilidade de não rejeição da hipótese nula. A Tabela 10 apresenta os modelos estimados no período 3. Para a família GARCH os modelos obtidos foram: GARCH(1,1) e EGARCH(1,1). Para a família GARCH-VI, foi obtido o modelo EGARCH-VI(1,1,1). 33 Tabela 10 - Coeficientes dos modelos estimados no período 3. Família GARCH Família GARCH-VI GARCH (1,1) EGARCH (1,1) TARCH (1,1) GARCHVI(1,1,1) Distribuição t-Student t-Student t-Student C (média) 0,001853 (2,551751) 0,000921* (1,263756) 0,001072* (1,506893) C (variância) 0,000018* (1,518766) -1,034399 -2,115405 (-3,25277) (-3,18114) EGARCHVI(1,1,1) TARCHVI(1,1,1) 0,259518 (2,324701) 0,847253 (13,31711) 0,882759 (22,83878) 0,658994 (6,25466) -0,234445 (-4,44035) -0,262705 (-3,8194) 0,09202* (1,543772) -0,01868* (-0,19803) 0,353871 (0,978) 0,537892 (0,89) 0,757827 (0,6941) 4,325837 (0,9768) 6,544507 (0,8862) 9,169162 (0,6884) 0,099593 (2,474702) Estatística F Obs*R² Notas: a) estatística Z entre parênteses. b) valores seguidos de asterisco indicam coeficientes não significativos. c) células em branco significam que o coeficiente da linha correspondente não faz parte do modelo na respectiva coluna. d) coluna em branco significa que o modelo não pode ser estimado. e) nas estatísticas F e Obs*R², o valor entre parênteses é a probabilidade de não rejeição da hipótese nula. A Tabela 11 apresenta os modelos estimados no período 4. Para a família GARCH os modelos obtidos foram: GARCH(1,1), EGARCH(1,1) e TARCH(1,1). Para a família GARCH-VI, foi obtido o modelo EGARCH-VI(1,1,1). 34 Tabela 11 - Coeficientes dos modelos estimados no período 4. Família GARCH Família GARCH-VI GARCH (1,1) EGARCH (1,1) TARCH (1,1) GARCHVI(1,1,1) EGARCHVI(1,1,1) Distribuição t-Student t-Student t-Student Normal C (média) 0,001069 (2,042378) 0,000792* (1,495209) 0,000804* (1,51098) 0,000113* (0,206691) C (variância) 0,000010* (1,710496) -0,778168 (-2,29895) 0,000012* (1,821519) -1,141675 (-1,97875) TARCHVI(1,1,1) 0,24475 (2,282396) 0,874445 (18,81116) 0,924334 (24,85235) 0,073429 (2,494002) 0,845029 (15,08621) 0,787301 (8,408097) 0,014793* (0,525226) 0,146866 (2,621652) Estatística F Obs*R² -0,125614 (-,341542) -0,201186 (-3,89324) 0,158976 (2,700772) -0,013747 (-0,16823) 0,531009 (0,8948) 1,189837 (0,2872) 0,959331 (0,4872) 1,12037 (0,3409) 6,461135 (0,8911) 14,24021 (0,2856) 11,5477 (0,4827) 13,432 (0,3384) Notas: a) estatística Z entre parênteses. b) valores seguidos de asterisco indicam coeficientes não significativos. c) células em branco significam que o coeficiente da linha correspondente não faz parte do modelo na respectiva coluna. d) coluna em branco significa que o modelo não pode ser estimado. e) nas estatísticas F e Obs*R², o valor entre parênteses é a probabilidade de não rejeição da hipótese nula. 5.2 Previsão e Resultados As previsões de volatilidade, realizadas com os modelos estimados, foram feitas em períodos de 10, 20 e 40 dias. As previsões realizadas são do tipo um passo à frente, ou seja, foram realizadas previsões um passo à frente de forma sucessiva durante os dias de cada período de previsão. As previsões foram realizadas fora da amostra 35 de estimação, conforme pode ser verificado na Tabela 2, que resume os períodos de estimação e previsão utilizados. As Tabelas 12, 13, 14 e 15 apresentam os resultados das previsões nos períodos 1, 2, 3 e 4, respectivamente. Em cada tabela é feito um comparativo entre os modelos da família GARCH e os modelos da família GARCH-VI. As melhores métricas de erros de previsão aparecem em destaque em cada período de previsão. Tabela 12 – Comparação dos Modelos GARCH e GARCH-VI no Período 1. Período de Previsão 10 dias 20 dias 40 dias Métrica de Erro de Previsão GARCH GARCH-VI GARCH(1,1) EGARCH(1,1) REQM 0,000233 (-0,5130*) 0,000239 EAM 0,000209 (-0,7770*) 0,000218 Theil 0,419047 0,435162 REQM 0,000534 (-2,2770) 0,000553 EAM 0,000372 (-2,3135) 0,000396 Theil 0,547302 0,549887 REQM 0,000462 (-1,7564*) 0,000475 EAM 0,000341 (-1,5957*) 0,000354 Theil 0,514027 0,519409 Notas: a) valores destacados em negrito indicam o melhor resultado. b) valores entre parênteses informam a estatística T do teste de DieboldMariano com relação às medidas de erro de previsão dos modelos à direita; o valor da estatística seguido de um asterisco indica que as medidas de erro de previsão não são significativamente diferentes. 36 Tabela 13 – Comparação dos Modelos GARCH e GARCH-VI no Período 2. Período de Previsão 10 dias 20 dias 40 dias Métrica de Erro de Previsão GARCH GARCH-VI GARCH(1,1) EGARCH(1,1) EGARCH-VI(1,1,1) REQM 0,000203 (-1,0702*;-0,9506*) 0,000254 (1,3865*) 0,000244 EAM 0,000185 (-0,8179*; -0,6660*) 0,000229 (1,4579*) 0,000221 Theil 0,39572 0,44748 0,436187 REQM 0,000305 (-1,1252*;-1,3114*) 0,000325 (0,5121*) 0,000320 EAM 0,000229 (-1,7807*; -1,4657*) 0,000262 (1,7147*) 0,000250 Theil 0,473642 0,459574 0,469963 REQM 0,000264 (-1,1395*;-1,0474*) 0,000279 (1,0106*) 0,000274 EAM 0,000207 (-1,2710*; -0,7607*) 0,000223 (1,8266*) 0,000215 Theil 0,438549 0,438975 0,449074 Notas: a) valores destacados em negrito indicam o melhor resultado. b) valores entre parênteses informam a estatística T do teste de DieboldMariano com relação às medidas de erro de previsão dos modelos à direita; o valor da estatística seguido de um asterisco indica que as medidas de erro de previsão não são significativamente diferentes. 37 Tabela 14 – Comparação dos Modelos GARCH e GARCH-VI no Período 3. Período de Previsão 10 dias 20 dias 40 dias Métrica de Erro de Previsão GARCH GARCH-VI GARCH(1,1) EGARCH(1,1) EGARCH-VI(1,1,1) REQM 0,000753 (1,6476*;1,4188*) 0,000680 (-1,9694*) 0,000700 EAM 0,000483 (-0,3691*;-1,7207*) 0,000503 (-2,3537) 0,000529 Theil 0,529782 0,413032 0,438016 REQM 0,002373 (-0,6398*;-1,1029*) 0,002429 (-1,6173*) 0,002516 EAM 0,001397 (0,6112*;-0,3835*) 0,001406 (-2,0418*) 0,001469 Theil 0,60525 0,661275 0,699763 REQM 0,004467 (-1,7119*;-1,3778*) 0,004695 (1,0192*) 0,004644 EAM 0,002694 (0,9641*;0,5431*) 0,002616 (-0,7484*) 0,002645 Theil 0,619215 0,716261 0,690511 Notas: a) valores destacados em negrito indicam o melhor resultado. b) valores entre parênteses informam a estatística T do teste de DieboldMariano com relação às medidas de erro de previsão dos modelos à direita; o valor da estatística seguido de um asterisco indica que as medidas de erro de previsão não são significativamente diferentes. 38 Tabela 15 – Comparação dos Modelos GARCH e GARCH-VI no Período 4. Período Métrica de de Erro de Previsão Previsão GARCH GARCH(1,1) EGARCH(1,1) GARCH-VI TARCH(1,1) EGARCH-VI(1,1,1) 0,000140 0,000155 (-1,5192*;(1,5820*;1,2722*) 1,4164*;0,3867*) 0,000147 (1,0085*) 0,000140 EAM 0,000116 (-2,8231;2,1730*;0,7572*) 0,00141 (3,1084;2,5998) 0,000128 (1,9248*) 0,000113 Theil 0,439452 0,418136 0,423409 0,455774 REQM 0,000123 (-2,9345;2,6070;0,5111*) 0,000149 (2,9087;2,4672) 0,000133 (1,7044*) 0,000122 EAM 0,000104 (-4,4757;3,7097;1,2933*) 0,000132 (4,6754;4,4047) 0,000118 (3,4967) 0,000099 Theil 0,406019 0,406565 0,398444 0,424964 0,000125 0,000149 (-3,9678;(3,7932;2,0186*) 3,6131;-0,4978*) 0,000134 (0,7446*) 0,000128 EAM 0,000105 (-5,3133; -3,5499;0,6342*) 0,000131 (5,0756;4,2471) 0,000115 (2,3871) 0,000101 Theil 0,405679 0,413341 0,403542 0,463416 REQM 10 dias 20 dias REQM 40 dias Notas: a) valores destacados em negrito indicam o melhor resultado. b) valores entre parênteses informam a estatística T do teste de DieboldMariano com relação às medidas de erro de previsão dos modelos à direita; o valor da estatística seguido de um asterisco indica que as medidas de erro de previsão não são significativamente diferentes. De maneira geral, as medidas de erro de previsão REQM e EAM, não foram significativamente diferentes entre os modelos, com diferenças significativas na escolha do melhor modelo apenas para previsões de 20 dias do período 1, elegendo o modelo GARCH(1,1). Ao analisarmos as comparações através da estatística U de Theil, há um predomínio do modelo GARCH(1,1) nos períodos 1, 2 e 3, não sendo o melhor modelo apenas para as previsões de 20 dias do período 2 e 10 dias do período 3, onde o modelo EGARCH(1,1) foi melhor. No período 4, o modelo TARCH(1,1) teve o melhor 39 desempenho nas previsões de 20 e 40 dias e o modelo EGARCH(1,1) teve o melhor desempenho na previsão de 10 dias. O modelo GARCH(1,1) obteve bons resultados em grande parte das previsões. Resultado semelhante ao que Hansen e Lunde (2005) encontraram em seus trabalhos ao comparar o modelo GARCH(1,1) com modelos mais sofisticados. Neste trabalho, o modelo GARCH(1,1) só não foi superior aos outros modelos no período 4, que foi caracterizado por ser o período de menor desvio-padrão dos retornos do Ibovespa. Os modelos da família GARCH-VI foram inferiores aos modelos da família GARCH em todos os períodos, sugerindo que a volatilidade implícita, usada como variável explicativa da variância condicional, não possui informação adicional na previsão de volatilidade do ativo subjacente. 6 Conclusão Os modelos GARCH são amplamente utilizados para estimar e prever a volatilidade de ativos do mercado financeiro. A volatilidade implícita de opções possui uma característica natural de ser uma previsão da volatilidade futura do ativo subjacente e por esta razão é bastante estudada na literatura. Este trabalho propôs verificar a utilização da volatilidade implícita em conjunto com modelos GARCH, mais precisamente usando a volatilidade implícita como variável explicativa da variância condicional em modelos GARCH. Na estimação dos modelos da família GARCH-VI, a volatilidade implícita obteve coeficientes significativos na equação da variância condicional apenas para os modelos EGARCH-VI(p,q,r), nos períodos 2, 3 e 4. A família GARCH-VI não teve um modelo estimado que a representasse no período 1. Após as previsões, as comparações entre os modelos GARCH e GARCH-VI indicaram que os modelos da família GARCH-VI foram inferiores aos modelos da família GARCH, sendo que o modelo GARCH(1,1) na maioria das vezes foi o melhor modelo para previsão de volatilidade. Esses resultados sugerem que o uso da volatilidade implícita como variável explicativa da variância condicional não aumenta o poder de previsão dos modelos GARCH. 40 Uma sugestão de continuação deste trabalho seria a utilização da previsão de volatilidade dos modelos GARCH-VI em estratégias de investimento, verificando se através de estratégias reais pode-se chegar a uma conclusão diferente sobre o uso da volatilidade implícita como variável explicativa da variância condicional em modelos GARCH. 41 Referências ANDERSEN, Torben G.; BOLLERSLEV, Tim; CHRISTOFFERSEN; Peter F.; DIEBOLD; Francis X. Volatility Forecasting. Philadelphia, 2005. 114 f. Artigo – University of Pennsylvania, Penn Institute for Economic Research, Philadelphia, 2005. BLACK, Fisher; SCHOLES, Myron. The Pricing of Options and Corporate Liabilities. Journal of Political Economy. Chicago, v. 81, n. 3, p. 637-654, 1973. BOLLERSLEV, Tim. Generalized Autoregressive Conditional Heteroskedasticity. Econometrics Journal, North-Holland, v. 31, p. 307-327, 1986. BOLLERSLEV, Tim; CHOU, Ray Y.; KRONER, Kenneth F. ARCH Modeling In Finance: A Review of the Theory and Empirical Evidence. Journal of Econometrics, Elsevier, v. 52, p. 5-59, 1992. CABEDO, J. David; MOYA, Clemente Ismael. Implied volatility as a predictor: the case of the Ibex 35 future contract. Estudios de Economía Aplicada. Valladolid, Espanha, v. 23-1, p. 67-78, 2005. CAVALERI, Rosangela. Combinação de Previsões Aplicada à Volatilidade. 2008. 83 f. Dissertação (Mestrado) - Faculdade de Ciências Econômicas, UFRGS, Porto Alegre, 2008. CHRISTENSEN, B.J.; PRABHALA, N.R. The relation between implied and realized volatility. Journal of Financial Economics. Elsevier, v. 50, p. 125-150, 1998. DIEBOLD, Francis X., MARIANO, Roberto S. Comparing Predictive Accuracy. Journal of Business and Economic Statistics. Alexandria, v. 13, p. 253-265, 1995. DOIDGE, Craig; WEI, Jason Z. Volatility Forecasting and the Efficiency of the Toronto 35 Index Options Market. Canadian Journal of Administrative Sciences. Hamilton, v. 15, n.1, p. 28-38, 1998. ENGLE, Robert F. Autoregressive Conditional Heteroscedasticity with Estimates of the Variance of United Kingdom Inflation. Econometrica, New York, v. 50, n. 4, p. 987-1007, 1982. GABE, João; PORTUGAL, Marcelo S. Volatilidade Implícita Versus Volatilidade Estatística: Uma Avaliação para o Mercado Brasileiro a partir dos Dados de Opções e Ações da Telemar S.A. Revista Brasileira de Finanças. Rio de Janeiro, v. 2, n. 1, p. 47-73, 2004. GALDI, Fernando Caio; PEREIRA, Leonel M. Valor em Risco (VaR) utilizando modelos de previsão de volatilidade: EWMA, GARCH e Volatilidade Estocástica. BBR - Brazilian Business Review. Vitória, v. 4, n. 1, p. 74-95, 2007. HANSEN, Peter R.; LUNDE, Asger. A Forescast Comparison of Volatility Models: Does Anything Beat a GARCH(1,1). Journal of Applied Econometrics. Wiley InterScience, v. 20, p. 873-889, 2005. 42 HARVEY, Andrew; RUIZ, Ester; SHEPHARD, Neil. Multivariate Stochastic Variance Models. The Review of Economic Studies. Stockholm, v. 61, n. 2, p. 247-264, 1994. HOL, Eugenie; KOOPMAN, Siem Jan. Forecasting the Variability of Stock Index Returns with Stochastic Volatility Models and Implied Volatility. Amsterdam, 2002. 23 f. Artigo – Free University Amsterdam, Department of Econometrics. JACQUIER, Eric; POLSON, Nicholas G.; ROSSI, Peter E. Bayesian Analysis of Stochastic Volatility Models. Journal of Business & Economic Statistics. Alexandria, v. 12, n. 4, p. 371-389, 1994. LAMOUREUX, Christopher G.; LASTRAPES, William D. Forecasting Stock-Return Variance: Toward an Understanding of Stochastic Implied Volatilities. The Review of Financial Studies. Oxford, v. 6, n. 2, p. 293-326, 1993. MARTINS, Gilberto A.; DOMINGUES, Osmar. Estatística Geral e Aplicada. 4 ed. São Paulo: Atlas, 2011, 662p. MORAIS, Igor A. C.; PORTUGAL, Marcelo S. Modelagem e previsão de volatilidade determinística e estocástica para a série do Ibovespa. Estudos Econômicos. São Paulo, v. 29, n. 3, p. 303-341, 1999. NELSON, Daniel B. Conditional heteroskedasticity in asset returns: A new approach. Econometrica. New York, v. 59, n. 2, p. 347-370, 1991. OLIVEIRA, Leonardo José Cappa de. Modelando a Volatilidade de Retornos em Alta Frequência. 2008. 97 f. Dissertação (Mestrado) – Faculdade Ibmec São Paulo, São Paulo, 2008. PEREIRA, Pedro L. Valls; HOTTA, Luiz K.; SOUZA, Luiz Alvares R; ALMEIDA; Nuno M. C. G. Modelos Alternativos para Extração de Volatilidade de Ativos: Um Estudo Comparativo. Revista de Econometria. Rio de Janeiro, v. 19, n. 1, p. 57-109, 1999. SANTOS, Douglas G.; ZIEGELMANN, Flávio A. Estimação de Volatilidade em Períodos de Crise: Modelos Aditivos Semi-Paramétricos Versus Modelos Garch. In: XXXVI ENCONTRO NACIONAL DE ECONOMIA, 2008, Salvador. TAYLOR, Stephen J. Modeling Financial Time Series. Chichester: John Wiley, 1986. 268 p. VARGA, Gyorgy. Índice de Sharpe e outros Indicadores de Desempenho Aplicados a Fundos de Ações Brasileiros. Revista de Administração Contemporânea, v. 5, n. 3, 2001. VASILELLIS, George A.; MEADE, Nigel. Forecasting Volatility for Portfolio Selection. Journal of Business Finance & Accounting. Hoboken, v. 23, n. 1, p. 125-143, 1996. VICENTE, José V. M.; GUEDES, Tiago de S. A Volatilidade implícita contém informações sobre a volatilidade futura? Evidências do mercado de opções de ações da Petrobras. Brazilian Business Review. Vitória, v. 7, n. 1, p. 48-65, 2010. ZAKOIAN, Jean-Michel. Threshold Heteroskedastic Models. Journal of Economic Dynamics and Control, v. 18, n. 5, p. 931-955, 1994. 43 APÊNDICE A – Séries de Opções de Compra do Ibovespa Data de Vencimento Data da Primeira Negociação Quantidade de Séries 14/jun/2000 13/abr/2000 5 16/ago/2000 31/mai/2000 5 18/out/2000 28/jul/2000 6 13/dez/2000 20/set/2000 11 14/fev/2001 07/dez/2000 8 18/abr/2001 30/jan/2001 7 13/jun/2001 22/dez/2000 7 15/ago/2001 16/mai/2001 7 17/out/2001 29/jun/2001 8 12/dez/2001 15/fev/2001 9 13/fev/2002 21/ago/2001 6 17/abr/2002 29/jan/2002 5 12/jun/2002 26/set/2001 6 14/ago/2002 08/jan/2002 7 16/out/2002 01/mar/2002 7 18/dez/2002 20/fev/2002 10 12/fev/2003 17/out/2002 5 16/abr/2003 04/abr/2002 6 18/jun/2003 10/mar/2003 6 13/ago/2003 08/ago/2002 6 15/out/2003 20/jan/2003 9 17/dez/2003 13/mar/2003 11 18/fev/2004 23/set/2003 12 14/abr/2004 02/dez/2003 11 16/jun/2004 04/dez/2003 10 18/ago/2004 10/out/2003 10 13/out/2004 24/out/2003 9 15/dez/2004 13/jan/2004 10 16/fev/2005 10/mai/2004 12 44 13/abr/2005 17/jan/2005 10 15/jun/2005 13/jul/2004 9 17/ago/2005 02/set/2004 8 13/out/2005 30/jun/2005 10 14/dez/2005 21/dez/2004 11 15/fev/2006 24/mar/2005 13 12/abr/2006 31/ago/2005 14 14/jun/2006 08/nov/2005 16 16/ago/2006 31/mar/2006 11 18/out/2006 04/jul/2006 12 13/dez/2006 02/dez/2005 15 14/fev/2007 22/fev/2006 16 18/abr/2007 17/mai/2006 15 13/jun/2007 08/dez/2006 13 15/ago/2007 26/set/2006 19 17/out/2007 26/out/2006 21 12/dez/2007 18/jan/2007 27 13/fev/2008 14/fev/2007 24 16/abr/2008 07/jun/2006 23 18/jun/2008 13/mar/2008 22 13/ago/2008 29/abr/2008 25 15/out/2008 03/jul/2008 24 17/dez/2008 27/dez/2007 35 18/fev/2009 04/set/2008 18 15/abr/2009 11/abr/2008 25 17/jun/2009 07/jul/2008 22 12/ago/2009 05/mai/2008 18 14/out/2009 22/set/2008 16 16/dez/2009 18/jun/2008 33 17/fev/2010 22/jul/2009 19 14/abr/2010 13/ago/2009 17 16/jun/2010 22/jul/2009 23 18/ago/2010 24/fev/2010 21 13/out/2010 23/out/2008 21 45 15/dez/2010 21/ago/2009 25 16/fev/2011 23/jul/2010 15 13/abr/2011 29/out/2010 17 15/jun/2011 08/jan/2010 22 46 APÊNDICE B – Testes-Q e Correlogramas dos Resíduos Padronizados e Resíduos Padronizados ao Quadrado dos Modelos Estimados Figura 9: Teste-Q e correlograma dos resíduos padronizados do modelo GARCH(1,1) do período 1. Figura 10: Teste-Q e correlograma dos resíduos padronizados ao quadrado do modelo GARCH(1,1) do período 1. 47 Figura 11: Teste-Q e correlograma dos resíduos padronizados do modelo EGARCH(1,1) do período 1. Figura 12: Teste-Q e correlograma dos resíduos padronizados ao quadrado do modelo EGARCH(1,1) do período 1. 48 Figura 13: Teste-Q e correlograma dos resíduos padronizados do modelo GARCH(1,1) do período 2. Figura 14: Teste-Q e correlograma dos resíduos padronizados ao quadrado do modelo GARCH(1,1) do período 2. 49 Figura 15: Teste-Q e correlograma dos resíduos padronizados do modelo EGARCH(1,1) do período 2. Figura 16: Teste-Q e correlograma dos resíduos padronizados ao quadrado do modelo EGARCH(1,1) do período 2. 50 Figura 17: Teste-Q e correlograma dos resíduos padronizados do modelo EGARCHVI(1,1,1) do período 2. Figura 18: Teste-Q e correlograma dos resíduos padronizados ao quadrado do modelo EGARCH-VI(1,1,1) do período 2. 51 Figura 19: Teste-Q e correlograma dos resíduos padronizados do modelo GARCH(1,1) do período 3. Figura 20: Teste-Q e correlograma dos resíduos padronizados ao quadrado do modelo GARCH(1,1) do período 3. 52 Figura 21: Teste-Q e correlograma dos resíduos padronizados do modelo EGARCH(1,1) do período 3. Figura 22: Teste-Q e correlograma dos resíduos padronizados ao quadrado do modelo EGARCH(1,1) do período 3. 53 Figura 23: Teste-Q e correlograma dos resíduos padronizados do modelo EGARCHVI(1,1,1) do período 3. Figura 24: Teste-Q e correlograma dos resíduos padronizados ao quadrado do modelo EGARCH-VI(1,1,1) do período 3. 54 Figura 25: Teste-Q e correlograma dos resíduos padronizados do modelo GARCH(1,1) do período 4. Figura 26: Teste-Q e correlograma dos resíduos padronizados ao quadrado do modelo GARCH(1,1) do período 4. 55 Figura 27: Teste-Q e correlograma dos resíduos padronizados do modelo EGARCH(1,1) do período 4. Figura 28: Teste-Q e correlograma dos resíduos padronizados ao quadrado do modelo EGARCH(1,1) do período 4. 56 Figura 29: Teste-Q e correlograma dos resíduos padronizados do modelo TARCH(1,1) do período 4. Figura 30: Teste-Q e correlograma dos resíduos padronizados ao quadrado do modelo TARCH(1,1) do período 4. 57 Figura 31: Teste-Q e correlograma dos resíduos padronizados do modelo EGARCHVI(1,1,1) do período 4. Figura 32: Teste-Q e correlograma dos resíduos padronizados ao quadrado do modelo EGARCH-VI(1,1,1) do período 4.