PREVISÃO DA VOLATILIDADE REALIZADA: o impacto dos saltos na série do IBOVESPA Autoria: Tricia Thaíse e Silva Pontes RESUMO Este trabalho busca identificar o efeito dos saltos na previsão da volatilidade da série de retornos intradiários do IBOVESPA. Para isso, foram comparados os métodos de estimação de volatilidade realizada HAR-RV, HAR-RV-J e HAR-RV-CJ. Os resultados mostraram pequenas diferenças entre os modelos, no entanto a forma como o modelo HAR-RV-CJ une os pequenos saltos ao componente contínuo da volatilidade realizada, ao mesmo tempo em que capta a contribuição dos saltos maiores, torna-o uma opção mais robusta na previsão da volatilidade. Palavras-chave: Risco, Dados de alta frequência, Volatilidade realizada. 1 1 INTRODUÇÃO Como medir e modelar a volatilidade é uma questão importante em finanças, devido ao reconhecimento da volatilidade como um dos mais importantes determinantes do valor dos ativos sendo essencial a qualquer avaliação que envolva o nível de risco futuro de um ativo. A previsão da volatilidade futura diz muito sobre a dinâmica dos preços dos ativos e auxilia em várias análises como, por exemplo, o gerenciamento de riscos, a escolha da carteira ótima, derivativos e hedging. A disponibilidade de dados para intervalos de tempo cada vez mais curtos permitiu a mudança de foco da modelagem da volatilidade com frequências trimestrais e mensais para intervalos semanais, diários e até intradiários, disponíveis em vários intervalos inclusive negócio a negócio (tick by tick). O estudo de dados financeiros de alta frequência tem sido uma das áreas de pesquisa que evoluiu mais rapidamente ao longo dos últimos anos. A incorporação da informação contida em dados de alta frequência melhora significativamente as projeções da volatilidade dos retornos diários, tanto na teoria quanto na prática (ANDERSON, BOLLERSLEV, 1998, 1999). Por outro lado, dados de alta frequência do mercado financeiro em intervalos muito pequenos podem ser enviesados por correlação serial espúria causada por vários efeitos de microestrutura do mercado como saltos, bid-ask, preços obsoletos e erros de medição (BANDI, RUSSEL, 2003). Para contornar esse problema, Andersen e Bollerslev (1997) desenvolveram modelo de volatilidade realizada, que permite lidar com os problemas de microestrutura de mercado sem que para isso haja perda significativa de informações. O termo volatilidade realizada foi utilizado inicialmente para representar a soma do quadrado dos retornos intradiários em curtos intervalos de tempo, como quinze ou cinco minutos, mostrando-se uma estimativa precisa para a volatilidade a posteriori. A volatilidade realizada converge para uma variação quadrática que é a soma da volatilidade integrada mais um componente de salto para uma ampla classe de modelos em tempo contínuo. A literatura sugere que a variância realizada a partir de dados de alta frequência fornece uma medida exata da verdadeira variância do processo subjacente em tempo contínuo (BARNDORFF-NIELSEN, SHEPHARD, 2003; MEDDAHI, 2002; ANDERSEN ET AL., 2003). A literatura a respeito desse tema tem crescido ao longo dos anos e em sua maioria buscam encontrar o melhor modelo de previsão para a volatilidade realizada por meio da investigação dos seus dois componentes: contínuo e de salto. Nielsen e Frederiksen (2006) avaliaram a precisão de diferentes estimadores de variância integrada sob a presença de ruído de microestrutura e possíveis saltos. Por sua vez, Andersen, Bollerslev e Diebold (2007, 2010) encontraram que o componente contínuo da volatilidade é mais persistente do que os saltos e que separar estes dois componentes melhora as previsões de volatilidade fora da amostra. Os trabalhos de Barndorff-Nielsen e Shephard (2002), Andersen et al. (2003), e Meddahi (2002), destacam as propriedades de volatilidades realizadas construídas a partir de dados de alta frequência. No Brasil poucos trabalhos têm se dedicado a esse tema, possivelmente devido ao pequeno número de ativos que possuem frequência de negociação suficiente para este tipo de análise, no entanto cabe destacar os trabalhos de Mota e Fernandes (2004), Carvalho et al. (2006) e Júnior e Pereira (2011). Mota e Fernandes (2004) utilizaram dados intradiários do IBOVESPA para comparar as estimativas de modelos da família GARCH com aquelas obtidas através dos estimadores baseados na volatilidade realizada, no entanto, não encontraram diferença significativa entre o desempenho das previsões de cada modelo. Comparação semelhante foi realizada por Carvalho et al. (2006) sendo seu resultado mais importante a aproximação encontrada da distribuição dos retornos a uma distribuição 2 normal. E contrariamente ao que é frequentemente observado em trabalhos sobre retorno, não foi encontrada nenhuma evidência de memória longa na variância realizada. Júnior e Pereira (2011), por sua vez, utilizaram dados de alta frequência para comparar a capacidade de previsão de dois modelos de volatilidade realizada o Heterogeneous Autorregressive Model of Realized Volatility (HAR-RV) e o Mixed Data Sampling (MIDASRV). Seus resultados apresentaram evidências de que o modelo MIDAS-RV é superior ao modelo HAR-RV apenas dentro da amostra, para os dados utilizados. Para previsões fora da amostra, não há diferença significativa entre os modelos, sendo sugerida a utilização do modelo HAR-RV para previsões fora da amostra devido a sua maior facilidade de estimação. Além disso, encontraram evidências que corroboram com os resultados obtidos anteriormente por Carvalho et al. (2006) de que a utilização da volatilidade realizada induz distribuições dos retornos padronizados mais próximas da distribuição normal. Com base no que foi apresentado, percebe-se a necessidade de continuação das investigações a respeito da volatilidade realizada para o mercado brasileiro. Este trabalho tem como objetivo identificar o efeito dos saltos na previsão da volatilidade da série de retornos do IBOVESPA. Para isso serão comparados os métodos de estimação de volatilidade realizada HAR-RV, HAR-RV-J e HAR-RV-CJ. O artigo está organizado da seguinte forma. Na seção 2 apresenta-se um resumo de conceitos referentes à volatilidade realizada e o componente de saltos, indispensáveis à compreensão da análise que será desenvolvida. Na seção 3 são apresentados os dados e métodos empregados. A seção 4, por sua vez, apresenta e discute os resultados encontrados, e, finalmente as considerações finais e sugestões para trabalhos futuros são apresentadas na seção 5, seguida das referências utilizadas. 2 REFERENCIAL TEÓRICO 2.1 Variância Quadrática e Volatilidade Realizada De acordo com Andersen, Bollerslev e Diebold (2007) o problema de medição da volatilidade pode ser considerado em um quadro de tempo contínuo, mesmo que em última análise, só permitam a amostragem em intervalos discretos. Inicialmente os autores consideram um cenário simplificado, sem considerar os saltos nos preços, com retornos compostos continuamente que seguem um movimento Browniano invariante no tempo, de modo que: , 0 , (1) onde, s(t) é o preço logarítmico do ativo no tempo t; W(t) é um movimento Browniano padronizado; µ(t) é o termo de drift contínuo e σ(t) é um processo de volatilidade estritamente positivo. O retorno composto continuamente durante o intervalo de tempo de t – k a t, 0 < k ≤ t, é, portanto: , , (2) e sua variação quadrática QV(t, k) é: , . (3) 3 A equação acima mostra que as inovações para o componente da média µ(t) afetam a trajetória da variação do retorno, pois o µ(t)dt, é de uma ordem mais baixa em termos de propriedades de segunda ordem do que as inovações difusas, σ(t)dW(t). A trajetória difusa da variação sobre [t - k, t] é conhecida também como Variância Integrada (integrated variance), IV (t, k): , (4) Nesse cenário simplificado as variâncias integrada e quadrática coincidem. Na ausência de ruídos de microestrutura e medidas de erro, a variação quadrática dos retornos pode ser arbitrariamente aproximada pelo processo de retorno quadrado cumulativo. Considerando {t – k + , j = 1, ... n . k}de um intervalo [t - k, t]. Temos que a volatilidade realizada do processo de preço logarítmico é: ∑ , ; . , . (5) A teoria de semimartingale assegura que a medida de volatilidade realizada converge em probabilidade para o retorno da variação quadrática QV, quando a frequência da amostra aumenta. Essa ligação formal entre as medidas de volatilidade realizada baseadas em retornos de alta frequência a variação quadrática do processo de preços foi aplicada empiricamente na mensuração da volatilidade dos retornos por Andersen e Bollerslev (1997). O poder da variação realizada de ordem p, V(p; t, k; n) é a soma acumulada do poder absoluto p dos retornos de alta frequência e converge com n→∞ para corresponder ao poder de variação da ordem p, V(p; t, k). Ou seja, define-se o poder da variação realizada p como: / ; , ; ∑ . , (6) onde µp representa o momento absoluto p de uma variável normal padrão, em probabilidade isso significa: ; , ; ; , (7) Em outras palavras, V (4; t, k; n) é uma escolha natural como um estimador consistente para a quarticity integrada, IQ (t, k). Deve notar-se que esta conclusão é fortemente dependente da ausência de saltos no processo de preços e a noção de poder da variação realizada é uma extensão direta da volatilidade realizada como RV(t, k; n) = V (2; t, k; n). 2.2 Saltos e volatilidade realizada As condições sugeridas para o retorno pela equação (1) são muito restritivas, pois uma notícia inesperada no mercado pode gerar movimentos bruscos nos preços, movimentos estes conhecidos como saltos. O modelo que inclui a presença de saltos é definido por Andersen e Benzoni (2008) como: , 0 , (8) 4 onde, µ(t) é o processo contínuo da variação, σ(t) é o processo de volatilidade estocástica, W(t) indica um movimento Browniano padronizado, dq(t) é um processo de contagem com dq(t) = 1 correspondendo a um salto no tempo t e dq(t) = 0 caso contrário, com magnitude do salto, λ(t), e κ(t) referindo-se ao tamanho do salto correspondente. O incremento na variação quadrática do tempo t para t + 1 é: ∑ , , (9) em que, o primeiro componente, chamado de volatilidade integrada, é o componente contínuo de (2), e o segundo termo é a contribuição dos saltos discretos. Assumindo que M + 1 observações intraperíodo (intradiárias) são uniformemente espaçadas pelo período t e estão disponíveis em log-preços ptj. Os retornos intraperíodos compostos continuamente são: rtj = ptj – ptj-1, j = 1, ..., M, t = 1, ..., T, (10) Sendo T o número de períodos na amostra, a volatilidade realizada por período t é dada pela soma dos quadrados dos retornos intraperíodo: ∑ , , 1, … , . (11) De acordo com Barndorff-Nielsen e Shephard (2006) a separação não paramétrica do componente contínuo e de salto da variação quadrática em (9) pode ser feita através de medidas de variação bi-power (bipotente) e tri-power (tripotente). A variação realizada bipotente é definida como: ∑ , 1, … , , (12) onde, μ1 = √2/π. Em teoria, um alto valor de M melhora a precisão dos estimadores, mas na prática, também os torna mais suscetíveis a efeitos de microestrutura de mercado, como saltos bid-ask, preços obsoletos e erros de medição, introduzindo correlação serial nos retornos (Hansen, Lunde, 2006; Barndorff-Nielsen, Shephard, 2007). Huang e Tauchen (2005) mostram que o escalonamento (ou seja, estabelecendo k ≥ 1) reduz o viés resultante em (12), uma vez que evita a multiplicação dos retornos adjacentes rt,j e rt, j-1, que por (10) compartilham o log-preço, pt j-1 na versão não-escalonada (ou seja, k = 0) de (12). Assim, a variância realizada quarticity escalonada tripotente é: / Com t = 1, ..., T e / 2 / ∑ / / / (13) Γ 7/6 /Γ 1/2 . Combinando (9) e (11), RVt é, por definição, um estimador consistente do incremento por período [p] (t) - [p] (t - 1) para a variação quadrática com M → ∞. Ao mesmo tempo, BVt é consistente para a parte de volatilidade integrada de: (14) 5 Assim, a diferença RVt - BVt converge para a soma dos quadrados dos saltos que ocorreram durante o período. Desse modo, mesmo que nenhum salto tenha ocorrido durante o período t, é necessária a noção de um “componente de salto significativo”. Huang e Tauchen (2005) e Andersen et al. (2007), aplicam a estatística de teste para saltos: (15) Na ausência de saltos, Zt → d N (0, 1) como M → ∞, e grandes valores positivos indicam que saltos ocorreram durante o período t. Huang e Tauchen (2005) mostram que o ruído da microestrutura de mercado pode enviesar o teste na detecção dos saltos, mas também que o escalonamento diminui esse viés. Desse modo, o componente de salto da volatilidade realizada é: (16) em que, I(A) é o indicador para o evento A, Φ1-α a 100(1 - α)% pontos na distribuição normal padrão, e α é o nível de significância. Quando eu I{Zt> Φ1-α} = 1, Jt é o excesso de volatilidade realizada além da variação bipotente e, portanto, atribuível aos saltos nos preços. O componente contínuo da variação quadrática é estimado pela parte restante de RVt: (17) Dessa forma, Ct é igual RVt se não houver saltos significativos durante o período t, e BVt se existir, ou seja, Ct = I{Zt ≤ Φ1-α}RVt + I{Zt> Φ1-α} BVt. Para qualquer nível de significância α <1/2, ambos Jt e Ct em (16) e (17) são não negativos porque o Φ1-α é. A consistência de cada componente como estimador dos componentes correspondentes da variação quadrática, pode ser escrita como: ∑ , (18) com α → 0 e M → ∞ simultaneamente. Assim, essa abordagem de dados de alta frequência permite uma consistente estimação de ambos os componentes de variação quadrática, definida na equação (9). 3 DESCRIÇÃO DOS DADOS E MODELOS 3.1 Dados A análise dos modelos será baseada na série de cotações intradiárias do IBOVESPA (Índice Bovespa) no período de 3 de janeiro de 2011 até 27 de dezembro de 2013, correspondendo a 752 dias de negociação. Foi escolhido um intervalo para as negociações de 5 minutos o que gerou 63.935 observações, com uma média de 85 cotações por dia, incluindo o after-market (negociações que ocorrem no horário em que a bolsa está fechada). No entanto, não foram considerados os preços no after-market sendo excluídas todas as observações que 6 não ocorreram durante o horário de pregão. Vários autores consideram que estas observações têm um padrão diferente das negociações que ocorrem durante o período normal de funcionamento da bolsa, justificando sua exclusão (ENGLE, 2000; ZHANG et al., 2001). As negociações geralmente ocorrem das 10:00 às 17:00, apenas no período de horário de verão as negociações começam às 11:00 e terminam às 18:00, para esses meses considerou-se esse horário não sendo necessário trazer as observações para o horário normal, pois, como os demais meses não foram alterados isso não afeta os resultados. A série analisada foi construída a partir desta série original e consiste na série de logretornos calculados com base nas últimas cotações registradas em cada intervalo consecutivo de cinco minutos. Após o cálculo dos log-retornos excluíram-se os primeiros retornos de cada dia, gerados pela última informação de preço de uma data qualquer e a primeira do dia subsequente, conforme orienta Andersen e Bollerslev (1997), com isso a amostra final ficou composta por 61.918 observações. Esses retornos são conhecidos como “retorno overnight”, pois incorporam as informações recebidas entre o encerramento de um pregão e o início do próximo e por isso apresentam variabilidade média bastante superior ao retorno de qualquer outro intervalo. Na subseção seguinte são apresentados os modelos estimados. Todos os cálculos foram realizados no programa R 3.0.1 com o uso do pacote highfrequency elaborado por Jonathan Cornelissen, Kris Boudt e Scott Payseur. 3.2 Modelos HAR-RV A partir da volatilidade realizada (RV), vários outros modelos surgiram na tentativa de aproveitar o máximo de informação que os dados de alta frequência fornecem. O modelo HARCH, por exemplo, foi sugerido por Muller et al. (1997) e Dacorogna et al. (1998) e reconhece a heterogeneidade nas negociações e na propagação assimétrica da volatilidade em horizontes longos e curtos de tempo. Inspirado nesse modelo, Corsi (2009) desenvolve um modelo que une um AR com a volatilidade realizada considerando esta volatilidade em diferentes horizontes de tempo. Corsi (2009) parte da simplificação em um modelo hierárquico com apenas três componentes de volatilidade correspondentes aos horizontes de tempo de um dia (d), uma , e . Supondo que o semana (w) e um mês (m) denotados respectivamente por processo de retorno de alta frequência seja: (19) Com εt ~ NID (0,1) e σt(d) como a volatilidade diária integrada. O modelo para o processo de volatilidade parcial não observada em cada nível hierárquico é assumido como sendo a função da volatilidade parcial passada, o mesmo horizonte de tempo (o componente AR(1)), e da esperança de valores do próximo período de mais longo prazo. Com a maior escala de tempo sendo a mensal, o modelo segue: (20) (21) (22) 7 RVtm, RVtw, RVtd são as volatilidades realizadas mensais, semanais e diárias observadas ex post, e são inovações na volatilidade que são variáveis contemporaneamente e serialmente não correlacionadas. Por meio de substituições recursivas de volatilidades parciais, o modelo pode ser escrito como: (23) Com isso, a volatilidade parcial ex post pode ser definida como: (24) onde representa o erro de estimação da volatilidade diária latente. Substituindo (23) em (24), chega-se a equação do modelo HAR-RV (Heterogeneous Autoregressive Realized Volatility): (25) com . Um modelo semelhante a este foi desenvolvido por Andersen, Bollerslev e Diebold (2007), no entanto a forma simplificada ganha a inclusão da contribuição dos saltos para a volatilidade realizada. Apenas por uma questão de nomenclaturas das saídas fornecidas pelo R e o pacote utilizado para o modelo HAR-RV, a equação (26) foi reescrita como: (26) 3.2.1 O modelo HARRVJ Na presença de saltos no processo de preço intradiário, as medidas tradicionais de volatilidade realizada são afetadas pela contribuição dos saltos para a volatilidade. Levando ao desenvolvimento de medidas robustas de volatilidade para estimar esse componente da variação de preços. Andersen, (2003), considera a contribuição dos saltos para o processo quadrático de preço como sendo estimado por Jt = max [RVt - BPVt; 0]. O modelo HAR-RVJ sugerido pelos autores é, então, dado por (27) 3.2.2 O modelo HARRVCJ Andersen, Bollerslev e Diebold (2007) argumentam que pode ser desejável tratar pequenos saltos como os erros de medição, ou parte do processo contínuo da variação, associando apenas valores grandes de (RVt - BPVt) com o componente de salto. Assim, os autores definem Zt como: 8 (28) Onde , com = E(| |p). Os componentes de salto multiperíodo e contínuo são calculados pelas equações (29) e (30) respectivamente: (29) (30) Desse modo, o modelo HAR-RV-CJ pode ser escrito como: (31) 4 ANÁLISE E DISCUSSÃO DOS RESULTADOS 4.1 Retornos e volatilidade realizada Inicialmente buscou-se obter uma visão geral dos dados por meio da análise descritiva básica da série dos log-retornos do IBOVESPA, os resultados são apresentados na Tabela 1. A média dos log-retornos calculados com 61.917 observações atingiu um valor muito baixo (1,137.10-05) podendo ser considerado como estatisticamente indistinguível de zero, com desvio padrão de 0,00129. Verifica-se que a série de retornos intradiários possui um alto valor da curtose (38,95) e assimetria positiva de 0,855, indicando que os retornos não têm distribuição normal. Ainda com relação à normalidade, o teste de Jarque-Bera aplicado apresentou estatística igual a 3.343.356 com p-valor de 2,2.10-16, o que leva a rejeição da hipótese de normalidade dos retornos a qualquer nível de significância prático. Foi realizado ainda o teste de Ljung-Box para testar se os dados são identicamente distribuídos, ou seja, não existe correlação entre eles. O p-valor encontrado foi menor que o nível de significância de 0,05, indicando a existência de correlação entre os retornos. 9 Tabela 1: Estatísticas para as séries de retornos do IBOVESPA Estatística Retornos intradiários (5 minutos) Mínimo -4,017.10-02 Primeiro Quartil -1,137.10-05 Média -1,137.10-05 Mediana -6,660.10-06 Terceiro Quartil 6,024.10-04 Máximo 2,240.10-02 Desvio Padrão 0,001296998 Assimetria 0,8556999 Curtose 38,95842 Ljung-Box 8,4984 Jarque-Bera** 3.343.356 *p-value = 0.003555; ** p-value < 2.2e-16 Fonte: Resultados da Pesquisa, 2014. Na Figura 1 temos o gráfico da série de log-retornos do IBOVESPA em intervalos de 5 minutos, o histograma dos retornos, o ACF (função de autocorrelação) e o PACF (função de autocorrelação parcial) da série. O gráfico do retorno mostra que as maiores variações ocorreram principalmente até a metade das observações, o que corresponde aos dados de 2011 até a primeira metade de 2012. O histograma mostra grande concentração dos valores, indicando pouca variabilidade nos retornos. Pelos gráficos do ACF e PACF confirmamos a presença de correlação serial na série, confirmando a estatística do teste de Ljung-Box. Figura 1: Série de log-retornos do IBOVESPA, histograma, ACF e PACF Fonte: Resultados da Pesquisa, 2014. 10 Os saltos foram gerados por meio do teste de Barndorff-Nielsen e Shephard (2006), sendo detectados saltos em 9,12% dos dias de negociação. Uma característica interessante dos dados de alta frequência, no contexto da medição de volatilidade, é a periodicidade da volatilidade dos retornos induzida pelo horário de abertura, almoço e fechamento dos mercados (ANDERSEN, BOLLERSLEV, 1997). Os trabalhos de Wood, McInish e Ord (1985) e Harris (1986) ficaram conhecidos por apresentar o formato de “U” assumido pela volatilidade do mercado acionário norte-americano ao longo do dia formado por um pico logo nos primeiros momentos após a abertura do mercado, caindo no horário do almoço para voltar a subir lentamente conforme se aproxima o horário de fechamento. Vários métodos foram desenvolvidos com o objetivo de captar essa periodicidade. Geralmente assume-se que o desvio padrão dos retornos intradiários pode ser decomposto em um fator de volatilidade diária (constante para todos os retornos intradiários observados no mesmo dia) e um fator intradiário (função determinística do intervalo intradiário) (ANDERSEN, BOLLERSLEV, 1997; BOUDT et al., 2011). As estimativas podem ser paramétrica (com base na estimação de uma regressão com especificação para o fator intradiário) ou não paramétrica (com base numa estimativa de escala). A Figura 2 ilustra a estimativa de periodicidade intradiária para a série do IBOVESPA pelos dois métodos. Figura 2: Periodicidade intradiária estimada* para a série do IBOVESPA *Periodicidade estimada com a função “spotVol” do R 3.01. Fonte: Resultados da Pesquisa, 2014. Como pode ser observada, a estimação pelo método paramétrico suaviza a periodicidade (sazonalidade) intradiária, no entanto ambas apresentam o mesmo movimento de alta no início do dia, queda acentuada na metade do dia (horário de almoço) e leve subida mantendo-se praticamente constante até o horário de fechamento do mercado. O formato apresentado pela série do IBOVESPA ao longo do dia assemelha-se ao formato de “J” invertido encontrado por outros autores em diversos mercados (GOODHART, O'HARA, 1997) e Cappa e Pereira (2010) que também encontraram formato semelhante para a série de retornos intradiários da Petrobrás. 11 4.2 Modelos HARRV Nesta subseção apresentamos os resultados dos modelos HAR-RV, HAR-RV-J e HAR-RV-CJ, conforme descritos na seção 3, para o índice IBOVESPA, estimados em três horizontes de tempo sobre os quais os componentes contínuo e de salto da volatilidade deverão ser agregados, correspondentes a um dia, uma semana e um mês de negociação (h = 1, 5, 22). Os coeficientes estimados dos modelos HAR-RV são apresentados na tabela 2, assim como seus respectivos p-valores. O R2 ajustado foi de 41,76%. Tabela 2: Coeficientes estimados do Modelo HAR-RV Coeficientes Estimativa Erro t-valor β0 0,0020123 0,0005066 3,972 βd 0,4519588 0,0429552 10,522 βw 0,1496540 0,0650902 2,299 βm 0,2062461 0,0639575 3,225 Significante a 0 ‘***’ 0,001 ‘**’ 0,01 ‘*’ 0,05 ‘.’ Fonte: Resultados da Pesquisa, 2014. p-valor 7,85.10-05*** < 2.10-16 *** 0,02178 * 0,00132 ** Todos dos coeficientes do HAR-RV mostraram-se significativos, confirmando assim a hipótese de alta persistência da volatilidade. A Figura 3 apresenta o gráfico para a previsão dentro da amostra a partir do modelo HAR-RV. Nota-se um bom ajustamento do modelo na maior parte da série, apenas os picos de volatilidade previstos não se mostram muito próximos do observado. Figura 3: Modelo HAR para a Volatilidade Realizada do IBOVESPA 0.03 0.02 0.01 Realized Volatility 0.04 Observed RV Forecasted RV 2011 2012 2013 2014 Time Fonte: Resultados da Pesquisa, 2014. Para estimar a contribuição dos saltos na previsão da volatilidade, aplicou-se o modelo HAR-RV-J, cujos resultados são apresentados na Tabela 3. Apenas o componente de salto agregado no horizonte de um mês (J22) não se mostrou significativo. O R2 ajustado foi de 45,11%, superior ao que foi encontrado no modelo simples. Os resultados mostram o efeito negativo dos saltos na composição da volatilidade. 12 Tabela 3: Coeficientes estimados do Modelo HAR-RV-J Coeficientes Estimativa Erro t-valor β0 0,0011648 0,0005103 2,282 βd 0,4985224 0,0553847 9,001 βw 0,3802667 0,0941195 4,040 βm 0,2386909 0,0971486 2,457 J1 -0,1095311 0,0530158 -2,066 J5 -0,4456848 0,1074488 -4,148 J22 -0,1185021 0,1478426 -0,802 Significante a 0 ‘***’ 0,001 ‘**’ 0,01 ‘*’ 0,05 ‘.’ Fonte: Resultados da Pesquisa, 2014. p-valor 0,0228 * < 2,10-16 *** 5,92e-05 *** 0,0143 * 0,0392 * 3,76.10-05*** 0,4231 Figura 4: Modelo HARRVJ para a Volatilidade Realizada do IBOVESPA 0.03 0.02 0.01 Realized Volatility 0.04 Observed RV Forecasted RV 2011 2012 2013 2014 Time Fonte: Resultados da Pesquisa, 2014. Por meio do gráfico da volatilidade observada e prevista pelo HARRVJ não se percebe diferenças significativas quando comparado ao que foi encontrado pelo HARRV. Por fim, estimou-se o modelo HAR-RV-CJ o qual mostrou todos os coeficientes de volatilidade realizada parcial com pequenos saltos (βCs) bastante significativos e positivamente relacionados. Os componentes de salto foram significativos nos horizontes de 1 e 5 dias, sendo o primeiro com contribuição positiva para a volatilidade realizada. O R2 encontrado para este modelo foi de 0,4602 ou 46,02%. Tabela 4: Coeficientes estimados do Modelo HAR-RV-J Coeficientes Estimativa Erro t-valor β0 0,0013322 0,0005007 2,660 βCD 0,5158555 0,0532624 9,685 βCW 0,2847846 0,0847807 3,359 βCM 0,1668055 0,0846248 1,971 J1 0,1102218 0,0380303 2,898 J5 -0,2013512 0,0770624 -2,613 J22 0,0290934 0,1131437 0,257 Significante a 0 ‘***’ 0,001 ‘**’ 0,01 ‘*’ 0,05 ‘.’ Fonte: Resultados da Pesquisa, 2014. p-valor 0,007982 ** < 2.10-16 *** 0,000824*** 0,049104 * 0,003870 ** 0,009172 ** 0,797149 13 Pela comparação dos R2 ajustados dos três modelos, considera-se o modelo HAR-RVCJ como o modelo de melhor desempenho na estimação da volatilidade realizada. Apesar de as diferenças encontradas serem pequenas, a forma como o modelo une os pequenos saltos ao componente contínuo da volatilidade realizada, ao mesmo tempo em que capta a contribuição dos saltos maiores torna-o uma opção mais robusta na previsão da volatilidade. 5 CONSIDERAÇÕES FINAIS A modelagem e previsão da volatilidade é uma questão que atrai bastante atenção dos pesquisadores. Nos últimos anos, essa literatura tem se beneficiado com a disponibilidade de dados alta frequência para os preços, conseguindo com isso melhoria na estimação da volatilidade realizada e identificação de seus componentes, contínuo e de salto. Este trabalho buscou identificar o papel dos saltos na composição da volatilidade realizada da série do Ibovespa no período de 2011 a 2013. Foi encontrada sazonalidade intradiária na série formada pelas variações que ocorrem nos preços no período de abertura, horário de almoço e de fechamento. Gerando ao longo do dia um formato semelhante ao de um “J” reverso assim como é frequentemente relatado pela literatura em diversos mercados. Os saltos foram encontrados em 9,12% dos dias sendo que os maiores saltos ocorreram até o primeiro semestre de 2012. Para identificar o melhor modelo de previsão da volatilidade realizada dentro da amostra e a contribuição dos saltos, foram estimados três modelos: HAR-RV, HAR-RV-J e HAR-RV-CJ. De maneira geral os modelos mostraram-se bastante semelhantes, sendo o HAR-RV-CJ o que se mostrou mais apropriado na previsão da volatilidade. A principal limitação da pesquisa foi a não realização de previsão fora da amostra que poderia ter contribuído para os resultados e escolha do modelo. Como sugestão para trabalhos futuros, além da realização e comparação das previsões dentro e fora da amostra, indica-se a investigação da influência que a intensidade do salto exerce sobre a volatilidade, ou modelos que consigam prever a probabilidade de ocorrência de saltos. REFERÊNCIAS ANDERSEN, T. G., BOLLERSLEV, T., DIEBOLD, F. X.; LABYS, P. Modeling and forecasting realized volatility. Econometrica, 71:579–625, 2003. ANDERSEN, T., T. BOLLERSLEV; HUANG, X. A reduced form frame-work for modeling volatility of speculative prices based on realized variation measures. Journal of Econometrics 160(1), p. 176-189, 2010. ANDERSEN, T.G., BOLLERSLEV, T.; DIEBOLD, F.X. Roughing it up: Including jump components in the measurement, modeling and forecasting of return volatility. NBER Working Paper Series 11775, 2007. ANDERSEN, T.G.; BOLLERSLEV, T. Answering the Skeptics: Yes, Standard Volatility Models Do Provide Accurate Forecasts, Int. Econ. Rev.39:4, 885–905, 1998. ANDERSEN, T.G.; BOLLERSLEV, T. Intraday periodicity and volatility persistence in financial markets. Journal of Empirical Finance, 4, 115-158, 1997. 14 ANDERSEN, T.G.; BOLLERSLEV, T.; DIEBOLD, F.X. Roughing it up: including jump components in the measurement,modeling, and forecasting of return volatility. Review of Economics and Statistics 89, 701–720, 2007. BANDI, F.M.; RUSSELL, J.R. Microstructure Noise, Realized Volatil-ity, and Optimal Sampling, manuscript, Graduate School of Business, Univer-sity of Chicago, 2003. BANDORff-NIELSEN, O. E. & SHEPHARD, N. How accurate is the asymptotic approximation to the distribution of realised volatility? In Andrews, D., Powell, J., Ruud, P., & Stock, J., editors, Identification and Inference for Econometric Models. A Festschrift for Tom Rothenberg. Econometric Society Monograph Series, Cambridge University Press, 2003. BOUDT, K.; CROUX, C.; LAURENT, S. Robust estimation of intraweek periodicity in volatility and jump detection. Journal of Empirical Finance, 18, 353-367, 2011. CAPPA, Leonardo; PEREIRA, P. L. Valls, 2010. Modelando a volatilidade dos retornos de Petrobrás usando dados de alta frequência. Textos para discussão, n.258, Escola de Economia de São Paulo, Getulio Vargas Foundation (Brazil). CARVALHO, M., FREIRE, M., MEDEIROS, M., E SOUZA, L. Modeling and forecasting the volatility of Brazilian asset returns: a realized variance approach. Revista Brasileira de Finanças, 4:321–343, 2006. CORSI F. A Simple Approximate Long Memory Model of Realized Volatility. Journal of Financial Econometrics, 7, 174-196, 2009. GOODHART, C. A. E.,; M. O'HARA. High Frequency Data in Financial Markets: Issues and Applications. Journal of Empirical Finance 4: 73-114, 1997. HARRIS, L. A Transaction Data Study of Weekly and Intradaily Patterns in Stock Returns.” Journal of Financial Economics 16, 99-117, 1986. WOOD, R. A., T. H. MCINISH, E J. K. ORD. An Investigation of Transaction Data for NYSE Stocks. Journal of Finance 25, 723-739, 1985. 15