PREVISÃO DA VOLATILIDADE REALIZADA: o impacto dos saltos na série do
IBOVESPA
Autoria: Tricia Thaíse e Silva Pontes
RESUMO
Este trabalho busca identificar o efeito dos saltos na previsão da volatilidade da série de
retornos intradiários do IBOVESPA. Para isso, foram comparados os métodos de estimação
de volatilidade realizada HAR-RV, HAR-RV-J e HAR-RV-CJ. Os resultados mostraram
pequenas diferenças entre os modelos, no entanto a forma como o modelo HAR-RV-CJ une
os pequenos saltos ao componente contínuo da volatilidade realizada, ao mesmo tempo em
que capta a contribuição dos saltos maiores, torna-o uma opção mais robusta na previsão da
volatilidade.
Palavras-chave: Risco, Dados de alta frequência, Volatilidade realizada.
1 1 INTRODUÇÃO
Como medir e modelar a volatilidade é uma questão importante em finanças, devido
ao reconhecimento da volatilidade como um dos mais importantes determinantes do valor dos
ativos sendo essencial a qualquer avaliação que envolva o nível de risco futuro de um ativo. A
previsão da volatilidade futura diz muito sobre a dinâmica dos preços dos ativos e auxilia em
várias análises como, por exemplo, o gerenciamento de riscos, a escolha da carteira ótima,
derivativos e hedging.
A disponibilidade de dados para intervalos de tempo cada vez mais curtos permitiu a
mudança de foco da modelagem da volatilidade com frequências trimestrais e mensais para
intervalos semanais, diários e até intradiários, disponíveis em vários intervalos inclusive
negócio a negócio (tick by tick). O estudo de dados financeiros de alta frequência tem sido
uma das áreas de pesquisa que evoluiu mais rapidamente ao longo dos últimos anos. A
incorporação da informação contida em dados de alta frequência melhora significativamente
as projeções da volatilidade dos retornos diários, tanto na teoria quanto na prática
(ANDERSON, BOLLERSLEV, 1998, 1999).
Por outro lado, dados de alta frequência do mercado financeiro em intervalos muito
pequenos podem ser enviesados por correlação serial espúria causada por vários efeitos de
microestrutura do mercado como saltos, bid-ask, preços obsoletos e erros de medição
(BANDI, RUSSEL, 2003). Para contornar esse problema, Andersen e Bollerslev (1997)
desenvolveram modelo de volatilidade realizada, que permite lidar com os problemas de
microestrutura de mercado sem que para isso haja perda significativa de informações. O
termo volatilidade realizada foi utilizado inicialmente para representar a soma do quadrado
dos retornos intradiários em curtos intervalos de tempo, como quinze ou cinco minutos,
mostrando-se uma estimativa precisa para a volatilidade a posteriori.
A volatilidade realizada converge para uma variação quadrática que é a soma da
volatilidade integrada mais um componente de salto para uma ampla classe de modelos em
tempo contínuo. A literatura sugere que a variância realizada a partir de dados de alta
frequência fornece uma medida exata da verdadeira variância do processo subjacente em
tempo contínuo (BARNDORFF-NIELSEN, SHEPHARD, 2003; MEDDAHI, 2002;
ANDERSEN ET AL., 2003).
A literatura a respeito desse tema tem crescido ao longo dos anos e em sua maioria
buscam encontrar o melhor modelo de previsão para a volatilidade realizada por meio da
investigação dos seus dois componentes: contínuo e de salto. Nielsen e Frederiksen (2006)
avaliaram a precisão de diferentes estimadores de variância integrada sob a presença de ruído
de microestrutura e possíveis saltos. Por sua vez, Andersen, Bollerslev e Diebold (2007,
2010) encontraram que o componente contínuo da volatilidade é mais persistente do que os
saltos e que separar estes dois componentes melhora as previsões de volatilidade fora da
amostra. Os trabalhos de Barndorff-Nielsen e Shephard (2002), Andersen et al. (2003), e
Meddahi (2002), destacam as propriedades de volatilidades realizadas construídas a partir de
dados de alta frequência.
No Brasil poucos trabalhos têm se dedicado a esse tema, possivelmente devido ao
pequeno número de ativos que possuem frequência de negociação suficiente para este tipo de
análise, no entanto cabe destacar os trabalhos de Mota e Fernandes (2004), Carvalho et al.
(2006) e Júnior e Pereira (2011). Mota e Fernandes (2004) utilizaram dados intradiários do
IBOVESPA para comparar as estimativas de modelos da família GARCH com aquelas
obtidas através dos estimadores baseados na volatilidade realizada, no entanto, não
encontraram diferença significativa entre o desempenho das previsões de cada modelo.
Comparação semelhante foi realizada por Carvalho et al. (2006) sendo seu resultado
mais importante a aproximação encontrada da distribuição dos retornos a uma distribuição
2 normal. E contrariamente ao que é frequentemente observado em trabalhos sobre retorno, não
foi encontrada nenhuma evidência de memória longa na variância realizada.
Júnior e Pereira (2011), por sua vez, utilizaram dados de alta frequência para comparar
a capacidade de previsão de dois modelos de volatilidade realizada o Heterogeneous
Autorregressive Model of Realized Volatility (HAR-RV) e o Mixed Data Sampling (MIDASRV). Seus resultados apresentaram evidências de que o modelo MIDAS-RV é superior ao
modelo HAR-RV apenas dentro da amostra, para os dados utilizados. Para previsões fora da
amostra, não há diferença significativa entre os modelos, sendo sugerida a utilização do
modelo HAR-RV para previsões fora da amostra devido a sua maior facilidade de estimação.
Além disso, encontraram evidências que corroboram com os resultados obtidos anteriormente
por Carvalho et al. (2006) de que a utilização da volatilidade realizada induz distribuições dos
retornos padronizados mais próximas da distribuição normal.
Com base no que foi apresentado, percebe-se a necessidade de continuação das
investigações a respeito da volatilidade realizada para o mercado brasileiro. Este trabalho tem
como objetivo identificar o efeito dos saltos na previsão da volatilidade da série de retornos
do IBOVESPA. Para isso serão comparados os métodos de estimação de volatilidade
realizada HAR-RV, HAR-RV-J e HAR-RV-CJ.
O artigo está organizado da seguinte forma. Na seção 2 apresenta-se um resumo de
conceitos referentes à volatilidade realizada e o componente de saltos, indispensáveis à
compreensão da análise que será desenvolvida. Na seção 3 são apresentados os dados e
métodos empregados. A seção 4, por sua vez, apresenta e discute os resultados encontrados, e,
finalmente as considerações finais e sugestões para trabalhos futuros são apresentadas na
seção 5, seguida das referências utilizadas.
2 REFERENCIAL TEÓRICO
2.1 Variância Quadrática e Volatilidade Realizada
De acordo com Andersen, Bollerslev e Diebold (2007) o problema de medição da
volatilidade pode ser considerado em um quadro de tempo contínuo, mesmo que em última
análise, só permitam a amostragem em intervalos discretos. Inicialmente os autores
consideram um cenário simplificado, sem considerar os saltos nos preços, com retornos
compostos continuamente que seguem um movimento Browniano invariante no tempo, de
modo que:
,
0
,
(1)
onde, s(t) é o preço logarítmico do ativo no tempo t; W(t) é um movimento Browniano
padronizado; µ(t) é o termo de drift contínuo e σ(t) é um processo de volatilidade
estritamente positivo. O retorno composto continuamente durante o intervalo de tempo de t –
k a t, 0 < k ≤ t, é, portanto:
,
,
(2)
e sua variação quadrática QV(t, k) é:
,
.
(3)
3 A equação acima mostra que as inovações para o componente da média µ(t) afetam a
trajetória da variação do retorno, pois o µ(t)dt, é de uma ordem mais baixa em termos de
propriedades de segunda ordem do que as inovações difusas, σ(t)dW(t). A trajetória difusa da
variação sobre [t - k, t] é conhecida também como Variância Integrada (integrated variance),
IV (t, k):
,
(4)
Nesse cenário simplificado as variâncias integrada e quadrática coincidem. Na
ausência de ruídos de microestrutura e medidas de erro, a variação quadrática dos retornos
pode ser arbitrariamente aproximada pelo processo de retorno quadrado cumulativo.
Considerando {t – k + , j = 1, ... n . k}de um intervalo [t - k, t]. Temos que a volatilidade
realizada do processo de preço logarítmico é:
∑
, ;
.
,
.
(5)
A teoria de semimartingale assegura que a medida de volatilidade realizada converge
em probabilidade para o retorno da variação quadrática QV, quando a frequência da amostra
aumenta. Essa ligação formal entre as medidas de volatilidade realizada baseadas em retornos
de alta frequência a variação quadrática do processo de preços foi aplicada empiricamente na
mensuração da volatilidade dos retornos por Andersen e Bollerslev (1997).
O poder da variação realizada de ordem p, V(p; t, k; n) é a soma acumulada do poder
absoluto p dos retornos de alta frequência e converge com n→∞ para corresponder ao poder
de variação da ordem p, V(p; t, k). Ou seja, define-se o poder da variação realizada p como:
/
; , ;
∑
.
,
(6)
onde µp representa o momento absoluto p de uma variável normal padrão, em probabilidade
isso significa:
; , ;
; ,
(7)
Em outras palavras, V (4; t, k; n) é uma escolha natural como um estimador
consistente para a quarticity integrada, IQ (t, k). Deve notar-se que esta conclusão é
fortemente dependente da ausência de saltos no processo de preços e a noção de poder da
variação realizada é uma extensão direta da volatilidade realizada como RV(t, k; n) = V (2; t,
k; n).
2.2 Saltos e volatilidade realizada
As condições sugeridas para o retorno pela equação (1) são muito restritivas, pois uma
notícia inesperada no mercado pode gerar movimentos bruscos nos preços, movimentos estes
conhecidos como saltos. O modelo que inclui a presença de saltos é definido por Andersen e
Benzoni (2008) como:
,
0
,
(8)
4 onde, µ(t) é o processo contínuo da variação, σ(t) é o processo de volatilidade estocástica,
W(t) indica um movimento Browniano padronizado, dq(t) é um processo de contagem com
dq(t) = 1 correspondendo a um salto no tempo t e dq(t) = 0 caso contrário, com magnitude do
salto, λ(t), e κ(t) referindo-se ao tamanho do salto correspondente. O incremento na variação
quadrática do tempo t para t + 1 é:
∑
,
,
(9)
em que, o primeiro componente, chamado de volatilidade integrada, é o componente contínuo
de (2), e o segundo termo é a contribuição dos saltos discretos.
Assumindo que M + 1 observações intraperíodo (intradiárias) são uniformemente
espaçadas pelo período t e estão disponíveis em log-preços ptj. Os retornos intraperíodos
compostos continuamente são:
rtj = ptj – ptj-1,
j = 1, ..., M,
t = 1, ..., T,
(10)
Sendo T o número de períodos na amostra, a volatilidade realizada por período t é
dada pela soma dos quadrados dos retornos intraperíodo:
∑
,
,
1, … , .
(11)
De acordo com Barndorff-Nielsen e Shephard (2006) a separação não paramétrica do
componente contínuo e de salto da variação quadrática em (9) pode ser feita através de
medidas de variação bi-power (bipotente) e tri-power (tripotente). A variação realizada
bipotente é definida como:
∑
,
1, … , ,
(12)
onde, μ1 = √2/π. Em teoria, um alto valor de M melhora a precisão dos estimadores, mas na
prática, também os torna mais suscetíveis a efeitos de microestrutura de mercado, como saltos
bid-ask, preços obsoletos e erros de medição, introduzindo correlação serial nos retornos
(Hansen, Lunde, 2006; Barndorff-Nielsen, Shephard, 2007). Huang e Tauchen (2005)
mostram que o escalonamento (ou seja, estabelecendo k ≥ 1) reduz o viés resultante em (12),
uma vez que evita a multiplicação dos retornos adjacentes rt,j e rt, j-1, que por (10)
compartilham o log-preço, pt j-1 na versão não-escalonada (ou seja, k = 0) de (12). Assim, a
variância realizada quarticity escalonada tripotente é:
/
Com t = 1, ..., T e
/
2
/
∑
/
/
/
(13)
Γ 7/6 /Γ 1/2 .
Combinando (9) e (11), RVt é, por definição, um estimador consistente do incremento
por período [p] (t) - [p] (t - 1) para a variação quadrática com M → ∞. Ao mesmo tempo, BVt
é consistente para a parte de volatilidade integrada de:
(14)
5 Assim, a diferença RVt - BVt converge para a soma dos quadrados dos saltos que
ocorreram durante o período. Desse modo, mesmo que nenhum salto tenha ocorrido durante o
período t, é necessária a noção de um “componente de salto significativo”. Huang e Tauchen
(2005) e Andersen et al. (2007), aplicam a estatística de teste para saltos:
(15)
Na ausência de saltos, Zt → d N (0, 1) como M → ∞, e grandes valores positivos
indicam que saltos ocorreram durante o período t. Huang e Tauchen (2005) mostram que o
ruído da microestrutura de mercado pode enviesar o teste na detecção dos saltos, mas também
que o escalonamento diminui esse viés. Desse modo, o componente de salto da volatilidade
realizada é:
(16)
em que, I(A) é o indicador para o evento A, Φ1-α a 100(1 - α)% pontos na distribuição normal
padrão, e α é o nível de significância. Quando eu I{Zt> Φ1-α} = 1, Jt é o excesso de volatilidade
realizada além da variação bipotente e, portanto, atribuível aos saltos nos preços. O
componente contínuo da variação quadrática é estimado pela parte restante de RVt:
(17)
Dessa forma, Ct é igual RVt se não houver saltos significativos durante o período t, e
BVt se existir, ou seja, Ct = I{Zt ≤ Φ1-α}RVt + I{Zt> Φ1-α} BVt. Para qualquer nível de
significância α <1/2, ambos Jt e Ct em (16) e (17) são não negativos porque o Φ1-α é. A
consistência de cada componente como estimador dos componentes correspondentes da
variação quadrática, pode ser escrita como:
∑
,
(18)
com α → 0 e M → ∞ simultaneamente. Assim, essa abordagem de dados de alta frequência
permite uma consistente estimação de ambos os componentes de variação quadrática, definida
na equação (9).
3 DESCRIÇÃO DOS DADOS E MODELOS
3.1 Dados
A análise dos modelos será baseada na série de cotações intradiárias do IBOVESPA
(Índice Bovespa) no período de 3 de janeiro de 2011 até 27 de dezembro de 2013,
correspondendo a 752 dias de negociação. Foi escolhido um intervalo para as negociações de
5 minutos o que gerou 63.935 observações, com uma média de 85 cotações por dia, incluindo
o after-market (negociações que ocorrem no horário em que a bolsa está fechada). No entanto,
não foram considerados os preços no after-market sendo excluídas todas as observações que
6 não ocorreram durante o horário de pregão. Vários autores consideram que estas observações
têm um padrão diferente das negociações que ocorrem durante o período normal de
funcionamento da bolsa, justificando sua exclusão (ENGLE, 2000; ZHANG et al., 2001).
As negociações geralmente ocorrem das 10:00 às 17:00, apenas no período de horário
de verão as negociações começam às 11:00 e terminam às 18:00, para esses meses
considerou-se esse horário não sendo necessário trazer as observações para o horário normal,
pois, como os demais meses não foram alterados isso não afeta os resultados.
A série analisada foi construída a partir desta série original e consiste na série de logretornos calculados com base nas últimas cotações registradas em cada intervalo consecutivo
de cinco minutos. Após o cálculo dos log-retornos excluíram-se os primeiros retornos de cada
dia, gerados pela última informação de preço de uma data qualquer e a primeira do dia
subsequente, conforme orienta Andersen e Bollerslev (1997), com isso a amostra final ficou
composta por 61.918 observações. Esses retornos são conhecidos como “retorno overnight”,
pois incorporam as informações recebidas entre o encerramento de um pregão e o início do
próximo e por isso apresentam variabilidade média bastante superior ao retorno de qualquer
outro intervalo.
Na subseção seguinte são apresentados os modelos estimados. Todos os cálculos
foram realizados no programa R 3.0.1 com o uso do pacote highfrequency elaborado por
Jonathan Cornelissen, Kris Boudt e Scott Payseur.
3.2 Modelos HAR-RV
A partir da volatilidade realizada (RV), vários outros modelos surgiram na tentativa de
aproveitar o máximo de informação que os dados de alta frequência fornecem. O modelo
HARCH, por exemplo, foi sugerido por Muller et al. (1997) e Dacorogna et al. (1998) e
reconhece a heterogeneidade nas negociações e na propagação assimétrica da volatilidade em
horizontes longos e curtos de tempo. Inspirado nesse modelo, Corsi (2009) desenvolve um
modelo que une um AR com a volatilidade realizada considerando esta volatilidade em
diferentes horizontes de tempo.
Corsi (2009) parte da simplificação em um modelo hierárquico com apenas três
componentes de volatilidade correspondentes aos horizontes de tempo de um dia (d), uma
,
e
. Supondo que o
semana (w) e um mês (m) denotados respectivamente por
processo de retorno de alta frequência seja:
(19)
Com εt ~ NID (0,1) e σt(d) como a volatilidade diária integrada. O modelo para o processo de
volatilidade parcial não observada em cada nível hierárquico é assumido como sendo a função
da volatilidade parcial passada, o mesmo horizonte de tempo (o componente AR(1)), e da
esperança de valores do próximo período de mais longo prazo. Com a maior escala de tempo
sendo a mensal, o modelo segue:
(20)
(21)
(22)
7 RVtm, RVtw, RVtd são as volatilidades realizadas mensais, semanais e diárias observadas ex
post,
e
são inovações na volatilidade que são variáveis contemporaneamente
e serialmente não correlacionadas. Por meio de substituições recursivas de volatilidades
parciais, o modelo pode ser escrito como:
(23)
Com isso, a volatilidade parcial ex post pode ser definida como:
(24)
onde
representa o erro de estimação da volatilidade diária latente. Substituindo (23) em
(24), chega-se a equação do modelo HAR-RV (Heterogeneous Autoregressive Realized
Volatility):
(25)
com
.
Um modelo semelhante a este foi desenvolvido por Andersen, Bollerslev e Diebold
(2007), no entanto a forma simplificada ganha a inclusão da contribuição dos saltos para a
volatilidade realizada.
Apenas por uma questão de nomenclaturas das saídas fornecidas pelo R e o pacote
utilizado para o modelo HAR-RV, a equação (26) foi reescrita como:
(26)
3.2.1 O modelo HARRVJ
Na presença de saltos no processo de preço intradiário, as medidas tradicionais de
volatilidade realizada são afetadas pela contribuição dos saltos para a volatilidade. Levando
ao desenvolvimento de medidas robustas de volatilidade para estimar esse componente da
variação de preços. Andersen, (2003), considera a contribuição dos saltos para o processo
quadrático de preço como sendo estimado por Jt = max [RVt - BPVt; 0]. O modelo HAR-RVJ sugerido pelos autores é, então, dado por
(27)
3.2.2 O modelo HARRVCJ
Andersen, Bollerslev e Diebold (2007) argumentam que pode ser desejável tratar
pequenos saltos como os erros de medição, ou parte do processo contínuo da variação,
associando apenas valores grandes de (RVt - BPVt) com o componente de salto. Assim, os
autores definem Zt como:
8 (28)
Onde
, com
= E(| |p).
Os componentes de salto multiperíodo e contínuo são calculados pelas equações (29) e
(30) respectivamente:
(29)
(30)
Desse modo, o modelo HAR-RV-CJ pode ser escrito como:
(31)
4 ANÁLISE E DISCUSSÃO DOS RESULTADOS
4.1 Retornos e volatilidade realizada
Inicialmente buscou-se obter uma visão geral dos dados por meio da análise descritiva
básica da série dos log-retornos do IBOVESPA, os resultados são apresentados na Tabela 1.
A média dos log-retornos calculados com 61.917 observações atingiu um valor muito baixo (1,137.10-05) podendo ser considerado como estatisticamente indistinguível de zero, com
desvio padrão de 0,00129.
Verifica-se que a série de retornos intradiários possui um alto valor da curtose (38,95)
e assimetria positiva de 0,855, indicando que os retornos não têm distribuição normal. Ainda
com relação à normalidade, o teste de Jarque-Bera aplicado apresentou estatística igual a
3.343.356 com p-valor de 2,2.10-16, o que leva a rejeição da hipótese de normalidade dos
retornos a qualquer nível de significância prático. Foi realizado ainda o teste de Ljung-Box
para testar se os dados são identicamente distribuídos, ou seja, não existe correlação entre
eles. O p-valor encontrado foi menor que o nível de significância de 0,05, indicando a
existência de correlação entre os retornos.
9 Tabela 1: Estatísticas para as séries de retornos do IBOVESPA
Estatística
Retornos intradiários (5 minutos)
Mínimo
-4,017.10-02
Primeiro Quartil
-1,137.10-05
Média
-1,137.10-05
Mediana
-6,660.10-06
Terceiro Quartil
6,024.10-04
Máximo
2,240.10-02
Desvio Padrão
0,001296998
Assimetria
0,8556999
Curtose
38,95842
Ljung-Box
8,4984
Jarque-Bera**
3.343.356
*p-value = 0.003555; ** p-value < 2.2e-16
Fonte: Resultados da Pesquisa, 2014.
Na Figura 1 temos o gráfico da série de log-retornos do IBOVESPA em intervalos de
5 minutos, o histograma dos retornos, o ACF (função de autocorrelação) e o PACF (função de
autocorrelação parcial) da série. O gráfico do retorno mostra que as maiores variações
ocorreram principalmente até a metade das observações, o que corresponde aos dados de 2011
até a primeira metade de 2012. O histograma mostra grande concentração dos valores,
indicando pouca variabilidade nos retornos. Pelos gráficos do ACF e PACF confirmamos a
presença de correlação serial na série, confirmando a estatística do teste de Ljung-Box.
Figura 1: Série de log-retornos do IBOVESPA, histograma, ACF e PACF
Fonte: Resultados da Pesquisa, 2014.
10 Os saltos foram gerados por meio do teste de Barndorff-Nielsen e Shephard (2006),
sendo detectados saltos em 9,12% dos dias de negociação.
Uma característica interessante dos dados de alta frequência, no contexto da medição
de volatilidade, é a periodicidade da volatilidade dos retornos induzida pelo horário de
abertura, almoço e fechamento dos mercados (ANDERSEN, BOLLERSLEV, 1997). Os
trabalhos de Wood, McInish e Ord (1985) e Harris (1986) ficaram conhecidos por apresentar
o formato de “U” assumido pela volatilidade do mercado acionário norte-americano ao longo
do dia formado por um pico logo nos primeiros momentos após a abertura do mercado, caindo
no horário do almoço para voltar a subir lentamente conforme se aproxima o horário de
fechamento.
Vários métodos foram desenvolvidos com o objetivo de captar essa periodicidade.
Geralmente assume-se que o desvio padrão dos retornos intradiários pode ser decomposto em
um fator de volatilidade diária (constante para todos os retornos intradiários observados no
mesmo dia) e um fator intradiário (função determinística do intervalo intradiário)
(ANDERSEN, BOLLERSLEV, 1997; BOUDT et al., 2011). As estimativas podem ser
paramétrica (com base na estimação de uma regressão com especificação para o fator
intradiário) ou não paramétrica (com base numa estimativa de escala). A Figura 2 ilustra a
estimativa de periodicidade intradiária para a série do IBOVESPA pelos dois métodos.
Figura 2: Periodicidade intradiária estimada* para a série do IBOVESPA
*Periodicidade estimada com a função “spotVol” do R 3.01.
Fonte: Resultados da Pesquisa, 2014.
Como pode ser observada, a estimação pelo método paramétrico suaviza a
periodicidade (sazonalidade) intradiária, no entanto ambas apresentam o mesmo movimento
de alta no início do dia, queda acentuada na metade do dia (horário de almoço) e leve subida
mantendo-se praticamente constante até o horário de fechamento do mercado. O formato
apresentado pela série do IBOVESPA ao longo do dia assemelha-se ao formato de “J”
invertido encontrado por outros autores em diversos mercados (GOODHART, O'HARA,
1997) e Cappa e Pereira (2010) que também encontraram formato semelhante para a série de
retornos intradiários da Petrobrás.
11 4.2 Modelos HARRV
Nesta subseção apresentamos os resultados dos modelos HAR-RV, HAR-RV-J e
HAR-RV-CJ, conforme descritos na seção 3, para o índice IBOVESPA, estimados em três
horizontes de tempo sobre os quais os componentes contínuo e de salto da volatilidade
deverão ser agregados, correspondentes a um dia, uma semana e um mês de negociação (h =
1, 5, 22). Os coeficientes estimados dos modelos HAR-RV são apresentados na tabela 2,
assim como seus respectivos p-valores. O R2 ajustado foi de 41,76%.
Tabela 2: Coeficientes estimados do Modelo HAR-RV
Coeficientes
Estimativa
Erro
t-valor
β0
0,0020123
0,0005066
3,972
βd
0,4519588
0,0429552
10,522
βw
0,1496540
0,0650902
2,299
βm
0,2062461
0,0639575
3,225
Significante a 0 ‘***’ 0,001 ‘**’ 0,01 ‘*’ 0,05 ‘.’
Fonte: Resultados da Pesquisa, 2014.
p-valor
7,85.10-05***
< 2.10-16 ***
0,02178 *
0,00132 **
Todos dos coeficientes do HAR-RV mostraram-se significativos, confirmando assim a
hipótese de alta persistência da volatilidade.
A Figura 3 apresenta o gráfico para a previsão dentro da amostra a partir do modelo
HAR-RV. Nota-se um bom ajustamento do modelo na maior parte da série, apenas os picos
de volatilidade previstos não se mostram muito próximos do observado.
Figura 3: Modelo HAR para a Volatilidade Realizada do IBOVESPA
0.03
0.02
0.01
Realized Volatility
0.04
Observed RV
Forecasted RV
2011
2012
2013
2014
Time
Fonte: Resultados da Pesquisa, 2014.
Para estimar a contribuição dos saltos na previsão da volatilidade, aplicou-se o modelo
HAR-RV-J, cujos resultados são apresentados na Tabela 3. Apenas o componente de salto
agregado no horizonte de um mês (J22) não se mostrou significativo. O R2 ajustado foi de
45,11%, superior ao que foi encontrado no modelo simples. Os resultados mostram o efeito
negativo dos saltos na composição da volatilidade.
12 Tabela 3: Coeficientes estimados do Modelo HAR-RV-J
Coeficientes
Estimativa
Erro
t-valor
β0
0,0011648
0,0005103
2,282
βd
0,4985224
0,0553847
9,001
βw
0,3802667
0,0941195
4,040
βm
0,2386909
0,0971486
2,457
J1
-0,1095311
0,0530158
-2,066
J5
-0,4456848
0,1074488
-4,148
J22
-0,1185021
0,1478426
-0,802
Significante a 0 ‘***’ 0,001 ‘**’ 0,01 ‘*’ 0,05 ‘.’
Fonte: Resultados da Pesquisa, 2014.
p-valor
0,0228 *
< 2,10-16 ***
5,92e-05 ***
0,0143 *
0,0392 *
3,76.10-05***
0,4231
Figura 4: Modelo HARRVJ para a Volatilidade Realizada do IBOVESPA
0.03
0.02
0.01
Realized Volatility
0.04
Observed RV
Forecasted RV
2011
2012
2013
2014
Time
Fonte: Resultados da Pesquisa, 2014.
Por meio do gráfico da volatilidade observada e prevista pelo HARRVJ não se percebe
diferenças significativas quando comparado ao que foi encontrado pelo HARRV.
Por fim, estimou-se o modelo HAR-RV-CJ o qual mostrou todos os coeficientes de
volatilidade realizada parcial com pequenos saltos (βCs) bastante significativos e
positivamente relacionados. Os componentes de salto foram significativos nos horizontes de 1
e 5 dias, sendo o primeiro com contribuição positiva para a volatilidade realizada. O R2
encontrado para este modelo foi de 0,4602 ou 46,02%.
Tabela 4: Coeficientes estimados do Modelo HAR-RV-J
Coeficientes
Estimativa
Erro
t-valor
β0
0,0013322
0,0005007
2,660
βCD
0,5158555
0,0532624
9,685
βCW
0,2847846
0,0847807
3,359
βCM
0,1668055
0,0846248
1,971
J1
0,1102218
0,0380303
2,898
J5
-0,2013512
0,0770624
-2,613
J22
0,0290934
0,1131437
0,257
Significante a 0 ‘***’ 0,001 ‘**’ 0,01 ‘*’ 0,05 ‘.’
Fonte: Resultados da Pesquisa, 2014.
p-valor
0,007982 **
< 2.10-16 ***
0,000824***
0,049104 *
0,003870 **
0,009172 **
0,797149
13 Pela comparação dos R2 ajustados dos três modelos, considera-se o modelo HAR-RVCJ como o modelo de melhor desempenho na estimação da volatilidade realizada. Apesar de
as diferenças encontradas serem pequenas, a forma como o modelo une os pequenos saltos ao
componente contínuo da volatilidade realizada, ao mesmo tempo em que capta a contribuição
dos saltos maiores torna-o uma opção mais robusta na previsão da volatilidade.
5 CONSIDERAÇÕES FINAIS
A modelagem e previsão da volatilidade é uma questão que atrai bastante atenção dos
pesquisadores. Nos últimos anos, essa literatura tem se beneficiado com a disponibilidade de
dados alta frequência para os preços, conseguindo com isso melhoria na estimação da
volatilidade realizada e identificação de seus componentes, contínuo e de salto. Este trabalho
buscou identificar o papel dos saltos na composição da volatilidade realizada da série do
Ibovespa no período de 2011 a 2013.
Foi encontrada sazonalidade intradiária na série formada pelas variações que ocorrem
nos preços no período de abertura, horário de almoço e de fechamento. Gerando ao longo do
dia um formato semelhante ao de um “J” reverso assim como é frequentemente relatado pela
literatura em diversos mercados. Os saltos foram encontrados em 9,12% dos dias sendo que
os maiores saltos ocorreram até o primeiro semestre de 2012.
Para identificar o melhor modelo de previsão da volatilidade realizada dentro da
amostra e a contribuição dos saltos, foram estimados três modelos: HAR-RV, HAR-RV-J e
HAR-RV-CJ. De maneira geral os modelos mostraram-se bastante semelhantes, sendo o
HAR-RV-CJ o que se mostrou mais apropriado na previsão da volatilidade.
A principal limitação da pesquisa foi a não realização de previsão fora da amostra que
poderia ter contribuído para os resultados e escolha do modelo. Como sugestão para trabalhos
futuros, além da realização e comparação das previsões dentro e fora da amostra, indica-se a
investigação da influência que a intensidade do salto exerce sobre a volatilidade, ou modelos
que consigam prever a probabilidade de ocorrência de saltos.
REFERÊNCIAS
ANDERSEN, T. G., BOLLERSLEV, T., DIEBOLD, F. X.; LABYS, P. Modeling and
forecasting realized volatility. Econometrica, 71:579–625, 2003.
ANDERSEN, T., T. BOLLERSLEV; HUANG, X. A reduced form frame-work for modeling
volatility of speculative prices based on realized variation measures. Journal of
Econometrics 160(1), p. 176-189, 2010.
ANDERSEN, T.G., BOLLERSLEV, T.; DIEBOLD, F.X. Roughing it up: Including jump
components in the measurement, modeling and forecasting of return volatility. NBER
Working Paper Series 11775, 2007.
ANDERSEN, T.G.; BOLLERSLEV, T. Answering the Skeptics: Yes, Standard Volatility
Models Do Provide Accurate Forecasts, Int. Econ. Rev.39:4, 885–905, 1998.
ANDERSEN, T.G.; BOLLERSLEV, T. Intraday periodicity and volatility persistence in
financial markets. Journal of Empirical Finance, 4, 115-158, 1997.
14 ANDERSEN, T.G.; BOLLERSLEV, T.; DIEBOLD, F.X. Roughing it up: including jump
components in the measurement,modeling, and forecasting of return volatility. Review of
Economics and Statistics 89, 701–720, 2007.
BANDI, F.M.; RUSSELL, J.R. Microstructure Noise, Realized Volatil-ity, and Optimal
Sampling, manuscript, Graduate School of Business, Univer-sity of Chicago, 2003.
BANDORff-NIELSEN, O. E. & SHEPHARD, N. How accurate is the asymptotic
approximation to the distribution of realised volatility? In Andrews, D., Powell, J., Ruud, P.,
& Stock, J., editors, Identification and Inference for Econometric Models. A Festschrift for
Tom Rothenberg. Econometric Society Monograph Series, Cambridge University Press,
2003.
BOUDT, K.; CROUX, C.; LAURENT, S. Robust estimation of intraweek periodicity in
volatility and jump detection. Journal of Empirical Finance, 18, 353-367, 2011.
CAPPA, Leonardo; PEREIRA, P. L. Valls, 2010. Modelando a volatilidade dos retornos de
Petrobrás usando dados de alta frequência. Textos para discussão, n.258, Escola de
Economia de São Paulo, Getulio Vargas Foundation (Brazil).
CARVALHO, M., FREIRE, M., MEDEIROS, M., E SOUZA, L. Modeling and forecasting
the volatility of Brazilian asset returns: a realized variance approach. Revista Brasileira de
Finanças, 4:321–343, 2006.
CORSI F. A Simple Approximate Long Memory Model of Realized Volatility. Journal of
Financial Econometrics, 7, 174-196, 2009.
GOODHART, C. A. E.,; M. O'HARA. High Frequency Data in Financial Markets: Issues and
Applications. Journal of Empirical Finance 4: 73-114, 1997.
HARRIS, L. A Transaction Data Study of Weekly and Intradaily Patterns in Stock Returns.”
Journal of Financial Economics 16, 99-117, 1986.
WOOD, R. A., T. H. MCINISH, E J. K. ORD. An Investigation of Transaction Data for
NYSE Stocks. Journal of Finance 25, 723-739, 1985.
15 
Download

PREVISÃO DA VOLATILIDADE REALIZADA: o impacto dos