Modelagem de volatilidade via modelos GARCH com erros assimétricos: abordagem Bayesiana José Augusto Fioruci SERVIÇO DE PÓS-GRADUAÇÃO DO ICMC-USP Data de Depósito: Assinatura:________________________ ______ Modelagem de volatilidade via modelos GARCH com erros assimétricos: abordagem Bayesiana José Augusto Fioruci Orientador: Prof. Dr. Ricardo Sandes Ehlers Dissertação apresentada ao Instituto de Ciências Matemáticas e de Computação - ICMC-USP, como parte dos requisitos para obtenção do título de Mestre em Ciências - Ciências de Computação e Matemática Computacional. VERSÃO REVISADA USP – São Carlos Agosto de 2012 A minha família, em especial aos meus pais, José Airton Fioruci e Luzia Neuza Dalaqua, pelo incentivo e o esforço pela minha formação. Aos meus amigos do laboratório da estatística, pela amizade e apoio. Agradecimentos Agradeço primeiramente a Deus por me permitir estudar os mistérios da sua criação e por ter me concedido saúde e sabedoria para realizar este trabalho. A minha família, em especial aos meus pais que sempre me ajudam, apoiam e me incentivam e a quem sempre estarei em dívida. Ao meu orientador, Ricardo Sandes Ehlers, pela orientação, sugestões e amizade que contribuíram no meu crescimento e na minha formação acadêmica. Aos professores Francisco Louzada Neto e Mauricio Enrique Zevallos Herencia, membros da banca de defesa, pelas valiosas sugestões feitas. Aos professores Francisco Antonio Rojas Rojas e Marinho Gomes de Andrade Filho, membros da banda de qualificação, pelas valiosas sugestões feitas. Aos diversos amigos e colegas do ICMC, em especial aos amigos do laboratório da estatística. Aos professores e aos demais funcionários do ICMC pelo excelente convívio. Por fim, agradeço ao Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq) pelo auxilio financeiro concedido para o desenvolvimento deste projeto. Resumo A modelagem da volatilidade desempenha um papel fundamental em Econometria. Nesta dissertação são estudados a generalização dos modelos autorregressivos condicionalmente heterocedásticos conhecidos como GARCH e sua principal generalização multivariada, os modelos DCC-GARCH (Dynamic Condicional Correlation GARCH). Para os erros desses modelos são consideradas distribuições de probabilidade possivelmente assimétricas e leptocúrticas, sendo essas parametrizadas em função da assimetria e do peso nas caudas, necessitando assim de estimar esses parâmetros adicionais aos modelos. A estimação dos parâmetros dos modelos é feita sob a abordagem Bayesiana e devido às complexidades destes modelos, métodos computacionais baseados em simulações de Monte Carlo via Cadeias de Markov (MCMC) são utilizados. Para obter maior eficiência computacional os algoritmos de simulação da distribuição a posteriori dos parâmetros são implementados em linguagem de baixo nível. Por fim, a proposta de modelagem e estimação é exemplificada com dois conjuntos de dados reais. Palavras-chave: series temporais, modelagem de volatilidade, modelos GARCH, distribuições assimétricas, inferência Bayesiana. Abstract The modeling of volatility plays a fundamental role in Econometrics. In this dissertation are studied the generalization of known autoregressive conditionally heteroscedastic (GARCH) models and its main principal multivariate generalization, the DCCGARCH (Dynamic Conditional Correlation GARCH) models. For the errors of these models are considered distribution of probability possibility asymmetric and leptokurtic, these being parameterized as a function of asymmetry and the weight on the tails, thus requiring estimate the models additional parameters. The estimation of parameters is made under the Bayesian approach and due to the complexities of these models, methods computer-based simulations Monte Carlo Markov Chain (MCMC) are used. For more computational efficiency of simulation algorithms of posterior distribution of the parameters are implemented in low-level language. Finally, the proposed modeling and estimation is illustrated with two real data sets. Keywords: time series, volatility modeling, GARCH models, asymmetric distributions, Bayesian inference. Sumário 1 Introdução 1 1.1 Motivação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1.2 Conceitos Básicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 1.2.1 Retornos e Volatilidade . . . . . . . . . . . . . . . . . . . . . . . 3 1.2.2 Métodos de Monte Carlo via Cadeias de Markov . . . . . . . . . 6 1.3 Revisão Bibliográfica . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 1.4 Apresentação de Capítulos . . . . . . . . . . . . . . . . . . . . . . . . . 14 2 Distribuições Assimétricas 16 2.1 Método Univariado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 2.2 Método Multivariado . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 2.2.1 Normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 2.2.2 t-Student . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 2.2.3 GED . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 3 Modelos GARCH 27 v SUMÁRIO vi 3.1 Modelos Univariados . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 3.2 Modelos Multivariados . . . . . . . . . . . . . . . . . . . . . . . . . . . 32 3.3 Estimação dos Parâmetros . . . . . . . . . . . . . . . . . . . . . . . . . 36 4 Estudo de Simulação 40 5 Aplicação 47 5.1 Modelo Univariado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 5.2 Modelo Multivariado . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 6 Considerações Finais e Conclusão 59 Bibliografia 61 A Estimativa Bayesiana dos parâmetros dos modelos 66 B Gráficos da simulação a posteriori dos parâmetros do modelo DCCGARCH com erros SST 71 Lista de Figuras 1.1 Petrobrás PN: (a) Gráfico da série, (b) Gráfico dos retornos. . . . . . . 1.2 Petrobrás PN: (a) Autocorrelação nos retornos, (b) Autocorrelação nos 4 quadrados dos retornos. . . . . . . . . . . . . . . . . . . . . . . . . . . 5 2.1 Versão padronizada da distribuição Normal Assimétrica . . . . . . . . . 19 4.1 Gráficos das densidades utilizadas para os erros do modelo GARCH(1,1) para gerar os dados artificiais: (a) SSN , (b) SST e (c) SSGED 5.1 . . . 41 Série do IBOVESPA de 02/01/2001 até 28/12/2007. (a) Gráfico da série; (b) Gráfico dos retornos; (c) Gráficos das autocorrelações dos retornos e (d) Gráfico das autocorrelações do quadrado dos retornos. . . . . . . 5.2 50 A esquerda o histograma dos resíduos com a distribuição de probabilidade dos erros sobreposta e a direita o gráfico qqplot dos resíduos do modelo com erros SST . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.3 51 (a) Densidade a posteriori do parâmetro de assimetria (γ) e (b) densidade a posteriori da persistência (α1 + β1 ), para o modelo com erros SST . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vii 52 viii LISTA DE FIGURAS 5.4 Gráfico das volatilidades estimadas pelo modelo GARCH(1,1) com erros SST e intervalo com 95% de credibilidade. . . . . . . . . . . . . . . . 52 5.5 Gráficos da série e dos retornos dos índices DAX, CAC40 e NIKKEI. . 53 5.6 Autocorrelações dos retornos (primeira coluna) e dos retornos ao quadrado (segunda coluna) dos índices DAX, CAC40 e NIKKEI. . . . . . . 5.7 54 Histogramas dos resíduos com as respectivas distribuições marginais sobrepostas na coluna esquerda e gráficos qqplots dos resíduos na coluna da direita: modelo com erros SST . . . . . . . . . . . . . . . . . . . . . 5.8 Densidade a posteriori dos parâmetros de assimetrias (γ) e das persistências (α1 + β1 ) do modelo com erros SST . . . . . . . . . . . . . . . . 5.9 56 57 Gráfico das volatilidades estimadas pelo modelo DCC-GARCH(1,1) com erros SST e intervalo com 95% de credibilidade. . . . . . . . . . . . . . 58 B.1 Na coluna da esquerda os traços, na centro os gráficos das densidades aproximadas e na direita o gráfico das autocorrelações da simulação da distribuição a posteriori dos parâmetros do modelo GARCH(1,1) com erros SST aplicado ao conjunto de dados univariado do Capítulo 5. . . 72 B.2 Traços da simulação a posteriori, densidades aproximadas e autocorrelações do parâmetro de assimetria e dos parâmetro da volatilidade para a série DAX. Modelo ajustado: GARCH(1,1) com erros SST ao conjunto da dados multivariados do Capítulo 5. . . . . . . . . . . . . . . . . . . 73 B.3 Traços da simulação a posteriori, densidades aproximadas e autocorrelações do parâmetro de assimetria e dos parâmetro da volatilidade para a série CAC40. Modelo ajustado: GARCH(1,1) com erros SST ao conjunto da dados multivariados do Capítulo 5. . . . . . . . . . . . . . . . 74 LISTA DE FIGURAS ix B.4 Traços da simulação a posteriori, densidades aproximadas e autocorrelações do parâmetro de assimetria e dos parâmetro da volatilidade para a série NIKKEI. Modelo ajustado: GARCH(1,1) com erros SST ao conjunto da dados multivariados do Capítulo 5. . . . . . . . . . . . . . . . 75 B.5 Traços da simulação a posteriori, densidades aproximadas e autocorrelações dos parâmetros de correlação e do parâmetro de peso nas caudas. Modelo ajustado: GARCH(1,1) com erros SST ao conjunto da dados multivariados do Capítulo 5. . . . . . . . . . . . . . . . . . . . . . . . . 76 Lista de Tabelas 2.1 Razões entre a massa de probabilidade presente a esquerda de −q com a massa de probabilidade presente a direita de q 4.1 P (X<−q) P (X>q) . . . . . . . 20 Porcentagem de vezes que cada modelo foi selecionado pelo critério EAIC no estudo de simulação. Em destaque a porcentagem de vezes que o modelo selecionado foi o mesmo utilizado na geração dos dados. . . . . 4.2 44 Porcentagem de vezes que cada modelo foi selecionado pelo critério EBIC no estudo de simulação. Em destaque a porcentagem de vezes que o modelo selecionado foi o mesmo utilizado na geração dos dados. . . . . 4.3 45 Porcentagem de vezes que cada modelo foi selecionado pelo critério DIC no estudo de simulação. Em destaque a porcentagem de vezes que o modelo selecionado foi o mesmo utilizado na geração dos dados. . . . . 46 5.1 Critérios para seleção dos modelos univariados. . . . . . . . . . . . . . . 49 5.2 Critérios para seleção dos modelos multivariados. . . . . . . . . . . . . 55 A.1 Estimativas do GARCH univariado com erros N . . . . . . . . . . . . . 66 A.2 Estimativas do GARCH univariado com erros SSN . . . . . . . . . . . . 66 A.3 Estimativas do GARCH univariado com erros ST . . . . . . . . . . . . . 67 x xi LISTA DE TABELAS A.4 Estimativas do GARCH univariado com erros SST . . . . . . . . . . . . 67 A.5 Estimativas do GARCH univariado com erros GED. . . . . . . . . . . 67 A.6 Estimativas do GARCH univariado com erros SSGED. . . . . . . . . . 67 A.7 Estimativas do GARCH multivariado com erros N . . . . . . . . . . . . 68 A.8 Estimativas do GARCH multivariado com erros SSN . . . . . . . . . . 68 A.9 Estimativas do GARCH multivariado com erros ST . . . . . . . . . . . . 69 A.10 Estimativas do GARCH multivariado com erros SST . . . . . . . . . . . 69 A.11 Estimativas do GARCH multivariado com erros GED. . . . . . . . . . 70 A.12 Estimativas do GARCH multivariado com erros SSGED. . . . . . . . . 70 Capítulo 1 Introdução 1.1 Motivação Modelagem de volatilidade (variância condicional) é de grande interesse em Economia. Gráficos de dados financeiros mostram que existem períodos mais voláteis do que outros, sendo que esses períodos geralmente estão distribuídos em grupos, sugerindo assim um grau de dependência no tempo. Outra característica que geralmente esta presente em séries financeiras, é que, em geral choques negativos tem mais influencia na volatilidade do que choques positivos, caracterizando assim, um certo grau de assimetria na volatilidade. Para levar em conta a presença de grupos de volatilidade é necessário a utilização de modelos heterocedásticos condicionais, ou seja, modelos que consideram que a variância condicional de uma série temporal não é constante. Diversos modelos para volatilidade foram propostos na literatura, sendo que os modelos autorregressivos condicionalmente heterocedásticos (ARCH) propostos por Engle (1982), e sua generalização os modelos GARCH (Bollerslev 1986), bem como os modelos de volatilidade estocástica (Taylor 1982) são os mais empregados. 1.1 Motivação 2 Variações em diversas séries financeiras podem ser correlacionadas, de forma que a volatilidade de uma série pode sofrer influencia das volatilidades de outras séries. Com o intuito de considerar essas correlações na estimação dos modelos GARCH, diversas extensões multivariadas surgiram na literatura, sendo que os modelos CCC-GARCH (Constant Conditional Correlation GARCH) proposto em Bollerslev (1990) e DCCGARCH (Dynamic Conditional Correlation-GARCH) propostos simultaneamente em Engle (2002) e Tse & Tsui (2002) estão entre os mais conhecidos. Muitas vezes a utilização da distribuição de probabilidade Normal Padrão para os erros dos modelos GARCH não é suficiente para adequar as características de caudas pesadas e assimetria dos retornos financeiros. Assim, tanto para os erros dos modelos GARCH como para os erros dos modelos DCC-GARCH, nesta dissertação é estudado a utilização de distribuições de probabilidade com caudas mais pesadas do que a distribuição Normal Padrão e também consideramos uma forma de tornar possivelmente assimétrica (skew) essas distribuições. A estimação é feita sob o enfoque Bayesiano o que possibilita analisar essas características através da distribuição a posteriori dos parâmetros, uma vez que as distribuições de probabilidade utilizadas são parametrizadas em função de parâmetros de peso nas caudas e de assimetria. Na literatura poucos trabalhos surgiram utilizando o enfoque Bayesiano, mesmo para os modelos univariados. Isto ocorre devido a complexidade desses modelos e ao custo computacional da utilização de métodos computacionais baseados em simulação de Monte Carlos via Cadeias de Markov (MCMC). Nesta dissertação, os métodos MCMC são utilizados, mas para obter maior eficiência computacional os algoritmos de simulação da distribuição a posteriori são implementados em linguagem de baixo nível. As principais contribuições metodológicas deste trabalho são: o estudo de distribuições possivelmente leptocúrticas e assimétricas para o termo do erro, tanto em modelos univariados GARCH como nos modelos multivariados DCC-GARCH; abordagem Baye- 3 1.2 Conceitos Básicos siana para estimação desses modelos; avaliação da adequação de alguns critérios para seleção entre os modelos aqui estudados através de um estudo de simulação. 1.2 Conceitos Básicos Nesta seção apresentamos alguns conceitos que serão utilizados nesta dissertação. Os conceitos relacionados a séries temporais podem ser vistos detalhadamente em Morettin (2008). Um excelente texto introdutório sobre os conceitos relacionados a inferência Bayesiana e métodos computacionais pode ser encontrado em Lynch (2007). Estudos mais avançados sobre os algoritmos Amostrador de Gibbs e Metropolis-Hastings podem ser encontrados em Casella & George (1992) e Chib & Greenberg (1995), respectivamente. 1.2.1 Retornos e Volatilidade Considere Pt como sendo o preço de um ativo no instante t e pt como sendo o logaritmo na base e do preço deste ativo (pt = log(Pt )). Assim o log-retorno ou simplesmente, retorno no instante t, é definido como sendo: Pt yt = log Pt−1 ! = pt − pt−1 . Como exemplo, a Figura 1.1 (a) apresenta o gráfico da série diária dos fechamentos da ação da Petrobrás PN, no período de 2 de janeiro de 1995 à 27 de dezembro de 2000, e a Figura 1.1 (b) apresenta o gráfico dos retornos da mesma série. Pela Figura 1.1 podemos notar algumas das principais propriedades dos retornos, como por exemplo estacionaridade. Isto faz com que em geral, seja preferível trabalhar com retornos do que com o preço dos ativos. 4 1.2 Conceitos Básicos 10000 50000 Observações (a) 0 500 1000 1500 1000 1500 Tempo 0.1 −0.2 Retornos (b) 0 500 Tempo Figura 1.1: Petrobrás PN: (a) Gráfico da série, (b) Gráfico dos retornos. Outra características comum em séries de retornos financeiros consiste na existência de autocorrelação nos quadrados dos retornos, enquanto que os retornos não possuem autocorrelação ou em alguns casos possuem autocorrelação apenas nos primeiros lags. Essa característica é exemplificada na Figura 1.2, onde para a mesma série da Petrobrás, temos no gráfico (a) as autocorrelações dos retornos e no gráfico (b) as autocorrelações dos quadrado dos retornos. Observe que no gráfico (a) existe autocorrelação apenas para o lag 1, enquanto que no gráfico (b) existe autocorrelação para diversos lags. Considerando uma série de retornos {yt , t = 1, . . . , T }, podemos escrever a distribuição conjunta dos retornos como o produto das distribuições de cada retorno, condicionado os retornos anteriores: p(y1 , . . . , yT ) = p(y1 )p(y2 |I2 )p(y3 |I3 ) . . . p(yT |IT ), (1.1) 5 1.2 Conceitos Básicos 0.6 0.0 ACF (a) 0 5 10 15 20 25 30 20 25 30 Lag 0.6 0.0 ACF (b) 0 5 10 15 Lag Figura 1.2: Petrobrás PN: (a) Autocorrelação nos retornos, (b) Autocorrelação nos quadrados dos retornos. sendo It = {yt−1 , yt−2 , . . .} a informação prévia até o instante t. A variância das distribuições condicionais da equação (1.1) convencionou-se chamar de Volatilidade e será o objetivo da modelagem. O formato de escrever distribuição conjunta dos retornos apresentado em (1.1) é muito utilizada nos modelos para volatilidade, pois nessa modelagem sempre estaremos interessados na informação disponível no instante t com relação ao que ocorreu nos instantes anteriores. Algumas das características que geralmente são encontradas em séries de retornos financeiros são: • Retornos são em geral não autocorrelacionados; • A distribuição incondicional dos retornos apresenta caudas mais pesadas do que a distribuição Normal; 6 1.2 Conceitos Básicos • Os quadrados dos retornos são em geral autocorrelacionados; • A volatilidade aparece em grupos de maior, ou menor, volatilidade; • A volatilidade reage de modo diferente a valores positivos e negativos da série; Os modelos que serão vistos no Capítulo 3 assumirão que a esperança de cada distribuição condicional da equação (1.1) é zero, enquanto que a variância (volatilidade) é uma função da informação passada. Ou seja, estes modelos assumi- rão heterocedasticidade. Para fixar a notação, considere a volatilidade como ht = V ar(yt |It ) = E(yt2 |It ), sendo It a informação prévia até o momento t, ou seja, It = (yt−1 , yt−2 , . . . , ht−1 , ht−2 , . . .). A seguir apresentaremos uma breve descrição de alguns dos principais métodos de simulação computacional baseados em Monte Carlo via Cadeias de Markov. 1.2.2 Métodos de Monte Carlo via Cadeias de Markov Suponha que temos interesse em obter características (por exemplo: média e a variância) de uma distribuição a posteriori π(θ|y), mas não podemos obter essa informação diretamente. Entretanto, suponha que podemos construir uma Cadeia de Markov, com espaço de estados no espaço paramétrico Θ (conjunto de todos valores possíveis de θ), que é simples para simular e cuja distribuição de equilíbrio seja dada por π(θ|y). Por fim, sob algumas condições de regularidade, o Teorema 1.1 garante que podemos utilizar os valores simulados da cadeia como base para sumarizar características da posteriori π(θ|y). A demonstração do Teorema 1.1 pode ser encontrada em Tierney (1994). Teorema 1.1. Suponha que {Y (t) }M t=1 é uma Cadeia de Markov irredutível, aperiódica com núcleo de transição P (., .) e distribuição invariante π. Se P (y, .) é absolutamente 7 1.2 Conceitos Básicos continua com respeito a π para todo y, então π é a única distribuição invariante de P(.,.) e para toda função h que toma valores nos reais e integrável em relação a π, temos Z M 1 X (t) h(Y ) −→ h(y)π(y)dy, M t=1 quando M → ∞, q.c. Recentemente, com a evolução computacional, os métodos de Monte Carlo via Cadeias de Markov (MCMC) vem sendo cada vez mais utilizados, por conta da facilidade na utilização e pela possibilidade de trabalhar com modelos complexos. A seguir serão apresentados os dois métodos MCMC mais empregados, o Amostrador de Gibbs e o Metropolis-Hastings. Amostrador de Gibbs Considere θ = (θ1 , . . . , θk ) um vetor de variáveis aleatórias. O Amostrador de Gibbs consiste em um algoritmo para gerar uma Cadeia de Markov da distribuição conjunta π(θ) a partir das distribuições condicionais de θi |θ−i , i = 1, . . . , k, sendo θ−i = (θ1 , . . . , θi−1 , θi+1 , . . . , θk ). As distribuições condicionais são obtidas a partir de: π(θi |θ−i ) = R π(θ) ∝ π(θ). π(θ) dθi Assim, a menos de uma constante, para obter a distribuição condicionais de θi |θ(i) , basta considerar apenas os termos da distribuição conjunta π(θ) que dependem de θi . A seguir é apresentado o esquema do algoritmo Amostrador de Gibbs: 1. Determine valores iniciais para θ (0) e faça j = 0. 8 1.2 Conceitos Básicos 2. Obtenha um novo valor de θ (j+1) a partir de θ (j) , através da geração sucessiva dos valores: (j+1) ∼ π(θ1 |θ2 , θ3 , . . . , θk ) (j+1) ∼ π(θ2 |θ1 θ1 θ2 (j) (j) (j) (j+1) , θ3 , . . . , θk ) (j+1) , θ2 (j) (j) .. . (j+1) θk ∼ π(θk |θ1 (j+1) (j+1) , . . . , θk−1 ) 3. Faça j = j + 1 e volte ao Passo 2. Os passo 2 e 3 devem ser repetidos até que a distribuição estacionária seja alcançada. Em geral, as primeiras simulações são descartadas como uma amostra de aquecimento. Pode-se considerar apenas os últimos valores gerados a cada bloco de k-simulações, com k > 1. Observe que não é necessário conhecer a distribuição conjunta, mas é necessário conhecer as distribuições condicionais completas. Se as distribuições condicionais completas coincidirem com alguma distribuição de probabilidade conhecida na literatura, então deve-se gerar valores diretamente dessa distribuição. No caso, de uma ou mais distribuições condicionais completas não coincidirem com alguma distribuição de probabilidade conhecida, pode-se utilizar o algoritmo Metropolis-Hastings para simular da distribuição conjunta. O algoritmo Metropolis-Hastings é apresentado a seguir. Metropolis-Hastings No algoritmo Metropolis-Hastings um valor é gerado de uma distribuição auxiliar (ou distribuição proposta) e aceito com uma dada probabilidade. Este mecanismo de correção garante a convergência da cadeia para a distribuição de probabilidade de equilíbrio. 9 1.2 Conceitos Básicos Considerando θ = (θ1 , . . . , θk ), suponha que deseja-se gerar valores da distribuição conjunta π(θ) e a cadeia esteja no estado θ, um valor θ 0 é gerado de uma distribuição proposta q(·|θ). Note que a distribuição proposta pode depender do estado atual da cadeia, por exemplo q(·|θ) poderia ser uma distribuição multivariada centrada em θ. O esquema geral do algoritmo Metropolis-Hastings é apresentado a seguir: 1. Inicialize o contador j = 0 e determine um valor inicial θ (0) . 2. Gere θ 0 da distribuição proposta q(·|θ (j) ). 3. Gere u ∼ U (0, 1). 4. Se u < p(θ 0 , θ (j) ) então faça θ (j+1) = θ 0 . Caso contrário, faça θ (j+1) = θ (j) . 5. Faça j = j + 1 e volte para o Passo 2. No passo 4 a probabilidade de aceitação p(θ 0 , θ (j) ) é dada por: π(θ 0 ) q(θ (j) |θ 0 ) . p(θ , θ ) = min 1, π(θ (j) ) q(θ 0 |θ (j) ) ( 0 ) (j) (1.2) Observe, que a probabilidade de aceitação não depende de constantes normalizadoras, ou seja, π(θ) pode ser conhecido a menos de uma constante. Os passo 2−5 devem ser repetidos até que seja obtida a distribuição estacionária π(θ). Na inferência Bayesiana o algoritmo Metropolis-Hastings é bastante utilizado para gerar amostras da distribuição a posteriori, neste caso, a distribuição pretendida é a posteriori π(θ|y) ∝ L(θ)π(θ), sendo L(θ) e π(θ) a função de verossimilhança e a distribuição a priori de θ, respectivamente. Assim, se considerarmos como distribuição proposta a priori π(θ), surge um caso especial, no qual a probabilidade de aceitação 10 1.3 Revisão Bibliográfica apresentada em (1.2) fica resumida na razão de verossimilhanças: L(θ 0 ) p(θ , θ ) = min 1, . L(θ (j) ) ( (j) ) 0 Um caso mais geral do Metropolis-Hastings e que em alguns casos pode ser mais eficiente computacionalmente, consiste em dividir θ = (θ1 , . . . , θk ) em p blocos {θ1 , . . . , θp }, sendo que cada bloco contém um ou mais elementos, assim dentro de cada iteração teremos o algoritmo aplicado p vezes. Por exemplo, definindo o vetor θ−i = (θ1 , . . . , θi−1 , θi+1 , . . . , θp ) que contém todos os elementos de θ exceto θi , suponha que na iteração j + 1 os blocos 1, 2, . . . , i − 1 já foram atualizados, isto é (j) (j+1) θ−i = (θ1 (j+1) (j) , . . . , θi−1 , θi+1 , . . . , θp(j) ). Assim, para atualizar a i-ésima componente, (j) (j) um valor θi0 é gerado da distribuição proposta q(·|θi , θ−i ) e este valor candidato é aceito com probabilidade: (j) (j) (j) (j) π(θi0 |θ−i ) q(θi |θi0 , θ−i ) π(θi |θ−i ) q(θi0 |θi , θ−i ) p(θi0 , θi ) = min 1, (j) (j) (j) (j) . (1.3) Aqui, π(θi |θ−i ) é a distribuição condicional completa do bloco θi . Note que o Amostrador de Gibbs é um caso especial do algoritmo MetropolisHastings, no qual os elementos de θ são atualizados um de cada vez (ou em blocos), tomando a distribuição condicional completa como proposta e neste caso, a probabilidade de aceitação é igual a 1. 1.3 Revisão Bibliográfica Os modelos ARCH (Autoregressive Conditional Heteroskedasticity) foram introduzidos por Engle (1982) e têm como ideia básica que a volatilidade (variância condicional) em um instante t não é constante e depende dos retornos passados. Bollerslev (1986) propôs 1.3 Revisão Bibliográfica 11 uma classe de modelos que considera que a volatilidade depende, além dos valores passados dos retornos, também dos valores passados da volatilidade, estes modelos são os considerados GARCH (Generalized ARCH ). Os modelos GARCH são considerados mais parcimoniosos do que os ARCH, no sentido que, em geral descrevem a volatilidade com menos parâmetros. Desde a criação dos modelos GARCH diversas extensões multivariadas foram propostas na literatura, uma revisão sobre vários desses modelos pode ser encontrada em Bauwens et al. (2006). Os modelos multivariados mais utilizados foram propostos pelos mesmos criadores dos modelos ARCH e GARCH, primeiramente foi proposto o modelo CCC-GARCH (Constant Conditional Correlation GARCH) em Bollerslev (1990), esse modelo considera correlação constante ao longo do tempo entre as séries de retornos. Uma extensão do CCC-GARCH que hoje é mais utilizada é o modelo DCC-GARCH (Dynamic Conditional Correlation GARCH) o qual foi proposto simultaneamente em Engle (2002) e Tse & Tsui (2002), este modelo considera que a correlação entre as volatilidades varia com o tempo através de um processo GARCH. Os modelos CCCGARCH e DCC-GARCH serão apresentados em detalhes na Seção 3.2. Atualmente vem surgindo algumas abordagens Bayesianas para estimação dos modelos GARCH. Ardia (2006) propõe um algoritmo para estimação Bayesiana do modelo GARCH(1,1) com erros normais. O algoritmo consiste em amostrar valores da distribuição posteriori conjunta dos parâmetros, construindo assim, uma Cadeia de Markov para ser utilizada na estimação dos parâmetros. Nos modelos GARCH as condicionais completas da posteriori, em geral, não coincidem com funções de densidades de probabilidade conhecidas na literatura, e assim, o algoritmo Metropolis-Hastings é utilizado. Ainda no mesmo artigo, para melhorar o desempenho do algoritmo a amostragem é feita por uma abordagem sugerida por Nakatsuma (1998), a qual utiliza uma transformação paramétrica e uma aproximação normal. 1.3 Revisão Bibliográfica 12 Devido a evidências na literatura de que muitas séries temporais financeiras tendem a ter a curtose observada maior do que aquela considerada por um modelo GARCH com erros normais, Ardia (2008) propõe a estimação Bayesiana do modelo GARCH(1,1) com erros t-Student através de um algoritmo MCMC. A implementação em R de ambos algoritmos, pode ser encontrada no pacote bayesGARCH (Ardia 2011). Além da distribuição t-Student, outra distribuição de probabilidade possivelmente leptocúrtica que vem sendo usada para os erros do modelo GARCH é a GED (Generalized Error Distribution), que pode ser encontrada na forma univariada e com uma das extensões multivariada em Gómez et al. (1998). Uma das preocupações atuais, tem sido com a evidência empírica de assimetria nos retornos financeiros, não tratada pelos modelos GARCH, isto levou alguns pesquisadores a proporem extensões para o modelo. Nelson (1991) introduziu os modelos EGARCH (Exponential GARCH), Glosten et al. (1993) introduziram os modelos GJR, mas uma das extensões que mostrou-se mais promissora foi a APARCH (Asymmetric Power ARCH) introduzidas por Ding et al. (1993). Os modelos APARCH generalizam vários modelos GARCH assimétricos, entre eles, os EGARCH e os GJR (veja, Laurent (2004)). Outra forma de tratar a assimetria nos retornos através dos modelos GARCH consiste em assumir algum grau de assimetria na distribuição dos erros. Em Pipien (2006) são revisados diversos métodos para inserir assimetria em qualquer distribuição de probabilidade univariada, continua, unimodal e simétrica. Na literatura o método para inserir assimetria que vem sendo mais explorado é o proposto em Fernandez & Steel (1998) para distribuições de probabilidade univariadas e generalizado para as distribuições multivariadas em Bauwens & Laurent (2005). O método de Fernandez e Steel transforma a distribuição de probabilidade simétrica em uma distribuição possivelmente assimétrica acrescentado apenas um parâmetro, o qual pode ser interpretado como um parâmetro de assimetria, que no caso igual a 1 torna a distribuição simétrica, 1.3 Revisão Bibliográfica 13 se menor que 1, então a distribuição terá maior massa a esquerda da moda e se maior que 1 terá maior massa a direita da moda. O método de Fernandez & Steel (1998) e sua generalização multivarida de Bauwens & Laurent (2005) será explicada em detalhes no Capítulo 2. Outras propostas recentes para modelar características não captadas pelos modelos GARCH usuais são: modelos com mudança de regime estocástica (Markov switching, Bauwens et al. (2008), Ardia (2009)), e misturas de distribuições para os erros (ver por exemplo Ausin & Galeano (2007)). Outra classe de modelos para volatilidade são os modelos de Volatilidade Estocástica (VE), propostos por Taylor (1982), os quais tem sido uma alternativa aos modelos da família GARCH. Em alguns casos, estes modelos são conhecidos por modelarem melhor a volatilidade do que os modelos GARCH (veja, Kim et al. (1998), Barossi-Filho et al. (2010)), mas são considerados de difícil estimação, isso porque nesses modelos não é possível obter a função verossimilhança de forma analítica, pois as volatilidades aparecem como variáveis latentes. Iniciado, por Jacquier et al. (1994) os métodos MCMC tem sido usados para estimar os parâmetros e as log-volatilidades do modelo de VE do ponto de vista Bayesiano. Na classe de modelos VE também tem surgido propostas na literatura para relaxar a hipótese de normalidade dos erros introduzindose distribuições com caudas mais pesadas bem como distribuições assimétricas (ver por exemplo, Liesenfeld & Jung (2000) e Cappuccio et al. (2004)). A utilização das distribuições de probabilidade que serão obtidas no Capítulo 2 para os erros dos modelos VE nos casos univariados e multivariados ficará como proposta futura de pesquisa nesta dissertação. 1.4 Apresentação de Capítulos 1.4 14 Apresentação de Capítulos No Capítulo 1 foi apresentada a motivação para o projeto e alguns conceitos básicos, incluindo uma introdução aos conceitos de retornos e volatilidade em séries temporais e aos principais métodos computacionais baseados em Monte Carlo via Cadeias de Markov (Amostrador de Gibbs e Metropolis-Hastings). Ainda neste capítulo, também é feita uma revisão bibliográfica de alguns trabalhos referentes a distribuições assimétricas e modelos GARCH. O Capítulo 2 define o conceito de simetria em distribuições de probabilidade univariadas e multivariadas e apresenta um método para obter uma generalização possivelmente assimétrica (dependendo do valor do parâmetro de assimetria) dessas distribuições, desde que estas sejam, contínuas e unimodais. O método é então aplicado a três distribuições de probabilidade comumente utilizadas para os erros dos modelos GARCH. Os modelos GARCH, foco do estudo dessa dissertação, são apresentados no Capítulo 3. Inicialmente, são introduzidos os modelos univariados conhecidos como GARCH(p,q), em seguida são apresentadas duas de suas generalizações multivariadas, os modelos CCC-GARCH e DCC-GARCH. Ainda, neste capítulo, é apresentado dois algoritmos para simulação da distribuição a posteriori dos parâmetros do modelo DCC-GARCH. Lembrando que o modelo DCC-GARCH generaliza o modelo GARCH univariado e portanto o mesmo algoritmo pode ser utilizado para o GARCH univariado. No Capítulo 4 é apresentado um estudo de simulação para avaliar se alguns critérios para seleção de modelos conhecidos na literatura são adequados para distinguir entre os modelos aqui estudados. No Capítulo 5 os modelos estudados são aplicados a dois conjuntos de dados reais, uma para os modelos univariados e outro para os modelos multivariados, a estimação é feita utilizando uma implementação dos algoritmos 1.4 Apresentação de Capítulos 15 apresentados no Capítulo 3. Estes, então são comparados via critérios de seleção de modelos e é feita a análise de resíduo para o modelo selecionado. Por fim, no Capítulo 6 temos as considerações finais e a conclusão da dissertação. Em seguida, são apresentadas as referências bibliográficas e o Apêndice A com as estimativas a posteriori de todos os modelos utilizados no Capítulo 5. Capítulo 2 Distribuições Assimétricas Neste capítulo apresentaremos o método de Fernandez & Steel (1998) para inserir assimetria em qualquer função de distribuição de probabilidade contínua, simétrica, unimodal e definida nos reais. Em seguida apresentaremos o método de Bauwens & Laurent (2005), o qual generaliza o método de Fernandez & Steel (1998) para as distribuições multivariadas. 2.1 Método Univariado Diversas propostas para introduzir assimetria em distribuições simétricas surgiram na literatura, dentre elas podemos citar, Azzalini (1985), Fernandez & Steel (1998), Branco & Dey (2001), Azzaline & Capitanio (2003), Jones & Faddy (2003). Mas devido a simplicidade e generalidade neste capítulo nos concentraremos na proposta de Fernandez & Steel (1998). Neste método os momentos são mais fáceis de serem calculados e não é necessário obter a função de distribuição acumulada. Ainda, no contexto Bayesiano, o método facilita a especificação das distribuições a priori separando os efeitos dos parâmetros de assimetria e de cauda. 16 2.1 Método Univariado 17 Considere p(x) uma função de densidade unimodal, definida na reta e simétrica em torno do zero. Neste caso, consideramos p(x) simétrica se p(x) = p(−x), para todo x ∈ R. O método proposto em Fernandez & Steel (1998) é conhecido como método de escala inversa de fatores. Este obtêm uma função de densidade s(x|γ) a partir de p(x) a qual é assimétrica e possui o grau de assimetria indexado pelo parâmetro adicional γ > 0. Quando o valor da variável aleatória é menor que zero então s(x|γ) ∝ p(xγ), caso contrário, s(x|γ) ∝ p( γx ). A função de densidade de probabilidade s(x|γ) é apresentada a seguir: n o 2 p(xγ)I (x) + p(x/γ)I (x) (−∞,0) [0,∞) γ + γ −1 2 p(xγ −sign(x) ), = γ + γ −1 s(x|γ) = sendo IA (x) a função indicadora no conjunto A e sign(x) é igual a −1, se x < 0 e igual a +1 , se x ≥ 0. Algumas das principais características de s(x|γ) são apresentadas a seguir: 1. Se γ = 1 então obtemos o caso simétrico, isto é, s(x|γ = 1) = p(x). 2. s(x|γ) mantém a mesma moda da p(x). Como p(x) é unimodal e simétrica em torno do zero, a moda sempre é no zero. 3. A massa de probabilidade a esquerda e a direita de zero é independente de p(x): γ2 2γ Z ∞ p(x/γ)dx = , P (X ≥ 0) = 1 + γ2 0 1 + γ2 1 P (X ≤ 0) = 1 − P (X ≥ 0) = , 1 + γ2 P (X ≥ 0) = γ 2. P (X ≤ 0) 4. Assimetria a direita (esquerda) corresponde a γ > 1 (γ < 1). 18 2.1 Método Univariado 5. A existência dos momentos de s(x|γ) depende unicamente dos momento absolutos de p(x). O r-ésimo momento é dado por: γ r+1 + (−1)r /γ r+1 E(X |γi ) = Mr , γ + 1/γ r sendo Mr = 2 Z ∞ xr p(x) dx 0 (2.1) o r-ésimo momento absoluto de p(x). 6. A média e a variância são dados por: µ = M1 (γ − 1/γ) (2.2) σ 2 = (M2 − M12 )(γ 2 + 1/γ 2 ) + 2M12 − M2 (2.3) 7. A versão padronizada da função de densidade s(x|γ) é a distribuição de probabilidade da variável aleatória Z = (X − µ)/σ, a qual é dada por: p(z|γ) = s(zσ + µ|γ) = sendo, z∗ = dx = s(zσ + µ|γ)σ dz 2σ p(z ∗ ), γ + γ −1 (2.4) (zσ + µ)γ, se z < −µ/σ (zσ + µ)/γ, se z ≥ −µ/σ (2.5) e p(z ∗ ) a função de densidade simétrica calculada em z ∗ . Como exemplo, se aplicarmos o método apresentado em (2.4) na distribuição de probabilidade Normal Padrão, obtemos: (2/π)1/2 (x∗ )2 p(x|γ) = exp , γ + γ −1 2 ( ) (2.6) 19 2.1 Método Univariado sendo, x∗ dado como em (2.5). No caso da função de distribuição simétrica p(x) ser padronizada temos o segundo momento absoluto será dado por M2 = 1. Neste exemplo então, temos M2 = 1 e aplicando (2.1) obtemos M1 = (2/π)1/2 . Desta forma, das expressões (2.2) e (2.3) obtemos a média a variância da versão assimétrica da Normal Padrão: µ = (2/π)1/2 (γ − 1/γ) σ 2 = (γ 2 + γ −1 − 1) − µ2 . A função de densidade (2.6) será referenciada no texto como SSN (0, 1, γ) (Standard Skew Normal). A Figura 2.1 apresenta o gráfico dessa distribuição nas versões com parâmetro de assimetria igual a 1, 0, 0, 7 e 1, 3, sendo respectivamente a versão simétrica, uma versão assimétrica a esquerda e uma versão assimétrica a direita. Observe 0.4 que no caso padronizado a função de densidade não possui moda igual a zero. 0.2 0.0 0.1 p(x|γ) 0.3 γ = 1.0 γ = 0.7 γ = 1.3 −4 −2 0 2 4 x Figura 2.1: Versão padronizada da distribuição Normal Assimétrica. A assimetria torna-se mais evidente quando quando comparamos a massa de pro- 20 2.2 Método Multivariado babilidade presente nas caudas da distribuição. Como exemplo, para a função de densidade (2.6), a Tabela 2.1 apresenta os valores de P (X < −q)/P (X > q), isto é, a razão entre a massa de probabilidade presente a esquerda de −q com a massa de probabilidade presente a direita de q, sendo q ≥ 0. Observe que mesmo com γ = 0, 9, o que graficamente seria próximo de simetria, a massa de probabilidade presente na cauda esquerda não é próxima da massa de probabilidade presente na cauda direita. Note que o valor desta razão aumenta quando aumentamos o valor de q. Tabela 2.1: Razões entre a massa de probabilidade presente a esquerda de −q com a P (X<−q) massa de probabilidade presente a direita de q P (X>q) . γ = 0, 9 γ = 0, 7 2.2 q=1 1,0192 1,0584 q=2 1,5183 4,9009 q=3 3,3238 119,7992 Método Multivariado O conceito de distribuições simétricas em torno do zero apresentado na Seção 2.1 é generalizado para distribuições multivariadas na definição a seguir (Bauwens & Laurent (2005)): Definição 2.1. Uma distribuição de probabilidade unimodal p(x) definida em Rm , com E(X) = 0 e V ar(X) = Im é simétrica se, e somente se, para qualquer x, p(x) = p(Qx) para qualquer matriz diagonal Q cujos elementos da diagonal são iguais a 1 ou −1. Considerando p(x) como na Definição 2.1 o método para inserir assimetria de Bauwens & Laurent (2005) generaliza para o caso multivariado o método de Fernandez 21 2.2 Método Multivariado & Steel (1998) apresentado na Seção 2.1. Este método é dado por: m Y ! γi p(x∗ ), 2 i=1 1 + γi s(x|γ) = 2 m (2.7) sendo, x∗ = (x∗1 , . . . , x∗m )0 , x∗i = xi /γi se xi ≥ 0 e x∗i = xi γi se xi < 0. Os parâmetros de assimetria são dados por γ = (γ1 , . . . , γm )0 , com γi > 0. Se γi = 1 então a marginal correspondente é simétrica. Os momentos de p(x|γ) podem ser obtidos em função dos momentos absolutos das distribuições marginais de p(x) como em Fernandez & Steel (1998). Isto é, E(Xir |γi ) = γir+1 + (−1)r /γ r+1 Mr , γi + 1/γi (2.8) sendo Mr = 2 Z ∞ 0 xri p(xi ) dxi, para qualquer r ∈ N. Em geral, mesmo p(x) sendo padronizada a distribuição resultante s(x|γ) não será padronizada. Mas desde que o primeiro momento absoluto da distribuição marginal p(xi ) seja conhecido podemos utilizar a expressão (2.8) para obtermos o vetor de médias 2 0 ) de s(x|γ). Como p(x) µ = (µ1 , . . . , µm )0 e o vetor de variâncias σ 2 = (σ12 , . . . , σm é padronizada, é fácil ver que M2 = 1, logo da expressão (2.8) temos as médias e as variâncias de p(x|γ): µi = E(Xi |γi ) = (γi − γi−1 )M1 , σi2 = γi3 + γi−3 M2 − µ2i = (γi2 + γi−2 − 1) − µ2i , γi + γi−1 (2.9) (2.10) para i = 1, . . . , m. Assim, a versão padronizada da função de densidade (2.7) é a distribuição de pro- 22 2.2 Método Multivariado babilidade do vetor aleatório Z = (Z1 , . . . , Zm )0 , no qual Zi = (Xi − µi )/σi , a qual é dada por: p(z|γ) = 2 sendo, zi∗ = m "m Y # γi σ p(z ∗ ), 2 i i=1 1 + γi (zi σi + µi )/γi , se zi ≥ −µi /σi (zi σi + µi )γi , se zi < −µi /σi . (2.11) (2.12) A seguir aplicaremos o método para as distribuições de probabilidade Normal, tStudent e GED multivariadas. Vale lembrar que para obter o caso univariado das distribuições a seguir, basta utilizar m = 1. 2.2.1 Normal A distribuição Normal m-Variada denotada por N (0, Im ) é definida como produto de m distribuições Normais Padrão N (0, 1), logo possui distribuições marginais N (0, 1). A distribuição N (0, Im ) é dada por: m 1X 1 exp − x2 . p(x) = (2π)m/2 2 i=1 i ( ) (2.13) Calculando o momento absoluto da N (0, 1), temos: 2 Z∞ x2i = x exp − dxi i (2π)1/2 0 2 2 = . (2π)1/2 ( M1 ) (2.14) Logo, substituindo (2.14) em (2.9) obtemos as médias marginais da versão assimétrica da função de densidade (2.13): µi = (2/π)1/2 (γi − γi−1 ). 23 2.2 Método Multivariado Para i = 1, . . . , m. As variâncias marginais são obtidas diretamente da expressão (2.10). Por fim, da expressão (2.11) obtemos a distribuição de probabilidade Normal Assimétrica e Padronizada (SSN (0, Im , γ), Standard Skew Normal). p(z|γ) = 2 π m/2 m Y γi σi 2 i=1 1 + γi ! m 1X exp − zi∗ 2 , 2 i=1 ( ) sendo, zi∗ dado pelas expressões (2.12). 2.2.2 t-Student Uma generalização multivariada da distribuição t-Student é definida como: x0 x Γ((ν + m)/2) 1+ p(x|ν) = Γ(ν/2)[π(ν − 2)]m/2 ν−2 !−(m+ν)/2 . (2.15) Essa distribuição de probabilidade será denotada por ST (0, Im , ν) (Standard tStudent), sendo essa padronizada e com distribuições marginais ST (0, 1, ν). A distribuição ST (0, Im , ν) satisfaz a Definição 2.1 e portanto, podemos aplicar o método de Bauwens & Laurent (2005). Calculemos inicialmente o primeiro momento absoluto da distribuição ST (0, 1, ν): M1 !− ν+1 Z ∞ 2 x2i 2Γ((ν + 1)/2) = x 1 + dxi i Γ(ν/2)(π(ν − 2))1/2 0 ν−2 = 2Γ((ν + 1)/2) (ν − 2) Γ(ν/2)(π(ν − 2))1/2 (ν − 1) √ Γ((ν − 1)/2) ν − 2 √ = . Γ(ν/2) π (2.16) Substituindo (2.16) na expressão (2.9) temos que o vetor de médias da versão assi- 24 2.2 Método Multivariado métrica da função de densidade (2.15) são formados pelos elementos: µi = (γi − Γ((ν γi−1 ) √ − 1)/2) ν − 2 √ . Γ(ν/2) π Por fim, da expressão (2.12) obtemos a distribuição de probabilidade t-Student assimétrica e padronizada (SST (0, Im , γ, ν), Standard Skew t-Student). p(z|γ, ν) = 2 √ π !m m Y γi σi 2 i=1 1 + γi ! Γ( ν+m ) z∗ z∗ 2 1 + Γ( ν2 )(ν − 2)m/2 ν−2 0 !− m+ν 2 , (2.17) sendo, σi e zi∗ dado pelas expressões (2.10) e (2.12), respectivamente. 2.2.3 GED A distribuição GED (Generalized Error Distribution) padronizada é escrita no caso univariado como: " p(x|k) = Γ(3/k) Γ(1/k) #1/2 exp − h i Γ(3/k) 2 k/2 x Γ(1/k) 2Γ((k + 1)/k) . (2.18) Essa distribuição generaliza a distribuição Normal podendo ter caudas mais leves (k > 2) ou mais pesadas (k < 2) do que a Normal Padrão (N (0, 1)) e se k = 2 obtemos a distribuição Normal. Algumas generalizações multivariadas da distribuição GED foram propostas na literatura, como por exemplo em Gómez et al. (1998) e Giller (2005), mas as marginais dessas distribuições são difíceis de obter, assim como os momentos absolutos das marginais. Por este motivo, neste trabalho optou-se por utilizar a distribuição conjunta de m variáveis aleatórias independentes, garantindo assim, que as marginais serão a distribuição apresentada em (2.18). Desta forma, a distribuição de probabilidade conjunta 25 2.2 Método Multivariado do vetor aleatório X = (X1 , . . . , Xm )0 é dada por: " p(x|k) = Γ(3/k) Γ(1/k) #m/2 exp − h i Γ(3/k) k/2 Γ(1/k) Pm k i=1 |xi | [2Γ((k + 1)/k)]m (2.19) . Como a distribuição (2.18) é padronizada, teremos E(X) = 0 e V ar(X) = Im e assim podemos utilizar o método de Bauwens & Laurent (2005) para inserir assimetria. Para facilitar a notação referiremos a distribuição GED Multivariada como GED(0, Im , k) e a distribuição resultante da aplicação do método e padronizada como SSGED(0, Im , γ, k) (Standard Skew GED). Calculemos inicialmente o primeiro momento absoluto da distribuição GED(0, 1, k): Γ(3/k) = 2 Γ(1/k) " M1 " = = Γ(3/k) Γ(1/k) #1/2 #1/2 Z ∞ 1 Γ(3/k) 2 x exp − x 2Γ((k + 1)/k) 0 Γ(1/k) " #k/2 dx 1 Γ((k + 1)/k)Γ(2/k) Γ((k + 1)/k) Γ(3/k) Γ(2/k) . [Γ(1/k)Γ(3/k)]1/2 (2.20) Logo, substituindo (2.20) na expressão (2.8) temos que o vetor de médias da versão assimétrica da função de densidade (2.19) é formado pelos elementos: µi = (γi − γi−1 ) Γ(2/k) , [Γ(1/k)Γ(3/k)]1/2 (2.21) para i = 1, . . . , m. Por fim, substituindo (2.19) em (2.11) temos a distribuição de probabilidade GED 26 2.2 Método Multivariado Assimétrica e Padronizada (SSGED(0, Im , γ, k), Standard Skew GED): p(z|γ) = 2m "m Y γi σ 2 i i=1 1 + γi #" Γ(3/k) Γ(1/k) #m/2 exp − h i Γ(3/k) k/2 Γ(1/k) Pm ∗ k i=1 |zi | (2/k)m [Γ(1/k)]m , (2.22) sendo µi , σi2 e zi∗ dados por (2.21), (2.10) e (2.12), respectivamente. Assim, como a distribuição SSN consiste em caso particular da SST , também consiste em um caso particular da SSGED, com k = 2. As distribuições de probabilidade apresentadas neste capítulo serão aplicadas no contexto de modelos GARCH univariados e multivariados, os quais serão apresentados em detalhes no Capitulo 3. Capítulo 3 Modelos GARCH Na modelagem estatística paramétrica de volatilidade, os modelos GARCH (Generalized Autoregressive Conditional Heteroscedasticity) estão entre os principais modelos empregados. O sucesso desses modelos deve-se principalmente à incorporação de certas características de dados financeiros em suas estruturas, tais como acomodação de caudas pesadas e autocorrelação entre os quadrados de retornos financeiros. É uma extensão natural considerar-se a modelagem simultânea de um conjunto de séries de retornos definindo-se modelos GARCH multivariados. Podemos estar interessados por exemplo em estudar as relações entre as volatilidades e co-volatilidades de vários mercados. Claramente, a construção de medidas de risco de um portfólio de ativos financeiros será influenciada pela estrutura de dependência entre as séries que compõem o portfólio. Neste capítulo serão apresentados o modelo GARCH univariado de Bollerslev (1986) e duas das principais extensões multivariadas, o CCC-GARCH de Bollerslev (1990) e o DCC-GARCH de Engle (2002). 27 28 3.1 Modelos Univariados 3.1 Modelos Univariados Considere y = {yt , t = 1, . . . , T } como uma série de retornos. O modelo GARCH(p,q) é definido como: q yt = t ht , t ∼ D(0, 1) ht = ω + p X i=1 2 αi yt−i + q X βj ht−j , (3.1) (3.2) j=1 sendo os t independentes e identicamente distribuídos e D(0, 1) uma distribuição de probabilidade com média zero e variância 1. Então ht é a variância condicional (não observável) de yt dada a informação prévia It = {yt−1 , yt−2 , . . . }. As restrições suficientes de positividade e estacionaridade de ht são ω > 0, αi ≥ 0, i = 1, . . . , p, βj ≥ 0, j = 1, . . . , q e Pp i=1 αi + Pq j=1 βj < 1. Considerando a esperança e a variância de yt dado It , temos: E[yt |It ] = q ht E[t |It ] = q ht E[t ] = 0 V ar[yt |It ] = E[yt2 |It ] = ht V ar[t ] = ht . (3.3) (3.4) Logo, podemos utilizar a equação (3.3) para calcular a esperança incondicional: E[yt ] = E[E[yt |It ]] = E[0] = 0. Considerando agora a equação (3.4) para calcular variância incondicional, temos: V ar[yt ] = E[yt2 ] = E[E[yt2 |It ]] = E[ht ]. (3.5) 29 3.1 Modelos Univariados Assumindo que a série y seja estacionária das equações (3.2) e (3.5) é fácil ver que E[yt2 ] = ω P 1− p i=1 αi + Pq j=1 βj . (3.6) Da equação (3.6), temos que, para existir a variância incondicional de yt é necessário que Pp i=1 αi + Pq j=1 βj < 1, justificando assim a restrição de estacionaridade do modelo. √ Como da expressão (3.1) temos que t = yt / ht , podemos escrever a fdp condicional do retorno yt em função da fdp de t . Obtemos assim, p(yt |It ) = (ht ) −1/2 q p (yt / ht ), (3.7) sendo p a função de densidade de probabilidade de t . Agora, podemos obter a função de verossimilhança do modelo substituindo (3.7) em (1.1). Logo, a função de verossimilhança do modelo será dada por: L(θ) = T Y q (ht )−1/2 p (yt / ht ), t=1 sendo θ = (ω, α1 , . . . , αp , β1 , . . . , βq )0 o conjunto de todos os parâmetros. Vale notar que mesmo se t ∼ N (0, 1) a distribuição incondicional de yt não é a Normal, em particular tendo caudas mais pesadas do que a Normal. No entanto, existe evidência na literatura de que muitas séries temporais financeiras tendem a ter a curtose observada ainda maior do que aquela implicada por um modelo GARCH com erros normais. Sendo assim, alguns autores têm proposto distribuições com caudas mais pesadas do que a Normal para os erros t . Por exemplo, a distribuição t-Student com ν graus de liberdade (Baillie & Bollerslev (1989), Ardia (2008)). Identificar a ordem de um modelo GARCH a ser ajustado a uma série pode ser difícil. Em Morettin (2008) recomenda-se a utilização de modelos de ordem baixa (por 30 3.1 Modelos Univariados exemplo: (1,1), (1,2), (2,1) e (2,2)) e escolhe-se o modelo com base em critérios, como o AIC (Akaike 1974) e o BIC (Schwarz 1978), entre outros. O autor também afirma, que na maioria das series financeiras um modelo GARCH(1,1) é o mais parcimonioso para descrever a volatilidade. Nesta dissertação, o desenvolvimento do algoritmo de estimação será focado no modelo GARCH(1,1), já que modelos GARCH de outras ordens podem ser estimados de forma semelhante. A distribuição de probabilidade dos erros será considerada na forma assimétrica apresentada no Capítulo 2, lembrando que para obter o caso simétrico basta fixar γ = 1. Sob o enfoque Bayesiano é necessário determinar a distribuição a priori dos parâmetros do modelo. Para os parâmetros do GARCH(1,1) utilizaremos as distribuições a priori propostas em Ardia (2006). Estás são normais truncadas no espaço paramétrico de cada um dos parâmetros, também assumiremos independência a priori entre os parâmetros, desta forma obtemos: ω ∼ N (µω , σω2 )I(ω>0) , α1 ∼ N (µα , σα2 )I(0<α<1) e β1 ∼ N (µβ , σβ2 )I(0<β<1) , sendo µω , µα , µβ , σω2 , σα2 e σβ2 hiperparâmetros. A notação N (µ, σ 2 )I(a<x<b) , com b > a, representa a função densidade de probabilidade: 1 (x − µ)2 1 ×√ , exp − φ(b) − φ(a) 2σ 2 2πσ 2 ! x ∈ (a, b), sendo φ(.) a função de densidade acumulada da distribuição normal com média µ e variância σ 2 . No caso, de utilizamos uma distribuição assimétrica, como as apresentadas no Capítulo 2, será necessário estimar o parâmetro assimetria, neste caso Fernandez & Steel (1998) propuseram usar uma distribuição a priori Gama(a, b) para γ 2 . A idéia é esco- 31 3.1 Modelos Univariados lher os valores de a e b de modo que E(γ) = 1. ba Z ∞ 2 1 = Eγ 2 (γ) = γ (γ 2 )a−1 e−bγ dγ 2 Γ(a) 0 ba Z ∞ 2 (a+0,5)−1 −bγ 2 2 = (γ ) e dγ Γ(a) 0 ba Γ(a + 0.5) = , Γ(a) ba+0.5 o que implica, b= Γ a+ 1 2 2 Γ(a) (3.8) . Considerando b como em (3.8) podemos fixar o valor de a controlando a variância a priori e a probabilidade a priori de γ ∈ (0, 1). Fixando a = 0, 5 obtemos b ≈ 0, 32, o que nos leva a V ar(γ) = π/2 − 1 ≈ 0, 57 e P (0 < γ < 1) ≈ 0, 58 o que parece ser uma escolha razoável. Além disso, esta particular escolha é equivalente a especificar γ ∼ N (0, 0, 64−1 )I(γ>0) , pois considerando Πγ e Πγ 2 como as densidades a priori de γ e γ 2 , respectivamente, temos: Πγ (γ|a = 0, 5, b = 0, 32) = 2γ × Πγ 2 γ 2 |a = 0, 5, b = 0, 32 ∝ γ (γ 2 )1/2−1 exp(−0, 32 γ 2 ) 1 0, 64 γ 2 2 ( ) γ2 ∝ exp − , γ ∈ (0, ∞). 2 (0, 64)−1 ∝ exp − Ainda, quando utilizarmos a distribuição SST (0, 1, γ, ν) apresentada em (2.17) ou SSGED(0, 1, γ, k) apresentada em (2.22) devemos estimar o parâmetro de cauda ν ou k, respectivamente. Neste caso, será utilizado ν ∼ N (µν , σν2 )I(ν>2) e k ∼ N (µk , σk2 )I(k>0) , sendo µν , µk , σν2 e σk2 hiperparâmetros. Vale lembrar que a utilização da distribuição de probabilidade Normal para as 32 3.2 Modelos Multivariados prioris, facilita a inserção de informação em uma determinada região de interesse através dos parâmetros µ e σ 2 da distribuição Normal (N (µ, σ 2 )), mesmo que no caso de truncamento esses hiperparâmetros não representem a média e a variância, mas ainda controlam a região de maior massa de probabilidade. A seguir apresentaremos os modelos multivariados e logo, em seguida apresentaremos dois algoritmos de simulação da distribuição a posteriori dos parâmetros que pode ser tanto usado para o modelo multivariado quando para o modelo univariado. 3.2 Modelos Multivariados Considere yt = (yt1 , . . . , yt,m )0 como sendo um vetor de retornos no instante t para m séries temporais. Assim, as extensões multivariadas dos modelos GARCH podem ser escritas como: 1/2 yt = Ht t , (3.9) 1/2 sendo Ht a matriz de covariâncias condicionais e Ht a matriz m×m positiva definida, obtida pela decomposição de Cholesky da matriz Ht . O vetor dos erros t tem ordem m × 1 e tem média e variância dado por: E(t ) = 0 V ar(t ) = Im , sendo, Im a matriz identidade de ordem m. Assim, temos que a média e a variância do vetor yt condicionado na informação 33 3.2 Modelos Multivariados prévia até o momento t (It = {yt−1 , yt−2 , . . .}), são dados por: 1/2 1/2 E(yt |It ) = E(Ht t |It ) = Ht E(t ) = 0 1/2 1/2 1/2 V ar(yt |It ) = V ar(Ht t |It ) = Ht V ar(t )(Ht )0 = Ht . Diversas formas de especificar a matriz Ht foram propostas na literatura. Neste trabalho, concentraremos em uma forma não linear de combinar GARCH univariados, os modelos CC-GARCH (Conditional Correlation GARCH). Outros modelos conhecidos na literatura são os modelos VEC de Bollerslev et al. (1988) e os modelos BEKK de Engle & Kroner (1995). Uma revisão das diversas formas de modelar a matriz de covariâncias condicionais pode ser encontrada em Bauwens et al. (2006). A primeira classe dos modelos CC-GARCH foi proposta em Bollerslev (1990), os modelos CCC-GARCH (Constant Condicional Correlation GARCH), os quais definem a matriz Ht como: Ht = Dt RDt , sendo, 1/2 1/2 Dt = diag(h11,t , . . . , hmm,t ), (3.10) e hii,t é definido como em um GARCH univariado de qualquer ordem. Assim, se especificarmos um GARCH(1,1) para cada variância condicional de Dt , teremos, hii,t = 2 ωi + α1,i yi,t−1 + β1,i hii,t−1 , com ωi > 0, αi ≥ 0, βi ≥ 0 e αi + βi < 1, para i = 1, . . . , m. A matriz de correlações R = {ρij }j=1,...,m i=1,...,m é simétrica e positiva definida com ρii = 1. Obviamente, ρij = ρji , logo, os parâmetros adicionais desse modelo serão todos ρij com i > j, para i, j = 1, . . . , m. Logo, é fácil ver que o número total de parâmetros desse modelo é m(m + 5)/2. Desta forma, o número de parâmetros cresce rapidamente de acordo com o número de séries, note que para 3 séries (m = 3), teremos 12 parâmetros, enquanto que para 5 séries (m = 5), teremos 25 parâmetros. 34 3.2 Modelos Multivariados Alguns modelos mais parcimoniosos foram propostos na literatura, sendo que Engle (2002) e Tse & Tsui (2002) independentemente propuseram um modelo CC-GARCH que considera que a matriz de correlações condicionais varie no tempo, este modelo é conhecido como DCC-GARCH (Dynamic Conditional Correlation GARCH). Adotando a abordagem de Engle (2002) a matriz de covariâncias é escrita como: Ht = Dt Rt Dt , sendo que, Dt é especificado como em (3.10) e Rt como: Rt = diag(Qt )−1/2 Qt diag(Qt )−1/2 Qt = (1 − a − b)R + aµt−1 µ0t−1 + bQt−1 , sendo µt = Dt−1 yt , R a matriz de covariâncias incondicionais de µt . As restrições de estacionaridade dos parâmetros adicionais são a > 0, b > 0 e a + b < 1. Além de modelar a correlação condicional com variação no tempo, o modelo DCCGARCH também possui a vantagem de acrescentar apenas dois parâmetros independentemente do número séries escolhidas. Sendo assim, se considerarmos o modelo GARCH(1,1) para cada variância condicional em Dt , o número de parâmetros do modelo será 3m + 2. Logo, se considerarmos 3 séries (m = 3) teremos 11 parâmetros e se considerarmos 5 séries (m = 5), teremos 17 parâmetros. Assim como nos modelos univariados a função densidade de probabilidade dos retornos nos modelos CC-GARCH pode ser obtida em função da densidade de probabilidade escolhida para os erros t . Considerando θ como o conjunto de todos os parâmetros do modelo, podemos escrever a distribuição conjunta dos retornos como produto das 35 3.2 Modelos Multivariados distribuições condicionais (θ foi omitido para simplificar a notação): p(y1 , . . . , yT |θ) = p(y1 )p(y2 |y1 )p(y3 |y2 , y1 ) . . . p(yT |IT ). (3.11) Da expressão (3.9), obtermos as distribuições condicionais dos retornos em função da distribuição dos erros: −1/2 p(yt |It ) = |Ht |−1/2 pt (Ht yt ), t = 1, . . . , T. (3.12) Assim, substituindo (3.12) em (3.11), obtemos a função de verossimilhança, que é dada por: L(θ) = p(y1 , . . . , yT ) = T Y −1/2 |Ht |−1/2 pt (Ht yt ). t=1 Para o modelo DCC-GARCH é fácil ver que: L(θ) = T Y t=1 "m # Y −1/2 hii,t |Rt |−1/2 pt (Dt Rt Dt )−1/2 yt . i=1 Sob o enfoque Bayesiano é necessário determinar a distribuição a priori dos parâmetros do modelo. A proposta adotada neste trabalho consiste em estender para os modelos multivariados a abordagem apresentada para os modelos univariados dos parâmetros da volatilidade (ω, α1 e β1 ) e para o parâmetro de assimetria (γ), apresentada na Seção 3.2. Para isso, assumiremos independência a priori estre os parâmetros do modelos. Desta forma obtemos: ωi ∼ N (µωi , σω2 i )I(ωi >0) , α1,i ∼ N (µαi , σα2 i )I(0<αi <1) , β1,i ∼ N (µβi , σβ2i )I(0<βi <1) , γi ∼ N (0, 0.64−1 )I(γ>0) , 36 3.3 Estimação dos Parâmetros para i = 1, . . . , m. Ainda nos resta determinar as prioris para os parâmetros da correlação a e b e no caso de assumirmos a distribuição dos erros do modelo SST (0, Im , γ, ν) ou SSGED(0, Im , γ, k), devemos determinar as prioris para os parâmetros de peso nas caudas. Seguindo, a mesma abordagem anterior utilizaremos as prioris: a ∼ N (µa , σa2 )I(0<a<1) , b ∼ N (µb , σb2 )I(0<b<1) , ν ∼ N (µν , σν2 )I(ν>2) , se t ∼ SST (0, Im , γ, ν), k ∼ N (µk , σk2 )I(k>0) , se t ∼ SSGED(0, Im , γ, k). Vale lembrar, que para m = 1, o modelo DCC-GARCH resulta no modelo GARCH 1/2 univariado. Pois neste caso, teríamos Dt = {h11,t } e Rt = {1}, resultando em Ht = {h11,t }. A seguir apresentaremos dois algoritmos para simulação da distribuição a posteriori dos parâmetros do modelo DCC-GARCH. 3.3 Estimação dos Parâmetros Neste trabalho serão considerados duas formas do algoritmo Metropolis-Hastings (apresentado na Seção 1.2.2) para simulação dos parâmetros da distribuição a posteriori do modelo DCC-GARCH(1,1), lembrando que, no caso particular m = 1 obtemos o modelo univariado GARCH(1,1). No primeiro algoritmo consideraremos que a atualização da cadeia é feita com um parâmetro por bloco e na segundo, consideraremos apenas um bloco contendo todos os parâmetros. Para podemos simular na reta, consideramos transformações em todos os parâmetros, tornando os reais como o espaço paramétrico de todos os parâmetros. A distribuição candidata será a distribuição Normal centrada no ultimo valor da cadeia, obtemos assim algoritmos Metropolis-Hastings do tipo passeio-aleatório. 37 3.3 Estimação dos Parâmetros Para simular da distribuição posteriori dos parâmetros consideramos as seguintes transformações paramétricas: Se a distribuição dos erros for a SST então φ1 = log(ν − 2) e se for a SSGED então φ1 = log(k), para os demais parâmetros, teremos φ2 = log(a/(1 + a)), φ3 = log(b/(1 + b)), φ4 = log(γ1 ), φ5 = log(ω1 ), φ6 = log(α1 /(1 + α1 )), φ7 = log(β1 /(1 + β1 )),. . ., φ4m = log(γm ), φ4m+1 = log(ωm ), φ4m+2 = log(αm /(1 + αm )), φ4m+3 = log(βm /(1 + βm )). A simulação na escala original dos parâmetros pode ser obtida facilmente tomando as transformações inversas. O primeiro caso do algoritmo Metropolis-Hastings que apresentaremos, consiste em um caso particular do algoritmo apresentado na Seção 1.2.2. Aqui consideraremos cada parâmetro como um bloco e todas as distribuições propostas como sendo a distribuição Normal centrada no estado atual da cadeia. Desta forma, podemos utilizar a variância de cada distribuição proposta para ajustar a taxa de aceitação do parâmetro correspondente. A esse caso particular, chamaremos de MH np-Blocos e será apresentado a seguir, considere np = 4m + 3 como o número de parâmetros. MH np-Blocos (0) 1. Fixar ou especificar valores iniciais para φi , para i = 1, . . . , np e faça j = 0. 2. Para i = 1 até i = np faça: Gere φ0i ∼ N (φ(j) , σφ2 i ) e u ∼ U (0, 1). (j) (j+1) Se u ≤ pφi (φ0i , φi ), então faça φi (j+1) = φ0i . Caso contrário, faça φi (j) = φi . 3. Faça j = j + 1 e volte para 2. (j) Sendo a probabilidade de aceitação pφi (φ0i , φi ) é dada como em (1.3), mas com a simplificação que neste caso, a razão da distribuição proposta se cancela. Lembramos, que neste caso a distribuição em questão é a posteriori de φi |φ(−i) a qual é proporcional 38 3.3 Estimação dos Parâmetros ao produto da função de verossimilhança com a priori de φi (π(φi )), isto é, (j) pφi (φ0i , φi ) = min 1, (j) π(φ0i |φi , y) (j) (j) π(φi |φi , y) , sendo, (j) (j+1) π(φ0i |φi , y) ∝ L(φ1 (j+1) (j) 0 , . . . , φi−1 , φ0i , φi+1 , . . . , φ(j) np ) π(φi ). Considerando φ = (φ1 , . . . , φnp )0 , temos que o espaço paramétrico é Rnp , lembrando que np é o número de parâmetros. Logo, podemos utilizar uma das formas mais eficientes computacionalmente do Metropolis-Hastings, o passeio aleatório com apenas um bloco (Chib & Greenberg 1995) , ou seja, a simulação de φ é feita gerando valores diretamente da distribuição Normal np-Variada com média no estado anterior da cadeia e matriz de covariâncias Σφ . Esse algoritmo é apresentado a seguir e referiremos a ele nos capítulos seguintes, como MH 1-Bloco. MH 1-Bloco (0) 1. Fixar ou especificar valores iniciais para φi , para i = 1, . . . , np e faça j = 0. 2. Gere φ0 ∼ Nnp (φ(j) , Σφ ) e u ∼ U (0, 1). 3. Se u ≤ pφ (φ0 , φ(j) ), então faça φ(j+1) = φ0 . Caso contrário, faça φ(j+1) = φ(j) . 4. Faça j = j + 1 e volte para 2. Como a distribuição geradora de φ0 escolhida é a Normal Multivariada com média φ(j) e a densidade em questão é a posteriori de φ, substituindo em (1.2) resultará em: π(φ0 |y) pφ (φ , φ ) = min 1, , π(φ(j) |y) ( 0 (j) ) 39 3.3 Estimação dos Parâmetros sendo, π(φ|y) = L(φ) np Y π(φi ). i=1 Em geral o algoritmo MH 1-Bloco além de mais eficiente computacionalmente, também gera resultados melhores do que o MH np-Bloco, mas este necessita da matriz de covariâncias Σφ . Apesar da escolha de Σφ ser livre, a convergência do algoritmo será mais rápida se utilizar a matriz de covariância dos parâmetros. Assim, uma estimativa para Σφ consiste no inverso da matriz de Informação de Fisher, mas no caso dos modelos GARCH essa matriz é difícil de ser obtida mesmo que numericamente. Deste modo, uma alternativa consiste em utilizaremos o algoritmo MH np-Bloco para obter uma amostra piloto da posteriori e com essa amostra estimar a matriz Σφ para em seguida utilizarmos o algoritmo MH 1-Bloco. As restrições de estacionaridade podem ser tratadas em ambos os algoritmos inserindo uma restrição na distribuição priori. Mas em geral mesmo que a simulação seja feita sem restrições o número de elementos da cadeia que não atende a restrição é baixo, de forma que um tratamento mais simples consiste em apenas retirar da simulação da posteriori os elementos que não atendem as restrições de estacionaridade. Tendo a Cadeia de Markov gerada da distribuição a posteriori dos parâmetros, as estimativa de Monte Carlo para uma característica g(.) de um determinado parâmetro θi é dada por: nc 1 X (j) [ g(θi ), g(θ ) = i nc j=1 sendo nc o tamanho da cadeia. A seguir apresentaremos um exemplo de aplicação dos modelos GARCH e DCCGARCH com as diferentes distribuições de probabilidade estudadas no Capítulo 2. Capítulo 4 Estudo de Simulação Neste capítulo será feito um estudo de simulação para verificar se alguns critérios conhecidos na literatura são adequados para selecionar o melhor modelo entre aqueles que estamos estudando nesta dissertação. Por conta do alto custo computacional envolvido neste processo, nós restringiremos o estudo aos modelos univariados. Para gerar os conjuntos de dados artificiais foi utilizado a linguagem R (R Development Core Team 2011) e para implementação do algoritmo de estimação foi utilizado a linguagem C. Para geração dos conjuntos de dados artificiais, foram considerados os modelos GARCH(1,1) com distribuição de probabilidade para os erros SSN , SST e SSGED, essas densidade foram apresentados no Capítulo 2. Para cada modelo, foram gerados conjuntos de dados de tamanho 500, 1000 e 2000. Para avaliarmos se os critério para seleção de modelos são capazes de distinguir entre modelos com erros simétrico e modelos com erros assimétricos, mesmo quando o grau de assimetria é pequeno, utilizamos na simulação dois valores para o parâmetro de assimetria γ = 0, 9 (pouco assimétrico) e γ = 0, 7 (mais assimétrico), veja a Figura 4.1. Os demais parâmetros foram fixados, os parâmetros da volatilidade foram fixados nos valores: ω = 0, 05, α1 = 0, 07 e β1 = 0, 88; para os modelos com erros SST o parâmetro ν foi fixado no valor 8 e para os 40 41 modelos com erros SSGED o parâmetro k foi fixado em 1, 3. Para cada configuração do modelo, foram geradas 200 replicas. (a) (b) −2 0 x 2 4 0.5 0.4 0.3 0.1 0.0 0.1 0.0 −4 γ = 1,0 γ = 0,9 γ = 0,7 0.2 p(x|γ) 0.3 0.4 0.5 γ = 1,0 γ = 0,9 γ = 0,7 0.2 p(x|γ) 0.3 0.0 0.1 0.2 p(x|γ) 0.4 0.5 γ = 1,0 γ = 0,9 γ = 0,7 (c) −4 −2 0 x 2 4 −4 −2 0 2 4 x Figura 4.1: Gráficos das densidades utilizadas para os erros do modelo GARCH(1,1) para gerar os dados artificiais: (a) SSN , (b) SST e (c) SSGED Para cada conjunto de dados artificiais foram ajustados os modelos GARCH(1,1) com erros assimétricos (SSN , SST e SSGED) e também com as respectivas distribuições simétricas, as quais serão referenciadas no texto como N , ST e GED. O ajuste foi feito utilizando o algoritmo MH np-Blocos, apresentado no Capítulo 3, foram geradas Cadeias de Markov de tamanho 30 mil, sendo que as primeiras 10 mil foram descartadas como amostra de aquecimento, com o restante foram obtidos os valores dos critérios para seleção de modelos. Os valores escolhidos para os hiperparâmetros das distribuições a priori são: µν = µk = µω = µα1 = µβ1 = 0 e σν2 = σk2 = σω2 1 = σα2 1 = σβ21 = 100. Desta forma, obtemos prioris com informação vaga em quase todo espaço paramétrico, exceto para o parâmetro de assimetria, para o qual foi utilizado a priori descrita no Capítulo 3. Os critérios para seleção de modelos avaliados foram 3, sendo que os dois primeiros consistem na média a posteriori dos critérios de informação de Akaike (EAIC) e do Bayesiano (EBIC), o terceiro é o Desvio de Informação (DIC). Esses critérios "penalizam" a função de verossimilhança do modelo de acordo com a sua complexidade, de 42 forma que os melhores modelos possuem maior valor da função de verossimilhança e menos parâmetros. Os critérios de Akaike (AIC) e Bayesiano (BIC) foram proposto em Akaike (1974) e Schwarz (1978), respectivamente, e são dados por: AIC(M ) = −2 log(LM (θ̂)) + 2npM , BIC(M ) = −2 log(LM (θ̂)) + npM log(n), sendo, M o modelo em questão, LM (θ̂) a função de verossimilhança de M calculado no vetor de parâmetros estimado θ̂, npM o número de parâmetros do modelo e n o número de observações da amostra. Valores menores do AIC e do BIC indicam o melhor modelo. Os critérios AIC e BIC são bastante utilizados para abordagens clássica. Sob a abordagem Bayesiana é preferível utilizarmos a estimativa da esperança a posteriori da \ função de verossimilhança (E(L M (θ))) no lugar da função de verossimilhança calculada no ponto estimado (LM (θ̂)), esses critérios são conhecidos como EAIC (Brooks 2002) e EBIC (Carlin & Louis 2001). O Critério de Desvio de Informação (DIC) foi proposto em Spiegelhalter et al. (2002) e é amplamente utilizado em inferência Bayesiana, especialmente quando métodos MCMC são considerados. O desvio é definido como D(θ) = −2 log(LM (θ)) e D̄ como a esperança a posteriori de D(θ), essa esperança é utilizada como uma medida da qualidade do ajuste do modelo com relação aos dados, quanto maior é o D̄, pior é o ajuste. O número efetivo de parâmetros é definido como pD = D̄ − D(θ̂). Desta forma, o critério DIC de um modelo M é calculado como: DIC(M ) = pD + D̄, valores menores do DIC indicam melhores modelos. As Tabelas 4.1, 4.2 e 4.3 apresentam a porcentagem de vezes que cada modelo foi 43 selecionado pelos critérios EAIC, EBIC e DIC, respectivamente. Nessas tabelas estão destacados em negrito a porcentagem de vezes que o modelo selecionado foi o mesmo que gerou os dados artificias. Note que em todas as linhas os valores em negrito sempre são os maiores, mas quando consideramos os conjuntos de dados de tamanho 500 a porcentagem de acertos dos critérios é menor do que ocorre para os conjuntos de dados de tamanhos 1000 e 2000. Durante o estudo nós notamos que para alguns conjuntos de dados de tamanho 500 a Cadeia de Markov gerada não convergia, o que sugere que deve-se utilizar conjuntos de dados maiores, o que em geral não é um problema quando trabalhos com séries temporais. Possivelmente, isto influenciou no desempenho dos critérios para seleção de modelos quando foram considerados conjuntos de dados de tamanho 500. Para os demais conjuntos de dados, não foi notado problemas de convergência. Descartando os conjuntos de dados de tamanho 500, podemos notar que todos os critérios tiveram bom desempenho para os conjuntos de dados provindos das distribuições com parâmetro de assimetria γ = 0, 7. Para os conjuntos de dados gerados com γ = 0, 9 os critérios também mostraram-se adequados, mas a sensibilidade para distinguir entre o modelo simétrico e o assimétrico mostrou-se aumentar quando o tamanho dos conjuntos de dados aumentam. 44 Tabela 4.1: Porcentagem de vezes que cada modelo foi selecionado pelo critério EAIC no estudo de simulação. Em destaque a porcentagem de vezes que o modelo selecionado foi o mesmo utilizado na geração dos dados. Dados Artificiais Modelos Ajustados Modelos N N ST GED SSN SST SSGED SSN (γ = 0, 7) 500 1000 2000 0,0% 0,0% 0,0% 0,0% 0,0% 0,0% 0,0% 0,0% 0,0% 95,0% 93,0% 92,0% 1,5% 2,0% 2,5% 3,5% 5,0% 5,5% SSN (γ = 0, 9) 500 1000 2000 23,5% 11,5% 1,0% 1,5% 0,5% 0,5% 1,0% 0,5% 1,0% 69,0% 81,5% 92,0% 2,5% 4,0% 2,5% 2,5% 2,0% 3,0% SST (γ = 0, 7) 500 1000 2000 0,0% 0,0% 0,0% 0,0% 0,0% 0,0% 0,0% 0,0% 0,0% 12,5% 1,0% 0,0% 77,5% 91,0% 96,5% 10,0% 8,0% 3,5% SST (γ = 0, 9) 500 1000 2000 5,5% 0,0% 0,0% 17,0% 12,5% 0,5% 2,5% 0,0% 0,0% 8,5% 1,5% 0,0% 58,5% 76,0% 93,5% 8,0% 10,0% 6,0% SSGED (γ = 0, 7) 500 1000 2000 0,0% 0,0% 0,0% 0,0% 0,0% 0,0% 0,0% 0,0% 0,0% 0,5% 0,0% 0,0% 22,5% 11,5% 6,0% 77,0% 88,5% 94,0% SSGED (γ = 0, 9) 500 1000 2000 0,0% 0,0% 0,0% 5,5% 1,0% 0,0% 14,0% 1,5% 0,0% 0,0% 0,0% 0,0% 21,0% 11,5% 4,0% 59,5% 86,0% 96,0% 45 Tabela 4.2: Porcentagem de vezes que cada modelo foi selecionado pelo critério EBIC no estudo de simulação. Em destaque a porcentagem de vezes que o modelo selecionado foi o mesmo utilizado na geração dos dados. Dados Artificiais Modelos Ajustados Modelos N N ST GED SSN SST SSGED SSN (γ = 0, 7) 500 1000 2000 0,0% 0,0% 0,0% 0,0% 0,0% 0,0% 0,0% 0,0% 0,0% 100,0% 100,0% 98,5% 0,0% 0,0% 1,0% 0,0% 0,0% 0,5% SSN (γ = 0, 9) 500 1000 2000 25,0% 12,5% 2,5% 0,0% 0,0% 0,0% 0,5% 0,0% 0,5% 73,0% 87,5% 97,0% 1,0% 0,0% 0,0% 0,5% 0,0% 0,0% SST (γ = 0, 7) 500 1000 2000 0,0% 0,0% 0,0% 0,0% 0,0% 0,0% 0,0% 0,0% 0,0% 40,0% 11,0% 0,5% 51,5% 81,5% 96,0% 8,5% 7,5% 3,5% SST (γ = 0, 9) 500 1000 2000 9,5% 0,5% 0,0% 12,5% 11,5% 0,5% 2,5% 0,0% 0,0% 24,5% 6,5% 0,0% 44,5% 72,5% 93,5% 6,5% 9,0% 6,0% SSGED (γ = 0, 7) 500 1000 2000 0,0% 0,0% 0,0% 0,0% 0,0% 0,0% 0,0% 0,0% 0,0% 5,0% 0,5% 0,0% 21,0% 11,5% 6,0% 74,0% 88,0% 94,0% SSGED (γ = 0, 9) 500 1000 2000 1,5% 0,0% 0,0% 4,5% 1,0% 0,0% 12,5% 1,5% 0,0% 5,5% 0,5% 0,0% 18,5% 11,5% 4,0% 57,5% 85,5% 96,0% 46 Tabela 4.3: Porcentagem de vezes que cada modelo foi selecionado pelo critério DIC no estudo de simulação. Em destaque a porcentagem de vezes que o modelo selecionado foi o mesmo utilizado na geração dos dados. Dados Artificiais Modelos Ajustados Modelos N N ST GED SSN SST SSGED SSN (γ = 0, 7) 500 1000 2000 0,0% 0,0% 0,0% 0,0% 0,0% 0,0% 0,0% 0,0% 0,0% 84,5% 88,5% 88,5% 8,5% 5,0% 4,5% 7,0% 6,5% 7,0% SSN (γ = 0, 9) 500 1000 2000 36,0% 17,5% 4,0% 6,0% 1,0% 1,0% 2,0% 1,5% 2,0% 47,5% 67,5% 83,5% 6,0% 9,0% 4,0% 2,5% 3,5% 5,5% SST (γ = 0, 7) 500 1000 2000 0,0% 0,0% 0,0% 0,0% 0,0% 0,0% 0,0% 0,0% 0,0% 7,0% 0,0% 0,0% 85,5% 92,5% 96,5% 7,5% 7,5% 3,5% SST (γ = 0, 9) 500 1000 2000 4,0% 0,0% 0,0% 30,0% 17,0% 1,5% 3,5% 1,0% 0,0% 5,5% 1,0% 0,0% 52,0% 72,5% 93,5% 5,0% 8,5% 5,0% SSGED (γ = 0, 7) 500 1000 2000 0,0% 0,0% 0,0% 0,0% 0,0% 0,0% 0,0% 0,0% 0,0% 0,5% 0,0% 0,0% 32,5% 13,5% 6,0% 67,0% 86,5% 94,0% SSGED (γ = 0, 9) 500 1000 2000 0,0% 0,0% 0,0% 12,0% 2,0% 0,0% 17,5% 5,0% 0,5% 0,0% 0,0% 0,0% 22,5% 10,5% 4,0% 48,0% 82,5% 95,5% Capítulo 5 Aplicação Apresentaremos nesse capítulo dois exemplos de aplicação do modelo DCCGARCH(1,1), um univariado e um multivariado, lembrando que no caso univariado o modelo DCC-GARCH(1,1) corresponde ao modelo GARCH(1,1). Para o termo de erro do modelo são consideradas as distribuições de probabilidade SSN (0, Im , γ), SST (0, Im , γ, ν) e SSGED(0, Im , γ, k) apresentadas no Capítulo 2, sendo m o número de séries modelas. Também utilizaremos os casos simétricos dessas distribuições, considerando apenas γi = 1 para i = 1, . . . , m. As distribuições simétricas serão referidas como N , ST e GED. A inferência dos modelos é feita sob a abordagem Bayesiana utilizando MCMC. As Cadeias de Markov são geradas em 2 etapas utilizando os algoritmos apresentados na Seção 3.3. Na primeira etapa é utilizado o algoritmo MH np-Blocos para gerar uma Cadeia de Markov inicial, essa cadeia é então utilizada para estimar a matriz de covariâncias dos parâmetros Σnp . A segunda etapa consiste em utilizar o algoritmo MH 1-Bloco para gerar uma segunda Cadeia de Markov. Dessa segunda cadeia são obtidas as estimativas de Monte Carlo. A implementação dos algoritmos de simulação foi feita em linguagem C e as análises das Cadeias de Markov foram feitas no software 47 48 R (R Development Core Team 2011). Todas as simulações foram feitas utilizando um computador equipado com processador core 2 duo de 2,0 GHz, 3 GB de memória RAM e utilizando o sistema operacional Windows 7. Os valores escolhidos para os hiperparâmetros das distribuições a priori são: µν = µk = µa = µb = µωi = µαi = µβi = 0 e σν2 = σk2 = σa2 = σb2 = σω2 i = σα2 i = σβ2i = 100, para i = 1, . . . , m. Desta forma, obtemos prioris com informação vaga em quase todo espaço paramétrico, exceto para os parâmetros de assimetria, os quais utilizam as prioris descritas no Capítulo 3. As Cadeias de Markov geradas na primeira etapa são de tamanho 15 mil, sendo as primeiras 5 mil descartadas como amostra de aquecimento. Na segunda etapa para os modelos univariados são geradas cadeias de tamanho 50 mil, sendo as primeiras 20 mil descartadas, nos modelos multivariados são geradas cadeias de tamanho 200 mil, sendo as primeiras 30 mil descartadas. As cadeias resultantes são considerados com intervalos de 5 em 5, obtendo assim as simulações finais de tamanho 6 mil para os modelos univariados e de 34 mil para os modelos multivariados. Para o conjunto de dados univariado, o tempo computacional de cada modelo foi inferior a 1 minuto e para o conjunto de dados multivariado o tempo computacional de cada modelo foi inferior a 10 minutos. Para seleção dos melhores modelos são considerados os critérios EAIC, EBIC e DIC, apresentados em detalhes no Capítulo 4. A seguir utilizaremos as distribuições simétricas e assimétricas para os erros dos modelos GARCH(1,1) e os aplicaremos a um conjunto de dados reais para assim selecionaremos o melhor modelo com base nos critérios mencionados. 49 5.1 Modelo Univariado 5.1 Modelo Univariado O conjunto de dados utilizado consiste nos retornos diários do Índice da Bolsa de Valores de São Paulo (IBOVESPA), os retornos considerados foram multiplicados por 100 e partem do dia 02/01/2001 até o dia 28/12/2007, totalizando 1750 observações. Os gráficos da série, dos retornos, das autocorrelações dos retornos e das autocorrelações dos retornos ao quadrado são apresentados na Figura 5.1. Observe que mesmo tendo uma forte tendencia de crescimento na série (gráfico (a)) os retornos (gráfico (b)) não apresentaram autocorrelações (gráfico (c)). Por outro lado, os retornos ao quadrado possuem autocorrelação para algumas defasagens (gráfico (d)), vimos no Capítulo 1 que essas características são comuns em retornos de séries temporais financeiras. As estimativas das médias a posteriori dos parâmetros de cada modelo estão disponíveis nas Tabelas de A.1 à A.6 do Apêndice A. A Tabela 5.1 apresenta a média a posteriori dos critérios de Akaike e Bayesino (EAIC e EBIC) e o critério de desvio de informação (DIC). Pela Tabela 5.1, temos que o modelo com erros SST foi selecionado pelos três critérios. Tendo o modelo SST sido selecionado como o melhor modelo, nas próximas análises será utilizado apenas este modelo. Tabela 5.1: Critérios para seleção dos modelos univariados. Modelo N ST GED SSN SST SSGED EAIC 6913,49 6889,27 6891,98 6895,22 6877,23 6880,98 EBIC 6929,89 6911,14 6913,85 6917,09 6904,57 6908,32 DIC 6910,09 6884,76 6887,54 6890,93 6871,63 6875,72 Para testar as hipóteses de não autocorrelação dos resíduos assim como dos resíduos 50 5.1 Modelo Univariado (b) 5 −5 −10 1000 1500 0 5 10 1000 Tempo Tempo (c) (d) ACF 0 500 15 Lag 20 25 30 1500 0.0 0.2 0.4 0.6 0.8 1.0 500 0.0 0.2 0.4 0.6 0.8 1.0 0 ACF 0 Retornos 50 40 30 10 20 Observações 60 (a) 0 5 10 15 20 25 30 Lag Figura 5.1: Série do IBOVESPA de 02/01/2001 até 28/12/2007. (a) Gráfico da série; (b) Gráfico dos retornos; (c) Gráficos das autocorrelações dos retornos e (d) Gráfico das autocorrelações do quadrado dos retornos. ao quadrado é comum a utilização do teste de Box-Ljung. Aplicando esse teste com defasagem igual a 20 aos resíduos do modelo com erros SST obtivemos a estatística χ2 = 20, 50, resultando em um p-valor igual 0, 42. O mesmo teste foi aplicado aos resíduos ao quadrado, a estatística foi χ2 = 19, 55 e o p-valor igual a 0, 48. Desta forma, com nível de significância 0, 05 a hipótese dos resíduos serem não autocorrelacionados não foi rejeitada, assim como a hipótese dos resíduos ao quadrado serem não autocorrelacionados. A Figura 5.2 apresenta no gráfico da esquerda o histograma dos resíduos com a distribuição de probabilidade sobreposta, no gráfico da direita é apresentado o qqplot dos quantis dos resíduos com os quantis teóricos da densidade SST , utilizando os valores estimados para os parâmetros de peso nas caudas (ν) e de assimetria (γ). 51 0.0 2 0 −4 −2 Quantis Teóricos 0.4 0.3 0.2 0.1 f(x) ● 4 0.5 5.1 Modelo Univariado ● ● ●● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ●● ●● ● ● ● ● −6 −4 −2 0 2 4 6 x −4 −2 0 2 Quantis amostrais Figura 5.2: A esquerda o histograma dos resíduos com a distribuição de probabilidade dos erros sobreposta e a direita o gráfico qqplot dos resíduos do modelo com erros SST . Uma das vantagens na utilização da abordagem Bayesiana é que podemos analisar a distribuição a posteriori dos parâmetros ou mesmo de uma função dos parâmetros. Assim podemos analisar a distribuição da persistência da volatilidade (α + β). A Figura 5.3 apresenta no gráfico direito a distribuição da persistência da volatilidade e no gráfico esquerdo a distribuição do parâmetro de assimetria (γ) para o modelo GARCH com erros SST . Nestes gráficos, temos que os retornos da série do IBOVESPA apresentaram assimetria a esquerda, veja que praticamente toda a massa de probabilidade do γ está a esquerda do 1,0 (valor de simetria). A série também apresentou um alto grau de persistência na volatilidade, observe que aproximadamente toda a massa de probabilidade está entre 0,90 e 1,0, sendo 1,0 o valor máximo. Os traço da Cadeia de Markov, as densidades aproximadas e os gráficos das autocorrelações de todos os parâmetros do modelo GARCH(1,1) com erros SST podem ser observados na Figura B.1 do Apêndice B. A Figura 5.4 apresenta o gráfico das volatilidades estimadas pelo modelo com erros SST , lembre que estamos utilizando os retornos multiplicados por 100 e portanto as volatilidades estão multiplicadas por 10000. 52 5.1 Modelo Univariado (b) 0 0 2 5 4 6 8 10 15 20 25 12 (a) 0.80 0.90 1.00 0.85 gamma 0.90 0.95 1.00 alpha_1 + beta_1 10 8 6 2 4 Volatilidades 12 14 Figura 5.3: (a) Densidade a posteriori do parâmetro de assimetria (γ) e (b) densidade a posteriori da persistência (α1 + β1 ), para o modelo com erros SST . 0 500 1000 1500 tempo Figura 5.4: Gráfico das volatilidades estimadas pelo modelo GARCH(1,1) com erros SST e intervalo com 95% de credibilidade. 53 5.2 Modelo Multivariado 5.2 Modelo Multivariado Como exemplo de aplicação do modelo multivariado serão utilizados os retornos diários do índices das bolsas de valores de Frankfurt(DAX), Paris(CAC40) e Tokio(Nikkei) no período de 04/10/1991 à 30/12/1997, totalizando 1627 dias observados. Esses dados estão disponíveis em http://robjhyndman.com/tsdldata/data/FVD1.dat. Na Figura 5.5 são apresentados os gráficos das séries na primeira coluna e dos respectivos retornos na segunda coluna. Os retornos considerados neste exemplo estão multiplicados por 100. DAX 5 0 −5 Retornos 3000 1500 Observações 4500 DAX 1000 1500 0 500 1000 Tempo Tempo CAC40 CAC40 1500 2 −4 0 Retornos 4 6 3000 500 2000 Observações 0 500 1000 1500 0 500 1000 Tempo Tempo NIKKEI NIKKEI 1500 2 −6 −2 Retornos 20000 14000 Observações 6 0 0 500 1000 Tempo 1500 0 500 1000 1500 Tempo Figura 5.5: Gráficos da série e dos retornos dos índices DAX, CAC40 e NIKKEI. 54 5.2 Modelo Multivariado A Figura 5.6 apresenta na primeira coluna as autocorrelações dos retornos e na segunda coluna as autocorrelações no quadrado dos retornos. Observe que, assim como ocorreu com índice IBOVESPA no exemplo do modelo univariado, aqui também temos as series dos retornos sem autocorrelação, mas as séries dos retornos ao quadrado com autocorrelação. 0.0 5 10 15 20 0 10 Lag CAC40 CAC40 20 15 20 15 20 0.8 15 0.0 0.4 ACF 0.4 0.0 10 15 20 0 5 10 Lag Lag NIKKEI NIKKEI 0.0 0.0 0.4 ACF 0.8 5 0.8 0 0.4 ACF 5 Lag 0.8 0 ACF 0.4 ACF 0.4 0.0 ACF 0.8 DAX 0.8 DAX 0 5 10 Lag 15 20 0 5 10 Lag Figura 5.6: Autocorrelações dos retornos (primeira coluna) e dos retornos ao quadrado (segunda coluna) dos índices DAX, CAC40 e NIKKEI. As estimativas dos modelos estão nas Tabelas de A.7 à A.12 do Apêndice A. A Tabela 5.2 apresenta os critério de seleção de modelos obtidos pelo modelo multivariado para cada uma das distribuições de probabilidade para os erros estudadas. Nesta tabela podemos notar que os critérios EAIC e DIC selecionaram o modelo com erros SST como 55 5.2 Modelo Multivariado sendo melhor e o critério EBIC selecionou o modelo com erros ST . Como o modelo com erros SST foi selecionado pela maioria dos critérios, nas próximas análises será utilizado apenas esse modelo. Tabela 5.2: Critérios para seleção dos modelos multivariados. Modelos N ST GED SSN SST SSGED EAIC 13969,37 13823,24 13841,78 13962,56 13819,53 13839,34 EBIC 14028,71 13887,97 13906,52 14038,09 13900,45 13920,25 DIC 13957,53 13810,36 13828,97 13947,62 13803,32 13823,48 Aplicando o teste de Ljung-Box com defasagem igual a 20 aos resíduos marginais ao quadrado para cada uma das séries, obtivemos as estatísticas 9, 44, 25, 81 e 6, 97 resultando em p-valores iguais a 0, 97, 0, 17 e 0, 99 para as séries DAX, CAC40 e NIKKEI, respectivamente. Desta forma, com nível de significância 0, 05 a hipótese nula de não autocorrelação nos resíduos ao quadrado não foi rejeitada para nenhuma série. A Figura 5.2 apresenta na coluna esquerda os histogramas dos resíduos com o gráfico da distribuição de probabilidade marginal sobreposta, na coluna da direita são apresentados os gráficos qqplots dos quantis dos resíduos com os quantis teóricos das respectivas distribuições de probabilidade maginais. A distribuição da posteriori da assimetria presente em cada uma das séries podem ser analisadas na coluna esquerda da Figura 5.8, juntamente com as respectivas persistências na coluna direita. Neste caso, temos que apenas os retornos da série DAX apresentaram um significativo grau de assimetria, observe que o 1, 0 está fora da massa de probabilidade. Para todas as série, a volatilidade apresentou um alto grau de persistência, observe que a massa de probabilidade concentrou-se acima de 0, 90 nos três gráficos. Os traço da Cadeia de Markov, as densidades aproximadas e os gráficos das autocorrelações de todos os parâmetros do modelo DCC-GARCH(1,1) com erros SST 56 5.2 Modelo Multivariado DAX DAX −6 −4 −2 0 2 4 2 4 −2 −6 f(x) 0.0 0.2 0.4 Quantis Teóricos ● ● ●●● ●● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●●●● ● ●●● ● ● ●● ● ●● ● ●● ● ● ● ● ● ● 6 −4 −2 0 2 x Quantis amostrais CAC40 CAC40 4 −6 −4 −2 0 2 4 4 2 0 −4 f(x) 0.0 0.2 0.4 Quantis Teóricos ● ●● ● ●● ●● ● ● ●●● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ●● ● ●●● ● 6 −4 −2 0 2 x Quantis amostrais NIKKEI NIKKEI 4 4 2 0 ● ● −4 f(x) 0.0 0.2 0.4 Quantis Teóricos ● ● ● ●● ● ●●● ● ● ●● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ●● ● −6 −4 −2 0 x 2 4 6 −6 −4 −2 0 2 4 6 Quantis amostrais Figura 5.7: Histogramas dos resíduos com as respectivas distribuições marginais sobrepostas na coluna esquerda e gráficos qqplots dos resíduos na coluna da direita: modelo com erros SST . podem ser observados nas Figuras B.2 a B.5 do Apêndice B. 5.2 Modelo Multivariado 57 Figura 5.8: Densidade a posteriori dos parâmetros de assimetrias (γ) e das persistências (α1 + β1 ) do modelo com erros SST . 58 5.2 Modelo Multivariado 12 8 4 0 Volatilidades DAX 0 500 1000 1500 1000 1500 1000 1500 tempo 4 3 2 1 Volatilidades 5 CAC40 0 500 tempo 8 4 0 Volatilidades 12 NIKKEI 0 500 tempo Figura 5.9: Gráfico das volatilidades estimadas pelo modelo DCC-GARCH(1,1) com erros SST e intervalo com 95% de credibilidade. Capítulo 6 Considerações Finais e Conclusão Nesta dissertação estudamos o modelo GARCH e uma de suas generalizações multivariadas, o modelo Dynamic Condicional Correlation GARCH (DCC-GARCH). Na literatura, as distribuições de probabilidade mais utilizadas para os erros do modelo GARCH, assim como as versões multivariadas para os erros do modelo DCC-GARCH, são a Normal, a t-Student e a GED, em suas versões padronizadas. Para essas distribuições de probabilidade no Capítulo 2 aplicamos o método apresentado em Bauwens & Laurent (2005) para inserir assimetria e obtivemos assim versões assimétricas dessas distribuições. A utilização de distribuições de probabilidade assimétricas para os erros dos modelos GARCH consiste em uma alternativa para modelar o grau de assimetria presente na volatilidade dos retornos de uma determinada série. A abordagem Bayesiana para estimação desses modelos traz algumas vantagens, como facilidade de interpretação e possibilidade de inserir informação a priori para os parâmetros, mas está é pouco utilizada na literatura. Assim, como contribuição, no Capítulo 3 fizemos o desenvolvimento de dois algoritmos Metropolis-Hastings para simular da distribuição a posteriori dos parâmetros. Pela grande quantidade de cálculos matemáticos e loops envolvidos nesses algoritmos foi necessária a utilização de uma 59 60 linguagem de baixo nível para a implementações. Optou-se então pela linguagem C, a qual é considerada uma das linguagens mais eficientes para este tipo de aplicação. O programa e o código fonte podem ser solicitados diretamente ao autor. No Capítulo 4 foi feito um estudo de simulação com dados univariados, no qual pudemos obter um indicativo de que os critérios EAIC, EBIC e DIC são adequados para distinguir entre os diversos modelos que trabalhamos nesta dissertação. Um exemplo de aplicação do modelo GARCH e do modelo DCC-GARCH utilizando todas as distribuições de probabilidade estudadas nessa dissertação foi apresentada no Capítulo 5. Neste exemplo e em outros testes preliminares os algoritmos com implementação em linguagem C mostraram-se eficientes para gerar amostras da distribuição a posteriori, gerando Cadeias de Markov longas (no Capítulo 5 foram geradas 50 mil para o GARCH e 200 mil para o DCC-GARCH) em tempos computacionais aceitáveis (inferior a 1 minuto para o GARCH e inferior a 10 minutos para o DCC-GARCH). Pelos critérios de seleção de modelos pudemos notar a melhor adequação dos modelos quando utilizam uma distribuição de probabilidade assimétrica para os erros, sendo que nesses exemplos os modelos GARCH e DCC-GARCH selecionados, foram os que utilizavam a distribuição de probabilidade SST (Standard Skew t-Student). Como proposta de trabalhos futuros destacamos: 1. Estudo de simulação com os modelos multivariados; 2. Comparação dos modelos utilizando a estimava do VaR (Valor em Risco); 3. Utilização das distribuições assimétricas obtidas no Capítulo 2 para os modelos de Volatilidade Estocástica Multivariados. Referências Akaike, H. (1974). A new look at the statistical model identification. IEEE Transactions on Automatic Control 19 (6), 716–723. Ardia, D. (2006). Bayesian estimation of the GARCH(1,1) model with normal innovations. Student 5 (3-4), 283–298. Ardia, D. (2008). Financial Risk Management with Bayesian Estimation of GARCH Models: Theory and Applications, Volume 612 of Lecture Notes in Economics and Mathematical Systems. Springer-Verlag. Ardia, D. (2009). Bayesian estimation of a Markov-switching threshold asymmetric GARCH model with Student-t innovations. Econometrics Journal 12 (1), 105– 126. Ardia, D. (2011). bayesGARCH: Bayesian Estimation of the GARCH(1,1) Model with Student-t Innovations in R. version 1-00.08. Ausin, M. C. & Galeano, P. (2007). Bayesian estimation of the Gaussian mixture GARCH model. Computational Statistics and Data Analysis 51, 2636–2652. Azzaline, A. & Capitanio, A. (2003). Distributions generated by perturbations of symmetry with emphasis on a multivariate skew-t distribution. Journal of the Royal Statistical Society B (65), 367–389. Azzalini, A. (1985). A class of distribubutions which includes the normal ones. Scandinavian Journal of Statistics (12), 171–178. 61 REFERÊNCIAS 62 Baillie, R. & Bollerslev, T. (1989). The message in daily exchange rates: A conditional variance tale. Journal of Business and Economic Statistics 7 (3), 297–305. Barossi-Filho, M., Achcar, J. & Souza, R. (2010). Modelos de volatilidade estocástica em séries financeiras: uma aplicação para o IBOVESPA. Economia Aplicada 14 (1), 25–40. Bauwens, L. & Laurent, S. (2005). A new class of multivariate skew densities, with application to generalized autoregressive conditional heteroscedasticity models. Journal of Business and Economic Statistics 23, 346–354. Bauwens, L., Laurent, S. & Rombouts, J. V. K. (2006). Multivariate GARCH models: a survey. Journal of Applied Econometrics 21 (1), 79–109. Bauwens, L., Preminger, A. & Rombouts, V. K. (2008). Theory and inference for a Markov switching GARCH model. Technical report, CORE Discussion Paper 2007/55. Bollerslev, T. (1986). Generalized autoregressive conditional heteroskedasticity. Journal of Econometrics 31, 307–327. Bollerslev, T. (1990). Modeling the coherence in short-run nominal exchange rates: a multivariate generalized arch model. Review of Economics and Statistics 72, 498–505. Bollerslev, T., Engle, R. F. & Wooldridge, J. M. (1988). A capital asset pricing model with time varying covariances. Journal of Political Economy (96), 116–131. Branco, M. & Dey, D. (2001). A class of multivariate skew-elliptical distribution. Journal of Multivariate Analysis (79), 79–113. Brooks, S. P. (2002). Discussion on the paper by Spiegelhalter, Best,Carlin, and van der Linde (2002). Journal of the Royal Statistical Society B 64, 616–618. Cappuccio, N., Lubian, D. & Raggi, R. (2004). MCMC Bayesian estimation of a REFERÊNCIAS 63 skew-GED stochastic volatility model. Studies in Nonlinear Dynamics and Econometrics 8 (2). Carlin, B. P. & Louis, T. A. (2001). Bayes and Empirical Bayes Methods for Data Analysis (second ed.). Boca Raton: Chapman & Hall/CRC. Casella, G. & George, R. (1992). Explaining the Gibbs sampler. The American Statistician 46 (3), 167–174. Chib, S. & Greenberg, E. (1995). Understanding the Metropolis-Hastings algorithm. The American Statistician 49 (4), 327–335. Ding, Z., Granger, C. & Engle, R. (1993). A long memory property of stock market returns and a new model. Journal of Empirical Finance 1 (1), 83–106. Engle, R. (1982). Autoregressive conditional heterokedasticity with estimates of the variance of U.K. inflation. Econometrica 55, 987–1008. Engle, R. F. (2002). Dynamic conditional correlation - a simple class of multivariate GARCH models. Journal of Business and Economic Statistics 20, 339–350. Engle, R. F. & Kroner, F. K. (1995). Multivariate simultaneous generalized arch. Econometric Theory (11), 122–150. Fernandez, C. & Steel, M. (1998). On bayesian modeling of fat tails and skewness. Journal of the American Statistical Association 93 (441), 359–371. Giller, G. (2005). A generalized error distribution. Guiller Investments, 1–7. 20031222/1. Glosten, L., Jagannathan, R. & Runkle, D. (1993). Relationship between the expected value and the volatility of the nominal excess return on stocks. Journal of Finance 48, 1779–1801. Gómez, E., Gómez-Villegas, M. & Marín, J. (1998). A multivariate generalization of the power exponential family of distributions. Communications in Statistics - REFERÊNCIAS 64 Theory and Methods 27 (3), 598–600. Jacquier, E., Polson, N. & Rossi, P. (1994). Bayesian analysis of stochastic volatility models. Journal of Business and Economic Statistics 12, 371–418. Jones, M. C. & Faddy, M. J. (2003). A skew extension of the t-distribution, with applications. Journal of the Royal Statistical Society B (65), 159–174. Kim, S., Shepard, N. & Chib, S. (1998). Stochastic volatility: likelihood inference comparison with ARCH models. Review of Economic Studies 65, 361–393. Laurent, S. (2004). Analytical derivates of the APARCH Model. Computational Economics 24, 51–57. 10.1023/B:CSEM.0000038851.72226.76. Liesenfeld, R. & Jung, R. C. (2000). Stochastic volatility models: conditional normality versus heavy-tailed distributions. Journal of Applied Econometrics 15, 137–60. Lynch, S. (2007). Introduction to Applied Bayesian Statistics and Estimation for Social Scientists. Springer. Morettin, P. (2008). Econometria Financeira - Um Curso em Séries Temporais Financeiras. Edgar Blucher. Nakatsuma, T. (1998). A Markov-chain sampling algorithm for GARCH models. Studies in Nonlinear Dynamics and Econometrics 3 (2), 107–117. Nelson, D. (1991). Conditional heteroskedasticity in asset returns: A new approach. Econometrica 59, 347–370. Pipien, M. (2006). Bayesian comparison of GARCH processes with skewness mechanism in conditional distributions. Acta Physica Polonica 37 (11), 3105–3121. R Development Core Team (2011). R: A Language and Environment for Statistical Computing. Vienna, Austria: R Foundation for Statistical Computing. REFERÊNCIAS 65 Schwarz, G. (1978). Estimating the dimension of a model. Annals of Statistics 6 (2), 461–464. Spiegelhalter, D. J., Best, N. G., Carlin, B. P. & Van der Linde, A. (2002). Bayesian measures of model complexity and fit. Journal of the Royal Statistical Society B 64, 583–639. Taylor, S. (1982). Financial returns modelled by the product of two stochastic processes-a study of the daily sugar prices 1961-75. In O. Anderson (Ed.), Time Series Analysis: Theory and Practice, Volume 1, pp. 203–226. Tierney, L. (1994). Markov chains for exploring posterior distributions. The Annals of Statistics 22 (4), 1701–1728. Tse, Y. K. & Tsui, A. K. C. (2002). A multivariate GARCH model with time-varying correlations. Journal of Business and Economic Statistics 20, 351–362. Apêndice A Estimativa Bayesiana dos parâmetros dos modelos Tabela A.1: Estimativas do GARCH univariado com erros N . Parâmetros Média ω 0,1478 α 0,0591 β 0,8944 Desv. Pad. Perc. (2,5%) 0,0559 0,0663 0,0119 0,0387 0,0253 0,8363 Mediana 0,1384 0,0581 0,8974 Perc. (97,5%) 0,2793 0,0850 0,9353 Tabela A.2: Estimativas do GARCH univariado com erros SSN . Parâmetros γ ω α β Média 0,8651 0,1380 0,0557 0,9014 Desv. Pad. Perc. (2,5%) 0,0285 0,8095 0,0498 0,0612 0,0119 0,0360 0,0237 0,8468 66 Mediana 0,8642 0,1308 0,0544 0,9039 Perc. (97,5%) 0,9242 0,2568 0,0822 0,9403 67 Tabela A.3: Estimativas do GARCH univariado com erros ST . Parâmetros Média Desv. Pad. ω 0,1271 0,0552 α 0,0550 0,0130 β 0,9060 0,0260 ν 10,4553 2,2843 Perc. (2,5%) 0,0491 0,0336 0,8415 7,0148 Mediana 0,1158 0,0536 0,9099 10,1673 Perc. (97,5%) 0,2609 0,0869 0,9450 16,1046 Tabela A.4: Estimativas do GARCH univariado com erros SST . Parâmetros Média Desv. Pad. γ 0,8797 0,0298 ω 0,1242 0,0536 α 0,0541 0,0124 β 0,9088 0,0244 ν 11,3308 2,8419 Perc. (2,5%) 0,8219 0,0472 0,0343 0,8496 7,2843 Mediana 0,8794 0,1145 0,0528 0,9125 10,8319 Perc. (97,5%) 0,9387 0,2551 0,0821 0,9457 18,1619 Tabela A.5: Estimativas do GARCH univariado com erros GED. Parâmetros ω α β k Média 0,1433 0,0582 0,8976 1,5064 Desv. Pad. Perc. (2,5%) 0,0627 0,0551 0,0136 0,0351 0,0282 0,8319 0,0731 1,3625 Mediana 0,1318 0,0572 0,9013 1,5056 Perc. (97,5%) 0,2910 0,0876 0,9409 1,6521 Tabela A.6: Estimativas do GARCH univariado com erros SSGED. Parâmetros γ ω α β k Média 0,8948 0,1373 0,0562 0,9023 1,5642 Desv. Pad. Perc. (2,5%) 0,0283 0,8387 0,0576 0,0537 0,0137 0,0326 0,0263 0,8472 0,0769 1,4157 Mediana 0,8953 0,1272 0,0550 0,9056 1,5663 Perc. (97,5%) 0,9481 0,2714 0,0863 0,9437 1,7105 68 Tabela A.7: Estimativas do GARCH multivariado com erros N . Parâmetros ω (DAX) α (DAX) β (DAX) ω (CAC40) α (CAC40) β (CAC40) ω (NIKKEI) α (NIKKEI) β (NIKKEI) a b Média 0,0354 0,0781 0,8843 0,0459 0,0450 0,9160 0,0567 0,0886 0,8840 0,0381 0,5860 Desv. Pad. Perc. (2,5%) 0,0093 0,0202 0,0137 0,0541 0,0196 0,8415 0,0144 0,0256 0,0096 0,0285 0,0183 0,8728 0,0148 0,0321 0,0139 0,0645 0,0179 0,8454 0,0137 0,0138 0,1749 0,1493 Mediana 0,0344 0,0771 0,8858 0,0433 0,0441 0,9186 0,0553 0,0875 0,8852 0,0374 0,6192 Perc. (97,5%) 0,0565 0,1076 0,9188 0,0810 0,0661 0,9437 0,0898 0,1189 0,9149 0,0671 0,8394 Tabela A.8: Estimativas do GARCH multivariado com erros SSN . Parâmetros γ (DAX) ω (DAX) α (DAX) β (DAX) γ (CAC40) ω (CAC40) α (CAC40) β (CAC40) γ (NIKKEI) ω (NIKKEI) α (NIKKEI) β (NIKKEI) a b Média 0,8917 0,0359 0,0762 0,8861 1,0345 0,0468 0,0443 0,9161 1,0225 0,0569 0,0890 0,8840 0,0387 0,5801 Desv. Pad. Perc. (2,5%) 0,0273 0,8390 0,0095 0,0204 0,0134 0,0527 0,0196 0,8436 0,0332 0,9724 0,0149 0,0259 0,0095 0,0282 0,0184 0,8726 0,0294 0,9662 0,0150 0,0321 0,0139 0,0649 0,0179 0,8444 0,0140 0,0135 0,1729 0,1610 Mediana 0,8912 0,0349 0,0752 0,8875 1,0334 0,0442 0,0435 0,9189 1,0220 0,0552 0,0879 0,8854 0,0379 0,6110 Perc. (97,5%) 0,9462 0,0577 0,1054 0,9206 1,1030 0,0832 0,0653 0,9439 1,0815 0,0902 0,1195 0,9146 0,0683 0,8366 69 Tabela A.9: Estimativas do GARCH multivariado com erros ST . Parâmetros ω (DAX) α (DAX) β (DAX) ω (CAC40) α (CAC40) β (CAC40) ω (NIKKEI) α (NIKKEI) β (NIKKEI) a b ν Média 0,0270 0,0678 0,9065 0,0426 0,0393 0,9279 0,0374 0,0849 0,8998 0,0424 0,6624 8,1332 Desv. Pad. Perc. (2,5%) 0,0092 0,0125 0,0141 0,0442 0,0201 0,8618 0,0153 0,0213 0,0098 0,0227 0,0180 0,8847 0,0127 0,0171 0,0138 0,0611 0,0161 0,8647 0,0147 0,0157 0,1408 0,3132 0,8491 6,6453 Mediana 0,0258 0,0665 0,9085 0,0398 0,0384 0,9306 0,0360 0,0838 0,9012 0,0417 0,6862 8,0770 Perc. (97,5%) 0,0484 0,0990 0,9400 0,0801 0,0611 0,9551 0,0660 0,1147 0,9273 0,0738 0,8669 9,9646 Tabela A.10: Estimativas do GARCH multivariado com erros SST . Parâmetros γ (DAX) ω (DAX) α (DAX) β (DAX) γ (CAC40) ω (CAC40) α (CAC40) β (CAC40) γ (NIKKEI) ω (NIKKEI) α (NIKKEI) β (NIKKEI) a b ν Média 0,8989 0,0276 0,0675 0,9071 1,0450 0,0442 0,0392 0,9270 1,0079 0,0378 0,0853 0,8997 0,0433 0,6495 8,1533 Desv. Pad. Perc. (2,5%) 0,0292 0,8425 0,0093 0,0129 0,0138 0,0439 0,0198 0,8634 0,0336 0,9803 0,0166 0,0225 0,0096 0,0230 0,0187 0,8827 0,0308 0,9486 0,0127 0,0173 0,0138 0,0614 0,0162 0,8639 0,0148 0,0163 0,1426 0,2938 0,8477 6,6878 Mediana 0,8985 0,0265 0,0662 0,9088 1,0443 0,0409 0,0383 0,9299 1,0072 0,0364 0,0842 0,9009 0,0426 0,6747 8,0850 Perc. (97,5%) 0,9571 0,0488 0,0978 0,9405 1,1119 0,0848 0,0606 0,9539 1,0691 0,0667 0,1154 0,9275 0,0741 0,8548 9,9988 70 Tabela A.11: Estimativas do GARCH multivariado com erros GED. Parâmetros ω (DAX) α (DAX) β (DAX) ω (CAC40) α (CAC40) β (CAC40) ω (NIKKEI) α (NIKKEI) β (NIKKEI) a b k Média 0,0367 0,0742 0,8889 0,0477 0,0432 0,9187 0,0538 0,0929 0,8812 0,0386 0,6473 1,3849 Desv. Pad. Perc. (2,5%) 0,0114 0,0188 0,0158 0,0477 0,0232 0,8376 0,0180 0,0239 0,0106 0,0251 0,0211 0,8693 0,0166 0,0269 0,0165 0,0651 0,0207 0,8352 0,0128 0,0158 0,1446 0,2707 0,0390 1,3095 Mediana 0,0352 0,0728 0,8912 0,0443 0,0421 0,9220 0,0519 0,0915 0,8831 0,0380 0,6735 1,3846 Perc. (97,5%) 0,0634 0,1091 0,9278 0,0908 0,0668 0,9496 0,0919 0,1293 0,9164 0,0659 0,8525 1,4629 Tabela A.12: Estimativas do GARCH multivariado com erros SSGED. Parâmetros γ (DAX) ω (DAX) α (DAX) β (DAX) γ (CAC40) ω (CAC40) α (CAC40) β (CAC40) γ (NIKKEI) ω (NIKKEI) α (NIKKEI) β (NIKKEI) a b k Média 0,9078 0,0361 0,0729 0,8916 1,0352 0,0476 0,0425 0,9195 1,0145 0,0544 0,0932 0,8809 0,0392 0,6355 1,3923 Desv. Pad. Perc. (2,5%) 0,0284 0,8537 0,0114 0,0181 0,0156 0,0467 0,0231 0,8402 0,0296 0,9816 0,0172 0,0244 0,0105 0,0245 0,0204 0,8721 0,0278 0,9612 0,0170 0,0275 0,0169 0,0645 0,0212 0,8345 0,0132 0,0155 0,1472 0,2500 0,0398 1,3152 Mediana 0,9074 0,0347 0,0714 0,8939 1,0336 0,0445 0,0416 0,9225 1,0140 0,0523 0,0917 0,8828 0,0384 0,6606 1,3922 Perc. (97,5%) 0,9640 0,0622 0,1073 0,9307 1,0963 0,0890 0,0660 0,9496 1,0707 0,0935 0,1301 0,9170 0,0672 0,8476 1,4721 Apêndice B Gráficos da simulação a posteriori dos parâmetros do modelo DCC-GARCH com erros SST 71 72 Figura B.1: Na coluna da esquerda os traços, na centro os gráficos das densidades aproximadas e na direita o gráfico das autocorrelações da simulação da distribuição a posteriori dos parâmetros do modelo GARCH(1,1) com erros SST aplicado ao conjunto de dados univariado do Capítulo 5. 73 Figura B.2: Traços da simulação a posteriori, densidades aproximadas e autocorrelações do parâmetro de assimetria e dos parâmetro da volatilidade para a série DAX. Modelo ajustado: GARCH(1,1) com erros SST ao conjunto da dados multivariados do Capítulo 5. 74 Figura B.3: Traços da simulação a posteriori, densidades aproximadas e autocorrelações do parâmetro de assimetria e dos parâmetro da volatilidade para a série CAC40. Modelo ajustado: GARCH(1,1) com erros SST ao conjunto da dados multivariados do Capítulo 5. 75 Figura B.4: Traços da simulação a posteriori, densidades aproximadas e autocorrelações do parâmetro de assimetria e dos parâmetro da volatilidade para a série NIKKEI. Modelo ajustado: GARCH(1,1) com erros SST ao conjunto da dados multivariados do Capítulo 5. 76 Figura B.5: Traços da simulação a posteriori, densidades aproximadas e autocorrelações dos parâmetros de correlação e do parâmetro de peso nas caudas. Modelo ajustado: GARCH(1,1) com erros SST ao conjunto da dados multivariados do Capítulo 5.