FACULDADE IBMEC SÃO PAULO Programa de Mestrado Profissional em Economia Juan Carlos Resende Morales MODELOS DE VALOR PRESENTE SOB A HIPÓTESE DE EFICIÊNCIA NO MERCADO ACIONÁRIO BRASILEIRO São Paulo 2006 Juan Carlos Resende Morales Modelos de Valor Presente sob a Hipótese de Eficiência no Mercado Acionário Brasileiro Dissertação apresentada ao Programa de Mestrado Profissional em Macroeconomia e Finanças da Faculdade Ibmec São Paulo, como parte dos requisitos para a obtenção do título de Mestre em Economia. Campo de conhecimento: Finanças Orientador: Prof. Dr. Ricardo D. Brito – IBMEC SÃO PAULO São Paulo 2006 Morales, Juan Carlos Resende Modelos de Valor Presente sob a Hipótese de Eficiência no Mercado Acionário Brasileiro./ Juan Carlos Resende Morales – São Paulo: IBMEC SÃO PAULO, 2006. 65 f. Dissertação: Faculdade de Economia e Administração. IBMEC SÃO PAULO. Orientador: Prof. Dr. Ricardo D. Brito 1. Modelo de Valor Presente 2. Expectativa de crescimento de dividendos futuros 3. Mercado acionário brasileiro JUAN CARLOS RESENDE MORALES Modelos de Valor Presente sob a Hipótese de Eficiência no Mercado Acionário Brasileiro. Dissertação apresentada ao Programa de Mestrado Profissional em Macroeconomia e Finanças da Faculdade Ibmec São Paulo, como parte dos requisitos para a obtenção do título de Mestre em Economia. Área de Concentração: Finanças Aprovado em Dezembro 2006. BANCA EXAMINADORA Prof. Dr. Ricardo D. Brito Instituição: Ibmec São Paulo Assinatura: _______________________________ Prof. Dr. José Luiz Rossi Júnior Instituição: Ibmec São Paulo Assinatura: _______________________________ Prof. Dr. Marcelo de Sales Pessoa Instituição: IPEA/RJ Assinatura: _______________________________ À minha esposa Carol, à minha filha Maria Fernanda e aos meus pais. AGRADECIMENTOS Essa dissertação certamente teria sido escrita de forma diferente sem a perícia, a ajuda, o acompanhamento e o aconselhamento de muitas pessoas envolvidas direta ou indiretamente na sua elaboração. Entre eles, especificamente no meio acadêmico, incluem-se o Prof. Dr. Ricardo D. Brito, professor do Ibmec São Paulo, que não somente foi meu orientador formal, mas também por todo apoio e cessão de material ao longo do trabalho de pesquisa; Prof. Dr. Pedro Valls, professor e coordenador do referido curso de Mestrado Profissional em Economia na data corrente; Prof. Dr. José Luiz Rossi Júnior, professor do Mestrado Profissional em Finanças; e Prof. Dr. Marcelo de Sales Pessoa, professor do IPEA/RJ. Agradeço aos meus amigos de classe do Mestrado pela contribuição à minha formação, pela participação e companheirismo. Sem eles o curso certamente teria sido menos divertido e produtivo. Gostaria de expressar um enorme agradecimento à minha esposa, Carol Buarque que, ao longo dos últimos dois anos depositou confiança e compreensão nesta empreitada acadêmica que culmina neste trabalho. Finalmente, obrigado Maria Fernanda, minha filha de apenas três meses: a partir de agora meu tempo disponível é todo seu. RESUMO Morales, Juan Carlos Resende. Modelos de Valor Presente sob a Hipótese de Eficiência no Mercado Acionário Brasileiro. São Paulo, 2006. 65p. Dissertação – Faculdade de Economia do IBMEC SÃO PAULO Este trabalho testa o modelo de valor presente (MVP) da razão dividendo-preço de ações baseado no crescimento de dividendos futuros descontado a taxas de retornos constante e variável. Os dados são analisados no período do 1º trimestre de 1995 ao 4º trimestre de 2005 para o índice Bovespa e um índice ponderado pela capitalização de mercado das empresas brasileiras. Apesar do MVP, à taxa de retorno constante ser rejeitado, os testes do MVP, à taxa de retorno variável no tempo apresentam resultados que confirmam uma igualdade estatística entre o spread teórico e o spread observado, evidenciando a possibilidade de compatibilizar previsibilidade de retornos com a existência de um mercado eficiente sob um contexto de expectativas racionais. Palavras-chave: Modelo de Valor Presente, Razão Dividendo-Preço, Processo Estocástico Linear, Expectativas Racionais, Testes de Cointegração. ABSTRACT This workpaper tests the present value model (PVM) for dividend to price ratio based on the future dividend growth discounted by constant and variable returns. The data are analyzed from the 1st quarter of 1995 to the 4th quarter of 2005 for the Bovespa index and an index weighted by the market capitalization from some Brazilian companies. Although the present value model using constant discount rate is rejected, the tests on the present value model through variable discount rate over time presents results which reiterate a statistical equality between the theoretical spread and the observed spread and, at the same time, showing the possibility to ally return predictability with the efficient market’s existence under the rational expectations hypothesis. Keywords: Present Value Model, Dividend-Price Ratio, Linear Stochastic Process, Rational Expectations, Cointegration Tests. SUMÁRIO 1 INTRODUÇÃO .................................................................................................................. 9 2 MODELO DE VALOR PRESENTE TEÓRICO .......................................................... 12 2.1 O Modelo de Valor Presente a Taxas de Retorno Constantes ............................................12 2.2 O Modelo de Valor Presente a Taxas de Retorno Variantes no Tempo.............................15 3 METODOLOGIA DE TESTE ........................................................................................ 19 4 BASE DE DADOS ............................................................................................................ 24 5 RESULTADOS EMPÍRICOS ......................................................................................... 28 5.1 Modelo de Valor Presente à Taxa de Retorno Constante - VWI ........................................28 5.2 Modelo de Valor Presente à Taxa de Retorno Constante - Ibovespa .................................36 5.3 Modelo de Valor Presente à Taxa de Retorno Variável - VWI...........................................44 5.4 Modelo de Valor Presente à Taxa de Retorno Variável - Ibovespa....................................52 6 Conclusão .......................................................................................................................... 60 Referências Bibliográficas ..................................................................................................... 63 Apêndice – Derivando a equação (9) .................................................................................... 65 9 1 INTRODUÇÃO Para analistas financeiros um simples modelo de avaliação de ações consiste em definir o preço igual ao fluxo futuro de dividendos trazido a valor presente por uma taxa de desconto. Este modelo fornece uma explicação teórica para movimentos no mercado acionário que são atribuídos à chegada de uma nova informação. Se esta é suficiente para alterar expectativas de dividendos futuros ou percepção de risco dos agentes, então alterará também os preços correntes das ações. Contudo há uma discussão popular a respeito dos índices de ações serem muito voláteis, levantando alguns questionamentos: a intensidade da alteração dos preços é tão grande que pode ser justificada somente pela nova informação? Será o mercado hipersensível, reagindo desproporcionalmente aos eventos subsequentes? E esta suposta volatilidade pode tornar o modelo inválido? Neste trabalho introduziu-se o modelo que relaciona o preço de uma ação a seu fluxo de dividendos futuros descontado a uma taxa constante ou variável. Como a fórmula do valor presente embute todos os dividendos de períodos futuros, o dividendo distribuído em um período específico é apenas uma pequena componente do preço da ação. Desta forma, pode-se afirmar que os movimentos que alteram de forma persistente a política de distribuição de dividendos de uma empresa terão maior impacto nos preços do que os movimentos temporários. Analisa-se também as variações relativas entre preço, dividendo e taxa de desconto: a razão dividendo-preço (denominada dividend yield) apresenta uma sensibilidade negativa ao crescimento de dividendos e, portanto, se existe expectativa de uma distribuição maior de dividendos futuros o dividend yield será baixo. De outra forma, esta razão é interpretada em função da taxa pela qual o fluxo de dividendos futuros é descontado ao preço atual da ação, ou seja, se a taxa de desconto for alta, o dividend yield será alto. A princípio a razão dividendo-preço pode ser descrita como sendo sensível às duas variáveis simultaneamente, no entanto, não está claro a importância relativa de cada uma e se as duas interpretações são responsáveis pelas variações da razão ao longo do tempo sob a premissa de expectativas racionais do mercado. O trabalho se propõe a analisar estas questões sob um contexto de expectativas racionais e competição entre agentes do mercado, que define um mercado 10 eficiente. Para isso, usar-se-á de séries históricas de dois índices representativos do mercado acionário brasileiro. O desenvolvimento de modelos teóricos de apreçamento de ações teve seu início há pelo menos quatro décadas e alguns trabalhos merecem ser mencionados pela contribuição dada à evolução do tema. A abordagem mais básica realizada na literatura, e talvez a mais difundida ainda hoje no mundo das financas, é o modelo de Gordon (1962) que assume premissas pouco realistas como a taxa de crescimento de dividendos e taxa de desconto constantes. Black e Scholes (1974) se preocupam com as relações seccionais entre dividend yield e retornos médios, tentando em vão explicar quais efeitos que um mudança na política de dividendos exerce sobre o preço de uma companhia aberta. Os artigos de Shiller (1981) e Campbell e Shiller (1987) consistem em análises de séries temporais de modelos de dividendos e preços sob a premissa de retornos constantes e aplicação de testes econométricos para confirmar a validade do modelo sugerido. Até então o fato de assumir taxas de retornos constantes era devido à impossibilidade de prevê-las. Contudo, Fama e French (1988) levantam a possibilidade teórica de reversão à média nos retornos de longo prazo e Campbell e Shiller (1988a) apresentam evidências empíricas sobre a previsibilidade de retornos, o que estimula o desenvolvimento de modelos de valor presente alternativos com taxas de retornos variantes no tempo. No caso brasileiro recente, a discussão sobre previsibilidade de retornos foi explorada por Torres, Bonomo e Fernandes (2000) entre outros. No entanto, foi Anchite e Issler (2001) que apresentaram uma abordagem de forma integrada entre previsibilidade e racionalidade no mercado acionário brasileiro. Aqui será empregada uma metodologia que tenta compatibilizar previsibilidade de retornos com a existência de um mercado eficiente sob um contexto de expectativas racionais como em Lucas (1978), por meio de técnicas econométricas de análise multivariada, mais precisamente aplicando a modelagem de VAR (vetores auto-regressivos). A razão dividendopreço deve ser um previsor ótimo do valor presente do crescimento de dividendos e taxas de desconto. Esta proposição pode ser testada formalmente por meio de testes de igualdade estatística entre os spreads teórico e observado. Duas premissas distintas de taxas de desconto são utilizadas e, portanto, duas versões diferentes do spread teórico serão analisadas: uma considera a taxa de retorno de ações constante ao longo do tempo, enquanto que a 2a versão trabalha com a variabilidade dos retornos. São duas principais contribuições ao que já foi analisado na literatura brasileira: primeiramente não se usou somente séries originadas do 11 Ibovespa, mas também de um Value Weighted Index (VWI) e, em segundo lugar, trabalhou-se não somente com modelos bivariados, mas também com os trivariados no caso do MVP a retornos variáveis. Além desta introdução, a seção 2 apresentará uma abordagem teórica sobre modelos de valor presente discriminando as duas versões já citadas: MVP a taxas de retorno constante e o MVP a taxas de retorno variante no tempo. A seção 3 concentrar-se-á em métodos econométricos a fim de representar o MVP por sistemas de VAR e na descrição de alguns testes relevantes. A seção 4 preocupar-se-á em detalhar a construção da base de dados utilizada para a formação dos dois índices: Ibovespa e VWI. A seção 5 compreenderá os resultados obtidos nos testes econométricos, enquanto que a seção 6 conterá a conclusão. 12 2 MODELO DE VALOR PRESENTE TEÓRICO O modelo da razão dividendo-preço que será estudado derivou de um dos mais simples entre os modelos dinâmicos estocásticos em Finanças1. Segundo Campbell e Shiller (1987), apesar da simplicidade deste modelo, existe um substancial grau de controvérsia a respeito de sua validade alimentado pelos seguintes questionamentos. Primeiramente, existem várias formas de testar a equação, incluindo testes de regressão simples, de vetores auto-regressivos com restrição e de volatilidade. Não está muito claro como estas abordagens alternativas se relacionam. Em segundo lugar, uma rejeição estatística do modelo pode não ter significado econômico, pois é bastante possível que o modelo tenha um elevado poder de explicação da variável dependente mesmo se sua significância estatística for rejeitada. Finalmente, as variáveis da equação precisam sofrer algumas transformações para ser aplicada corretamente a teoria de processos estocásticos estacionários no caso destas apresentarem evidências da presença de raiz unitária. Particularmente nos modelos da razão dividendo-preço, tanto as séries de preços quanto as de dividendos evidenciam a presença de raiz unitária. 2.1 O Modelo de Valor Presente a Taxas de Retorno Constantes Para um dado horizonte de investimento, pode-se definir que o retorno esperado para uma ação é uma constante R: Et [Rt +1 ] = R , (1) onde a esperança do retorno no período t+1 é função do preço no final do período, após distribuição de dividendos, somado aos dividendos distribuídos: 1 O modelo de valor presente teórico generalizado Yt = θ (1 − δ ) ∞ ∑δ i =0 i E t y t + i + ct , onde ct é uma constante, θ, o coeficiente de proporcionalidade e δ, o fator de desconto, são parâmetros que, a princípio, devem ser conhecidos ou estimados. Et é a esperança condicional dado todo o conjunto de informações It que inclui Yt e yt. Restringindo a abordagem a um modelo de avaliação de preços de ações, considera-se Yt o preço de uma ação e yt, seu dividendo. 13 R = Et [Rt +1 ] = Et (Pt +1 − Pt ) + Dt +1 . Pt (2) Desta forma, pode-se relacionar o preço atual com expectativa de preço futuro e com o fluxo de dividendos futuros: ⎡ P + Dt +1 ⎤ Pt = Et ⎢ t +1 ⎥. ⎣ 1+ R ⎦ (3) A equação (3) expressa o cálculo do preço da ação em função da soma de seu fluxo futuro de dividendos e do preço ao final de um período somente. No entanto, se quiser obter Pt a partir de expectativas racionais de K períodos à frente, a equação será resolvida recursivamente, adotando uma representação que remete à Lei das Expectativas Iteradas: ⎡ k ⎛ 1 ⎞i ⎤ ⎡⎛ 1 ⎞ K ⎤ Pt = Et ⎢∑ ⎜ ⎟ Dt +i ⎥ + Et ⎢⎜ ⎟ Pt + K ⎥ . ⎣⎢⎝ 1 + R ⎠ ⎣⎢ i =1 ⎝ 1 + R ⎠ ⎦⎥ ⎦⎥ (4) Quando K tende ao infinito, ou seja, na perpetuidade do investimento, o segundo termo da equação se aproxima de zero. Conseqüentemente, pode-se assumir como válida a equação representativa do preço de ações Pt para infinitos períodos: ⎡ ∞ ⎛ 1 ⎞i ⎤ Pt = Et ⎢∑ ⎜ ⎟ Dt +i ⎥ . ⎣⎢ i =1 ⎝ 1 + R ⎠ ⎦⎥ (5) A equação (5) pode ser descrita como a versão generalizada para o modelo de crescimento de Gordon (1962), que assume uma hipótese pouco realista de que a série de dividendos apresenta um crescimento constante G e que deve ser sempre menor que a taxa de desconto, também constante, R. O modelo de valor presente descrito acima poderia ser diretamente testado caso as séries de preços e dividendos fossem estacionárias em nível2. No entanto, existem algumas evidências de que as séries de dividendos e preços de ações realmente 2 Para que as séries sigam um processo estacionário, possíveis choques sobre elas devem causar efeitos temporários no seu nível. De forma contrária, variáveis que seguem um processo linear com raiz unitária sofrem alterações permanentes sob choques, mas não sofrem alterações na sua taxa de evolução. 14 seguem um processo integrado de 1ª ordem, ver como referência de trabalhos Campbell e Shiller (1987) para os EUA e Torres, Bonomo e Fernandes (2000) para o caso brasileiro. Para que se possa aplicar a teoria de séries temporais no MVP as variáveis relacionadas devem seguir processos estacionários. Segundo Campbell e Shiller (1987), se estas variáveis fossem estacionárias apenas em suas primeiras diferenças, a escolha de tratamento por intermédio de VAR torna-se inadequado por dois motivos: primeiro, por não poder impor todas as restrições em (5) num VAR a primeiras diferenças e, em segundo lugar, não existe nenhuma boa representação para um VAR cujas variáveis são séries em primeiras diferenças. Pode-se transformar a equação em uma relação de variáveis estacionárias por uma operação de subtração de um múltiplo de Dt nos dois lados da equação, obtendo-se: i ⎤ Dt ⎛ 1 ⎞ ⎡ ∞ ⎛ 1 ⎞ Pt − = ⎜ ⎟ E t ⎢∑ ⎜ ⎟ ∆Dt +1+i ⎥ . R ⎝ R ⎠ ⎢⎣ i =0 ⎝ 1 + R ⎠ ⎥⎦ (6) A equação destaca no seu lado esquerdo uma relação de cointegração entre duas séries integradas de 1ª ordem, ou seja, existe uma combinação linear estacionária entre duas séries não-estacionárias. Isto é verdade se o termo do lado direito da equação definido pela variação de dividendos for uma série estacionária. A adaptação expressa na equação (6) do MVP esperado foi analisada empiricamente por Campbell e Shiller (1987), West (1988b) e outros. Entretanto, a premissa aqui utilizada de retorno constante no tempo é uma restrição muito forte ao modelo e não reflete o real comportamento de preços de ações. Na seção 5 testar-se-á o MVP à taxa de retorno constante R, onde Et[Rt+1-R]=0. Contudo preços e dividendos, igualmente a várias séries temporais macroeconômicas, crescem exponencialmente ao longo do tempo ao invés de linearmente a taxa R, conforme sugerido. Logo, a proposição linear se torna menos adequada do que a aplicação de um modelo loglinear. 15 2.2 O Modelo de Valor Presente a Taxas de Retorno Variantes no Tempo É bastante difícil trabalhar com hipóteses de não linearidade entre as variáveis componentes de um modelo a valor presente quando os retornos esperados das ações variam ao longo do tempo. A abordagem sugerida por Campbell e Shiller (1988a,b) utiliza uma aproximação loglinear para definir uma relação entre preços e dividendos. Denomina-se Pt como o preço real de uma ação (ou um carteira delas) ao final de cada período t, como já foi definido na seção anterior, e Dt como os dividendos distribuídos ao longo do período t. O log do retorno bruto realizado, considerando o final do período t até o final do período t+1 pode ser definido por: rt +1 = ht +1 ≡ log(1 + Rt +1 ) = log(Pt +1 + Dt +1 ) − log(Pt ) . (7) A relação exata em (7) é não-linear, uma vez que envolve o logaritmo da soma do preço e do dividendo. Para a obtenção de uma relação linear entre o logaritmo de retornos, o logaritmo de preços e o logaritmo de dividendos, ht+1 pode ser aproximado a uma variável ξt+1, tal que ht+1 ≈ ξt+1. Usa-se como convenção o log das variáveis representado por letras minúsculas. Chega-se à definição de ξt+1 após algumas transformações e simplificações de ht+1 da seguinte maneira: rt +1 ≡ log(Pt +1 + Dt +1 ) − log(Pt ) ⎛ P P + Dt +1 ⎞ ⎟⎟ = log⎜⎜ t +1 t +1 Pt +1 ⎝ Pt ⎠ ⎛P ⎞ ⎛ P + Dt +1 ⎞ ⎟⎟ = log⎜⎜ t +1 ⎟⎟ + log⎜⎜ t +1 Pt +1 ⎝ Pt ⎠ ⎝ ⎠ ⎛P ⎞ = log⎜⎜ t +1 ⎟⎟ + log(1 + exp(log Dt +1 − log Pt +1 )) ⎝ Pt ⎠ = pt +1 − pt + log(1 + exp(d t +1 − pt +1 )) . (8) Pode-se fazer uma expansão de Taylor de 1ª ordem em (8), descrita no Apêndice, para obter a seguinte expressão: 16 rt +1 = ht +1 ≈ ξ t +1 = pt +1 − pt + k + (1 − ρ )(d t +1 − pt +1 ) = k + ρpt +1 + (1 − ρ )d t +1 − pt . (9) A equação (9) é uma equação linear a primeiras diferenças para o log do preço da uma ação, análoga à equação (3), que reflete uma equação diferencial linear para o nível do preço da ação no modelo de valor presente a retorno constante. Pode-se resolver esta equação recursivamente para o futuro impondo a condição: lim ρ j Et pt + j = 0 , (10) j →∞ e assim se obtém: pt = ⎡∞ k + Et ⎢∑ ρ j (1 − ρ )d t +1+ j − ht +1+ j 1− ρ ⎣ j =0 [ ]⎤⎥ . ⎦ (11) A equação acima explicita uma relação entre duas séries não-estacionárias integradas pt e dt. Como já foi anteriormente mencionado para se aplicar a teoria de séries temporais é necessário que as séries sejam estacionárias. Desta forma, submete-se a equação (9) às seguintes transformações: ht +1 ≈ pt +1 − pt + k + (1 − ρ )(d t +1 − pt +1 ) = k + ρpt +1 + (1 − ρ )d t +1 − pt ≈ k + ρpt +1 + (1 − ρ )d t +1 − pt + d t − d t ≈ k + ρpt +1 + d t +1 − d t − ρd t +1 + d t − pt ≈ k + ρpt +1 − ρd t +1 + ∆d t +1 + d t − pt ht +1 ≈ k − ρδ t +1 + ∆d t +1 + δ t , (12) onde δ t = d t − pt Para resolver (12) considerando expectativas racionais e aplicando recursivamente a equação para frente, impõe-se lim ρ j Et δ t + j = 0 , obtém-se: j →∞ δ t = d t − pt = − ∞ k + Et ∑ ρ j − ∆d t +1+ j + ht +1+ j . 1− ρ j =0 [ ] (13) 17 A equação (13) relaciona o log da razão dividendo-preço a variáveis fundamentais como à expectativa de crescimento de dividendos futuros e de retorno, descontado da ação. Concluise que o log da razão dividendo-preço é mais alto quando o crescimento de dividendos é mais baixo ou quando os retornos esperados são maiores. A intuição econômica por trás da sensibilidade com a taxa de crescimento de dividendos reside no fato de o investidor ao optar no presente por dividendos relativos menores (e, portanto, com baixo dividend yield) possibilita à empresa uma taxa corrente de reinvestimento maior. Desta forma este investidor pode esperar em períodos futuros maiores dividendos, fruto de uma maior expansão do negócio. A relação da razão dividendo-preço com o retorno da ação é mais intuitiva, ou seja, se a rentabilidade esperada do negócio é alta, a distribuição de dividendos relativa ao preço no período presente também será. Esta simples estrutura torna o modelo loglinear mais fácil de usar na análise empírica do que o modelo que envolve uma relação linear de cointegração, pois todos os parâmetros são conhecidos quando se trata do logaritmo da razão dividendopreço apenas. De acordo com Campbel e Shiller (1988a), todas as variáveis na equação (13) são medidas expost. Além disso, esta relação é obtida por meio de uma aproximação linear de ht e da imposição que ao longo do tempo a série δt+j é estacionária e, consequentemente, não há conteúdo econômico na equação. Para que se aproxime de um modelo econômico, algumas restrições devem ser impostas sobre o comportamento de ht. A forma mais simples de se impor tais restrições é assumir uma relação entre o retorno da ação ht e a taxa de desconto rt, que pode representar para fins práticos à taxa de juros real, sem risco: Et ht = Et rt + c . (14) A representação Et significa uma expectativa racional formada por informações no início do período t, com ht e rt medidos ao final de cada período. O significado ao se impor esta condição é que existe uma variável cuja expectativa racional no começo do período somada a uma constante c iguala o retorno ex ante da ação. Substituindo (14) na equação (13) obtém-se um modelo econometricamente testável: 18 δt ≈ ∞ c−k + Et ∑ ρ j rt +1+ j − ∆d t +1+ j . 1− ρ j =0 [ ] (15) Esta relação representa o Modelo da Razão Dividendo-Preço que é uma evolução do modelo de crescimento proposto por Gordon (1962). Este assume um modelo estático de razão dividendo-preço sem descrever como esta relação deve se comportar temporalmente se taxas de juros ou taxas de crescimento mudarem ao longo do tempo. 19 3 METODOLOGIA DE TESTE Inúmeros testes econométricos podem ser aplicados para se testar a validade dos modelos de razão dividendo-preço. Suas variáveis explicativas são tratadas como elementos de um vetor que descreve o estado da economia em algum período no tempo. Este vetor de estado se comporta temporalmente como um processo estocástico linear multivariado com coeficientes constantes. A informação intrínseca ao vetor de estado é capturada por agentes de mercado que conhecem o processo que se segue e, portanto, são capazes de estimar a evolução das respectivas variáveis no futuro. Nesta seção assume-se que a dinâmica de dados de longo prazo pode ser resumida e bem descrita por um modelo de séries temporais simples. Propriedades de longo prazo podem ser inferidas a partir de um modelo de curto-prazo ao invés de tentar estimar diretamente de uma série finita. Como primeira passo deve-se analisar as propriedades estocásticas de cada série envolvida, verificando a presença de raízes unitárias nas séries em nível. Caso estas sejam I (1), realizar-se-ão testes de cointegração, usando as técnicas de Engle-Granger (1987) e Johansen (1988, 1991) definindo relações estacionárias entre dividendos e preços, para posteriormente usar técnicas de VAR para modelar as equações (6) e (15). Como foi apresentado na seção anterior, uma relação de cointegração entre Pt e Dt bem como uma aproximação linear do log do retorno de preços de ações implica em uma função que envolve o valor descontado da esperança da taxa de crescimento de dividendos futuros e das taxas de retorno. O teste de confiabilidade para ambas as versões citadas de MVP é feito usando o método de vetores auto-regressivos (VAR) para definir o spread teórico e, posteriormente, comparando-o com o spread observado. Campbell e Shiller (1988a) propôs um modelo a partir da equação (15), utilizando as variáveis δ t ≡ d t − pt e rt − ∆d t como variáveis estacionárias que definem a relação entre as séries dt e pt. Logo se pode obter uma representação VAR da seguinte maneira: ⎤ ⎡ u1t ⎤ ⎡ δ t ⎤ ⎡a( L) b( L) ⎤ ⎡ δ t −1 ⎢r − ∆d ⎥ = ⎢ c( L) d ( L)⎥ ⎢r − ∆d ⎥ + ⎢u ⎥ , ⎣ ⎦ ⎣ t −1 t⎦ t −1 ⎦ ⎣t ⎣ 2t ⎦ (16) 20 onde os polinômios a(L), b(L), c(L) e d(L) são todos de ordem p no operador de defasagem L. Este VAR proposto pode ser usado para fazer uma previsão em vários períodos à frente de rt − ∆d t bem como inclui como variável independente δ t que é a previsão ótima do valor presente de rt − ∆d t no futuro. Modelos VAR com p defasagens podem ser resumidos a um VAR a uma defasagem quando se aumenta o vetor de variáveis de estado: δt ⎡ ⎤ ⎡a1 L a p ⎢ ⎥ ⎢ M ⎢ ⎥ ⎢1 O ⎢ ⎥ ⎢ M ⎢ ⎥ ⎢ δ t − p +1 1 ⎢ ⎥=⎢ − ∆ r d L c c t t p ⎢ ⎥ ⎢ 1 ⎢ ⎥ ⎢ M ⎢ ⎥ ⎢ 0 M ⎢ ⎥ ⎢ ⎢⎣rt − p +1 − ∆d t − p +1 ⎥⎦ ⎣⎢ δ t −1 ⎤ ⎡ u1t ⎤ b1 L b p ⎤ ⎡ ⎥ ⎢ ⎥ ⎥⎢ M ⎢ ⎥ ⎢0 ⎥ ⎥ 0 ⎥ ⎢M ⎥ M ⎥⎢ ⎥ ⎢ ⎥ ⎥⎢ δ t− p ⎢ ⎥+ 0 . ⎥ d1 L d p ⎢ rt −1 − ∆d t −1 ⎥ ⎢u 2t ⎥ ⎥ ⎢ ⎥ ⎥ ⎢0 ⎥ ⎥⎢ 1 M ⎥ ⎢ ⎥ ⎥⎢ O M ⎢ ⎥ ⎢M ⎥ ⎥ 1 ⎦⎥ ⎢⎣rt − p − ∆d t − p ⎥⎦ ⎣ 0 ⎦ (17) O sistema acima pode ser representado vetorialmente como: z t = Az t −1 + vt , [ (18) ] onde z t = δ t Lδ t − p +1 , rt − ∆d t L rt − p +1 − ∆d t − p +1 , vt = [u1t ,0L 0, u 2t ,0L 0] . O vetor zt segue ' ' um VAR de primeira ordem, onde as linhas correspondentes a δt e rt-∆dt são estocásticas e as outras são determinísticas. νt é o vetor de choques sobre o VAR. Por simplicidade não se considera o efeito de constantes, pois se pode assumir o vetor das variáveis de estado composto pelas variáveis explicativas menos suas respectivas constantes. O vetor zt tem a propriedade de que, para ser estimado quaisquer períodos k à frente dado o conjunto de informação Ht, que contém valores correntes e defasados de zt, simplesmente multiplica-se zt pela matriz A elevada à k-ésima potência. Consequentemente, E [z t + k H t ] = A k z t . Sejam os vetores canônicos e1 e e2 de dimensões p x 1, tal que ' ' e1 = [1 0 L 0] , e2 = [0 L 0 1 0 L 0] e e'1 z t ≡ δ t e e' 2 z t ≡ rt − ∆d t , pode-se agora discutir as implicações da equação matricial acima sobre o modelo de valor presente sugerido na equação (15). A primeira e mais fraca implicação do modelo é que o log da razão dividendo-preço δt deve causar, no sentido Granger, rt-∆dt. A principal razão é que a variável δt embute toda informação de mercado sobre o vetor de variável de estado zt. 21 A segunda implicação do modelo é que este impõe uma série de restrições no sistema (18). Para derivar estas restrições deve-se tratar a equação (15) condicionada ao conjunto de informações Ht, representado da seguinte forma: ⎡ ⎤ ∞ δ t = E ⎢∑ ρ j [rt +1+ j − ∆d t +1+ j ] H t ⎥ ≡ δ t* . ⎣ j =0 ⎦ (19) A equação (19) diz que δt deve ser igual à estimativa ótima irrestrita do fluxo futuro descontado de rt+1+j – ∆dt+1+j, expressa por δt*. Pode-se reescrever a equação, usando a fórmula de estimativas por intermédio de um VAR multiperíodos como: ∞ δ t = e1' z t = ∑ ρ j e2' A j +1 z t ≡ δ t* . (20) j =0 A equação (20) se estende para todas as realizações de zt e, portanto, simplifica-se a: ∞ e1' = ∑ ρ j e2' A j +1 =e2' A(I − ρA) , −1 (21) j =0 onde a 2a igualdade é a avaliação de uma soma infinita, observando que deve convergir uma vez que os elementos da variável de estado zt são estacionários. A equação (21) define um conjunto de 2p restrições não-lineares nos coeficientes do VAR, que podem ser testados usando um Teste de Wald não-linear. No entanto, a abordagem mais usual é realizar uma transformação nas restrições, multiplicando a equação por (I − ρA) de cada lado, obtendo-se as seguintes restrições lineares: e1' (I − ρA) = e2' A . (22) A equação acima impõe que a restrição do modelo na forma de retornos pode ser expressa como E (ξ t +1 − rt +1 H t ) = 0 , onde ξ t +1 é definido na equação (9)3. Segundo Anchite e Issler (2001), a interpretação dada a esta restrição é que o excesso de retorno esperado é imprevisível, fora uma constante, pois é possível demonstrar que a aproximação de Taylor 3 De acordo com Campbell e Shiller (1988a), o termo constante c não aparece na relação porque define-se todas as variáveis como desvios de suas médias e estas médias não sofrem restrições nos modelos. 22 representada em (9) só será exata, isto é, ξ t = rt , se este for o caso. Para atestar como a equação e1' (I − ρA) − e2' A = 0 é equivalente à restrição na forma de retornos, pode-se reescrevê-la como e1' z t − e1' ρ ( Az t ) − e2' ( Az t ) = 0 , onde Az t = Et z t e, desta forma, e1' z t = δ t , e1' ρ ( Azt ) = ρEtδ t +1 e e2' ( Az t ) = Et (rt − ∆d t ) . Combinando estes elementos e usando a definição de ξ t +1 na equação (9) chega-se à restrição de retornos. As restrições em (21) são algebricamente equivalentes às representadas em (22), no entanto o teste de Wald não é. O principal motivo é que ambas as equações são relacionadas por uma transformação não-linear e testes de Wald não são invariantes a estas transformações4. Realizar o teste de Wald da equação (17) sobre o VAR é numericamente equivalente a testar se existem 2p coeficientes nulos quando ξ t − rt é uma regressão sobre as variáveis de zt. Campbell e Shiller (1988a) realizam algumas alternativas do VAR apresentado em (17) como por exemplo utilizar um VAR de sistema trivariado cujas variáveis são δt, rt e ∆dt. Desta forma pode-se fazer testes em separado para cada variável e verificar como cada uma se relaciona com a razão dividendo-preço. Conseqüentemente, altera-se a matriz zt de forma a incluir tais variáveis separadamente e redefine-se a matriz A, bem como os vetores canônicos e1, e2 e e3, direcionados às variáveis δt, ∆dt e rt respectivamente. Por analogia a equação (20): ∞ ( ) e1' z t = ∑ ρ j e3' − e2' A j +1 z t . j =0 (23) Mediante a mesma simplificação algébrica, feita anteriormente, chega-se à expressão: ( ) e1' (I − ρA) = e3' − e2' A , (24) sujeita igualmente ao mesmo problema observado anteriormente, ou seja, o teste de Wald pode variar da equação (23) para a equação (24) pois ambas estão relacionadas a transformações não-lineares. 4 Ver Davidson e Mackinnon (1993), pp 467-469. 23 O teste de razão unitária entre as variâncias do spread observado e o teórico também será utilizado, mediante a restrição Var (δ t ) = 1, Var δ t* ( ) onde δ t* é o previsor ótimo do logaritmo da razão dividendo-preço. De fato no modelo de valor presente o ratio deverá ser igual a um, no entanto este teste de igualdade entre as variâncias terá sua hipótese nula rejeitada se a variável δ t apresentar uma volatilidade grande em relação às mudanças sobre o futuro de rt − ∆d t de tal forma que o ratio seja maior que a unidade. Um estatística complementar a este teste é a correlação entre as séries δ t e δ t* que, baseado mais uma vez na proposição teórica do MVP de que δ t = δ t* , deveria ser igual a um. 24 4 BASE DE DADOS Os dados utilizados consistem em observações com freqüência trimestral de preços e dividendos normalizados em relação a dois índices: (i) Value Weighted Index (VWI) e (ii) IBOVESPA. Tais dados foram extraídos da Economática e deflacionados pelo índice geral de preços IGP-DI com base de final de dezembro de 2005. Importante ressaltar a construção da série de preços leva em consideração o preço de fechamento de cada papel no último pregão de cada trimestre na amostra. A série de dividendos5 captura os proventos distribuídos ao longo do período e, portanto, anteriores ao preço utilizado. O VWI é um índice cuja composição consiste em 131 ações negociadas na Bovespa antes de 1986 e até final de 2005. A necessidade de se construir este índice evitou que houvesse grandes mudanças na amostra ao longo do tempo e que isto causasse de certa forma alguma distorção no padrão de retorno das séries. Foi estabelecida uma restrição sobre classe de ações da mesma empresa, se ação ordinária ou preferencial, que privilegia a classe com maior volume de negócio no período retroativo de um mês. A composição desta carteira6 obedece à regra de que a participação da ação no índice deve ser proporcional à capitalização de mercado da respectiva ação, de acordo com a seguinte fórmula: wit = pit ∗ qit n ∑p it , (25) ∗ qit i =1 onde wit = participação da ação i no VWI no período t pit = preço da ação i no final do período t qit = quantidade da ação i no mercado no final do período t A formação da série de preços do VWI consiste na soma da capitalização de mercado de cada ação i componente do índice: 5 Relativamente à análise e construção da série de dividendos do Ibovespa, agradece-se ao Prof. Dr. Marcelo de Sales Pessoa pela gentil cessão de seus dados. 6 A composição da carteira VWI e as respectivas séries de preço e dividendos ficam inteiramente à disposição para futuros trabalhos acadêmicos. 25 n Pt = ∑ pit ∗ qit . (26) i =1 Posteriormente normalizou-se a série de preços pelo preço do primeiro período: n Ptnorm = ∑p it ∗ qit i =1 . P1 (27) O pagamento de proventos aos acionistas considerado neste trabalho equivale à distribuição dos “dividendos-caixa”, distribuição de dividendos em forma de ações (bonificações) e juros sobre capital próprio (JSCP). A série de dividendos normalizada Dtnorm foi construída agregando-se o dividend yield de cada ação ponderados pelos respectivos pesos no VWI e, posteriormente, multiplicados pela série de preços normalizada. d ⎞, Dtnorm = Ptnorm * ∑ wit * ⎛⎜ it ⎟ p it ⎝ ⎠ i =1 n (28) Onde dit = dividendo por ações i no final do período t Para confrontar resultados do VWI e, dada sua relevância para o mercado brasileiro, utilizaram-se também as séries históricas correspondentes ao IBOVESPA. A evolução trimestral da composição da carteira teórica do IBOVESPA foi disponibilizada pela própria Bovespa e a construção da série de preços e dividendos passa pela mesma metodologia de construção do Value Weighted Index mencionado acima. Para testar o modelo de razão dividendo-preço proposto por Campbell e Shiller (1988 a, b) foi utilizada, como proxy da taxa livre de risco, a taxa real overnight SELIC paga pelos títulos públicos federais, obtida da série em nível da SELIC acumulada na Economática. Antes de se iniciar qualquer teste estatístico e de estimação é necessário fazer algumas considerações sobre a evolução das séries utilizadas neste trabalho. Seguem abaixo os gráficos da séries de dividendos (Dt), preços (Pt), dividendo-preço (Dt/Pt)e da taxa SELIC (rt), todos em valores reais. 26 Analisando as séries de dividendos (gráficos DIVIDENDOS), nota-se um comportamento bastante volátil no período, com a verificação de sazonalidade de distribuição destes proventos concentrada principalmente no 2o trimestre de cada ano7. Esta peculiaridade é explicada pela tendência das empresas distribuírem parte de seus lucros por meio de dividendos ou JSCP, como dividendos complementares, referentes ao resultado do exercício do ano anterior. Particularmente a partir de 1997 observa-se uma distribuição maior de dividendos, devido à constituição da figura do JSCP, que segundo Ness Junior e Zani (2001) não somente é um alternativa à remuneração ao acionista, mas também uma forma de reduzir a carga tributária das empresas. A concentração dos índices em determinadas ações em parte também justifica uma volatilidade maior da série, pois esta se torna mais dependente do perfil de remuneração de poucas empresas a seus acionistas. As séries de preços Pt (gráfico PREÇO) tanto do VWI quanto do Ibovespa são mais suaves que as dos respectivos dividendos, apresentando claramente uma tendência de alta o que pode ser relacionado com a presença de raiz unitária e, portanto, a característica de nãoestacionaridade. A razão dividendo-preço (gráficos DIVIDENDO/PREÇO) possui volatilidade expressiva e é difícil identificar uma tendência clara nas séries, conforme as expectativas de que se as séries de dividendos e preços possuírem uma relação de longo prazo (relação de cointegração) fica caracterizado então a estacionaridade desta razão. Por último, a série da taxa livre de risco (TAXA SELIC) em primeiras diferenças, ou seja, o retorno propriamente dito da série da SELIC acumulada no período, que aparentemente não possui tendência oscilando sempre em torno de um determinado nível. 7 Evitou-se a dessazonalização dos dividendos, pois esta técnica altera significativamente a estrutura estocástica da série original, alocando parte dos dividendos concentrados em um trimestre para trimestres subjacentes, inviabilizando qualquer estudo de modelos que testam a racionalidade. 27 DIVIDENDO PREÇO .20 14 12 .16 10 .12 8 .08 6 .04 4 .00 2 96 97 98 99 00 01 02 03 04 05 96 97 98 DIVIDENDO/PREÇO 99 00 01 02 03 04 05 03 04 05 TAXA SELIC .040 8 .035 .030 4 .025 .020 0 .015 .010 -4 .005 .000 -8 96 97 98 99 00 01 02 03 04 05 96 97 98 99 00 01 02 Gráfico 1 - Gráficos de Séries do VWI Fonte: Elaborados pelo autor DIVIDENDO PREÇO .35 14 .30 12 .25 10 .20 8 .15 6 .10 4 .05 .00 2 95 96 97 98 99 00 01 02 03 04 05 95 96 97 98 DIVIDENDO/PREÇO 99 00 01 02 03 04 05 02 03 04 05 TAXA SELIC .035 12 .030 8 .025 4 .020 .015 0 .010 -4 .005 .000 -8 95 96 97 98 99 00 01 02 03 04 05 95 96 97 98 99 Gráfico 2 - Gráficos de Séries do Ibovespa Fonte: Elaborados pelo autor 00 01 28 5 RESULTADOS EMPÍRICOS 5.1 Modelo de Valor Presente à Taxa de Retorno Constante - VWI Teste de Raiz Unitária e Cointegração Realiza-se testes de raiz unitária Augmented Dickey-Fuller (ADF), Philips-Perron (PP) e, apenas em caso de discrepâncias entre os dois primeiros testes, Kwiatkowski-PhilipsSchmidt-Shin (KPSS) para verificar o comportamento estocástico das séries envolvidas, tentando identificar a presença de raiz unitária nas séries em nível, e, portanto, se existe uma relação de longo prazo entre elas, e a sua estacionaridade quando em primeiras diferenças. Os resultados estão na tabela abaixo com algumas conclusões: Fonte: Elaborada pelo autor De acordo com os testes realizados existe uma forte evidência de que a série de preços Pt possui raiz unitária ao aceitar H0. Considerando apenas as séries em primeiras diferenças rejeitou-se a hipótese nula, indicando estacionaridade e corroborando a evidência de raiz unitária de ordem 1 em Pt. Os resultados dos testes de raiz unitária sobre a série de dividendos, Dt, foram um tanto divergentes se considerarmos o teste ADF e PP, o que obrigou a realizar um terceiro teste, o KPSS, para ratificar um destes resultados. Baseado no KPSS observou-se evidências da 29 presença de raiz unitária em Dt uma vez que H0 é rejeitada a um nível de significância de 1%. Esta dubiedade nos resultados está longe de ser uma surpresa, citando dois eventos corporativos característicos no Brasil que provavelmente influenciaram o comportamento das séries. Primeiramente, em 1996 foi criado uma forma de remuneração aos acionistas de empresas chamada juros sobre capital próprio (JCSP) que trazia benefícios fiscais às empresas quando incorporados aos dividendos. Pode-se especular que este novo incentivo fiscal de alguma forma alterou a propensão das empresas na amostra em remunerar seus acionistas por meio de dividendos, o que poderia significar uma quebra estrutural no modelo a partir de 1997, conforme analisado por Silva, Lima e Brito (2005). Em segundo lugar, como também observado por Anchite a Issler (2001), existe uma forte sazonalidade na distribuição de dividendos concentrada no 2º trimestre de cada ano calendário, fazendo com que haja uma queda súbita nas séries de dividendos do 2º para o 3º trimestre. Esta sazonalidade se justifica dado que os dividendos normalmente são pagos após a divulgação do balanço anual das companhias, permitida pela CVM até março do ano seguinte ao ano de exercício. Estas quedas abruptas na série entre vários períodos podem alterar a conclusão em testes de raiz unitária, conforme apontado por Cati, Garcia e Perron (1999). Assumindo que as séries de dividendos e preços não são estacionárias pelos testes expostos, a próxima etapa é identificar as possíveis relações de longo prazo entre Dt e Pt. Realiza-se os testes de critério de informação para se obter o no de defasagens ótimas do VAR entre as duas variáveis. Tentou-se o VAR com 4 lags conforme é sugerido por Schwarz (SC), no entanto este modelo apresentou-se mal especificado ao se testar a autocorrelação dos resíduos. A sugestão de HQ, AIC, FPE e LR de um VAR com 7 defasagens, apesar de limitar o tamanho da amostra, eliminou a correlação serial entre os resíduos e, portanto, originou um vetor autoregressivo melhor especificado. 30 Fonte: Elaborada pelo autor O resultado do teste de cointegração de Johansen. (1988, 1991) se mostrou conflitante dependendo da estatística adotada como demonstrado na tabela 3. Segundo a estatística do máximo autovalor existe uma relação de longo prazo entre dividendo e preço da forma Pt – θDt particularmente definida pelo vetor ( 1 -97.60 ). Vamos nos referir a esta relação como uma equação S_1 = Pt – 97.60*Dt para simulações posteriores. Fonte: Elaborada pelo autor Adicionalmente infere-se outra relação de longo prazo por meio do Teste de Cointegração de Engle-Granger, que basicamente é uma regressão simples da série de preços sobre a série de dividendos. Apesar de se considerar a especificação S_1t teoricamente mais rigorosa por estar sujeita a testes de diagnósticos mais extensos, a tentativa de se chegar a uma relação alternativa de cointegração é válida no sentido de se testar a robustez do modelo teórico. Esta relação é definida pelo vetor de cointegração ( 1 -29.96 ) e denominada S_2t = Pt – 29.96*Dt. Ao se fazer o teste de raiz unitária ADF para a série em nível (não demonstrado aqui) verificase uma relação instável e não-estacionária e, portanto, não se prosseguirá com testes do MVP 31 a retornos constante em S_2t, com o VAR, sendo especificado apenas pela variável S_1t, esta sim, uma série comprovadamente estacionária conforme mencionado. Estimação do Vetor Auto-regressivo e Teste do Modelo a Valor Presente Inicialmente deve-se definir a ordem do vetor auto-regressivo formado pelas séries S_1 e ∆Dt, utilizando a sugestão dos testes de critério de informação, que sugerem um VAR com três defasagens (SC e HQ) e seis defasagens (LR, FPE, AIC). Ao se realizar dois testes de diagnóstico nos resíduos do VAR, os testes de autocorrelação e o de heterocedasticidade, o modelo com três defasagens apresenta autocorrelação nos resíduos defasados em três períodos (p=3), apresentando um p-value de 0.004 e, portanto, rejeitando a hipótese nula de que não há correlação serial entre os resíduos do VAR. Optou-se pelo modelo com seis lags que elimina evidências de correlação serial e apresenta variância homogênea ao longo do tempo. Fonte: Elaborada pelo autor. A capacidade da razão dividendo-preço de prever retornos foi anteriormente verificada em outros trabalhos8. A principal característica desta abordagem é que se pode usar o modelo da razão de dividendos pelo preço para estimar o comportamento da relação dividendo-preço observada. Para isto, parte-se das estimativas de VAR, cujos coeficientes reportados são os elementos da matriz A, conforme tabela abaixo. Utiliza-se tais coeficientes e a equação (20) 8 Por exemplo em Shiller (1984) e por Flood, Hodrick e Kaplan (1986). 32 para computar a variável S_1_OTt (na equação representado por δ*t) como uma combinação linear das variáveis explicativas no VAR. Apenas ressaltando que ρ calculado foi de 0.99 de acordo com a definição de S_1t. Fonte: Elaborada pelo autor 33 34 Fonte: Elaborada pelo autor São feitos basicamente três testes para a comprovação do modelo a valor presente no mercado brasileiro, como o teste de Wald para restrições conjuntas impostas pelos coeficientes do VAR, como sugere a equação (22), o teste de causalidade de Granger entre os coeficientes e testes de razão unitária para as variâncias dos spreads observado e esperado. Se o modelo de valor presente a retorno constante for representativo do mercado, a variável S_1_OTt deveria corresponder ao peso unitário em S_1t e um peso nulo em ∆Dt.. De acordo com o teste de Wald para restrições conjuntas, rejeita-se a hipótese nula de que S_1t = S_1_OTt. A variável crescimento de dividendos apresentou significância estatística nula, com um desvio padrão de 14.949 bastante relevante em relação ao peso do coeficiente em ∆Dt na regressão de -11.611. No entanto o peso da variável S_1t sobre S_1_OTt é consideravelmente menor que a unidade. Na tabela esta ponderação equivale a 0.5072 com um erro padrão de 0.1438, significando que S_1_OTt, o previsor ótimo irrestrito do valor presente do crescimento real de dividendos futuros, tem uma sensibilidade equivalente à metade do S_1t; ou seja, a variável razão dividendo-preço move-se duas vezes mais. Como já era intuitivamente previsto, o teste de variância rejeita a hipótese de igualdade entre as variâncias das séries unitárias. Os coeficientes de determinação, R2, do VAR bivariado indicam um alto poder de explicação da variável S_1t e da variação dos dividendos ∆Dt., o que leva a crer que possa existir relação 35 de causalidade entre estas variáveis. Esta suposição é ratificada por um dos testes de causalidade de Granger: enquanto o teste da variável ∆Dt sobre S_1t rejeita a hipótese de efeitos pouco significativos, a hipótese de que S_1t não causa granger ∆Dt não é rejeitada. Este resultado diverge da proposição teórica de que a causalidade é unidirecional e no sentido de S_1t causar granger ∆Dt. Os resultados dos testes não corroboram com o sugerido pelo modelo teórico de valor presente. O teste de racionalidade realizado rejeita o MVP a retorno constante proposto e não se adequa à hipótese de expectativas racionais e competição no mercado acionário brasileiro. Segue abaixo a evolução de dois gráficos das séries dos desvios da média do spread teórico (S_1t) e o spread realizado (S_1_OTt), apresentando uma alta correlação de 0.8699. 8 4 0 -4 -8 -12 97 98 99 00 S_1 01 02 03 04 05 S_1_OT Gráfico 3 – Desvios da Média entre Spreads Teórico e Observado - θ=97.6 Período 4T1996 a 4T2005 Fonte: Elaborado pelo autor 9 O início dos gráficos acontece no 4o trimestre de 1996 uma vez que na composição da série S_1_OTt há perda de informações por este ser um VAR a seis defasagens. 36 5.2 Modelo de Valor Presente à Taxa de Retorno Constante - Ibovespa Teste de Raiz Unitária e Cointegração Procede-se aos testes de diagnósticos para o modelo a valor presente a retorno constante do IBOVESPA, analisando inicialmente as correspondentes séries de preços e dividendos em nível e a primeiras diferenças. Fonte: Elaborada pelo autor A série de preços em nível do IBOVESPA novamente comprova a presença de raiz unitária integrada de ordem 1 no testes de ADF e PP, bem como a série a primeiras diferenças evidencia estacionaridade. Apenas pelos testes ADF e PP, o resultado sobre a série de dividendos em nível é inconclusivo, com divergências, pois o último rejeita a hipótese nula da série possuir raiz unitária a 1% de significância. A justificativa encontrada para esta diferença já foi mencionada na seção anterior e, desta forma, realiza-se adicionalmente o teste KPSS no intuito de mitigar quaisquer dúvidas a respeito da série. O resultado final do KPSS evidencia que a série de dividendos em nível não é estacionária e, portanto, pode-se prosseguir à etapa de definição da possível relação de longo prazo existente entre Dt e Pt. O teste de critério de informação ajuda a definir o número ótimo de defasagens na relação de cointegração entre as duas variáveis, com Schwarz sugerindo apenas um lag (não demonstrado aqui). Novamente analisou-se a cointegração entre as séries utilizando a escolha do VAR a uma defasagem para descobrir a presença de uma combinação linear entre as séries, usando o Teste de Johansen. 37 Fonte: Elaborada pelo autor A estimativa de máximo autovalor rejeita a hipótese da ausência de relação de cointegração e sugere a presença de uma matriz com posto igual a 1. O teste do traço também rejeita H0 com sua estimativa ficando bastante próxima do valor crítico a um nível de confiança de 95%. A hipótese de p menor ou igual a 1 não é rejeitada e, portanto, pode-se assumir a existência da relação de cointegração entre Dt e Pt. Adicionalmente, o teste de cointegração de EngleGranger indica a presença de relação de longo prazo ao rejeitar autocorrelação da série de resíduos originadas da equação de regressão simples. Chamar-se-á esta relação de S_2t. Fonte: Elaborada pelo autor Existem evidências que ambas as combinações lineares Pt – θDt, a primeira sugerida pelo teste de Johansen (S_1t) bem como a obtida do teste de Engle-Granger (S_2t), são estacionárias e, portanto, pode-se compará-las com a proposição teórica do MVP a retornos constantes. Estimação do Vetor Auto-regressivo e Teste do Modelo a Valor Presente Utiliza-se os métodos de critérios de informação para a determinação dos lags ótimos do VAR definido em S_it, i=1,2. Segue-se a sugestão feita pelo método de Schwarz para S_1t e Schwarz e Hannan-Quinn para S_2t de uma defasagem ótima. As especificações dos sistemas 38 se mostraram insatisfatórias de acordo com o resultado de testes de resíduos (não explicitados neste artigo), pois apresentaram inicialmente correlação serial. Conseqüentemente, optou-se pelas sugestões seguintes dos critérios de informação, ou seja, para S_1t adotaram-se quatro defasagens baseado no teste LR e para S_2t, cinco defasagens de acordo com os testes LR, FPE, AIC e HQ. Concluiu-se que com estas premissas os dois vetores auto-regressivos ficam bem especificados e, além disso, pelos testes de heterocedasticidade sem os termos dos produtos cruzados não se detecta a heterocedasticidade nas séries. Fonte: Elaborada pelo autor As tabelas 11 e 12 detalham os resultados para duas versões do MVP a retornos constantes do IBOVESPA, S_1t e S_2t. A primeira versão é baseada num sistema de VAR com quatro lags e variáveis auto-regressivas de razão dividendo-preço e crescimento real de dividendos, enquanto que a segunda versão trabalha com um número ótimo de cinco defasagens e com as mesmas variáveis explicativas descritas para S_1t. Reporta-se os resultados e os testes que comprovam ou não se o modelo está adequado às expectativas racionais no mesmo painel, discriminando os dados para cada versão. Novamente testar-se-á a capacidade do modelo de razão dividendo-preço de prever retornos10 e quais implicações geradas das estimativas do VAR. No início da tabela, reporta-se aos vetores auto-regressivos com as variáveis conhecidas no início do período t: as relações 10 Esta característica já foi testada e verificada em outros trabalhos, como Shiller (1984) e por Flood, Hodrik e Kaplan (1986). 39 dividendo-preço S_it, i=1,2 e o crescimento real de dividendos ∆Dt. Estas variáveis serão usadas no sistema VAR de primeira ordem. Caso as duas versões estejam corretas, de tal forma que o retorno real esperado para as ações no mercado brasileiro sejam constantes ao longo do tempo, então os coeficientes da regressão destas variáveis explicativas devem ser iguais a zero. Uma característica peculiar desta abordagem é que se pode usar o modelo de dividendos e analisar suas implicações para prever o comportamento da razão dividendopreço. Conforme as estimativas de VAR para S_1t e S_2t, os coeficientes são os elementos da matriz A e usa-se estes coeficientes junto com a equação (15) para computar as variáveis S_i_OTt, i=1,2, uma combinação linear das variáveis explicativas dos respectivos VAR. Fonte: elaborada pelo autor 40 41 Fonte: Elaborada pelo autor Para comprovar a veracidade do MVP a retornos constantes analisa-se as restrições conjuntas do sistema submetendo-as ao teste de Wald. Caso a hipótese nula de que todas as restrições sejam iguais a zero for aceita estará confirmada a proposição teórica a retornos constantes. O resultado do teste de Wald não ratifica a teoria, rejeitando H0 mesmo fazendo uma sensibilidade variando-se o ρ para cada versão do modelo. O teste de causalidade de Granger apresentou resultados distintos. No VAR contendo S_1t e ∆Dt conclui-se que existe uma relação de causalidade unidirecional onde S_1t causa granger ∆Dt, mas a recíproca não é verdadeira a 5% de significância. Esta constatação está bastante em linha com o que sugere a leitura dos respectivos coeficientes de determinação, ou seja, de uma relação com alto grau explicativo em ∆Dt, R2 igual a 0.723, enquanto que a equação para estimação de S_1t possui baixa confiabilidade, com R2 igual a 0.395. O VAR composto por S_2t e ∆Dt apresenta coeficientes de determinação bem significativos, de 0.627 e 0.819 42 respectivamente, sugerindo causalidade bidirecional entre as variáveis. A prova real desta conclusão é o teste de causalidade de Granger, que rejeita ambas hipóteses nulas a um nível de significância menor que 1%, posto que seus p-values são iguais a 0.007 e zero, respectivamente. Os testes de razão unitária para as variâncias dos spreads observado e esperado também apresentam resultados conflitantes e pode-se afirmar que a diferença entre as volatilidades de S_1t e S_1_OTt é estatisticamente significativa, enquanto que não há rejeição da hipótese de igualdade das variâncias na segunda versão. Estes resultados intuitivamente já eram previstos quando analisamos a regressão de S_i_OT t sobre S_it, i=1,2. Na 1a versão a sensibilidade do coeficiente de S_1t é próxima de um enquanto que a sua sensibilidade ao crescimento real de dividendos é extremamente alta, isto é, para cada variação de unidade em ∆Dt altera-se em dez vezes relação dividendo-preço, se tudo mais constante. Pode-se especular que esta alta volatilidade originada pelos dividendos justifica o diferencial de variâncias. Já na 2ª versão do modelo a sensibilidade do coeficiente de S_2t também é próxima da unidade, no entanto a magnitude do coeficiente em ∆Dt é bem menor tornando o estimador ótimo mais “aderente” ao spread observado. Desta forma a hipótese de σ2(S_2t) / σ2(S_2_OTt) =1 não é rejeitada. Em Anchite e Issler (2001) os mesmos testes empíricos foram realizados e não se pôde rejeitar a grande maioria das implicações do MVP a taxa de retorno, mesmo assumindo que este é baseado em hipóteses pouco realistas. Segue a evolução dos gráficos das séries dos desvios entre o spread observado (S_1t, S_2t) e o spread ótimo (S_1_OTt , S_2_OTt), com correlações de 0.628 e 0.792 respectivamente11. 11 O início do gráfico S_1t vs S_1_OTt acontece no 2o trimestre de 1996 uma vez que na composição da série S_1_OTt houve perda de informações por este ser um VAR a quatro defasagens. A mesma lógica serve para o gráfico S_2t vs S_2_OTt, que começa no 3o trimestre de 1996 com o previsor ótimo sendo um VAR a cinco defasagens. 43 8 4 0 -4 -8 96 97 98 99 00 01 S_1 02 03 04 05 S_1_OT Gráfico 4 – Versão 1: Desvios da Média entre Spreads Teórico e Observado - θ=54.4 Período 2T1996 a 4T2005 Fonte: Elaborado pelo autor 11 10 9 8 7 6 5 4 3 2 97 98 99 00 S_2 01 02 03 04 05 S_2_OT Gráfico 5 – Versão 2: Desvios da Média entre Spreads Teórico e Observado - θ=23.3 Período 3T1996 a 4T2005 Fonte: Elaborado pelo autor 44 5.3 Modelo de Valor Presente à Taxa de Retorno Variável - VWI Teste de Raiz Unitária e Cointegração A partir desta seção estudar-se-ão as séries logaritmizadas dos preços e dividendos normalizados do Value Weighted Index. Como convenção adotam-se para séries em logaritmo letras minúsculas pt e dt, respectivamente. Da mesma forma a taxa livre de risco, será representada pela série da SELIC, é denominada por rt. Neste estudo trabalharemos com dois tipos de VAR, um bivariado em função das séries δt e rt- ∆dt e outro trivariado dependente das séries δt, rt e ∆dt. Segue a tabela com os resultados dos testes de razão unitária de cada série em questão. Fonte: Elaborada pelo autor O resultado confirma a não-estacionaridade da série de preços com os testes de ADF e PP aceitando a hipótese de presença de raiz unitária e exibindo estatísticas de -1.018 e -1.079, respectivamente. A mesma série em primeiras diferenças, ∆pt, evidencia a condição de nãoestacionária com ambos os testes rejeitando H0 a 1% de significância e indicando realmente que pt possui apenas uma raiz unitária. 45 O teste ADF sobre a série de taxas de juros rejeita a hipótese nula a 1% de significância e estatística de -3.706, enquanto que PP rejeita esta série a 5% de significância e estatística de 3.590. A conclusão de rt estacionária está em conformidade com a intuição inicial ao se visualizar o gráfico da série ao longo do tempo na Figura 1. A série de dividendos apresenta resultados conflitantes entre os testes ADF e PP, com o primeiro aceitando H0 e o segundo rejeitando a hipótese nula ao nível de 1% de significância e estatística -5.365. Desta forma foi necessário o resultado do teste adicional KPSS que rejeitou H0: a série não possui raiz unitária, a 1% de significância. A combinação linear entre as séries de dividendos e taxas de juros, rt - ∆dt, como era esperado pelas próprias características das séries isoladamente, se mostrou estacionária com ADF e PP rejeitando a hipótese nula a 1% de significância e estatísticas de -12.976 e -22.347 respectivamente. A série de dividend yield, δt, apresentou divergência entre os dois testes, aceitando H0 no ADF com a estatística do teste (-2.92) muito próxima ao valor crítico a 5% de significância (-2.04) e, portanto, com pouca margem de confiabilidade. Apesar de PP ter rejeitado a série ao nível de 1% de significância resolveu-se mais uma vez fazer o teste KPSS, cujo resultado indicou a série como estacionária. Estimação do Vetor Auto-regressivo e Teste do Modelo a Valor Presente Como dito anteriormente, serão usados duas versões de VAR para a constituição do MVP, um sistema bivariado utilizando as variáveis δt e rt- ∆dt e um sistema trivariado, usando δt, rt e ∆dt como variáveis em separado. Para a determinação do número ótimo de defasagens utilizar-se-ão novamente os testes de critério de informação. Para a 1a versão do modelo segue-se inicialmente o sugerido pelo teste de Schwarz, ou seja, três lags para o VAR. No entanto este sistema se mostra mal especificado ao detectar correlação serial de resíduos. Opta-se, portanto, pela defasagem de ordem seis sugerida pelos testes de LR, FPE, AIC e HQ, que se mostra bem especificado eliminando qualquer dependência entre seus resíduos ao longo do tempo. Procede-se da 46 mesma forma para o VAR trivariado e para a modelagem do VAR utiliza-se a sugestão dos testes FPE e HQ de três defasagens somente, suficiente para obtermos resultados satisfatórios nos testes de autocorrelação. Ao se testar o comportamento da variância das séries conclui-se pela homocedasticidade dos resíduos como é apresentado abaixo. Fonte: Elaborada pelo autor A teoria do modelo de valor presente com retornos constantes não requer a estimação de parâmetros, pois estes foram calculados por meio dos testes de cointegração. Na realidade quando se assume uma relação de longo prazo Pt - θ*Dt, a taxa de retorno constante implícita do modelo é R=1/θ e o fator de desconto ρ é igual a 1/(1+R). Por outro lado, no MVP com retorno variável no tempo há a necessidade de arbitrar este parâmetro que representa o fator de desconto temporal ρ . A teoria citada anteriormente na equação (15) sugere que este parâmetro pode ser definido a partir da equação abaixo. ρ≡ 1 , 1 + exp d − p ( ) (29) onde d − p significa a média do log da razão dividendo-preço, equivalente a –4.656 extraído da estatística descritiva da série dt - pt. Consequentemente o ρ utilizado será 0.991. Além disso, basea-se nos resultados dos testes de cointegração do VWI no MVP a retorno constante para arbitrar outros ρ. Pela equação de Johansen o fator de desconto temporal se 47 aproxima de 0.989, enquanto que pela equação de Engle-Granger este fator é de 0.968. Desta forma se pode fazer uma análise de sensibilidade do MVP variando os diversos fatores de desconto e verificando a robustez da proposição teórica. Fonte: elaborada pelo autor 48 49 Fonte: Elaborada pelo autor O teste de Wald exposto na tabela 16 apresenta um resultado que ratifica o modelo teórico para as duas versões do modelo sob análise, ou seja, não há rejeição da hipótese nula de que as restrições impostas aos modelos são verdadeiras. No teste foram feitos simulações variando o ρ para testar a robustez dos modelos bivariado e trivariado: assumindo ρ=0.991, os pvalues obtidos foram de 99.97% e 99.98%, respectivamente. Os mesmos níveis de significância foram observados quando se varia ρ para 0.989. Os níveis de significância dos modelos se mostram muito pouco sensíveis quando ρ=0.968, apresentando p-values ainda muito próximos de 100%. Realiza-se o teste promovendo uma queda considerável no ρ, para 0.85, não apresentado na tabela. Apesar deste valor não ser representativo de nenhuma relação entre as séries de dividendos e preços e, portanto, irreal, este cálculo é válido a fim de estressar ao máximo a confiabilidade dos modelos. Novamente não se verifica a rejeição de 50 H0 tanto para restrições impostas ao δ’t bivar como ao δ’t trivar, com p-values de 99.71% e 99.33%, respectivamente. O teste de causalidade de Granger no modelo bivariado apresentou consistência em relação ao poder explicativo dos vetores auto-regressivos. Nota-se uma relação de causalidade bidirecional entre δt e rt-∆dt que confirma os altos coeficientes de determinação (R2) dos respectivos VARs: 65.7% e 83.2%, respectivamente. É importante ressaltar que este resultado confirma a proposição teórica de que δt causa granger rt-∆dt. O teste aplicado ao modelo trivariado confirma a intuição econômica de que não há evidências de relação de causalidade entre o logaritmo da taxa selic e as variáveis δt e ∆dt, corroborado pelo baixo R2 de 35.4%. Por outro lado, entre δt e ∆dt existe uma relevante relação de causalidade bidirecional comprovado por níveis de significância abaixo de 5%, isto é, p-values a 4% e zero. Este resultado está refletido no VAR cuja variável dependente é ∆dt, pois apresenta um elevado coeficiente de determinação de 78.5%. Já no VAR cuja variável dependente é δt, o baixo R2 de 49.8% deixa margem de dúvida em relação ao poder explicativo de suas variáveis regressivas, talvez mais influenciado pelos efeitos de rt. O testes de razão de variância sugerem resultados distintos para ambos os modelos. No modelo bivariado aceita-se a hipótese de que a razão entre a variância de δt e a variância de δ’t bivar é igual à unidade com p-value de 20%. Ao contrário do modelo trivariado, que rejeita a hipótese com um nível de significância de 2.4%. A análise das implicações das estimativas do VAR sugere que as séries δt e rt-∆dt têm parâmetros de sensibilidade de 0.996 e 0.153, respectivamente, em relação ao previsor δ’t bivar. A análise do modelo trivariado, no entanto, apesar de sugerir um coeficiente de 0.963 para a variável δt e de -0.0207 para ∆dt, atribui uma magnitude ao coeficiente de rt muito alta, de -5.843. Como esta variável pouco explica o spread ótimo entre dividendos e preços (δ’t trivar), conforme visto no teste de causalidade de Granger, é natural e intuitivo que sua medida de volatilidade seja estatisticamente diferente de δt, rejeitando desta forma a hipótese nula do teste de razão de variância. 51 Os gráficos das séries do spread dividendo-preço ótimo e observado nos gráficos 6 e 7 possibilitam visualizar quão aderente é o modelo teórico à série observada12. Particularmente para o modelo bivariado verifica-se uma correlação entre as séries de 81.1% e a variância do spread teórico δ’t bivar equivalente a 2/3 da variância do spread observado. No modelo trivariado a correlação é menor, porém ainda elevada, de 70.6% e a proporção relativa entre as variâncias cai para 50%. -3.2 -3.6 -4.0 -4.4 -4.8 -5.2 -5.6 -6.0 -6.4 97 98 99 00 01 Spread Observado 02 03 04 05 Spread Teórico Gráfico 6 – Modelo Bivariado: Desvios da Média entre Spreads Teórico e Observado Período 4T1996 a 4T2000 Fonte: Elaborado pelo autor -3.2 -3.6 -4.0 -4.4 -4.8 -5.2 -5.6 -6.0 -6.4 96 97 98 99 00 Spread Observado 01 02 03 04 05 Spread Teórico Gráfico 7 – Modelo Trivariado: Desvios da Média entre Spreads Teórico e Observado Período 1T1996 a 4T2005 Fonte: Elaborado pelo autor 12 O início do gráfico δt vs δ’t bivar acontece no 4o trimestre de 1996 uma vez que na composição da série δ’t bivar houve perda de informações por este ser um VAR a seis defasagens. A mesma lógica serve para o gráfico δt vs δ’t trivar, que começa no 1o trimestre de 1996 com o previsor ótimo sendo um VAR a três defasagens. 52 5.4 Modelo de Valor Presente à Taxa de Retorno Variável - Ibovespa Teste de Raiz Unitária e Cointegração Assim como foi feito no estudo das séries a partir do VWI, extraem-se as séries logaritimizadas dos preços e dividendos normalizados do IBOVESPA, sempre sob a ótica de duas versões distintas do MVP a retornos variáveis no tempo, uma bivariada em função das variáveis δt e rt-∆dt e a versão trivariada em função de δt, rt e ∆dt. Novamente recorrem-se aos testes de diagnósticos destas variáveis. Os resultados foram bastante satisfatórios sob o ponto de vista de estacionaridade das séries, bastando apenas os testes de ADF e PP para confirmar a presença de raiz unitária na série de preços do IBOVESPA, com a não rejeição de H0. Também confirma-se como séries estacionárias ∆pt, ∆dt, rt e rt - ∆dt. O resultado da análise sobre a série logaritmizada dos dividendos se mostrou conflitante entre os testes ADF e PP, com o segundo rejeitando a hipótese da existência de raiz unitária a um nível de significância menor que 1%. Desta forma utilizou-se adicionalmente o teste de KPPS que confirmou a não-estacionaridade de dt. A série do log da razão dividendo-preço, δt, a verificar-se única e exclusivamente pelos resultados dos testes, seria “explosiva”, pois tanto o teste ADF como o KPSS indicam a presença de raiz unitária, apesar do teste PP ter rejeitado fortemente esta hipótese. No entanto, como se verá na etapa seguinte os testes de cointegração entre dt e pt detectam uma relação de longo prazo entre essas variáveis e, por conseqüência, sugerem a estacionaridade em δt. 53 Fonte: Elaborada pelo autor Como os testes de raiz unitária não confirmam estacionaridade da série δt, tenta-se verificar esta propriedade aplicando um teste de cointegração de Johansen sob restrições nos coeficientes de dt e pt , ao se assumir que o vetor que define esta possível relação é (1, -1). Conforme os testes de critério de informação não demonstrados aqui, o número de defasagens ótimas sugeridas para o VAR foi de quatro defasagens. Fonte: Elaborada pelo autor De acordo com o teste de cointegração de Johansen elaborado acima verifica-se que com a restrição imposta sobre as séries dt e pt existe uma relação estacionária conforme sugere a teoria por trás do MVP. 54 Estimação do Vetor Auto-regressivo e Teste do Modelo a Valor Presente Para o VAR bivariado seguimos a sugestão dos testes de critério de informação LR, FPE, AIC e HQ, isto é, quatro defasagens ao modelo suficiente para eliminar correlações seriais entre seus resíduos. Apesar do teste de Schwarz sugerir apenas um lag, este VAR se mostrou mal especificado, pois não conseguiu eliminar as interdependências entre os erros. Para o VAR trivariado usa-se um número de lags ótimo de três apesar deste número não ter sido sugerido por nenhum teste. Não se usa uma defasagem como a maioria dos testes indica pois no teste de autocorrelação este VAR mostra-se mal especificado. Da mesma forma não se usam oito lags como o teste AIC menciona, uma vez que o tamanho da nossa amostra é relativamente curto, apenas 44 períodos, e perderia muita informação ao assumir uma autoregressão de oito períodos. No entanto, ao construir o VAR com três lags percebe-se que toda a correlação entre resíduos é eliminada. O teste de heterocedasticidade não rejeita a hipótese de variância constante ao longo do tempo conferindo mais esta propriedade a ambos os VARs. Fonte: Elaborada pelo autor Arbitra-se o parâmetro ρ que representa o fator de desconto temporal da equação (15) pelas definições já adotadas na abordagem do modelo utilizando como série dados do VWI. Utilizando dados da estatística descritiva da série, que indica a média da razão dividendopreço equivalente a –5.117, chega-se ao valor de ρ=0.994. 55 Alternativamente, recorre-se novamente tanto ao teste de cointegração de Johansen quanto ao teste de Engle-Granger do modelo de valor presente a retornos constantes para se chegar a ρ=0.982 e ρ=0.959, respectivamente. A tabela 21 apresenta os resultados dos testes nas duas versões do MVP para retornos variáveis para o índice IBOVESPA no período de 1T1995 a 4T2005. O teste de Wald para restrições conjuntas mais uma vez vai de encontro com a proposição teórica nas duas versões testadas e, adicionalmente, faz-se um teste de sensibilidade para cada versão do MVP variando ρ igual a 0.994, 0.982 e 0.959 a partir das definições acima mencionada. Conseqüentemente, testa-se a robustez dos modelos ao assumirmos ρ de diversas magnitudes. Todos os testes aceitam fortemente o modelo sob as restrições impostas e, quando se diminui a magnitude de ρ, o p-value de cada teste se mostra pouco sensível a tais variações: no modelo bivariado, p-values de 99.98%, 99.98% e 99.96% respectivamente, enquanto que o modelo trivariado apresenta em todos os p-values 100%. O teste de causalidade de Granger para o modelo de duas variáveis indica para uma relação de causalidade unidirecional com a hipótese nula H0: δt não causa granger rt- ∆dt sendo rejeitada a um nível de significância de 1.4%. Contudo, observa-se a evidência de que a recíproca não é verdadeira, pois para hipótese H0: rt - ∆dt não causa granger δt o p-value é 14.5%. Esta conclusão faz sentido com a análise feita apenas para os R2 do vetor auto-regressivo do modelo bivariado, sendo o poder explicativo da equação rt- ∆dt (77.8%) bem maior que ao da equação cuja variável dependente é δt (53.3%). Os resultados do modelo trivariado apresentam conclusões diversas, com a variável rt não apontando interação causal com as demais variáveis δt e ∆dt como já era esperado pela análise de R2 do VAR, com um baixo patamar de 31.54%. Curiosamente o VAR cuja variável dependente é δt apresenta um coeficiente de determinação de 50.26% com evidências de que a variável ∆dt causa granger δt, com p-value próximo de zero. Por outro lado o VAR da dependente ∆dt possui um poder explicativo maior de 75.3% apesar das variáveis rt e δt não acusarem causalidade de acordo com o teste de causalidade de Granger, com p-values de 29.55% e 10.94%, respectivamente. O teste de razão unitária entre a variância da versão bivariada ( δ't bivar) e a variância do δt rejeitou H0 a um nível de significância de 5%, com p-value de 4.42%, enquanto que o mesmo teste entre as volatilidades do δ't trivar e do δt foi rejeitado mais fortemente, com p-value de 56 2.3%. Analisando as implicações das estimativas do VAR pode-se especular que esta maior intensidade na rejeição do segundo teste tem como origem principal uma sensibilidade à variável rt de -1.46, bem maior em valor absoluto que a sensibilidade de 0.233 no modelo bivariado. É importante ressaltar que, apesar de diferentes, os coeficientes das variáveis δt e ∆dt em ambas as regressões simples possuem praticamente a mesma magnitude (0.992 vs. 0.981 e -0.233 vs. -0.250) e, aparentemente, não são o motivo que justificam a diferença de pvalues entre os dois testes. Fonte: elaborada pelo autor 57 58 Fonte: Elaborada pelo autor Os gráficos das séries do spread dividendo-preço ótimo e observado possibilitam visualizar a evolução do modelo teórico se comparado à série observada13. Tornam-se explícitas as correlações existentes entre os spreads, já calculados na tabela 21, e as diferenças de volatilidade entre as séries. Particularmente para o modelo bivariado verifica-se uma correlação entre as séries de 72.9% e a variância do spread teórico δ’t bivar equivalente a pouco mais da metade da variância do spread observado. No modelo trivariado a correlação é marginalmente menor, de 70.8%, e a proporção entre as variâncias se repete. 13 O início do gráfico δt vs δ’t bivar acontece no 2º trimestre de 1996 uma vez que na composição da série δ’t bivar houve perda de informações por este ser um VAR a quatro defasagens. A mesma lógica serve para o gráfico δt vs δ’t trivar, que começa no 1º trimestre de 1996 com o previsor ótimo sendo um VAR a três defasagens. 59 -3 -4 -5 -6 -7 -8 96 97 98 99 00 01 Spread Observado 02 03 04 05 Spread Teórico Gráfico 8 – Modelo Bivariado: Desvios da Média entre Spreads Teórico e Observado Período 2T1996 a 4T2005 Fonte: Elaborado pelo autor -3 -4 -5 -6 -7 -8 96 97 98 99 00 Spread Observado 01 02 03 04 05 Spread Teórico Gráfico 9 – Modelo Trivariado: Desvios da Média entre Spreads Teórico e Observado Período 1T1996 a 4T2005 Fonte: Elaborado pelo autor 60 6 CONCLUSÃO Este estudo atesta a validade de modelos sob premissas de eficiência no mercado acionário brasileiro. Adicionalmente examinou-se a evolução no tempo da razão dividendo-preço de ações relativo às expectativas de crescimento de dividendos futuros e taxas de desconto. Constatou-se que o modelo de valor presente à taxa de retorno constante foi rejeitado ao ser submetido aos testes econométricos. Este resultado induz a assumir inúmeras hipóteses a respeito do modelo e do mercado. Inicialmente, existe a hipótese de um mercado que se move de acordo com as expectativas racionais e, portanto, esta versão do MVP não daria suporte teórico à movimentação de preços das ações, nem ao comportamento de seus agentes. Mantido este cenário, pôde-se supor adicionalmente que o modelo não reflete de forma imediata a nova informação, não incorporando automaticamente o valor intrínseco de suas variáveis explicativas, pela ausência de competição no mercado acionário. Consequentemente, ao assumir expectativas racionais sem competição, seria permitido ao investidor ganhos num determinado espaço de tempo gerados por oportunidades de arbitragem. Pode-se também admitir que existem alguns investidores no mercado que apresentam o mesmo comportamento irracional a ponto de eliminar a influência do especulador racional nos preços das ações, mesmo que o modelo seja o correto. Esta hipótese de ineficiência do mercado abre espaço para a defesa da gestão ativa que tenta identificar e capturar excessos de retorno em equities. Anchite e Issler (2001) chegam a uma conclusão diferente para seu modelo de valor presente a retorno constante, uma vez que não é rejeitado e confirmando que os agentes atuam de forma racional. Esta divergência pode ser justificada pela diferença no período amostral estudado, de 1986 a 1998. Este período incorpora dois regimes inflacionários distintos no Brasil antes e depois do Plano Real (1994) o que pode alterar substancialmente o padrão das séries de preços, dividendos e taxas de retorno se comparado com as séries analisadas neste trabalho. O modelo de valor presente à taxa de retorno variável não é rejeitado, independente da sua característica, se bivariada ou trivariada, ou mesmo do índice representativo do mercado, se Ibovespa ou VWI - aliás é importante ressaltar a contribuição à literatura brasileira da análise, até então inédita, realizada sobre modelos trivariados e a utilização de um índice diferente do Ibovespa. Os resultados obtidos comprovam uma grande aderência do spread teórico ao spread observado. Em termos práticos, diante de uma nova informação, qualquer alteração na 61 esperança dos dividendos futuros e dos retornos da ação alterará de forma precisa e simultânea o dividend yield corrente. Desta forma, o modelo é consistente com a hipótese de mercados eficientes na forma fraca, onde é impossível produzir retornos consistentemente superiores à carteira teórica de mercado, utilizando estratégias baseadas em preços passados. A incapacidade do mercado e de gerar excessos de retorno dado que todos os agentes têm acesso à mesma informação dá suporte à gestão passiva em detrimento à gestão ativa de portfolios. Várias implementações podem ser realizadas na tentativa de melhorar a confiabilidade dos modelos de valor presente. A começar por uma reflexão sobre quais fundamentos de valor podem efetivamente alterar o valuation de empresas e a expectativa de retornos de suas ações listadas. Ao invés de se usar a perspectiva de crescimento futuro de dividendos para prever o comportamento de preços, poder-se-ia substituí-la por outras variáveis explicativas como fluxo de caixa de empresas ao longo dos anos, evolução do patrimônio líquido das empresas correspondentes às ações da amostra, múltiplos como P/BV14, etc. e discriminar a contribuição gerada por esta alteração. Campbell e Shiller (1988b) incluem em seu modelo uma média móvel de longo prazo de lucros das empresas sob a análise, chegando à conclusão que esta nova variável ajuda a prever o valor presente de dividendos futuros, levando a crer que dados passados são fonte de informação relevante a respeito de fluxo descontado de dividendos futuros. Fica como sugestão para o futuro, sempre buscando o aprimoramento deste trabalho um estudo similar, mas usando quebras em um período amostral maior. O período de 1995 a 2005 em questão no Brasil sofreu influências de inúmeros eventos, muitos deles capazes de alterar a estrutura de séries, como por exemplo a implantação dos Juros sobre Capital Próprio (JCP), em 1996, que gerou benefícios fiscais a ponto de mudar a propensão histórica das firmas em distribuir seus dividendos15. Além disso, apenas para ativar as memórias, as crises da Ásia e Rússia, em 1997 e 1998 respectivamente, tiveram conseqüências importantes no cenário macroeconômico brasileiro e no cash management das empresas. Finalmente, a crise de racionamento em 2001 foi um evento que alterou o padrão de consumo de toda a população brasileira, afetou significativamente o fluxo de caixa e a estrutura de capital das firmas. Aqui, 14 15 P/BV leia-se price-to-book value ou a razão entre preço da ação e o patrimônio líquido. Ver Ness JR., W. L. e Zani, J. (2000) e Silva, J., Lima, M. e Brito, R. (2005). 62 se fosse implementado o estudo das quebras, o resultado poderia ser pouco confiável dado que os períodos teriam poucas observações. 63 Referências Bibliográficas ANCHITE, Claudine Furtado; ISSLER, João Victor. Racionalidade e Previsibilidade no Mercado Brasileiro de Ações: Uma Aplicação de Modelos de Valor Presente. Ensaios Econômicos, EPGE no 415, 04/2001. BLACK, Fischer; SCHOLES, Myron. The Effects of Dividend Yield and Dividend Policy on Common Stock Prices and Returns. Journal of Financial Economics, v.1, pp.1-22, 1974. CAMPBELL, John Y.; LO, Andrew W.; MACKINLAY, A. Craig. The Econometrics of Financial Markets. Princeton University Press, 1997, 2a edição, pp. 253-287. CAMPBELL, John Y.; SHILLER, Robert J. Cointegration and Tests of Present Value Models. Journal of Political Economy, vol. 95, no 5, pp. 1062-1088, 1987. ______. The Dividend-Price Ratio and Expectations of Future Dividends and Discount Factors. Review of Financial Studies, 58, pp. 495-514, 1988a. ______. Stock Prices, Earnings and Expected Dividends. Journal of Finance, 43, pp. 661676, 1988b. Cati, Regina Celia; Garcia, Márcio G. R.; Perron, Pierre. Unit Roots in the Presence of Abrupt Governmental interventions with an application to Brazilian Data. Journal of Applied Econometrics, 14, pp. 27-56, 1999. DAVIDSON, Russel; MACKINNON, James G. Estimation and Inference in Econometrics. Oxford University: Oxford, 1993. DICKEY D. e FULLER, W. Distribution of the Estimates for Autoregressive Time Series with a Unit Root. Journal of the American Statistical Association 74, pp. 427-31, 1979. ENDERS, Walter. Applied Econometric Time Series. JohnWiley e Sons, 1995. ENGLE, Robert F.; GRANGER, Clive W. J. Cointegration and Errors Correction: Representation, Estimation and Testing. Econométrica, 55, pp.251-276, 1987. FAMA, Eugene; French, Ken. Dividend Yields and Expected Stock Returns. Journal of Financial Economics, vol.22, pp. 3-26, 1988. FLOOD, Robert P.; HODRICK, Robert J.; KAPLAN, Paul. An Evaluation Of Recent Evidence on Stock Market Bubbles. Working Paper 1971, National Bureau of Economic Research, Cambridge, Mass, 1986. 64 GORDON, M. J. The Investment Financing and Valuation of the Corporation. Irwin, Illinois: Homewood, III, 1962. GRANGER, Clive W. J. Investigating Causal Relations by Econometric Models and CrossSpectral Methods. Econometrica, 37, pp. 424-438, 1969. JOHANSEN, S. Statistical Analysis of Cointegration Vectors. Journal of Economic Dynamics and Control, vol. 12, pp.231-254, 1988. ______. Estimation and Hypothesis Testing of Cointegration Vectors in Gaussian Vector Autoregressive Models. Econometrica, vol. 59, pp.1551-1580, 1991. LUCAS, R. Asset Prices in an Exchange Economy. Econometrica, vol. 46, pp.1429-1445, 1978. NESS JR., Walter Lee; ZANI, João. Os Juros Sobre Capital Próprio Versus a Vantagem Fiscal do Endividamento. Revista de Administração, São Paulo v. 36, n.2, p. 89-102, abril/junho 2001. PESSOA, Marcelo de Sales; BONOMO, Marco Antonio; GARCIA, René. Reproduzindo os Momentos dos Retornos dos Ativos Brasileiros com Aversão ao Desapontamento Generalizado. Texto para Discussão – EPGE/FGV-RJ, 2006. PHILLIPS, Peter; PERRON, Pierre. Testing for a Unit Root in Time Series Regression. Biometrika 75, pp. 335-46, 1988. SHILLER, Robert J. Do Stock Prices Move Too Much to Be Justified by Subsequent Changes in Dividends? American Economic Review, 71, No.3, pp. 421-436, 1981. ______. Stock Prices and Social Dynamics. Brookings Papers on Economic Activity, 2, pp. 457-498, 1984. SILVA, Julio C.; LIMA, Mônica R.; BRITO, Ricardo D. Sobre O Crescimento da Remuneração Direta Aos Acionistas: Economia de Impostos ou Mudança nas Características das Firmas. Anais do V Encontro Brasileiro de Finanças, 2005. TORRES, Ricardo; BONOMO, Marco Antonio; FERNANDES, Cristiano. A Aleatoriedade do Passeio na Bovespa: Testando a Eficiência do Mercado Acionário Brasileiro. Ensaios Econômicos da EPGE no. 402, 2000. WEST, Kenneth D. Dividend Innovations and Stock Price Volatility. Econometrica, 56, 3761, 1988b. 65 APÊNDICE – Derivando a equação (9) Na função descrita pela equação (9) pode-se usar uma expansão de Taylor de primeira ordem da função não-linear f(xt+1) em torno da média de xt +1 , x : () ( )( ) f ( xt +1 ) ≈ f x + f ' x xt +1 − x , Onde f(xt+1) é uma função relacionada no modelo a: f ( xt +1 ) ≡ log(1 + exp(d t +1 − pt +1 )) . Procede-se a expansão de Taylor: ( ( )) ( )) ) ( )( ) ≈ log(1 + exp(d − p )) + exp(d − p ) [− (d − p )] + exp(d − p ) (d − p 1 + exp(d − p ) 1 + exp(d − p ) ) ≈ − log(1 + exp(d − p )) − exp(d − p ) log(exp(d − p )) + exp(d − p ) (d 1 + exp(d − p ) 1 + exp(d − p ) ) ≈ k + exp(d − p ) (d − p ) 1 + exp(d − p ) f ( xt +1 ) ≈ log 1 + exp d − p + f ( xt +1 f ( xt +1 f ( xt +1 1 exp d − p d t +1 − pt +1 − d − p 1 + exp d − p ( t +1 t +1 t +1 ) t +1 − pt +1 ) t +1 f ( xt +1 ) ≈ k + (1 − ρ )(d t +1 − pt +1 ) , Onde os parâmetros de linearização ρ e k podem ser definidos por ρ ≡ ( (30) ( ) exp d − p e 1 + exp d − p ) ( ) ⎛ 1 ⎞ ⎟⎟ , e d − p é igual à média do log da razão dividendo-preço16. k ≡ − log ρ − (1 − ρ ) log⎜⎜ ⎝ ρ −1⎠ Substituindo (30) em (8), obtém-se: rt +1 = ht +1 ≈ ξ t +1 = pt +1 − pt + k + (1 − ρ )(d t +1 − pt +1 ) = k + ρpt +1 + (1 − ρ )d t +1 − pt . 16 Para a dedução, ver Campbell, J, Lo, W. e MacKinlay, A.C. (1997)