Alexandre José dos Santos Modelos Vetoriais Auto-Regressivos com Transição Suave Estruturados por Árvores – STVAR-Tree Dissertação de Mestrado Dissertação apresentada como requisito parcial para obtenção do título de Mestre pelo Programa de PósGraduação em Engenharia Elétrica da PUC-Rio. Orientador: Prof. Álvaro de Lima Veiga Filho Rio de Janeiro Setembro de 2009 Alexandre José dos Santos Modelos Vetoriais Auto-Regressivos com Transição Suave Estruturados por Árvores – STVAR-Tree Dissertação apresentada como requisito parcial para obtenção do título de Mestre pelo Programa de PósGraduação em Engenharia Elétrica da PUC-Rio. Aprovada pela Comissão Examinadora abaixo assinada. Prof. Álvaro de Lima Veiga Filho Orientador Departamento de Engenharia Elétrica PUC-Rio Prof. Reinaldo Castro Souza Departamento de Engenharia Elétrica PUC-Rio Prof. Joel Maurício Corrêa da Rosa Departamento de Estatística UFF Prof. José Eugenio Leal Coordenador Setorial do Centro Técnico Científico PUC-Rio Rio de Janeiro, 11 de setembro de 2009 Todos os direitos reservados. É proibida a reprodução total ou parcial do trabalho sem autorização da universidade, do autor e do orientador. Alexandre José dos Santos Graduou-se em Ciências Estatísticas na Escola Nacional de Ciências Estatísticas – ENCE (Rio de Janeiro, Brasil). Durante o mestrado, trabalhou com modelos estatísticos lineares e não-lineares, tanto univariados quanto multivariados e, ainda, com modelagem de inteligência artificial, todos com aplicações no mercado brasileiro de energia elétrica. Ficha Catalográfica Santos, Alexandre José dos Modelos Vetoriais Auto-Regressivos com Transição Suave Estruturados por Árvores – STVAR-Tree / Alexandre José dos Santos ; orientador: Álvaro de Lima Veiga Filho. – 2009. 121 f. : il. ; 30 cm Dissertação (Mestrado em Engenharia Elétrica)– Pontifícia Universidade Católica do Rio de Janeiro, Rio de Janeiro, 2009. Inclui bibliografia 1. Engenharia elétrica – Teses. 2. Modelos nãolineares multivariados. 3. Árvore de regressão. 4. STVARTree. 5. Teste LM. 6. Vasão de rios. 7. Preço spot. I. Veiga Filho, Álvaro de Lima. II. Pontifícia Universidade Católica do Rio de Janeiro. Departamento de Engenharia Elétrica. III. Título. CDD: 621.3 Agradecimentos A Deus, em primeiro lugar, pelo dom da vida. Ao professor Álvaro Veiga, pela orientação, incentivo e amizade. À PUC-Rio, pela estrutura e auxílio, imprescindíveis para a realização deste trabalho. À CAPES, pelo suporte financeiro. Aos professores do Departamento de Engenharia Elétrica, pela contribuição a minha formação, em especial aos professores Álvaro Veiga, Cristiano Fernandes e Reinaldo Souza. Aos colegas do Departamento de Engenharia Elétrica, que estiveram disponíveis para ajudar em todos os momentos. Aos meus pais, pelo amor incondicional e por não terem medido esforços para me propiciar a melhor formação possível. A minha irmã e ao meu sobrinho, pelo amor, companhia, incentivo e confiança. Aos meus amigos, que estiveram presentes ao longo destes anos, pelo apoio, compreensão e perdão por não ter outro assunto, que não o mestrado e, no final, a dissertação. Resumo Santos, Alexandre; Veiga, Álvaro. Modelos Vetoriais Auto-Regressivos com Transição Suave Estruturados por Árvores – STVAR-Tree. Rio de Janeiro, 2009. 121p. Dissertação de Mestrado - Departamento de Engenharia Elétrica, Pontifícia Universidade Católica do Rio de Janeiro. Esta dissertação tem como objetivo principal introduzir uma formulação de modelo não-linear multivariado, a qual combina o modelo STVAR (Smooth Transition Vector Autoregressive) com a metodologia CART (Classification and Regression Tree) a fim de utilizá-lo para geração de cenários e de previsões. O modelo resultante é um Modelo Vetorial Auto-Regressivo com Transição Suave Estruturado por Árvores, denominado STVAR-Tree e tem como base o conceito de múltiplos regimes, definidos por árvore binária. A especificação do modelo é feita através do teste LM. Desta forma, o crescimento da árvore é condicionado à existência de não-linearidade nas séries, que aponta a divisão do nó e a variável de transição correspondente. Em cada divisão, são estimados os parâmetros lineares, por Mínimos Quadrados Multivariados, e os parâmetros não-lineares, por Mínimos Quadrados Não-Lineares. Como forma de avaliação do modelo STVARTree, foram realizados diversos experimentos de Monte Carlo com o objetivo de constatar a funcionalidade tanto do teste LM quanto da estimação do modelo. Bons resultados foram obtidos para amostras médias e grandes. Além dos experimentos, o modelo STVAR-Tree foi aplicado às séries brasileiras de Vazão de Rios e Preço Spot de energia elétrica. No primeiro estudo, o modelo foi comparado estatisticamente com o Periodic Autoregressive (PAR) e apresentou um desempenho muito superior ao concorrente. No segundo caso, a comparação foi com a modelagem Neuro-Fuzzy e ganhou em uma das quatro séries. Somando os resultados dos experimentos e das duas aplicações conclui-se que o modelo STVAR-Tree pode ser utilizado na solução de problemas reais, apresentando bom desempenho. Palavras-chave Modelos Não-Lineares Multivariados; Árvore de Regressão; STVAR-Tree; Teste LM; Vazão de Rios; Preço Spot. Abstract Santos, Alexandre; Veiga, Álvaro (advisor). Tree-Structure Smooth Transition Vector Autoregressive Models – STVAR-Tree. Rio de Janeiro, 2009. 121p. MSc. Dissertation. Departamento de Engenharia Elétrica, Pontifícia Universidade Católica do Rio de Janeiro. The main goal of the dissertation is to introduce a nonlinear multivariate model, which combines the model STVAR (Smooth Transition Vector Autoregressive) with the CART (Classification and Regression Tree) method and use it for generating scenarios and forecasting. The resulting model is a TreeStructured Vector Autoregressive model with Smooth Transition, called STVARTree, which is based on the concept of multiple regimes, defined by binary tree. The model specification is based on Lagrange Multiplier tests. Thus, the growth of the tree is conditioned on the existence of nonlinearity in the time series, which indicates the node to be split and the corresponding transition variable. In each division, linear parameters are estimated by Multivariate Least Squares, and nonlinear parameters by Non-Linear Least Squares. As a way of checking the STVAR-Tree model, several Monte Carlo experiments were performed in order to see the functionality of both the LM test and the model estimation. Best results were obtained with medium and large samples. Besides, the STVAR-Tree model was applied to Brazilian time series of Rivers Flow and electricity spot price. In the first study, the model was statistically compared to the Periodic Autoregressive (PAR) model and had a much higher performance than the competitor. In the second case, the model comparison was with Neural-Fuzzy Modeling and the STVAR-Tree model won in one of the four series. Adding both the experiments and the two applications results we conclude that the STVARTree model may be applied to solve real problems, having good results. Keywords Multivariate Non Linear Models; Regression Tree; STVAR-Tree; LM Test; Rivers Flow; Spot Price. Sumário 1 Introdução 12 1.1. Vazão de Rios 14 1.2. Preço Spot de energia elétrica 16 1.3. Organização da dissertação 17 2 Modelos Lineares Multivariados 18 2.1. Introdução 18 2.2. Modelo VAR 19 2.3. Modelo VEC 25 3 Modelos Não-Lineares 29 3.1. Modelos Não-Lineares Univariados 29 3.2. Modelos Não-Lineares Multivariados 35 3.3. Metodologia CART 47 4 Metodologia 52 4.1. Introdução 52 4.2. Modelo STVAR-Tree 52 4.3. Modelo PAR 62 4.4. Sistema Neuro-Fuzzy 63 4.5. ANFIS: Adaptive Neuro-Fuzzy Inference System (Sistema Adaptativo de Inferência Neuro-Fuzzy) 63 5 Experimentos e Aplicações 66 5.1. Experimentos de Monte Carlo 66 5.2. Aplicações a dados reais 78 6 Conclusão 114 Referências Bibliográficas 116 Lista de figuras Gráfico 2.1: Séries temporais bivariadas co-integradas 26 Gráfico 3.1: Função logística com parâmetros fixos 32 Figura 3.1: Exemplo de árvore com ausência de alguns nós 49 Figura 3.2: Exemplo de um modelo gerado por uma árvore de regressão 50 Figura 4.1: Arquitetura ANFIS equivalente 64 Figura 4.2: Arquitetura ANFIS para o modelo Sugeno 65 Figura 5.1: Arquitetura STVAR-Tree simulada 68 simulado, com = 0,1% 75 simulado, com = 1% 76 simulado, com = 5% 77 simulado, com = 10% Figura 5.6: Mediana de Φi, i = 1,2 do modelo STVAR-Tree 77 simulado, com = 15% 78 Figura 5.7: Árvore estimada do modelo 7 94 Figura 5.8: FAC e FACP do logaritmo de ENA Sudeste 95 Figura 5.9: FAC e FACP do logaritmo de ENA Sul 95 Figura 5.10: FAC e FACP do logaritmo de ENA Nordeste 95 Figura 5.11: FAC e FACP do logaritmo de ENA Norte 95 Figura 5.2: Mediana de Φi, i = 1,2 do modelo STVAR-Tree Figura 5.3: Mediana de Φi, i = 1,2 do modelo STVAR-Tree Figura 5.4: Mediana de Φi, i = 1,2 do modelo STVAR-Tree Figura 5.5: Mediana de Φi, i = 1,2 do modelo STVAR-Tree Figura 5.12: Árvore estimada do modelo 12 110 Lista de tabelas Tabela 5.1: Probabilidades em um teste de hipóteses 66 Tabela 5.2: Experimento Monte Carlo – Simulação de um VAR 67 Tabela 5.3: Experimento Monte Carlo – Simulação de um STVAR-Tree 69 Tabela 5.4: Experimento Monte Carlo – Estimação dos parâmetros lineares 71 Tabela 5.5: Experimento Monte Carlo – Estimação da diagonal principal da matriz de covariâncias dos erros, Σε 71 parâmetros não-lineares e 73 Tabela 5.6: Experimento Monte Carlo – Estimação dos Tabela 5.7: Experimento Monte Carlo – Estimação da diagonal da matriz de covariâncias dos erros, 75 Tabela 5.8: Divisão dos dados 79 Tabela 5.9: Estatísticas Descritivas das séries de ENA 79 Tabela 5.10: Estatísticas Descritivas do logaritmo natural das séries de ENA 80 Tabela 5.11: Matriz de Correlação do logaritmo natural das séries de ENA 81 Tabela 5.12: Teste Estatístico ADF para o logaritmo das séries de ENA 82 Tabela 5.13: Número de nós terminais e de parâmetros dos modelos estimados 83 Tabela 5.14: Critérios de Informação 84 Tabela 5.15: Estatísticas descritivas dos resíduos – in-sample 85 Tabela 5.16: Estatísticas de erro dos modelos – in-sample 86 Tabela 5.17: Testes de normalidade dos resíduos – in-sample 87 Tabela 5.18: Estatísticas descritivas dos resíduos (RC) – out-of-sample Tabela 5.19: Estatísticas de erro dos modelos (RC) – 88 out-of-sample 89 Tabela 5.20: Testes de normalidade dos resíduos (RC) – out-of-sample 89 Tabela 5.21: Estatísticas descritivas dos resíduos – out-of-sample 90 Tabela 5.22: Estatísticas de erro dos modelos (MM) – out-of-sample 90 Tabela 5.23: Testes de normalidade dos resíduos (MM) – out-of-sample 91 Tabela 5.24: Estatísticas descritivas dos resíduos (ARC) – out-of-sample 92 Tabela 5.25: Estatísticas de erro dos modelos (ARC) – out-of-sample 92 Tabela 5.26: Testes de normalidade dos resíduos (ARC) – out-of-sample 93 Tabela 5.27: Modelos PAR(p) para cada um dos sub-mercados 96 Tabela 5.28: Estimativa dos parâmetros dos modelos PAR(p) 96 Tabela 5.29: Estatísticas Descritivas das séries de resíduos 96 Tabela 5.30: Comparação dos modelos STVAR-Tree e PAR(p) 97 Tabela 5.31: Divisão dos dados 97 Tabela 5.32: Estatísticas Descritivas das séries de Preço spot 98 Tabela 5.33: Estatísticas Descritivas do logaritmo natural das séries de Preço spot 99 Tabela 5.34: Matriz de Correlação do logaritmo natural das séries de Preço spot 99 Tabela 5.35: Teste Estatístico ADF 100 Tabela 5.36: Teste Co-integração de Johansen 101 Tabela 5.37: Número de nós terminais e de parâmetros dos modelos estimados 102 Tabela 5.38: Critérios de Informação 103 Tabela 5.39: Estatísticas descritivas dos resíduos – in-sample 103 Tabela 5.40: Estatísticas de erro dos modelos – in-sample 104 Tabela 5.41: Teste de normalidade dos resíduos – in-sample 104 Tabela 5.42: Estatísticas descritivas dos resíduos (RC) – out-of-sample 105 Tabela 5.43: Estatísticas de erro dos modelos (RC) – out-of-sample 106 Tabela 5.44: Testes de normalidade dos resíduos (RC) – out-of-sample 106 Tabela 5.45: Estatísticas descritivas dos resíduos (MM) – out-of-sample 107 Tabela 5.46: Estatísticas de erro dos modelos (MM) – out-of-sample 108 Tabela 5.47: Testes de normalidade dos resíduos (MM) – out-of-sample 108 Tabela 5.48: Estatísticas descritivas dos resíduos (ARC) – out-of-sample 109 Tabela 5.49: Estatísticas de erro dos modelos (ARC) – out-of-sample 109 Tabela 5.50: Testes de normalidade dos resíduos (ARC) – out-of-sample 110 Tabela 5.51: Variáveis disponíveis de acordo com a ordem da defasagem 111 Tabela 5.52: Modelos selecionados pela modelagem Neuro-Fuzzy 112 Tabela 5.53: Estatísticas de erro dos modelos – in-sample e out-of-sample 112 Tabela 5.54: Comparação dos modelos STVAR-Tree e Neuro-Fuzzy 113 12 1 Introdução Recentemente, muitos modelos estatísticos para análise e previsão de séries temporais têm sido propostos na literatura. Os modelos mais famosos e que ganharam mais destaque nas pesquisas científicas pertencem ao grupo dos modelos estatísticos lineares. A razão dessa popularidade vem do fato destes modelos tratarem dados homocedásticos, estacionários e Gaussianos (Box, Jenkins e Reisel, 1994). Os modelos lineares possuem características vantajosas e importantes, tais como, fácil interpretação, cálculos de intervalo de confiança, resultados assintóticos, entre outras. Muito embora essas características possuam vantagens, a natureza é intrinsecamente não-linear e muitos fenômenos podem não ser capturados pelos modelos lineares. Com essa motivação, nos últimos anos, muitos modelos estatísticos não-lineares vêm sendo propostos. Alguns deles são da classe de modelos STAR (Smooth Transition Autoregressive), com aplicações em séries temporais econométricas. Tong (1978) propôs o modelo TAR (Threshold Autoregressive), o qual tem como idéia central a mudança dos parâmetros lineares do modelo auto-regressivo, de acordo com o valor assumido por uma variável de transição (neste caso, uma variável indicadora). Este modelo atribui um modelo linear diferente para distintas regiões onde se encontram os valores dessa variável. Caso a variável de transição seja uma defasagem da variável endógena, o modelo é, então, denominado SETAR (Self-Exciting Threshold Autoregressive). Uma generalização do modelo SETAR com dois regimes, incorporando uma transição suave entre eles, foi proposta por Chan e Tong (1986). Este modelo foi denominado modelo STAR (Smooth Threshold Autoregressive). Para uma revisão consulte Teräsvirta (1994). Outras extensões dos modelos TAR têm sido propostas na literatura, podendo citar o modelo MRSTAR (Multiple Regimes Smooth Transition Autoregressive), proposto por Dijk e Franses (1999) e o 13 modelo TV-STAR (Time-Varying Smooth Transition Autoregressive), proposto por Lundbergh e Teräsvirta (2000). Muitos assuntos em diferentes áreas do conhecimento requerem diversas relações para serem especificados. Por isso, tornaram-se necessárias técnicas para lidar com aspectos não-lineares de sistemas. A maioria delas refere-se ao modelo VAR não-linear, denominado STVAR (Smooth Transition Vector Autoregressive). O modelo STVAR é a versão multivariada do modelo STAR, assim como ocorre com os modelos lineares VAR (Vector Autoregressive) e AR (Autoregressive). Muitas de suas aplicações foram feitas no campo da Macroeconomia. Os modelos STAR e STVAR podem ser vistos como modelos lineares autoregressivos, univariado e multivariado, respectivamente, onde os seus coeficientes são determinados pela posição do vetor de variáveis explicativas dentro do denominado espaço de transição. É crescente, também, o uso de metodologias estruturadas por árvores de decisão, tendo em vista uma metodologia alternativa aos tradicionais métodos de classificação e modelos de regressão. O algoritmo CART (Classification and Regression Tree) (Breiman et al., 1984) é considerado o principal marco na utilização de metodologias estruturadas por árvores, cuja filosofia desta formulação é utilizar modelos mais simples para sub-amostras dos dados, dividindo de forma conveniente o problema em partes, através do particionamento recursivo do espaço de variáveis de transição. As árvores de classificação são úteis quando a variável dependente é categórica, enquanto que as árvores de regressão devem ser utilizadas na solução de problemas com variável dependente contínua. O principal atrativo da metodologia CART é a interpretabilidade proporcionada pela estrutura de árvore de decisão obtida no modelo final que, também pode ser lido, como um conjunto de sentenças lógicas a respeito das variáveis explanatórias. O foco desta dissertação é uma nova formulação de modelo não-linear multivariado, o qual combina o modelo não-linear STVAR com a metodologia CART. O modelo resultante é denominado STVAR-Tree e sua versão univariada é o modelo STAR-Tree, proposto por Rosa, Veiga e Medeiros (2008). 14 A modelagem STVAR-Tree tem como base o conceito de múltiplos regimes, os quais são definidos por uma árvore binária. Desta forma, temos um modelo não-linear paramétrico através de uma árvore de decisão. No STVARTree, os coeficientes do modelo são determinados através da combinação de diferentes modelos auto-regressivos multivariados, que podem apresentar variáveis exógenas no conjunto das variáveis explicativas. A especificação do modelo é feita através de testes de hipóteses do tipo LM (Lagrange Multiplier). Assim, o crescimento da árvore é condicionado à existência de não-linearidade nas séries. Para cada divisão, são estimados os parâmetros lineares e não-lineares do modelo. No momento em que o teste LM rejeita a hipótese de não-linearidade (e divisão de todos os nós) na profundidade em que a árvore se encontra, o procedimento de crescimento da árvore é finalizado e tem-se, portanto, o modelo final estimado. Como forma de avaliação do modelo STVAR-Tree proposto nesta dissertação, foram feitos diversos experimentos de Monte Carlo. Após as simulações, aplicou-se o modelo STVAR-Tree às séries brasileiras de Vazão de Rios e às séries de Preço Spot de energia elétrica do mercado brasileiro. 1.1. Vazão de Rios No Brasil, o sistema gerador de energia elétrica tem como base as vazões de rios que afluem naturalmente no país. Por serem originadas das precipitações, as vazões fluviais possuem muitas irregularidades, tornando-as inconstantes e difíceis de prever. Por causa dessas irregularidades, o Brasil conta com usinas termoelétricas de complementação e com reservatórios de acumulação, com o propósito de regularizar os regimes fluviais. Então, quando as vazões fluviais são escassas (período de seca), a água que foi armazenada durante o período de grandes afluências naturais (período de cheia) é utilizada. O Planejamento da Operação do Sistema Interligado (SIN), executado atualmente no Operador Nacional do Sistema Elétrico (ONS), permite o melhor aproveitamento das vazões naturais, evitando o desperdício de água e gastos excessivos com combustíveis nas usinas termoelétricas. Devido a sua 15 complexidade, este planejamento é feito por etapas com base nos modelos desenvolvidos no Centro de Pesquisas de Energia Elétrica (CEPEL). Em cada etapa, os modelos utilizados possuem diferentes horizontes de planejamento, discretização do tempo, e graus de detalhamento em suas representações (Maceira et al., 2002). Potencialmente, o sistema brasileiro de geração de energia elétrica pode beneficiar-se em larga escala com o contínuo aprimoramento dos modelos de previsão hidrológica. A geração de energia elétrica futura é influenciada pelas afluências hidrológicas futuras, quando as previsões e incertezas envolvidas devem ser controladas no planejamento. Isto porque a qualidade das previsões hidrológicas feitas pelos modelos afeta substancialmente o desempenho do sistema. Com isso, os benefícios e a confiança aumentam e os custos diminuem. O CEPEL utiliza o modelo PREVIVAZM (Costa et al., 2003) para fornecer previsões mensais de afluências de vazão de rios para um horizonte de até 12 meses. Este modelo é uma ferramenta para estudos especiais de verificação de condições de atendimento da demanda energética para o horizonte anual. Outro modelo é utilizado pelo CEPEL, o modelo PREVIVAZ, para obter as previsões de afluências semanais, num horizonte de até seis semanas. Essas previsões são utilizadas no primeiro mês do Programa Mensal de Operação (PMO), um planejamento de curto prazo. Este modelo é, portanto, executado ao final de cada mês para a elaboração do PMO do mês seguinte e, durante o mês em curso, é executado todas as semanas para a realização das revisões do PMO. Os modelos PREVIVAZ e o PREVIVAZM para obtenção de previsões de vazões semanais e mensais, respectivamente, utilizam diversas alternativas de classe de modelo, ordem dos modelos, agrupamento da estrutura de autocorrelação e métodos de estimação dos parâmetros, acoplado a diferentes prétransformações das séries históricas, tipo Box-Cox ou logarítmicas (Box e Cox, 1964), ou sem transformação, e a diferentes formas de estimação de parâmetros dos modelos. Os algoritmos de previsão destes modelos são testados por um esquema robusto de validação cruzada e o algoritmo selecionado é aquele de menor erro quadrático médio de previsão. As formulações lineares de previsão de séries temporais foram classificadas em modelos estacionários e modelos periódicos. Na classe de modelos 16 estacionários estão a média e os modelos auto-regressivos de média-móvel, ARMA(p,q). Já na classe dos modelos periódicos estão os modelos periódicos auto-regressivos de média-móvel, PARMA(p,q), e o caso particular PAR(p), os quais se caracterizam por apresentar uma equação de regressão para cada período. 1.2. Preço Spot de energia elétrica No mercado spot de energia elétrica, toda a energia excedente dos contratos bilaterais é comprada e vendida no Mercado Atacadista de Energia Elétrica. Estes contratos formalizam a compra e venda de energia estabelecendo preços, prazos e montantes de suprimento em intervalos temporais determinados pelos agentes. O preço spot, também chamado de Preço de Liquidação das Diferenças (PLD), é definido com base nos Custos Marginais de Operação (CMO), obtidos por meio de uma cadeia de programas computacionais. O CMO indica quanto custa a produção de uma unidade de energia adicional à última unidade consumida pelo mercado. O Centro de Pesquisas de Energia Elétrica (CEPEL), criado por iniciativa do Ministério de Minas e Energia de empresas do setor de energia elétrica, utiliza o software NEWAVE para planejar a operação de subsistemas hidrotérmicos interligados em longo prazo. Este programa determina, mensalmente, metas de geração para cada usina, de maneira a atender a demanda, minimizando o valor esperado do custo total de operação ao longo do período de planejamento. Em resumo, o NEWAVE é responsável por gerar o CMO, valor base para a determinação do preço spot de energia elétrica no Brasil. Outro software utilizado neste processo é o DECOMP, responsável por gerar valores para o preço, semanalmente. A Câmara Comercializadora de Energia Elétrica (CCEE) é o órgão responsável pela determinação e publicação semanal do PLD, calculado individualmente para cada um dos quatro sub-mercados existentes no Brasil (Sudeste/Centro, Sul, Nordeste e Norte). Ao final do mês, após o registro e validação de todos os contratos, a CCEE utiliza o PLD para liquidar as operações de compra e venda de energia. 17 O preço spot é único e sua definição depende das condições de oferta e procura do mercado. Como o preço não é, de fato, de mercado e sim fornecido por modelos computacionais, grandes variações semanais podem ocorrer nos seus valores. Além disso, fatores externos também podem influenciar o preço spot, como o nível de armazenamento dos reservatórios das usinas hidrelétricas, a evolução prevista da demanda de energia e a disponibilidade atual e futura de usinas e linhas de transmissão de energia elétrica. Outro problema é quando os próprios modelos matemáticos (da cadeia de modelos do CEPEL) são abandonados. Um exemplo disso ocorreu no período do racionamento de 2001/2002 quando alguns valores do PLD semanal foram regulados pelo governo. Além disso, alterações nos planos de reparo e manutenção de unidades térmicas, limites na transmissão de energia entre sub-mercados, e outros motivos, têm feito com que a volatilidade das séries de preço aumente. No caso do setor elétrico brasileiro, o preço da energia é função da natureza da indústria de eletricidade, isto é, da disponibilidade de água nos reservatórios e no nível de precipitação pluviométrico. A volatilidade está relacionada à dinâmica das afluências. Outro problema do PLD é o fato de que não leva em conta a reação da demanda, sendo a apenas a hidrologia - presente e a previsão futura – a formadora do preço. 1.3. Organização da dissertação A dissertação está organizada da seguinte forma: o Capítulo 2 apresenta uma revisão dos modelos lineares multivariados. Já no Capítulo 3, os modelos não-lineares são revisados, reunindo os modelos univariados e multivariados, além da metodologia CART. No Capítulo 4 consta a teoria sobre os modelos STVAR-tree, PAR(p) e Neuro-Fuzzy. As aplicações estão presentes no Capítulo 5. E a dissertação conclui no Capítulo 6. 18 2 Modelos Lineares Multivariados 2.1. Introdução Neste capítulo, serão apresentados dois modelos lineares, largamente utilizados na estimação de séries temporais multivariadas. O primeiro deles, o modelo Vector Autoregressive (VAR), proposto por Sims (1980), foi desenvolvido como um modelo dinâmico, no qual todas as variáveis a serem estudadas são tratadas como endógenas. Sendo assim, o modelo VAR examina as relações lineares existentes entre cada variável endógena e os valores passados das mesmas variáveis (assume-se uma defasagem p), permitindo ainda a inclusão de variáveis exógenas na análise. Este modelo tem como restrições a escolha do conjunto relevante de variáveis a serem analisadas, que são os valores correntes dos processos, e o número máximo de defasagens envolvidas nas relações entre elas, normalmente escolhido com base em critérios estatísticos, como os de Akaike (1974) ou Schwarz (1978). Por um lado, é desejável incluir o maior número possível de defasagens, de modo a evitar a imposição de restrições falsas sobre a dinâmica do modelo. Por outro lado, quanto maior a ordem de defasagens, maior o número de parâmetros a serem estimados, conseqüentemente, menos graus de liberdade para a estimação. Um cuidado deve ser tomado ao estimar modelos multivariados. Geralmente, eles apresentam elevado número de parâmetros, com reflexo no tamanho de amostra requerido para que se obtenha uma estimação confiável. Diversos testes estatísticos podem ser utilizados com a finalidade de verificar a adequação de um modelo. Caso alguma das premissas básicas da modelagem não for válida, diz-se que existe um erro de especificação do modelo. Os testes são aplicados em diversos estágios da modelagem, ou seja, a cada momento da elaboração do modelo aplica-se os testes de diagnóstico para verificar se todas as exigências básicas são válidas para o conjunto de dados em questão. A seguir, alguns motivos da realização dos testes: 19 1) Testes com o objetivo de definir a especificação do modelo; 2) Testes para inclusão ou não de variáveis defasadas no modelo; 3) Testes para as propriedades dos termos de perturbação não-observável (ruído branco); 4) Testes para verificação do ajuste do modelo. Uma condição básica para estimação do modelo VAR é que as séries temporais sob análise sejam estacionárias. Isto indica que as médias e variâncias devem ser constantes ao longo do tempo e o valor das covariâncias entre dois períodos de tempo devem depender apenas da distância ou defasagem entre os dois períodos, e não do período de tempo efetivo em que as covariâncias foram calculadas. Após a verificação da presença de raízes unitárias nas séries, sendo as mesmas integradas de mesma ordem, ou seja, necessitando as séries do mesmo número de diferenciações para se tornarem estacionárias procedem-se os testes de co-integração. Em existindo relações de co-integração entre as séries, diz-se que as mesmas apresentam uma relação linear estável no longo prazo. O teste de co-integração visa determinar o número de vetores de cointegração que serão necessários no sistema. Um dos procedimentos para identificar a existência de co-integração é o de Johansen (1988), o qual utiliza Máxima Verossimilhança para estimar os vetores de co-integração. A hipótese nula é de que não há nenhum vetor de co-integração versus a hipótese alternativa de que há pelo menos um vetor de co-integração. Caso o teste detecte a presença de um vetor de co-integração num sistema, então, ao invés de estimar o modelo VAR, deve-se utilizar o modelo VEC. 2.2. Modelo VAR Algumas propriedades importantes do modelo VAR serão discutidas. As principais utilizações deste modelo são para previsão e análise estrutural. Considere um conjunto de séries temporais observadas no tempo. Um primeiro modelo tem de ser especificado e os parâmetros têm de ser estimados. Em seguida, a adequação do modelo é marcada por diversos instrumentos estatísticos 20 e o modelo pode ser estimado e utilizado para previsão e análise estrutural ou dinâmico. As principais etapas da modelagem multivariada são: 1) Especificação e estimação do modelo; 2) Avaliação / verificação do modelo; a. Modelo rejeitado, volta ao passo 1 b. Modelo aceito, avança ao passo 3 3) Previsão 4) Análise estrutural 2.2.1. Formulação Matemática Sejam , , … , séries temporais multivariadas, com = , , … , . Um modelo VAR(p) pode ser expresso matematicamente pela seguinte formulação: = + + + ⋯ + ! ; t = 0, 1, 2, … (2.1) Todos os símbolos utilizados nesta representação possuem significados usuais, isto é, = , , … , é um vetor aleatório (K x 1) de variáveis endógenas; = , , … , " ′ é um vetor fixo de interceptos (K x 1), os quais permitem a possibilidade de média E(yt) não-nula; $ são matrizes fixas de coeficientes, os quais são interpretados como a sensibilidade da de uma variável do modelo com relação a uma defasagem de outra variável; ! = ! , ! , … , ! é um vetor K-dimensional de ruído branco, ou seja, E(u) = 0, E(utut’) = Σu e E(utus’) = 0. Cada equação do modelo possui um termo específico, o qual pode ser interpretado como o choque correspondente à K-ésima equação. Este termo é o termo de erro !$ . Qualquer modelo VAR(p) pode ser representado por um modelo Kp- dimensional VAR(1), dado por: 21 % = & + ' + ( , (2.2) onde, x 1). E as dimensões são: % ~ (Kp x 1) , & ~ (Kp x 1), ' ~ (Kp x Kp) e ( ~ (Kp % é estável se para |*| ≤ 1, A média do modelo VAR(p) é dada por E as auto-covariâncias são: onde, Σ, = -( ( . Usando a matriz J com dimensão (K x Kp) dada por: . = /0 : 0 : … : 02. O processo é obtido como = .% . Pelo fato de % ser um processo bem definido, isto implica que também seja. Então, temos: - = .3, constante para todo t, Γ5 h = JΓ5 hJ , também invariantes no tempo. Seja o polinômio característico do processo VAR(p), dado por: Dizemos que o processo é estável se, para |*| ≤ 1, . Esta é a condição de estabilidade do processo. 22 2.2.2. Representação Média Móvel (MA) de um processo VAR A representação de médias móveis é um útil instrumento para examinar a interação entre as variáveis. Chamam-se os coeficientes de $ de função de resposta ao impulso observados a partir dos choques ! das variáveis. Estas funções medem o impacto nas variáveis a partir de seus respectivos choques ! . Sob a condição de estabilidade, o processo % tem a representação de Média Móvel (MA) definida como: $ % = 3 + ∑9 $:; ($ (2.3) onde, % é expresso em termos do passado e presente do vetor de inovações ( e do termo média 3. Além disso, a representação MA de pode ser encontrada pré-multiplicando % por uma matriz . = /0 : 0 : 3 = .< , =$ = .$ . e ! = .( . … : 02 de dimensão (K x Kp). Aqui, (2.4) O problema de estimar estes parâmetros incorre nas mesmas dificuldades em obter os parâmetros do modelo primitivo a partir do modelo reduzido; a identificação do sistema. Esta metodologia não permite estimação se o sistema é sub-identificado, isto é, tenha um número de equações menores que os números de incógnitas. Para ser possível identificar o sistema escrito na forma MA, é necessário usar a decomposição de Choleski. 23 2.2.3. Processo estacionário Um processo estocástico é estacionário se seus momentos de primeira e segunda ordem são invariantes no tempo. Então, temos o primeiro momento, para todo t, 3. Esta condição indica que todos possuem o mesmo vetor finito de média E o segundo momento, para todo t e h = 0, 1, E esta condição requer que as auto-covariâncias do processo não dependam do tempo >, mas somente do período ℎ de tempo que separa os vetores e @ . 2.2.4. Estimação Na estimação das equações do modelo VAR, o sistema apresenta uma estrutura fixa, com as mesmas variáveis em todas as equações e com o mesmo número de defasagens, sendo conhecido como “VAR puro”. O estimador para a representação padrão de um processo VAR(p) é definido por mínimos quadrados multivariados (ou mínimos quadrados generalizados) expresso da seguinte forma: AB = C C C % (2.5) Este resultado é bastante conhecido na literatura e largamente utilizado. 2.2.5. Previsão Um dos principais objetivos de análise de séries temporais multivariadas é gerar previsão. No contexto dos modelos VAR, interessa-nos o modelo que minimiza o Erro Quadrático Médio (EQM) de previsão, que também é largamente utilizado como a função-perda na fase de estimação. Além disso, o EQM é um 24 estimador não-viciado da variância dos erros de previsão, útil para a construção de intervalos e regiões de previsão. A equação de previsão num horizonte ℎ na origem > é dada pelo valor esperado condicional: (2.6) Supondo normalidade dos termos de erro do modelo, isto é, ! são normais multivariados com ! e !D independentes para t≠ F. Sob estas condições, os erros de previsão também são normalmente distribuídos como transformações lineares de vetores normais: (2.7) Este resultado implica que os erros de previsão das componentes individuais são também normais, dados por: onde, ", ℎ é a k-ésima componente de ℎ e G" ℎ é a raiz quadrada do k- ésimo elemento da diagonal principal da matriz ΣH ℎ. Denotando por *I o ponto crítico da distribuição normal, temos: (2.8) Então, o intervalo de previsão com 1 − %, ℎ períodos a frente, para a k- ésima componente de é: 25 ou Este resultado pode ser estendido para regiões de previsão, para duas ou mais componentes. Defina a matriz K = /0L : 02 com dimensão (N x K) e note que temos um resultado conhecido de vetores normais multivariados, dado por: (2.9) Assim, a distribuição M N pode ser usada para determinar o elipsóide de previsão com 1 − % para as primeiras N componentes do processo. Para tal, utiliza-se o método de Bonferroni, considerando que, para um intervalo de previsão com O1 − LP %, a região de previsão resultante tem probabilidade no I mínimo 1 − % de conter todas as N variáveis conjuntamente. 2.3. Modelo VEC Relações de equilíbrio são suspeitas entre muitas variáveis, especialmente econômicas. Suponha que as variáveis de interesse foram coletadas no vetor = , , … , e a sua relação de equilíbrio de longo prazo seja A = A + ⋯ + A = 0, onde A = A , … , A . Em algum momento particular, essa relação pode não ser satisfeita exatamente, mas talvez tenhamos A = *Q , onde *Q é uma variável estocástica que representa os desvios do equilíbrio. Se realmente há um equilíbrio, parece plausível assumir que as variáveis Q avançam juntas e que *Q é estável. Assim, *Q pode ser conduzido por uma tendência estocástica comum. Em outras palavras, não está excluído que cada variável é integrada, isto é, ainda existe uma combinação linear das variáveis. Variáveis integradas com essas propriedades são chamadas co-integradas. No Gráfico 2.1, duas séries temporais co-integradas geradas artificialmente são representadas. 26 Gráfico 2.1: Séries temporais bivariadas co-integradas Geralmente, as variáveis em um processo K-dimensional são chamadas co-integradas de ordem (d, b), brevemente, yQ ~CId, b, se todos os componentes do são 0 X e existe uma combinação linear * = β , com A = A , … , A ≠ 0 tal que * é 0X − Z. Por exemplo, se todos os componentes de * 0 1 e β é estacionário (I0), então yQ ~CI1,1. O vetor A é chamado de vetor de co-integração. Um processo que consiste em variáveis co-integradas é chamado um processo co-integrado. Estes processos foram introduzidos por Granger (1981) e Engle & Granger (1987). Desde então, tornaram-se populares em trabalhos econométricos teóricos e aplicados. Lüktepohl (2005) chama um processo K-dimensional integrado de ordem d, brevemente, yQ ~Id, se ∆\ é estável e ∆\ não é estável. O processo 0X é chamado co-integrado se existe uma combinação linear β com A ≠ 0, o qual é integrado de ordem menor que d. Se existir apenas um componente 0X no vetor e todos os outros componentes forem estáveis 00, então o vetor será 0X (Lüktepohl, 2005). Estritamente falando, as variáveis endógenas de um modelo VAR devem ser todas estacionárias, ou seja, integradas de ordem zero, I(0), portanto nesse contexto os autovalores da matriz A localizam-se todos no interior do círculo unitário. Se não forem, o modelo VEC deve ser estimado ao invés do VAR. 27 2.3.1. Formulação Matemática Um processo K-dimensional VAR(p), expresso matematicamente por: (2.10) é chamado co-integrado de rank r se tem rank r e assim Π pode ser escrito como uma matriz-produto A com e A sendo de dimensão (K x r) e de rank r. A matriz A é chamada matriz de cointegração e é chamada loading matrix. Se ^ = 0, Δ tem uma representação VAR(p-1) e, para ^ = `, e assim, o VAR não tem raiz unitária e é um processo VAR(p) estável. Deste modo, tem uma representação VEC dada matematicamente por: (2.11) onde, Se esta representação de correção de erros for dada, é fácil descobrir o VAR correspondente, notando que: (2.12) 28 2.3.2. Estimação A estimação dos parâmetros de um modelo VEC é feita em dois estágios. No primeiro, estima-se a matriz de co-integração A, por mínimos quadrados ou máxima verossimilhança e, em seguida, substitui-se o verdadeiro valor de A pelo seu estimador AB na equação, ou seja, considerando: (2.13) E, assim, todos os outros parâmetros são estimados na segunda etapa, tendo os estimadores de dois estágios de e Γ denotados por: (2.14) (2.15) 29 3 Modelos Não-Lineares 3.1. Modelos Não-Lineares Univariados 3.1.1. Modelo TAR O modelo Auto-regressivo com limiar (TAR – Threshold Autoregressive) foi proposto inicialmente por Tong (1978). Um pouco mais trabalhado, foi mais bem desenvolvido por Tong e Lim (1980) e Tong (1983). Conforme os avanços das pesquisas, este modelo se popularizou com inúmeras aplicações em séries temporais não-lineares. As análises tornaram-se interessantes pelo fato deste modelo atribuir um modelo linear diferente para distintas regiões onde se encontram os valores de uma variável determinada variável de transição. Definiuse que se a variável de transição for uma defasagem da variável endógena, o modelo é, então, denominado modelo auto-regressivo com limiar auto-excitante SETAR (Self-Exciting Threshold Autoregressive). 3.1.1.1. Formulação Matemática caso, Defina como uma série temporal. Esta série segue um processo TAR (3.1) onde, os termos ; , , … , a e b;$ , b$ , … , ba$ c = 1, … , ℎ, são os coeficientes reais do modelo; ~N0d0, G ; 0$ . é uma função indicadora, definida por 30 1, Fh f ≥ ^$ n 0$ f = g 0, jFk kl>^á^ck O modelo pode ser reescrito na forma vetorial, (3.2) onde, os coeficientes do modelo são os vetores = o; , , … , a p b$ = ob;$ , b$ , … , ba$ p e, ainda, * = o1, , , … , a p. e Esta representação do modelo permite verificar que, dependendo do valor assumido pela variável f , o modelo ativa um dos h+1 modelos lineares auto- regressivos de ordem p, AR(p). Conforme dito, caso f = \ o modelo TAR é denominado SETAR, e tem a seguinte representação matricial: (3.3) onde, o escalar d é conhecido como tamanho do limiar ou parâmetro de defasamento. 3.1.2. Modelo STAR Uma generalização do modelo SETAR com dois regimes, incorporando uma transição suave entre eles, foi proposta por Chan e Tong (1986). Este modelo foi denominado modelo STAR (Smooth Threshold Autoregressive). Para uma revisão, consulte Teräsvirta (1994). 3.1.2.1. Formulação matemática Considere uma série temporal univariada. A expressão matemática representada pelo modelo com dois regimes é dada por: onde, = = x rs F ; , u + = x r1 − s F ; , u + (3.4) 31 o vetor ϕ$ = r=$,; , =$, , … , =$,a u ; c = 1,2 são os coeficientes dos modelos lineares ligados aos regimes o vetor x = 1, , , … , a ′, é formado por 1 na posição inicial indicando o intercepto do modelo e nas demais posições as defasagens da variável endógena a função s. é uma função limitada no intervalo [0,1], aqui determinada como a função logística, dada por: s F ; , = 1+ 1 h wDx y (3.5) O vetor de parâmetros z = , dessa função contém os parâmetros de suavidade e locação, respectivamente, com a restrição > 0. O primeiro é o responsável pelo grau de suavidade da função de transição, e o segundo representa o limiar entre os dois regimes. Para o mesmo valor de , a distância entre o valor de F e c determina o grau de pertinência dos regimes do modelo. Na situação em que F = , a observação pertence a ambos os regimes com igual grau de pertinência. Obtemos o modelo TAR se definirmos a função de transição s . como uma função indicadora do tipo: s. = g 1, 0, F ≤ n F > Neste caso, o limiar entre os dois regimes é abrupto e determinado por c, o parâmetro de limiar ou locação. Uma das grandes vantagens na utilização dos modelos de transição suave é a possibilidade de especificar a função de transição de forma a evitar este problema da busca por um limiar “rígido” entre os regimes. A escolha mais comum para a função de transição é a função logística. O modelo com esta função de transição é denominado modelo LSTAR (Logistic Smooth Transition AutoRegressive). A fim de experimentar a função logística, fixou-se alguns parâmetros e avaliou-se o seu comportamento através do Gráfico 3.1. O parâmetro de suavidade 32 assumiu os valores do conjunto {1, 2.5, 5, 50}, para representar diferentes níveis de suavidade da função logística, e o parâmetro de locação c assumiu o valor zero. Gráfico 3.1: Função logística com parâmetros fixos Quando tende para zero, a função logística torna-se uma constante igual a 0,5 e o modelo LSTAR se reduz a uma média de dois modelos lineares AR(p). Este comportamento permite concluir que não existe distinção entre os regimes. Conforme aumentamos o valor do parâmetro de suavidade , ou seja, com tendendo para infinito, a função logística aproxima-se de uma função do tipo degrau e a transição de um regime para o outro se torna uma transição abrupta. Neste caso, a função logística torna-se uma função indicadora e o modelo é denominado TAR. E ainda, caso a variável de transição seja uma defasagem da variável endógena, F = \ , o modelo é então denominado SETAR (Self- Exciting Threshold Autoregression). Para valores no intervalo (0,1) assumidos pela função logística s. , o modelo LSTAR com dois regimes é definido como uma média ponderada de dois modelos AR(p), onde os pesos das observações são determinados por esses valores da função de transição, s F ; , e 1 − s F ; , . O modelo STAR citado anteriormente possui 2 regimes. Porém, este pode ser estendido para um número maior de regimes. Neste caso, denomina-se como 33 MRSTAR (Multiple Regime Smooth Transition AutoRegression). Por exemplo, a representação de um modelo MRSTAR de 4 regimes pode ser escrita da seguinte forma: = o= | s F ; , + = | r1 − s F ; , up ∗ s F ; , + o=~ | s F ; , + = | r1 − s F ; , up ∗ r1 − s F ; , u + (3.6) Considerando conhecidas as variáveis de transição F e F , nota-se que os regimes na equação são ponderados por uma composição de funções logísticas (s . e s . ). Essa composição soma a unidade, por isso podem ser vista como funções de pertinência. O conceito de pertinência é largamente utilizado na teoria da Lógica Fuzzy (Zadeh, 1965). Maiores detalhes referentes aos modelos MRSTAR podem ser obtidos em van Dijk e Franses (1999). 3.1.2.2. Especificação do modelo Esta seção apresenta uma estratégia de especificação do modelo STAR. Estratégia esta, definida como “específica-para-geral”. Este procedimento inicia com um modelo simples e, de acordo com os resultados dos testes estatísticos aplicados, o modelo tem sua complexidade aumentada. A primeira preocupação refere-se à seleção das variáveis que irá compor o modelo, tanto as variáveis que formarão o vetor * quanto aquelas denominadas variáveis de transição, que formam o vetor | . A modelagem STAR parte de um modelo simples e aumenta sua complexidade de acordo com os resultados dos testes aplicados. van Dijk, Terasvirta e Franses (2002) em seu trabalho, propuseram um processo de construção destes modelos, o qual segue um ciclo de modelagem. Os passos são: 1) Especificação de um modelo AR(p) Diversos modelos lineares são estimados, começando com um modelo AR(1) e aumentando a ordem p do modelo, com = 1,2, … , . Aquele modelo que minimizar os critérios de informação AIC (Akaike, 1974) ou BIC (Schwarz, 1978) deve ser selecionado. Todas as 34 propriedades dos modelos lineares AR(p) devem ser verificadas, incluindo a que se refere aos resíduos do modelo, definindo-os como aproximadamente um ruído branco. 2) Teste da hipótese de linearidade contra uma alternativa da família STAR Na construção do modelo STAR, o teste de linearidade tem duas funções. A primeira verifica a adequação do modelo linear para descrever os dados. A hipótese nula do teste é a de linearidade. No caso em que esta não for rejeitada, não é necessário estimar um modelo não-linear para os dados. A segunda determina as variáveis que formam o vetor de transição | . Tsay (1989) propôs a aplicação do teste de linearidade para cada uma das defasagens da variável endógena (\ ) e selecionar como variável de transição aquela que apresentar o menor p-valor do teste. 3) Estimação dos parâmetros do modelo STAR selecionado Para estimar os parâmetros do modelo, utiliza-se o método de Mínimos Quadrados Ordinários (MQO) para os parâmetros lineares e o método de Mínimos Quadrados Não-Lineares (MQNL) para os parâmetros não-lineares do modelo STAR. Este último, sob a normalidade dos erros, é equivalente ao método de Máxima Verossimilhança (MV). 4) Análise de diagnóstico do modelo O modelo STAR selecionado e estimado deve apresentar resíduos com boas propriedades. Basicamente, verifica-se a correlação dos resíduos de forma que eles se comportem como ruído branco. 5) Re-especificação do modelo de acordo com os resultados do diagnóstico No caso de selecionar um modelo STAR que não produza resíduos com boas propriedades, deve-se voltar a etapa 1 e re-especificar um modelo AR(p) e, assim, seguir todas as etapas. 35 6) Utilização do modelo com fins descritivos ou de previsão Com todas as etapas acima verificadas, determina-se este modelo como o modelo final e este deve ser utilizado de acordo com os seus fins. 3.2. Modelos Não-Lineares Multivariados 3.2.1. Modelo TVAR Tsay (1998) estendeu a abordagem dos modelos TAR (Threshold Autoregressive) para modelos multivariados, definindo-os como modelos TVAR (Threshold Vector Autoregressive). Este modelo teve como motivação uma aplicação no mercado financeiro, onde um ativo foi negociado em dois mercados, simultaneamente. 3.2.1.1. Formulação matemática Considere que os modelos lineares locais dependam de algumas variáveis exógenas. Seja = , … , " ′ uma série temporal k-dimensional e | = | , … , | ′ uma série temporal v-dimensional de variáveis exógenas. Seja −∞ = ^; < ^ < ⋯ < ^D < ^D = ∞, então segue um modelo multivariado de limiar com variável de limiar * e um lag d dado pela seguinte expressão: (3.7) onde, = 1, … , F; são vetores de constantes; p e q são inteiros não negativos. A inovação satisfaz onde, o primeiro termo é uma matriz positiva definida simétrica; 36 o segundo é uma seqüência de vetores descorrelatados aleatórios com média zero e matriz de covariância I, a matriz identidade. O modelo apresentado tem s regimes e é um modelo linear com relação ao espaço de limiar *\ , mas é não linear no tempo se s >1. Assume-se que a variável de limiar * é conhecida, estacionária e apresenta uma distribuição contínua e o lag d, o número de regimes s, e os limiares ^$ são desconhecidos. 3.2.1.2. Teste de Linearidade Primeiramente, Tsay (1998) propôs um teste estatístico para detectar a necessidade de estimar o modelo TVAR ao invés de um modelo linear, isto é, testou s =1 contra s > 1. O teste é simples e apresenta um bom desempenho em amostras finitas. Este teste é uma generalização do proposto em Tsay (1989) para o caso univariado, e apresenta uma distribuição assintótica Qui-Quadrado. A generalização também leva em conta a presença de variáveis exógenas e heterocedasticidade condicional. Em seguida, o autor considerou o teste LM com a hipótese nula que é linear contra a hipótese alternativa que segue um modelo TVAR definido anteriormente. O teste LM usa a variável de limiar para construir uma regressão arranjada. Este regressão baseada no crescimento da ordem da variável de limiar *\ é: (3.8) onde >c é o índice temporal de *$ . É importante notar que a dinâmica da série não mudou. O que mudou foi a ordem que cada dado entra na regressão, isto é, a ordem das linhas, se víssemos a regressão em um contexto matricial. A idéia do teste é simples: se é linear, então o estimador de mínimos quadrados recursivo da regressão arranjada é consistente, logo os resíduos previstos são aproximadamente um ruído branco. Conseqüentemente, os resíduos previstos são descorrelatados do regressor $\ . Por outro lado, se seguir um modelo de limiar, os resíduos previstos 37 não serão ruído branco, pois o estimador de mínimos quadrados será viesado. Neste caso, os resíduos previstos serão correlatados com o regressor $\ . Após a aplicação do teste o autor descreve um procedimento de construção do modelo incluindo a estimação de s e dos limiares. O método de estimação aplicado é o de mínimos quadrados condicional e a seleção do modelo é realizada com base no critério de informação de Akaike. 3.2.1.3. Estimação Considerando estimação por mínimos quadrados condicional e assumindo que p, q e s são conhecidos, e que a variável de limiar * é dada, escrevemos o modelo para o caso de s = 2 da seguinte forma: Os parâmetros do modelo são e a sua estimação pode ser obtida em dois passos. Primeiro, para um dado d e ^, o modelo acima nada mais é do que duas regressões lineares multivariadas separadas, cujas estimativas de mínimos quadrados dos seus parâmetros são um resultado conhecido: Define-se a soma do quadrado dos resíduos como onde $ ^ , X é o traço de No passo 2, as estimativas de mínimos quadrados condicional de d e ^ são obtidas fazendo 38 Os estimadores de mínimos quadrados condicionais são estimadores consistentes dos coeficientes, do lag e dos limiares e da matriz de covariâncias. 3.2.1.4. Identificação do modelo O problema de identificação e especificação de um modelo de limiar multivariado envolve a seleção de muitos parâmetros. Os problemas mais difíceis são: a identificação da variável de limiar e a especificação do número de regimes. A identificação de s pode levar em consideração experiências passadas e informações a priori sobre o conjunto de dados, ou a complexidade computacional pode restringir s a um número pequeno. Assumindo que * e s são dados, o autor usa o critério AIC para selecionar um modelo. Dados p, q, d e s, o critério AIC do modelo de limiar multivariado é dado por: (3.9) onde , f, X, F é a função de verossimilhança do regime j avaliado na estimativa de máxima verossimilhança de , $ , $ . 3.2.2. Modelo STVAR O modelo STVAR (Smooth Transition Vector Autoregressive) é a versão multivariada do modelo STAR descrito na seção 3.1.2. Este modelo é severamente utilizado para modelar vetores de séries temporais, citando aqui o campo da Macroeconomia. 3.2.2.1. Formulação matemática Considere % = , , … , como um vetor (K x 1) de séries temporais. Uma analogia K-dimensional da expressão matemática representada pelo modelo STAR com dois regimes é dada por: 39 % = Φ X rsF ; , u + Φ X r1 − sF ; , u + onde, (3.10) os vetores Φ$,; , i =1,2 são vetores (K x 1) dos coeficientes interceptos ligados aos regimes; a matriz Φ$ = rΦ$, , … , Φ$,a u i =1,2 tem dimensão (K x K) e é formada pelos coeficientes dos modelos lineares ligados aos regimes; o vetor ε = ε , … , ε é o vetor k-dimensional de ruído branco com média zero e matriz de variância-covariância positiva definida Σ ; a matriz X = 1, … ,1, % , % , … , %a ′, é formada por 1 na posição inicial indicando o intercepto do modelo e nas demais posições as defasagens das variáveis endógenas; a função s . é a função logística. Observe que no modelo STVAR os regimes são comuns às K variáveis, no sentido de que uma mesma função de transição determina o regime e a troca de regimes de todas as K equações do modelo. 3.2.2.2. Teste de Linearidade Para realizar os testes de linearidade enfrentamos o mesmo problema do caso univariado. Isto é, o STVAR contém parâmetros que não são identificáveis sob a hipótese nula. Para solucionar o problema de identificação os autores usam uma aproximação de Taylor adequada para a função de transição. Por exemplo no caso da função logística utiliza-se a aproximação de Taylor de terceira ordem em torno de = 0, resultando em um modelo re-parametrizado: (3.11) Desta forma, a hipótese nula original é equivalente à de que $ = 0, c = 1,2,3. A estatística do teste de multiplicador de Lagrange (LM) resultante tem uma distribuição assintótica qui-quadrada com 3` graus de liberdade sob a hipótese nula. 40 3.2.2.3. Estimação Quando a linearidade é rejeitada e a variável e a função de transição foram selecionadas, os parâmetros do modelo STVAR podem ser estimados através de mínimos quadrados não lineares (MQNL). Sob algumas condições de regularidade, os estimadores são consistentes e com distribuição assintoticamente Normal. 3.2.2.4. Adequação Como proposto em Eitrheim e Teräsvirta (1996), três testes são realizados com o objetivo de checar se o modelo estimado é adequado. Testa-se se os resíduos apresentam auto-correlação, se os dados ainda apresentam alguma não linearidade e se os parâmetros são constantes. Camacho (2004) descreve esses testes detalhadamente. 3.2.3. Modelo SBTVAR O modelo TVAR proposto por Tsay (1998) é um modelo linear local com matrizes auto-regressivas diferentes em cada regime, determinados por uma variável de limiar (uma das variáveis endógenas), um lag e um limiar. O modelo SBTVAR (Structural Break Threshold Vector Autoregressive) proposto por Galvão (2006) também divide a amostra em dois períodos, determinados por um ponto de quebra, o qual permite diferentes dinâmicas antes e depois desta quebra. O que mostra que este modelo caracteriza em mudanças abruptas de um regime para o outro. Apesar dos modelos não-lineares capturarem algumas características de modelos de quebras estruturais, pode ser que a quebra também implique em mudanças nos parâmetros que determinam a não-linearidade. 41 3.2.3.1. Formulação matemática Defina x = x , … , x como um vetor (m x 1) de m variáveis endógenas e defina x = r1, x , … , xa u como uma matriz (m x (mp+1)), onde p é a ordem auto-regressiva. O modelo SBTVAR pode ser escrito como: (3.12) onde, 0$,\ ^$ é uma função indicadora, a qual depende de uma variável de transição *\ , do limiar ^$ e do lag X$ , e 0 é uma função indicadora que depende do ponto de quebra. O SBTVAR tem um TVAR em cada subconjunto determinado pelo ponto de quebra, ou seja, a quebra também afeta os parâmetros da função indicadora que determina os regimes. Se não houver limiar, o VAR com quebra estrutural (SBVAR) é dado por: (3.13) Por outro lado, se houver limiar, mas não quebra estrutural, temos o VAR com limiar (TVAR), que pode ser escrito como: (3.14) 3.2.3.2. Estimação A estimação do SBTVAR pode seguir duas abordagens, a de mínimos quadrados condicionais, usada em Tsay (1998), apresentada na seção 2.3, ou máxima verossimilhança, sugerida em Hansen and Seo (2002). Usando os resíduos, a matriz de covariância é computada de forma consistente como 42 O estimador de mínimos quadrados condicionais (MQC) é obtido fazendo Da mesma forma, o estimador de máxima verossimilhança (ML) é obtido fazendo O estimador de ML é construído assumindo que as matrizes de covariância são as mesmas em cada regime. Essa hipótese pode não ser válida quando aplicada a dados macroeconômicos com variância não constante no tempo, mas o estimador pode ser modificado para este caso. 3.2.3.3. Seleção do modelo Em Galvão (2006) é apresentado um procedimento de seleção entre modelos de limiar. A questão a ser estudada é qual modelo é mais adequado ao conjunto de dados, um VAR, TVAR, SBVAR ou um SBTVAR. Mesmo se podendo estimar modelos SBTVAR’s, não fica claro a necessidade de ter limiares ou transições que variam no tempo para capturar a estrutura dinâmica dos dados. Testes para limiar em um SBVAR ou para quebra estrutural em um TVAR são complicados devido à descontinuidade das mudanças e da presença de parâmetros mal comportados. A autora propõe um método de especificação do modelo baseado nos limites assintóticos para os testes LM e de Wald, derivados por Altissimo e Corradi (2002). A regra de decisão para a seleção do modelo usa limites assintóticos e os valores máximos das estatísticas de Wald e LM em uma grade de possíveis valores para os parâmetros mal comportados, como proposto por Altissimo e Corradi (2002). As estatísticas de Wald e LM são calculadas usando a soma do quadrado dos resíduos (SSR) sob a hipótese nula e alternativa: 43 O vetor z contém parâmetros como limiares e quebras do modelo sob a hipótese nula, e o vetor z contêm os mesmos parâmetros sob a hipótese alternativa. 3.2.4. Modelo TVEC Lo e Zivot (2001) definiram um modelo de co-integração com limiar multivariado, chamado TVEC (Threshold Vector Error Correction), que é um caso especial do TVAR do Tsay (1998). 3.2.4.1. Formulação matemática De acordo com todas as considerações e suposições feitas no modelo TVAR, Tsay (1998), define-se um modelo de limiar bivariado com 3 regimes pela expressão: (3.15) Pode-se reescrever este modelo como: (3.16) onde Se, em cada regime j, é I(1) e co-integrado com o vetor de co-integração comum A = 1, −A , então o rank ∏ = 1 e 44 Desta forma, a representação do modelo TVEC é dada por: (3.17) 3.2.4.2. Teste de co-integração Lo e Zivot (2001) consideram testes de não co-integração contra cointegração linear e co-integração com limiar, além de testes de linearidade depois de determinado que existe co-integração nos dados. Balke e Fomby (1997) discutiram alguns problemas associados a testes de co-integração com limiar. Os autores notaram que testar a hipótese nula de não co-integração contra a hipótese alternativa de co-integração com limiar é complicado. Além disso, para construir testes com alto poder para um tipo específico de TVEC, é preciso especificar e estimar a forma do modelo de limiar sob a hipótese alternativa, e isto pode ser difícil, uma vez que existem muitos tipos de modelos de limiar. Baseados em resultados de simulações de Monte Carlo, Balke e Fomby (1997) sugeriram a seguinte estratégia, que Lo e Zivot (2001) estenderam: 1) Testa a hipótese nula de não co-integração contra a alternativa de cointegração linear. 2) Se a hipótese de não co-integração for rejeitada, testa a hipótese nula de co-integração linear contra a alternativa de co-integração nãolinear (com limiar). 3) Se a hipótese de linearidade for rejeitada, é realizada a especificação e estimação do modelo de limiar. 3.2.4.3. Teste de linearidade Para testar a linearidade, os autores usaram o teste generalizado apresentado em Tsay (1998), que também é válido para processos co-integrados. Para implementar esse teste, foi considerada uma regressão arranjada multivariada para VEC. 45 3.2.4.4. Especificação do modelo Após a realização dos testes e de rejeitar a não co-integração e linearidade, é necessário determinar que tipo de modelo de limiar é mais apropriado para o conjunto de dados. Algumas questões a serem respondidas são o número de regimes do modelo, se os valores dos limiares são simétricos, qual modelo é mais apropriado, entre outras. Duas linhas gerais foram seguidas para determinar a especificação do modelo de limiar apropriada. A primeira, adotada por Tong (1990), Clements e Krolzig (1998), e Tsay (1998), usa um critério de seleção como AIC para determinar a melhor especificação do modelo. A segunda, recentemente revisada por Hansen (1999), usa um procedimento de testes seqüenciais baseados em modelos aninhados. Lo e Zivot (2001) seguiram Hansen (1999) e consideraram testes de hipóteses em ninhos baseadas em estimação irrestrita do modelo TVEC. 3.2.4.5. Estimação A estimação do modelo é realizada usando mínimos quadrados condicional seqüenciais, como em Hansen (1999). 3.2.5. Modelo STVEC O modelo STVEC (Smooth Transition Vector Error Correction) é a versão não-linear do modelo VEC (Vector Error Correction). A julgar pelas aplicações destes modelos multivariados não-lineares que estão atualmente disponíveis, um modelo de particular interesse é aquele em que os componentes do % linear estão ligados por uma relação de equilíbrio de longo prazo, enquanto a adaptação para este equilíbrio é não-linear e pode ser caracterizado como troca de regimes, com os regimes determinados pelo tamanho e/ou o desvio de sinal de equilíbrio. Em modelos lineares de séries temporais, este tipo de comportamento é capturado pelo modelo vetorial de correção de erros, consulte Johansen (1995) para os 46 tratamentos em profundidade. Recentemente, extensões não-lineares destes conceitos foram consideradas na literatura. 3.2.5.1. Formulação matemática Concentrando-se na incorporação do mecanismo de transição suave em um VEC para permitir a não-linearidade ou assimetria dos dados, define-se como um modelo vetorial de correção de erros com transição suave (Smooth Transition Vector Error Correction – STVEC) dado por: (3.18) onde, os vetores α$ , i =1,2 são vetores (K x 1) e * = A % para algum vetor (K x 1); A é o termo de correção de erro, isto é, * é o desvio da relação de equilíbrio a qual é dada por A % = 0; a matriz Φ$ = rΦ$, , … , Φ$,a u i =1,2 tem dimensão (K x K) e é formada pelos coeficientes dos modelos lineares ligados aos regimes; o vetor ε = ε , … , ε é o vetor k-dimensional de ruído branco com média zero e matriz de variância-covariância positiva definida Σ ; a matriz X = 1, … ,1, % , % , … , %a ′, é formada por 1 na posição inicial indicando o intercepto do modelo e nas demais posições as defasagens das variáveis endógenas. Afigura-se que as formas de correção de erros não-lineares freqüentemente afetam diferentes ajustes para desvios positivos e negativos, ou para desvios grandes e pequenos do equilíbrio. Efeitos assimétricos de desvios positivos e negativos do equilíbrio podem ser obtidos definindo a função s . como a função logística e F = * . No modelo resultante, a força de reversão de * ao seu atrator muda monotonicamente para valores crescentes de * . A constante de locação pode ser reduzida a zero para tornar a mudança simétrica em torno do valor de equilíbrio zero. 47 Já os efeitos assimétricos de desvios grandes e pequenos do equilíbrio podem ser obtidos definindo a função s. como a função exponencial, dada por: s F ; , = 1 − h|−F − , > 0. com F = * e novamente com a constante de locação reduzida a zero para centrar a força de equilíbrio em zero. 3.2.5.2. Teste de Linearidade A seleção da variável de transição é feita testando a linearidade do modelo. A hipótese nula é de que o conjunto de dados segue um modelo VEC e a alternativa é de que seguem um STVEC. Para isso, preparam-se uma seqüência de candidatas a variáveis de transição. Para solucionar o problema de identificação dos parâmetros sob a hipótese nula, segue-se a abordagem de Luukkonen, Saikkonen, Teräsvirta (1988) e substitui-se a função de transição por uma aproximação de Taylor adequada. Desta forma, a metodologia aplicada no teste é a mesma da aplicada em modelos STVAR. O teste proposto por Luukkonen, Saikkonen, Teräsvirta (1988) vem sendo usado em muitos estudos empíricos. Mas esse teste estatístico é baseado em uma aproximação polinomial, e os erros de aproximação podem afetar a inferência estatística. Além disso, os testes não são diretamente relacionados com o modelo de transição suave, logo não pode apontar o que causa a rejeição da linearidade. Com esta motivação, Seo (2004) considerou testes diretos para ajuste não-linear em um modelo STVEC, baseados na especificação exata da transição suave. Hansen e Seo (2002) consideraram os testes para não-linearidade de limiar em um VEC e Seo (2004) estendeu para VEC de transição suave (STVEC). Os testes são baseados na estatística LM, que pode ser calculada sob a hipótese nula. 3.3. Metodologia CART 3.3.1. Introdução A metodologia Classification and Regression Tree (CART), proposta por Breiman, Friedman, Olshen e Stone (1984), é um método de particionamento 48 recursivo, o qual estrutura os modelos definidos para sub-amostra dos dados, dividindo de forma conveniente o problema em partes. Isto define a estruturação por árvores de decisão, servindo de alternativa aos métodos tradicionais de classificação (variável dependente binária) e regressão (variável dependente contínua). O modelo CART é não-paramétrico, sendo, portanto, não-probabilístico, pois não assume uma distribuição de probabilidade e não seguem suposições sobre componentes aleatórios e a forma do modelo. A principal vantagem do CART vem da facilidade de interpretação da estrutura de árvore de decisão. As variáveis envolvidas na definição da árvore formam um conjunto de sentenças lógicas do modelo final. O ciclo da modelagem envolve o crescimento da árvore a partir da raiz (nó inicial), que contém todas as observações do conjunto de dados, até as folhas (nós terminais), cada qual contendo parte das observações. Primeiramente, realiza-se um teste no nó inicial, o qual só admite resposta do tipo binário {0,1}, sendo então um teste lógico. Este teste é realizado em cada observação de cada uma das variáveis preditoras e, de acordo com as respostas lógicas obtidas, a raiz dará origem a dois filhos (novos nós), contendo parte das observações originais. Por convenção, se a resposta for 1, aloca-se a observação no nó esquerdo, caso contrário, no nó direito. Para cada nó gerado, este procedimento de teste lógico deve ser repetido até que não seja mais possível dividir a árvore. Desta forma, cada um dos nós que não geraram novos nós são os chamados nós terminais. E cada nó que gerou dois filhos são denominados nós ancestrais, ou nós de divisão, ou ainda nós intermediários. O modelo final estimado é representado por um gráfico com o formato de uma árvore binária de decisão, com os nós ancestrais (ou nós de divisão) e os nós terminais (ou folhas). Um procedimento importante de numeração dos nós deve ser adotado. A raiz é sempre o nó 0. E cada nó gerado a partir do nó 0 segue uma seqüência numérica crescente da esquerda para a direita. Quando os nós não forem gerados, deve-se saltar os seus números correspondentes e prosseguir a numeração com o nó à direita mais próximo. A Figura 3.1 ilustra um exemplo de árvore com ausência de alguns nós. 49 Figura 3.1: Exemplo de árvore com ausência de alguns nós 3.3.2. Formulação matemática Seja | = | , | , … , |a ′ ∈ ⊆ ℝa um vetor com variáveis preditoras de uma determinada resposta univariada e contínua ′ ∈ ℝ. Defina . como uma função desconhecida através da expressão: = x + (3.19) tal que, não há suposições sobre o termo aleatório . Define-se, conforme Lewis,Stevens (1991), um modelo estruturado por árvore com K folhas por uma função geral não-linear x ; de x e definida pelo vetor de parâmetros ∈ ℝ¡ , onde r é o número total de parâmetros, através da expressão: x ≈ x ; = ∑ $: A$ 0$ x ; z$ (3.20) onde, 0. é uma função indicadora, dada por: 1, 0$ x ; z$ = g 0, Fh x ∈ `$ z$ n . e = A , … , A , z , … , z ′ é o vetor de parâmetros envolvidos na árvore. 50 Usualmente, H(.) é uma função constante definida por K sub-regiões `$ z, c = 1, … , £, de algum domínio K ⊂ ℝa . A Figura 3.2 é um exemplo de um modelo gerado por uma árvore de regressão que explica a relação entre a variável resposta y e um conjunto de duas variáveis preditoras x1 e x2 (q = 2). Define-se cj, j = 0,1,...,N, como o valor limite da partição ki que determinará a inclusão da observação na região. Figura 3.2: Exemplo de um modelo gerado por uma árvore de regressão 3.3.3. Algoritmo de crescimento A arquitetura da árvore é definida a partir de um ciclo iterativo que escolhe um nó a cada passo para ser subdividido e gerar mais 2 nós. A cada iteração, além do nó a ser dividido, também é especificada uma variável de transição e o limiar desta divisão (cj). A escolha desta especificação visa minimizar a soma dos erros quadráticos de previsão. Para a raiz da árvore (primeira divisão), a equação a ser minimizada é dada por: SQEF© = ∑:ª − oA 0| ; F; , ; + A r1 − 0| ; F; , ; up« (3.21) 51 Após a especificação, estimam-se os parâmetros dos modelos locais para as observações alocadas dentro dos nós gerados pela divisão. Esse ciclo se repete até que não haja mais ganho em efetuar subdivisões na árvore. Com o modelo final estimado, é possível realizar cortes de algumas folhas, técnica conhecida como podagem (prunning), a partir de medidas de custo e complexidade, ou da capacidade preditiva do modelo. 52 4 Metodologia 4.1. Introdução Neste capítulo apresentam-se os modelos STVAR-Tree, o principal da dissertação, além dos modelos competidores PAR(p) e Neuro-Fuzzy. 4.2. Modelo STVAR-Tree O modelo vetorial auto-regressivo de transição suave estruturado por árvores (em inglês, Smooth Transition Vector Autoregressive-Tree), denominado aqui por modelo STVAR-Tree, é resultante da combinação do modelo STVAR (Smooth Transition Vector Autoregressive) com o algoritmo CART (Classification and Regression Tree), ambos discutidos no Capítulo 3. A construção do modelo STVAR-Tree é uma adaptação do modelo STAR, proposto por Dijk, Teräsvirta e Franses (2002). O ciclo da modelagem consiste em três etapas: especificação, estimação e avaliação do modelo. A especificação do modelo é feita através de métodos estatísticos, o que permite desenvolver testes de hipóteses. Por esta abordagem, é possível especificar um modelo não-linear paramétrico por meio de uma árvore de decisão. Além disso, a árvore de decisão final pode ser facilmente interpretada, como sentenças lógicas. A estimação dos coeficientes pode ser vista como uma combinação de diferentes modelos auto-regressivos, podendo utilizar variáveis exógenas no conjunto daquelas que ajudam a compor o espaço de transição. E, por fim, a avaliação do modelo final dá-se por meio de seu desempenho (habilidade preditiva) em dados fora da amostra (out-of-sample). 53 4.2.1. Formulação matemática Sejam , , … , séries temporais multivariadas de variáveis endógenas, = , , … , , = , , … , , ..., = , , … , . Defina . como uma função desconhecida de séries temporais multivariadas x , as quais podem ser as variáveis endógenas defasadas e variáveis exógenas, através da expressão: = x + (4.1) tal que Ε / 2 = 0 (vetor nulo de dimensão K) e Ε / 2 = Σ (matriz de variância-covariância de dimensão K x K). Define-se, portanto, a função ®¯ x ; : ℝ° → ℝ, indexada pelos parâmetros , como o modelo STVAR-Tree através da expressão: ®¯ x ; = ∑$∈¯ Φ$ z³ ´®$ x ; z$ + onde, (4.2) o vetor | = r| , | , … , |° u , tal que x ∈ µ° ; o vetor * = r* , * , … , *a u , o qual z ⊆ x , tal que z ∈ ℝa , < f, contém as variáveis endógenas defasadas e, ainda, pode conter variáveis exógenas e variáveis exógenas defasadas ; e o vetor z³ = 1, … ,1, z ′ contém 1’s indicando os interceptos acrescidos ao vetor * ; o vetor = , , … , é K-dimensional contendo ruídos brancos, ou seja, Ε / 2 = 0 , Ε / 2 = ¶·;,¸ , ¹º Q:¹n ¹º Q»¹ ® é o conjunto de índices de nós geradores. Define-se ®$ como o subconjunto de ® contendo os índices dos nós geradores que formam o caminho para a folha (nó terminal) i; ¯ é o conjunto de índices de folhas (nós terminais); µ é o conjunto de índices de variáveis de transição; As funções ´®$ , 0 < ´®$ < 1, são conhecidas como funções de pertinência, dadas por. 54 ¾,½ ¾,½ ´®$ x ; z$ = ¼ s O|D½ , ; , P ∈® − s O|D½ , ; , PÀ ¿1 r¾,½ u¾,½ (4.3) onde, −1, Fh k jÅclℎk j^j j kÆℎj c lãk clÆ!c k ló jlhF>^jÆ Ä ´®$ = 1;   0, Fh k jÅclℎk j^j j kÆℎj c clÆ!c k cÆℎk Xc^hc>k Xk ló jlhF>^jÆ n l$, ´®$ = 1 − s; à   1, Fh k jÅclℎk j^j j kÆℎj c clÆ!c k cÆℎk hFf!h^Xk Xk ló jlhF>^jÆ ´®$ = s. Á Vale ressaltar que ∑∈® ´®$ rx ; z u = 1, ∀ x ∈ µ° . A função s | ; z é definida como Função Logística, da forma: s | ; , = Ê ËÌÍx ËÎ (4.4) Define-se = Φ$ , z$ como a representação de todos os parâmetros do modelo, sendo particionado em dois grupos, classificados como parâmetros lineares Φ$ = rΦ$ , … , Φa$ u e parâmetros não-lineares z$ = $ , $ . A matriz de parâmetros Φ$ é aquela que contém os coeficientes associados às defasagens das variáveis dependentes, e o vetor z$ é formado pelos parâmetros de suavidade e locação, respectivamente. O motivo de z ser um subconjunto de x (conjunto de variáveis de transição) é evitar regressores não estacionários nos modelos lineares locais, uma vez que podemos ter séries não estacionárias como variáveis de transição. Uma ilustração deste caso é dada quando a variável de transição x$ trata-se de uma tendência linear, a qual identifica uma possível quebra estrutural nas séries. 4.2.2. Especificação do modelo O objetivo, aqui, é obter uma estratégia para o crescimento da árvore, baseado na inferência estatística. Um processo de construção similar ao proposto por van Dijk, Teräsvirta e Franses (2002) para o modelo STAR foi adaptado para 55 a modelagem STVAR-Tree. Os passos são basicamente os mesmos descritos no Capítulo 3, os quais seguem o princípio “específico para geral”: 1) Seleção de variáveis relevantes para o modelo Caso o número de variáveis disponíveis para a composição do modelo seja elevado, é importante selecionar as mais relevantes. As candidatas à variáveis de transição podem ser variáveis exógenas ou defasagens da variável dependente. Dois critérios podem ser utilizados nesta fase: a) conhecimento subjetivo do problema em questão, ou seja, usar o conhecimento prévio sobre as séries temporais; ou b) estimar diversos modelos lineares VAR, incrementando a ordem p do modelo, com = 1,2, … , . Aquele modelo que minimizar os critérios de informação AIC (Akaike, 1974) ou BIC (Schwarz, 1978) deve ser selecionado e todas as propriedades dos modelos lineares VAR(p) devem ser verificadas. As variáveis que compõem este modelo devem ser selecionadas para a modelagem do STVAR-Tree. 2) Especificação do modelo, baseado em uma sequência de testes de hipótese do tipo LM, o qual avalia a linearidade de um determinado modelo Esta etapa define o modelo a ser estimado. Aqui, os conceitos de inferência estatística são utilizados para determinar o crescimento da árvore. O procedimento envolve uma seqüência de testes do tipo Multiplicadores de Lagrange, conhecido como teste LM (do inglês, Lagrange Multiplier), como apresentado em Luukkonen, Saikkonen e Teräsvirta (1988). Na construção do modelo STVAR-Tree, o teste LM verifica a adequação do modelo STVAR-Tree para descrever os dados. No caso em que a hipótese nula de linearidade for rejeitada, seleciona-se o nó a ser dividido e a variável de transição para estimar o modelo. 3) Estimação dos parâmetros lineares (constantes dentro dos nós) e nãolineares (parâmetros da função logística) do modelo selecionado Dois métodos de estimação são utilizados para produzir as estimativas dos parâmetros do modelo STVAR-Tree, representados por = Φ$ , z$ .Para estimar os parâmetros classificados como lineares Φ$ = rΦ$ , … , Φa$ u utiliza-se Mínimos Quadrados Multivariados (ou Mínimos Quadrados Generalizados – MQG) e para estimar os parâmetros não-lineares z$ = 56 $ , $ utiliza-se Mínimos Quadrados Não-Lineares (MQNL), que é equivalente ao método de Máxima Verossimilhança (MV) sob a normalidade dos erros. Caso os erros não sejam normais, MQNL é equivalente à Quase-Máxima Verossimilhança (QMV). 4) Análise de diagnóstico do modelo Avalia-se os modelos estruturados por árvores pelo seu desempenho estatístico (habilidade preditiva) em dados fora da amostra (out-ofsample). 5) Re-especificação do modelo de acordo com os resultados do diagnóstico No caso de selecionar um modelo STVAR-Tree que não produza resultados estatísticos satisfatórios, deve-se voltar a etapa 1 e reespecificar um modelo e, assim, seguir todas as etapas. 6) Utilização do modelo com fins descritivos ou de previsão Com todas as etapas acima verificadas e satisfeitas, determina-se o modelo ®¯ x ; como o modelo final que será utilizado de acordo com os seus propósitos. Esta etapa de especificação engloba a etapa de estimação dos parâmetros, definida na seção posterior, pois o teste LM necessita estimar os modelos sob H0 e H1, o que indica que, para cada divisão, são estimados os parâmetros lineares e não-lineares dos modelos. 4.2.3. Estimação dos parâmetros Definiu-se que, para a estimação de todos os parâmetros do modelo STVAR-Tree, representados por = Φ$ , z$ , leva-se em consideração a hipótese de que o vetor = , , … , é formado por variáveis aleatórias normalmente distribuídas com média zero e matriz de variância-covariância Σ . Para estimar os parâmetros lineares do modelo inicializa-se os valores dos parâmetros não-lineares z$ = $ , $ através de uma grade de valores (grid). Uma vez inicializados, ou seja, dado que os parâmetros não-lineares são conhecidos, a estimação do modelo STVAR-Tree corresponde a estimação de uma regressão multivariada e os parâmetros lineares Φ$ = rΦ$ , … , Φa$ u são estimados por 57 Mínimos Quadrados Multivariados (ou Mínimos Quadrados Generalizados – MQG), dados por: Ï = /Zz Zz 2 Zz Q Φ (4.5) onde, = , , … , , z = z , … , z" e Zz = Ñ z³ ´ x ; z ⋯ ⋮ ⋱ z³ ´ x ; z ⋯ z³ ´ x ; z ⋮ Ô z³ ´ x ; z Esse método de estimação é conhecido como Máxima Verossimilhança Concentrada, sob normalidade dos erros, ou Quase-Máxima Verossimilhança Concentrada, caso os erros não sejam normais, e a expressão é dada através de: 1 Õ = argmin Ý ß/ − ®¯ x ; 2 / − ®¯ x ; 2à Þ Û∈Ü : (4.6) Os parâmetros não-lineares de , ou seja, vetor z$ são estimados condicionalmente a Φ através de MQNL, o qual faz uso de procedimentos de otimização não-linear. Para a estimação dos parâmetros do modelo STVAR-Tree considerou-se o algoritmo de Levenberg-Marquadt, completando a estimação da iteração. Como o método MQNL é muito sensível aos valores iniciais, é feita uma busca de valores iniciais por grade de valores (grid), que busca a maximização da função de log-verossimilhança concentrada. 4.2.4. Divisão dos nós – Seqüência de testes LM Considere um modelo STVAR-Tree com K nós terminais, escrito como: > = ou ®¯ x ; = ∑$∈¯ Φ$ z³ ´®$ x ; z$ + (4.7) 58 = ß $∈¯$ ∗ Φi z³ ´®$ x ; z$ + Φ$ ∗ z³ ´®$∗ x ; z$∗ + Φ$ ∗ z³ ´®$∗ x ; z$ ∗ + (4.8) onde ´®$∗ x ; z$ ∗ = ´®$∗ x ; z$ ∗ s|$∗ ; $ ∗ , $∗ ; ´®$∗ x ; z$ ∗ = ´®$∗ x ; z$ ∗ /1 − s |$ ∗ ; $∗ , $∗ 2. A equação pode ser escrita na forma: = ß Φ$ z³ ´®$ x ; z$ + =z³ ´®$∗ x ; z$ ∗ $∈¯$ ∗ + bz³ ´®$∗ x ; z$ ∗ s|$ ∗ ; $∗ , $∗ + (4.9) onde = = Φ$∗ e b = Φ$∗ − Φ$ ∗ . Define-se, portanto, a construção do modelo através de testes de hipóteses do tipo Multiplicadores de Lagrange, conhecido como teste LM. Desta forma, o crescimento da árvore está condicionado à existência de não-linearidade nas séries modeladas. Primeiramente, o teste LM deve ser realizado, baseado nas hipóteses: H0: Linearidade H1: Não-linearidade Esta etapa consiste em testar se o nó raiz deve ou não ser dividido. Em outras palavras, o teste determinará um modelo constante VAR ou o mais simples modelo STVAR-Tree, com 2 nós terminais. Sob H0, é fácil verificar que, para = 0, a função logística s . assume um valor constante igual a 0,5, independente do valor do parâmetro de locação , pois: s| ; 0, = 1+ 1 h ;x y = 1 1 1 = = ; 1+h 1+1 2 59 Isto implica que a estimação de ®¯ x ; será simplesmente a média ponderada entre os regimes, sendo então, uma combinação linear de modelos lineares VAR. Consequentemente, o modelo resultante também será linear. Portanto, seria suficiente testar a linearidade das séries considerando as hipóteses: H0 : = 0 H1 : > 0 Porém, ao considerar diferentes valores para o parâmetro , a função de verossimilhança pode permanecer inalterada, o que acarretará num problema de identificação. Como uma solução deste problema, adota-se a proposta de Luukkonen, Saikkonen e Teräsvirta (1988), que aproxima a função s . por uma expansão de Taylor de 3ª ordem em torno de = 0. Então, ao reescrever o modelo ®¯ x ; considerando a expansão de Taylor no lugar da função s . , chega-se a seguinte expressão: s | ; , = 1 3 1 + 2 | − + | − + ~ | − ~ 2 2 2 + â~ | ; , (4.10) onde R ~ xQ ; γ, c é o resto da expressão. Considerando a expansão de Taylor de 3ª ordem em torno de = 0, o modelo pode ser escrito como: = ß Φ$ z³ ´®$ x ; z$ + ; z³ ´®$∗ x ; z$ ∗ + z³ ´®$∗ x ; z$ ∗ |$ ∗ $∈¯$ ∗ + z³ ´®$∗ x ; z$∗ |$∗ + ~ z³ ´®$∗ x ; z$ ∗ |$~∗ + h (4.11) onde h = + b z³ ´®$ ∗ x ; z$∗ + â~ |$ ∗ ; $∗ , $ ∗ Os parâmetros " , ` = 0, … ,3 são funções dos parâmetros originais lineares e não-lineares do modelo, =, b, $ ∗ , $ ∗ . Desta forma, as hipóteses do teste LM passam a ser: 60 H0: = = ~ = 0 H1: caso contrário Sob H0, o resto da expansão de Taylor desaparece, de forma que as propriedades do erro permanecem inalteradas. E isto gera condições propícias para o uso de inferência estatística assintótica. O teste LM também pode ser aplicado na sua versão do teste F, seguindo os seguintes passos: 1) Estimar o modelo com K regimes 2) Regredir os resíduos !æ em hÕ e calcular a soma dos novos resíduos quadráticos â; = ∑: !³. Os novos resíduos !³ serão ortogonais à hÕ . 3) Fazer a regressão de !³ em hÕ e νæQ . Calcular a soma dos resíduos quadráticos obtidos a partir desta regressão, â = ∑: è̂ . 4) Obter a estatística M ou a estatística F êëì = Þ êí = onde l = f + 2ℎ + + 1. â; − â , â; â; − â /Å , â /Þ − l − Å Sob H; , a estatística de teste êëì segue uma distribuição M assintótica com Å graus de liberdade, e a estatística de teste êí segue aproximadamente uma distribuição F com m e Þ − l − Å graus de liberdade, onde T é o número de observações. Uma vez definidos a estimação do modelo e o teste ML para o crescimento da árvore, o algoritmo da modelagem torna-se simples. 4.2.5. Controle do crescimento da árvore Na modelagem STVAR-Tree, o teste LM deve ser executado seqüencialmente de modo a decidir a divisão de cada um dos nós sob teste. Sabe- 61 se que árvores com muitos nós terminais tornam-se complexas e isto compromete a análise do modelo final. Com a finalidade de controlar o erro do tipo I (árvore superestimada), adotou-se o procedimento de diminuir o nível de significância do teste, de acordo com o crescimento da árvore. Assim, ao realizar o teste pela nésima vez em um nó da d-ésima profundidade, o procedimento adotado faz com que X, l assuma o valor: X, l = , l\ onde é o nível de significância do primeiro teste. Este procedimento força o teste LM a ser mais rigoroso nas divisões de maiores profundidades e, assim, o uso de técnicas de podagem citadas no Capítulo III não deve ser levado em consideração. 4.2.6. Previsão A flexibilidade da metodologia STVAR-Tree permite que sejam criados três tipos de previsão diferentes: 1) Combinação de Regimes (RC): Aplicação direta do modelo estimado. Utiliza-se a equação resultante da estimação para obter a previsão um passo a frente. Assim, a previsão é obtida a partir da soma ponderada dos modelos lineares locais, na qual os pesos são as pertinências das observações em cada regime. 2) Máxima Pertinência (MM): Observa-se em qual regime a observação apresenta maior pertinência e aplica-se o modelo local correspondente. 3) Combinação Adaptativa de Regimes (do inglês, Adaptive Regime Combining – ARC): Metodologia similar à RC, porém os parâmetros lineares são re-estimados a cada passo da previsão, utilizando as últimas observações, correspondentes a um ano. Para séries diárias, as últimas 365 (ou 252, no mercado financeiro). Séries semanais, as últimas 52 observações. E para séries mensais, as últimas 12 observações. E assim por diante. 62 4.3. Modelo PAR Essencialmente, qualquer estrutura de dependência temporal pode ser reproduzida por modelos de séries temporais lineares do tipo PAR(p), sendo este tipo de modelo uma abordagem bastante flexível, e bastante popular para a modelagem estocástica de vazões fluviais (Hipel e McLeod, 1994). Na terminologia de séries temporais, a tendência hidrológica é conhecida como estrutura de dependência temporal, sendo quantificada pela função de autocorrelação estimada do registro de vazões. A análise deste tipo de séries pode ser feita pelo uso de formulações autoregressivas cujos parâmetros apresentam um comportamento periódico. A esta classe de modelos costuma-se denominar modelos auto-regressivos periódicos de ordem p - PAR(p), Salas et al. (1980). Em geral, p é um vetor, = , , . . . , , onde cada elemento fornece a ordem de cada período. 4.3.1. Formulação matemática O modelo PAR , , . . . , pode ser descrito matematicamente por: (4.12) onde, ï é uma série sazonal de período s; F é o número de período (s=12 para séries mensais) > é o índice do tempo, t=1,2,…,sN, função do ano T (T=1,2,…,N) e do período m (m=1,2,…,s); N é o número de anos; 3 é a média sazonal de período s; G é o desvio-padrão sazonal de período s; $ = é o i-ésimo coeficiente auto-regressivo do período m; é a ordem do operador auto-regressivo do período m; j é a série de ruídos independentes com média zero e variância . 63 E a correlação do modelo PAR(p) é dada por: (4.13) 4.4. Sistema Neuro-Fuzzy Os Sistemas Neuro-Fuzzy (SNF) são ditos “inteligentes” e associam a capacidade de aprendizado das Redes Neurais e sua tolerância a falhas à interpretabilidade dos Sistemas Fuzzy (Zadeh, 1965). Ao se combinarem duas ou mais técnicas, cria-se, muitas vezes, um sinergismo que pode levar a um sistema mais poderoso. Verifica-se que SNF tem aplicação em diversas áreas, como reconhecimento de padrões, previsão, classificação, controle, etc., com a obtenção de bons resultados. A razão para o seu bom desempenho é que os mesmos implementam um sistema de inferência fuzzy através de uma arquitetura de redes neurais (paralelamente distribuída), permitindo assim a integração de conhecimentos implícitos (própria base de dados) e explícitos (conhecimento de especialistas). Uma série de arquiteturas de SNF tem sido proposta na literatura nos últimos anos. Dentre essas, pode-se citar o sistema ANFIS (Jang,1993), um dos modelos mais conhecidos e utilizados na prática. Passa-se a descrever o sistema ANFIS, o qual será utilizado no próximo capítulo para modelar o preço spot de energia elétrica no Brasil. 4.5. ANFIS: Adaptive Neuro-Fuzzy Inference System (Sistema Adaptativo de Inferência Neuro-Fuzzy) Por simplicidade, considere um sistema de inferência fuzzy com duas entradas x e y e uma saída z. Para um modelo Fuzzy Sugeno de primeira ordem, um conjunto usual de regras “se-então” é a seguinte: 64 A partir deste modelo Fuzzy Sugeno de primeira ordem com duas entradas e duas regras ilustra-se a arquitetura ANFIS como aquela da Figura 4.1, onde os nós da mesma camada têm funções similares. Figura 4.1: Arquitetura ANFIS equivalente A seguir, passa-se a descrever cada camada do modelo. Camada 1. Cada nó nesta camada , , ´ , ´ é um nó adaptativo com uma função denominada função de pertinência de um conjunto fuzzy, a qual gera a saída do tipo: ð,$ = 3ñ |, para c = 1,2, ou ð,$ = 3òËì , para c = 3,4 onde x (ou y) é a entrada para o nó i e $ (ou ´$ ) é um rótulo lingüístico (como “alto” ou “baixo”) associado a este nó. Esta função especifica o grau, pertencente ao intervalo [0,1], em que a entrada x (ou y) satisfaz este conjunto conjunto fuzzy,. Camada 2. Cada nó nesta camada é um nó fixo rotulado Π, representa o nível da regra, cuja saída é o produto de todos os sinais de entrada: ð,$ = ô$ = 3ñ | 3ò . Camada 3. Cada nó i nesta camada é um nó fixo rotulado N. A partir dessa camada temos o processo defuzzificador. A saída desse nó é dada pela razão entre o i-ésimo nível da regra e a soma de todas os níveis: Camada 4. Cada nó i nesta camada é um nó adaptativo com uma função nó: 65 onde ô$ é um nível da Camada 3 e $ , f$ , ^$ é o conjunto de parâmetros deste nó. Tem-se, então, um produto entre os níveis o valor do conseqüente da regra em si. Por isso, parâmetros nesta camada são denominados parâmetros conseqüentes. Camada 5. Cada nó i nesta camada é um nó fixo rotulado Σ, que calcula a saída geral do sistema como a soma de todos os sinais de sua entrada: Finalmente, a Figura 4.2 mostra uma arquitetura ANFIS que é equivalente a um modelo Sugeno de primeira ordem de duas entradas com nove regras, onde cada entrada tem três funções de pertinência associadas. Figura 4.2: Arquitetura ANFIS para o modelo Sugeno A identificação dos parâmetros do modelo ANFIS é realizada, em geral, empregando algoritmos de aprendizagem híbrida, isto é, combinando estimação de mínimos quadrados com retro-propagação. 66 5 Experimentos e Aplicações 5.1. Experimentos de Monte Carlo Experimentos de Monte Carlo foram planejados com o objetivo de constatar a funcionalidade tanto do teste LM quanto da estimação do modelo STVAR-Tree. Nos experimentos, foram realizadas 1000 replicações para cada modelo com tamanho de amostra variando em T = 200, 600 e 1100, numa tentativa de representar amostras pequenas, médias e grandes. Para evitar efeitos de inicialização, as 100 primeiras observações geradas foram descartadas e, assim, passamos a ter amostras de tamanho T = 100, 500 e 1000. Foram considerados os níveis de significância do teste LM, = 0,1%, 1%, 5%, 10% e 15%. 5.1.1. Teste LM Ao efetuarmos um teste de hipóteses, podemos tomar decisões certas ou erradas, de acordo com a aceitação ou rejeição das hipóteses em questão. Se representarmos isso numa tabela em termos de probabilidade, temos: H0 Verdadeira H0 Falsa P(Rejeitar H0) α (Erro do Tipo I) 1-β (Poder do teste) P(Aceitar H0) 1-α (Decisão correta) β (Erro do Tipo II) Tabela 5.1: Probabilidades em um teste de hipóteses Para a avaliação do teste LM, foram realizados dois experimentos, baseados nas seguintes hipóteses: H0: Linearidade H1: Não-linearidade 67 Primeiramente, uma análise da coluna que considera H0 verdadeira foi feita, isto é, um modelo linear, um VAR bivariado, foi simulado, tendo os seguintes parâmetros fixos: / 2 = /1 0 0 2 Ñ0,90 0 Ô + / 0 0,95 2 (5.1) Neste experimento, definimos o vetor constante como nulo e os erros aleatórios e independentes $ , c = 1,2 com distribuição Normal (0,1). A candidata a variável de transição foi . Vale ressaltar que as mesmas análises foram refeitas considerando a variável de transição , porém os resultados não se alteraram. A Tabela 5.2 apresenta os resultados obtidos. Duas conclusões deste primeiro experimento são tiradas, sendo uma positiva e outra negativa: Positiva: O teste LM apresentou grande nível de acerto quanto à linearidade dos dados; Negativa: Os valores de Êaí¡$y© são sempre menores que ¾©$¾÷ . E isto indica que o teste LM apresenta uma tendência para a aceitação da linearidade. Em outras palavras, o teste LM aceita a linearidade mais do que deveria. Uma atenção a mais deve ser dada aos valores muito baixos para . ¾©$¾÷ = 0,1% T = 100 T = 500 T = 1000 ¾©$¾÷ = 1% T = 100 T = 500 T = 1000 ¾©$¾÷ = 5% T = 100 T = 500 T = 1000 ¾©$¾÷ = 10% T = 100 T = 500 T = 1000 ¾©$¾÷ = 15% T = 100 T = 500 T = 1000 Lineares Não-lineares Êaí¡$y© 1000 1000 1000 0 0 0 0,0% 0,0% 0,0% 999 999 999 1 1 1 0,1% 0,1% 0,1% 970 973 981 30 27 19 3,0% 2,7% 1,9% 915 936 931 85 64 69 8,5% 6,4% 6,9% 842 877 899 158 123 101 15,8% 12,3% 10,1% Tabela 5.2: Experimento Monte Carlo – Simulação de um VAR 68 Em seguida, foi realizada uma análise da Tabela 5.1 na coluna que considera H0 falsa. Para tal, basta simular um modelo não-linear. Neste estudo, um modelo STVAR-Tree bivariado foi simulado, tendo a seguinte arquitetura: Figura 5.1: Arquitetura STVAR-Tree simulada A fim de evitar complexidade, definiu-se esta arquitetura por apresentar um número pequeno de folhas (nós terminais). Matematicamente, o modelo com os parâmetros fixos é representado por: / 2 = /1 0 0 2 Ñ0,90 0 Ô s| ; , + /1 0 0,95 + / 2 0 0 2 Ñ0,50 0 Ô r1 − s| ; , u 0 0,50 (5.2) Neste experimento, também definimos o vetor constante como nulo e os erros aleatórios e independentes $ , c = 1,2 com distribuição Normal (0,1). A candidata a variável de transição também foi e os parâmetros não-lineares da função de transição s ; , assumiram os valores = 0, para o parâmetro de locação, e o parâmetro de suavidade variou em = 1,5, 10. Vale ressaltar que, inicialmente, variamos o parâmetro de suavidade em diversos valores, desde 0.01 até 100. Porém, este procedimento acarretou num custo computacional muito alto e não houve melhora significativa nos resultados. Por isso, fixamos somente três valores para . A Tabela 5.3 apresenta os resultados obtidos. Em geral, o poder do teste aumenta com o aumento do nível de significância ¾©$¾÷ e/ou do parâmetro de suavidade . O teste LM acusa problemas na identificação de não-linearidade para amostras de tamanho pequeno. Conclui-se que, quanto maior o tamanho da amostra, maior o poder do teste, independente do nível de significância e do valor do parâmetro de suavidade . 69 = 0,1% T = 100 T = 500 T = 1000 = 1% T = 100 T = 500 T = 1000 = 5% T = 100 T = 500 T = 1000 = 10% T = 100 T = 500 T = 1000 = 15% T = 100 T = 500 T = 1000 Lineares = 1 Nãolineares Poder do teste Lineares = 5 Nãolineares Poder do teste Lineares = 10 Nãolineares Poder do teste 1000 600 25 0 400 975 0,0% 40,0% 97,5% 993 114 0 7 886 1000 0,7% 88,6% 100,0% 992 107 0 8 893 1000 0,8% 89,3% 100,0% 986 222 0 14 778 1000 1,4% 77,8% 100,0% 952 21 0 48 979 1000 4,8% 97,9% 100,0% 915 24 0 85 976 1000 8,5% 97,6% 100,0% 895 60 0 105 940 1000 10,5% 94,0% 100,0% 750 0 0 250 1000 1000 25,0% 100,0% 100,0% 708 1 0 292 999 1000 29,2% 99,9% 100,0% 788 20 0 212 980 1000 21,2% 98,0% 100,0% 571 0 0 429 1000 1000 42,9% 100,0% 100,0% 570 1 0 430 999 1000 43,0% 99,9% 100,0% 681 14 0 319 986 1000 31,9% 98,6% 100,0% 452 1 0 548 999 1000 54,8% 99,9% 100,0% 447 0 0 553 1000 1000 55,3% 100,0% 100,0% Tabela 5.3: Experimento Monte Carlo – Simulação de um STVAR-Tree 5.1.2. Modelo STVAR-Tree Para a avaliação da modelagem STVAR-Tree, foram realizados outros experimentos de Monte Carlo. Novamente, foram considerados os níveis de significância para o teste LM = 0,1%, 1%, 5%, 10% e 15%. Primeiramente, um modelo linear, um VAR bivariado, foi simulado, com os mesmos parâmetros fixos utilizados na avaliação do teste LM. Aqui, o experimento avalia a modelagem STVAR-Tree na situação em que o modelo em questão não apresenta não-linearidade, ou seja, o modelo é linear. E por isso, o modelo terá como nó terminal a raiz da árvore e, assim, um modelo linear VAR deverá ser estimado. Espera-se que os parâmetros lineares estimados sejam aproximadamente iguais aos valores fixos. A matriz de covariâncias dos erros também foi estimada e analisada. Considerou-se as medidas de tendência central, média e mediana, além das medidas de dispersão, desvio-padrão e DAM (desvio absoluto mediano) em torno da mediana (do inglês, Mean Absolute Deviation, MAD), sendo o último expresso por: 70 (5.2) Φ. A Tabela 5.4 apresenta os resultados da estimação dos parâmetros lineares Ï Φ = 0,1% T = 100 T = 500 T = 1000 = 1% T = 100 T = 500 T = 1000 = 5% T = 100 T = 500 T = 1000 = 10% T = 100 T = 500 Média Mediana Desvio-padrão DAM 0,00 0,00 0,00 0,00 0,19 0,22 0,10 0,12 0,85 0,00 0,85 0,00 0,06 0,07 0,04 0,04 0,00 0,90 0,00 0,91 0,05 0,05 0,03 0,03 0,01 0,00 0,01 0,00 0,05 0,05 0,03 0,03 0,89 0,00 0,89 0,00 0,02 0,02 0,01 0,02 0,00 0,94 0,00 0,94 0,02 0,02 0,01 0,01 0,00 0,00 0,01 0,00 0,04 0,03 0,02 0,02 0,89 0,00 0,89 0,00 0,01 0,01 0,01 0,01 0,00 0,95 0,00 0,95 0,01 0,01 0,01 0,01 0,01 0,01 0,00 0,01 0,18 0,21 0,11 0,12 0,85 0,00 0,86 0,00 0,06 0,06 0,04 0,04 0,00 0,90 0,00 0,91 0,05 0,06 0,03 0,03 -0,01 -0,01 -0,01 -0,01 0,05 0,06 0,03 0,03 0,89 0,00 0,89 0,00 0,02 0,02 0,01 0,01 0,00 0,94 0,00 0,94 0,01 0,02 0,01 0,01 0,00 0,00 0,00 0,00 0,03 0,04 0,02 0,02 0,90 0,00 0,89 0,00 0,01 0,01 0,01 0,01 0,00 0,95 0,00 0,95 0,01 0,01 0,01 0,01 0,00 -0,02 0,00 0,00 0,17 0,24 0,10 0,12 0,85 0,00 0,86 0,00 0,06 0,06 0,04 0,04 0,00 0,90 0,00 0,91 0,05 0,06 0,03 0,03 0,00 -0,01 0,01 -0,02 0,06 0,06 0,03 0,03 0,89 0,00 0,89 0,00 0,02 0,02 0,01 0,01 0,00 0,94 0,00 0,95 0,02 0,02 0,01 0,01 0,00 0,00 0,00 0,00 0,04 0,03 0,03 0,02 0,89 0,00 0,89 0,00 0,01 0,01 0,01 0,01 0,00 0,95 0,00 0,95 0,01 0,01 0,01 0,01 0,00 0,00 0,00 0,00 0,19 0,22 0,11 0,12 0,84 0,00 0,85 0,00 0,06 0,07 0,04 0,04 0,00 0,89 0,00 0,90 0,05 0,06 0,04 0,04 -0,01 0,00 -0,01 0,01 0,05 0,06 0,03 0,03 0,89 0,00 0,89 0,00 0,02 0,02 0,01 0,01 71 T = 1000 = 15% T = 100 T = 500 T = 1000 0,00 0,94 0,00 0,94 0,02 0,02 0,01 0,01 0,00 0,01 0,00 0,01 0,04 0,04 0,03 0,02 0,90 0,00 0,90 0,00 0,02 0,02 0,01 0,01 0,00 0,94 0,00 0,95 0,01 0,01 0,01 0,01 0,00 -0,01 0,00 0,00 0,19 0,23 0,11 0,11 0,84 0,00 0,85 0,00 0,06 0,07 0,04 0,04 0,00 0,90 0,00 0,91 0,05 0,06 0,03 0,04 0,00 0,01 0,00 0,00 0,05 0,05 0,03 0,03 0,89 0,00 0,89 0,00 0,02 0,02 0,01 0,01 0,00 0,94 0,00 0,94 0,02 0,01 0,01 0,01 0,00 0,00 0,00 0,00 0,03 0,04 0,02 0,02 0,89 0,00 0,90 0,00 0,02 0,01 0,01 0,01 0,00 0,95 0,00 0,95 0,01 0,01 0,01 0,01 Tabela 5.4: Experimento Monte Carlo – Estimação dos parâmetros lineares Conclui-se que, para amostras pequenas, a tendência é subestimar os parâmetros lineares, independente do nível de significância do teste LM. Para amostras médias e grandes, o modelo STVAR-Tree estima corretamente os parâmetros. As medidas de dispersão não apontam grandes afastamentos das estimativas. Com os mesmos modelos estimados, foi feita uma análise da estimativa da matriz de covariâncias dos termos de erro, Σ , apresentada na Tabela 5.5. 0,1% 1% 5% 10% 15% T Média Mediana ΣÕ Desvio-Padrão DAM 100 0,96 0,96 0,95 0,96 0,15 0,14 0,10 0,09 500 1,00 0,99 0,99 0,99 0,06 0,06 0,04 0,04 0,03 1000 1,00 0,99 1,00 0,99 0,04 0,05 0,03 100 0,97 0,96 0,96 0,95 0,13 0,14 0,09 500 0,99 0,99 0,99 1,00 0,06 0,06 0,05 0,04 1000 1,00 0,99 1,00 0,98 0,05 0,04 0,03 0,03 100 0,96 0,96 0,95 0,96 0,14 0,14 0,09 0,09 500 0,99 0,99 0,99 0,99 0,06 0,06 0,04 0,04 1000 1,00 0,99 1,00 0,99 0,04 0,04 0,03 0,03 100 0,97 0,96 0,96 0,95 0,14 0,14 0,09 0,09 500 0,99 1,00 0,99 0,99 0,07 0,07 0,05 0,04 1000 0,99 0,99 0,99 0,99 0,05 0,05 0,03 0,03 100 0,97 0,95 0,96 0,94 0,14 0,14 0,09 0,09 500 0,99 1,00 1,00 1,00 0,06 0,06 0,04 0,04 1000 0,99 0,99 1,00 0,99 0,04 0,04 0,03 0,03 Tabela 5.5: Experimento Monte Carlo – Estimação da diagonal principal da matriz de covariâncias dos erros, Σ 72 Este resultado mostra que, apesar de amostras pequenas subestimarem os parâmetros, como resultado final da estimação, os modelos conseguem capturar toda a estrutura e ajustar valores próximos aos valores observados. Em seguida, simulou-se um modelo STVAR-Tree, com a mesma arquitetura e os mesmos parâmetros fixos utilizados na avaliação do teste LM. Esta etapa avaliou a modelagem STVAR-Tree na situação em que o modelo apresenta nãolinearidade, ou seja, ocorre crescimento da árvore. Aqui, deve-se considerar somente os resultados para a simulação que detectou a arquitetura especificada. Então, modelos especificados de modo incorreto, ou seja, que não apresentaram não-linearidade ou modelos com mais de dois nós terminais foram retirados desta análise. A estimação dos parâmetros resultou em outliers e valores extremos para algumas simulações. Conseqüentemente, tanto a média quanto o desvio-padrão das estimativas foram fortemente afetados por estes valores. Por isso, a análise baseada na mediana e no DAM permite tirar melhores conclusões. A Tabela 5.6 apresenta os resultados da estimação dos parâmetros não-lineares e . Vale ressaltar que para = 0,1%, = 1 e T = 100, o teste LM acusou linearidade para as 1000 replicações, por isso, nenhum parâmetro não-linear foi estimado. = 0,1% ¾©$¾÷ = 1 ¾©$¾÷ = 5 ¾©$¾÷ = 10 = 1% ¾©$¾÷ = 1 ¾©$¾÷ = 5 ¾©$¾÷ = 10 T Média Mediana æ Desvio-Padrão DAM Média Mediana ̂ Desvio-Padrão DAM 100 x x x x x x x x 500 7,71 2,31 20,61 1,28 -0,01 0,02 0,69 0,40 1000 46,94 9,14 181,55 7,22 -0,03 -0,01 0,44 0,10 100 5,06 5,51 2,22 0,89 -0,31 -0,08 0,68 0,05 500 35,45 7,18 132,33 5,08 -0,03 -0,01 0,42 0,12 1000 45,86 9,19 179,68 7,00 -0,03 -0,01 0,43 0,09 100 10,89 5,51 19,45 2,19 -0,20 -0,04 0,49 0,07 500 54,92 10,93 182,54 7,88 -0,02 -0,01 0,33 0,08 1000 48,39 9,85 194,42 7,46 -0,03 -0,01 0,41 0,09 100 9,19 5,78 14,48 4,41 -0,15 -0,07 0,94 0,44 500 45,12 8,56 162,28 6,91 -0,02 -0,01 0,48 0,12 1000 45,86 9,16 188,83 7,15 -0,03 -0,01 0,43 0,09 100 18,92 5,51 58,88 3,44 -0,18 -0,11 0,69 0,28 500 46,51 9,02 185,86 6,67 -0,03 -0,01 0,43 0,10 1000 44,70 9,16 186,16 6,94 -0,03 -0,01 0,41 0,09 100 21,08 6,38 51,01 4,16 -0,15 -0,08 0,63 0,23 73 = 5% ¾©$¾÷ = 1 ¾©$¾÷ = 5 ¾©$¾÷ = 10 = 10% ¾©$¾÷ = 1 ¾©$¾÷ = 5 ¾©$¾÷ = 10 = 15% ¾©$¾÷ = 1 ¾©$¾÷ = 5 ¾©$¾÷ = 10 500 54,30 10,61 187,93 7,94 -0,03 -0,01 0,39 0,09 1000 46,28 9,72 194,65 7,32 -0,03 -0,01 0,40 0,08 100 20,41 5,98 46,89 4,48 0,00 -0,03 0,79 0,33 500 49,29 9,41 181,19 7,38 -0,02 -0,01 0,46 0,11 1000 44,36 9,16 190,31 7,08 -0,03 0,00 0,41 0,09 100 27,85 6,90 83,74 4,92 -0,04 -0,07 0,72 0,30 500 48,58 9,41 206,81 7,03 -0,02 -0,01 0,44 0,10 1000 43,41 9,18 186,85 6,94 -0,03 0,00 0,40 0,08 100 38,70 7,98 153,55 6,01 -0,03 -0,06 0,71 0,27 500 52,93 10,28 205,08 7,75 -0,02 -0,01 0,41 0,09 1000 44,18 9,59 186,10 7,21 -0,03 0,00 0,40 0,08 100 36,75 7,74 144,02 6,26 0,00 -0,05 0,78 0,32 500 49,29 9,51 195,75 7,50 -0,03 -0,01 0,46 0,10 1000 42,79 9,16 182,81 7,05 -0,03 0,00 0,40 0,08 100 35,22 8,13 127,24 6,23 0,00 -0,04 0,77 0,31 500 47,92 9,57 188,50 7,32 -0,03 -0,01 0,44 0,10 1000 42,70 9,20 195,19 6,96 -0,03 0,00 0,40 0,08 100 38,67 9,21 125,79 7,27 0,02 -0,03 0,76 0,29 500 50,96 10,20 194,07 7,82 -0,03 -0,01 0,43 0,09 1000 43,87 9,55 197,48 7,19 -0,03 0,00 0,39 0,08 100 36,80 9,07 120,99 7,02 0,05 -0,02 0,81 0,33 500 48,80 9,64 188,46 7,55 -0,03 -0,01 0,45 0,10 1000 42,69 9,16 194,57 7,03 -0,03 0,00 0,40 0,08 100 37,50 9,42 117,88 7,33 0,04 -0,02 0,78 0,31 500 48,06 9,69 184,07 7,42 -0,03 -0,01 0,44 0,10 1000 42,10 9,17 192,34 6,94 -0,03 0,00 0,39 0,08 100 44,69 10,42 93,41 8,38 0,11 -0,01 0,75 0,27 500 50,24 10,10 188,15 7,68 -0,03 -0,01 0,43 0,09 1000 42,73 9,45 192,65 7,10 -0,03 0,00 0,38 Tabela 5.6: Experimento Monte Carlo – Estimação dos parâmetros não-lineares e 0,08 Para valores de muito baixos, o modelo STVAR-Tree superestima este parâmetro, independente do tamanho da amostra e do nível de significância. Conforme aumentamos o valor de , aumenta a acurácia das estimativas, com destaque para amostras grandes. O modelo STVAR-Tree não apresenta problemas em estimar o parâmetro de locação . Inicialmente definido como = 0, em todos os experimentos este foi o valor médio e mediano, com baixa dispersão, mesmo variando o tamanho de amostra, o nível de significância e o parâmetro de suavidade . 74 Para estes experimentos, também medimos a dispersão dos dados através da estimativa da diagonal principal da matriz de covariâncias dos termos de erro foi feita. Vale ressaltar que para = 0,1%, = 1 e T = 100, o teste LM acusou linearidade para as 1000 replicações. = 0,1% ¾©$¾÷ = 1 ¾©$¾÷ = 5 ¾©$¾÷ = 10 = 1% ¾©$¾÷ = 1 ¾©$¾÷ = 5 ¾©$¾÷ = 10 = 5% ¾©$¾÷ = 1 ¾©$¾÷ = 5 ¾©$¾÷ = 10 = 10% ¾©$¾÷ = 1 ¾©$¾÷ = 5 Ïε Σ T Média DesvioPadrão Mediana DAM 100 x x x x x x x x 500 0,99 0,98 0,99 0,98 0,06 0,06 0,04 0,04 1000 0,99 0,98 0,99 0,98 0,06 0,06 0,04 0,04 100 0,85 0,88 0,85 0,92 0,12 0,10 0,11 0,07 500 0,99 0,98 0,99 0,98 0,06 0,06 0,04 0,04 1000 0,99 0,98 0,99 0,98 0,06 0,06 0,04 0,04 100 0,87 0,86 0,85 0,82 0,14 0,10 0,11 0,08 500 0,99 0,98 0,99 0,98 0,06 0,06 0,04 0,04 1000 0,99 0,99 0,99 0,98 0,06 0,06 0,04 0,04 100 0,88 0,86 0,93 0,86 0,15 0,11 0,11 0,08 500 0,99 0,98 0,99 0,98 0,06 0,06 0,04 0,04 1000 0,99 0,99 0,99 0,98 0,06 0,06 0,04 0,04 100 0,89 0,89 0,91 0,87 0,14 0,13 0,09 0,08 500 0,99 0,98 0,99 0,98 0,06 0,06 0,04 0,04 1000 0,99 0,99 0,99 0,99 0,06 0,06 0,04 0,04 100 0,91 0,91 0,92 0,89 0,13 0,13 0,09 0,08 500 0,99 0,98 0,99 0,98 0,06 0,06 0,04 0,04 1000 0,99 0,99 0,99 0,99 0,06 0,06 0,04 0,04 100 0,91 0,89 0,92 0,88 0,14 0,14 0,09 0,08 500 0,99 0,98 0,99 0,98 0,06 0,06 0,04 0,04 1000 0,99 0,99 0,99 0,99 0,06 0,06 0,04 0,04 100 0,92 0,90 0,91 0,89 0,13 0,13 0,09 0,08 500 0,99 0,98 0,99 0,98 0,06 0,06 0,04 0,04 1000 0,99 0,99 0,99 0,99 0,06 0,06 0,04 0,04 100 0,91 0,91 0,91 0,89 0,13 0,13 0,09 0,08 500 0,99 0,98 0,99 0,98 0,06 0,06 0,04 0,04 1000 0,99 0,99 0,99 0,99 0,06 0,06 0,04 0,04 100 0,91 0,90 0,91 0,89 0,13 0,13 0,09 0,09 500 0,99 0,98 0,99 0,98 0,06 0,06 0,04 0,04 1000 0,99 0,99 0,99 0,99 0,06 0,06 0,04 0,04 100 0,91 0,91 0,91 0,90 0,14 0,13 0,09 0,09 500 0,99 0,98 0,99 0,98 0,06 0,06 0,04 0,04 1000 0,99 0,99 0,99 0,99 0,06 0,06 0,04 0,04 75 ¾©$¾÷ = 10 = 15% ¾©$¾÷ = 1 ¾©$¾÷ = 5 ¾©$¾÷ = 10 100 0,91 0,91 0,90 0,90 0,14 0,13 0,09 0,09 500 0,99 0,98 0,99 0,98 0,06 0,06 0,04 0,04 1000 0,99 0,99 0,99 0,99 0,06 0,05 0,04 0,04 100 0,91 0,91 0,90 0,90 0,14 0,13 0,09 0,09 500 0,99 0,98 0,99 0,98 0,06 0,06 0,04 0,04 1000 0,99 0,99 0,99 0,99 0,05 0,05 0,04 0,04 100 0,91 0,91 0,91 0,90 0,14 0,13 0,09 0,09 500 0,99 0,98 0,99 0,98 0,06 0,06 0,04 0,04 1000 0,99 0,99 0,99 0,99 0,05 0,05 0,04 0,04 100 0,92 0,91 0,92 0,90 0,14 0,13 0,09 0,10 500 0,99 0,98 0,99 0,98 0,06 0,06 0,04 0,04 1000 0,99 0,99 0,99 0,99 0,05 0,05 0,03 0,04 Tabela 5.7: Experimento Monte Carlo – Estimação da diagonal da matriz de covariâncias dos erros, Este resultado mostra que o modelo STVAR-Tree consegue capturar toda a estrutura e ajustar valores próximos aos valores observados. Ï ø, i = As figuras a seguir ilustram alguns dos resultados da estimação de Φ 1,2 dos modelos STVAR-Tree simulados. Por termos muitos dados para analisar, somente as medianas foram consideradas aqui. Cada conjunto agrupa os modelos com o mesmo nível de significância do teste LM. Ï ø , i = 1,2 do modelo STVAR-Tree simulado, com = 0,1% Figura 5.2: Mediana de Φ 76 Analisando a Figura 5.2, com nível de significância = 0,1%, percebe-se que a primeira árvore não foi estimada, justamente pelo fato da não-detecção de não-linearidade. Mais uma vez, nota-se problemas de estimação para amostras pequenas. As estimativas são distantes dos valores fixos, mesmo com variação dos valores do parâmetro de suavidade. Em alguns casos, o modelo estimou valores maiores que 1. Para amostras médias e grandes, o modelo STVAR-Tree apresenta melhores resultados, tanto para árvores com divisões suaves quanto para divisões mais bruscas. A Figura 5.3 mostra os resultados com nível de significância = 1%. Ï ø , i = 1,2 do modelo STVAR-Tree simulado, com = 1% Figura 5.3: Mediana de Φ Pode-se repetir aqui as análises feitas para os resultados anteriores. Isto mostra que com o aumento do nível de significância de = 0,1% para = 1% não houve melhoras nas pequenas amostras. E nas médias e grandes amostras, os resultados foram praticamente os mesmos. As Figuras 5.4 e 5.5 ilustram os casos de aumentos do nível de significância para = 5% e para = 10%. 77 Ï ø , i = 1,2 do modelo STVAR-Tree simulado, com = 5% Figura 5.4: Mediana de Φ Ï ø , i = 1,2 do modelo STVAR-Tree simulado, com = 10% Figura 5.5: Mediana de Φ 78 Os resultados para pequenas amostras continuam distantes dos valores fixos inicialmente, porém, as estimativas não apresentam mais o problema de valores maiores que 1. Para amostras médias e grandes, os resultados são próximos aos valores fixos inicialmente. Por fim, os modelos que consideram nível de significância = 15% apresentam estimativas próximas àquelas fixas nas amostras pequenas. E os comentários dos resultados para as demais amostras são os mesmos das árvores estimadas anteriormente. Ï ø , i = 1,2 do modelo STVAR-Tree simulado, com = 15% Figura 5.6: Mediana de Φ 5.2. Aplicações a dados reais Nesta seção são apresentadas aplicações para dois conjuntos de dados reais. A primeira aplicação refere-se à Vazão de Rios, medida pela Energia Natural Afluente (ENA) dos quatro sub-mercados brasileiros, Sudeste/Centro-Oeste (SE), Sul (S), Nordeste (NE) e Norte(N). A outra, refere-se ao Preço Spot de energia elétrica no Brasil, considerando também os quatro sub-mercados brasileiros, com 79 a adição das séries de ENA e Energia Armazenada (EARM), utilizadas como candidatas a variáveis de transição. 5.2.1. Vazão de Rios Primeiramente, uma análise exploratória foi feita para conhecimento do comportamento das séries de ENA. Em seguida, para a modelagem das séries de Vazão de rios, considerou-se o modelo STVAR-Tree e o modelo PAR(p). Na fase de estimação dos modelos, foram utilizados 80% das observações e os 20% restantes foram separados para a previsão fora da amostra (out-of-sample), com 1 passo à frente, utilizada como validação dos modelos ajustados. Estes números estão mais detalhados na Tabela 5.8. Período Divisão Início Fim Observações (univariado) Observações (multivariado) In-sample 80% Janeiro/1931 Dezembro/1990 720 2880 Dezembro/2005 Out-of-sample 20% Janeiro/1991 Total 100% Janeiro/1931 Dezembro/2005 Tabela 5.8: Divisão dos dados 180 720 900 3600 A comparação dos modelos foi feita com base em medidas estatísticas no período out-of-sample, considerando previsões de 1 passo à frente. 5.2.1.1. Análise exploratória O conjunto de dados de vazão de rios trata de séries mensais, coletadas no período de Janeiro/1931 a Dezembro/2005, representando 74 anos, no total de 900 observações, para cada um dos 4 submercados. A tabela 5.9 apresenta algumas estatísticas descritivas das séries. SE S NE N Média 32.752,88 7.673,40 8.305,83 6.311,03 Mediana 27.175,67 6.316,19 5.884,49 4.183,39 Desvio-padrão 17.158,06 5.384,29 6.068,08 5.278,20 Mínimo 9.115,39 992,44 1.523,22 736,53 Máximo 114.307,50 61.043,77 46.262,92 29.424,81 Assimetria 1,07 2,36 1,59 1,10 Curtose 3,80 15,29 6,45 3,63 Jarque-Bera 197,15 6.501,80 821,40 197,27 P-valor 0,00 0,00 0,00 0,00 Tabela 5.9: Estatísticas Descritivas das séries de ENA 80 O Gráfico 5.1 apresenta a evolução das séries de ENA ao longo dos anos. 1/1931 12/1933 11/1936 10/1939 9/1942 8/1945 7/1948 6/1951 5/1954 4/1957 3/1960 2/1963 1/1966 12/1968 11/1971 10/1974 9/1977 8/1980 7/1983 6/1986 5/1989 4/1992 3/1995 2/1998 1/2001 12/2003 140000,00 120000,00 100000,00 80000,00 60000,00 40000,00 20000,00 0,00 SE S NE N Gráfico 5.1: Evolução das séries de ENA Devido à grande variabilidade dos dados, melhores resultados foram obtidos ao aplicar o logaritmo natural às séries de ENA. E daqui para frente, somente estas séries serão consideradas nas análises. A Tabela 5.10 fornece estatísticas descritivas do logaritmo natural das séries de ENA. As médias das séries apresentam valores semelhantes às medianas, devido à baixa dispersão medida pelos desvios-padrão. Nota-se que os valores de mínimo e máximo não são distantes. ln(SE) ln(S) ln(NE) lnN) Média 10,27 8,74 8,79 8,38 Mediana 10,21 8,75 8,68 8,34 Desvio-padrão 0,50 0,64 0,68 0,89 Mínimo 9,12 6,90 7,33 6,60 Máximo 11,65 11,02 10,74 10,29 Assimetria 0,16 0,00 0,27 0,03 Curtose 2,19 2,78 2,06 1,74 Jarque-Bera 28,60 1,81 43,80 60,06 P-valor 0,00 0,40 0,00 0,00 Tabela 5.10: Estatísticas Descritivas do logaritmo natural das séries de ENA Sabemos que se uma variável aleatória segue uma distribuição Normal, então as medidas de assimetria e curtose são 0 e 3, respectivamente. Para o logaritmo natural das séries de ENA, as medidas de assimetria são próximas a zero e as medidas de curtose são menores que 3. Isto nos sugere que as séries não seguem uma distribuição Normal. Para comprovar estatisticamente, o teste de Jarque-Bera foi realizado, o qual se baseia nas seguintes hipóteses: 81 H0: a série é normalmente distribuída H1: a série não é normalmente distribuída O teste sugere que a distribuição do logaritmo natural das séries de ENA do sub-mercado Sul apresenta a normalidade e para os sub-mercados SE, NE e N não aprenta, devido aos baixíssimos p-valores. A Tabela 5.10 apresenta as correlações entre as séries de ENA. É possível notar as correlações elevadas entre os sub-mercados, com exceção do Sul. ln(SE) ln(S) ln(NE) ln(N) ln(SE) ln(S) ln(NE) ln(N) 1 -0,11 0,85 0,78 -0,11 1 -0,36 -0,34 0,85 -0,36 1 0,85 0,78 -0,34 0,85 1 Tabela 5.11: Matriz de Correlação do logaritmo natural das séries de ENA Visualmente, no Gráfico 5.2, as séries apresentam comportamento de séries estacionárias, uma vez que os níveis se mantêm constantes. É possível perceber a ausência de tendência (crescente ou decrescente) nas séries dos quatro submercados. 1/1931 10/1933 7/1936 4/1939 1/1942 10/1944 7/1947 4/1950 1/1953 10/1955 7/1958 4/1961 1/1964 10/1966 7/1969 4/1972 1/1975 10/1977 7/1980 4/1983 1/1986 10/1988 7/1991 4/1994 1/1997 10/1999 7/2002 4/2005 14,00 12,00 10,00 8,00 6,00 4,00 2,00 0,00 ln(SE) ln(S) ln(NE) ln(N) Gráfico 5.2: Evolução do logaritmo das séries de ENA Conforme indicado inicialmente na análise exploratória, com destaque para o Gráfico 5.2, as séries apresentam comportamento estacionário. Para comprovar estatisticamente este resultado, o teste ADF (Augmented DickeyFuller) foi realizado, baseado nos valores críticos de McKinnon para a rejeição da hipótese nula, com as seguintes hipóteses: 82 H0: a série tem raiz unitária (não é estacionária) H1: a série não tem raiz unitária (é estacionária) Como resultados dos testes, temos a rejeição da hipótese de raiz unitária para as séries, aos níveis de 1%, 5% e 10%. ln(SE) ln(S) ln(NE) ln(N) -20,71 -10,8 -18,98 -23,49 * valores críticos de McKinnon 1%* -3.46 5% -2.87 10% -2.57 Tabela 5.12: Teste Estatístico ADF para o logaritmo das séries de ENA Portanto, a conclusão que tiramos é que as séries temporais do logaritmo natural das séries de ENA são 00. Este resultado indica que temos satisfeitas as condições necessárias para usar o arcabouço da modelagem STVAR-Tree. 5.2.1.2. STVAR-Tree Para a escolha do modelo STVAR-Tree mais adequado ao logaritmo das séries de ENA, estimou-se 12 modelos, cada um deles com o aumento de uma unidade no número de defasagem nas séries das variáveis endógenas dos quatro sub-sistemas brasileiros, começando na ordem 1 e alcançando o máximo de 12 defasagens. As candidatas a possíveis variáveis de transição foram as 12 primeiras defasagens nas séries das variáveis endógenas e o mês. Coloca-se a variável tempo (mês) no conjunto de variáveis de transição na tentativa de capturar possíveis efeitos de quebra estrutural nas séries. O grid de valores dos parâmetros não-lineares foi composto por: • • Suavidade: = 1,5,10 Locação: percentis das candidatas a variável de transição, fixos em = 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%. Com a finalidade de evitar a estimação de árvores complexas e também de reduzir o tempo computacional, limitou-se árvores com no máximo 8 folhas (nós 83 terminais). Ao analisar diversos resultados de árvores mais complexas, percebeuse que estas poderiam até apresentar um ajuste um pouco melhor, porém, com a limitação, os resultados foram satisfatórios e houve redução de tempo de processamento e complexidade. Uma forma de ilustrar essa complexidade seria com a apresentação do número de nós terminais e de parâmetros dos 12 modelos estimados, já considerando o procedimento de limitação. Vale lembrar que o número que identifica o modelo está associado à ordem de defasagem das variáveis endógenas. A Tabela 5.13 mostra os números. Número de parâmetros de suavidade Número de parâmetros locação Número de parâmetros lineares Φ Modelo Número de nós terminais 1 8 2 8 7 7 288 3 8 7 7 416 4 8 7 7 544 5 8 7 7 672 6 8 7 7 800 7 2 1 1 232 8 1 0 0 132 9 1 0 0 148 10 1 0 0 164 11 1 0 0 180 7 7 160 12 1 0 0 196 Tabela 5.13: Número de nós terminais e de parâmetros dos modelos estimados Conforme aumenta a ordem da defasagem, os modelos apresentam um decréscimo no número de nós terminais. Isto se deve ao procedimento adotado de diminuir o nível de significância do teste LM, de acordo com o crescimento da árvore. Os modelos de 1 a 6 apresentaram crescimento da árvore e, com a limitação, esses modelos possuem o número máximo de folhas. O modelo 7 só cresceu da raiz para as folhas 1 e 2, sendo a arquitetura mais simples de um modelo STVARTree. Os modelos de 8 a 12 não formaram árvores e, neste caso, modelos lineares foram estimados. Portanto, estes últimos modelos não serão tratados como prioritários, já que o objetivo é estimar modelos STVAR-Tree. Caso nenhum dos anteriores se mostre adequado, pode ser que um desses seja o modelo escolhido. 84 Para cada modelo estimado, verificou-se os valores assumidos pelos Critérios de Informação Akaike (AIC), Bayesian (BIC), Hannan-Quinn (HQ) e Final Prediction Error (FPE), expressos por: (5.4) (5.5) (5.6) (5.7) onde, m é a ordem do modelo STVAR-Tree ajustado aos dados; T é o tamanho da amostra; K é a dimensão das séries temporais; ΣÕü m é a estimativa da matriz de covariância ruído branco; O critério FPE auxilia na obtenção de um modelo com melhor capacidade preditiva. Já os critérios BIC e HQ são os mais consistentes, dentre os quatro. O objetivo então é selecionar o modelo que minimiza esses valores. A Tabela 5.14 apresenta os valores dos quatro Critérios de Informação para os 12 modelos estimados. Modelo AIC BIC FPE HQ 1 -99,04 -9,58 1,44E-05 -10,21 2 -64,35 -6,10 4,35E-05 -8,37 3 63,48 -0,15 -1,64E-04 -5,07 4 284,42 8,25 -1,07E-05 -0,33 5 598,15 18,79 -1,58E-05 5,53 6 1004,74 31,53 -1,04E-05 12,59 7 -87,34 3,84 -8,75E-06 -2,57 8 -91,43 -1,09 -9,39E-06 -5,26 9 -94,05 1,39 -1,93E-05 -3,86 10 -95,15 4,17 -1,57E-05 -2,30 11 -94,78 7,18 -3,10E-05 -0,64 12 -92,75 10,60 -2,69E-05 Tabela 5.14: Critérios de Informação 1,32 85 O modelo com uma defasagem nas variáveis endógenas apresentou o menor valor para AIC, BIC e HQ. O modelo com melhor capacidade preditiva, pelo critério FPE, é o modelo 8. Porém, o modelo final não foi selecionado aqui nesta etapa. Além dessas, outras estatísticas baseadas nos resíduos foram utilizadas para seleção do modelo mais adequado, tanto in-sample quanto out-of-sample. A Tabela 5.15 apresenta as estatísticas Média, Variância, Assimetria e Curtose dos resíduos no período in-sample. Todos os modelos possuem resíduos com média nula, variância pequena, assimetria próxima a zero e curtose próxima a 3, com pequenos desvios. Estes resultados mostram o bom ajuste aos dados do modelo STVAR-Tree. Modelo Média Variância Assimetria Curtose 1 2 3 4 5 6 7 8 9 10 11 12 SE 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 S 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 NE 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 N 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 SE 0,04 0,04 0,03 0,03 0,03 0,02 0,03 0,04 0,04 0,04 0,04 0,04 S 0,23 0,21 0,20 0,19 0,17 0,15 0,22 0,23 0,23 0,22 0,22 0,22 NE 0,04 0,04 0,04 0,03 0,03 0,03 0,04 0,05 0,05 0,04 0,04 0,04 N 0,05 0,04 0,04 0,04 0,03 0,03 0,04 0,05 0,05 0,05 0,04 0,04 SE 0,09 0,10 0,12 0,13 0,20 0,15 0,08 0,04 0,02 0,03 0,04 0,04 S 0,27 0,23 0,22 0,20 0,16 0,12 0,29 0,28 0,29 0,26 0,27 0,27 NE -0,01 0,06 0,09 -0,01 -0,01 -0,05 0,15 0,17 0,16 0,18 0,09 0,10 N 0,63 0,48 0,59 0,46 0,32 0,20 0,45 0,55 0,52 0,50 0,48 0,48 SE 3,50 3,27 3,51 3,19 3,24 3,43 3,55 3,07 3,09 3,05 3,23 3,24 S 2,89 2,67 3,10 2,90 2,85 3,18 2,85 2,85 2,89 2,84 2,86 2,86 NE 4,11 4,51 4,50 4,08 4,23 4,32 4,17 3,99 3,96 4,00 3,86 3,92 N 4,87 4,69 4,97 4,73 4,95 3,81 5,15 4,95 5,08 5,06 4,87 4,87 Tabela 5.15: Estatísticas descritivas dos resíduos – in-sample A Tabela 5.16 apresenta as estatísticas MSE, RMSE, MAE e MAPE, dadas por: Mean Squared Error (Erro Quadrático Médio): MSE = ∑: − æ Root Mean Squared Error (Raiz do Erro Quadrático Médio): RMSE = ý ∑: − æ Mean Absolute Error (Erro Absoluto Médio): MAE = ∑:| − æ | Mean Absolute Percentual Error (Erro Percentual Absoluto Médio): MAPE = 100 ∑: þ Hx Hæx Hx þ 86 Os valores de MSE, RMSE e MAE estão próximos a zero. Além disso, as medidas de MAPE apontam valores baixos, o que indica que os modelos estimados controlaram bastante os erros in-sample. É interessante notar que a dispersão dos valores é mínima, o que não permite destacar um único modelo como o mais adequado para representar as séries de vazão de rios. Modelo MSE RMSE MAE MAPE 1 2 3 4 5 6 7 8 9 10 11 12 SE 0,04 0,04 0,03 0,03 0,03 0,02 0,03 0,04 0,04 0,04 0,04 0,04 S 0,23 0,21 0,20 0,19 0,17 0,14 0,22 0,23 0,23 0,22 0,22 0,22 NE 0,04 0,04 0,04 0,03 0,03 0,03 0,04 0,05 0,05 0,04 0,04 0,04 N 0,05 0,04 0,04 0,04 0,03 0,03 0,04 0,05 0,05 0,05 0,04 0,04 SE 0,19 0,19 0,18 0,17 0,16 0,15 0,19 0,20 0,20 0,19 0,19 0,19 S 0,47 0,45 0,44 0,43 0,41 0,38 0,47 0,48 0,47 0,47 0,47 0,47 NE 0,21 0,19 0,19 0,18 0,18 0,17 0,20 0,21 0,21 0,21 0,21 0,21 N 0,21 0,20 0,19 0,19 0,18 0,17 0,21 0,22 0,22 0,21 0,21 0,21 SE 0,15 0,15 0,14 0,14 0,13 0,12 0,14 0,16 0,15 0,15 0,15 0,15 S 0,38 0,37 0,35 0,35 0,33 0,30 0,37 0,38 0,38 0,38 0,38 0,38 NE 0,15 0,14 0,14 0,14 0,13 0,12 0,15 0,16 0,16 0,16 0,16 0,16 N 0,16 0,15 0,14 0,15 0,13 0,13 0,16 0,16 0,16 0,16 0,15 0,15 SE 1,43 1,42 1,36 1,34 1,25 1,15 1,41 1,51 1,51 1,49 1,46 1,46 S 4,40 4,26 4,06 4,03 3,83 3,47 4,33 4,44 4,41 4,39 4,38 4,38 NE 1,68 1,55 1,51 1,51 1,48 1,39 1,68 1,82 1,82 1,79 1,76 1,76 N 1,90 1,75 1,67 1,74 1,60 1,53 1,87 1,97 1,91 1,88 1,83 1,83 Tabela 5.16: Estatísticas de erro dos modelos – in-sample Por fim, verificou-se a normalidade dos resíduos dos modelos estimados, mostrados na Tabela 5.17. Para esta análise, realizou-se tanto a versão multivariada do teste (descrito a seguir) quanto à versão univariada, dada pelo teste Jarque-Bera, considerando as hipóteses: H0: a série é normalmente distribuída H1: a série não é normalmente distribuída Sob H0, a estatística de teste (multivariado) é dada por, onde, T é o tamanho da amostra; √Þ S ~ Ma 87 é um vetor que contém a média das discrepâncias; S é a estimativa da matriz de covariâncias dos erros; é a o número de parâmetros no modelo. Ao nível de significância %. √Þ S maiores que Ma %, rejeita-se H0 para valores de Modelo Teste Normalidade Multivariado Teste JB H=0 Normal H=1 Nãonormal p-valor do teste JB My÷y 1 2 3 4 5 6 7 8 9 10 11 12 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 7,81 7,81 7,81 7,81 7,81 7,81 7,81 7,81 7,81 7,81 7,81 7,81 p-valor 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 M~ 5% SE 1 0 1 0 1 1 1 0 0 0 0 0 S 1 1 0 0 0 0 1 1 1 1 1 1 NE 1 1 1 1 1 1 1 1 1 1 1 1 N 1 1 1 1 1 1 1 1 1 1 1 1 SE 0,02 0,17 0,01 0,22 0,04 0,02 0,01 0,5 0,5 0,5 0,39 0,37 S 0,02 0,01 0,05 0,07 0,14 0,24 0,01 0,01 0,01 0,02 0,02 0,01 NE 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 N 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 Tabela 5.17: Testes de normalidade dos resíduos – in-sample 0,00 0,00 0,00 0,00 Conclui-se que os resíduos in-sample de todos os modelos seguem distribuição Normal multivariada. Um ponto positivo na estimação é que todos os modelos se ajustaram bem aos dados. Com a adição da análise dos critérios de informação, seria interessante selecionar o modelo 1 como o modelo mais adequado por querermos sempre o modelo mais parcimonioso. Porém, estatísticas descritivas e de erro dos modelos no período out-of-sample também foram geradas. Depois de estimados os modelos, 3 tipos de previsão foram realizadas no período out-of-sample: Combinação de Regimes (RC), Máxima Pertinência (MM) e Combinação Adaptativa de Regimes (ARC), conforme descritas no Capítulo IV. Analisar os resíduos gerados por modelos utilizando estes três métodos de previsão determinará o modelo STVAR-Tree que melhor se adequa aos dados. Nesta etapa, os modelos de 1 a 12 competem entre si, pois alguns modelos apresentam bons ajustes out-of-sample e outros não. A Tabela 5.18 apresenta as estatísticas Média, Variância, Assimetria e Curtose dos resíduos no período out-of-sample pelo método RC. Nem todos os 88 modelos possuem resíduos com média nula, variância pequena, assimetria próxima a zero e curtose próxima a 3. Destacam-se com melhores resultados os modelos 1, 2, 3, 4 e 7. Modelo Média Variância Assimetria Curtose 1 2 3 4 5 6 7 8 9 10 11 12 SE -0,14 -0,25 -0,14 0,19 0,14 -8,75 0,09 5,17 5,17 5,17 5,17 5,17 S 0,06 0,16 0,10 -0,42 -2,85 -51,29 0,05 4,50 4,51 4,50 4,50 4,50 NE -0,32 -0,35 0,02 -0,50 1,53 -0,29 0,05 4,28 4,28 4,28 4,28 4,28 N -0,27 -0,25 -0,13 0,68 0,33 9,34 0,13 4,15 4,15 4,15 4,15 4,15 SE 0,07 0,72 0,32 0,21 3,47 1.498,73 0,04 0,08 0,07 0,07 0,08 0,08 S 0,55 0,95 2,58 1,74 37,35 6.005,73 0,30 0,29 0,29 0,29 0,29 0,29 NE 0,15 0,48 0,35 0,37 6,82 506,98 0,06 0,17 0,17 0,17 0,17 0,17 N 0,14 0,70 0,60 0,27 1,95 1.827,38 0,04 0,25 0,24 0,24 0,24 0,24 SE 0,12 -0,59 -0,93 0,29 1,78 -0,35 0,19 0,21 0,21 0,21 0,22 0,24 S -0,27 0,31 -0,68 -0,31 -1,59 -1,05 -0,13 -0,03 -0,03 -0,02 -0,02 -0,02 NE -0,39 0,25 0,67 -0,06 1,73 -0,03 0,32 0,40 0,40 0,42 0,43 0,43 N 0,27 1,08 -0,38 0,41 0,23 0,17 0,31 0,25 0,26 0,26 0,27 0,27 SE 3,36 4,02 7,10 3,32 8,79 7,45 3,23 2,84 2,85 2,81 2,83 2,87 S 2,91 5,33 4,30 5,01 5,57 4,56 2,76 2,41 2,39 2,39 2,40 2,41 NE 4,44 6,26 4,08 3,94 5,82 6,77 3,68 2,49 2,49 2,51 2,52 2,51 N 2,75 7,64 3,77 2,65 5,78 6,22 3,48 1,84 1,84 Tabela 5.18: Estatísticas descritivas dos resíduos (RC) – out-of-sample 1,84 1,86 1,87 Diferentemente do ocorrido no período in-sample, nem todos os valores de MSE, RMSE, MAE e MAPE do período out-of-sample estão próximos a zero, o que indica que alguns modelos estimados não conseguiram controlar os erros neste período. A Tabela 5.19 apresenta as estatísticas, com destaque positivo para os modelos 1,2 e 7, este último apresentou os menores valores de MAPE. Modelo MSE RMSE MAE 1 2 3 4 5 6 7 8 9 SE 0,09 0,78 0,34 S 0,55 0,97 2,57 NE 0,25 0,60 N 0,21 0,76 SE 0,31 10 11 12 0,25 3,47 1.566,84 0,05 26,81 26,81 26,83 26,85 26,84 1,90 45,26 8.603,08 0,30 20,55 20,60 20,55 20,51 20,52 0,35 0,61 9,11 504,22 0,06 18,48 18,46 18,49 18,52 18,52 0,61 0,73 2,04 1.904,32 0,06 17,46 17,44 17,44 17,46 17,46 0,88 0,58 0,50 1,86 3,96E+01 0,23 5,18 5,18 5,18 5,18 5,18 S 0,74 0,99 1,60 1,38 6,73 9,28E+01 0,54 4,53 4,54 4,53 4,53 4,53 NE 0,50 0,78 0,59 0,78 3,02 2,25E+01 0,25 4,30 4,30 4,30 4,30 4,30 N 0,45 0,87 0,78 0,85 1,43 4,36E+01 0,24 4,18 4,18 4,18 4,18 4,18 SE 0,25 0,62 0,39 0,38 1,13 22,24 0,17 5,17 5,17 5,17 5,17 5,17 89 MAPE S 0,59 0,73 1,19 1,03 3,93 59,74 0,44 4,50 4,51 4,50 4,50 4,50 NE 0,40 0,57 0,44 0,62 1,80 12,63 0,18 4,28 4,28 4,28 4,28 4,28 N 0,38 0,63 0,57 0,70 1,00 24,98 0,19 4,15 4,15 4,15 4,15 4,15 SE 2,43 6,14 3,78 3,66 10,65 210,13 1,64 50,02 50,02 50,04 50,06 50,05 S 6,61 8,13 13,47 11,67 44,43 666,81 4,89 50,20 50,26 50,21 50,16 50,16 NE 4,83 6,82 5,07 7,11 19,73 141,54 2,10 49,66 49,64 49,67 49,73 49,72 N 4,78 8,01 7,01 8,76 11,42 298,19 2,22 49,80 49,77 Tabela 5.19: Estatísticas de erro dos modelos (RC) – out-of-sample 49,77 49,81 49,80 Por fim, verificou-se a normalidade (nas versões univariada e multivariada do teste) dos resíduos dos modelos estimados no período out-of-sample, mostrados na Tabela 5.20. Modelo Teste Normalidade Multivariado Teste JB H=0 Normal H=1 Nãonormal p-valor do teste JB My÷y 1 2 3 4 5 6 7 8 9 10 11 12 12,94 5,25 1,16 16,98 6,58 5,35 6,60 52,83 52,83 52,83 52,84 52,84 7,81 7,81 7,81 7,81 7,81 7,81 7,81 7,81 7,81 7,81 7,81 7,81 p-valor 0,00 0,15 0,76 0,00 0,09 0,15 0,09 0,00 0,00 0,00 0,00 0,00 SE 0 1 1 0 1 1 0 0 0 0 0 0 S 0 1 1 1 1 1 0 0 0 0 0 0 NE 1 1 1 1 1 1 1 1 1 1 1 1 M~ 5% N 0 1 1 1 1 1 0 1 1 1 1 1 SE 0,45 0,00 0,00 0,14 0,00 0,00 0,43 0,43 0,43 0,39 0,38 0,35 S 0,27 0,00 0,00 0,00 0,00 0,00 0,50 0,21 0,19 0,20 0,20 0,21 NE 0,00 0,00 0,00 0,04 0,00 0,00 0,04 0,04 0,03 0,03 0,03 0,03 0,20 0,00 0,02 0,05 0,00 0,00 0,08 0,01 0,01 0,01 Tabela 5.20: Testes de normalidade dos resíduos (RC) – out-of-sample 0,01 0,01 N Conclui-se que os resíduos neste período out-of-sample dos modelos 2, 3, 6 e 7 seguem distribuição Normal multivariada, porém, nem todos seguem distribuição Normal univariada. Considerando o método de previsão RC, o modelo 7 foi o modelo que apresentou melhores resultados para os resíduos, em todas as análises. Selecionase, portanto, este modelo como o mais adequado. Considere, agora, o tipo MM de previsão. A Tabela 5.21 apresenta as estatísticas Média, Variância, Assimetria e Curtose dos resíduos. Nem todos os modelos possuem resíduos com média nula, variância pequena, assimetria próxima a zero e curtose próxima a 3. Destacam-se com melhores resultados os modelos 7 (com 2 nós terminais), 8 a 12 (não formaram árvores). 90 Modelo 1 2 3 4 5 6 7 8 9 10 11 12 SE 4,91 9,55 -6,40 -18,68 3,29 832,71 -0,18 0,01 0,01 0,01 0,01 0,01 S -1,13 -1,81 25,99 80,23 8,21 795,40 0,59 0,06 0,07 0,07 0,06 0,06 NE 4,60 1,12 -21,89 -9,38 3,67 57,53 0,02 -0,05 -0,05 -0,05 -0,04 -0,04 Média N 1,50 -0,89 -12,06 -36,53 1,72 -285,57 0,32 -0,03 -0,03 -0,03 -0,03 -0,03 SE 4,09 529,19 338,47 2,53E+03 0,09 2,03E+06 1,21 0,04 0,04 0,04 0,04 0,04 S 1,00 17,23 2.092,15 1,99E+04 0,50 2,08E+06 7,75 0,28 0,29 0,29 0,29 0,29 Variância NE 7,19 15,72 3.913,94 651,74 0,12 2,21E+04 0,07 0,06 0,06 0,06 0,06 0,06 N 14,14 62,38 587,97 1,03E+04 0,06 2,37E+05 1,65 0,04 0,04 0,04 0,04 0,04 SE -0,60 0,60 -1,74 -1,45 0,53 -1,21 0,36 -0,36 -0,37 -0,30 -0,26 -0,22 S -0,53 -0,79 1,80 1,43 0,05 -1,22 -0,34 -0,09 -0,10 -0,10 -0,11 -0,11 NE -0,56 -1,79 -1,88 -1,34 0,04 -1,33 -0,01 0,05 0,05 0,05 0,06 0,07 N -0,61 -1,51 -1,83 -1,41 0,23 1,26 -0,36 0,41 0,42 0,36 0,47 0,46 SE 1,45 6,06 4,26 3,16 3,23 2,48 1,28 3,88 3,95 3,99 4,13 4,23 S 3,01 5,57 4,37 3,13 2,67 2,50 1,27 2,49 2,45 2,51 2,54 2,53 NE 1,42 7,05 4,53 3,02 3,07 2,94 3,11 3,49 3,52 3,43 3,55 3,57 N 1,42 4,98 4,44 3,12 3,34 2,65 1,24 3,80 3,72 Tabela 5.21: Estatísticas descritivas dos resíduos – out-of-sample 3,69 4,24 4,26 Assimetria Curtose A Tabela 5.22 apresenta as estatísticas MSE, RMSE, MAE e MAPE do período out-of-sample do tipo MM de previsão. Modelo MSE RMSE MAE MAPE 1 2 SE 28,17 617,48 S 2,26 20,40 NE 28,30 16,87 N 16,30 62,82 SE 5,31 3 4 5 6 7 8 9 10 11 12 377,53 2.869,04 10,91 2,71E+06 1,23 0,04 0,04 0,04 0,04 0,04 2.756,13 26.224,08 67,94 2,70E+06 8,05 0,28 0,30 0,29 0,29 0,29 4.371,11 735,98 13,62 25.237,59 0,07 0,07 0,07 0,07 0,06 0,06 730,20 11.605,10 3,00 3,17E+05 1,74 0,04 0,04 0,04 0,04 0,04 24,85 19,43 53,56 3,30 1.646,24 1,11 0,19 0,19 0,19 0,19 0,20 S 1,50 4,52 52,50 161,94 8,24 1.644,18 2,84 0,53 0,54 0,54 0,54 0,54 NE 5,32 4,11 66,11 27,13 3,69 158,86 0,27 0,26 0,26 0,26 0,25 0,25 N 4,04 7,93 27,02 107,73 1,73 563,46 1,32 0,21 0,21 0,20 0,21 0,21 SE 4,91 13,81 10,74 29,04 3,29 1.645,13 1,09 0,14 0,14 0,14 0,15 0,15 S 1,20 2,59 26,53 87,20 8,21 1.641,21 2,78 0,44 0,45 0,44 0,44 0,44 NE 4,60 3,46 30,39 15,70 3,67 154,04 0,21 0,20 0,20 0,20 0,19 0,19 N 4,01 4,78 13,27 58,92 1,72 560,25 1,30 0,16 0,16 0,15 0,15 0,15 SE 47,03 137,76 106,46 290,63 31,79 15.947,86 10,54 1,38 1,36 1,38 1,40 1,42 S 13,79 29,05 294,33 968,03 91,98 18.451,97 31,19 4,88 4,98 4,92 4,92 4,92 NE 52,23 40,58 372,37 193,00 42,88 1.794,43 2,48 2,27 2,27 2,26 2,21 2,22 N 48,29 62,67 170,84 768,72 20,84 6.815,21 15,82 1,90 1,88 Tabela 5.22: Estatísticas de erro dos modelos (MM) – out-of-sample 1,83 1,80 1,82 91 Os resultados indicam que os modelos que formaram árvores (1 a 7) não conseguiram controlar os erros neste período. Os demais modelos, aqueles que não formaram árvores, apresentaram os menores valores em todas as estatísticas. Verificou-se a normalidade (nas versões univariada e multivariada do teste) dos resíduos dos modelos lineares (8 a 12) no período out-of-sample, mostrados na Tabela 5.23. Para os modelos não-lineares, somente os modelos 2 e 7 não rejeitaram a hipótese de normalidade na versão multivariada. Dentre esses modelos destacados, no teste de Jarque-Bera, os resíduos de algumas variáveis dos modelos lineares (8 a 12) e do modelo não-linear 7 seguem distribuição Normal univariada. Modelo Teste Normalidade Multivariado Teste JB H=0 Normal H=1 Nãonormal p-valor do teste JB 1 2 3 4 5 6 7 8 9 10 11 12 30,68 5,26 8,84 8,03 52,77 11,71 1,75 0,96 1,17 1,06 0,77 0,80 7,81 7,81 7,81 7,81 7,81 7,81 7,81 7,81 7,81 7,81 7,81 7,81 pvalor 0,00 0,15 0,03 0,05 0,00 0,01 0,63 0,81 0,76 0,79 0,86 0,85 SE 1 1 1 1 1 1 1 1 1 1 1 1 S 1 1 1 1 0 1 1 0 0 0 0 0 NE 1 1 1 1 0 1 0 0 0 0 0 0 N 1 1 1 1 0 1 1 1 1 1 1 1 SE 0,00 0,00 0,00 0,00 0,02 0,00 0,00 0,02 0,01 0,02 0,01 0,01 S 0,02 0,00 0,00 0,00 0,50 0,00 0,00 0,27 0,22 0,30 0,32 0,32 NE 0,00 0,00 0,00 0,00 0,50 0,00 0,50 0,34 0,29 0,44 0,25 0,22 0,00 0,00 0,00 0,00 0,23 0,00 0,00 0,02 0,02 0,03 Tabela 5.23: Testes de normalidade dos resíduos (MM) – out-of-sample 0,00 0,00 N Por último, mas não menos importante, o tipo ARC de previsão. A Tabela 5.24 apresenta as estatísticas básicas Média, Variância, Assimetria e Curtose dos resíduos. Nem todos os modelos possuem resíduos com média nula, variância pequena, assimetria próxima a zero e curtose próxima a 3. Destacam-se com melhores resultados os modelos 8 a 12 (não formaram árvores). Dentre os que formaram árvores, o modelo 7 apresenta as melhores estatísticas. 92 Modelo 1 2 3 4 5 6 7 8 9 10 11 12 SE -6,94 1,59 0,49 0,94 0,10 0,86 -0,05 0,00 0,00 0,00 0,00 0,00 S -130,14 2,55 0,83 1,09 1,20 3,05 0,15 -0,01 0,02 0,02 0,02 0,03 NE -60,10 1,14 0,47 0,72 -0,16 0,25 -0,06 0,01 0,00 0,00 0,01 0,01 Média N -38,74 2,72 0,78 0,78 -1,40 -0,52 -0,13 0,02 0,00 0,01 0,01 0,01 SE 1,97E+05 16,24 5,59 0,97 1,42 1,17 0,25 0,11 0,10 0,09 0,08 0,08 S 3,27E+06 42,11 22,31 5,96 6,83 7,67 0,77 0,60 0,57 0,50 0,50 0,48 Variância NE 1,04E+06 24,20 5,96 0,81 2,68 1,83 0,41 0,20 0,18 0,17 0,16 0,14 N 2,73E+05 13,57 4,73 0,77 2,83 2,41 0,34 0,12 0,11 0,09 0,09 0,08 SE 1,92 -1,43 0,04 0,28 -0,57 0,85 0,53 0,38 0,37 0,34 0,37 0,22 S -6,27 0,39 0,40 0,45 -0,13 0,39 0,02 -0,15 0,10 -0,05 -0,03 -0,06 NE 0,70 -2,14 -0,43 0,24 0,48 0,44 1,00 0,05 0,01 0,20 0,32 0,19 N -1,76 -0,13 0,26 0,79 -0,14 -0,20 0,59 -0,03 0,03 0,26 0,37 0,23 Assimetria SE 23,64 9,06 4,19 4,03 2,80 8,16 8,29 2,83 3,20 3,23 3,44 3,15 S 56,61 4,46 3,67 3,42 4,31 2,41 3,98 3,38 2,88 2,60 2,75 2,89 NE 25,66 17,75 4,84 2,74 3,50 8,15 7,67 3,49 3,88 3,34 3,61 3,73 N 23,62 8,25 4,37 3,68 2,74 4,14 6,55 2,94 3,46 3,38 Tabela 5.24: Estatísticas descritivas dos resíduos (ARC) – out-of-sample 3,56 3,55 Curtose Com exceção do modelo 7, as estatísticas MSE, RMSE, MAE e MAPE do tipo ARC de previsão indicam que os modelos que formaram árvores (1 a 7), não controlaram os erros neste período. A Tabela 5.25 apresenta os resultados. Modelo MSE RMSE MAE MAPE 1 2 3 4 5 6 7 8 9 10 11 12 SE 1,96E+05 18,68 5,79 1,85 1,42 1,90 0,25 0,11 0,10 0,09 0,08 0,08 S 3,26E+06 48,35 22,87 7,11 8,22 16,92 0,79 0,60 0,57 0,50 0,49 0,48 NE 1,04E+06 25,35 6,15 1,33 2,69 1,89 0,41 0,20 0,18 0,17 0,15 0,14 N 2,73E+05 20,87 5,32 1,37 4,76 2,67 0,35 0,12 0,11 0,09 0,09 0,08 SE 442,38 4,32 2,41 1,36 1,19 1,38 0,50 0,33 0,32 0,30 0,29 0,27 S 1.806,24 6,95 4,78 2,67 2,87 4,11 0,89 0,77 0,75 0,70 0,70 0,69 NE 1.019,39 5,04 2,48 1,15 1,64 1,37 0,64 0,44 0,43 0,41 0,39 0,38 N 522,59 4,57 2,31 1,17 2,18 1,63 0,59 0,34 0,34 0,30 0,30 0,29 SE 176,83 3,28 1,69 1,07 0,99 1,05 0,34 0,27 0,26 0,24 0,22 0,21 S 545,09 5,12 3,45 2,03 2,28 3,26 0,68 0,62 0,61 0,58 0,58 0,56 NE 362,75 3,33 1,84 0,91 1,27 1,01 0,45 0,34 0,32 0,32 0,30 0,29 N 213,06 3,53 1,70 0,89 1,73 1,20 0,43 0,27 0,26 0,23 0,23 0,22 SE 1.674,98 31,63 16,66 10,42 9,63 10,14 3,29 2,57 2,46 2,27 2,16 2,07 S 6.172,75 57,54 38,43 22,45 25,38 36,45 7,58 6,90 6,81 6,49 6,41 6,22 NE 4.166,97 38,77 21,81 10,78 14,90 11,79 5,23 3,96 3,79 3,77 3,54 3,40 N 2.530,71 41,57 21,02 11,06 21,50 14,66 5,28 3,29 3,14 2,80 Tabela 5.25: Estatísticas de erro dos modelos (ARC) – out-of-sample 2,77 2,68 93 Os demais modelos, aqueles que não formaram árvores, apresentaram os menores valores em todas as estatísticas. Verificou-se a normalidade (nas versões univariada e multivariada do teste) dos resíduos dos modelos lineares (8 a 12) no período out-of-sample, mostrados na Tabela 5.26. Para os modelos não-lineares, somente os modelos 1, 2, 5 e 7 não rejeitaram a hipótese de normalidade na versão multivariada. Dentre esses modelos, os resíduos não seguem distribuição Normal univariada, pelo teste de Jarque-Bera. Já os lineares (8 a 12) seguem normalidade tanto na versão multivariada quanto na univariada, em todas as variáveis. Modelo Teste Normalidade Multivariado p-valor Teste JB p-valor do teste JB H=0 Normal H=1 Nãonormal 1 2 3 4 5 6 7 8 9 10 11 12 0,19 8,70 2,87 19,09 7,74 13,79 1,24 0,04 0,01 0,02 0,03 0,04 7,81 7,81 7,81 7,81 7,81 7,81 7,81 7,81 7,81 7,81 7,81 7,81 0,98 0,03 0,41 0,00 0,05 0,00 0,74 1,00 1,00 1,00 1,00 1,00 SE 1 1 1 1 1 1 1 0 0 0 0 0 S 1 1 1 1 1 1 1 0 0 0 0 0 NE 1 1 1 0 1 1 1 0 0 0 0 0 N 1 1 1 1 0 1 1 0 0 0 1 0 SE 0,00 0,00 0,02 0,02 0,02 0,00 0,00 0,09 0,10 0,13 0,06 0,41 S 0,00 0,00 0,03 0,03 0,01 0,04 0,04 0,39 0,50 0,50 0,50 0,50 NE 0,00 0,00 0,00 0,31 0,03 0,00 0,00 0,36 0,05 0,34 0,05 0,07 0,00 0,00 0,01 0,00 0,50 0,01 0,00 0,50 0,43 0,17 Tabela 5.26: Testes de normalidade dos resíduos (ARC) – out-of-sample 0,04 0,12 N Depois de analisar todos esses resultado, desde o número de parâmetros em cada modelo, os critérios de informação, as estatísticas dos resíduos in-sample e – out-of-sample dos três tipos de previsão, o modelo que apresentou melhor ajuste aos dados de vazão de rios foi o modelo 7. Este modelo foi, então, o selecionado para representar o STVAR-Tree no confronto com o modelo PAR(p). A Figura 5.7 ilustra a árvore estimada pelo modelo 7, identificando o valor estimado pelo parâmetro de suavidade e de locação , além da variável de transição . A interpretação da árvore é feita da seguinte maneira: para estimar as séries de vazão de rios, medidas aqui pela Energia Natural Afluente (ENA), o modelo STVAR-Tree mais adequado sugere uma árvore com dois regimes, com uma transição suave æ = 1,32 determinada pela defasagem 11 do 94 sub-mercado Sul. O ponto de corte desta variável de transição ocorre no valor = 8,7. Figura 5.7: Árvore estimada do modelo 7 Portanto, para ENA do Sul com valores menores que 8,7, as séries de ENA dos quatro sub-mercados são estimadas pelo Regime 1, com 79% de pertinência. Para ENA do Sul com valores maiores ou iguais a 8,7, as séries de ENA dos quatro sub-mercados são estimadas pelo Regime 2, com 21% de pertinência. Os parâmetros lineares estimados, para cada regime, estão a seguir. Regime 1 0,63 0,40 0,71 0,23 −0,06 0,26 −0,10 −0,31 4,45 0,65 0 0,15 −0,25 −0,14 0,01 −0,18 0,05 0,13 + + = 3,02 0 0,01 NN0,05 −0,25 −0,05 0,32 −0,21 −0,13 N0,11 0,19 N N 3,36 0,10 −0,02 −0,03 0,55 −0,23 −0,17 N + + + 0,10 0,12 0 −0,08 −0,07 −0,03 −0,04 0,02 0 0,04 0,09 0,02 0,04 −0,03 + −0,1 0,03 −0,01 −0,05 N0,04 0,06 0,47 −0,01 −0,07 N ~ −0,21 0,07 −0,16 0,01 0,07 −0,05 0,11 0,36 −0,08 −0,76 0,37 0,16 0,29 0,05 −0,06 −0,13 −0,12 0,12 0,03 0,01 0,14 0,03 0,25 0,03 −0,19 + N0,10 −017 0,16 0,05 −0,16 0,29 −0,23 −0,20 N 0,04 −0,03 −0,03 0,01 −0,29 0,15 −0,20 −0,20 −0,10 0,02 −0,11 −0,13 N0,24 −0,26 0,33 0,28 N −0,06 0,01 −0,22 N−0,09 N −0,03 0,86 0,03 N−0,22 N Regime 2 −1,17 0,75 −0,26 0,53 0,13 0,08 −0,50 −0,05 −0,08 2,88 0 −1,04 −0,14 0,07 0,01 0,04 0,12 0,48 = + + N0,04 0,22 0,09 0,09 0,13 0,29 N0,85 −0,10 −0,01 NN 1,14 N −0,21 0,17 −0,34 −0,33 N 0,10 0,71 0,04 0,09 −0,04 0,10 −0,04 −0,05 −0,11 −0,03 + 0,07 −0,01 0,08 −0,03 0,04 −0,03 −0,03 0,04 0,10 0,09 0,01 −0,04 −0,07 0,14 −0,07 −0,16 + 0,06 N−0,19 −0,10 0,72 0,27 N0,28 0,59 N −0,05 N ~ 0,05 −0,18 −0,04 −0,05 −0,02 0,07 0,11 0,22 + 0,11 0,26 0,15 −0,13 −0,15 −0,18 −0,05 0,01 N0,08 −0,10 N + 0,37 0,09 −0,09 −0,86 −0,01 −0,37 0,02 −0,21 −0,06 0,11 0,18 0,69 −0,11 0,97 0,04 0,56 + −0,17 −0,72 −0,09 −0,06 N−0,07 −0,28 −0,10 −0,24 N−0,04 0,41 N −0,01 −0,17 0,06 0,08 N 0,05 −0,05 95 5.2.1.3. PAR Quatro modelos PAR(p) foram estimados, um para cada sub-mercado. A estratégia de seleção de modelos seguida, inicialmente, considerou a mesma ordem p para todos os meses. Porém, os resultados foram muito ruins. Os resíduos não tinham boas propriedades e os erros de previsão eram elevados. Como a modelagem PAR(p) permite que se escolham ordens diferentes para os períodos, realizou-se este procedimento e os resultados melhoraram, permitindo que o modelo mais adequado fosse selecionado. O critério utilizado para selecionar a ordem de cada um dos períodos foi aquele que reduz o valor do BIC. As Figuras 5.8 a 5.11 a seguir ilustram a Função de Auto Correlação (FAC) Periódica e a Função de Auto Correlação Parcial (FACP) Periódica, de cada subsistema. Estas funções auxiliam na seleção da ordem dos modelos. Figura 5.8: FAC e FACP do logaritmo de ENA Figura 5.9: FAC e FACP do logaritmo de ENA Sul Sudeste Figura 5.10: FAC e FACP do logaritmo de ENA Nordeste Figura 5.11: FAC e FACP do logaritmo de ENA Norte Nem sempre, os resultados obtidos pura e simplesmente pelo critério BIC foram satisfatórios. Combinando, então, os resultados pelo critério BIC e em 96 conjunto com FAC e FACP Periódicas selecionou-se os modelos, disponíveis na Tabela 5.27. Mês 2 1 1 2 4 SE S NE N 3 1 1 1 1 4 5 6 7 8 9 10 1 1 1 3 1 1 1 2 1 1 1 1 1 1 1 1 3 1 1 1 1 1 1 5 3 4 5 1 Tabela 5.27: Modelos PAR(p) para cada um dos sub-mercados 11 1 1 2 1 12 1 1 1 1 Os parâmetros destes modelos foram estimados e constam na Tabela 5.28. Os valores nulos significam que a ordem era menor que a disponível na tabela. Mês SE S NE N 1 2 3 4 5 6 7 8 9 10 11 12 lag 1 0,68 0,70 0,69 0,69 0,75 lag 2 0 0 0 0 0 0,94 0,68 0,85 1,12 0,67 0,66 0,69 0 -0,02 0 0 0 0 0 lag 3 0 0 0 0 0 0 0,25 0 0 0 0 0 lag 1 0,45 0,64 0,54 lag 2 0 0 0 0,29 0,95 0,55 0,68 0,65 0,53 0,47 0,61 0,75 0,38 0 0 0 0 0 0 0 0 lag 1 0,44 1,07 0,79 0,78 0,8 0,56 0,81 0,93 0,91 0,90 0,80 0,71 lag 2 0 -0,34 0 0 0 0,01 0 0 0 0 0 0 lag 3 0 0 0 0 0 0,18 0 0 0 0 0 0 lag 1 0,63 0,85 0,66 0,68 0,86 0,77 1,05 1,25 1,47 0,97 0,85 0,8 lag 2 0 -0,31 0 0 0 0 -0,45 -0,49 -1,09 0 0 0 lag 3 0 0 0 0 0 -0,02 0,23 0,11 0,29 0 0 0 lag 4 0 0,35 0 0 0 0,10 0 0,15 -0,10 0 0 0 lag 5 0 0 0 0 0 0,11 0 0 0,32 Tabela 5.28: Estimativa dos parâmetros dos modelos PAR(p) 0 0 0 A Tabela 5.29 apresenta as estatísticas Média, Variância, Assimetria e Curtose dos resíduos nos períodos in-sample e out-of-sample. Estes resultados mostram um ajuste razoável aos dados. In-sample Out-of-sample Média Variância Assimetria Curtose Média Variância Assimetria Curtose SE -0,01 2,41 -0,92 2,63 0,01 2,39 -0,92 2,59 S -0,02 1,58 -0,65 3,31 0,06 1,76 -0,48 3,24 NE -0,05 1,71 1,48 4,99 -0,11 1,65 1,55 5,26 N -0,01 1,96 0,22 1,86 -0,02 2,01 Tabela 5.29: Estatísticas Descritivas das séries de resíduos 0,2 1,86 97 5.2.1.4. Comparação dos modelos STVAR-Tree e PAR Estatisticamente, os modelos STVAR-Tree e PAR(p) foram comparados pelas medidas de MAPE no período out-of-sample, apresentadas na Tabela 5.30. Conclui-se que a modelagem STVAR-Tree teve um ajuste muito superior em comparação com a modelagem PAR. Duas das três estratégias de previsão do STVAR-Tree, RC e ARC, apresentaram MAPE muito menores. Out-of-sample STVAR-Tree RC STVAR-Tree MM STVAR-Tree ARC PAR SE 1,64 10,54 3,29 13,02 S 4,89 31,19 7,58 11,73 NE 2,10 2,48 5,23 10,96 N 2,22 15,82 5,28 Tabela 5.30: Comparação dos modelos STVAR-Tree e PAR(p) 14,68 Este resultado mostra que o modelo não-linear multivariado denominado STVAR-Tree é capaz de ser aplicado a problemas reais e que pode competir com modelos já existentes. Neste caso, o modelo STVAR-Tree ganhou com uma vantagem bastante expressiva. 5.2.2. Preço spot de energia elétrica Primeiramente, uma análise exploratória foi feita para conhecimento do comportamento das séries de Preço spot de energia elétrica do mercado brasileiro, no patamar médio de carga, medidas em (R$/MWh). Em seguida, para a modelagem das séries de Preço spot, considerou-se o modelo STVAR-Tree e o modelo PAR(p). A estratégia de separar 80% das observações na fase de estimação e os 20% restantes para a previsão out-of-sample foi utilizada, e estes números estão mais detalhados na Tabela 5.31. Período In-sample Out-of-sample Total Divisão (%) 80% 20% 100% Observações (univariada) 298 Observações (multivariada) 1192 74 372 Tabela 5.31: Divisão dos dados 296 1488 98 A comparação dos modelos foi feita com base em medidas estatísticas no período out-of-sample, considerando previsões de 1 passo à frente. 5.2.2.1. Análise exploratória Trata-se de séries semanais, coletadas no período de maio/2002 a junho/2009, no total de 372 semanas de observações. Média Mediana Desvio-padrão Mínimo Máximo Assimetria Curtose SE S NE 55,86 56,61 51,26 28,13 27,26 18,59 71,41 71,79 76,89 4,00 4,00 4,00 569,59 569,59 569,59 3,90 3,83 3,71 25,03 24,37 20,77 Tabela 5.32: Estatísticas Descritivas das séries de Preço spot N 51,38 18,59 72,12 4,00 569,59 3,95 25,00 O Gráfico 5.3 apresenta a evolução das séries de Preço spot ao longo das semanas. Note que a série histórica apresenta elevada volatilidade e diversas quebras estruturais. Vários são os motivos para explicar esse comportamento, a maioria em razão de efeitos conjunturais ou estruturais da própria formação do preço spot. 600,00 500,00 400,00 300,00 200,00 100,00 04/05/02-10/05/02 03/08/02-09/08/02 02/11/02-08/11/02 01/02/03-07/02/03 03/05/03-09/05/03 02/08/03-08/08/03 01/11/03-07/11/03 31/01/04-06/02/04 01/05/04-07/05/04 31/07/04-06/08/04 30/10/04-05/11/04 29/01/05-04/02/05 30/04/05-06/05/05 30/07/05-05/08/05 29/10/05-04/11/05 28/01/06-03/02/06 29/04/06-05/05/06 29/07/06-04/08/06 28/10/06-03/11/06 27/01/07-02/02/07 28/04/07-04/05/07 28/07/07-03/08/07 27/10/07-02/11/07 26/01/08-01/02/08 26/04/08-02/05/08 26/07/08-01/08/08 25/10/08-31/10/08 24/01/09-30/01/09 25/04/09-01/05/09 0,00 Preço_SE Preço_S Preço_NE Preço_N Gráfico 5.3: Evolução das séries de Preço spot Como o preço não é, de fato, de mercado, e sim fornecido por modelos computacionais, grandes variações semanais podem ocorrer, por exemplo, quando 99 parâmetros ou versões desses modelos matemáticos são alterados ou lançados, ou até mesmo a adoção de valores não advindos dos modelos. Outro problema é quando os próprios modelos matemáticos são abandonados. Um exemplo disso ocorreu no período do racionamento de 2001/2002 quando alguns valores do PLD semanal foram regulados pelo governo. Além disso, descontinuidades no Plano de Expansão e alterações nos planos de reparo e manutenção de unidades térmicas, limites na transmissão de energia entre sub-mercados, entre outros motivos, têm feito com que a volatilidade das séries de preço seja elevada. Devido à grande variabilidade dos dados, melhores resultados foram obtidos ao aplicar o logaritmo natural às séries de Preço spot. E daqui para frente, somente estas séries serão consideradas nas análises. A Tabela 5.33 fornece estatísticas descritivas do logaritmo natural das séries de Preço spot. As médias das séries apresentam valores semelhantes às medianas, com alguns desvios devido à baixa dispersão medida pelos desvios-padrão. Nota-se que os valores de mínimo e máximo não são distantes (entre 1,39 e 6,35). ln(SE) ln(S) ln(NE) lnN) Média 3,48 3,49 3,30 3,34 Mediana 3,37 3,31 2,92 2,92 Desvio-padrão 1,04 1,07 1,07 1,06 Mínimo 1,39 1,39 1,39 1,39 Máximo 6,35 6,35 6,35 6,35 Assimetria 0,08 0,02 0,47 0,34 Curtose 2,63 2,62 2,91 2,67 Tabela 5.33: Estatísticas Descritivas do logaritmo natural das séries de Preço spot A Tabela 5.34 apresenta as correlações entre as séries de Preço spot. É possível notar as correlações elevadas entre todos os sub-mercados. ln(SE) ln(S) ln(NE) ln(N) ln(SE) ln(S) ln(NE) ln(N) 1 0,96 0,89 0,94 0,96 1 0,86 0,89 0,89 0,86 1 0,89 0,94 0,89 0,89 1 Tabela 5.34: Matriz de Correlação do logaritmo natural das séries de Preço spot Visualmente, no Gráfico 5.4, é possível perceber a presença de tendência crescente no início das séries dos quatro sub-mercados, porém na maior parte do período analisado as séries apresentam comportamento de séries estacionárias, uma vez que os níveis se mantêm constantes. 100 04/05/02-10/05/02 27/07/02-02/08/02 19/10/02-25/10/02 11/01/03-17/01/03 05/04/03-11/04/03 28/06/03-04/07/03 20/09/03-26/09/03 13/12/03-19/12/03 06/03/04-12/03/04 29/05/04-04/06/04 21/08/04-27/08/04 13/11/04-19/11/04 05/02/05-11/02/05 30/04/05-06/05/05 23/07/05-29/07/05 15/10/05-21/10/05 07/01/06-13/01/06 01/04/06-07/04/06 24/06/06-30/06/06 16/09/06-22/09/06 09/12/06-15/12/06 03/03/07-09/03/07 26/05/07-01/06/07 18/08/07-24/08/07 10/11/07-16/11/07 02/02/08-08/02/08 26/04/08-02/05/08 19/07/08-25/07/08 11/10/08-17/10/08 03/01/09-09/01/09 28/03/09-03/04/09 7,00 6,00 5,00 4,00 3,00 2,00 1,00 0,00 ln(SE) ln(S) ln(NE) ln(N) Gráfico 5.4: Evolução do logaritmo natural das séries de Preço spot Para comprovar estatisticamente este resultado, o teste ADF (Augmented Dickey-Fuller) foi realizado, baseado nos valores críticos de McKinnon para a rejeição da hipótese nula, com as seguintes hipóteses: H0: a série tem raiz unitária (não é estacionária) H1: a série não tem raiz unitária (é estacionária) Como resultados dos testes, temos a rejeição da hipótese de raiz unitária para as séries, aos níveis de 1%, 5% e 10%. ln(SE) -2,19 ln(S) ln(NE) -2,52 -2,76 * valores críticos de McKinnon 1%* -3,46 5% -2,87 ln(N) -2,78 10% -2,57 Tabela 5.35: Teste Estatístico ADF Portanto, a conclusão que tiramos é que o logaritmo natural das séries de Preço spot não são estatisticamente estacionárias, considerando diferentes níveis de significância. Neste caso, o teste de co-integração deve ser realizado, pois somente na ausência de co-integração que o modelo STVAR-Tree deve ser utilizado. H0: as séries não são co-integradas H1: as séries são co-integradas 101 Estatística Equações de Likelihood Valor crítico Co-integração Ratio 5% Nenhuma(*) 138,95 47,21 Uma(*) 74,71 29,68 Duas(*) 38,98 15,41 Três(*) 6,42 3,76 Tabela 5.36: Teste Co-integração de Johansen Pela estatística de teste de Razão de Verossimilhança, o teste de cointegração rejeita a hipótese nos levando a conclusão que as séries são cointegradas. Entretanto, ao definir o número de equações co-integradas, o procedimento de Johansen sugere 4 equações, o que indica que temos uma matriz de posto completo, nos indicando, assim, a ausência de co-integração entre as séries testadas. Estritamente falando, as séries de Preço spot no período em questão são integradas de ordem zero, I(0), portanto temos satisfeitas as condições necessárias para usar o arcabouço da modelagem STVAR-Tree. 5.2.2.2. STVAR-Tree Para a escolha do modelo STVAR-Tree mais adequado ao logaritmo das séries de Preço spot, foi utilizado o mesmo procedimento adotado na modelagem de Vazão de rios. Estimou-se 13 modelos, cada um deles com o aumento de uma unidade no número de defasagem nas séries das variáveis endógenas dos quatro sub-sistemas brasileiros, começando na ordem 1 e alcançando o máximo de 13 defasagens (o equivalente a 3 meses). As candidatas a possíveis variáveis de transição foram as 13 primeiras defasagens nas séries das variáveis endógenas, as séries Energia Natural Afluente (ENA, medidas em %MLT - Média de Longo Termo) e as séries de Energia Armazenada (EARM, medidas em % do armazenamento máximo). O grid de valores dos parâmetros não-lineares foi composto por: • • Suavidade: = 1,5,10 Locação: percentis das candidatas a variável de transição, fixos em = 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%. Com a finalidade de evitar a estimação de árvores complexas e também de reduzir o tempo computacional, limitou-se árvores com no máximo 8 folhas (nós terminais). 102 Uma forma de ilustrar essa complexidade seria com a apresentação do número de nós terminais e de parâmetros dos 13 modelos estimados, já considerando o procedimento de limitação. Vale lembrar que o número que identifica o modelo está associado à ordem de defasagem das variáveis endógenas. A Tabela 5.37 mostra os números. Número de parâmetros de suavidade Número de parâmetros locação Número de parâmetros lineares Φ Modelo Número de nós terminais 1 8 2 8 7 7 288 3 8 7 7 416 4 8 7 7 544 5 8 7 7 672 6 6 5 5 600 7 5 4 4 580 8 4 3 3 528 9 4 3 3 592 10 3 2 2 492 11 3 2 2 540 12 2 1 1 392 7 7 160 13 2 1 1 424 Tabela 5.37: Número de nós terminais e de parâmetros dos modelos estimados Todos os modelos apresentaram crescimento da árvore e, com a limitação, os modelos 1 a 5 possuem o número máximo de folhas. A partir dessa defasagem, os modelos apresentam um decréscimo no número de nós terminais. Isto se deve ao procedimento adotado de diminuir o nível de significância do teste, de acordo com o crescimento da árvore. Para cada modelo estimado, verificou-se os valores assumidos pelos Critérios de Informação Akaike (AIC), Bayesian (BIC), Hannan-Quinn (HQ) e Final Prediction Error (FPE). O objetivo então é selecionar o modelo que minimiza esses valores. A Tabela 5.38 apresenta os valores dos quatro Critérios de Informação para os 13 modelos estimados. O modelo com somente 1 defasagem nas variáveis endógenas apresentou o menor valor para AIC, BIC e HQ. O modelo com melhor capacidade preditiva, pelo critério FPE, é o modelo 7. Porém, o modelo final não foi selecionado aqui nesta etapa. 103 Modelo AIC BIC FPE HQ 1 6,63 -9,84 8,06E-06 -11,07 2 280,72 -2,95 -1,82E-06 -7,35 3 784,82 8,87 -2,34E-07 -0,66 4 1519,36 26,05 -6,19E-08 9,42 5 1828,19 41,22 -6,42E-08 18,76 6 1919,20 53,21 -2,23E-08 25,71 7 1778,97 63,45 -7,03E-08 32,43 8 1431,97 68,40 -3,91E-07 36,13 9 1875,05 89,61 -2,15E-07 48,90 10 1216,61 82,05 -3,56E-07 44,46 11 1520,78 101,71 -2,20E-07 56,32 12 699,99 79,41 -1,80E-06 43,47 13 855,43 94,97 -1,21E-06 Tabela 5.38: Critérios de Informação 52,85 Outras estatísticas, todas baseadas nos resíduos, foram utilizadas para seleção do modelo mais adequado, tanto in-sample quanto out-of-sample. A Tabela 5.39 apresenta as estatísticas Média, Variância, Assimetria e Curtose dos resíduos no período in-sample. Todos os modelos possuem resíduos com média nula, variância pequena. As medidas de assimetria e curtose apontam desvios dos valores que indicam normalidade (0 e 3, respectivamente). Modelo SE Média Variância Assimetria Curtose 1 2 3 4 5 6 7 8 9 10 11 12 13 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 S 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 NE 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 NE 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 SE 0,03 0,03 0,02 0,02 0,02 0,01 0,02 0,02 0,02 0,02 0,02 0,03 0,03 S 0,04 0,04 0,02 0,03 0,03 0,02 0,03 0,03 0,03 0,04 0,03 0,04 0,04 NE 0,05 0,02 0,02 0,01 0,01 0,01 0,01 0,02 0,03 0,02 0,02 0,04 0,04 NE 0,03 0,03 0,02 0,01 0,01 0,01 0,01 0,02 0,01 0,02 0,02 0,03 0,03 SE 1,81 1,91 1,44 3,73 3,85 1,92 3,94 2,19 2,91 2,70 2,98 1,35 1,11 S 1,52 1,92 1,35 3,01 4,05 2,02 3,65 2,99 3,39 2,27 3,23 1,85 1,48 NE 1,63 1,86 2,07 0,31 0,12 2,34 0,48 0,78 1,73 1,74 3,11 0,72 0,97 NE 1,09 -0,47 0,68 0,25 0,90 0,67 0,19 -0,17 0,51 -0,34 -0,65 -1,07 -0,92 SE 11,88 16,99 13,37 33,71 37,04 17,62 40,77 20,22 25,68 21,97 27,37 11,52 7,47 S 9,20 15,05 10,58 23,18 33,77 16,45 29,29 23,85 27,70 15,19 26,75 12,84 10,47 NE 19,01 18,40 20,18 6,78 8,40 24,29 12,09 8,54 16,58 16,46 35,74 10,83 10,58 NE 8,67 10,12 6,48 5,66 7,10 9,72 6,49 7,76 8,20 7,40 Tabela 5.39: Estatísticas descritivas dos resíduos – in-sample 10,14 13,24 11,62 104 A Tabela 5.40 apresenta as estatísticas MSE, RMSE, MAE e MAPE. Os valores de MSE, RMSE e MAE estão próximos a zero e as medidas de MAPE apontam valores baixos, o que indica que os modelos estimados controlaram bastante os erros in-sample. É interessante notar que todos os valores estão muito próximos uns dos outros, não permitindo destacar um único modelo como o mais adequado para representar as séries de Vazão de rios. Modelo MSE RMSE MAE MAPE 1 2 3 4 5 6 7 8 9 10 11 12 13 SE 0,03 0,03 0,02 0,02 0,02 0,01 0,02 0,02 0,02 0,02 0,02 0,03 0,03 S 0,04 0,04 0,02 0,03 0,03 0,02 0,03 0,03 0,03 0,04 0,03 0,04 0,04 NE 0,05 0,02 0,02 0,01 0,01 0,01 0,01 0,02 0,03 0,02 0,02 0,04 0,04 N 0,03 0,03 0,02 0,01 0,01 0,01 0,01 0,02 0,01 0,02 0,02 0,03 0,03 SE 0,18 0,16 0,14 0,13 0,13 0,11 0,12 0,14 0,14 0,15 0,14 0,18 0,16 S 0,21 0,20 0,15 0,16 0,16 0,13 0,16 0,19 0,17 0,19 0,18 0,20 0,19 NE 0,23 0,15 0,14 0,10 0,10 0,11 0,11 0,15 0,16 0,14 0,13 0,20 0,20 N 0,17 0,16 0,13 0,10 0,11 0,09 0,11 0,14 0,12 0,14 0,13 0,18 0,17 SE 0,11 0,10 0,09 0,08 0,07 0,06 0,07 0,08 0,08 0,09 0,07 0,12 0,12 S 0,14 0,13 0,10 0,09 0,09 0,07 0,09 0,10 0,09 0,12 0,09 0,14 0,14 NE 0,12 0,09 0,09 0,06 0,06 0,06 0,06 0,10 0,10 0,09 0,07 0,13 0,13 N 0,11 0,10 0,09 0,07 0,07 0,05 0,07 0,09 0,07 0,09 0,07 0,12 0,11 SE 3,54 3,21 2,87 2,49 2,40 2,15 2,26 2,82 2,93 3,15 2,66 3,85 3,94 S 4,41 4,08 3,60 3,11 2,88 2,63 3,05 3,44 3,42 4,01 3,30 4,49 4,61 2,31 2,13 2,23 2,27 3,47 3,57 NE 3,85 3,17 2,99 N 3,69 3,35 2,89 2,40 2,38 1,86 2,65 3,07 2,79 Tabela 5.40: Estatísticas de erro dos modelos – in-sample 3,09 2,52 4,40 4,49 3,38 2,77 3,93 3,86 Por fim, verificou-se a normalidade dos resíduos dos modelos estimados, mostrados na Tabela 5.41. Para esta análise, realizou-se a versão multivariada do teste. O teste univariado de normalidade Jarque-Bera não foi realizado devido ao tamanho da amostra ser considerado pequeno. Este teste apresenta melhores desempenhos para amostras em torno de (ou maior que) 1000 observações. Modelo My÷y M~ 5% p-valor 1 2 3 4 5 6 7 8 9 10 11 12 13 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 7,81 7,81 7,81 7,81 7,81 7,81 7,81 7,81 7,81 7,81 7,81 7,81 7,81 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 Tabela 5.41: Teste de normalidade dos resíduos – in-sample 105 Conclui-se que os resíduos in-sample de todos os modelos seguem distribuição Normal multivariada. Além da análise dos critérios de informação, que aponta o modelo 1 como o modelo mais adequado, e da análise dos resíduos in-sample, que apontam bons ajustes dos modelos, estatísticas descritivas e de erro dos modelos no período outof-sample também foram geradas. Depois de estimados os modelos, 3 tipos de previsão foram realizadas no período out-of-sample: Combinação de Regimes (RC), Máxima Pertinência (MM) e Combinação Adaptativa de Regimes (ARC), conforme descritas no Capítulo IV. Analisar os resíduos gerados por modelos utilizando estes três métodos de previsão determinará o modelo STVAR-Tree que melhor se adéqua aos dados. Nesta etapa, os modelos de 1 a 13 competem entre si, pois alguns modelos apresentam bons ajustes out-of-sample e outros não. A Tabela 5.42 apresenta as estatísticas Média, Variância, Assimetria e Curtose dos resíduos no período out-of-sample pelo método RC. Nem todos os modelos possuem resíduos com média nula, variância pequena, assimetria próxima a zero e curtose próxima a 3. Destacam-se com melhores resultados os modelos 8, 12 e 13. Modelo Média Variância Assimetria Curtose 1 2 3 4 5 6 7 8 9 10 11 12 13 SE -2,61 47,30 237,04 2,36 25,14 4,28 0,84 -0,22 -88,88 1,95 106,06 -0,12 -0,08 S -4,71 15,14 522,96 4,70 30,02 7,35 0,61 -0,16 -76,85 0,96 -11,51 -0,15 -0,10 NE -2,38 13,07 -35,31 3,96 20,35 1,58 1,76 0,02 -34,23 3,04 85,84 -0,10 -0,03 NE -2,74 23,52 68,28 0,72 31,32 2,76 0,36 -0,24 8,46 2,77 70,10 -0,17 -0,18 SE 170,41 1,0E+05 4,1E+05 57,83 2,3E+04 299,04 6,63 0,28 1,4E+05 56,93 6,9E+04 0,25 0,27 S 592,96 3,8E+04 1,7E+06 213,09 2,8E+04 1152,01 3,88 0,34 1,1E+05 22,55 3,0E+04 0,20 0,20 NE 160,72 1,2E+03 1,0E+05 213,68 1,5E+04 843,94 41,96 0,87 1,9E+04 150,35 2,5E+04 0,30 0,31 NE 191,28 6,4E+04 5,5E+04 31,39 4,6E+04 400,42 6,69 0,30 1,2E+04 87,73 5,8E+04 0,35 0,32 SE -6,80 6,52 4,93 3,74 7,43 5,30 2,43 0,07 -3,28 4,71 2,31 0,18 0,04 S -6,80 6,33 3,97 4,12 6,06 6,13 2,43 1,13 -3,37 4,28 0,50 -0,05 0,01 NE -6,80 1,39 -2,44 3,39 6,53 -2,19 3,52 -0,47 -4,06 4,39 2,24 -0,74 -0,01 NE -6,80 6,42 4,11 2,65 7,98 5,29 0,85 -0,55 0,52 4,59 1,67 -0,76 -1,08 SE 51,05 49,41 33,34 19,28 59,08 32,48 9,70 3,60 16,05 24,20 8,48 3,05 3,67 S 51,03 47,94 23,25 22,23 39,85 42,38 16,43 9,05 16,95 25,27 7,95 4,46 2,85 NE 51,11 6,07 17,34 14,00 46,05 28,51 16,77 8,58 21,49 21,35 7,11 8,25 5,86 NE 51,05 48,66 25,76 19,39 66,19 39,12 8,32 5,19 11,79 23,88 Tabela 5.42: Estatísticas descritivas dos resíduos (RC) – out-of-sample 8,45 4,78 6,09 106 Diferentemente do ocorrido no período in-sample, nem todos os valores de MSE, RMSE, MAE e MAPE do período out-of-sample estão próximos a zero, o que indica que alguns modelos estimados não conseguiram controlar os erros neste período. A Tabela 5.43 apresenta as estatísticas, com destaque positivo para os modelos 8, 12 e 13. Modelo MSE RMSE MAE MAPE 1 2 3 4 5 6 7 8 9 10 11 12 13 SE 174,84 1,0E+05 S 606,90 3,7E+04 4,6E+05 62,61 2,0E+06 232,26 2,4E+04 313,19 7,25 0,33 1,4E+05 59,93 7,9E+04 0,26 0,27 2,8E+04 1189,97 4,19 0,36 1,1E+05 23,15 3,0E+04 0,22 0,21 NE 164,17 1,4E+03 1,0E+05 226,42 1,5E+04 834,71 44,48 0,86 2,0E+04 157,49 3,2E+04 0,31 0,31 N 196,15 6,3E+04 5,9E+04 31,47 4,6E+04 402,49 6,73 0,35 1,2E+04 94,20 6,2E+04 0,37 0,35 SE 13,22 3,2E+02 S 24,64 1,9E+02 6,7E+02 7,91 1,5E+02 17,70 2,69 0,57 3,8E+02 7,74 2,8E+02 0,51 0,52 1,4E+03 15,24 1,7E+02 34,50 2,05 0,60 3,3E+02 4,81 1,7E+02 0,47 0,46 NE 12,81 3,7E+01 3,2E+02 15,05 1,2E+02 28,89 6,67 0,93 1,4E+02 12,55 1,7E+02 0,56 0,55 N 14,01 2,5E+02 2,4E+02 5,61 2,1E+02 20,06 2,59 0,60 1,1E+02 9,71 2,4E+02 0,61 0,59 SE 2,72 8,9E+01 2,8E+02 3,10 2,6E+01 4,57 1,38 0,42 1,4E+02 2,26 1,3E+02 0,39 0,38 S 4,83 6,2E+01 6,1E+02 5,55 3,2E+01 7,78 1,16 0,42 1,2E+02 1,93 9,6E+01 0,34 0,35 NE 2,60 1,9E+01 1,3E+02 5,34 2,1E+01 7,96 2,54 0,59 5,5E+01 3,47 9,3E+01 0,38 0,40 N 2,87 7,8E+01 9,9E+01 2,41 3,3E+01 4,62 1,42 0,43 5,6E+01 3,33 1,2E+02 0,42 0,40 SE 58,70 2,1E+03 6,9E+03 79,59 6,2E+02 122,16 33,39 10,27 3,4E+03 54,11 3,4E+03 9,72 9,60 S 102,71 1,4E+03 1,5E+04 139,31 7,8E+02 202,39 27,70 10,01 2,9E+03 43,99 2,3E+03 8,20 8,63 NE 61,17 5,0E+02 3,5E+03 135,86 7,0E+02 221,57 64,81 15,40 1,4E+03 83,81 2,4E+03 10,05 10,52 N 68,25 2,4E+03 3,2E+03 73,61 1,0E+03 145,69 45,40 12,14 1,6E+03 103,74 Tabela 5.43: Estatísticas de erro dos modelos (RC) – out-of-sample 3,6E+03 12,12 11,53 Por fim, verificou-se a normalidade (somente na versão multivariada do teste) dos resíduos dos modelos estimados no período out-of-sample, mostrados na Tabela 5.44. Modelo My÷y M~ 5% p-valor 1 2 3 4 5 6 7 8 9 10 11 12 13 1,26 1,34 2,96 2,29 0,90 1,07 2,33 3,27 1,43 2,06 3,86 2,25 1,38 7,81 7,81 7,81 7,81 7,81 7,81 7,81 7,81 7,81 7,81 7,81 7,81 7,81 0,74 0,72 0,40 0,51 0,83 0,79 0,51 0,35 0,70 0,56 0,28 0,52 0,71 Tabela 5.44: Testes de normalidade dos resíduos (RC) – out-of-sample Conclui-se que os resíduos de os modelos neste período seguem distribuição Normal multivariada. 107 Considerando o método de previsão RC, os modelos 8, 12 e 13 foram os que melhor apresentaram resultados para os resíduos, em todas as análises. Selecionase, portanto, estes modelos como os candidatos aos mais adequados. Considere, agora, o tipo MM de previsão. A Tabela 5.45 apresenta as estatísticas Média, Variância, Assimetria e Curtose dos resíduos. Destacam-se os modelos 8, 12 e 13 por possuírem resíduos com médias próximas a zero, variâncias pequenas, assimetrias próximas a zero e curtoses próximas a 3. Modelo Média Variância Assimetria Curtose 1 2 3 4 5 6 7 8 9 10 11 SE -1,86 28,31 -4838,89 S -3,21 -5,49 -2086,70 18,07 -7049,50 36,74 -5593,02 NE -1,68 -4,75 -624,13 -13,53 -5220,35 NE -2,02 12,38 -3275,96 9,32 -3688,39 SE 181,42 1,0E+05 4,1E+05 9,7E+02 1,9E+07 7,8E+05 12 13 -1420,44 -7,21 -0,62 -69,49 0,44 -1470,09 -0,15 -0,08 926,46 13,84 -0,42 -66,77 0,40 -1255,25 -0,10 -0,06 795,91 32,82 -0,11 -41,85 0,45 -178,57 -0,10 -0,01 -1134,26 36,04 -0,66 19,76 0,61 -846,90 -0,21 -0,23 25,34 0,29 1,1E+05 1,21 9,8E+06 0,25 0,27 S 625,58 3,8E+04 1,7E+06 4,1E+03 1,2E+07 2,8E+05 138,90 0,34 9,5E+04 2,15 5,8E+06 0,20 0,20 NE 170,38 1,2E+03 1,0E+05 1,8E+03 1,0E+07 2,2E+05 711,13 0,88 4,6E+04 2,17 3,8E+05 0,30 0,31 NE 203,13 6,4E+04 5,5E+04 5,9E+02 5,3E+06 4,9E+05 885,45 0,31 1,0E+04 3,24 3,3E+06 0,35 0,32 SE -8,29 6,52 4,93 0,14 0,99 1,11 1,56 0,02 -3,18 0,73 0,78 0,19 0,04 S -8,30 6,33 3,97 0,37 0,99 -1,13 -1,47 1,12 -2,95 -0,10 0,62 -0,11 0,02 NE -8,29 1,39 -2,44 1,67 0,99 -1,07 -1,28 -0,47 -6,02 2,89 1,39 -0,74 -0,01 NE -8,29 6,42 4,11 -1,39 0,99 1,10 -1,39 -0,53 3,13 -0,31 0,82 -0,73 -1,08 SE 69,86 49,41 33,34 3,84 1,98 2,31 5,29 3,48 17,16 9,41 2,76 3,06 3,67 S 69,96 47,94 23,25 3,12 1,98 2,29 4,67 8,99 13,57 7,61 2,41 4,32 2,85 NE 69,83 6,07 17,34 9,75 1,98 2,15 4,51 8,38 41,74 13,83 4,48 8,24 5,86 NE 69,85 48,66 25,76 9,22 1,98 2,26 3,95 5,05 20,65 Tabela 5.45: Estatísticas descritivas dos resíduos (MM) – out-of-sample 6,64 2,95 4,77 6,05 As estatísticas MSE, RMSE, MAE e MAPE do período out-of-sample do tipo MM de previsão, indicam que os modelos 8, 12 e 13 controlam bem os erros devido aos valores baixos nas medidas MSE, RMSE e MAE. A Tabela 5.46 apresenta os resultados. Modelo SE MSE RMSE 1 2 3 4 5 6 7 8 9 10 11 12 13 182,35 1,0E+05 2,3E+07 1291,84 6,8E+07 2,7E+06 77,03 0,66 1,1E+05 1,39 1,1E+07 0,27 0,27 S 627,18 3,7E+04 6,0E+06 5417,64 4,3E+07 1,1E+06 328,59 0,51 9,8E+04 2,28 7,3E+06 0,20 0,20 NE 170,82 1,2E+03 4,9E+05 1999,19 3,7E+07 8,5E+05 1778,66 0,88 4,7E+04 2,34 4,0E+05 0,31 0,31 N 204,39 6,3E+04 1,0E+07 677,28 1,8E+07 1,7E+06 2172,09 0,73 1,1E+04 3,56 4,0E+06 0,39 0,37 SE 13,50 324,76 4880,58 35,94 8295,48 1670,86 8,78 0,81 344,60 1,18 3451,63 0,52 0,52 108 MAE MAPE S 25,04 193,77 2465,87 73,60 6581,50 1069,38 18,13 0,71 313,59 1,51 2701,13 0,45 0,45 NE 13,07 35,44 700,58 44,71 6143,06 926,20 42,17 0,94 217,16 1,53 638,29 0,56 0,55 N 14,30 251,63 3284,34 26,02 4340,47 1333,48 46,61 0,86 105,33 1,89 2013,69 0,62 0,61 SE 1,96 102,35 4838,89 21,95 7050,12 1442,91 8,01 0,68 120,07 0,86 2623,88 0,40 0,38 S 3,35 76,96 2313,03 44,31 5593,46 926,67 16,22 0,56 109,01 1,04 2058,59 0,32 0,35 NE 1,87 26,84 637,58 26,15 5220,85 797,64 36,64 0,60 60,62 0,86 462,54 0,38 0,40 N 2,12 86,12 3275,96 15,65 3689,06 1151,63 41,27 0,72 46,25 1,29 1525,44 0,43 0,41 SE 41,70 2430,42 1,13E+05 491,12 1,55E+05 31942,70 180,99 16,50 2940,51 19,60 59010,65 9,97 9,59 S 69,55 1823,96 52979,59 981,98 1,23E+05 20460,44 363,25 13,28 2635,57 23,05 45794,87 7,82 8,42 NE 40,70 669,20 15776,37 599,34 1,16E+05 17851,51 836,07 15,67 1701,09 19,90 10672,35 10,08 10,43 N 46,88 2679,58 84431,46 394,88 86630,63 27208,79 1004,20 20,01 1272,66 Tabela 5.46: Estatísticas de erro dos modelos (MM) – out-of-sample 30,80 36155,36 12,56 11,89 Verificou-se a normalidade na versão multivariada do teste dos resíduos no período out-of-sample, mostrados na Tabela 5.47. Para os modelos 3, 5, 6, 7 e 8 não temos a distribuição Normal multivariada dos resíduos. Modelo My÷y M~ 5% p-valor 1 2 3 4 5 6 7 8 9 10 11 12 13 0,61 0,24 29,59 6,12 24,51 24,91 20,90 12,86 1,34 3,36 5,54 2,37 1,52 7,81 7,81 7,81 7,81 7,81 7,81 7,81 7,81 7,81 7,81 7,81 7,81 7,81 0,89 0,97 0,00 0,11 0,00 0,00 0,00 0,00 0,72 0,34 0,14 0,50 0,68 Tabela 5.47: Testes de normalidade dos resíduos (MM) – out-of-sample Então, pelo tipo de previsão MM, os candidatos a modelos STVAR-Tree são 12 e 13. Por último, mas não menos importante, o tipo ARC de previsão. A Tabela 5.48 mostra as estatísticas Média, Variância, Assimetria e Curtose dos resíduos. Apesar de alguns modelos apresentarem médias próximas a zero, as variâncias não são baixas. Além disso, as medidas de assimetria e curtose estão afastadas daquelas que sugerem a normalidade. Destacam-se positivamente nesta análise os modelos 8, 11, 12 e 13. Modelo Média Variância 1 2 3 4 5 6 7 8 9 10 11 12 13 SE 6,94 -0,72 16,89 0,46 50,78 -0,73 1,72 0,03 -0,19 0,21 0,06 0,02 0,03 S 5,75 -0,34 18,26 0,54 49,68 -0,78 1,74 0,01 -0,16 0,24 0,07 0,04 0,05 NE 4,97 -0,32 74,33 0,49 52,73 -0,69 1,65 0,00 -0,26 0,19 0,05 -0,03 -0,01 NE 1,67 -0,33 74,38 0,43 52,69 -0,74 1,62 -0,02 -0,33 0,12 -0,04 -0,08 -0,02 SE 2072,79 23,39 2,0E+05 3,58 1,4E+05 118,85 178,04 2,68 6,68 2,41 0,74 2,20 1,78 109 S 1554,87 NE 1425,20 21,28 5,1E+06 3,36 1,5E+05 112,95 NE 546,44 22,69 5,1E+06 3,63 1,5E+05 112,14 SE 3,81 -4,79 2,82 3,33 7,48 -7,17 S 3,78 -3,71 2,87 4,43 7,48 NE 4,03 -2,59 0,55 4,16 7,48 Assimetria 4,84 2,1E+05 5,01 1,4E+05 119,28 177,31 2,73 5,77 2,58 0,66 1,89 1,49 194,33 2,56 7,56 2,77 0,83 2,43 2,00 193,17 2,14 6,95 2,46 0,61 2,25 2,07 7,18 0,26 -5,01 2,42 1,23 0,11 -0,28 -7,17 7,17 0,05 -5,05 3,12 1,58 0,57 0,25 -7,13 7,16 0,81 -4,65 2,35 1,24 -0,14 -0,52 NE 1,99 -2,90 0,55 3,73 7,48 -7,20 7,23 0,13 -5,11 2,22 -0,14 -0,50 -0,50 SE 19,49 30,90 19,60 17,23 57,33 54,45 54,34 8,11 32,69 12,79 6,59 5,81 6,35 S 20,86 19,19 20,80 27,29 57,29 54,45 54,27 9,26 33,38 17,31 8,33 6,24 6,35 NE 24,56 21,62 24,12 25,42 57,32 54,06 54,19 8,58 29,08 13,52 8,79 5,48 6,15 NE 17,75 23,16 24,12 22,37 57,32 54,68 54,89 7,02 33,46 13,08 Tabela 5.48: Estatísticas descritivas dos resíduos (ARC) – out-of-sample 5,47 5,15 5,86 Curtose As estatísticas MSE, RMSE, MAE e MAPE do tipo ARC de previsão indicam que os modelos que não conseguiram controlar os erros neste período. Os resultados estão muito ruins, a exceção do modelo 11. A Tabela 5.49 apresenta os resultados. Modelo MSE RMSE MAE MAPE 1 2 3 4 5 6 7 8 SE 2086,47 23,52 2,0E+05 3,73 1,47E+05 117,41 178,03 2,64 S 1562,00 4,87 2,0E+05 5,22 1,40E+05 117,89 177,38 2,68 NE 1426,12 21,03 5,0E+06 3,54 1,58E+05 111,55 193,81 2,52 N 540,12 22,42 5,0E+06 3,75 1,58E+05 110,83 192,58 SE 45,68 4,85 450,32 1,93 383,22 10,84 13,34 9 10 11 12 13 6,60 2,41 0,73 2,16 1,75 5,70 2,60 0,66 1,86 1,47 7,50 2,76 0,82 2,39 1,96 2,11 6,94 2,44 0,60 2,22 2,04 1,62 2,57 1,55 0,85 1,47 1,32 S 39,52 2,21 456,84 2,28 374,74 10,86 13,32 1,64 2,39 1,61 0,81 1,36 1,21 NE 37,76 4,59 2244,44 1,88 397,90 10,56 13,92 1,59 2,74 1,66 0,91 1,55 1,40 N 23,24 4,74 2244,10 1,94 397,90 10,53 13,88 1,45 2,64 1,56 0,78 1,49 1,43 SE 15,09 1,52 122,79 0,96 56,58 2,50 2,95 0,96 1,08 0,91 0,56 1,00 0,87 S 13,45 0,89 122,74 1,01 55,41 2,49 2,95 0,93 0,99 0,85 0,51 0,91 0,79 NE 12,53 1,65 520,23 0,92 58,65 2,48 3,03 0,99 1,18 0,94 0,57 1,04 0,91 N 8,35 1,64 519,79 1,00 58,64 2,38 2,95 0,92 1,04 0,87 0,51 1,02 0,92 SE 414,13 38,51 2734,77 23,24 1367,63 59,19 70,95 23,24 25,97 21,78 13,95 24,26 21,04 S 321,58 21,32 2719,51 24,09 1330,03 58,25 70,64 21,61 23,07 19,79 12,15 21,14 18,44 NE 377,17 42,59 1,1E+04 23,89 1456,20 70,02 75,90 25,57 30,09 24,17 15,32 26,47 23,57 N 237,54 48,65 1,8E+04 27,42 1464,43 71,43 77,62 26,04 26,98 23,28 Tabela 5.49: Estatísticas de erro dos modelos (ARC) – out-of-sample 14,77 28,02 25,06 Verificou-se a normalidade na versão multivariada do teste dos resíduos no período out-of-sample, mostrados na Tabela 5.50. Todos os modelos não rejeitaram a hipótese de normalidade. 110 Modelo My÷y M~ 5% p-valor 1 2 3 4 5 6 7 8 9 10 11 12 13 0,52 0,43 0,04 1,77 0,54 0,15 0,47 0,00 0,27 0,47 0,13 0,03 0,02 7,81 7,81 7,81 7,81 7,81 7,81 7,81 7,81 7,81 7,81 7,81 7,81 7,81 0,92 0,93 1,00 0,62 0,91 0,99 0,92 1,00 0,97 0,93 0,99 1,00 1,00 Tabela 5.50: Testes de normalidade dos resíduos (ARC) – out-of-sample Depois de analisar todos esses resultado, desde o número de parâmetros em cada modelo, os Critérios de Informação, as estatísticas dos resíduos in-sample e out-of-sample dos três tipos de previsão, o modelo que apresentou melhor ajuste aos dados de Vazão de rios foi o modelo 12. Este modelo foi, então, o selecionado para representar o STVAR-Tree no confronto com a modelagem Neuro-Fuzzy. A Figura 5.12 ilustra a árvore estimada pelo modelo 12, identificando o valor estimado pelo parâmetro de suavidade e de locação , além da variável de transição ^hçk N. Figura 5.12: Árvore estimada do modelo 12 A interpretação da árvore é feita da seguinte maneira: para estimar as séries de Preço spot, o modelo STVAR-Tree mais adequado sugere uma árvore com dois regimes, com uma transição bruta æ = 34,07 determinada pela primeira defasagem do preço spot do sub-mercado Nordeste. O ponto de corte desta variável de transição ocorre no valor = 2,94. Portanto, para Preço spot do Nordeste (logaritmo) com valores menores que 2,94, as séries de Preço spot dos quatro sub-mercados são estimadas pelo Regime 1, com 40% de pertinência. Para Preço spot do Nordeste (logaritmo) com valores maiores ou iguais 2,94 as séries de Preço spot dos quatro sub-mercados são estimadas pelo Regime 2, com 60% de pertinência. 111 5.2.2.3. Neuro-Fuzzy O emprego de um sistema Neuro-Fuzzy permitiu que o processo de escolha de “variáveis explicativas” e seus pesos relativos fossem encontrados de maneira automática, sem a necessidade de decisões empíricas e arbitrárias, baseadas no conhecimento ou experiência de especialistas. Para a estimação dos parâmetros da modelagem Neuro-Fuzzy utilizou-se Sistema Adaptativo de Inferência NeuroFuzzy (ANFIS), tendo como saída as séries de Preço spot de cada um dos submercados (SE, S, NE e N), um por vez, e as estradas foram as defasagens destas séries acrescidas das defasagens das séries de ENA e EARM, dos respectivos submercados. Definiu-se uma estratégia de seleção para estimar automaticamente toda a combinação possível de modelos levando-se em consideração o número de defasagens e o número de variáveis explicativas. No caso em questão, temos três variáveis (Preço, ENA e EARM). A Tabela 5.51 mostra as variáveis, para cada sub-mercado, de acordo com a ordem da defasagem estipulada. Ordem da defasagem Variáveis 1 Preço(t-1) ENA(t-1) EARM(t-1) 2 Preço(t-1) ENA(t-1) EARM(t-1) 3 Preço(t-1) Preço(t-2) ENA(t-2) EARM(t-2) ENA(t-1) EARM(t-1) Preço(t-2) ENA(t-2) EARM(t-2) Preço(t-3) ENA(t-3) Tabela 5.51: Variáveis disponíveis de acordo com a ordem da defasagem EARM(t-3) Quando estipulamos o número máximo de defasagens igual a dois, temos então um total de 63 combinações, sendo 6 modelos com uma variável de entrada, 15 com duas variáveis, 20 com três variáveis, 15 com quatro variáveis, 6 com cinco variáveis e, finalmente, 1 com seis variáveis de entrada. Neste último caso, entram no modelo todas as variáveis com defasagens t-1 e t-2. Cabe aqui uma ressalva importante, pois quando o número máximo de defasagens é maior que 2, o número de modelos a ser estimado é muito grande. Por exemplo, para d=3 o total de modelos estimados será 511, o que eleva (e muito) o tempo de execução do programa, particularmente quando o número de variáveis de entrada de um modelo é superior a seis. Os dados de entrada foram linearmente normalizados, de modo a pertencer ao intervalo [-1,1]. O método utilizado é denominado Max-Min, dado por: 112 |_lk^ÅjÆc*jXk = | − Åcl| Åj| | − Åcl| (5.10) Os 80% iniciais do banco de dados foi utilizado para “treinar” os modelos neuro-fuzzy (estimar os parâmetros do sistema) e os 20% restantes para validar as previsões a partir dos modelos. Definiu-se os seguintes parâmetros para o sistema ANFIS: 1) 2) 3) 4) 100 épocas para o treinamento da rede; Erro de aprendizado de 0,1%; 2 MF (membership functions); Função de pertinência em formato de sino; Uma análise dos resíduos foi feita para a escolha dos modelos mais adequados, em cada sub-mercado. Em geral, dentre os 63 modelos estimados, adotou-se que o melhor modelo era aquele com o menor MAPE no conjunto de validação. A Tabela 5.52 identifica os modelos mais adequados para cada submercado. O modelo para o Sudeste teve como variáveis de entrada, Preçot-1 e ENAt-1. Para Sul e Norte, somente a variável Preçot-1 foi utilizada como entrada. E, por fim, para o Nordeste, as variáveis de entrada selecionadas foram Preçot-1 e EARMt-1. Sub-mercado Preçot-1 ENAt-1 SE x x S x NE x N EARMt-1 Preçot-2 ENAt-2 EARMt-2 x x Tabela 5.52: Modelos selecionados pela modelagem Neuro-Fuzzy A Tabela 5.53 mostra as estatísticas MSE, RMSE, MAE e MAPE, de cada um dos sub-mercados nos períodos in-sample e out-of-sample. In-sample Out-of-sample MSE RMSE MAE MAPE MSE RMSE MAE MAPE SE 0,05 0,22 0,14 4,52 0,09 S 0,14 0,38 0,24 8,08 0,09 0,3 0,2 4,34 0,3 0,25 5,27 NE 0,17 0,41 0,26 9,23 0,4 0,63 0,57 11,92 N 0,11 0,31 6,7 0,34 0,2 7,18 0,18 0,42 Tabela 5.53: Estatísticas de erro dos modelos– in-sample e out-of-sample 113 5.2.2.4. Neuro-Fuzzy Estatisticamente, os modelos STVAR-Tree e Neuro-Fuzzy foram comparados pelas medidas de MAPE no período out-of-sample, apresentadas na Tabela 5.54. Conclui-se que, em geral, a modelagem STVAR-Tree não teve um ajuste superior ao ajuste da modelagem Neuro-Fuzzy. Entretanto, duas das três estratégias de previsão do STVAR-Tree, RC e ARC, apresentaram MAPE melhores para o sub-mercado Nordeste. Out-of-sample STVAR-Tree RC STVAR-Tree MM STVAR-Tree ARC NeuroFuzzy SE 9,72 9,97 24,26 4,34 S 8,20 7,82 21,14 5,27 10,05 10,08 26,47 11,92 NE N 12,12 12,56 28,02 Tabela 5.54: Comparação dos modelos STVAR-Tree e Neuro-Fuzzy 6,70 Este resultado mostra que o modelo não-linear multivariado denominado STVAR-Tree é capaz de ser aplicado a problemas reais e que pode competir com modelos já existentes. 114 6 Conclusão Nesta dissertação foi considerada uma nova formulação de modelo nãolinear multivariado, o qual combina o modelo não-linear STVAR (Smooth Transition Vector Autoregressive) com a metodologia CART (Classification and Regression Tree). O modelo resultante é denominado STVAR-Tree e tem como base o conceito de múltiplos regimes, definidos por uma árvore binária A especificação do modelo é feita através de testes de hipóteses LM (Lagrange Multiplier). Desta forma, o crescimento da árvore é condicionado à existência de não-linearidade nas séries modeladas. Para cada divisão, são estimados os parâmetros lineares, por Mínimos Quadrados Multivariados, e os parâmetros não-lineares, por Mínimos Quadrados Não-Lineares. No momento em que o teste LM rejeita a hipótese de nãolinearidade (e divisão de todos os nós) na profundidade em que a árvore se encontra, o procedimento de crescimento da árvore é finalizado e o modelo estimado é o modelo final. Como forma de avaliação do modelo STVAR-Tree proposto nesta dissertação, foram realizados diversos experimentos de Monte Carlo com o objetivo de constatar a funcionalidade tanto do teste LM quanto da estimação do modelo STVAR-Tree. Quanto à avaliação do teste LM conclui-se que o teste acusa problemas na identificação de não-linearidade para amostras de tamanho pequeno, o que indica uma tendência para a aceitação da linearidade. Por isso, quanto maior o tamanho da amostra, maior o poder do teste LM, independente do nível de significância e de valores dos parâmetros não-lineares. Em relação à funcionalidade do modelo STVAR-Tree conclui-se que, para amostras pequenas, a tendência é subestimar os parâmetros lineares, independente do nível de significância do teste LM. Para amostras médias e grandes, o modelo STVAR-Tree estima corretamente os parâmetros. Mas apesar de amostras pequenas subestimarem os parâmetros, como resultado final da estimação, os 115 modelos conseguem capturar toda a estrutura e ajustar valores próximos aos valores observados. Na estimação dos parâmetros não-lineares constatou-se que, para valores de γ_nominal muito baixos, o modelo STVAR-Tree superestima este parâmetro, independente do tamanho da amostra e do nível de significância. Conforme aumentamos o valor de γ_nominal, o modelo melhora as estimativas de æ, com destaque para amostras grandes. O modelo STVAR-Tree não apresenta problemas para estimar o parâmetro de locação c. Após a realização dos experimentos de Monte Carlo, o modelo STVARTree foi aplicado às séries brasileiras de Vazão de Rios e às séries de Preço Spot de energia elétrica do mercado brasileiro. Com a finalidade de evitar a estimação de árvores complexas e também de reduzir o tempo computacional, limitou-se árvores com no máximo 8 folhas (nós terminais). No primeiro estudo, constatou-se, estatisticamente, que o modelo STVARTree comparado ao modelo PAR(p) através das medidas de MAPE no período out-of-sample, teve um ajuste muito superior. Duas das três estratégias de previsão do STVAR-Tree, RC e ARC, apresentaram MAPE muito melhores. No segundo estudo, conclui-se que, em geral, a modelagem STVAR-Tree não teve um ajuste superior ao ajuste da modelagem Neuro-Fuzzy. Entretanto, duas das três estratégias de previsão do STVAR-Tree, RC e ARC, apresentaram MAPE melhores para o sub-mercado Nordeste. Estes resultados das duas aplicações mostram que o modelo não-linear multivariado denominado STVAR-Tree é capaz de ser aplicado a problemas reais e que pode competir com modelos já existentes, lineares ou não-lineares. No primeiro caso, o modelo STVAR-Tree ganhou do modelo PAR(p) com uma vantagem bastante expressiva. E no segundo, o modelo STVAR-Tree ganhou da modelagem Neuro-Fuzzy em uma das quatro séries. Como trabalho futuro fica a recomendação da extensão dos modelos nãolineares multivariados. E isto pode ser feito a partir da detecção da presença de um vetor de co-integração num sistema. Então, ao invés de estimar o modelo STVAR-Tree, deve-se desenvolver e estimar um modelo, o qual pode ser denominado STVEC-Tree. 116 Referências Bibliográficas [1] AKAIKE, H. A new look at the statistical model identification. IEEE Transactions on Automatic Control 19 (6): 716–723, 1974. [2] ALTISSIMO F, CORRADI V. Bounds for inference with nuisance parameters present only under the alternative. Econometrics Journal 5: 494–519, 2002. [3] BALKE, N.; FOMBY; T. Threshold cointegration. International Economic Review 38, 627–645, 1997. [4] BOX, G.; JENKINS, C.; REISEL, G. Time series analysis: Forecasting and control. Englewood Cliffs: Prentice Hall, 1994. [5] BREIMAN, L.; FRIEDMAN, J.; OLSHEN, R.; STONE, C. J. Classification and Regression Trees. Belmont Wadsworth Int. Group, New York, 1984. [6] CAMACHO, M. Vector Smooth Transition Regression Models for US GDP and the Composite Index of Leading Indicators. Journal of Forecasting 23: 173-196, 2004. [7] CHAN, K.; TONG, H. On estimating thresholds in autoregressive models. Journal of Time Series Analysis, 7, 179–190, 1986. [8] CLEMENTS, M.; KROLZIG, H. A comparison of the forecast performance of Markov-switching and threshold autoregressive models of US GNP. Econometrics Journal 1, C47–C75, 1998. [9] COSTA, F. et al. Modelagem Estocástica de Previsão de Vazões Mensais: PREVIVAZM, XV Simpósio Brasileiro de Recursos Hídricos, Curitiba, PR, Brasil, 2003. [10] EIRTHEIM, O., TERÄSVIRTA, T. Testing the adequacy of smooth transition autoregressive models. Journal of Econometrics, Vol. 74, pp. 59-76, 1996 117 [11] ENGLE, R.; GRANGER C. Co-Integration and Error Correction: Representation, Estimation, and Testing. Econometrica, Vol. 55, No 2, pp. 251-276, 1987. [12] EPPRECHT, C. Modelos de Transição Suave para Média e Volatilidade Realizada Aplicados à Previsão de Retornos e Negociação Automática. 132p. Dissertação de Mestrado, PUC-Rio, Departamento de Engenharia Elétrica, Rio de Janeiro, 2008. [13] FRANSES, P.; TERÄSVIRTA, T. Introduction to the special issue: nonlinear modeling of multivariate macroeconomic relations. Macroeconomic Dynamics, vol 5, 461-465, 2001. [14] GALVÃO, A. Structural Break Threshold VARs for Predicting US Recessions Using the Spread. Journal of Applied Econometrics 21: 463– 487, 2006. [15] GODFREY, L. G. Misspecification Tests in Econometrics: the Lagrange Multiplier Principle and Other Approaches. Cambridge University Press, 1988. [16] GRANGER, C. Some Properties of Time Series Data and Their Use in Econometric Model Specification. Journal of Econometrics, 121-130, 1981. [17] GRANGER, C.; TERÄSVIRTA, T. Modelling Nonlinear Economic Relationships. Oxford University Press, Oxford, 1993. [18] HAMILTON, J. Time Series Analysis. Princeton University Press, Princeton, 1994. [19] HANSEN, B. Testing linearity. Journal of Economic Surveys 13, 551– 576, 1999. [20] HILLEBRAND, E.; MEDEIROS, M. Forecasting realized volatility models: the benefits of bagging and nonlinear specifications. Texto para Discussão do Dept. de Economia, PUC-Rio, 2007. [21] HIPEL, K.; MCLOAD, A. Time Series Modelling of Water Resources and Environmental Systems. Elsevier Science, 1994. [22] HORNIK, K.; (feedforward) STINCHOMBE, networks Networks, 2, 359–366, 1989. are M.; WHITE, universal H.. Multi-layer approximators. Neural 118 [23] HUANG; CHEN; CAMACHO. Determinants of Japanese Yen Interest Rate Swap Spreads: Evidence from a Smooth Transition Vector Autoregressive Model. Journal of Futures Markets (28), No.1, pp 82107, 2008. [24] JOHANSEN, S. Statistical analysis of cointegrating vectors. Journal of Economic Dynamics and Control, Vol. 12, pp. 231-254, 1988. [25] KASUYA, M. Regime-switching approach to monetary policy effects. Applied Economics, Volume 37, Issue 3, pages 307 – 326, 2005. [26] KAVKLER; BÖHM, BORSIC. Smooth, Transition vector errorcorrection (STVEC) models: An application to real exchange rates. [27] KAVKLER; MIKEK; BÖHM, BORSIC, Nonlinear econometric models: The smooth transition regression approach. [28] KOOP, G.; PESARAN M.; POTTER, S. Impulse response analysis in nonlinear multivariate models. Journal of Econometrics, vol74; 119-147, 1996. [29] LEKKOS, I., MILAS, C.; PANAGIOTIDIS T. Forecasting interest rate swap spreads using domestic and international risk factors: evidence from linear and non-linear models. Journal of Forecasting, Forthcoming, 2006. [30] LEWIS, P.; STEVENS, J. Nonlinear modeling of time series using multivariate adaptative regression splines. Journal of the American Statistical Association, 86, 864–877, 1991. [31] LÜTKEPOHL, H. New Introduction to Multiple Time Series Analysis. Springer, New York, 2005. [32] LUUKKONEN, R; SAIKKONEN, P; TERÄSVIRTA, T. Testing linearity against smooth transition autoregressive models. Biometrika 75, 491-499, 1988. [33] LO, M.; ZIVOT, E. Threshold Cointegration and Nonlinear Adjustment to the Law of One Price. Macroeconomic Dynamics, Volume 5, Issue 04, pp 533-576, 2001. [34] MACEIRA, M.; TERRY, L. et al. Chain of Optimization Models for Setting the Energy Dispatch and Spot Price in the Brazilian System. IEEE Power System Computation Conference, Servilla, Session 43, p. 1-7, 2002. 119 [35] MCALEER, M.; MEDEIROS, M. Realized volatility: a review. Econometric Reviews, 27, 10-45, 2008. [36] MEDEIROS, M. C., VEIGA, A. A flexible coefficient smooth transition time series model. IEEE Transactions on Neural Networks, 16, 97-113, 2005. [37] MEDEIROS, M. C., VEIGA, A. Modeling multiple regimes in financial volatility with a flexible coefficient GARCH model. Econometric Theory, to appear, 2008. [38] MEDEIROS, M.; VEIGA, A. A hybrid linear-neural model for time series forecasting. IEEE Transactions on Neural Networks, 11, 1402– 1412, 2000. [39] MEDEIROS, M.; VEIGA, A. Diagnostic checking in a flexible nonlinear time series model. Journal of Time Series Analysis, 24, 461–482, 2003. [40] MEDEIROS, M.; VEIGA, A.; PEDREIRA, E. Modeling Exchange rates: smooth transition, neural networks, and linear models. IEEE Transactions on Neural Networks, 12, 755-764, 2001. [41] RIPATTI A.; SAIKKONEN, P. Vector Autoregressive Processes with Nonlinear Time Trends in Cointegrating Relations. Macroeconomic Dynamics, Volume 5, Issue 04, pp 577-597, 2001. [42] ROSA, J. Modelos de Regressão com Transição Suave Estruturados por Árvores. 157p. Tese de Doutorado, PUC-Rio, Departamento de Engenharia Elétrica, Rio de Janeiro, 2005. [43] ROSA J., VEIGA, A., MEDEIROS, M. Tree structured smooth transition regression models. Computational Statistics and Data Analysis, 52, 2469-2488, 2008. [44] ROSA, J., RAMOS, G., VEIGA, A. Application of STAR-Tree Model to Brazilian Stock Market Time Series. Working Paper do DEE, PUC-Rio, Apr 2005. [45] ROSENBLAT, F. A comparison of several perceptron models. In: Books, S., editor, SELF-ORGANIZING SYSTEMS, volume 1. Spartan Books, Washington D.C., 1962. [46] ROTHMAN, P.; van DIJK, D; FRANSES, P. A Multivariate STAR Analysis of the Relationship Between Money and Output. 120 Macroeconomic Dynamics 5, 506-532, 2001. [47] ROTHMAN, P.; MILAS, C. Multivariate STAR unemployment rate forecasts. Econometrics, num 0502010, 2005. [48] SALAS, J.; DELLEUR, J.; YEVJEVICH, V.; LANE, W. Applied modelling of hydrologic time series. Water Resources Publications, 484p, 1980. [49] SCHWARZ, G. Estimating the dimension of a model. Annals of Statistics 6 (2): 461–464, 1978. [50] SEO, B. Testing for Nonlinear Adjustment in Smooth Transition Vector Error Correction Models. Econometric Society Far Eastern Meetings, No. 749, 2004. [51] SIMS, C. Macroeconomics and reality. Econometrica, V.48, N0.1, 1-48, 1980. [52] SKALIN, J.; TERÄSVIRTA, T. Modeling Asymmetries and Moving Equilibrium in Unemployment Rates. Macroeconomic Dynamics 6, 202-241, 2002. [53] SRIPINIT, T. Asymmetric Monetary Policy Responses in the US Economy: Smooth Transition Vector Autoregressive. Working paper, 2008. [54] TAYLOR, S. Modelling Financial Time Series. John Wiley, Chichester, UK, 1986. [55] TERÄSVIRTA, T. Specification, estimation, and evaluation of smooth transition autoregressive models. Journal of the American Statistical Association, 89, 208-218, 1994. [56] TONG, H. Non-linear Time Series: A Dynamical System Approach. Oxford University Press, 1990. [57] TONG, H. On a threshold model. In: Chen, C, H., editor, In Patern Recognition and Signal Processing, volume 5. Sijhoff Noordhoff, Amsterdam, 1978. [58] TONG, H. Threshold models in non-linear time series analysis: lecture notes in statistics 21. Berlin: Springer-Verlag, 1983. [59] TONG, H.; LIM, K. Threshold autoregressions, limit cycles, and data, Journal of the Royal Statistical Society B 42, 245-92, 1980. [60] TSAY, R. Testing and modeling threshold autoregressive processes. 121 Journal of the American Statistical Association, 84, 231-240, 1989. [61] TSAY, R. Testing and modeling multivariate threshold models. Journal of the American Statistical Association 93, 1188-1202, 1998. [62] VAN DIJK, D.; FRANSES, P. Modelling multiple regimes in the business cycle. Macroeconomic Dynamics, 3:311–340, 1999. [63] VAN DIJK, D.; T.TERÄSVIRTA; FRANSES, P.. Smooth transition autoregressive models - A survey of recent developments. Econometric Reviews, 21, 1-47, 2002. [64] VAN DIJK, D. Smooth Transition Models: Extensions and Outlier Robust Inference. Tinberg Institute: Amsterdam, 2001. [65] WEISE, C. The asymmetric effects of monetary policy: a nonlinear vector autoregression Approach. Journal of Money, Credit, and Banking 31, 85-108, 1999. [66] ZADEH, L. Fuzzy sets. Information and Control, 8, 338–353, 1965.