Alexandre José dos Santos
Modelos Vetoriais Auto-Regressivos com Transição
Suave Estruturados por Árvores – STVAR-Tree
Dissertação de Mestrado
Dissertação apresentada como requisito parcial para
obtenção do título de Mestre pelo Programa de PósGraduação em Engenharia Elétrica da PUC-Rio.
Orientador: Prof. Álvaro de Lima Veiga Filho
Rio de Janeiro
Setembro de 2009
Alexandre José dos Santos
Modelos Vetoriais Auto-Regressivos com Transição
Suave Estruturados por Árvores – STVAR-Tree
Dissertação apresentada como requisito parcial para
obtenção do título de Mestre pelo Programa de PósGraduação em Engenharia Elétrica da PUC-Rio.
Aprovada pela Comissão Examinadora abaixo assinada.
Prof. Álvaro de Lima Veiga Filho
Orientador
Departamento de Engenharia Elétrica
PUC-Rio
Prof. Reinaldo Castro Souza
Departamento de Engenharia Elétrica
PUC-Rio
Prof. Joel Maurício Corrêa da Rosa
Departamento de Estatística
UFF
Prof. José Eugenio Leal
Coordenador Setorial do Centro Técnico Científico
PUC-Rio
Rio de Janeiro, 11 de setembro de 2009
Todos os direitos reservados. É proibida a reprodução total
ou parcial do trabalho sem autorização da universidade, do
autor e do orientador.
Alexandre José dos Santos
Graduou-se em Ciências Estatísticas na Escola Nacional de
Ciências Estatísticas – ENCE (Rio de Janeiro, Brasil).
Durante o mestrado, trabalhou com modelos estatísticos
lineares e não-lineares, tanto univariados quanto
multivariados e, ainda, com modelagem de inteligência
artificial, todos com aplicações no mercado brasileiro de
energia elétrica.
Ficha Catalográfica
Santos, Alexandre José dos
Modelos
Vetoriais
Auto-Regressivos
com
Transição Suave Estruturados por Árvores – STVAR-Tree /
Alexandre José dos Santos ; orientador: Álvaro de Lima
Veiga Filho. – 2009.
121 f. : il. ; 30 cm
Dissertação (Mestrado em Engenharia Elétrica)–
Pontifícia Universidade Católica do Rio de Janeiro, Rio de
Janeiro, 2009.
Inclui bibliografia
1. Engenharia elétrica – Teses. 2. Modelos nãolineares multivariados. 3. Árvore de regressão. 4. STVARTree. 5. Teste LM. 6. Vasão de rios. 7. Preço spot. I. Veiga
Filho, Álvaro de Lima. II. Pontifícia Universidade Católica
do Rio de Janeiro. Departamento de Engenharia Elétrica.
III. Título.
CDD: 621.3
Agradecimentos
A Deus, em primeiro lugar, pelo dom da vida.
Ao professor Álvaro Veiga, pela orientação, incentivo e amizade.
À PUC-Rio, pela estrutura e auxílio, imprescindíveis para a realização deste
trabalho.
À CAPES, pelo suporte financeiro.
Aos professores do Departamento de Engenharia Elétrica, pela contribuição a
minha formação, em especial aos professores Álvaro Veiga, Cristiano Fernandes e
Reinaldo Souza.
Aos colegas do Departamento de Engenharia Elétrica, que estiveram disponíveis
para ajudar em todos os momentos.
Aos meus pais, pelo amor incondicional e por não terem medido esforços para me
propiciar a melhor formação possível.
A minha irmã e ao meu sobrinho, pelo amor, companhia, incentivo e confiança.
Aos meus amigos, que estiveram presentes ao longo destes anos, pelo apoio,
compreensão e perdão por não ter outro assunto, que não o mestrado e, no final, a
dissertação.
Resumo
Santos, Alexandre; Veiga, Álvaro. Modelos Vetoriais Auto-Regressivos
com Transição Suave Estruturados por Árvores – STVAR-Tree. Rio de
Janeiro, 2009. 121p. Dissertação de Mestrado - Departamento de
Engenharia Elétrica, Pontifícia Universidade Católica do Rio de Janeiro.
Esta dissertação tem como objetivo principal introduzir uma formulação de
modelo não-linear multivariado, a qual combina o modelo STVAR (Smooth
Transition Vector Autoregressive) com a metodologia CART (Classification and
Regression Tree) a fim de utilizá-lo para geração de cenários e de previsões. O
modelo resultante é um Modelo Vetorial Auto-Regressivo com Transição Suave
Estruturado por Árvores, denominado STVAR-Tree e tem como base o conceito
de múltiplos regimes, definidos por árvore binária. A especificação do modelo é
feita através do teste LM. Desta forma, o crescimento da árvore é condicionado à
existência de não-linearidade nas séries, que aponta a divisão do nó e a variável de
transição correspondente. Em cada divisão, são estimados os parâmetros lineares,
por Mínimos Quadrados Multivariados, e os parâmetros não-lineares, por
Mínimos Quadrados Não-Lineares. Como forma de avaliação do modelo STVARTree, foram realizados diversos experimentos de Monte Carlo com o objetivo de
constatar a funcionalidade tanto do teste LM quanto da estimação do modelo.
Bons resultados foram obtidos para amostras médias e grandes. Além dos
experimentos, o modelo STVAR-Tree foi aplicado às séries brasileiras de Vazão
de Rios e Preço Spot de energia elétrica. No primeiro estudo, o modelo foi
comparado estatisticamente com o Periodic Autoregressive (PAR) e apresentou
um desempenho muito superior ao concorrente. No segundo caso, a comparação
foi com a modelagem Neuro-Fuzzy e ganhou em uma das quatro séries. Somando
os resultados dos experimentos e das duas aplicações conclui-se que o modelo
STVAR-Tree pode ser utilizado na solução de problemas reais, apresentando bom
desempenho.
Palavras-chave
Modelos Não-Lineares Multivariados; Árvore de Regressão; STVAR-Tree;
Teste LM; Vazão de Rios; Preço Spot.
Abstract
Santos, Alexandre; Veiga, Álvaro (advisor). Tree-Structure Smooth
Transition Vector Autoregressive Models – STVAR-Tree. Rio de
Janeiro, 2009. 121p. MSc. Dissertation. Departamento de Engenharia
Elétrica, Pontifícia Universidade Católica do Rio de Janeiro.
The main goal of the dissertation is to introduce a nonlinear multivariate
model, which combines the model STVAR (Smooth Transition Vector
Autoregressive) with the CART (Classification and Regression Tree) method and
use it for generating scenarios and forecasting. The resulting model is a TreeStructured Vector Autoregressive model with Smooth Transition, called STVARTree, which is based on the concept of multiple regimes, defined by binary tree.
The model specification is based on Lagrange Multiplier tests. Thus, the growth
of the tree is conditioned on the existence of nonlinearity in the time series, which
indicates the node to be split and the corresponding transition variable. In each
division, linear parameters are estimated by Multivariate Least Squares, and
nonlinear parameters by Non-Linear Least Squares. As a way of checking the
STVAR-Tree model, several Monte Carlo experiments were performed in order to
see the functionality of both the LM test and the model estimation. Best results
were obtained with medium and large samples. Besides, the STVAR-Tree model
was applied to Brazilian time series of Rivers Flow and electricity spot price. In
the first study, the model was statistically compared to the Periodic
Autoregressive (PAR) model and had a much higher performance than the
competitor. In the second case, the model comparison was with Neural-Fuzzy
Modeling and the STVAR-Tree model won in one of the four series. Adding both
the experiments and the two applications results we conclude that the STVARTree model may be applied to solve real problems, having good results.
Keywords
Multivariate Non Linear Models; Regression Tree; STVAR-Tree; LM Test;
Rivers Flow; Spot Price.
Sumário
1 Introdução
12
1.1. Vazão de Rios
14
1.2. Preço Spot de energia elétrica
16
1.3. Organização da dissertação
17
2 Modelos Lineares Multivariados
18
2.1. Introdução
18
2.2. Modelo VAR
19
2.3. Modelo VEC
25
3 Modelos Não-Lineares
29
3.1. Modelos Não-Lineares Univariados
29
3.2. Modelos Não-Lineares Multivariados
35
3.3. Metodologia CART
47
4 Metodologia
52
4.1. Introdução
52
4.2. Modelo STVAR-Tree
52
4.3. Modelo PAR
62
4.4. Sistema Neuro-Fuzzy
63
4.5. ANFIS: Adaptive Neuro-Fuzzy Inference System
(Sistema Adaptativo de Inferência Neuro-Fuzzy)
63
5 Experimentos e Aplicações
66
5.1. Experimentos de Monte Carlo
66
5.2. Aplicações a dados reais
78
6 Conclusão
114
Referências Bibliográficas
116
Lista de figuras
Gráfico 2.1: Séries temporais bivariadas co-integradas
26
Gráfico 3.1: Função logística com parâmetros fixos
32
Figura 3.1: Exemplo de árvore com ausência de alguns nós
49
Figura 3.2: Exemplo de um modelo gerado por uma
árvore de regressão
50
Figura 4.1: Arquitetura ANFIS equivalente
64
Figura 4.2: Arquitetura ANFIS para o modelo Sugeno
65
Figura 5.1: Arquitetura STVAR-Tree simulada
68
simulado, com = 0,1%
75
simulado, com = 1%
76
simulado, com = 5%
77
simulado, com = 10%
Figura 5.6: Mediana de Φi, i = 1,2 do modelo STVAR-Tree
77
simulado, com = 15%
78
Figura 5.7: Árvore estimada do modelo 7
94
Figura 5.8: FAC e FACP do logaritmo de ENA Sudeste
95
Figura 5.9: FAC e FACP do logaritmo de ENA Sul
95
Figura 5.10: FAC e FACP do logaritmo de ENA Nordeste
95
Figura 5.11: FAC e FACP do logaritmo de ENA Norte
95
Figura 5.2: Mediana de Φi, i = 1,2 do modelo STVAR-Tree
Figura 5.3: Mediana de Φi, i = 1,2 do modelo STVAR-Tree
Figura 5.4: Mediana de Φi, i = 1,2 do modelo STVAR-Tree
Figura 5.5: Mediana de Φi, i = 1,2 do modelo STVAR-Tree
Figura 5.12: Árvore estimada do modelo 12
110
Lista de tabelas
Tabela 5.1: Probabilidades em um teste de hipóteses
66
Tabela 5.2: Experimento Monte Carlo – Simulação de um
VAR
67
Tabela 5.3: Experimento Monte Carlo – Simulação de um
STVAR-Tree
69
Tabela 5.4: Experimento Monte Carlo – Estimação dos
parâmetros lineares
71
Tabela 5.5: Experimento Monte Carlo – Estimação da diagonal
principal da matriz de covariâncias dos erros, Σε
71
parâmetros não-lineares e 73
Tabela 5.6: Experimento Monte Carlo – Estimação dos
Tabela 5.7: Experimento Monte Carlo – Estimação da diagonal
da matriz de covariâncias dos erros, 75
Tabela 5.8: Divisão dos dados
79
Tabela 5.9: Estatísticas Descritivas das séries de ENA
79
Tabela 5.10: Estatísticas Descritivas do logaritmo natural
das séries de ENA
80
Tabela 5.11: Matriz de Correlação do logaritmo natural
das séries de ENA
81
Tabela 5.12: Teste Estatístico ADF para o logaritmo das
séries de ENA
82
Tabela 5.13: Número de nós terminais e de parâmetros
dos modelos estimados
83
Tabela 5.14: Critérios de Informação
84
Tabela 5.15: Estatísticas descritivas dos resíduos – in-sample
85
Tabela 5.16: Estatísticas de erro dos modelos – in-sample
86
Tabela 5.17: Testes de normalidade dos resíduos – in-sample
87
Tabela 5.18: Estatísticas descritivas dos resíduos (RC) –
out-of-sample
Tabela 5.19: Estatísticas de erro dos modelos (RC) –
88
out-of-sample
89
Tabela 5.20: Testes de normalidade dos resíduos (RC) –
out-of-sample
89
Tabela 5.21: Estatísticas descritivas dos resíduos –
out-of-sample
90
Tabela 5.22: Estatísticas de erro dos modelos (MM) –
out-of-sample
90
Tabela 5.23: Testes de normalidade dos resíduos (MM) –
out-of-sample
91
Tabela 5.24: Estatísticas descritivas dos resíduos (ARC) –
out-of-sample
92
Tabela 5.25: Estatísticas de erro dos modelos (ARC) –
out-of-sample
92
Tabela 5.26: Testes de normalidade dos resíduos (ARC) –
out-of-sample
93
Tabela 5.27: Modelos PAR(p) para cada um dos sub-mercados
96
Tabela 5.28: Estimativa dos parâmetros dos modelos PAR(p)
96
Tabela 5.29: Estatísticas Descritivas das séries de resíduos
96
Tabela 5.30: Comparação dos modelos STVAR-Tree e PAR(p)
97
Tabela 5.31: Divisão dos dados
97
Tabela 5.32: Estatísticas Descritivas das séries de Preço spot
98
Tabela 5.33: Estatísticas Descritivas do logaritmo natural
das séries de Preço spot
99
Tabela 5.34: Matriz de Correlação do logaritmo natural
das séries de Preço spot
99
Tabela 5.35: Teste Estatístico ADF
100
Tabela 5.36: Teste Co-integração de Johansen
101
Tabela 5.37: Número de nós terminais e de parâmetros
dos modelos estimados
102
Tabela 5.38: Critérios de Informação
103
Tabela 5.39: Estatísticas descritivas dos resíduos – in-sample
103
Tabela 5.40: Estatísticas de erro dos modelos – in-sample
104
Tabela 5.41: Teste de normalidade dos resíduos – in-sample
104
Tabela 5.42: Estatísticas descritivas dos resíduos (RC) –
out-of-sample
105
Tabela 5.43: Estatísticas de erro dos modelos (RC) –
out-of-sample
106
Tabela 5.44: Testes de normalidade dos resíduos (RC) –
out-of-sample
106
Tabela 5.45: Estatísticas descritivas dos resíduos (MM) –
out-of-sample
107
Tabela 5.46: Estatísticas de erro dos modelos (MM) –
out-of-sample
108
Tabela 5.47: Testes de normalidade dos resíduos (MM) –
out-of-sample
108
Tabela 5.48: Estatísticas descritivas dos resíduos (ARC) –
out-of-sample
109
Tabela 5.49: Estatísticas de erro dos modelos (ARC) –
out-of-sample
109
Tabela 5.50: Testes de normalidade dos resíduos (ARC) –
out-of-sample
110
Tabela 5.51: Variáveis disponíveis de acordo com a ordem
da defasagem
111
Tabela 5.52: Modelos selecionados pela modelagem
Neuro-Fuzzy
112
Tabela 5.53: Estatísticas de erro dos modelos – in-sample e
out-of-sample
112
Tabela 5.54: Comparação dos modelos STVAR-Tree e
Neuro-Fuzzy
113
12
1
Introdução
Recentemente, muitos modelos estatísticos para análise e previsão de séries
temporais têm sido propostos na literatura. Os modelos mais famosos e que
ganharam mais destaque nas pesquisas científicas pertencem ao grupo dos
modelos estatísticos lineares. A razão dessa popularidade vem do fato destes
modelos tratarem dados homocedásticos, estacionários e Gaussianos (Box,
Jenkins e Reisel, 1994). Os modelos lineares possuem características vantajosas e
importantes, tais como, fácil interpretação, cálculos de intervalo de confiança,
resultados assintóticos, entre outras.
Muito embora essas características possuam vantagens, a natureza é
intrinsecamente não-linear e muitos fenômenos podem não ser capturados pelos
modelos lineares. Com essa motivação, nos últimos anos, muitos modelos
estatísticos não-lineares vêm sendo propostos. Alguns deles são da classe de
modelos STAR (Smooth Transition Autoregressive), com aplicações em séries
temporais econométricas.
Tong (1978) propôs o modelo TAR (Threshold Autoregressive), o qual tem
como idéia central a mudança dos parâmetros lineares do modelo auto-regressivo,
de acordo com o valor assumido por uma variável de transição (neste caso, uma
variável indicadora). Este modelo atribui um modelo linear diferente para distintas
regiões onde se encontram os valores dessa variável. Caso a variável de transição
seja uma defasagem da variável endógena, o modelo é, então, denominado
SETAR (Self-Exciting Threshold Autoregressive).
Uma generalização do modelo SETAR com dois regimes, incorporando
uma transição suave entre eles, foi proposta por Chan e Tong (1986). Este modelo
foi denominado modelo STAR (Smooth Threshold Autoregressive). Para uma
revisão consulte Teräsvirta (1994). Outras extensões dos modelos TAR têm sido
propostas na literatura, podendo citar o modelo MRSTAR (Multiple Regimes
Smooth Transition Autoregressive), proposto por Dijk e Franses (1999) e o
13
modelo TV-STAR (Time-Varying Smooth Transition Autoregressive), proposto
por Lundbergh e Teräsvirta (2000).
Muitos assuntos em diferentes áreas do conhecimento requerem diversas
relações para serem especificados. Por isso, tornaram-se necessárias técnicas para
lidar com aspectos não-lineares de sistemas. A maioria delas refere-se ao modelo
VAR
não-linear,
denominado
STVAR
(Smooth
Transition
Vector
Autoregressive). O modelo STVAR é a versão multivariada do modelo STAR,
assim como ocorre com os modelos lineares VAR (Vector Autoregressive) e AR
(Autoregressive). Muitas de suas aplicações foram feitas no campo da
Macroeconomia.
Os modelos STAR e STVAR podem ser vistos como modelos lineares autoregressivos, univariado e multivariado, respectivamente, onde os seus coeficientes
são determinados pela posição do vetor de variáveis explicativas dentro do
denominado espaço de transição.
É crescente, também, o uso de metodologias estruturadas por árvores de
decisão, tendo em vista uma metodologia alternativa aos tradicionais métodos de
classificação e modelos de regressão. O algoritmo CART (Classification and
Regression Tree) (Breiman et al., 1984) é considerado o principal marco na
utilização de metodologias estruturadas por árvores, cuja filosofia desta
formulação é utilizar modelos mais simples para sub-amostras dos dados,
dividindo de forma conveniente o problema em partes, através do particionamento
recursivo do espaço de variáveis de transição.
As árvores de classificação são úteis quando a variável dependente é
categórica, enquanto que as árvores de regressão devem ser utilizadas na solução
de problemas com variável dependente contínua.
O principal atrativo da metodologia CART é a interpretabilidade
proporcionada pela estrutura de árvore de decisão obtida no modelo final que,
também pode ser lido, como um conjunto de sentenças lógicas a respeito das
variáveis explanatórias.
O foco desta dissertação é uma nova formulação de modelo não-linear
multivariado, o qual combina o modelo não-linear STVAR com a metodologia
CART. O modelo resultante é denominado STVAR-Tree e sua versão univariada
é o modelo STAR-Tree, proposto por Rosa, Veiga e Medeiros (2008).
14
A modelagem STVAR-Tree tem como base o conceito de múltiplos
regimes, os quais são definidos por uma árvore binária. Desta forma, temos um
modelo não-linear paramétrico através de uma árvore de decisão. No STVARTree, os coeficientes do modelo são determinados através da combinação de
diferentes modelos auto-regressivos multivariados, que podem apresentar
variáveis exógenas no conjunto das variáveis explicativas.
A especificação do modelo é feita através de testes de hipóteses do tipo LM
(Lagrange Multiplier). Assim, o crescimento da árvore é condicionado à
existência de não-linearidade nas séries. Para cada divisão, são estimados os
parâmetros lineares e não-lineares do modelo. No momento em que o teste LM
rejeita a hipótese de não-linearidade (e divisão de todos os nós) na profundidade
em que a árvore se encontra, o procedimento de crescimento da árvore é
finalizado e tem-se, portanto, o modelo final estimado.
Como forma de avaliação do modelo STVAR-Tree proposto nesta
dissertação, foram feitos diversos experimentos de Monte Carlo.
Após as simulações, aplicou-se o modelo STVAR-Tree às séries brasileiras
de Vazão de Rios e às séries de Preço Spot de energia elétrica do mercado
brasileiro.
1.1.
Vazão de Rios
No Brasil, o sistema gerador de energia elétrica tem como base as vazões de
rios que afluem naturalmente no país. Por serem originadas das precipitações, as
vazões fluviais possuem muitas irregularidades, tornando-as inconstantes e
difíceis de prever. Por causa dessas irregularidades, o Brasil conta com usinas
termoelétricas de complementação e com reservatórios de acumulação, com o
propósito de regularizar os regimes fluviais. Então, quando as vazões fluviais são
escassas (período de seca), a água que foi armazenada durante o período de
grandes afluências naturais (período de cheia) é utilizada.
O Planejamento da Operação do Sistema Interligado (SIN), executado
atualmente no Operador Nacional do Sistema Elétrico (ONS), permite o melhor
aproveitamento das vazões naturais, evitando o desperdício de água e gastos
excessivos com combustíveis nas usinas termoelétricas. Devido a sua
15
complexidade, este planejamento é feito por etapas com base nos modelos
desenvolvidos no Centro de Pesquisas de Energia Elétrica (CEPEL). Em cada
etapa, os modelos utilizados possuem diferentes horizontes de planejamento,
discretização do tempo, e graus de detalhamento em suas representações (Maceira
et al., 2002).
Potencialmente, o sistema brasileiro de geração de energia elétrica pode
beneficiar-se em larga escala com o contínuo aprimoramento dos modelos de
previsão hidrológica.
A geração de energia elétrica futura é influenciada pelas afluências
hidrológicas futuras, quando as previsões e incertezas envolvidas devem ser
controladas no planejamento. Isto porque a qualidade das previsões hidrológicas
feitas pelos modelos afeta substancialmente o desempenho do sistema. Com isso,
os benefícios e a confiança aumentam e os custos diminuem.
O CEPEL utiliza o modelo PREVIVAZM (Costa et al., 2003) para fornecer
previsões mensais de afluências de vazão de rios para um horizonte de até 12
meses. Este modelo é uma ferramenta para estudos especiais de verificação de
condições de atendimento da demanda energética para o horizonte anual.
Outro modelo é utilizado pelo CEPEL, o modelo PREVIVAZ, para obter as
previsões de afluências semanais, num horizonte de até seis semanas. Essas
previsões são utilizadas no primeiro mês do Programa Mensal de Operação
(PMO), um planejamento de curto prazo. Este modelo é, portanto, executado ao
final de cada mês para a elaboração do PMO do mês seguinte e, durante o mês em
curso, é executado todas as semanas para a realização das revisões do PMO.
Os modelos PREVIVAZ e o PREVIVAZM para obtenção de previsões de
vazões semanais e mensais, respectivamente, utilizam diversas alternativas de
classe de modelo, ordem dos modelos, agrupamento da estrutura de autocorrelação e métodos de estimação dos parâmetros, acoplado a diferentes prétransformações das séries históricas, tipo Box-Cox ou logarítmicas (Box e Cox,
1964), ou sem transformação, e a diferentes formas de estimação de parâmetros
dos modelos. Os algoritmos de previsão destes modelos são testados por um
esquema robusto de validação cruzada e o algoritmo selecionado é aquele de
menor erro quadrático médio de previsão.
As formulações lineares de previsão de séries temporais foram classificadas
em modelos estacionários e modelos periódicos. Na classe de modelos
16
estacionários estão a média e os modelos auto-regressivos de média-móvel,
ARMA(p,q). Já na classe dos modelos periódicos estão os modelos periódicos
auto-regressivos de média-móvel, PARMA(p,q), e o caso particular PAR(p), os
quais se caracterizam por apresentar uma equação de regressão para cada período.
1.2.
Preço Spot de energia elétrica
No mercado spot de energia elétrica, toda a energia excedente dos contratos
bilaterais é comprada e vendida no Mercado Atacadista de Energia Elétrica. Estes
contratos formalizam a compra e venda de energia estabelecendo preços, prazos e
montantes de suprimento em intervalos temporais determinados pelos agentes.
O preço spot, também chamado de Preço de Liquidação das Diferenças
(PLD), é definido com base nos Custos Marginais de Operação (CMO), obtidos
por meio de uma cadeia de programas computacionais. O CMO indica quanto
custa a produção de uma unidade de energia adicional à última unidade
consumida pelo mercado.
O Centro de Pesquisas de Energia Elétrica (CEPEL), criado por iniciativa
do Ministério de Minas e Energia de empresas do setor de energia elétrica, utiliza
o software NEWAVE para planejar a operação de subsistemas hidrotérmicos
interligados em longo prazo. Este programa determina, mensalmente, metas de
geração para cada usina, de maneira a atender a demanda, minimizando o valor
esperado do custo total de operação ao longo do período de planejamento. Em
resumo, o NEWAVE é responsável por gerar o CMO, valor base para a
determinação do preço spot de energia elétrica no Brasil. Outro software utilizado
neste processo é o DECOMP, responsável por gerar valores para o preço,
semanalmente.
A Câmara Comercializadora de Energia Elétrica (CCEE) é o órgão
responsável pela determinação e publicação semanal do PLD, calculado
individualmente para cada um dos quatro sub-mercados existentes no Brasil
(Sudeste/Centro, Sul, Nordeste e Norte). Ao final do mês, após o registro e
validação de todos os contratos, a CCEE utiliza o PLD para liquidar as operações
de compra e venda de energia.
17
O preço spot é único e sua definição depende das condições de oferta e
procura do mercado. Como o preço não é, de fato, de mercado e sim fornecido por
modelos computacionais, grandes variações semanais podem ocorrer nos seus
valores. Além disso, fatores externos também podem influenciar o preço spot,
como o nível de armazenamento dos reservatórios das usinas hidrelétricas, a
evolução prevista da demanda de energia e a disponibilidade atual e futura de
usinas e linhas de transmissão de energia elétrica.
Outro problema é quando os próprios modelos matemáticos (da cadeia de
modelos do CEPEL) são abandonados. Um exemplo disso ocorreu no período do
racionamento de 2001/2002 quando alguns valores do PLD semanal foram
regulados pelo governo.
Além disso, alterações nos planos de reparo e manutenção de unidades
térmicas, limites na transmissão de energia entre sub-mercados, e outros motivos,
têm feito com que a volatilidade das séries de preço aumente.
No caso do setor elétrico brasileiro, o preço da energia é função da natureza
da indústria de eletricidade, isto é, da disponibilidade de água nos reservatórios e
no nível de precipitação pluviométrico. A volatilidade está relacionada à dinâmica
das afluências. Outro problema do PLD é o fato de que não leva em conta a reação
da demanda, sendo a apenas a hidrologia - presente e a previsão futura – a
formadora do preço.
1.3.
Organização da dissertação
A dissertação está organizada da seguinte forma: o Capítulo 2 apresenta
uma revisão dos modelos lineares multivariados. Já no Capítulo 3, os modelos
não-lineares são revisados, reunindo os modelos univariados e multivariados,
além da metodologia CART. No Capítulo 4 consta a teoria sobre os modelos
STVAR-tree, PAR(p) e Neuro-Fuzzy. As aplicações estão presentes no Capítulo
5. E a dissertação conclui no Capítulo 6.
18
2
Modelos Lineares Multivariados
2.1.
Introdução
Neste capítulo, serão apresentados dois modelos lineares, largamente
utilizados na estimação de séries temporais multivariadas. O primeiro deles, o
modelo Vector Autoregressive (VAR), proposto por Sims (1980), foi
desenvolvido como um modelo dinâmico, no qual todas as variáveis a serem
estudadas são tratadas como endógenas. Sendo assim, o modelo VAR examina as
relações lineares existentes entre cada variável endógena e os valores passados das
mesmas variáveis (assume-se uma defasagem p), permitindo ainda a inclusão de
variáveis exógenas na análise.
Este modelo tem como restrições a escolha do conjunto relevante de
variáveis a serem analisadas, que são os valores correntes dos processos, e o
número máximo de defasagens envolvidas nas relações entre elas, normalmente
escolhido com base em critérios estatísticos, como os de Akaike (1974) ou
Schwarz (1978). Por um lado, é desejável incluir o maior número possível de
defasagens, de modo a evitar a imposição de restrições falsas sobre a dinâmica do
modelo. Por outro lado, quanto maior a ordem de defasagens, maior o número de
parâmetros a serem estimados, conseqüentemente, menos graus de liberdade para
a estimação. Um cuidado deve ser tomado ao estimar modelos multivariados.
Geralmente, eles apresentam elevado número de parâmetros, com reflexo no
tamanho de amostra requerido para que se obtenha uma estimação confiável.
Diversos testes estatísticos podem ser utilizados com a finalidade de
verificar a adequação de um modelo. Caso alguma das premissas básicas da
modelagem não for válida, diz-se que existe um erro de especificação do modelo.
Os testes são aplicados em diversos estágios da modelagem, ou seja, a cada
momento da elaboração do modelo aplica-se os testes de diagnóstico para
verificar se todas as exigências básicas são válidas para o conjunto de dados em
questão. A seguir, alguns motivos da realização dos testes:
19
1) Testes com o objetivo de definir a especificação do modelo;
2) Testes para inclusão ou não de variáveis defasadas no modelo;
3) Testes para as propriedades dos termos de perturbação não-observável
(ruído branco);
4) Testes para verificação do ajuste do modelo.
Uma condição básica para estimação do modelo VAR é que as séries
temporais sob análise sejam estacionárias. Isto indica que as médias e variâncias
devem ser constantes ao longo do tempo e o valor das covariâncias entre dois
períodos de tempo devem depender apenas da distância ou defasagem entre os
dois períodos, e não do período de tempo efetivo em que as covariâncias foram
calculadas.
Após a verificação da presença de raízes unitárias nas séries, sendo as
mesmas integradas de mesma ordem, ou seja, necessitando as séries do mesmo
número de diferenciações para se tornarem estacionárias procedem-se os testes de
co-integração. Em existindo relações de co-integração entre as séries, diz-se que
as mesmas apresentam uma relação linear estável no longo prazo.
O teste de co-integração visa determinar o número de vetores de cointegração que serão necessários no sistema. Um dos procedimentos para
identificar a existência de co-integração é o de Johansen (1988), o qual utiliza
Máxima Verossimilhança para estimar os vetores de co-integração. A hipótese
nula é de que não há nenhum vetor de co-integração versus a hipótese alternativa
de que há pelo menos um vetor de co-integração. Caso o teste detecte a presença
de um vetor de co-integração num sistema, então, ao invés de estimar o modelo
VAR, deve-se utilizar o modelo VEC.
2.2.
Modelo VAR
Algumas propriedades importantes do modelo VAR serão discutidas. As
principais utilizações deste modelo são para previsão e análise estrutural.
Considere um conjunto de séries temporais observadas no tempo. Um primeiro
modelo tem de ser especificado e os parâmetros têm de ser estimados. Em
seguida, a adequação do modelo é marcada por diversos instrumentos estatísticos
20
e o modelo pode ser estimado e utilizado para previsão e análise estrutural ou
dinâmico. As principais etapas da modelagem multivariada são:
1) Especificação e estimação do modelo;
2) Avaliação / verificação do modelo;
a. Modelo rejeitado, volta ao passo 1
b. Modelo aceito, avança ao passo 3
3) Previsão
4) Análise estrutural
2.2.1.
Formulação Matemática
Sejam
, , … , séries
temporais
multivariadas,
com
= , , … , . Um modelo VAR(p) pode ser expresso matematicamente
pela seguinte formulação:
= + + + ⋯ + ! ; t = 0, 1, 2, …
(2.1)
Todos os símbolos utilizados nesta representação possuem significados
usuais, isto é,
= , , … , é um vetor aleatório (K x 1) de variáveis endógenas;
= , , … , " ′ é um vetor fixo de interceptos (K x 1), os quais
permitem a possibilidade de média E(yt) não-nula;
$ são matrizes fixas de coeficientes, os quais são interpretados como a
sensibilidade da de uma variável do modelo com relação a uma defasagem de
outra variável;
! = ! , ! , … , ! é um vetor K-dimensional de ruído branco, ou seja,
E(u) = 0, E(utut’) = Σu e E(utus’) = 0.
Cada equação do modelo possui um termo específico, o qual pode ser
interpretado como o choque correspondente à K-ésima equação. Este termo é o
termo de erro !$ .
Qualquer modelo VAR(p) pode ser representado por um modelo Kp-
dimensional VAR(1), dado por:
21
% = & + ' + ( ,
(2.2)
onde,
x 1).
E as dimensões são: % ~ (Kp x 1) , & ~ (Kp x 1), ' ~ (Kp x Kp) e ( ~ (Kp
% é estável se para |*| ≤ 1,
A média do modelo VAR(p) é dada por
E as auto-covariâncias são:
onde, Σ, = -( ( .
Usando a matriz J com dimensão (K x Kp) dada por:
. = /0
: 0
: …
:
02.
O processo é obtido como = .% . Pelo fato de % ser um processo bem
definido, isto implica que também seja. Então, temos:
- = .3, constante para todo t,
Γ5 h = JΓ5 hJ , também invariantes no tempo.
Seja o polinômio característico do processo VAR(p), dado por:
Dizemos que o processo é estável se, para |*| ≤ 1,
.
Esta é a condição de estabilidade do processo.
22
2.2.2.
Representação Média Móvel (MA) de um processo VAR
A representação de médias móveis é um útil instrumento para examinar a
interação entre as variáveis. Chamam-se os coeficientes de $ de função de
resposta ao impulso observados a partir dos choques ! das variáveis. Estas
funções medem o impacto nas variáveis a partir de seus respectivos choques ! .
Sob a condição de estabilidade, o processo % tem a representação de Média
Móvel (MA) definida como:
$
% = 3 + ∑9
$:; ($
(2.3)
onde, % é expresso em termos do passado e presente do vetor de inovações ( e
do termo média 3.
Além disso, a representação MA de pode ser encontrada pré-multiplicando %
por uma matriz . = /0
: 0 :
3 = .< , =$ = .$ . e ! = .( .
…
: 02 de dimensão (K x Kp). Aqui,
(2.4)
O problema de estimar estes parâmetros incorre nas mesmas dificuldades
em obter os parâmetros do modelo primitivo a partir do modelo reduzido; a
identificação do sistema. Esta metodologia não permite estimação se o sistema é
sub-identificado, isto é, tenha um número de equações menores que os números
de incógnitas.
Para ser possível identificar o sistema escrito na forma MA, é necessário
usar a decomposição de Choleski.
23
2.2.3.
Processo estacionário
Um processo estocástico é estacionário se seus momentos de primeira e
segunda ordem são invariantes no tempo. Então, temos o primeiro momento, para
todo t,
3.
Esta condição indica que todos possuem o mesmo vetor finito de média
E o segundo momento, para todo t e h = 0, 1,
E esta condição requer que as auto-covariâncias do processo não dependam
do tempo >, mas somente do período ℎ de tempo que separa os vetores e @ .
2.2.4.
Estimação
Na estimação das equações do modelo VAR, o sistema apresenta uma
estrutura fixa, com as mesmas variáveis em todas as equações e com o mesmo
número de defasagens, sendo conhecido como “VAR puro”. O estimador para a
representação padrão de um processo VAR(p) é definido por mínimos quadrados
multivariados (ou mínimos quadrados generalizados) expresso da seguinte forma:
AB = C C C %
(2.5)
Este resultado é bastante conhecido na literatura e largamente utilizado.
2.2.5.
Previsão
Um dos principais objetivos de análise de séries temporais multivariadas é
gerar previsão. No contexto dos modelos VAR, interessa-nos o modelo que
minimiza o Erro Quadrático Médio (EQM) de previsão, que também é largamente
utilizado como a função-perda na fase de estimação. Além disso, o EQM é um
24
estimador não-viciado da variância dos erros de previsão, útil para a construção de
intervalos e regiões de previsão.
A equação de previsão num horizonte ℎ na origem > é dada pelo valor
esperado condicional:
(2.6)
Supondo normalidade dos termos de erro do modelo, isto é, ! são normais
multivariados com ! e !D independentes para t≠ F. Sob estas condições, os erros
de previsão também são normalmente distribuídos como transformações lineares
de vetores normais:
(2.7)
Este resultado implica que os erros de previsão das componentes individuais
são também normais, dados por:
onde, ", ℎ é a k-ésima componente de ℎ e G" ℎ é a raiz quadrada do k-
ésimo elemento da diagonal principal da matriz ΣH ℎ.
Denotando por *I o ponto crítico da distribuição normal, temos:
(2.8)
Então, o intervalo de previsão com 1 − %, ℎ períodos a frente, para a k-
ésima componente de é:
25
ou
Este resultado pode ser estendido para regiões de previsão, para duas ou
mais componentes. Defina a matriz K = /0L
:
02 com dimensão (N x K) e note
que temos um resultado conhecido de vetores normais multivariados, dado por:
(2.9)
Assim, a distribuição M N pode ser usada para determinar o elipsóide de
previsão com 1 − % para as primeiras N componentes do processo. Para tal,
utiliza-se o método de Bonferroni, considerando que, para um intervalo de
previsão com O1 − LP %, a região de previsão resultante tem probabilidade no
I
mínimo 1 − % de conter todas as N variáveis conjuntamente.
2.3.
Modelo VEC
Relações de equilíbrio são suspeitas entre muitas variáveis, especialmente
econômicas. Suponha que as variáveis de interesse foram coletadas no vetor
= , , … , e a sua relação de equilíbrio de longo prazo seja A =
A + ⋯ + A = 0, onde A = A , … , A . Em algum momento particular,
essa relação pode não ser satisfeita exatamente, mas talvez tenhamos A = *Q ,
onde *Q é uma variável estocástica que representa os desvios do equilíbrio. Se
realmente há um equilíbrio, parece plausível assumir que as variáveis Q avançam
juntas e que *Q é estável. Assim, *Q pode ser conduzido por uma tendência
estocástica comum. Em outras palavras, não está excluído que cada variável é
integrada, isto é, ainda existe uma combinação linear das variáveis. Variáveis
integradas com essas propriedades são chamadas co-integradas.
No Gráfico 2.1, duas séries temporais co-integradas geradas artificialmente
são representadas.
26
Gráfico 2.1: Séries temporais bivariadas co-integradas
Geralmente, as variáveis em um processo K-dimensional são chamadas
co-integradas de ordem (d, b), brevemente, yQ ~CId, b, se todos os componentes
do
são
0 X
e
existe
uma
combinação
linear
* = β ,
com
A = A , … , A ≠ 0 tal que * é 0X − Z. Por exemplo, se todos os
componentes de * 0 1 e β é estacionário (I0), então yQ ~CI1,1. O vetor A
é chamado de vetor de co-integração.
Um processo que consiste em variáveis co-integradas é chamado um
processo co-integrado. Estes processos foram introduzidos por Granger (1981) e
Engle & Granger (1987). Desde então, tornaram-se populares em trabalhos
econométricos teóricos e aplicados.
Lüktepohl (2005) chama um processo K-dimensional integrado de
ordem d, brevemente, yQ ~Id, se ∆\ é estável e ∆\ não é estável. O
processo 0X é chamado co-integrado se existe uma combinação linear β com
A ≠ 0, o qual é integrado de ordem menor que d. Se existir apenas um
componente 0X no vetor e todos os outros componentes forem estáveis 00,
então o vetor será 0X (Lüktepohl, 2005).
Estritamente falando, as variáveis endógenas de um modelo VAR devem
ser todas estacionárias, ou seja, integradas de ordem zero, I(0), portanto nesse
contexto os autovalores da matriz A localizam-se todos no interior do círculo
unitário. Se não forem, o modelo VEC deve ser estimado ao invés do VAR.
27
2.3.1.
Formulação Matemática
Um processo K-dimensional VAR(p), expresso matematicamente por:
(2.10)
é chamado co-integrado de rank r se
tem rank r e assim Π pode ser escrito como uma matriz-produto A com e A
sendo de dimensão (K x r) e de rank r. A matriz A é chamada matriz de cointegração e é chamada loading matrix.
Se ^ = 0, Δ tem uma representação VAR(p-1) e, para ^ = `,
e assim, o VAR não tem raiz unitária e é um processo VAR(p) estável.
Deste modo, tem uma representação VEC dada matematicamente por:
(2.11)
onde,
Se esta representação de correção de erros for dada, é fácil descobrir o VAR
correspondente, notando que:
(2.12)
28
2.3.2.
Estimação
A estimação dos parâmetros de um modelo VEC é feita em dois estágios.
No primeiro, estima-se a matriz de co-integração A, por mínimos quadrados ou
máxima verossimilhança e, em seguida, substitui-se o verdadeiro valor de A pelo
seu estimador AB na equação, ou seja, considerando:
(2.13)
E, assim, todos os outros parâmetros são estimados na segunda etapa, tendo os
estimadores de dois estágios de e Γ denotados por:
(2.14)
(2.15)
29
3
Modelos Não-Lineares
3.1.
Modelos Não-Lineares Univariados
3.1.1.
Modelo TAR
O modelo Auto-regressivo com limiar (TAR – Threshold Autoregressive)
foi proposto inicialmente por Tong (1978). Um pouco mais trabalhado, foi mais
bem desenvolvido por Tong e Lim (1980) e Tong (1983). Conforme os avanços
das pesquisas, este modelo se popularizou com inúmeras aplicações em séries
temporais não-lineares. As análises tornaram-se interessantes pelo fato deste
modelo atribuir um modelo linear diferente para distintas regiões onde se
encontram os valores de uma variável determinada variável de transição. Definiuse que se a variável de transição for uma defasagem da variável endógena, o
modelo é, então, denominado modelo auto-regressivo com limiar auto-excitante
SETAR (Self-Exciting Threshold Autoregressive).
3.1.1.1.
Formulação Matemática
caso,
Defina como uma série temporal. Esta série segue um processo TAR
(3.1)
onde,
os termos ; , , … , a e b;$ , b$ , … , ba$ c = 1, … , ℎ, são os coeficientes reais do
modelo;
~N0d0, G ;
0$ . é uma função indicadora, definida por
30
1,
Fh f ≥ ^$ n
0$ f = g
0, jFk kl>^á^ck
O modelo pode ser reescrito na forma vetorial,
(3.2)
onde,
os
coeficientes
do
modelo
são
os
vetores
= o; , , … , a p
b$ = ob;$ , b$ , … , ba$ p e, ainda, * = o1, , , … , a p.
e
Esta representação do modelo permite verificar que, dependendo do valor
assumido pela variável f , o modelo ativa um dos h+1 modelos lineares auto-
regressivos de ordem p, AR(p). Conforme dito, caso f = \ o modelo TAR é
denominado SETAR, e tem a seguinte representação matricial:
(3.3)
onde, o escalar d é conhecido como tamanho do limiar ou parâmetro de
defasamento.
3.1.2.
Modelo STAR
Uma generalização do modelo SETAR com dois regimes, incorporando
uma transição suave entre eles, foi proposta por Chan e Tong (1986). Este modelo
foi denominado modelo STAR (Smooth Threshold Autoregressive). Para uma
revisão, consulte Teräsvirta (1994).
3.1.2.1.
Formulação matemática
Considere uma série temporal univariada. A expressão matemática
representada pelo modelo com dois regimes é dada por:
onde,
= = x rs F ; , u + = x r1 − s F ; , u + (3.4)
31
o vetor ϕ$ = r=$,; , =$, , … , =$,a u ; c = 1,2 são os coeficientes dos modelos
lineares ligados aos regimes
o vetor x = 1, , , … , a ′, é formado por 1 na posição inicial
indicando o intercepto do modelo e nas demais posições as defasagens da variável
endógena
a função s. é uma função limitada no intervalo [0,1], aqui determinada como a
função logística, dada por:
s F ; , =
1+
1
h wDx y
(3.5)
O vetor de parâmetros z = , dessa função contém os parâmetros de
suavidade e locação, respectivamente, com a restrição > 0. O primeiro é o
responsável pelo grau de suavidade da função de transição, e o segundo representa
o limiar entre os dois regimes. Para o mesmo valor de , a distância entre o valor
de F e c determina o grau de pertinência dos regimes do modelo. Na situação em
que F = , a observação pertence a ambos os regimes com igual grau de
pertinência.
Obtemos o modelo TAR se definirmos a função de transição s . como
uma função indicadora do tipo:
s. = g
1,
0,
F ≤ n
F > Neste caso, o limiar entre os dois regimes é abrupto e determinado por c, o
parâmetro de limiar ou locação.
Uma das grandes vantagens na utilização dos modelos de transição suave é a
possibilidade de especificar a função de transição de forma a evitar este problema
da busca por um limiar “rígido” entre os regimes. A escolha mais comum para a
função de transição é a função logística. O modelo com esta função de transição é
denominado modelo LSTAR (Logistic Smooth Transition AutoRegressive).
A fim de experimentar a função logística, fixou-se alguns parâmetros e
avaliou-se o seu comportamento através do Gráfico 3.1. O parâmetro de suavidade
32
assumiu os valores do conjunto {1, 2.5, 5, 50}, para representar diferentes níveis
de suavidade da função logística, e o parâmetro de locação c assumiu o valor zero.
Gráfico 3.1: Função logística com parâmetros fixos
Quando tende para zero, a função logística torna-se uma constante igual a
0,5 e o modelo LSTAR se reduz a uma média de dois modelos lineares AR(p).
Este comportamento permite concluir que não existe distinção entre os regimes.
Conforme aumentamos o valor do parâmetro de suavidade , ou seja, com
tendendo para infinito, a função logística aproxima-se de uma função do tipo
degrau e a transição de um regime para o outro se torna uma transição abrupta.
Neste caso, a função logística torna-se uma função indicadora e o modelo é
denominado TAR. E ainda, caso a variável de transição seja uma defasagem da
variável endógena, F = \ , o modelo é então denominado SETAR (Self-
Exciting Threshold Autoregression).
Para valores no intervalo (0,1) assumidos pela função logística s. , o
modelo LSTAR com dois regimes é definido como uma média ponderada de dois
modelos AR(p), onde os pesos das observações são determinados por esses
valores da função de transição, s F ; , e 1 − s F ; , .
O modelo STAR citado anteriormente possui 2 regimes. Porém, este pode
ser estendido para um número maior de regimes. Neste caso, denomina-se como
33
MRSTAR (Multiple Regime Smooth Transition AutoRegression). Por exemplo, a
representação de um modelo MRSTAR de 4 regimes pode ser escrita da seguinte
forma:
= o= | s F ; , + = | r1 − s F ; , up ∗ s F ; , + o=~ | s F ; , + = | r1 − s F ; , up
∗ r1 − s F ; , u + (3.6)
Considerando conhecidas as variáveis de transição F e F , nota-se que os
regimes na equação são ponderados por uma composição de funções logísticas
(s . e s . ). Essa composição soma a unidade, por isso podem ser vista como
funções de pertinência. O conceito de pertinência é largamente utilizado na teoria
da Lógica Fuzzy (Zadeh, 1965). Maiores detalhes referentes aos modelos
MRSTAR podem ser obtidos em van Dijk e Franses (1999).
3.1.2.2.
Especificação do modelo
Esta seção apresenta uma estratégia de especificação do modelo STAR.
Estratégia esta, definida como “específica-para-geral”. Este procedimento inicia
com um modelo simples e, de acordo com os resultados dos testes estatísticos
aplicados, o modelo tem sua complexidade aumentada.
A primeira preocupação refere-se à seleção das variáveis que irá compor o
modelo, tanto as variáveis que formarão o vetor * quanto aquelas denominadas
variáveis de transição, que formam o vetor | .
A modelagem STAR parte de um modelo simples e aumenta sua
complexidade de acordo com os resultados dos testes aplicados. van Dijk,
Terasvirta e Franses (2002) em seu trabalho, propuseram um processo de
construção destes modelos, o qual segue um ciclo de modelagem. Os passos são:
1) Especificação de um modelo AR(p)
Diversos modelos lineares são estimados, começando com um modelo
AR(1) e aumentando a ordem p do modelo, com € = 1,2, … , €‚ƒ .
Aquele modelo que minimizar os critérios de informação AIC (Akaike,
1974) ou BIC (Schwarz, 1978) deve ser selecionado. Todas as
34
propriedades dos modelos lineares AR(p) devem ser verificadas,
incluindo a que se refere aos resíduos do modelo, definindo-os como
aproximadamente um ruído branco.
2) Teste da hipótese de linearidade contra uma alternativa da família
STAR
Na construção do modelo STAR, o teste de linearidade tem duas
funções. A primeira verifica a adequação do modelo linear para
descrever os dados. A hipótese nula do teste é a de linearidade. No
caso em que esta não for rejeitada, não é necessário estimar um modelo
não-linear para os dados. A segunda determina as variáveis que
formam o vetor de transição | . Tsay (1989) propôs a aplicação do
teste de linearidade para cada uma das defasagens da variável
endógena (\ ) e selecionar como variável de transição aquela que
apresentar o menor p-valor do teste.
3) Estimação dos parâmetros do modelo STAR selecionado
Para estimar os parâmetros do modelo, utiliza-se o método de Mínimos
Quadrados Ordinários (MQO) para os parâmetros lineares e o método
de Mínimos Quadrados Não-Lineares (MQNL) para os parâmetros
não-lineares do modelo STAR. Este último, sob a normalidade dos
erros, é equivalente ao método de Máxima Verossimilhança (MV).
4) Análise de diagnóstico do modelo
O modelo STAR selecionado e estimado deve apresentar resíduos com
boas propriedades. Basicamente, verifica-se a correlação dos resíduos
de forma que eles se comportem como ruído branco.
5) Re-especificação do modelo de acordo com os resultados do
diagnóstico
No caso de selecionar um modelo STAR que não produza resíduos
com boas propriedades, deve-se voltar a etapa 1 e re-especificar um
modelo AR(p) e, assim, seguir todas as etapas.
35
6) Utilização do modelo com fins descritivos ou de previsão
Com todas as etapas acima verificadas, determina-se este modelo como
o modelo final e este deve ser utilizado de acordo com os seus fins.
3.2.
Modelos Não-Lineares Multivariados
3.2.1.
Modelo TVAR
Tsay (1998) estendeu a abordagem dos modelos TAR (Threshold
Autoregressive) para modelos multivariados, definindo-os como modelos TVAR
(Threshold Vector Autoregressive). Este modelo teve como motivação uma
aplicação no mercado financeiro, onde um ativo foi negociado em dois mercados,
simultaneamente.
3.2.1.1.
Formulação matemática
Considere que os modelos lineares locais dependam de algumas variáveis
exógenas. Seja = , … , " ′ uma série temporal k-dimensional e | =
| , … , |„ ′ uma série temporal v-dimensional de variáveis exógenas. Seja
−∞ = ^; < ^ < ⋯ < ^D < ^D = ∞, então segue um modelo multivariado de
limiar com variável de limiar * e um lag d dado pela seguinte expressão:
(3.7)
onde,
‡ = 1, … , F; ˆ são vetores de constantes; p e q são inteiros não negativos.
A inovação satisfaz
onde,
o primeiro termo é uma matriz positiva definida simétrica;
36
o segundo é uma seqüência de vetores descorrelatados aleatórios com média zero
e matriz de covariância I, a matriz identidade.
O modelo apresentado tem s regimes e é um modelo linear com relação ao
espaço de limiar *\ , mas é não linear no tempo se s >1. Assume-se que a
variável de limiar * é conhecida, estacionária e apresenta uma distribuição
contínua e o lag d, o número de regimes s, e os limiares ^$ são desconhecidos.
3.2.1.2.
Teste de Linearidade
Primeiramente, Tsay (1998) propôs um teste estatístico para detectar a
necessidade de estimar o modelo TVAR ao invés de um modelo linear, isto é,
testou s =1 contra s > 1. O teste é simples e apresenta um bom desempenho em
amostras finitas. Este teste é uma generalização do proposto em Tsay (1989) para
o caso univariado, e apresenta uma distribuição assintótica Qui-Quadrado. A
generalização também leva em conta a presença de variáveis exógenas e
heterocedasticidade condicional.
Em seguida, o autor considerou o teste LM com a hipótese nula que é
linear contra a hipótese alternativa que segue um modelo TVAR definido
anteriormente. O teste LM usa a variável de limiar para construir uma regressão
arranjada. Este regressão baseada no crescimento da ordem da variável de limiar
*\ é:
(3.8)
onde >c é o índice temporal de *$ .
É importante notar que a dinâmica da série não mudou. O que mudou
foi a ordem que cada dado entra na regressão, isto é, a ordem das linhas, se
víssemos a regressão em um contexto matricial. A idéia do teste é simples: se é
linear, então o estimador de mínimos quadrados recursivo da regressão arranjada é
consistente, logo os resíduos previstos são aproximadamente um ruído branco.
Conseqüentemente, os resíduos previstos são descorrelatados do regressor
‰$Š\ . Por outro lado, se seguir um modelo de limiar, os resíduos previstos
37
não serão ruído branco, pois o estimador de mínimos quadrados será viesado.
Neste caso, os resíduos previstos serão correlatados com o regressor ‰$Š\ .
Após a aplicação do teste o autor descreve um procedimento de construção
do modelo incluindo a estimação de s e dos limiares. O método de estimação
aplicado é o de mínimos quadrados condicional e a seleção do modelo é realizada
com base no critério de informação de Akaike.
3.2.1.3.
Estimação
Considerando estimação por mínimos quadrados condicional e assumindo
que p, q e s são conhecidos, e que a variável de limiar * é dada, escrevemos o
modelo para o caso de s = 2 da seguinte forma:
Os parâmetros do modelo são
e a sua estimação pode ser obtida em dois passos. Primeiro, para um dado d e ^, o
modelo acima nada mais é do que duas regressões lineares multivariadas
separadas, cujas estimativas de mínimos quadrados dos seus parâmetros são um
resultado conhecido:
Define-se a soma do quadrado dos resíduos como
onde ‹$ ^ , X é o traço de
No passo 2, as estimativas de mínimos quadrados condicional de d e ^ são
obtidas fazendo
38
Os estimadores de mínimos quadrados condicionais são estimadores
consistentes dos coeficientes, do lag e dos limiares e da matriz de covariâncias.
3.2.1.4.
Identificação do modelo
O problema de identificação e especificação de um modelo de limiar
multivariado envolve a seleção de muitos parâmetros. Os problemas mais difíceis
são: a identificação da variável de limiar e a especificação do número de regimes.
A identificação de s pode levar em consideração experiências passadas e
informações a priori sobre o conjunto de dados, ou a complexidade computacional
pode restringir s a um número pequeno.
Assumindo que * e s são dados, o autor usa o critério AIC para selecionar
um modelo. Dados p, q, d e s, o critério AIC do modelo de limiar multivariado é
dado por:
(3.9)
onde Œˆ €, f, X, F é a função de verossimilhança do regime j avaliado na
estimativa de máxima verossimilhança de ˆ , Ž$ , $ .
ˆ
ˆ
3.2.2.
Modelo STVAR
O modelo STVAR (Smooth Transition Vector Autoregressive) é a versão
multivariada do modelo STAR descrito na seção 3.1.2. Este modelo é
severamente utilizado para modelar vetores de séries temporais, citando aqui o
campo da Macroeconomia.
3.2.2.1.
Formulação matemática
Considere % = , , … , como um vetor (K x 1) de séries
temporais. Uma analogia K-dimensional da expressão matemática representada
pelo modelo STAR com dois regimes é dada por:
39
% = Φ X rsF ; , u + Φ X r1 − sF ; , u + onde,
(3.10)
os vetores Φ$,; , i =1,2 são vetores (K x 1) dos coeficientes interceptos ligados aos
regimes;
a matriz Φ$ = rΦ$, , … , Φ$,a u i =1,2 tem dimensão (K x K) e é formada pelos
coeficientes dos modelos lineares ligados aos regimes;
o vetor ε = ε , … , ε é o vetor k-dimensional de ruído branco com média
zero e matriz de variância-covariância positiva definida Σ‘ ;
a matriz X = 1, … ,1, % , % , … , %a ′, é formada por 1 na posição inicial
indicando o intercepto do modelo e nas demais posições as defasagens das
variáveis endógenas;
a função s . é a função logística.
Observe que no modelo STVAR os regimes são comuns às K variáveis, no
sentido de que uma mesma função de transição determina o regime e a troca de
regimes de todas as K equações do modelo.
3.2.2.2.
Teste de Linearidade
Para realizar os testes de linearidade enfrentamos o mesmo problema do
caso univariado. Isto é, o STVAR contém parâmetros que não são identificáveis
sob a hipótese nula. Para solucionar o problema de identificação os autores usam
uma aproximação de Taylor adequada para a função de transição. Por exemplo no
caso da função logística utiliza-se a aproximação de Taylor de terceira ordem em
torno de = 0, resultando em um modelo re-parametrizado:
(3.11)
Desta forma, a hipótese nula original é equivalente à de que ’$ = 0, c =
1,2,3. A estatística do teste de multiplicador de Lagrange (LM) resultante tem
uma distribuição assintótica qui-quadrada com 3€` graus de liberdade sob a
hipótese nula.
40
3.2.2.3.
Estimação
Quando a linearidade é rejeitada e a variável e a função de transição foram
selecionadas, os parâmetros do modelo STVAR podem ser estimados através de
mínimos quadrados não lineares (MQNL). Sob algumas condições de
regularidade, os estimadores são consistentes e com distribuição assintoticamente
Normal.
3.2.2.4.
Adequação
Como proposto em Eitrheim e Teräsvirta (1996), três testes são realizados
com o objetivo de checar se o modelo estimado é adequado. Testa-se se os
resíduos apresentam auto-correlação, se os dados ainda apresentam alguma não
linearidade e se os parâmetros são constantes. Camacho (2004) descreve esses
testes detalhadamente.
3.2.3.
Modelo SBTVAR
O modelo TVAR proposto por Tsay (1998) é um modelo linear local com
matrizes auto-regressivas diferentes em cada regime, determinados por uma
variável de limiar (uma das variáveis endógenas), um lag e um limiar. O modelo
SBTVAR (Structural Break Threshold Vector Autoregressive) proposto por
Galvão (2006) também divide a amostra em dois períodos, determinados por um
ponto de quebra, o qual permite diferentes dinâmicas antes e depois desta quebra.
O que mostra que este modelo caracteriza em mudanças abruptas de um regime
para o outro.
Apesar dos modelos não-lineares capturarem algumas características de
modelos de quebras estruturais, pode ser que a quebra também implique em
mudanças nos parâmetros que determinam a não-linearidade.
41
3.2.3.1.
Formulação matemática
Defina x = x , … , x como um vetor (m x 1) de m variáveis endógenas
e defina x = r1, x , … , xa u como uma matriz (m x (mp+1)), onde p é a
ordem auto-regressiva. O modelo SBTVAR pode ser escrito como:
(3.12)
onde,
0$,\” ^$ é uma função indicadora, a qual depende de uma variável de transição
*\” , do limiar ^$ e do lag X$ , e 0 • é uma função indicadora que depende do
ponto de quebra.
O SBTVAR tem um TVAR em cada subconjunto determinado pelo ponto
de quebra, ou seja, a quebra também afeta os parâmetros da função indicadora que
determina os regimes. Se não houver limiar, o VAR com quebra estrutural
(SBVAR) é dado por:
(3.13)
Por outro lado, se houver limiar, mas não quebra estrutural, temos o VAR
com limiar (TVAR), que pode ser escrito como:
(3.14)
3.2.3.2.
Estimação
A estimação do SBTVAR pode seguir duas abordagens, a de mínimos
quadrados condicionais, usada em Tsay (1998), apresentada na seção 2.3, ou
máxima verossimilhança, sugerida em Hansen and Seo (2002).
Usando os resíduos, a matriz de covariância é computada de forma
consistente como
42
O estimador de mínimos quadrados condicionais (MQC) é obtido fazendo
Da mesma forma, o estimador de máxima verossimilhança (ML) é obtido
fazendo
O estimador de ML é construído assumindo que as matrizes de covariância
são as mesmas em cada regime. Essa hipótese pode não ser válida quando
aplicada a dados macroeconômicos com variância não constante no tempo, mas o
estimador pode ser modificado para este caso.
3.2.3.3.
Seleção do modelo
Em Galvão (2006) é apresentado um procedimento de seleção entre modelos
de limiar. A questão a ser estudada é qual modelo é mais adequado ao conjunto de
dados, um VAR, TVAR, SBVAR ou um SBTVAR.
Mesmo se podendo estimar modelos SBTVAR’s, não fica claro a
necessidade de ter limiares ou transições que variam no tempo para capturar a
estrutura dinâmica dos dados. Testes para limiar em um SBVAR ou para quebra
estrutural em um TVAR são complicados devido à descontinuidade das mudanças
e da presença de parâmetros mal comportados.
A autora propõe um método de especificação do modelo baseado nos limites
assintóticos para os testes LM e de Wald, derivados por Altissimo e Corradi
(2002). A regra de decisão para a seleção do modelo usa limites assintóticos e os
valores máximos das estatísticas de Wald e LM em uma grade de possíveis
valores para os parâmetros mal comportados, como proposto por Altissimo e
Corradi (2002). As estatísticas de Wald e LM são calculadas usando a soma do
quadrado dos resíduos (SSR) sob a hipótese nula e alternativa:
43
O vetor z contém parâmetros como limiares e quebras do modelo sob a
hipótese nula, e o vetor z contêm os mesmos parâmetros sob a hipótese
alternativa.
3.2.4.
Modelo TVEC
Lo e Zivot (2001) definiram um modelo de co-integração com limiar
multivariado, chamado TVEC (Threshold Vector Error Correction), que é um
caso especial do TVAR do Tsay (1998).
3.2.4.1.
Formulação matemática
De acordo com todas as considerações e suposições feitas no modelo
TVAR, Tsay (1998), define-se um modelo de limiar bivariado com 3 regimes pela
expressão:
(3.15)
Pode-se reescrever este modelo como:
(3.16)
onde
Se, em cada regime j, € é I(1) e co-integrado com o vetor de co-integração
comum A = 1, −A , então o rank ∏ˆ = 1 e
44
Desta forma, a representação do modelo TVEC é dada por:
(3.17)
3.2.4.2.
Teste de co-integração
Lo e Zivot (2001) consideram testes de não co-integração contra cointegração linear e co-integração com limiar, além de testes de linearidade depois
de determinado que existe co-integração nos dados.
Balke e Fomby (1997) discutiram alguns problemas associados a testes de
co-integração com limiar. Os autores notaram que testar a hipótese nula de não
co-integração contra a hipótese alternativa de co-integração com limiar é
complicado. Além disso, para construir testes com alto poder para um tipo
específico de TVEC, é preciso especificar e estimar a forma do modelo de limiar
sob a hipótese alternativa, e isto pode ser difícil, uma vez que existem muitos
tipos de modelos de limiar.
Baseados em resultados de simulações de Monte Carlo, Balke e Fomby
(1997) sugeriram a seguinte estratégia, que Lo e Zivot (2001) estenderam:
1) Testa a hipótese nula de não co-integração contra a alternativa de cointegração linear.
2) Se a hipótese de não co-integração for rejeitada, testa a hipótese nula
de co-integração linear contra a alternativa de co-integração nãolinear (com limiar).
3) Se a hipótese de linearidade for rejeitada, é realizada a especificação
e estimação do modelo de limiar.
3.2.4.3.
Teste de linearidade
Para testar a linearidade, os autores usaram o teste generalizado
apresentado em Tsay (1998), que também é válido para processos co-integrados.
Para implementar esse teste, foi considerada uma regressão arranjada multivariada
para VEC.
45
3.2.4.4.
Especificação do modelo
Após a realização dos testes e de rejeitar a não co-integração e linearidade,
é necessário determinar que tipo de modelo de limiar é mais apropriado para o
conjunto de dados. Algumas questões a serem respondidas são o número de
regimes do modelo, se os valores dos limiares são simétricos, qual modelo é mais
apropriado, entre outras.
Duas linhas gerais foram seguidas para determinar a especificação do
modelo de limiar apropriada. A primeira, adotada por Tong (1990), Clements e
Krolzig (1998), e Tsay (1998), usa um critério de seleção como AIC para
determinar a melhor especificação do modelo. A segunda, recentemente revisada
por Hansen (1999), usa um procedimento de testes seqüenciais baseados em
modelos aninhados. Lo e Zivot (2001) seguiram Hansen (1999) e consideraram
testes de hipóteses em ninhos baseadas em estimação irrestrita do modelo TVEC.
3.2.4.5.
Estimação
A estimação do modelo é realizada usando mínimos quadrados
condicional seqüenciais, como em Hansen (1999).
3.2.5.
Modelo STVEC
O modelo STVEC (Smooth Transition Vector Error Correction) é a versão
não-linear do modelo VEC (Vector Error Correction). A julgar pelas aplicações
destes modelos multivariados não-lineares que estão atualmente disponíveis, um
modelo de particular interesse é aquele em que os componentes do % linear estão
ligados por uma relação de equilíbrio de longo prazo, enquanto a adaptação para
este equilíbrio é não-linear e pode ser caracterizado como troca de regimes, com
os regimes determinados pelo tamanho e/ou o desvio de sinal de equilíbrio. Em
modelos lineares de séries temporais, este tipo de comportamento é capturado
pelo modelo vetorial de correção de erros, consulte Johansen (1995) para os
46
tratamentos em profundidade. Recentemente, extensões não-lineares destes
conceitos foram consideradas na literatura.
3.2.5.1.
Formulação matemática
Concentrando-se na incorporação do mecanismo de transição suave em um
VEC para permitir a não-linearidade ou assimetria dos dados, define-se como um
modelo vetorial de correção de erros com transição suave (Smooth Transition
Vector Error Correction – STVEC) dado por:
(3.18)
onde,
os vetores α$ , i =1,2 são vetores (K x 1) e * = A % para algum vetor (K x 1);
A é o termo de correção de erro, isto é, * é o desvio da relação de equilíbrio a
qual é dada por A % = 0;
a matriz Φ$ = rΦ$, , … , Φ$,a u i =1,2 tem dimensão (K x K) e é formada pelos
coeficientes dos modelos lineares ligados aos regimes;
o vetor ε = ε , … , ε é o vetor k-dimensional de ruído branco com média
zero e matriz de variância-covariância positiva definida Σ‘ ;
a matriz X = 1, … ,1, % , % , … , %a ′, é formada por 1 na posição inicial
indicando o intercepto do modelo e nas demais posições as defasagens das
variáveis endógenas.
Afigura-se que as formas de correção de erros não-lineares freqüentemente
afetam diferentes ajustes para desvios positivos e negativos, ou para desvios
grandes e pequenos do equilíbrio. Efeitos assimétricos de desvios positivos e
negativos do equilíbrio podem ser obtidos definindo a função s . como a função
logística e F = * . No modelo resultante, a força de reversão de * ao seu
atrator muda monotonicamente para valores crescentes de * . A constante de
locação pode ser reduzida a zero para tornar a mudança simétrica em torno do
valor de equilíbrio zero.
47
Já os efeitos assimétricos de desvios grandes e pequenos do equilíbrio
podem ser obtidos definindo a função s. como a função exponencial, dada por:
s F ; , = 1 − h|€˜−F − ™,
> 0.
com F = * e novamente com a constante de locação reduzida a zero para
centrar a força de equilíbrio em zero.
3.2.5.2.
Teste de Linearidade
A seleção da variável de transição é feita testando a linearidade do modelo.
A hipótese nula é de que o conjunto de dados segue um modelo VEC e a
alternativa é de que seguem um STVEC. Para isso, preparam-se uma seqüência de
candidatas a variáveis de transição. Para solucionar o problema de identificação
dos parâmetros sob a hipótese nula, segue-se a abordagem de Luukkonen,
Saikkonen, Teräsvirta (1988) e substitui-se a função de transição por uma
aproximação de Taylor adequada. Desta forma, a metodologia aplicada no teste é
a mesma da aplicada em modelos STVAR.
O teste proposto por Luukkonen, Saikkonen, Teräsvirta (1988) vem sendo
usado em muitos estudos empíricos. Mas esse teste estatístico é baseado em uma
aproximação polinomial, e os erros de aproximação podem afetar a inferência
estatística. Além disso, os testes não são diretamente relacionados com o modelo
de transição suave, logo não pode apontar o que causa a rejeição da linearidade.
Com esta motivação, Seo (2004) considerou testes diretos para ajuste não-linear
em um modelo STVEC, baseados na especificação exata da transição suave.
Hansen e Seo (2002) consideraram os testes para não-linearidade de limiar em um
VEC e Seo (2004) estendeu para VEC de transição suave (STVEC). Os testes são
baseados na estatística LM, que pode ser calculada sob a hipótese nula.
3.3.
Metodologia CART
3.3.1.
Introdução
A metodologia Classification and Regression Tree (CART), proposta por
Breiman, Friedman, Olshen e Stone (1984), é um método de particionamento
48
recursivo, o qual estrutura os modelos definidos para sub-amostra dos dados,
dividindo de forma conveniente o problema em partes. Isto define a estruturação
por árvores de decisão, servindo de alternativa aos métodos tradicionais de
classificação (variável dependente binária) e regressão (variável dependente
contínua).
O modelo CART é não-paramétrico, sendo, portanto, não-probabilístico,
pois não assume uma distribuição de probabilidade e não seguem suposições
sobre componentes aleatórios e a forma do modelo. A principal vantagem do
CART vem da facilidade de interpretação da estrutura de árvore de decisão. As
variáveis envolvidas na definição da árvore formam um conjunto de sentenças
lógicas do modelo final.
O ciclo da modelagem envolve o crescimento da árvore a partir da raiz (nó
inicial), que contém todas as observações do conjunto de dados, até as folhas (nós
terminais), cada qual contendo parte das observações.
Primeiramente, realiza-se um teste no nó inicial, o qual só admite resposta
do tipo binário {0,1}, sendo então um teste lógico. Este teste é realizado em cada
observação de cada uma das variáveis preditoras e, de acordo com as respostas
lógicas obtidas, a raiz dará origem a dois filhos (novos nós), contendo parte das
observações originais. Por convenção, se a resposta for 1, aloca-se a observação
no nó esquerdo, caso contrário, no nó direito. Para cada nó gerado, este
procedimento de teste lógico deve ser repetido até que não seja mais possível
dividir a árvore. Desta forma, cada um dos nós que não geraram novos nós são os
chamados nós terminais. E cada nó que gerou dois filhos são denominados nós
ancestrais, ou nós de divisão, ou ainda nós intermediários.
O modelo final estimado é representado por um gráfico com o formato de
uma árvore binária de decisão, com os nós ancestrais (ou nós de divisão) e os nós
terminais (ou folhas). Um procedimento importante de numeração dos nós deve
ser adotado. A raiz é sempre o nó 0. E cada nó gerado a partir do nó 0 segue uma
seqüência numérica crescente da esquerda para a direita. Quando os nós não
forem gerados, deve-se saltar os seus números correspondentes e prosseguir a
numeração com o nó à direita mais próximo. A Figura 3.1 ilustra um exemplo de
árvore com ausência de alguns nós.
49
Figura 3.1: Exemplo de árvore com ausência de alguns nós
3.3.2.
Formulação matemática
Seja | = | , | , … , |a ′ ∈ › ⊆ ℝa um vetor com € variáveis preditoras de
uma determinada resposta univariada e contínua ′ ∈ ℝ. Defina ž. como uma
função desconhecida através da expressão:
= ž x + (3.19)
tal que, não há suposições sobre o termo aleatório .
Define-se, conforme Lewis,Stevens (1991), um modelo estruturado por
árvore com K folhas por uma função geral não-linear Ÿx ; de x e definida
pelo vetor de parâmetros ∈ ℝ¡ , onde r é o número total de parâmetros, através
da expressão:
ž x ≈ Ÿx ; = ∑
$: A$ 0$ x ; z$ (3.20)
onde, 0. é uma função indicadora, dada por:
1,
0$ x ; z$ = g
0,
Fh x ∈ `$ z$ n
.
e = A , … , A , z , … , z ′ é o vetor de parâmetros envolvidos na árvore.
50
Usualmente, H(.) é uma função constante definida por K sub-regiões
`$ z, c = 1, … , £, de algum domínio K ⊂ ℝa .
A Figura 3.2 é um exemplo de um modelo gerado por uma árvore de
regressão que explica a relação entre a variável resposta y e um conjunto de duas
variáveis preditoras x1 e x2 (q = 2). Define-se cj, j = 0,1,...,N, como o valor limite
da partição ki que determinará a inclusão da observação na região.
Figura 3.2: Exemplo de um modelo gerado por uma árvore de regressão
3.3.3.
Algoritmo de crescimento
A arquitetura da árvore é definida a partir de um ciclo iterativo que escolhe
um nó a cada passo para ser subdividido e gerar mais 2 nós. A cada iteração, além
do nó a ser dividido, também é especificada uma variável de transição e o limiar
desta divisão (cj). A escolha desta especificação visa minimizar a soma dos erros
quadráticos de previsão. Para a raiz da árvore (primeira divisão), a equação a ser
minimizada é dada por:
SQEF© = ∑:ª − oA 0| ; F; , ; + A r1 − 0| ; F; , ; up«
(3.21)
51
Após a especificação, estimam-se os parâmetros dos modelos locais para as
observações alocadas dentro dos nós gerados pela divisão. Esse ciclo se repete até
que não haja mais ganho em efetuar subdivisões na árvore.
Com o modelo final estimado, é possível realizar cortes de algumas folhas,
técnica conhecida como podagem (prunning), a partir de medidas de custo e
complexidade, ou da capacidade preditiva do modelo.
52
4
Metodologia
4.1.
Introdução
Neste capítulo apresentam-se os modelos STVAR-Tree, o principal da
dissertação, além dos modelos competidores PAR(p) e Neuro-Fuzzy.
4.2.
Modelo STVAR-Tree
O modelo vetorial auto-regressivo de transição suave estruturado por
árvores (em inglês, Smooth Transition Vector Autoregressive-Tree), denominado
aqui por modelo STVAR-Tree, é resultante da combinação do modelo STVAR
(Smooth
Transition
Vector
Autoregressive)
com
o
algoritmo
CART
(Classification and Regression Tree), ambos discutidos no Capítulo 3.
A construção do modelo STVAR-Tree é uma adaptação do modelo STAR,
proposto por Dijk, Teräsvirta e Franses (2002). O ciclo da modelagem consiste em
três etapas: especificação, estimação e avaliação do modelo.
A especificação do modelo é feita através de métodos estatísticos, o que
permite desenvolver testes de hipóteses. Por esta abordagem, é possível
especificar um modelo não-linear paramétrico por meio de uma árvore de decisão.
Além disso, a árvore de decisão final pode ser facilmente interpretada, como
sentenças lógicas.
A estimação dos coeficientes pode ser vista como uma combinação de
diferentes modelos auto-regressivos, podendo utilizar variáveis exógenas no
conjunto daquelas que ajudam a compor o espaço de transição.
E, por fim, a avaliação do modelo final dá-se por meio de seu desempenho
(habilidade preditiva) em dados fora da amostra (out-of-sample).
53
4.2.1.
Formulação matemática
Sejam , , … , séries temporais multivariadas de variáveis endógenas,
= , , … , , = , , … , , ...,
= , , … , .
Defina ž. como uma função desconhecida de séries temporais multivariadas x ,
as quais podem ser as variáveis endógenas defasadas e variáveis exógenas, através
da expressão:
= žx + (4.1)
tal que Ε / 2 = 0 (vetor nulo de dimensão K) e Ε / 2 = Σ­ (matriz de
variância-covariância de dimensão K x K).
Define-se, portanto, a função Ÿ®¯ x ; : ℝ°Š → ℝ, indexada pelos
parâmetros , como o modelo STVAR-Tree através da expressão:
Ÿ®¯ x ; = ∑$∈¯ Φ$ z³ ´®$ x ; z$ + onde,
(4.2)
o vetor | = r| , | , … , |° u , tal que x ∈ µ° ;
o vetor * = r* , * , … , *a u , o qual z ⊆ x , tal que z ∈ ℝa , € < f, contém
as variáveis endógenas defasadas e, ainda, pode conter variáveis exógenas e
variáveis exógenas defasadas ; e o vetor z³ = 1, … ,1, z ′ contém 1’s indicando
os interceptos acrescidos ao vetor * ;
o vetor = , , … , é K-dimensional contendo ruídos brancos, ou seja,
Ε / 2 = 0 , Ε / 2 = ¶·;,¸ ,
¹º Q:¹n
¹º Q»¹
® é o conjunto de índices de nós geradores. Define-se ®$ como o subconjunto de ®
contendo os índices dos nós geradores que formam o caminho para a folha (nó
terminal) i;
¯ é o conjunto de índices de folhas (nós terminais);
µ é o conjunto de índices de variáveis de transição;
As funções ´®$ , 0 < ´®$ < 1, são conhecidas como funções de pertinência, dadas
por.
54
¾”,½ Š¾”,½ ´®$ x ; z$ = ¼ s O|D½ , ; ˆ , ˆ P
ˆ∈®
− s O|D½ , ; ˆ , ˆ PÀ
¿1
r¾”,½ uŠ¾”,½ (4.3)
onde,
−1,
Fh k jÅclℎk €j^j j žkÆℎj c lãk clÆ!c k ló jlhF>^jÆ ‡
Ä
´®$ = 1;
Â
Â
0, Fh k jÅclℎk €j^j j žkÆℎj c clÆ!c k žcÆℎk Xc^hc>k Xk ló jlhF>^jÆ ‡ n
l$,ˆ
´®$ = 1 − s;
Ã
Â
 1, Fh k jÅclℎk €j^j j žkÆℎj c clÆ!c k žcÆℎk hFf!h^Xk Xk ló jlhF>^jÆ ‡
´®$ = s.
Á
Vale ressaltar que ∑ˆ∈® ´®$ rx ; zˆ u = 1, ∀ x ∈ µ° .
A função s | ; z é definida como Função Logística, da forma:
s | ; , = ŠÊ ËÌÍx ËÎ
(4.4)
Define-se = Φ$ , z$ como a representação de todos os parâmetros do
modelo, sendo particionado em dois grupos, classificados como parâmetros
lineares Φ$ = rΦ$ , … , Φa$ u e parâmetros não-lineares z$ = $ , $ . A matriz de
parâmetros Φ$ é aquela que contém os coeficientes associados às defasagens das
variáveis dependentes, e o vetor z$ é formado pelos parâmetros de suavidade e
locação, respectivamente.
O motivo de z ser um subconjunto de x (conjunto de variáveis de
transição) é evitar regressores não estacionários nos modelos lineares locais, uma
vez que podemos ter séries não estacionárias como variáveis de transição. Uma
ilustração deste caso é dada quando a variável de transição x$ trata-se de uma
tendência linear, a qual identifica uma possível quebra estrutural nas séries.
4.2.2.
Especificação do modelo
O objetivo, aqui, é obter uma estratégia para o crescimento da árvore,
baseado na inferência estatística. Um processo de construção similar ao proposto
por van Dijk, Teräsvirta e Franses (2002) para o modelo STAR foi adaptado para
55
a modelagem STVAR-Tree. Os passos são basicamente os mesmos descritos no
Capítulo 3, os quais seguem o princípio “específico para geral”:
1) Seleção de variáveis relevantes para o modelo
Caso o número de variáveis disponíveis para a composição do modelo seja
elevado, é importante selecionar as mais relevantes. As candidatas à
variáveis de transição podem ser variáveis exógenas ou defasagens da
variável dependente. Dois critérios podem ser utilizados nesta fase: a)
conhecimento subjetivo do problema em questão, ou seja, usar o
conhecimento prévio sobre as séries temporais; ou b) estimar diversos
modelos lineares VAR, incrementando a ordem p do modelo, com
€ = 1,2, … , €‚ƒ . Aquele modelo que minimizar os critérios de
informação AIC (Akaike, 1974) ou BIC (Schwarz, 1978) deve ser
selecionado e todas as propriedades dos modelos lineares VAR(p) devem
ser verificadas. As variáveis que compõem este modelo devem ser
selecionadas para a modelagem do STVAR-Tree.
2) Especificação do modelo, baseado em uma sequência de testes de hipótese
do tipo LM, o qual avalia a linearidade de um determinado modelo
Esta etapa define o modelo a ser estimado. Aqui, os conceitos de
inferência estatística são utilizados para determinar o crescimento da
árvore. O procedimento envolve uma seqüência de testes do tipo
Multiplicadores de Lagrange, conhecido como teste LM (do inglês,
Lagrange Multiplier), como apresentado em Luukkonen, Saikkonen e
Teräsvirta (1988). Na construção do modelo STVAR-Tree, o teste LM
verifica a adequação do modelo STVAR-Tree para descrever os dados. No
caso em que a hipótese nula de linearidade for rejeitada, seleciona-se o nó
a ser dividido e a variável de transição para estimar o modelo.
3) Estimação dos parâmetros lineares (constantes dentro dos nós) e nãolineares (parâmetros da função logística) do modelo selecionado
Dois métodos de estimação são utilizados para produzir as estimativas dos
parâmetros do modelo STVAR-Tree, representados por = Φ$ , z$ .Para
estimar os parâmetros classificados como lineares Φ$ = rΦ$ , … , Φa$ u
utiliza-se Mínimos Quadrados Multivariados (ou Mínimos Quadrados
Generalizados – MQG) e para estimar os parâmetros não-lineares z$ =
56
$ , $ utiliza-se Mínimos Quadrados Não-Lineares (MQNL), que é
equivalente ao método de Máxima Verossimilhança (MV) sob a
normalidade dos erros. Caso os erros não sejam normais, MQNL é
equivalente à Quase-Máxima Verossimilhança (QMV).
4) Análise de diagnóstico do modelo
Avalia-se os modelos estruturados por árvores pelo seu desempenho
estatístico (habilidade preditiva) em dados fora da amostra (out-ofsample).
5) Re-especificação do modelo de acordo com os resultados do diagnóstico
No caso de selecionar um modelo STVAR-Tree que não produza
resultados estatísticos satisfatórios, deve-se voltar a etapa 1 e reespecificar um modelo e, assim, seguir todas as etapas.
6) Utilização do modelo com fins descritivos ou de previsão
Com todas as etapas acima verificadas e satisfeitas, determina-se o modelo
Ÿ®¯ x ; como o modelo final que será utilizado de acordo com os seus
propósitos.
Esta etapa de especificação engloba a etapa de estimação dos parâmetros,
definida na seção posterior, pois o teste LM necessita estimar os modelos sob H0 e
H1, o que indica que, para cada divisão, são estimados os parâmetros lineares e
não-lineares dos modelos.
4.2.3.
Estimação dos parâmetros
Definiu-se que, para a estimação de todos os parâmetros do modelo
STVAR-Tree, representados por = Φ$ , z$ , leva-se em consideração a hipótese
de que o vetor = , , … , é formado por variáveis aleatórias
normalmente distribuídas com média zero e matriz de variância-covariância Σ­ .
Para estimar os parâmetros lineares do modelo inicializa-se os valores dos
parâmetros não-lineares z$ = $ , $ através de uma grade de valores (grid). Uma
vez inicializados, ou seja, dado que os parâmetros não-lineares são conhecidos, a
estimação do modelo STVAR-Tree corresponde a estimação de uma regressão
multivariada e os parâmetros lineares Φ$ = rΦ$ , … , Φa$ u são estimados por
57
Mínimos Quadrados Multivariados (ou Mínimos Quadrados Generalizados –
MQG), dados por:
Ï = /Zz Zz 2 Zz Q
Φ
(4.5)
onde,
= , , … , ,
z = z , … , z" e
Zz = Ñ
z³ ´ x ; z ⋯
⋮
⋱
z³ ´ x ; z ⋯
z³ ´ x ; z ⋮
Ô
z³ ´ x ; z Esse método de estimação é conhecido como Máxima Verossimilhança
Concentrada, sob normalidade dos erros, ou Quase-Máxima Verossimilhança
Concentrada, caso os erros não sejam normais, e a expressão é dada através de:
1
Õ = argmin Ý ß/ − Ÿ®¯ x ; 2 / − Ÿ®¯ x ; 2à
Þ
Û∈Ü
:
(4.6)
Os parâmetros não-lineares de , ou seja, vetor z$ são estimados
condicionalmente a Φ através de MQNL, o qual faz uso de procedimentos de
otimização não-linear. Para a estimação dos parâmetros do modelo STVAR-Tree
considerou-se o algoritmo de Levenberg-Marquadt, completando a estimação da
iteração. Como o método MQNL é muito sensível aos valores iniciais, é feita uma
busca de valores iniciais por grade de valores (grid), que busca a maximização da
função de log-verossimilhança concentrada.
4.2.4.
Divisão dos nós – Seqüência de testes LM
Considere um modelo STVAR-Tree com K nós terminais, escrito como:
> =
ou
Ÿ®¯ x ; = ∑$∈¯ Φ$ z³ ´®$ x ; z$ + (4.7)
58
=
ß
$∈¯˜$ ∗ ™
Φi z³ ´®$ x ; z$ + Φ$ ∗Š z³ ´®$∗ Š x ; z$∗Š + Φ$ ∗Š z³ ´®$∗ Š x ; z$ ∗Š + (4.8)
onde
´®$∗ Š x ; z$ ∗ Š = ´®$∗ x ; z$ ∗ s|$∗ ; $ ∗ , $∗ ;
´®$∗ Š x ; z$ ∗ Š = ´®$∗ x ; z$ ∗ /1 − s |$ ∗ ; $∗ , $∗ 2.
A equação pode ser escrita na forma:
=
ß Φ$ z³ ´®$ x ; z$ + =z³ ´®$∗ x ; z$ ∗ $∈¯˜$ ∗ ™
+ bz³ ´®$∗ x ; z$ ∗ s|$ ∗ ; $∗ , $∗ + (4.9)
onde = = Φ$∗ Š e b = Φ$∗ Š − Φ$ ∗ Š.
Define-se, portanto, a construção do modelo através de testes de hipóteses
do tipo Multiplicadores de Lagrange, conhecido como teste LM. Desta forma, o
crescimento da árvore está condicionado à existência de não-linearidade nas séries
modeladas.
Primeiramente, o teste LM deve ser realizado, baseado nas hipóteses:
H0: Linearidade
H1: Não-linearidade
Esta etapa consiste em testar se o nó raiz deve ou não ser dividido. Em
outras palavras, o teste determinará um modelo constante VAR ou o mais simples
modelo STVAR-Tree, com 2 nós terminais.
Sob H0, é fácil verificar que, para = 0, a função logística s . assume um
valor constante igual a 0,5, independente do valor do parâmetro de locação ,
pois:
s| ; 0, =
1+
1
h ;ƒx y
=
1
1
1
=
=
;
1+h
1+1 2
59
Isto implica que a estimação de Ÿ®¯ x ; será simplesmente a média
ponderada entre os regimes, sendo então, uma combinação linear de modelos
lineares VAR. Consequentemente, o modelo resultante também será linear.
Portanto, seria suficiente testar a linearidade das séries considerando as hipóteses:
H0 : = 0
H1 : > 0
Porém, ao considerar diferentes valores para o parâmetro , a função de
verossimilhança pode permanecer inalterada, o que acarretará num problema de
identificação. Como uma solução deste problema, adota-se a proposta de
Luukkonen, Saikkonen e Teräsvirta (1988), que aproxima a função s . por uma
expansão de Taylor de 3ª ordem em torno de = 0. Então, ao reescrever o
modelo Ÿ®¯ x ; considerando a expansão de Taylor no lugar da função s . ,
chega-se a seguinte expressão:
s | ; , =
1
3
1
+ 2 | − + | − + ~ | − ~
2
2
2
+ â~ | ; , (4.10)
onde R ~ xQ ; γ, c é o resto da expressão.
Considerando a expansão de Taylor de 3ª ordem em torno de = 0, o
modelo pode ser escrito como:
=
ß Φ$ z³ ´®$ x ; z$ + ; z³ ´®$∗ x ; z$ ∗ + z³ ´®$∗ x ; z$ ∗ |$ ∗ $∈¯˜$ ∗ ™
+ z³ ´®$∗ x ; z$∗ |$∗ + ~ z³ ´®$∗ x ; z$ ∗ |$~∗ + h
(4.11)
onde h = + b z³ ´®$ ∗ x ; z$∗ + â~ |$ ∗ ; $∗ , $ ∗ Os parâmetros " , ` = 0, … ,3 são funções dos parâmetros originais
lineares e não-lineares do modelo, =, b, $ ∗ , $ ∗ . Desta forma, as hipóteses do
teste LM passam a ser:
60
H0: = = ~ = 0
H1: caso contrário
Sob H0, o resto da expansão de Taylor desaparece, de forma que as
propriedades do erro permanecem inalteradas. E isto gera condições propícias
para o uso de inferência estatística assintótica.
O teste LM também pode ser aplicado na sua versão do teste F, seguindo os
seguintes passos:
1) Estimar o modelo com K regimes
2) Regredir os resíduos !æ em hÕ e calcular a soma dos novos resíduos
quadráticos ‹‹â; = ∑: !³. Os novos resíduos !³ serão ortogonais à
hÕ .
3) Fazer a regressão de !³ em hÕ e νæQ . Calcular a soma dos resíduos
quadráticos obtidos a partir desta regressão, ‹‹â = ∑: è̂ .
4) Obter a estatística M ou a estatística F
êŒëì = Þ
êŒí =
onde l = f + 2ℎ + € + 1.
‹‹â; − ‹‹â
,
‹‹â;
‹‹â; − ‹‹â /Å
,
‹‹â /Þ − l − Å
Sob H; , a estatística de teste êŒëì segue uma distribuição M assintótica
com Å graus de liberdade, e a estatística de teste êŒí segue aproximadamente
uma distribuição F com m e Þ − l − Å graus de liberdade, onde T é o número de
observações.
Uma vez definidos a estimação do modelo e o teste ML para o crescimento
da árvore, o algoritmo da modelagem torna-se simples.
4.2.5.
Controle do crescimento da árvore
Na
modelagem
STVAR-Tree,
o
teste
LM
deve
ser
executado
seqüencialmente de modo a decidir a divisão de cada um dos nós sob teste. Sabe-
61
se que árvores com muitos nós terminais tornam-se complexas e isto compromete
a análise do modelo final. Com a finalidade de controlar o erro do tipo I (árvore
superestimada), adotou-se o procedimento de diminuir o nível de significância do
teste, de acordo com o crescimento da árvore. Assim, ao realizar o teste pela nésima vez em um nó da d-ésima profundidade, o procedimento adotado faz com
que X, l assuma o valor:
X, l =
,
l\
onde é o nível de significância do primeiro teste.
Este procedimento força o teste LM a ser mais rigoroso nas divisões de
maiores profundidades e, assim, o uso de técnicas de podagem citadas no Capítulo
III não deve ser levado em consideração.
4.2.6.
Previsão
A flexibilidade da metodologia STVAR-Tree permite que sejam criados
três tipos de previsão diferentes:
1) Combinação de Regimes (RC):
Aplicação direta do modelo estimado. Utiliza-se a equação resultante da
estimação para obter a previsão um passo a frente. Assim, a previsão é
obtida a partir da soma ponderada dos modelos lineares locais, na qual os
pesos são as pertinências das observações em cada regime.
2) Máxima Pertinência (MM):
Observa-se em qual regime a observação apresenta maior pertinência e
aplica-se o modelo local correspondente.
3) Combinação Adaptativa de Regimes (do inglês, Adaptive Regime
Combining – ARC):
Metodologia similar à RC, porém os parâmetros lineares são re-estimados
a
cada
passo
da
previsão,
utilizando as
últimas
observações,
correspondentes a um ano. Para séries diárias, as últimas 365 (ou 252, no
mercado financeiro). Séries semanais, as últimas 52 observações. E para
séries mensais, as últimas 12 observações. E assim por diante.
62
4.3.
Modelo PAR
Essencialmente, qualquer estrutura de dependência temporal pode ser
reproduzida por modelos de séries temporais lineares do tipo PAR(p), sendo este
tipo de modelo uma abordagem bastante flexível, e bastante popular para a
modelagem estocástica de vazões fluviais (Hipel e McLeod, 1994). Na
terminologia de séries temporais, a tendência hidrológica é conhecida como
estrutura de dependência temporal, sendo quantificada pela função de
autocorrelação estimada do registro de vazões.
A análise deste tipo de séries pode ser feita pelo uso de formulações autoregressivas cujos parâmetros apresentam um comportamento periódico. A esta
classe de modelos costuma-se denominar modelos auto-regressivos periódicos de
ordem p - PAR(p), Salas et al. (1980). Em geral, p é um vetor,
€ = € , € , . . . , € , onde cada elemento fornece a ordem de cada período.
4.3.1.
Formulação matemática
O modelo PAR€ , € , . . . , € pode ser descrito matematicamente por:
(4.12)
onde,
ï é uma série sazonal de período s;
F é o número de período (s=12 para séries mensais)
> é o índice do tempo, t=1,2,…,sN, função do ano T (T=1,2,…,N) e do período m
(m=1,2,…,s);
N é o número de anos;
3 é a média sazonal de período s;
G é o desvio-padrão sazonal de período s;
$
=
é o i-ésimo coeficiente auto-regressivo do período m;
€ é a ordem do operador auto-regressivo do período m;
j é a série de ruídos independentes com média zero e variância .
63
E a correlação do modelo PAR(p) é dada por:
(4.13)
4.4.
Sistema Neuro-Fuzzy
Os Sistemas Neuro-Fuzzy (SNF) são ditos “inteligentes” e associam a
capacidade de aprendizado das Redes Neurais e sua tolerância a falhas à
interpretabilidade dos Sistemas Fuzzy (Zadeh, 1965). Ao se combinarem duas ou
mais técnicas, cria-se, muitas vezes, um sinergismo que pode levar a um sistema
mais poderoso. Verifica-se que SNF tem aplicação em diversas áreas, como
reconhecimento de padrões, previsão, classificação, controle, etc., com a obtenção
de bons resultados.
A razão para o seu bom desempenho é que os mesmos implementam um
sistema de inferência fuzzy através de uma arquitetura de redes neurais
(paralelamente distribuída), permitindo assim a integração de conhecimentos
implícitos (própria base de dados) e explícitos (conhecimento de especialistas).
Uma série de arquiteturas de SNF tem sido proposta na literatura nos
últimos anos. Dentre essas, pode-se citar o sistema ANFIS (Jang,1993), um dos
modelos mais conhecidos e utilizados na prática. Passa-se a descrever o sistema
ANFIS, o qual será utilizado no próximo capítulo para modelar o preço spot de
energia elétrica no Brasil.
4.5.
ANFIS: Adaptive Neuro-Fuzzy Inference System (Sistema Adaptativo
de Inferência Neuro-Fuzzy)
Por simplicidade, considere um sistema de inferência fuzzy com duas
entradas x e y e uma saída z. Para um modelo Fuzzy Sugeno de primeira ordem,
um conjunto usual de regras “se-então” é a seguinte:
64
A partir deste modelo Fuzzy Sugeno de primeira ordem com duas entradas e
duas regras ilustra-se a arquitetura ANFIS como aquela da Figura 4.1, onde os nós
da mesma camada têm funções similares.
Figura 4.1: Arquitetura ANFIS equivalente
A seguir, passa-se a descrever cada camada do modelo.
Camada 1. Cada nó nesta camada , , ´ , ´ é um nó adaptativo com
uma função denominada função de pertinência de um conjunto fuzzy, a qual gera
a saída do tipo:
ð,$ = 3ñ” |, para c = 1,2, ou
ð,$ = 3ò”Ëì , para c = 3,4
onde x (ou y) é a entrada para o nó i e $ (ou ´$ ) é um rótulo lingüístico (como
“alto” ou “baixo”) associado a este nó. Esta função especifica o grau, pertencente
ao intervalo [0,1], em que a entrada x (ou y) satisfaz este conjunto conjunto
fuzzy,.
Camada 2. Cada nó nesta camada é um nó fixo rotulado Π, representa o
nível da regra, cuja saída é o produto de todos os sinais de entrada:
ð,$ = ô$ = 3ñ” | 3ò” .
Camada 3. Cada nó i nesta camada é um nó fixo rotulado N. A partir dessa
camada temos o processo defuzzificador. A saída desse nó é dada pela razão entre
o i-ésimo nível da regra e a soma de todas os níveis:
Camada 4. Cada nó i nesta camada é um nó adaptativo com uma função nó:
65
onde ô$ é um nível da Camada 3 e ˜€$ , f$ , ^$ ™ é o conjunto de parâmetros deste nó.
Tem-se, então, um produto entre os níveis o valor do conseqüente da regra em si.
Por isso, parâmetros nesta camada são denominados parâmetros conseqüentes.
Camada 5. Cada nó i nesta camada é um nó fixo rotulado Σ, que calcula a
saída geral do sistema como a soma de todos os sinais de sua entrada:
Finalmente, a Figura 4.2 mostra uma arquitetura ANFIS que é equivalente a
um modelo Sugeno de primeira ordem de duas entradas com nove regras, onde
cada entrada tem três funções de pertinência associadas.
Figura 4.2: Arquitetura ANFIS para o modelo Sugeno
A identificação dos parâmetros do modelo ANFIS é realizada, em geral,
empregando algoritmos de aprendizagem híbrida, isto é, combinando estimação
de mínimos quadrados com retro-propagação.
66
5
Experimentos e Aplicações
5.1.
Experimentos de Monte Carlo
Experimentos de Monte Carlo foram planejados com o objetivo de constatar
a funcionalidade tanto do teste LM quanto da estimação do modelo STVAR-Tree.
Nos experimentos, foram realizadas 1000 replicações para cada modelo com
tamanho de amostra variando em T = 200, 600 e 1100, numa tentativa de
representar amostras pequenas, médias e grandes. Para evitar efeitos de
inicialização, as 100 primeiras observações geradas foram descartadas e, assim,
passamos a ter amostras de tamanho T = 100, 500 e 1000. Foram considerados os
níveis de significância do teste LM, = 0,1%, 1%, 5%, 10% e 15%.
5.1.1.
Teste LM
Ao efetuarmos um teste de hipóteses, podemos tomar decisões certas ou
erradas, de acordo com a aceitação ou rejeição das hipóteses em questão. Se
representarmos isso numa tabela em termos de probabilidade, temos:
H0 Verdadeira
H0 Falsa
P(Rejeitar H0)
α
(Erro do Tipo I)
1-β
(Poder do teste)
P(Aceitar H0)
1-α
(Decisão correta)
β
(Erro do Tipo II)
Tabela 5.1: Probabilidades em um teste de hipóteses
Para a avaliação do teste LM, foram realizados dois experimentos, baseados
nas seguintes hipóteses:
H0: Linearidade
H1: Não-linearidade
67
Primeiramente, uma análise da coluna que considera H0 verdadeira foi feita,
isto é, um modelo linear, um VAR bivariado, foi simulado, tendo os seguintes
parâmetros fixos:
/
2 = /1 0
0
2 Ñ0,90
0 Ô + /
0
0,95
2
(5.1)
Neste experimento, definimos o vetor constante como nulo e os erros
aleatórios e independentes $ , c = 1,2 com distribuição Normal (0,1). A candidata
a variável de transição foi . Vale ressaltar que as mesmas análises foram
refeitas considerando a variável de transição , porém os resultados não se
alteraram.
A Tabela 5.2 apresenta os resultados obtidos. Duas conclusões deste
primeiro experimento são tiradas, sendo uma positiva e outra negativa:
Positiva: O teste LM apresentou grande nível de acerto quanto à linearidade
dos dados;
Negativa: Os valores de ʁaí¡$y© são sempre menores que ¾©$¾‚÷ . E isto
indica que o teste LM apresenta uma tendência para a aceitação da linearidade.
Em outras palavras, o teste LM aceita a linearidade mais do que deveria. Uma
atenção a mais deve ser dada aos valores muito baixos para .
¾©$¾‚÷ = 0,1%
T = 100
T = 500
T = 1000
¾©$¾‚÷ = 1%
T = 100
T = 500
T = 1000
¾©$¾‚÷ = 5%
T = 100
T = 500
T = 1000
¾©$¾‚÷ = 10%
T = 100
T = 500
T = 1000
¾©$¾‚÷ = 15%
T = 100
T = 500
T = 1000
Lineares
Não-lineares
ʁaí¡$y©
1000
1000
1000
0
0
0
0,0%
0,0%
0,0%
999
999
999
1
1
1
0,1%
0,1%
0,1%
970
973
981
30
27
19
3,0%
2,7%
1,9%
915
936
931
85
64
69
8,5%
6,4%
6,9%
842
877
899
158
123
101
15,8%
12,3%
10,1%
Tabela 5.2: Experimento Monte Carlo – Simulação de um VAR
68
Em seguida, foi realizada uma análise da Tabela 5.1 na coluna que considera
H0 falsa. Para tal, basta simular um modelo não-linear. Neste estudo, um modelo
STVAR-Tree bivariado foi simulado, tendo a seguinte arquitetura:
Figura 5.1: Arquitetura STVAR-Tree simulada
A fim de evitar complexidade, definiu-se esta arquitetura por apresentar um
número pequeno de folhas (nós terminais). Matematicamente, o modelo com os
parâmetros fixos é representado por:
/
2 = /1 0
0
2 Ñ0,90
0 Ô s| ; , + /1
0
0,95
+ /
2
0
0
2 Ñ0,50
0 Ô r1 − s| ; , u
0
0,50
(5.2)
Neste experimento, também definimos o vetor constante como nulo e os
erros aleatórios e independentes $ , c = 1,2 com distribuição Normal (0,1). A
candidata a variável de transição também foi e os parâmetros não-lineares
da função de transição s ; , assumiram os valores = 0, para o
parâmetro de locação, e o parâmetro de suavidade variou em = 1,5, 10. Vale
ressaltar que, inicialmente, variamos o parâmetro de suavidade em diversos
valores, desde 0.01 até 100. Porém, este procedimento acarretou num custo
computacional muito alto e não houve melhora significativa nos resultados. Por
isso, fixamos somente três valores para .
A Tabela 5.3 apresenta os resultados obtidos. Em geral, o poder do teste
aumenta com o aumento do nível de significância ¾©$¾‚÷ e/ou do parâmetro de
suavidade . O teste LM acusa problemas na identificação de não-linearidade para
amostras de tamanho pequeno.
Conclui-se que, quanto maior o tamanho da amostra, maior o poder do teste,
independente do nível de significância e do valor do parâmetro de suavidade .
69
= 0,1%
T = 100
T = 500
T = 1000
= 1%
T = 100
T = 500
T = 1000
= 5%
T = 100
T = 500
T = 1000
= 10%
T = 100
T = 500
T = 1000
= 15%
T = 100
T = 500
T = 1000
Lineares
= 1
Nãolineares
Poder do
teste
Lineares
= 5
Nãolineares
Poder do
teste
Lineares
= 10
Nãolineares
Poder do
teste
1000
600
25
0
400
975
0,0%
40,0%
97,5%
993
114
0
7
886
1000
0,7%
88,6%
100,0%
992
107
0
8
893
1000
0,8%
89,3%
100,0%
986
222
0
14
778
1000
1,4%
77,8%
100,0%
952
21
0
48
979
1000
4,8%
97,9%
100,0%
915
24
0
85
976
1000
8,5%
97,6%
100,0%
895
60
0
105
940
1000
10,5%
94,0%
100,0%
750
0
0
250
1000
1000
25,0%
100,0%
100,0%
708
1
0
292
999
1000
29,2%
99,9%
100,0%
788
20
0
212
980
1000
21,2%
98,0%
100,0%
571
0
0
429
1000
1000
42,9%
100,0%
100,0%
570
1
0
430
999
1000
43,0%
99,9%
100,0%
681
14
0
319
986
1000
31,9%
98,6%
100,0%
452
1
0
548
999
1000
54,8%
99,9%
100,0%
447
0
0
553
1000
1000
55,3%
100,0%
100,0%
Tabela 5.3: Experimento Monte Carlo – Simulação de um STVAR-Tree
5.1.2.
Modelo STVAR-Tree
Para a avaliação da modelagem STVAR-Tree, foram realizados outros
experimentos de Monte Carlo. Novamente, foram considerados os níveis de
significância para o teste LM = 0,1%, 1%, 5%, 10% e 15%.
Primeiramente, um modelo linear, um VAR bivariado, foi simulado, com os
mesmos parâmetros fixos utilizados na avaliação do teste LM. Aqui, o
experimento avalia a modelagem STVAR-Tree na situação em que o modelo em
questão não apresenta não-linearidade, ou seja, o modelo é linear. E por isso, o
modelo terá como nó terminal a raiz da árvore e, assim, um modelo linear VAR
deverá ser estimado.
Espera-se que os parâmetros lineares estimados sejam aproximadamente
iguais aos valores fixos. A matriz de covariâncias dos erros também foi estimada e
analisada. Considerou-se as medidas de tendência central, média e mediana, além
das medidas de dispersão, desvio-padrão e DAM (desvio absoluto mediano) em
torno da mediana (do inglês, Mean Absolute Deviation, MAD), sendo o último
expresso por:
70
(5.2)
Φ.
A Tabela 5.4 apresenta os resultados da estimação dos parâmetros lineares
Ï
Φ
= 0,1%
T = 100
T = 500
T = 1000
= 1%
T = 100
T = 500
T = 1000
= 5%
T = 100
T = 500
T = 1000
= 10%
T = 100
T = 500
Média
Mediana
Desvio-padrão
DAM
0,00
0,00
0,00
0,00
0,19
0,22
0,10
0,12
0,85
0,00
0,85
0,00
0,06
0,07
0,04
0,04
0,00
0,90
0,00
0,91
0,05
0,05
0,03
0,03
0,01
0,00
0,01
0,00
0,05
0,05
0,03
0,03
0,89
0,00
0,89
0,00
0,02
0,02
0,01
0,02
0,00
0,94
0,00
0,94
0,02
0,02
0,01
0,01
0,00
0,00
0,01
0,00
0,04
0,03
0,02
0,02
0,89
0,00
0,89
0,00
0,01
0,01
0,01
0,01
0,00
0,95
0,00
0,95
0,01
0,01
0,01
0,01
0,01
0,01
0,00
0,01
0,18
0,21
0,11
0,12
0,85
0,00
0,86
0,00
0,06
0,06
0,04
0,04
0,00
0,90
0,00
0,91
0,05
0,06
0,03
0,03
-0,01
-0,01
-0,01
-0,01
0,05
0,06
0,03
0,03
0,89
0,00
0,89
0,00
0,02
0,02
0,01
0,01
0,00
0,94
0,00
0,94
0,01
0,02
0,01
0,01
0,00
0,00
0,00
0,00
0,03
0,04
0,02
0,02
0,90
0,00
0,89
0,00
0,01
0,01
0,01
0,01
0,00
0,95
0,00
0,95
0,01
0,01
0,01
0,01
0,00
-0,02
0,00
0,00
0,17
0,24
0,10
0,12
0,85
0,00
0,86
0,00
0,06
0,06
0,04
0,04
0,00
0,90
0,00
0,91
0,05
0,06
0,03
0,03
0,00
-0,01
0,01
-0,02
0,06
0,06
0,03
0,03
0,89
0,00
0,89
0,00
0,02
0,02
0,01
0,01
0,00
0,94
0,00
0,95
0,02
0,02
0,01
0,01
0,00
0,00
0,00
0,00
0,04
0,03
0,03
0,02
0,89
0,00
0,89
0,00
0,01
0,01
0,01
0,01
0,00
0,95
0,00
0,95
0,01
0,01
0,01
0,01
0,00
0,00
0,00
0,00
0,19
0,22
0,11
0,12
0,84
0,00
0,85
0,00
0,06
0,07
0,04
0,04
0,00
0,89
0,00
0,90
0,05
0,06
0,04
0,04
-0,01
0,00
-0,01
0,01
0,05
0,06
0,03
0,03
0,89
0,00
0,89
0,00
0,02
0,02
0,01
0,01
71
T = 1000
= 15%
T = 100
T = 500
T = 1000
0,00
0,94
0,00
0,94
0,02
0,02
0,01
0,01
0,00
0,01
0,00
0,01
0,04
0,04
0,03
0,02
0,90
0,00
0,90
0,00
0,02
0,02
0,01
0,01
0,00
0,94
0,00
0,95
0,01
0,01
0,01
0,01
0,00
-0,01
0,00
0,00
0,19
0,23
0,11
0,11
0,84
0,00
0,85
0,00
0,06
0,07
0,04
0,04
0,00
0,90
0,00
0,91
0,05
0,06
0,03
0,04
0,00
0,01
0,00
0,00
0,05
0,05
0,03
0,03
0,89
0,00
0,89
0,00
0,02
0,02
0,01
0,01
0,00
0,94
0,00
0,94
0,02
0,01
0,01
0,01
0,00
0,00
0,00
0,00
0,03
0,04
0,02
0,02
0,89
0,00
0,90
0,00
0,02
0,01
0,01
0,01
0,00
0,95
0,00
0,95
0,01
0,01
0,01 0,01
Tabela 5.4: Experimento Monte Carlo – Estimação dos parâmetros lineares
Conclui-se que, para amostras pequenas, a tendência é subestimar os
parâmetros lineares, independente do nível de significância do teste LM. Para
amostras médias e grandes, o modelo STVAR-Tree estima corretamente os
parâmetros. As medidas de dispersão não apontam grandes afastamentos das
estimativas.
Com os mesmos modelos estimados, foi feita uma análise da estimativa da
matriz de covariâncias dos termos de erro, Σ­ , apresentada na Tabela 5.5.
0,1%
1%
5%
10%
15%
T
Média
Mediana
ΣՑ
Desvio-Padrão
DAM
100
0,96
0,96
0,95
0,96
0,15
0,14
0,10
0,09
500
1,00
0,99
0,99
0,99
0,06
0,06
0,04
0,04
0,03
1000
1,00
0,99
1,00
0,99
0,04
0,05
0,03
100
0,97
0,96
0,96
0,95
0,13
0,14
0,09
500
0,99
0,99
0,99
1,00
0,06
0,06
0,05
0,04
1000
1,00
0,99
1,00
0,98
0,05
0,04
0,03
0,03
100
0,96
0,96
0,95
0,96
0,14
0,14
0,09
0,09
500
0,99
0,99
0,99
0,99
0,06
0,06
0,04
0,04
1000
1,00
0,99
1,00
0,99
0,04
0,04
0,03
0,03
100
0,97
0,96
0,96
0,95
0,14
0,14
0,09
0,09
500
0,99
1,00
0,99
0,99
0,07
0,07
0,05
0,04
1000
0,99
0,99
0,99
0,99
0,05
0,05
0,03
0,03
100
0,97
0,95
0,96
0,94
0,14
0,14
0,09
0,09
500
0,99
1,00
1,00
1,00
0,06
0,06
0,04
0,04
1000 0,99 0,99 1,00 0,99 0,04
0,04
0,03 0,03
Tabela 5.5: Experimento Monte Carlo – Estimação da diagonal principal da matriz de covariâncias dos erros, Σ­
72
Este resultado mostra que, apesar de amostras pequenas subestimarem os
parâmetros, como resultado final da estimação, os modelos conseguem capturar
toda a estrutura e ajustar valores próximos aos valores observados.
Em seguida, simulou-se um modelo STVAR-Tree, com a mesma arquitetura
e os mesmos parâmetros fixos utilizados na avaliação do teste LM. Esta etapa
avaliou a modelagem STVAR-Tree na situação em que o modelo apresenta nãolinearidade, ou seja, ocorre crescimento da árvore. Aqui, deve-se considerar
somente os resultados para a simulação que detectou a arquitetura especificada.
Então, modelos especificados de modo incorreto, ou seja, que não apresentaram
não-linearidade ou modelos com mais de dois nós terminais foram retirados desta
análise.
A estimação dos parâmetros resultou em outliers e valores extremos para
algumas simulações. Conseqüentemente, tanto a média quanto o desvio-padrão
das estimativas foram fortemente afetados por estes valores. Por isso, a análise
baseada na mediana e no DAM permite tirar melhores conclusões. A Tabela 5.6
apresenta os resultados da estimação dos parâmetros não-lineares e . Vale
ressaltar que para = 0,1%, = 1 e T = 100, o teste LM acusou linearidade
para as 1000 replicações, por isso, nenhum parâmetro não-linear foi estimado.
= 0,1%
¾©$¾‚÷ = 1
¾©$¾‚÷ = 5
¾©$¾‚÷ = 10
= 1%
¾©$¾‚÷ = 1
¾©$¾‚÷ = 5
¾©$¾‚÷ = 10
T
Média
Mediana
æ
Desvio-Padrão
DAM
Média
Mediana
̂
Desvio-Padrão
DAM
100
x
x
x
x
x
x
x
x
500
7,71
2,31
20,61
1,28
-0,01
0,02
0,69
0,40
1000
46,94
9,14
181,55
7,22
-0,03
-0,01
0,44
0,10
100
5,06
5,51
2,22
0,89
-0,31
-0,08
0,68
0,05
500
35,45
7,18
132,33
5,08
-0,03
-0,01
0,42
0,12
1000
45,86
9,19
179,68
7,00
-0,03
-0,01
0,43
0,09
100
10,89
5,51
19,45
2,19
-0,20
-0,04
0,49
0,07
500
54,92
10,93
182,54
7,88
-0,02
-0,01
0,33
0,08
1000
48,39
9,85
194,42
7,46
-0,03
-0,01
0,41
0,09
100
9,19
5,78
14,48
4,41
-0,15
-0,07
0,94
0,44
500
45,12
8,56
162,28
6,91
-0,02
-0,01
0,48
0,12
1000
45,86
9,16
188,83
7,15
-0,03
-0,01
0,43
0,09
100
18,92
5,51
58,88
3,44
-0,18
-0,11
0,69
0,28
500
46,51
9,02
185,86
6,67
-0,03
-0,01
0,43
0,10
1000
44,70
9,16
186,16
6,94
-0,03
-0,01
0,41
0,09
100
21,08
6,38
51,01
4,16
-0,15
-0,08
0,63
0,23
73
= 5%
¾©$¾‚÷ = 1
¾©$¾‚÷ = 5
¾©$¾‚÷ = 10
= 10%
¾©$¾‚÷ = 1
¾©$¾‚÷ = 5
¾©$¾‚÷ = 10
= 15%
¾©$¾‚÷ = 1
¾©$¾‚÷ = 5
¾©$¾‚÷ = 10
500
54,30
10,61
187,93
7,94
-0,03
-0,01
0,39
0,09
1000
46,28
9,72
194,65
7,32
-0,03
-0,01
0,40
0,08
100
20,41
5,98
46,89
4,48
0,00
-0,03
0,79
0,33
500
49,29
9,41
181,19
7,38
-0,02
-0,01
0,46
0,11
1000
44,36
9,16
190,31
7,08
-0,03
0,00
0,41
0,09
100
27,85
6,90
83,74
4,92
-0,04
-0,07
0,72
0,30
500
48,58
9,41
206,81
7,03
-0,02
-0,01
0,44
0,10
1000
43,41
9,18
186,85
6,94
-0,03
0,00
0,40
0,08
100
38,70
7,98
153,55
6,01
-0,03
-0,06
0,71
0,27
500
52,93
10,28
205,08
7,75
-0,02
-0,01
0,41
0,09
1000
44,18
9,59
186,10
7,21
-0,03
0,00
0,40
0,08
100
36,75
7,74
144,02
6,26
0,00
-0,05
0,78
0,32
500
49,29
9,51
195,75
7,50
-0,03
-0,01
0,46
0,10
1000
42,79
9,16
182,81
7,05
-0,03
0,00
0,40
0,08
100
35,22
8,13
127,24
6,23
0,00
-0,04
0,77
0,31
500
47,92
9,57
188,50
7,32
-0,03
-0,01
0,44
0,10
1000
42,70
9,20
195,19
6,96
-0,03
0,00
0,40
0,08
100
38,67
9,21
125,79
7,27
0,02
-0,03
0,76
0,29
500
50,96
10,20
194,07
7,82
-0,03
-0,01
0,43
0,09
1000
43,87
9,55
197,48
7,19
-0,03
0,00
0,39
0,08
100
36,80
9,07
120,99
7,02
0,05
-0,02
0,81
0,33
500
48,80
9,64
188,46
7,55
-0,03
-0,01
0,45
0,10
1000
42,69
9,16
194,57
7,03
-0,03
0,00
0,40
0,08
100
37,50
9,42
117,88
7,33
0,04
-0,02
0,78
0,31
500
48,06
9,69
184,07
7,42
-0,03
-0,01
0,44
0,10
1000
42,10
9,17
192,34
6,94
-0,03
0,00
0,39
0,08
100
44,69
10,42
93,41
8,38
0,11
-0,01
0,75
0,27
500
50,24
10,10
188,15
7,68
-0,03
-0,01
0,43
0,09
1000
42,73
9,45
192,65
7,10
-0,03
0,00
0,38
Tabela 5.6: Experimento Monte Carlo – Estimação dos parâmetros não-lineares e 0,08
Para valores de muito baixos, o modelo STVAR-Tree superestima este
parâmetro, independente do tamanho da amostra e do nível de significância.
Conforme aumentamos o valor de , aumenta a acurácia das estimativas, com
destaque para amostras grandes.
O modelo STVAR-Tree não apresenta problemas em estimar o parâmetro de
locação . Inicialmente definido como = 0, em todos os experimentos este foi o
valor médio e mediano, com baixa dispersão, mesmo variando o tamanho de
amostra, o nível de significância e o parâmetro de suavidade .
74
Para estes experimentos, também medimos a dispersão dos dados através da
estimativa da diagonal principal da matriz de covariâncias dos termos de erro ‘ foi feita. Vale ressaltar que para = 0,1%, = 1 e T = 100, o teste LM acusou
linearidade para as 1000 replicações.
= 0,1%
¾©$¾‚÷ = 1
¾©$¾‚÷ = 5
¾©$¾‚÷ = 10
= 1%
¾©$¾‚÷ = 1
¾©$¾‚÷ = 5
¾©$¾‚÷ = 10
= 5%
¾©$¾‚÷ = 1
¾©$¾‚÷ = 5
¾©$¾‚÷ = 10
= 10%
¾©$¾‚÷ = 1
¾©$¾‚÷ = 5
Ïε
Σ
T
Média
DesvioPadrão
Mediana
DAM
100
x
x
x
x
x
x
x
x
500
0,99
0,98
0,99
0,98
0,06
0,06
0,04
0,04
1000
0,99
0,98
0,99
0,98
0,06
0,06
0,04
0,04
100
0,85
0,88
0,85
0,92
0,12
0,10
0,11
0,07
500
0,99
0,98
0,99
0,98
0,06
0,06
0,04
0,04
1000
0,99
0,98
0,99
0,98
0,06
0,06
0,04
0,04
100
0,87
0,86
0,85
0,82
0,14
0,10
0,11
0,08
500
0,99
0,98
0,99
0,98
0,06
0,06
0,04
0,04
1000
0,99
0,99
0,99
0,98
0,06
0,06
0,04
0,04
100
0,88
0,86
0,93
0,86
0,15
0,11
0,11
0,08
500
0,99
0,98
0,99
0,98
0,06
0,06
0,04
0,04
1000
0,99
0,99
0,99
0,98
0,06
0,06
0,04
0,04
100
0,89
0,89
0,91
0,87
0,14
0,13
0,09
0,08
500
0,99
0,98
0,99
0,98
0,06
0,06
0,04
0,04
1000
0,99
0,99
0,99
0,99
0,06
0,06
0,04
0,04
100
0,91
0,91
0,92
0,89
0,13
0,13
0,09
0,08
500
0,99
0,98
0,99
0,98
0,06
0,06
0,04
0,04
1000
0,99
0,99
0,99
0,99
0,06
0,06
0,04
0,04
100
0,91
0,89
0,92
0,88
0,14
0,14
0,09
0,08
500
0,99
0,98
0,99
0,98
0,06
0,06
0,04
0,04
1000
0,99
0,99
0,99
0,99
0,06
0,06
0,04
0,04
100
0,92
0,90
0,91
0,89
0,13
0,13
0,09
0,08
500
0,99
0,98
0,99
0,98
0,06
0,06
0,04
0,04
1000
0,99
0,99
0,99
0,99
0,06
0,06
0,04
0,04
100
0,91
0,91
0,91
0,89
0,13
0,13
0,09
0,08
500
0,99
0,98
0,99
0,98
0,06
0,06
0,04
0,04
1000
0,99
0,99
0,99
0,99
0,06
0,06
0,04
0,04
100
0,91
0,90
0,91
0,89
0,13
0,13
0,09
0,09
500
0,99
0,98
0,99
0,98
0,06
0,06
0,04
0,04
1000
0,99
0,99
0,99
0,99
0,06
0,06
0,04
0,04
100
0,91
0,91
0,91
0,90
0,14
0,13
0,09
0,09
500
0,99
0,98
0,99
0,98
0,06
0,06
0,04
0,04
1000
0,99
0,99
0,99
0,99
0,06
0,06
0,04
0,04
75
¾©$¾‚÷ = 10
= 15%
¾©$¾‚÷ = 1
¾©$¾‚÷ = 5
¾©$¾‚÷ = 10
100
0,91
0,91
0,90
0,90
0,14
0,13
0,09
0,09
500
0,99
0,98
0,99
0,98
0,06
0,06
0,04
0,04
1000
0,99
0,99
0,99
0,99
0,06
0,05
0,04
0,04
100
0,91
0,91
0,90
0,90
0,14
0,13
0,09
0,09
500
0,99
0,98
0,99
0,98
0,06
0,06
0,04
0,04
1000
0,99
0,99
0,99
0,99
0,05
0,05
0,04
0,04
100
0,91
0,91
0,91
0,90
0,14
0,13
0,09
0,09
500
0,99
0,98
0,99
0,98
0,06
0,06
0,04
0,04
1000
0,99
0,99
0,99
0,99
0,05
0,05
0,04
0,04
100
0,92
0,91
0,92
0,90
0,14
0,13
0,09
0,10
500
0,99
0,98
0,99
0,98
0,06
0,06
0,04
0,04
1000
0,99
0,99
0,99
0,99
0,05
0,05
0,03
0,04
Tabela 5.7: Experimento Monte Carlo – Estimação da diagonal da matriz de covariâncias dos erros, ‘
Este resultado mostra que o modelo STVAR-Tree consegue capturar toda a
estrutura e ajustar valores próximos aos valores observados.
Ï ø, i =
As figuras a seguir ilustram alguns dos resultados da estimação de Φ
1,2 dos modelos STVAR-Tree simulados. Por termos muitos dados para analisar,
somente as medianas foram consideradas aqui. Cada conjunto agrupa os modelos
com o mesmo nível de significância do teste LM.
Ï ø , i = 1,2 do modelo STVAR-Tree simulado, com = 0,1%
Figura 5.2: Mediana de Φ
76
Analisando a Figura 5.2, com nível de significância = 0,1%, percebe-se
que a primeira árvore não foi estimada, justamente pelo fato da não-detecção de
não-linearidade. Mais uma vez, nota-se problemas de estimação para amostras
pequenas. As estimativas são distantes dos valores fixos, mesmo com variação
dos valores do parâmetro de suavidade. Em alguns casos, o modelo estimou
valores maiores que 1. Para amostras médias e grandes, o modelo STVAR-Tree
apresenta melhores resultados, tanto para árvores com divisões suaves quanto para
divisões mais bruscas.
A Figura 5.3 mostra os resultados com nível de significância = 1%.
Ï ø , i = 1,2 do modelo STVAR-Tree simulado, com = 1%
Figura 5.3: Mediana de Φ
Pode-se repetir aqui as análises feitas para os resultados anteriores. Isto
mostra que com o aumento do nível de significância de = 0,1% para = 1%
não houve melhoras nas pequenas amostras. E nas médias e grandes amostras, os
resultados foram praticamente os mesmos.
As Figuras 5.4 e 5.5 ilustram os casos de aumentos do nível de significância
para = 5% e para = 10%.
77
Ï ø , i = 1,2 do modelo STVAR-Tree simulado, com = 5%
Figura 5.4: Mediana de Φ
Ï ø , i = 1,2 do modelo STVAR-Tree simulado, com = 10%
Figura 5.5: Mediana de Φ
78
Os resultados para pequenas amostras continuam distantes dos valores fixos
inicialmente, porém, as estimativas não apresentam mais o problema de valores
maiores que 1. Para amostras médias e grandes, os resultados são próximos aos
valores fixos inicialmente.
Por fim, os modelos que consideram nível de significância = 15%
apresentam estimativas próximas àquelas fixas nas amostras pequenas. E os
comentários dos resultados para as demais amostras são os mesmos das árvores
estimadas anteriormente.
Ï ø , i = 1,2 do modelo STVAR-Tree simulado, com = 15%
Figura 5.6: Mediana de Φ
5.2.
Aplicações a dados reais
Nesta seção são apresentadas aplicações para dois conjuntos de dados reais.
A primeira aplicação refere-se à Vazão de Rios, medida pela Energia Natural
Afluente (ENA) dos quatro sub-mercados brasileiros, Sudeste/Centro-Oeste (SE),
Sul (S), Nordeste (NE) e Norte(N). A outra, refere-se ao Preço Spot de energia
elétrica no Brasil, considerando também os quatro sub-mercados brasileiros, com
79
a adição das séries de ENA e Energia Armazenada (EARM), utilizadas como
candidatas a variáveis de transição.
5.2.1.
Vazão de Rios
Primeiramente, uma análise exploratória foi feita para conhecimento do
comportamento das séries de ENA. Em seguida, para a modelagem das séries de
Vazão de rios, considerou-se o modelo STVAR-Tree e o modelo PAR(p). Na fase
de estimação dos modelos, foram utilizados 80% das observações e os 20%
restantes foram separados para a previsão fora da amostra (out-of-sample), com 1
passo à frente, utilizada como validação dos modelos ajustados. Estes números
estão mais detalhados na Tabela 5.8.
Período
Divisão
Início
Fim
Observações
(univariado)
Observações
(multivariado)
In-sample
80%
Janeiro/1931
Dezembro/1990
720
2880
Dezembro/2005
Out-of-sample
20%
Janeiro/1991
Total
100%
Janeiro/1931
Dezembro/2005
Tabela 5.8: Divisão dos dados
180
720
900
3600
A comparação dos modelos foi feita com base em medidas estatísticas no
período out-of-sample, considerando previsões de 1 passo à frente.
5.2.1.1.
Análise exploratória
O conjunto de dados de vazão de rios trata de séries mensais, coletadas no
período de Janeiro/1931 a Dezembro/2005, representando 74 anos, no total de 900
observações, para cada um dos 4 submercados. A tabela 5.9 apresenta algumas
estatísticas descritivas das séries.
SE
S
NE
N
Média
32.752,88 7.673,40 8.305,83 6.311,03
Mediana
27.175,67 6.316,19 5.884,49 4.183,39
Desvio-padrão 17.158,06 5.384,29 6.068,08 5.278,20
Mínimo
9.115,39
992,44
1.523,22
736,53
Máximo
114.307,50 61.043,77 46.262,92 29.424,81
Assimetria
1,07
2,36
1,59
1,10
Curtose
3,80
15,29
6,45
3,63
Jarque-Bera
197,15
6.501,80
821,40
197,27
P-valor
0,00
0,00
0,00
0,00
Tabela 5.9: Estatísticas Descritivas das séries de ENA
80
O Gráfico 5.1 apresenta a evolução das séries de ENA ao longo dos anos.
1/1931
12/1933
11/1936
10/1939
9/1942
8/1945
7/1948
6/1951
5/1954
4/1957
3/1960
2/1963
1/1966
12/1968
11/1971
10/1974
9/1977
8/1980
7/1983
6/1986
5/1989
4/1992
3/1995
2/1998
1/2001
12/2003
140000,00
120000,00
100000,00
80000,00
60000,00
40000,00
20000,00
0,00
SE
S
NE
N
Gráfico 5.1: Evolução das séries de ENA
Devido à grande variabilidade dos dados, melhores resultados foram obtidos
ao aplicar o logaritmo natural às séries de ENA. E daqui para frente, somente
estas séries serão consideradas nas análises. A Tabela 5.10 fornece estatísticas
descritivas do logaritmo natural das séries de ENA. As médias das séries
apresentam valores semelhantes às medianas, devido à baixa dispersão medida
pelos desvios-padrão. Nota-se que os valores de mínimo e máximo não são
distantes.
ln(SE)
ln(S)
ln(NE)
lnN)
Média
10,27
8,74
8,79
8,38
Mediana
10,21
8,75
8,68
8,34
Desvio-padrão
0,50
0,64
0,68
0,89
Mínimo
9,12
6,90
7,33
6,60
Máximo
11,65
11,02
10,74
10,29
Assimetria
0,16
0,00
0,27
0,03
Curtose
2,19
2,78
2,06
1,74
Jarque-Bera
28,60
1,81
43,80
60,06
P-valor
0,00
0,40
0,00
0,00
Tabela 5.10: Estatísticas Descritivas do logaritmo natural das séries de ENA
Sabemos que se uma variável aleatória segue uma distribuição Normal,
então as medidas de assimetria e curtose são 0 e 3, respectivamente. Para o
logaritmo natural das séries de ENA, as medidas de assimetria são próximas a
zero e as medidas de curtose são menores que 3. Isto nos sugere que as séries não
seguem uma distribuição Normal. Para comprovar estatisticamente, o teste de
Jarque-Bera foi realizado, o qual se baseia nas seguintes hipóteses:
81
H0: a série é normalmente distribuída
H1: a série não é normalmente distribuída
O teste sugere que a distribuição do logaritmo natural das séries de ENA do
sub-mercado Sul apresenta a normalidade e para os sub-mercados SE, NE e N não
aprenta, devido aos baixíssimos p-valores.
A Tabela 5.10 apresenta as correlações entre as séries de ENA. É possível
notar as correlações elevadas entre os sub-mercados, com exceção do Sul.
ln(SE)
ln(S)
ln(NE)
ln(N)
ln(SE)
ln(S)
ln(NE)
ln(N)
1
-0,11
0,85
0,78
-0,11
1
-0,36
-0,34
0,85
-0,36
1
0,85
0,78
-0,34
0,85
1
Tabela 5.11: Matriz de Correlação do logaritmo natural das séries de ENA
Visualmente, no Gráfico 5.2, as séries apresentam comportamento de séries
estacionárias, uma vez que os níveis se mantêm constantes. É possível perceber a
ausência de tendência (crescente ou decrescente) nas séries dos quatro submercados.
1/1931
10/1933
7/1936
4/1939
1/1942
10/1944
7/1947
4/1950
1/1953
10/1955
7/1958
4/1961
1/1964
10/1966
7/1969
4/1972
1/1975
10/1977
7/1980
4/1983
1/1986
10/1988
7/1991
4/1994
1/1997
10/1999
7/2002
4/2005
14,00
12,00
10,00
8,00
6,00
4,00
2,00
0,00
ln(SE)
ln(S)
ln(NE)
ln(N)
Gráfico 5.2: Evolução do logaritmo das séries de ENA
Conforme indicado inicialmente na análise exploratória, com destaque
para o Gráfico 5.2, as séries apresentam comportamento estacionário. Para
comprovar estatisticamente este resultado, o teste ADF (Augmented DickeyFuller) foi realizado, baseado nos valores críticos de McKinnon para a rejeição da
hipótese nula, com as seguintes hipóteses:
82
H0: a série tem raiz unitária (não é estacionária)
H1: a série não tem raiz unitária (é estacionária)
Como resultados dos testes, temos a rejeição da hipótese de raiz unitária
para as séries, aos níveis de 1%, 5% e 10%.
ln(SE)
ln(S)
ln(NE)
ln(N)
-20,71
-10,8
-18,98
-23,49
* valores críticos de McKinnon
1%*
-3.46
5%
-2.87
10%
-2.57
Tabela 5.12: Teste Estatístico ADF para o logaritmo das séries de ENA
Portanto, a conclusão que tiramos é que as séries temporais do logaritmo
natural das séries de ENA são 00. Este resultado indica que temos satisfeitas as
condições necessárias para usar o arcabouço da modelagem STVAR-Tree.
5.2.1.2.
STVAR-Tree
Para a escolha do modelo STVAR-Tree mais adequado ao logaritmo das
séries de ENA, estimou-se 12 modelos, cada um deles com o aumento de uma
unidade no número de defasagem nas séries das variáveis endógenas dos quatro
sub-sistemas brasileiros, começando na ordem 1 e alcançando o máximo de 12
defasagens.
As candidatas a possíveis variáveis de transição foram as 12 primeiras
defasagens nas séries das variáveis endógenas e o mês. Coloca-se a variável
tempo (mês) no conjunto de variáveis de transição na tentativa de capturar
possíveis efeitos de quebra estrutural nas séries.
O grid de valores dos parâmetros não-lineares foi composto por:
•
•
Suavidade: = 1,5,10
Locação: percentis das candidatas a variável de transição, fixos em
= 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%.
Com a finalidade de evitar a estimação de árvores complexas e também de
reduzir o tempo computacional, limitou-se árvores com no máximo 8 folhas (nós
83
terminais). Ao analisar diversos resultados de árvores mais complexas, percebeuse que estas poderiam até apresentar um ajuste um pouco melhor, porém, com a
limitação, os resultados foram satisfatórios e houve redução de tempo de
processamento e complexidade.
Uma forma de ilustrar essa complexidade seria com a apresentação do
número de nós terminais e de parâmetros dos 12 modelos estimados, já
considerando o procedimento de limitação. Vale lembrar que o número que
identifica o modelo está associado à ordem de defasagem das variáveis
endógenas. A Tabela 5.13 mostra os números.
Número de
parâmetros
de
suavidade
Número de
parâmetros
locação Número de
parâmetros
lineares Φ
Modelo
Número de
nós
terminais
1
8
2
8
7
7
288
3
8
7
7
416
4
8
7
7
544
5
8
7
7
672
6
8
7
7
800
7
2
1
1
232
8
1
0
0
132
9
1
0
0
148
10
1
0
0
164
11
1
0
0
180
7
7
160
12
1
0
0
196
Tabela 5.13: Número de nós terminais e de parâmetros dos modelos estimados
Conforme aumenta a ordem da defasagem, os modelos apresentam um
decréscimo no número de nós terminais. Isto se deve ao procedimento adotado de
diminuir o nível de significância do teste LM, de acordo com o crescimento da
árvore.
Os modelos de 1 a 6 apresentaram crescimento da árvore e, com a limitação,
esses modelos possuem o número máximo de folhas. O modelo 7 só cresceu da
raiz para as folhas 1 e 2, sendo a arquitetura mais simples de um modelo STVARTree. Os modelos de 8 a 12 não formaram árvores e, neste caso, modelos lineares
foram estimados. Portanto, estes últimos modelos não serão tratados como
prioritários, já que o objetivo é estimar modelos STVAR-Tree. Caso nenhum dos
anteriores se mostre adequado, pode ser que um desses seja o modelo escolhido.
84
Para cada modelo estimado, verificou-se os valores assumidos pelos
Critérios de Informação Akaike (AIC), Bayesian (BIC), Hannan-Quinn (HQ) e
Final Prediction Error (FPE), expressos por:
(5.4)
(5.5)
(5.6)
(5.7)
onde,
m é a ordem do modelo STVAR-Tree ajustado aos dados;
T é o tamanho da amostra;
K é a dimensão das séries temporais;
ΣÕü m é a estimativa da matriz de covariância ruído branco;
O critério FPE auxilia na obtenção de um modelo com melhor capacidade
preditiva. Já os critérios BIC e HQ são os mais consistentes, dentre os quatro. O
objetivo então é selecionar o modelo que minimiza esses valores.
A Tabela 5.14 apresenta os valores dos quatro Critérios de Informação para
os 12 modelos estimados.
Modelo
AIC
BIC
FPE
HQ
1
-99,04
-9,58
1,44E-05
-10,21
2
-64,35
-6,10
4,35E-05
-8,37
3
63,48
-0,15
-1,64E-04
-5,07
4
284,42
8,25
-1,07E-05
-0,33
5
598,15
18,79
-1,58E-05
5,53
6
1004,74
31,53
-1,04E-05
12,59
7
-87,34
3,84
-8,75E-06
-2,57
8
-91,43
-1,09
-9,39E-06
-5,26
9
-94,05
1,39
-1,93E-05
-3,86
10
-95,15
4,17
-1,57E-05
-2,30
11
-94,78
7,18
-3,10E-05
-0,64
12
-92,75
10,60
-2,69E-05
Tabela 5.14: Critérios de Informação
1,32
85
O modelo com uma defasagem nas variáveis endógenas apresentou o menor
valor para AIC, BIC e HQ. O modelo com melhor capacidade preditiva, pelo
critério FPE, é o modelo 8. Porém, o modelo final não foi selecionado aqui nesta
etapa. Além dessas, outras estatísticas baseadas nos resíduos foram utilizadas para
seleção do modelo mais adequado, tanto in-sample quanto out-of-sample.
A Tabela 5.15 apresenta as estatísticas Média, Variância, Assimetria e
Curtose dos resíduos no período in-sample. Todos os modelos possuem resíduos
com média nula, variância pequena, assimetria próxima a zero e curtose próxima a
3, com pequenos desvios. Estes resultados mostram o bom ajuste aos dados do
modelo STVAR-Tree.
Modelo
Média
Variância
Assimetria
Curtose
1
2
3
4
5
6
7
8
9
10
11
12
SE
0,00
0,00
0,00
0,00
0,00
0,00
0,00
0,00
0,00
0,00
0,00
0,00
S
0,00
0,00
0,00
0,00
0,00
0,00
0,00
0,00
0,00
0,00
0,00
0,00
NE
0,00
0,00
0,00
0,00
0,00
0,00
0,00
0,00
0,00
0,00
0,00
0,00
N
0,00
0,00
0,00
0,00
0,00
0,00
0,00
0,00
0,00
0,00
0,00
0,00
SE
0,04
0,04
0,03
0,03
0,03
0,02
0,03
0,04
0,04
0,04
0,04
0,04
S
0,23
0,21
0,20
0,19
0,17
0,15
0,22
0,23
0,23
0,22
0,22
0,22
NE
0,04
0,04
0,04
0,03
0,03
0,03
0,04
0,05
0,05
0,04
0,04
0,04
N
0,05
0,04
0,04
0,04
0,03
0,03
0,04
0,05
0,05
0,05
0,04
0,04
SE
0,09
0,10
0,12
0,13
0,20
0,15
0,08
0,04
0,02
0,03
0,04
0,04
S
0,27
0,23
0,22
0,20
0,16
0,12
0,29
0,28
0,29
0,26
0,27
0,27
NE
-0,01
0,06
0,09
-0,01
-0,01
-0,05
0,15
0,17
0,16
0,18
0,09
0,10
N
0,63
0,48
0,59
0,46
0,32
0,20
0,45
0,55
0,52
0,50
0,48
0,48
SE
3,50
3,27
3,51
3,19
3,24
3,43
3,55
3,07
3,09
3,05
3,23
3,24
S
2,89
2,67
3,10
2,90
2,85
3,18
2,85
2,85
2,89
2,84
2,86
2,86
NE
4,11
4,51
4,50
4,08
4,23
4,32
4,17
3,99
3,96
4,00
3,86
3,92
N
4,87
4,69
4,97
4,73
4,95
3,81
5,15
4,95
5,08
5,06
4,87
4,87
Tabela 5.15: Estatísticas descritivas dos resíduos – in-sample
A Tabela 5.16 apresenta as estatísticas MSE, RMSE, MAE e MAPE, dadas
por:
Mean Squared Error (Erro Quadrático Médio): MSE = ∑: − æ Root Mean Squared Error (Raiz do Erro Quadrático Médio): RMSE = ý ∑: − æ Mean Absolute Error (Erro Absoluto Médio): MAE = ∑:| − æ |
Mean Absolute Percentual Error (Erro Percentual Absoluto Médio): MAPE = 100 ∑: þ
Hx Hæx
Hx
þ
86
Os valores de MSE, RMSE e MAE estão próximos a zero. Além disso, as
medidas de MAPE apontam valores baixos, o que indica que os modelos
estimados controlaram bastante os erros in-sample. É interessante notar que a
dispersão dos valores é mínima, o que não permite destacar um único modelo
como o mais adequado para representar as séries de vazão de rios.
Modelo
MSE
RMSE
MAE
MAPE
1
2
3
4
5
6
7
8
9
10
11
12
SE
0,04
0,04
0,03
0,03
0,03
0,02
0,03
0,04
0,04
0,04
0,04
0,04
S
0,23
0,21
0,20
0,19
0,17
0,14
0,22
0,23
0,23
0,22
0,22
0,22
NE
0,04
0,04
0,04
0,03
0,03
0,03
0,04
0,05
0,05
0,04
0,04
0,04
N
0,05
0,04
0,04
0,04
0,03
0,03
0,04
0,05
0,05
0,05
0,04
0,04
SE
0,19
0,19
0,18
0,17
0,16
0,15
0,19
0,20
0,20
0,19
0,19
0,19
S
0,47
0,45
0,44
0,43
0,41
0,38
0,47
0,48
0,47
0,47
0,47
0,47
NE
0,21
0,19
0,19
0,18
0,18
0,17
0,20
0,21
0,21
0,21
0,21
0,21
N
0,21
0,20
0,19
0,19
0,18
0,17
0,21
0,22
0,22
0,21
0,21
0,21
SE
0,15
0,15
0,14
0,14
0,13
0,12
0,14
0,16
0,15
0,15
0,15
0,15
S
0,38
0,37
0,35
0,35
0,33
0,30
0,37
0,38
0,38
0,38
0,38
0,38
NE
0,15
0,14
0,14
0,14
0,13
0,12
0,15
0,16
0,16
0,16
0,16
0,16
N
0,16
0,15
0,14
0,15
0,13
0,13
0,16
0,16
0,16
0,16
0,15
0,15
SE
1,43
1,42
1,36
1,34
1,25
1,15
1,41
1,51
1,51
1,49
1,46
1,46
S
4,40
4,26
4,06
4,03
3,83
3,47
4,33
4,44
4,41
4,39
4,38
4,38
NE
1,68
1,55
1,51
1,51
1,48
1,39
1,68
1,82
1,82
1,79
1,76
1,76
N
1,90
1,75
1,67
1,74
1,60
1,53
1,87
1,97
1,91
1,88
1,83
1,83
Tabela 5.16: Estatísticas de erro dos modelos – in-sample
Por fim, verificou-se a normalidade dos resíduos dos modelos estimados,
mostrados na Tabela 5.17. Para esta análise, realizou-se tanto a versão
multivariada do teste (descrito a seguir) quanto à versão univariada, dada pelo
teste Jarque-Bera, considerando as hipóteses:
H0: a série é normalmente distribuída
H1: a série não é normalmente distribuída
Sob H0, a estatística de teste (multivariado) é dada por,
onde,
T é o tamanho da amostra;
√Þ S‘ ~ Ma
87
é um vetor que contém a média das discrepâncias;
S‘ é a estimativa da matriz de covariâncias dos erros;
€ é a o número de parâmetros no modelo.
Ao
nível
de
significância
%.
√Þ S‘ maiores que Ma
%,
rejeita-se
H0
para
valores
de
Modelo
Teste
Normalidade
Multivariado
Teste
JB
H=0
Normal
H=1
Nãonormal
p-valor do teste
JB
My‚÷y
1
2
3
4
5
6
7
8
9
10
11
12
0,00
0,00
0,00
0,00
0,00
0,00
0,00
0,00
0,00
0,00
0,00
0,00
7,81
7,81
7,81
7,81
7,81
7,81
7,81
7,81
7,81
7,81
7,81
7,81
p-valor
1,00
1,00
1,00
1,00
1,00
1,00
1,00
1,00
1,00
1,00
1,00
1,00
M~ 5%
SE
1
0
1
0
1
1
1
0
0
0
0
0
S
1
1
0
0
0
0
1
1
1
1
1
1
NE
1
1
1
1
1
1
1
1
1
1
1
1
N
1
1
1
1
1
1
1
1
1
1
1
1
SE
0,02
0,17
0,01
0,22
0,04
0,02
0,01
0,5
0,5
0,5
0,39
0,37
S
0,02
0,01
0,05
0,07
0,14
0,24
0,01
0,01
0,01
0,02
0,02
0,01
NE
0,00
0,00
0,00
0,00
0,00
0,00
0,00
0,00
0,00
0,00
0,00
0,00
N
0,00
0,00
0,00
0,00
0,00
0,00
0,00
0,00
Tabela 5.17: Testes de normalidade dos resíduos – in-sample
0,00
0,00
0,00
0,00
Conclui-se que os resíduos in-sample de todos os modelos seguem
distribuição Normal multivariada.
Um ponto positivo na estimação é que todos os modelos se ajustaram bem
aos dados. Com a adição da análise dos critérios de informação, seria interessante
selecionar o modelo 1 como o modelo mais adequado por querermos sempre o
modelo mais parcimonioso. Porém, estatísticas descritivas e de erro dos modelos
no período out-of-sample também foram geradas.
Depois de estimados os modelos, 3 tipos de previsão foram realizadas no
período out-of-sample: Combinação de Regimes (RC), Máxima Pertinência (MM)
e Combinação Adaptativa de Regimes (ARC), conforme descritas no Capítulo IV.
Analisar os resíduos gerados por modelos utilizando estes três métodos de
previsão determinará o modelo STVAR-Tree que melhor se adequa aos dados.
Nesta etapa, os modelos de 1 a 12 competem entre si, pois alguns modelos
apresentam bons ajustes out-of-sample e outros não.
A Tabela 5.18 apresenta as estatísticas Média, Variância, Assimetria e
Curtose dos resíduos no período out-of-sample pelo método RC. Nem todos os
88
modelos possuem resíduos com média nula, variância pequena, assimetria
próxima a zero e curtose próxima a 3. Destacam-se com melhores resultados os
modelos 1, 2, 3, 4 e 7.
Modelo
Média
Variância
Assimetria
Curtose
1
2
3
4
5
6
7
8
9
10
11
12
SE
-0,14
-0,25
-0,14
0,19
0,14
-8,75
0,09
5,17
5,17
5,17
5,17
5,17
S
0,06
0,16
0,10
-0,42
-2,85
-51,29
0,05
4,50
4,51
4,50
4,50
4,50
NE
-0,32
-0,35
0,02
-0,50
1,53
-0,29
0,05
4,28
4,28
4,28
4,28
4,28
N
-0,27
-0,25
-0,13
0,68
0,33
9,34
0,13
4,15
4,15
4,15
4,15
4,15
SE
0,07
0,72
0,32
0,21
3,47
1.498,73
0,04
0,08
0,07
0,07
0,08
0,08
S
0,55
0,95
2,58
1,74
37,35
6.005,73
0,30
0,29
0,29
0,29
0,29
0,29
NE
0,15
0,48
0,35
0,37
6,82
506,98
0,06
0,17
0,17
0,17
0,17
0,17
N
0,14
0,70
0,60
0,27
1,95
1.827,38
0,04
0,25
0,24
0,24
0,24
0,24
SE
0,12
-0,59
-0,93
0,29
1,78
-0,35
0,19
0,21
0,21
0,21
0,22
0,24
S
-0,27
0,31
-0,68
-0,31
-1,59
-1,05
-0,13
-0,03
-0,03
-0,02
-0,02
-0,02
NE
-0,39
0,25
0,67
-0,06
1,73
-0,03
0,32
0,40
0,40
0,42
0,43
0,43
N
0,27
1,08
-0,38
0,41
0,23
0,17
0,31
0,25
0,26
0,26
0,27
0,27
SE
3,36
4,02
7,10
3,32
8,79
7,45
3,23
2,84
2,85
2,81
2,83
2,87
S
2,91
5,33
4,30
5,01
5,57
4,56
2,76
2,41
2,39
2,39
2,40
2,41
NE
4,44
6,26
4,08
3,94
5,82
6,77
3,68
2,49
2,49
2,51
2,52
2,51
N
2,75
7,64
3,77
2,65
5,78
6,22
3,48
1,84
1,84
Tabela 5.18: Estatísticas descritivas dos resíduos (RC) – out-of-sample
1,84
1,86
1,87
Diferentemente do ocorrido no período in-sample, nem todos os valores de
MSE, RMSE, MAE e MAPE do período out-of-sample estão próximos a zero, o
que indica que alguns modelos estimados não conseguiram controlar os erros
neste período. A Tabela 5.19 apresenta as estatísticas, com destaque positivo para
os modelos 1,2 e 7, este último apresentou os menores valores de MAPE.
Modelo
MSE
RMSE
MAE
1
2
3
4
5
6
7
8
9
SE
0,09
0,78
0,34
S
0,55
0,97
2,57
NE
0,25
0,60
N
0,21
0,76
SE
0,31
10
11
12
0,25
3,47
1.566,84
0,05
26,81
26,81
26,83
26,85
26,84
1,90
45,26
8.603,08
0,30
20,55
20,60
20,55
20,51
20,52
0,35
0,61
9,11
504,22
0,06
18,48
18,46
18,49
18,52
18,52
0,61
0,73
2,04
1.904,32
0,06
17,46
17,44
17,44
17,46
17,46
0,88
0,58
0,50
1,86
3,96E+01
0,23
5,18
5,18
5,18
5,18
5,18
S
0,74
0,99
1,60
1,38
6,73
9,28E+01
0,54
4,53
4,54
4,53
4,53
4,53
NE
0,50
0,78
0,59
0,78
3,02
2,25E+01
0,25
4,30
4,30
4,30
4,30
4,30
N
0,45
0,87
0,78
0,85
1,43
4,36E+01
0,24
4,18
4,18
4,18
4,18
4,18
SE
0,25
0,62
0,39
0,38
1,13
22,24
0,17
5,17
5,17
5,17
5,17
5,17
89
MAPE
S
0,59
0,73
1,19
1,03
3,93
59,74
0,44
4,50
4,51
4,50
4,50
4,50
NE
0,40
0,57
0,44
0,62
1,80
12,63
0,18
4,28
4,28
4,28
4,28
4,28
N
0,38
0,63
0,57
0,70
1,00
24,98
0,19
4,15
4,15
4,15
4,15
4,15
SE
2,43
6,14
3,78
3,66
10,65
210,13
1,64
50,02
50,02
50,04
50,06
50,05
S
6,61
8,13
13,47
11,67
44,43
666,81
4,89
50,20
50,26
50,21
50,16
50,16
NE
4,83
6,82
5,07
7,11
19,73
141,54
2,10
49,66
49,64
49,67
49,73
49,72
N
4,78
8,01
7,01
8,76
11,42
298,19
2,22
49,80
49,77
Tabela 5.19: Estatísticas de erro dos modelos (RC) – out-of-sample
49,77
49,81
49,80
Por fim, verificou-se a normalidade (nas versões univariada e multivariada
do teste) dos resíduos dos modelos estimados no período out-of-sample,
mostrados na Tabela 5.20.
Modelo
Teste
Normalidade
Multivariado
Teste
JB
H=0
Normal
H=1
Nãonormal
p-valor do teste
JB
My‚÷y
1
2
3
4
5
6
7
8
9
10
11
12
12,94
5,25
1,16
16,98
6,58
5,35
6,60
52,83
52,83
52,83
52,84
52,84
7,81
7,81
7,81
7,81
7,81
7,81
7,81
7,81
7,81
7,81
7,81
7,81
p-valor
0,00
0,15
0,76
0,00
0,09
0,15
0,09
0,00
0,00
0,00
0,00
0,00
SE
0
1
1
0
1
1
0
0
0
0
0
0
S
0
1
1
1
1
1
0
0
0
0
0
0
NE
1
1
1
1
1
1
1
1
1
1
1
1
M~ 5%
N
0
1
1
1
1
1
0
1
1
1
1
1
SE
0,45
0,00
0,00
0,14
0,00
0,00
0,43
0,43
0,43
0,39
0,38
0,35
S
0,27
0,00
0,00
0,00
0,00
0,00
0,50
0,21
0,19
0,20
0,20
0,21
NE
0,00
0,00
0,00
0,04
0,00
0,00
0,04
0,04
0,03
0,03
0,03
0,03
0,20
0,00 0,02
0,05
0,00 0,00 0,08
0,01
0,01
0,01
Tabela 5.20: Testes de normalidade dos resíduos (RC) – out-of-sample
0,01
0,01
N
Conclui-se que os resíduos neste período out-of-sample dos modelos 2, 3, 6
e 7 seguem distribuição Normal multivariada, porém, nem todos seguem
distribuição Normal univariada.
Considerando o método de previsão RC, o modelo 7 foi o modelo que
apresentou melhores resultados para os resíduos, em todas as análises. Selecionase, portanto, este modelo como o mais adequado.
Considere, agora, o tipo MM de previsão. A Tabela 5.21 apresenta as
estatísticas Média, Variância, Assimetria e Curtose dos resíduos. Nem todos os
modelos possuem resíduos com média nula, variância pequena, assimetria
próxima a zero e curtose próxima a 3. Destacam-se com melhores resultados os
modelos 7 (com 2 nós terminais), 8 a 12 (não formaram árvores).
90
Modelo
1
2
3
4
5
6
7
8
9
10
11
12
SE
4,91
9,55
-6,40
-18,68
3,29
832,71
-0,18
0,01
0,01
0,01
0,01
0,01
S
-1,13
-1,81
25,99
80,23
8,21
795,40
0,59
0,06
0,07
0,07
0,06
0,06
NE
4,60
1,12
-21,89
-9,38
3,67
57,53
0,02
-0,05
-0,05
-0,05
-0,04
-0,04
Média
N
1,50
-0,89
-12,06
-36,53
1,72
-285,57
0,32
-0,03
-0,03
-0,03
-0,03
-0,03
SE
4,09
529,19
338,47
2,53E+03
0,09
2,03E+06
1,21
0,04
0,04
0,04
0,04
0,04
S
1,00
17,23
2.092,15
1,99E+04
0,50
2,08E+06
7,75
0,28
0,29
0,29
0,29
0,29
Variância
NE
7,19
15,72
3.913,94
651,74
0,12
2,21E+04
0,07
0,06
0,06
0,06
0,06
0,06
N
14,14
62,38
587,97
1,03E+04
0,06
2,37E+05
1,65
0,04
0,04
0,04
0,04
0,04
SE
-0,60
0,60
-1,74
-1,45
0,53
-1,21
0,36
-0,36
-0,37
-0,30
-0,26
-0,22
S
-0,53
-0,79
1,80
1,43
0,05
-1,22
-0,34
-0,09
-0,10
-0,10
-0,11
-0,11
NE
-0,56
-1,79
-1,88
-1,34
0,04
-1,33
-0,01
0,05
0,05
0,05
0,06
0,07
N
-0,61
-1,51
-1,83
-1,41
0,23
1,26
-0,36
0,41
0,42
0,36
0,47
0,46
SE
1,45
6,06
4,26
3,16
3,23
2,48
1,28
3,88
3,95
3,99
4,13
4,23
S
3,01
5,57
4,37
3,13
2,67
2,50
1,27
2,49
2,45
2,51
2,54
2,53
NE
1,42
7,05
4,53
3,02
3,07
2,94
3,11
3,49
3,52
3,43
3,55
3,57
N
1,42
4,98
4,44
3,12
3,34
2,65
1,24
3,80
3,72
Tabela 5.21: Estatísticas descritivas dos resíduos – out-of-sample
3,69
4,24
4,26
Assimetria
Curtose
A Tabela 5.22 apresenta as estatísticas MSE, RMSE, MAE e MAPE do
período out-of-sample do tipo MM de previsão.
Modelo
MSE
RMSE
MAE
MAPE
1
2
SE
28,17
617,48
S
2,26
20,40
NE
28,30
16,87
N
16,30
62,82
SE
5,31
3
4
5
6
7
8
9
10
11
12
377,53
2.869,04
10,91
2,71E+06
1,23
0,04
0,04
0,04
0,04
0,04
2.756,13
26.224,08
67,94
2,70E+06
8,05
0,28
0,30
0,29
0,29
0,29
4.371,11
735,98
13,62
25.237,59
0,07
0,07
0,07
0,07
0,06
0,06
730,20
11.605,10
3,00
3,17E+05
1,74
0,04
0,04
0,04
0,04
0,04
24,85
19,43
53,56
3,30
1.646,24
1,11
0,19
0,19
0,19
0,19
0,20
S
1,50
4,52
52,50
161,94
8,24
1.644,18
2,84
0,53
0,54
0,54
0,54
0,54
NE
5,32
4,11
66,11
27,13
3,69
158,86
0,27
0,26
0,26
0,26
0,25
0,25
N
4,04
7,93
27,02
107,73
1,73
563,46
1,32
0,21
0,21
0,20
0,21
0,21
SE
4,91
13,81
10,74
29,04
3,29
1.645,13
1,09
0,14
0,14
0,14
0,15
0,15
S
1,20
2,59
26,53
87,20
8,21
1.641,21
2,78
0,44
0,45
0,44
0,44
0,44
NE
4,60
3,46
30,39
15,70
3,67
154,04
0,21
0,20
0,20
0,20
0,19
0,19
N
4,01
4,78
13,27
58,92
1,72
560,25
1,30
0,16
0,16
0,15
0,15
0,15
SE
47,03
137,76
106,46
290,63
31,79
15.947,86
10,54
1,38
1,36
1,38
1,40
1,42
S
13,79
29,05
294,33
968,03
91,98
18.451,97
31,19
4,88
4,98
4,92
4,92
4,92
NE
52,23
40,58
372,37
193,00
42,88
1.794,43
2,48
2,27
2,27
2,26
2,21
2,22
N
48,29
62,67
170,84
768,72
20,84
6.815,21
15,82
1,90
1,88
Tabela 5.22: Estatísticas de erro dos modelos (MM) – out-of-sample
1,83
1,80
1,82
91
Os resultados indicam que os modelos que formaram árvores (1 a 7) não
conseguiram controlar os erros neste período. Os demais modelos, aqueles que
não formaram árvores, apresentaram os menores valores em todas as estatísticas.
Verificou-se a normalidade (nas versões univariada e multivariada do teste) dos
resíduos dos modelos lineares (8 a 12) no período out-of-sample, mostrados na
Tabela 5.23. Para os modelos não-lineares, somente os modelos 2 e 7 não
rejeitaram a hipótese de normalidade na versão multivariada. Dentre esses
modelos destacados, no teste de Jarque-Bera, os resíduos de algumas variáveis dos
modelos lineares (8 a 12) e do modelo não-linear 7 seguem distribuição Normal
univariada.
Modelo
Teste
Normalidade
Multivariado
Teste
JB
H=0
Normal
H=1
Nãonormal
p-valor do teste
JB
1
2
3
4
5
6
7
8
9
10
11
12
30,68
5,26
8,84
8,03
52,77
11,71
1,75
0,96
1,17
1,06
0,77
0,80
7,81
7,81
7,81
7,81
7,81
7,81
7,81
7,81
7,81
7,81
7,81
7,81
pvalor
0,00
0,15
0,03
0,05
0,00
0,01
0,63
0,81
0,76
0,79
0,86
0,85
SE
1
1
1
1
1
1
1
1
1
1
1
1
S
1
1
1
1
0
1
1
0
0
0
0
0
NE
1
1
1
1
0
1
0
0
0
0
0
0
N
1
1
1
1
0
1
1
1
1
1
1
1
SE
0,00
0,00
0,00
0,00
0,02
0,00
0,00
0,02
0,01
0,02
0,01
0,01
S
0,02
0,00
0,00
0,00
0,50
0,00
0,00
0,27
0,22
0,30
0,32
0,32
NE
0,00
0,00
0,00
0,00
0,50
0,00
0,50
0,34
0,29
0,44
0,25
0,22
0,00
0,00 0,00 0,00
0,23
0,00
0,00 0,02 0,02 0,03
Tabela 5.23: Testes de normalidade dos resíduos (MM) – out-of-sample
0,00
0,00
N
Por último, mas não menos importante, o tipo ARC de previsão. A Tabela
5.24 apresenta as estatísticas básicas Média, Variância, Assimetria e Curtose dos
resíduos. Nem todos os modelos possuem resíduos com média nula, variância
pequena, assimetria próxima a zero e curtose próxima a 3. Destacam-se com
melhores resultados os modelos 8 a 12 (não formaram árvores). Dentre os que
formaram árvores, o modelo 7 apresenta as melhores estatísticas.
92
Modelo
1
2
3
4
5
6
7
8
9
10
11
12
SE
-6,94
1,59
0,49
0,94
0,10
0,86
-0,05
0,00
0,00
0,00
0,00
0,00
S
-130,14
2,55
0,83
1,09
1,20
3,05
0,15
-0,01
0,02
0,02
0,02
0,03
NE
-60,10
1,14
0,47
0,72
-0,16
0,25
-0,06
0,01
0,00
0,00
0,01
0,01
Média
N
-38,74
2,72
0,78
0,78
-1,40
-0,52
-0,13
0,02
0,00
0,01
0,01
0,01
SE
1,97E+05
16,24
5,59
0,97
1,42
1,17
0,25
0,11
0,10
0,09
0,08
0,08
S
3,27E+06
42,11
22,31
5,96
6,83
7,67
0,77
0,60
0,57
0,50
0,50
0,48
Variância
NE
1,04E+06
24,20
5,96
0,81
2,68
1,83
0,41
0,20
0,18
0,17
0,16
0,14
N
2,73E+05
13,57
4,73
0,77
2,83
2,41
0,34
0,12
0,11
0,09
0,09
0,08
SE
1,92
-1,43
0,04
0,28
-0,57
0,85
0,53
0,38
0,37
0,34
0,37
0,22
S
-6,27
0,39
0,40
0,45
-0,13
0,39
0,02
-0,15
0,10
-0,05
-0,03
-0,06
NE
0,70
-2,14
-0,43
0,24
0,48
0,44
1,00
0,05
0,01
0,20
0,32
0,19
N
-1,76
-0,13
0,26
0,79
-0,14
-0,20
0,59
-0,03
0,03
0,26
0,37
0,23
Assimetria
SE
23,64
9,06
4,19
4,03
2,80
8,16
8,29
2,83
3,20
3,23
3,44
3,15
S
56,61
4,46
3,67
3,42
4,31
2,41
3,98
3,38
2,88
2,60
2,75
2,89
NE
25,66
17,75
4,84
2,74
3,50
8,15
7,67
3,49
3,88
3,34
3,61
3,73
N
23,62
8,25
4,37
3,68
2,74
4,14
6,55
2,94
3,46
3,38
Tabela 5.24: Estatísticas descritivas dos resíduos (ARC) – out-of-sample
3,56
3,55
Curtose
Com exceção do modelo 7, as estatísticas MSE, RMSE, MAE e MAPE do
tipo ARC de previsão indicam que os modelos que formaram árvores (1 a 7), não
controlaram os erros neste período. A Tabela 5.25 apresenta os resultados.
Modelo
MSE
RMSE
MAE
MAPE
1
2
3
4
5
6
7
8
9
10
11
12
SE
1,96E+05
18,68
5,79
1,85
1,42
1,90
0,25
0,11
0,10
0,09
0,08
0,08
S
3,26E+06
48,35
22,87
7,11
8,22
16,92
0,79
0,60
0,57
0,50
0,49
0,48
NE
1,04E+06
25,35
6,15
1,33
2,69
1,89
0,41
0,20
0,18
0,17
0,15
0,14
N
2,73E+05
20,87
5,32
1,37
4,76
2,67
0,35
0,12
0,11
0,09
0,09
0,08
SE
442,38
4,32
2,41
1,36
1,19
1,38
0,50
0,33
0,32
0,30
0,29
0,27
S
1.806,24
6,95
4,78
2,67
2,87
4,11
0,89
0,77
0,75
0,70
0,70
0,69
NE
1.019,39
5,04
2,48
1,15
1,64
1,37
0,64
0,44
0,43
0,41
0,39
0,38
N
522,59
4,57
2,31
1,17
2,18
1,63
0,59
0,34
0,34
0,30
0,30
0,29
SE
176,83
3,28
1,69
1,07
0,99
1,05
0,34
0,27
0,26
0,24
0,22
0,21
S
545,09
5,12
3,45
2,03
2,28
3,26
0,68
0,62
0,61
0,58
0,58
0,56
NE
362,75
3,33
1,84
0,91
1,27
1,01
0,45
0,34
0,32
0,32
0,30
0,29
N
213,06
3,53
1,70
0,89
1,73
1,20
0,43
0,27
0,26
0,23
0,23
0,22
SE
1.674,98
31,63
16,66
10,42
9,63
10,14
3,29
2,57
2,46
2,27
2,16
2,07
S
6.172,75
57,54
38,43
22,45
25,38
36,45
7,58
6,90
6,81
6,49
6,41
6,22
NE
4.166,97
38,77
21,81
10,78
14,90
11,79
5,23
3,96
3,79
3,77
3,54
3,40
N
2.530,71
41,57 21,02 11,06 21,50 14,66 5,28 3,29 3,14 2,80
Tabela 5.25: Estatísticas de erro dos modelos (ARC) – out-of-sample
2,77
2,68
93
Os demais modelos, aqueles que não formaram árvores, apresentaram os
menores valores em todas as estatísticas.
Verificou-se a normalidade (nas versões univariada e multivariada do teste)
dos resíduos dos modelos lineares (8 a 12) no período out-of-sample, mostrados
na Tabela 5.26. Para os modelos não-lineares, somente os modelos 1, 2, 5 e 7 não
rejeitaram a hipótese de normalidade na versão multivariada. Dentre esses
modelos, os resíduos não seguem distribuição Normal univariada, pelo teste de
Jarque-Bera. Já os lineares (8 a 12) seguem normalidade tanto na versão
multivariada quanto na univariada, em todas as variáveis.
Modelo
Teste
Normalidade
Multivariado
p-valor
Teste JB
p-valor do
teste JB
H=0
Normal
H=1
Nãonormal
1
2
3
4
5
6
7
8
9
10
11
12
0,19
8,70
2,87
19,09
7,74
13,79
1,24
0,04
0,01
0,02
0,03
0,04
7,81
7,81
7,81
7,81
7,81
7,81
7,81
7,81
7,81
7,81
7,81
7,81
0,98
0,03
0,41
0,00
0,05
0,00
0,74
1,00
1,00
1,00
1,00
1,00
SE
1
1
1
1
1
1
1
0
0
0
0
0
S
1
1
1
1
1
1
1
0
0
0
0
0
NE
1
1
1
0
1
1
1
0
0
0
0
0
N
1
1
1
1
0
1
1
0
0
0
1
0
SE
0,00
0,00
0,02
0,02
0,02
0,00
0,00
0,09
0,10
0,13
0,06
0,41
S
0,00
0,00
0,03
0,03
0,01
0,04
0,04
0,39
0,50
0,50
0,50
0,50
NE
0,00
0,00
0,00
0,31
0,03
0,00
0,00
0,36
0,05
0,34
0,05
0,07
0,00 0,00 0,01
0,00
0,50
0,01
0,00 0,50 0,43 0,17
Tabela 5.26: Testes de normalidade dos resíduos (ARC) – out-of-sample
0,04
0,12
N
Depois de analisar todos esses resultado, desde o número de parâmetros em
cada modelo, os critérios de informação, as estatísticas dos resíduos in-sample e –
out-of-sample dos três tipos de previsão, o modelo que apresentou melhor ajuste
aos dados de vazão de rios foi o modelo 7. Este modelo foi, então, o selecionado
para representar o STVAR-Tree no confronto com o modelo PAR(p).
A Figura 5.7 ilustra a árvore estimada pelo modelo 7, identificando o valor
estimado pelo parâmetro de suavidade e de locação , além da variável de
transição ‹ . A interpretação da árvore é feita da seguinte maneira: para
estimar as séries de vazão de rios, medidas aqui pela Energia Natural Afluente
(ENA), o modelo STVAR-Tree mais adequado sugere uma árvore com dois
regimes, com uma transição suave æ = 1,32 determinada pela defasagem 11 do
94
sub-mercado Sul. O ponto de corte desta variável de transição ocorre no valor
= 8,7.
Figura 5.7: Árvore estimada do modelo 7
Portanto, para ENA do Sul com valores menores que 8,7, as séries de ENA
dos quatro sub-mercados são estimadas pelo Regime 1, com 79% de pertinência.
Para ENA do Sul com valores maiores ou iguais a 8,7, as séries de ENA dos
quatro sub-mercados são estimadas pelo Regime 2, com 21% de pertinência.
Os parâmetros lineares estimados, para cada regime, estão a seguir.
Regime 1
0,63 0,40
0,71 0,23
−0,06 0,26 −0,10 −0,31 ‹4,45
‹‹0,65
0
0,15 −0,25 −0,14 ‹
0,01 −0,18
0,05 0,13
+
+ ‹ ‹ =
3,02
0 0,01
NN0,05 −0,25
−0,05 0,32 −0,21 −0,13 N0,11 0,19
N N 3,36
0,10 −0,02
−0,03 0,55 −0,23 −0,17 N +
+
+
0,10 0,12
0
−0,08
−0,07 −0,03 −0,04
‹0,02 0
0,04
0,09
0,02
0,04 −0,03
‹ + −0,1
0,03 −0,01 −0,05 N0,04
0,06
0,47
−0,01 −0,07
N ~
−0,21 0,07 −0,16
0,01 0,07
−0,05
0,11
0,36
−0,08 −0,76
0,37
0,16
0,29
0,05
−0,06 −0,13 −0,12
0,12 ‹0,03
0,01
0,14
0,03
0,25
0,03 −0,19
‹ + N0,10 −017
0,16
0,05
−0,16 0,29 −0,23
−0,20 N 0,04 −0,03 −0,03 0,01 ‹−0,29 0,15 −0,20 −0,20 ‹
−0,10 0,02 −0,11 −0,13 N0,24 −0,26
0,33 0,28
N −0,06 ‹0,01
‹ −0,22 N−0,09 N 
−0,03 ‹0,86
‹ 0,03
N−0,22 N Regime 2
−1,17
0,75 −0,26
0,53 0,13
0,08 −0,50 −0,05 −0,08 ‹‹‹2,88
0
−1,04 −0,14 0,07
0,01 0,04
0,12 0,48
‹ =
+
‹ + ‹ N0,04
0,22
0,09 0,09
0,13 0,29
N0,85 −0,10 −0,01 NN 1,14
N −0,21 0,17 −0,34 −0,33 N 0,10 0,71
0,04 0,09
−0,04 0,10 −0,04
−0,05 −0,11 −0,03
+
0,07 −0,01
0,08
−0,03 0,04 −0,03
−0,03 ‹0,04 0,10
0,09
0,01
‹−0,04 ‹
−0,07 0,14 −0,07 −0,16 ‹
+ 0,06
N−0,19 −0,10
0,72 0,27
N0,28
0,59
N 
−0,05 N ~
0,05 −0,18
−0,04 −0,05 −0,02
0,07
0,11
0,22
+
0,11
0,26
0,15
−0,13 −0,15 −0,18
−0,05 ‹0,01
‹ N0,08
−0,10 N +
0,37 0,09
−0,09 −0,86
−0,01 −0,37 0,02 −0,21 ‹‹−0,06 0,11
0,18
0,69
−0,11 0,97
0,04
0,56
‹ + ‹ −0,17 −0,72 −0,09 −0,06 N−0,07 −0,28 −0,10 −0,24 N−0,04 0,41
N −0,01 −0,17
0,06 0,08
N 0,05 −0,05
95
5.2.1.3.
PAR
Quatro modelos PAR(p) foram estimados, um para cada sub-mercado. A
estratégia de seleção de modelos seguida, inicialmente, considerou a mesma
ordem p para todos os meses. Porém, os resultados foram muito ruins. Os resíduos
não tinham boas propriedades e os erros de previsão eram elevados. Como a
modelagem PAR(p) permite que se escolham ordens diferentes para os períodos,
realizou-se este procedimento e os resultados melhoraram, permitindo que o
modelo mais adequado fosse selecionado. O critério utilizado para selecionar a
ordem de cada um dos períodos foi aquele que reduz o valor do BIC.
As Figuras 5.8 a 5.11 a seguir ilustram a Função de Auto Correlação (FAC)
Periódica e a Função de Auto Correlação Parcial (FACP) Periódica, de cada
subsistema. Estas funções auxiliam na seleção da ordem dos modelos.
Figura 5.8: FAC e FACP do logaritmo de ENA
Figura 5.9: FAC e FACP do logaritmo de ENA Sul
Sudeste
Figura 5.10: FAC e FACP do logaritmo de ENA Nordeste
Figura 5.11: FAC e FACP do logaritmo de ENA
Norte
Nem sempre, os resultados obtidos pura e simplesmente pelo critério BIC
foram satisfatórios. Combinando, então, os resultados pelo critério BIC e em
96
conjunto com FAC e FACP Periódicas selecionou-se os modelos, disponíveis na
Tabela 5.27.
Mês
2
1
1
2
4
SE
S
NE
N
3
1
1
1
1
4
5
6
7
8
9
10
1
1
1
3
1
1
1
2
1
1
1
1
1
1
1
1
3
1
1
1
1
1
1
5
3
4
5
1
Tabela 5.27: Modelos PAR(p) para cada um dos sub-mercados
11
1
1
2
1
12
1
1
1
1
Os parâmetros destes modelos foram estimados e constam na Tabela 5.28.
Os valores nulos significam que a ordem era menor que a disponível na tabela.
Mês
SE
S
NE
N
1
2
3
4
5
6
7
8
9
10
11
12
lag 1
0,68
0,70
0,69
0,69
0,75
lag 2
0
0
0
0
0
0,94
0,68
0,85
1,12
0,67
0,66
0,69
0
-0,02
0
0
0
0
0
lag 3
0
0
0
0
0
0
0,25
0
0
0
0
0
lag 1
0,45
0,64
0,54
lag 2
0
0
0
0,29
0,95
0,55
0,68
0,65
0,53
0,47
0,61
0,75
0,38
0
0
0
0
0
0
0
0
lag 1
0,44
1,07
0,79
0,78
0,8
0,56
0,81
0,93
0,91
0,90
0,80
0,71
lag 2
0
-0,34
0
0
0
0,01
0
0
0
0
0
0
lag 3
0
0
0
0
0
0,18
0
0
0
0
0
0
lag 1
0,63
0,85
0,66
0,68
0,86
0,77
1,05
1,25
1,47
0,97
0,85
0,8
lag 2
0
-0,31
0
0
0
0
-0,45
-0,49
-1,09
0
0
0
lag 3
0
0
0
0
0
-0,02
0,23
0,11
0,29
0
0
0
lag 4
0
0,35
0
0
0
0,10
0
0,15
-0,10
0
0
0
lag 5
0
0
0
0
0
0,11
0
0
0,32
Tabela 5.28: Estimativa dos parâmetros dos modelos PAR(p)
0
0
0
A Tabela 5.29 apresenta as estatísticas Média, Variância, Assimetria e
Curtose dos resíduos nos períodos in-sample e out-of-sample. Estes resultados
mostram um ajuste razoável aos dados.
In-sample
Out-of-sample
Média
Variância
Assimetria
Curtose
Média
Variância
Assimetria
Curtose
SE
-0,01
2,41
-0,92
2,63
0,01
2,39
-0,92
2,59
S
-0,02
1,58
-0,65
3,31
0,06
1,76
-0,48
3,24
NE
-0,05
1,71
1,48
4,99
-0,11
1,65
1,55
5,26
N
-0,01
1,96
0,22
1,86
-0,02
2,01
Tabela 5.29: Estatísticas Descritivas das séries de resíduos
0,2
1,86
97
5.2.1.4.
Comparação dos modelos STVAR-Tree e PAR
Estatisticamente, os modelos STVAR-Tree e PAR(p) foram comparados
pelas medidas de MAPE no período out-of-sample, apresentadas na Tabela 5.30.
Conclui-se que a modelagem STVAR-Tree teve um ajuste muito superior em
comparação com a modelagem PAR. Duas das três estratégias de previsão do
STVAR-Tree, RC e ARC, apresentaram MAPE muito menores.
Out-of-sample
STVAR-Tree RC
STVAR-Tree MM
STVAR-Tree ARC
PAR
SE
1,64
10,54
3,29
13,02
S
4,89
31,19
7,58
11,73
NE
2,10
2,48
5,23
10,96
N
2,22
15,82
5,28
Tabela 5.30: Comparação dos modelos STVAR-Tree e PAR(p)
14,68
Este resultado mostra que o modelo não-linear multivariado denominado
STVAR-Tree é capaz de ser aplicado a problemas reais e que pode competir com
modelos já existentes. Neste caso, o modelo STVAR-Tree ganhou com uma
vantagem bastante expressiva.
5.2.2.
Preço spot de energia elétrica
Primeiramente, uma análise exploratória foi feita para conhecimento do
comportamento das séries de Preço spot de energia elétrica do mercado brasileiro,
no patamar médio de carga, medidas em (R$/MWh). Em seguida, para a
modelagem das séries de Preço spot, considerou-se o modelo STVAR-Tree e o
modelo PAR(p). A estratégia de separar 80% das observações na fase de
estimação e os 20% restantes para a previsão out-of-sample foi utilizada, e estes
números estão mais detalhados na Tabela 5.31.
Período
In-sample
Out-of-sample
Total
Divisão
(%)
80%
20%
100%
Observações
(univariada)
298
Observações
(multivariada)
1192
74
372
Tabela 5.31: Divisão dos dados
296
1488
98
A comparação dos modelos foi feita com base em medidas estatísticas no
período out-of-sample, considerando previsões de 1 passo à frente.
5.2.2.1.
Análise exploratória
Trata-se de séries semanais, coletadas no período de maio/2002 a
junho/2009, no total de 372 semanas de observações.
Média
Mediana
Desvio-padrão
Mínimo
Máximo
Assimetria
Curtose
SE
S
NE
55,86
56,61
51,26
28,13
27,26
18,59
71,41
71,79
76,89
4,00
4,00
4,00
569,59
569,59
569,59
3,90
3,83
3,71
25,03
24,37
20,77
Tabela 5.32: Estatísticas Descritivas das séries de Preço spot
N
51,38
18,59
72,12
4,00
569,59
3,95
25,00
O Gráfico 5.3 apresenta a evolução das séries de Preço spot ao longo das
semanas. Note que a série histórica apresenta elevada volatilidade e diversas
quebras estruturais. Vários são os motivos para explicar esse comportamento, a
maioria em razão de efeitos conjunturais ou estruturais da própria formação do
preço spot.
600,00
500,00
400,00
300,00
200,00
100,00
04/05/02-10/05/02
03/08/02-09/08/02
02/11/02-08/11/02
01/02/03-07/02/03
03/05/03-09/05/03
02/08/03-08/08/03
01/11/03-07/11/03
31/01/04-06/02/04
01/05/04-07/05/04
31/07/04-06/08/04
30/10/04-05/11/04
29/01/05-04/02/05
30/04/05-06/05/05
30/07/05-05/08/05
29/10/05-04/11/05
28/01/06-03/02/06
29/04/06-05/05/06
29/07/06-04/08/06
28/10/06-03/11/06
27/01/07-02/02/07
28/04/07-04/05/07
28/07/07-03/08/07
27/10/07-02/11/07
26/01/08-01/02/08
26/04/08-02/05/08
26/07/08-01/08/08
25/10/08-31/10/08
24/01/09-30/01/09
25/04/09-01/05/09
0,00
Preço_SE
Preço_S
Preço_NE
Preço_N
Gráfico 5.3: Evolução das séries de Preço spot
Como o preço não é, de fato, de mercado, e sim fornecido por modelos
computacionais, grandes variações semanais podem ocorrer, por exemplo, quando
99
parâmetros ou versões desses modelos matemáticos são alterados ou lançados, ou
até mesmo a adoção de valores não advindos dos modelos. Outro problema é
quando os próprios modelos matemáticos são abandonados. Um exemplo disso
ocorreu no período do racionamento de 2001/2002 quando alguns valores do PLD
semanal foram regulados pelo governo. Além disso, descontinuidades no Plano de
Expansão e alterações nos planos de reparo e manutenção de unidades térmicas,
limites na transmissão de energia entre sub-mercados, entre outros motivos, têm
feito com que a volatilidade das séries de preço seja elevada.
Devido à grande variabilidade dos dados, melhores resultados foram obtidos
ao aplicar o logaritmo natural às séries de Preço spot. E daqui para frente, somente
estas séries serão consideradas nas análises. A Tabela 5.33 fornece estatísticas
descritivas do logaritmo natural das séries de Preço spot. As médias das séries
apresentam valores semelhantes às medianas, com alguns desvios devido à baixa
dispersão medida pelos desvios-padrão. Nota-se que os valores de mínimo e
máximo não são distantes (entre 1,39 e 6,35).
ln(SE)
ln(S)
ln(NE)
lnN)
Média
3,48
3,49
3,30
3,34
Mediana
3,37
3,31
2,92
2,92
Desvio-padrão
1,04
1,07
1,07
1,06
Mínimo
1,39
1,39
1,39
1,39
Máximo
6,35
6,35
6,35
6,35
Assimetria
0,08
0,02
0,47
0,34
Curtose
2,63
2,62
2,91
2,67
Tabela 5.33: Estatísticas Descritivas do logaritmo natural das séries de Preço spot
A Tabela 5.34 apresenta as correlações entre as séries de Preço spot. É
possível notar as correlações elevadas entre todos os sub-mercados.
ln(SE)
ln(S)
ln(NE)
ln(N)
ln(SE)
ln(S)
ln(NE)
ln(N)
1
0,96
0,89
0,94
0,96
1
0,86
0,89
0,89
0,86
1
0,89
0,94
0,89
0,89
1
Tabela 5.34: Matriz de Correlação do logaritmo natural das séries de Preço spot
Visualmente, no Gráfico 5.4, é possível perceber a presença de tendência
crescente no início das séries dos quatro sub-mercados, porém na maior parte do
período analisado as séries apresentam comportamento de séries estacionárias,
uma vez que os níveis se mantêm constantes.
100
04/05/02-10/05/02
27/07/02-02/08/02
19/10/02-25/10/02
11/01/03-17/01/03
05/04/03-11/04/03
28/06/03-04/07/03
20/09/03-26/09/03
13/12/03-19/12/03
06/03/04-12/03/04
29/05/04-04/06/04
21/08/04-27/08/04
13/11/04-19/11/04
05/02/05-11/02/05
30/04/05-06/05/05
23/07/05-29/07/05
15/10/05-21/10/05
07/01/06-13/01/06
01/04/06-07/04/06
24/06/06-30/06/06
16/09/06-22/09/06
09/12/06-15/12/06
03/03/07-09/03/07
26/05/07-01/06/07
18/08/07-24/08/07
10/11/07-16/11/07
02/02/08-08/02/08
26/04/08-02/05/08
19/07/08-25/07/08
11/10/08-17/10/08
03/01/09-09/01/09
28/03/09-03/04/09
7,00
6,00
5,00
4,00
3,00
2,00
1,00
0,00
ln(SE)
ln(S)
ln(NE)
ln(N)
Gráfico 5.4: Evolução do logaritmo natural das séries de Preço spot
Para comprovar estatisticamente este resultado, o teste ADF (Augmented
Dickey-Fuller) foi realizado, baseado nos valores críticos de McKinnon para a
rejeição da hipótese nula, com as seguintes hipóteses:
H0: a série tem raiz unitária (não é estacionária)
H1: a série não tem raiz unitária (é estacionária)
Como resultados dos testes, temos a rejeição da hipótese de raiz unitária
para as séries, aos níveis de 1%, 5% e 10%.
ln(SE)
-2,19
ln(S)
ln(NE)
-2,52
-2,76
* valores críticos de McKinnon
1%*
-3,46
5%
-2,87
ln(N)
-2,78
10%
-2,57
Tabela 5.35: Teste Estatístico ADF
Portanto, a conclusão que tiramos é que o logaritmo natural das séries de
Preço spot não são estatisticamente estacionárias, considerando diferentes níveis
de significância. Neste caso, o teste de co-integração deve ser realizado, pois
somente na ausência de co-integração que o modelo STVAR-Tree deve ser
utilizado.
H0: as séries não são co-integradas
H1: as séries são co-integradas
101
Estatística
Equações de
Likelihood
Valor crítico Co-integração
Ratio
5%
Nenhuma(*)
138,95
47,21
Uma(*)
74,71
29,68
Duas(*)
38,98
15,41
Três(*)
6,42
3,76
Tabela 5.36: Teste Co-integração de Johansen
Pela estatística de teste de Razão de Verossimilhança, o teste de cointegração rejeita a hipótese nos levando a conclusão que as séries são cointegradas. Entretanto, ao definir o número de equações co-integradas, o
procedimento de Johansen sugere 4 equações, o que indica que temos uma matriz
de posto completo, nos indicando, assim, a ausência de co-integração entre as
séries testadas. Estritamente falando, as séries de Preço spot no período em
questão são integradas de ordem zero, I(0), portanto temos satisfeitas as condições
necessárias para usar o arcabouço da modelagem STVAR-Tree.
5.2.2.2.
STVAR-Tree
Para a escolha do modelo STVAR-Tree mais adequado ao logaritmo das
séries de Preço spot, foi utilizado o mesmo procedimento adotado na modelagem
de Vazão de rios. Estimou-se 13 modelos, cada um deles com o aumento de uma
unidade no número de defasagem nas séries das variáveis endógenas dos quatro
sub-sistemas brasileiros, começando na ordem 1 e alcançando o máximo de 13
defasagens (o equivalente a 3 meses).
As candidatas a possíveis variáveis de transição foram as 13 primeiras
defasagens nas séries das variáveis endógenas, as séries Energia Natural Afluente
(ENA, medidas em %MLT - Média de Longo Termo) e as séries de Energia
Armazenada (EARM, medidas em % do armazenamento máximo).
O grid de valores dos parâmetros não-lineares foi composto por:
•
•
Suavidade: = 1,5,10
Locação: percentis das candidatas a variável de transição, fixos em
= 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%.
Com a finalidade de evitar a estimação de árvores complexas e também de
reduzir o tempo computacional, limitou-se árvores com no máximo 8 folhas (nós
terminais).
102
Uma forma de ilustrar essa complexidade seria com a apresentação do
número de nós terminais e de parâmetros dos 13 modelos estimados, já
considerando o procedimento de limitação. Vale lembrar que o número que
identifica o modelo está associado à ordem de defasagem das variáveis
endógenas. A Tabela 5.37 mostra os números.
Número de
parâmetros
de
suavidade
Número de
parâmetros
locação Número de
parâmetros
lineares Φ
Modelo
Número de
nós
terminais
1
8
2
8
7
7
288
3
8
7
7
416
4
8
7
7
544
5
8
7
7
672
6
6
5
5
600
7
5
4
4
580
8
4
3
3
528
9
4
3
3
592
10
3
2
2
492
11
3
2
2
540
12
2
1
1
392
7
7
160
13
2
1
1
424
Tabela 5.37: Número de nós terminais e de parâmetros dos modelos estimados
Todos os modelos apresentaram crescimento da árvore e, com a limitação,
os modelos 1 a 5 possuem o número máximo de folhas. A partir dessa defasagem,
os modelos apresentam um decréscimo no número de nós terminais. Isto se deve
ao procedimento adotado de diminuir o nível de significância do teste, de acordo
com o crescimento da árvore.
Para cada modelo estimado, verificou-se os valores assumidos pelos
Critérios de Informação Akaike (AIC), Bayesian (BIC), Hannan-Quinn (HQ) e
Final Prediction Error (FPE). O objetivo então é selecionar o modelo que
minimiza esses valores. A Tabela 5.38 apresenta os valores dos quatro Critérios
de Informação para os 13 modelos estimados.
O modelo com somente 1 defasagem nas variáveis endógenas apresentou o
menor valor para AIC, BIC e HQ. O modelo com melhor capacidade preditiva,
pelo critério FPE, é o modelo 7. Porém, o modelo final não foi selecionado aqui
nesta etapa.
103
Modelo
AIC
BIC
FPE
HQ
1
6,63
-9,84
8,06E-06
-11,07
2
280,72
-2,95
-1,82E-06
-7,35
3
784,82
8,87
-2,34E-07
-0,66
4
1519,36
26,05
-6,19E-08
9,42
5
1828,19
41,22
-6,42E-08
18,76
6
1919,20
53,21
-2,23E-08
25,71
7
1778,97
63,45
-7,03E-08
32,43
8
1431,97
68,40
-3,91E-07
36,13
9
1875,05
89,61
-2,15E-07
48,90
10
1216,61
82,05
-3,56E-07
44,46
11
1520,78
101,71
-2,20E-07
56,32
12
699,99
79,41
-1,80E-06
43,47
13
855,43
94,97
-1,21E-06
Tabela 5.38: Critérios de Informação
52,85
Outras estatísticas, todas baseadas nos resíduos, foram utilizadas para
seleção do modelo mais adequado, tanto in-sample quanto out-of-sample. A
Tabela 5.39 apresenta as estatísticas Média, Variância, Assimetria e Curtose dos
resíduos no período in-sample. Todos os modelos possuem resíduos com média
nula, variância pequena. As medidas de assimetria e curtose apontam desvios dos
valores que indicam normalidade (0 e 3, respectivamente).
Modelo
SE
Média
Variância
Assimetria
Curtose
1
2
3
4
5
6
7
8
9
10
11
12
13
0,00
0,00
0,00
0,00
0,00
0,00
0,00
0,00
0,00
0,00
0,00
0,00
0,00
S
0,00
0,00
0,00
0,00
0,00
0,00
0,00
0,00
0,00
0,00
0,00
0,00
0,00
NE
0,00
0,00
0,00
0,00
0,00
0,00
0,00
0,00
0,00
0,00
0,00
0,00
0,00
NE
0,00
0,00
0,00
0,00
0,00
0,00
0,00
0,00
0,00
0,00
0,00
0,00
0,00
SE
0,03
0,03
0,02
0,02
0,02
0,01
0,02
0,02
0,02
0,02
0,02
0,03
0,03
S
0,04
0,04
0,02
0,03
0,03
0,02
0,03
0,03
0,03
0,04
0,03
0,04
0,04
NE
0,05
0,02
0,02
0,01
0,01
0,01
0,01
0,02
0,03
0,02
0,02
0,04
0,04
NE
0,03
0,03
0,02
0,01
0,01
0,01
0,01
0,02
0,01
0,02
0,02
0,03
0,03
SE
1,81
1,91
1,44
3,73
3,85
1,92
3,94
2,19
2,91
2,70
2,98
1,35
1,11
S
1,52
1,92
1,35
3,01
4,05
2,02
3,65
2,99
3,39
2,27
3,23
1,85
1,48
NE
1,63
1,86
2,07
0,31
0,12
2,34
0,48
0,78
1,73
1,74
3,11
0,72
0,97
NE
1,09
-0,47
0,68
0,25
0,90
0,67
0,19
-0,17
0,51
-0,34
-0,65
-1,07
-0,92
SE
11,88
16,99
13,37
33,71
37,04
17,62
40,77
20,22
25,68
21,97
27,37
11,52
7,47
S
9,20
15,05
10,58
23,18
33,77
16,45
29,29
23,85
27,70
15,19
26,75
12,84
10,47
NE
19,01
18,40
20,18
6,78
8,40
24,29
12,09
8,54
16,58
16,46
35,74
10,83
10,58
NE
8,67
10,12
6,48
5,66
7,10
9,72
6,49
7,76
8,20
7,40
Tabela 5.39: Estatísticas descritivas dos resíduos – in-sample
10,14
13,24
11,62
104
A Tabela 5.40 apresenta as estatísticas MSE, RMSE, MAE e MAPE. Os
valores de MSE, RMSE e MAE estão próximos a zero e as medidas de MAPE
apontam valores baixos, o que indica que os modelos estimados controlaram
bastante os erros in-sample. É interessante notar que todos os valores estão muito
próximos uns dos outros, não permitindo destacar um único modelo como o mais
adequado para representar as séries de Vazão de rios.
Modelo
MSE
RMSE
MAE
MAPE
1
2
3
4
5
6
7
8
9
10
11
12
13
SE
0,03
0,03
0,02
0,02
0,02
0,01
0,02
0,02
0,02
0,02
0,02
0,03
0,03
S
0,04
0,04
0,02
0,03
0,03
0,02
0,03
0,03
0,03
0,04
0,03
0,04
0,04
NE
0,05
0,02
0,02
0,01
0,01
0,01
0,01
0,02
0,03
0,02
0,02
0,04
0,04
N
0,03
0,03
0,02
0,01
0,01
0,01
0,01
0,02
0,01
0,02
0,02
0,03
0,03
SE
0,18
0,16
0,14
0,13
0,13
0,11
0,12
0,14
0,14
0,15
0,14
0,18
0,16
S
0,21
0,20
0,15
0,16
0,16
0,13
0,16
0,19
0,17
0,19
0,18
0,20
0,19
NE
0,23
0,15
0,14
0,10
0,10
0,11
0,11
0,15
0,16
0,14
0,13
0,20
0,20
N
0,17
0,16
0,13
0,10
0,11
0,09
0,11
0,14
0,12
0,14
0,13
0,18
0,17
SE
0,11
0,10
0,09
0,08
0,07
0,06
0,07
0,08
0,08
0,09
0,07
0,12
0,12
S
0,14
0,13
0,10
0,09
0,09
0,07
0,09
0,10
0,09
0,12
0,09
0,14
0,14
NE
0,12
0,09
0,09
0,06
0,06
0,06
0,06
0,10
0,10
0,09
0,07
0,13
0,13
N
0,11
0,10
0,09
0,07
0,07
0,05
0,07
0,09
0,07
0,09
0,07
0,12
0,11
SE
3,54
3,21
2,87
2,49
2,40
2,15
2,26
2,82
2,93
3,15
2,66
3,85
3,94
S
4,41
4,08
3,60
3,11
2,88
2,63
3,05
3,44
3,42
4,01
3,30
4,49
4,61
2,31
2,13
2,23
2,27
3,47
3,57
NE
3,85
3,17
2,99
N
3,69
3,35
2,89
2,40
2,38
1,86
2,65
3,07
2,79
Tabela 5.40: Estatísticas de erro dos modelos – in-sample
3,09
2,52
4,40
4,49
3,38
2,77
3,93
3,86
Por fim, verificou-se a normalidade dos resíduos dos modelos estimados,
mostrados na Tabela 5.41. Para esta análise, realizou-se a versão multivariada do
teste. O teste univariado de normalidade Jarque-Bera não foi realizado devido ao
tamanho da amostra ser considerado pequeno. Este teste apresenta melhores
desempenhos para amostras em torno de (ou maior que) 1000 observações.
Modelo
My‚÷y
M~ 5%
p-valor
1
2
3
4
5
6
7
8
9
10
11
12
13
0,00
0,00
0,00
0,00
0,00
0,00
0,00
0,00
0,00
0,00
0,00
0,00
0,00
7,81
7,81
7,81
7,81
7,81
7,81
7,81
7,81
7,81
7,81
7,81
7,81
7,81
1,00
1,00
1,00
1,00
1,00
1,00
1,00
1,00
1,00
1,00
1,00
1,00
1,00
Tabela 5.41: Teste de normalidade dos resíduos – in-sample
105
Conclui-se que os resíduos in-sample de todos os modelos seguem
distribuição Normal multivariada.
Além da análise dos critérios de informação, que aponta o modelo 1 como o
modelo mais adequado, e da análise dos resíduos in-sample, que apontam bons
ajustes dos modelos, estatísticas descritivas e de erro dos modelos no período outof-sample também foram geradas.
Depois de estimados os modelos, 3 tipos de previsão foram realizadas no
período out-of-sample: Combinação de Regimes (RC), Máxima Pertinência (MM)
e Combinação Adaptativa de Regimes (ARC), conforme descritas no Capítulo IV.
Analisar os resíduos gerados por modelos utilizando estes três métodos de
previsão determinará o modelo STVAR-Tree que melhor se adéqua aos dados.
Nesta etapa, os modelos de 1 a 13 competem entre si, pois alguns modelos
apresentam bons ajustes out-of-sample e outros não.
A Tabela 5.42 apresenta as estatísticas Média, Variância, Assimetria e
Curtose dos resíduos no período out-of-sample pelo método RC. Nem todos os
modelos possuem resíduos com média nula, variância pequena, assimetria
próxima a zero e curtose próxima a 3. Destacam-se com melhores resultados os
modelos 8, 12 e 13.
Modelo
Média
Variância
Assimetria
Curtose
1
2
3
4
5
6
7
8
9
10
11
12
13
SE
-2,61
47,30
237,04
2,36
25,14
4,28
0,84
-0,22
-88,88
1,95
106,06
-0,12
-0,08
S
-4,71
15,14
522,96
4,70
30,02
7,35
0,61
-0,16
-76,85
0,96
-11,51
-0,15
-0,10
NE
-2,38
13,07
-35,31
3,96
20,35
1,58
1,76
0,02
-34,23
3,04
85,84
-0,10
-0,03
NE
-2,74
23,52
68,28
0,72
31,32
2,76
0,36
-0,24
8,46
2,77
70,10
-0,17
-0,18
SE
170,41
1,0E+05
4,1E+05
57,83
2,3E+04
299,04
6,63
0,28
1,4E+05
56,93
6,9E+04
0,25
0,27
S
592,96
3,8E+04
1,7E+06
213,09
2,8E+04
1152,01
3,88
0,34
1,1E+05
22,55
3,0E+04
0,20
0,20
NE
160,72
1,2E+03
1,0E+05
213,68
1,5E+04
843,94
41,96
0,87
1,9E+04
150,35
2,5E+04
0,30
0,31
NE
191,28
6,4E+04
5,5E+04
31,39
4,6E+04
400,42
6,69
0,30
1,2E+04
87,73
5,8E+04
0,35
0,32
SE
-6,80
6,52
4,93
3,74
7,43
5,30
2,43
0,07
-3,28
4,71
2,31
0,18
0,04
S
-6,80
6,33
3,97
4,12
6,06
6,13
2,43
1,13
-3,37
4,28
0,50
-0,05
0,01
NE
-6,80
1,39
-2,44
3,39
6,53
-2,19
3,52
-0,47
-4,06
4,39
2,24
-0,74
-0,01
NE
-6,80
6,42
4,11
2,65
7,98
5,29
0,85
-0,55
0,52
4,59
1,67
-0,76
-1,08
SE
51,05
49,41
33,34
19,28
59,08
32,48
9,70
3,60
16,05
24,20
8,48
3,05
3,67
S
51,03
47,94
23,25
22,23
39,85
42,38
16,43
9,05
16,95
25,27
7,95
4,46
2,85
NE
51,11
6,07
17,34
14,00
46,05
28,51
16,77
8,58
21,49
21,35
7,11
8,25
5,86
NE
51,05
48,66
25,76
19,39
66,19
39,12
8,32
5,19
11,79
23,88
Tabela 5.42: Estatísticas descritivas dos resíduos (RC) – out-of-sample
8,45
4,78
6,09
106
Diferentemente do ocorrido no período in-sample, nem todos os valores de
MSE, RMSE, MAE e MAPE do período out-of-sample estão próximos a zero, o
que indica que alguns modelos estimados não conseguiram controlar os erros
neste período. A Tabela 5.43 apresenta as estatísticas, com destaque positivo para
os modelos 8, 12 e 13.
Modelo
MSE
RMSE
MAE
MAPE
1
2
3
4
5
6
7
8
9
10
11
12
13
SE
174,84
1,0E+05
S
606,90
3,7E+04
4,6E+05
62,61
2,0E+06
232,26
2,4E+04
313,19
7,25
0,33
1,4E+05
59,93
7,9E+04
0,26
0,27
2,8E+04
1189,97
4,19
0,36
1,1E+05
23,15
3,0E+04
0,22
0,21
NE
164,17
1,4E+03
1,0E+05
226,42
1,5E+04
834,71
44,48
0,86
2,0E+04
157,49
3,2E+04
0,31
0,31
N
196,15
6,3E+04
5,9E+04
31,47
4,6E+04
402,49
6,73
0,35
1,2E+04
94,20
6,2E+04
0,37
0,35
SE
13,22
3,2E+02
S
24,64
1,9E+02
6,7E+02
7,91
1,5E+02
17,70
2,69
0,57
3,8E+02
7,74
2,8E+02
0,51
0,52
1,4E+03
15,24
1,7E+02
34,50
2,05
0,60
3,3E+02
4,81
1,7E+02
0,47
0,46
NE
12,81
3,7E+01
3,2E+02
15,05
1,2E+02
28,89
6,67
0,93
1,4E+02
12,55
1,7E+02
0,56
0,55
N
14,01
2,5E+02
2,4E+02
5,61
2,1E+02
20,06
2,59
0,60
1,1E+02
9,71
2,4E+02
0,61
0,59
SE
2,72
8,9E+01
2,8E+02
3,10
2,6E+01
4,57
1,38
0,42
1,4E+02
2,26
1,3E+02
0,39
0,38
S
4,83
6,2E+01
6,1E+02
5,55
3,2E+01
7,78
1,16
0,42
1,2E+02
1,93
9,6E+01
0,34
0,35
NE
2,60
1,9E+01
1,3E+02
5,34
2,1E+01
7,96
2,54
0,59
5,5E+01
3,47
9,3E+01
0,38
0,40
N
2,87
7,8E+01
9,9E+01
2,41
3,3E+01
4,62
1,42
0,43
5,6E+01
3,33
1,2E+02
0,42
0,40
SE
58,70
2,1E+03
6,9E+03
79,59
6,2E+02
122,16
33,39
10,27
3,4E+03
54,11
3,4E+03
9,72
9,60
S
102,71
1,4E+03
1,5E+04
139,31
7,8E+02
202,39
27,70
10,01
2,9E+03
43,99
2,3E+03
8,20
8,63
NE
61,17
5,0E+02
3,5E+03
135,86
7,0E+02
221,57
64,81
15,40
1,4E+03
83,81
2,4E+03
10,05
10,52
N
68,25
2,4E+03
3,2E+03
73,61
1,0E+03
145,69
45,40 12,14 1,6E+03 103,74
Tabela 5.43: Estatísticas de erro dos modelos (RC) – out-of-sample
3,6E+03
12,12
11,53
Por fim, verificou-se a normalidade (somente na versão multivariada do
teste) dos resíduos dos modelos estimados no período out-of-sample, mostrados
na Tabela 5.44.
Modelo
My‚÷y
M~ 5%
p-valor
1
2
3
4
5
6
7
8
9
10
11
12
13
1,26
1,34
2,96
2,29
0,90
1,07
2,33
3,27
1,43
2,06
3,86
2,25
1,38
7,81
7,81
7,81
7,81
7,81
7,81
7,81
7,81
7,81
7,81
7,81
7,81
7,81
0,74
0,72
0,40
0,51
0,83
0,79
0,51
0,35
0,70
0,56
0,28
0,52
0,71
Tabela 5.44: Testes de normalidade dos resíduos (RC) – out-of-sample
Conclui-se que os resíduos de os modelos neste período seguem distribuição
Normal multivariada.
107
Considerando o método de previsão RC, os modelos 8, 12 e 13 foram os que
melhor apresentaram resultados para os resíduos, em todas as análises. Selecionase, portanto, estes modelos como os candidatos aos mais adequados.
Considere, agora, o tipo MM de previsão. A Tabela 5.45 apresenta as
estatísticas Média, Variância, Assimetria e Curtose dos resíduos. Destacam-se os
modelos 8, 12 e 13 por possuírem resíduos com médias próximas a zero,
variâncias pequenas, assimetrias próximas a zero e curtoses próximas a 3.
Modelo
Média
Variância
Assimetria
Curtose
1
2
3
4
5
6
7
8
9
10
11
SE
-1,86
28,31
-4838,89
S
-3,21
-5,49
-2086,70
18,07
-7049,50
36,74
-5593,02
NE
-1,68
-4,75
-624,13
-13,53
-5220,35
NE
-2,02
12,38
-3275,96
9,32
-3688,39
SE
181,42
1,0E+05
4,1E+05
9,7E+02
1,9E+07
7,8E+05
12
13
-1420,44
-7,21
-0,62
-69,49
0,44
-1470,09
-0,15 -0,08
926,46
13,84
-0,42
-66,77
0,40
-1255,25
-0,10 -0,06
795,91
32,82
-0,11
-41,85
0,45
-178,57
-0,10 -0,01
-1134,26
36,04
-0,66
19,76
0,61
-846,90
-0,21 -0,23
25,34
0,29
1,1E+05
1,21
9,8E+06
0,25
0,27
S
625,58
3,8E+04
1,7E+06
4,1E+03
1,2E+07
2,8E+05
138,90
0,34
9,5E+04
2,15
5,8E+06
0,20
0,20
NE
170,38
1,2E+03
1,0E+05
1,8E+03
1,0E+07
2,2E+05
711,13
0,88
4,6E+04
2,17
3,8E+05
0,30
0,31
NE
203,13
6,4E+04
5,5E+04
5,9E+02
5,3E+06
4,9E+05
885,45
0,31
1,0E+04
3,24
3,3E+06
0,35
0,32
SE
-8,29
6,52
4,93
0,14
0,99
1,11
1,56
0,02
-3,18
0,73
0,78
0,19
0,04
S
-8,30
6,33
3,97
0,37
0,99
-1,13
-1,47
1,12
-2,95
-0,10
0,62
-0,11
0,02
NE
-8,29
1,39
-2,44
1,67
0,99
-1,07
-1,28
-0,47
-6,02
2,89
1,39
-0,74 -0,01
NE
-8,29
6,42
4,11
-1,39
0,99
1,10
-1,39
-0,53
3,13
-0,31
0,82
-0,73 -1,08
SE
69,86
49,41
33,34
3,84
1,98
2,31
5,29
3,48
17,16
9,41
2,76
3,06
3,67
S
69,96
47,94
23,25
3,12
1,98
2,29
4,67
8,99
13,57
7,61
2,41
4,32
2,85
NE
69,83
6,07
17,34
9,75
1,98
2,15
4,51
8,38
41,74
13,83
4,48
8,24
5,86
NE
69,85
48,66
25,76
9,22
1,98
2,26
3,95
5,05
20,65
Tabela 5.45: Estatísticas descritivas dos resíduos (MM) – out-of-sample
6,64
2,95
4,77
6,05
As estatísticas MSE, RMSE, MAE e MAPE do período out-of-sample do
tipo MM de previsão, indicam que os modelos 8, 12 e 13 controlam bem os erros
devido aos valores baixos nas medidas MSE, RMSE e MAE. A Tabela 5.46
apresenta os resultados.
Modelo
SE
MSE
RMSE
1
2
3
4
5
6
7
8
9
10
11
12
13
182,35
1,0E+05
2,3E+07
1291,84
6,8E+07
2,7E+06
77,03
0,66
1,1E+05
1,39
1,1E+07
0,27
0,27
S
627,18
3,7E+04
6,0E+06
5417,64
4,3E+07
1,1E+06
328,59
0,51
9,8E+04
2,28
7,3E+06
0,20
0,20
NE
170,82
1,2E+03
4,9E+05
1999,19
3,7E+07
8,5E+05
1778,66
0,88
4,7E+04
2,34
4,0E+05
0,31
0,31
N
204,39
6,3E+04
1,0E+07
677,28
1,8E+07
1,7E+06
2172,09
0,73
1,1E+04
3,56
4,0E+06
0,39
0,37
SE
13,50
324,76
4880,58
35,94
8295,48
1670,86
8,78
0,81
344,60
1,18
3451,63
0,52
0,52
108
MAE
MAPE
S
25,04
193,77
2465,87
73,60
6581,50
1069,38
18,13
0,71
313,59
1,51
2701,13
0,45
0,45
NE
13,07
35,44
700,58
44,71
6143,06
926,20
42,17
0,94
217,16
1,53
638,29
0,56
0,55
N
14,30
251,63
3284,34
26,02
4340,47
1333,48
46,61
0,86
105,33
1,89
2013,69
0,62
0,61
SE
1,96
102,35
4838,89
21,95
7050,12
1442,91
8,01
0,68
120,07
0,86
2623,88
0,40
0,38
S
3,35
76,96
2313,03
44,31
5593,46
926,67
16,22
0,56
109,01
1,04
2058,59
0,32
0,35
NE
1,87
26,84
637,58
26,15
5220,85
797,64
36,64
0,60
60,62
0,86
462,54
0,38
0,40
N
2,12
86,12
3275,96
15,65
3689,06
1151,63
41,27
0,72
46,25
1,29
1525,44
0,43
0,41
SE
41,70
2430,42
1,13E+05
491,12
1,55E+05
31942,70
180,99
16,50
2940,51
19,60
59010,65
9,97
9,59
S
69,55
1823,96
52979,59
981,98
1,23E+05
20460,44
363,25
13,28
2635,57
23,05
45794,87
7,82
8,42
NE
40,70
669,20
15776,37
599,34
1,16E+05
17851,51
836,07
15,67
1701,09
19,90
10672,35
10,08
10,43
N
46,88
2679,58
84431,46
394,88
86630,63
27208,79
1004,20 20,01 1272,66
Tabela 5.46: Estatísticas de erro dos modelos (MM) – out-of-sample
30,80
36155,36
12,56
11,89
Verificou-se a normalidade na versão multivariada do teste dos resíduos no
período out-of-sample, mostrados na Tabela 5.47. Para os modelos 3, 5, 6, 7 e 8
não temos a distribuição Normal multivariada dos resíduos.
Modelo
My‚÷y
M~ 5%
p-valor
1
2
3
4
5
6
7
8
9
10
11
12
13
0,61
0,24
29,59
6,12
24,51
24,91
20,90
12,86
1,34
3,36
5,54
2,37
1,52
7,81
7,81
7,81
7,81
7,81
7,81
7,81
7,81
7,81
7,81
7,81
7,81
7,81
0,89
0,97
0,00
0,11
0,00
0,00
0,00
0,00
0,72
0,34
0,14
0,50
0,68
Tabela 5.47: Testes de normalidade dos resíduos (MM) – out-of-sample
Então, pelo tipo de previsão MM, os candidatos a modelos STVAR-Tree
são 12 e 13.
Por último, mas não menos importante, o tipo ARC de previsão. A Tabela
5.48 mostra as estatísticas Média, Variância, Assimetria e Curtose dos resíduos.
Apesar de alguns modelos apresentarem médias próximas a zero, as variâncias
não são baixas. Além disso, as medidas de assimetria e curtose estão afastadas
daquelas que sugerem a normalidade. Destacam-se positivamente nesta análise os
modelos 8, 11, 12 e 13.
Modelo
Média
Variância
1
2
3
4
5
6
7
8
9
10
11
12
13
SE
6,94
-0,72
16,89
0,46
50,78
-0,73
1,72
0,03
-0,19
0,21
0,06
0,02
0,03
S
5,75
-0,34
18,26
0,54
49,68
-0,78
1,74
0,01
-0,16
0,24
0,07
0,04
0,05
NE
4,97
-0,32
74,33
0,49
52,73
-0,69
1,65
0,00
-0,26
0,19
0,05
-0,03
-0,01
NE
1,67
-0,33
74,38
0,43
52,69
-0,74
1,62
-0,02
-0,33
0,12
-0,04
-0,08
-0,02
SE
2072,79
23,39
2,0E+05
3,58
1,4E+05
118,85
178,04
2,68
6,68
2,41
0,74
2,20
1,78
109
S
1554,87
NE
1425,20
21,28
5,1E+06
3,36
1,5E+05
112,95
NE
546,44
22,69
5,1E+06
3,63
1,5E+05
112,14
SE
3,81
-4,79
2,82
3,33
7,48
-7,17
S
3,78
-3,71
2,87
4,43
7,48
NE
4,03
-2,59
0,55
4,16
7,48
Assimetria
4,84
2,1E+05
5,01
1,4E+05
119,28
177,31
2,73
5,77
2,58
0,66
1,89
1,49
194,33
2,56
7,56
2,77
0,83
2,43
2,00
193,17
2,14
6,95
2,46
0,61
2,25
2,07
7,18
0,26
-5,01
2,42
1,23
0,11
-0,28
-7,17
7,17
0,05
-5,05
3,12
1,58
0,57
0,25
-7,13
7,16
0,81
-4,65
2,35
1,24
-0,14
-0,52
NE
1,99
-2,90
0,55
3,73
7,48
-7,20
7,23
0,13
-5,11
2,22
-0,14
-0,50
-0,50
SE
19,49
30,90
19,60
17,23
57,33
54,45
54,34
8,11
32,69
12,79
6,59
5,81
6,35
S
20,86
19,19
20,80
27,29
57,29
54,45
54,27
9,26
33,38
17,31
8,33
6,24
6,35
NE
24,56
21,62
24,12
25,42
57,32
54,06
54,19
8,58
29,08
13,52
8,79
5,48
6,15
NE
17,75
23,16
24,12
22,37
57,32
54,68
54,89
7,02
33,46 13,08
Tabela 5.48: Estatísticas descritivas dos resíduos (ARC) – out-of-sample
5,47
5,15
5,86
Curtose
As estatísticas MSE, RMSE, MAE e MAPE do tipo ARC de previsão
indicam que os modelos que não conseguiram controlar os erros neste período. Os
resultados estão muito ruins, a exceção do modelo 11. A Tabela 5.49 apresenta os
resultados.
Modelo
MSE
RMSE
MAE
MAPE
1
2
3
4
5
6
7
8
SE
2086,47
23,52
2,0E+05
3,73
1,47E+05
117,41
178,03
2,64
S
1562,00
4,87
2,0E+05
5,22
1,40E+05
117,89
177,38
2,68
NE
1426,12
21,03
5,0E+06
3,54
1,58E+05
111,55
193,81
2,52
N
540,12
22,42
5,0E+06
3,75
1,58E+05
110,83
192,58
SE
45,68
4,85
450,32
1,93
383,22
10,84
13,34
9
10
11
12
13
6,60
2,41
0,73
2,16
1,75
5,70
2,60
0,66
1,86
1,47
7,50
2,76
0,82
2,39
1,96
2,11
6,94
2,44
0,60
2,22
2,04
1,62
2,57
1,55
0,85
1,47
1,32
S
39,52
2,21
456,84
2,28
374,74
10,86
13,32
1,64
2,39
1,61
0,81
1,36
1,21
NE
37,76
4,59
2244,44
1,88
397,90
10,56
13,92
1,59
2,74
1,66
0,91
1,55
1,40
N
23,24
4,74
2244,10
1,94
397,90
10,53
13,88
1,45
2,64
1,56
0,78
1,49
1,43
SE
15,09
1,52
122,79
0,96
56,58
2,50
2,95
0,96
1,08
0,91
0,56
1,00
0,87
S
13,45
0,89
122,74
1,01
55,41
2,49
2,95
0,93
0,99
0,85
0,51
0,91
0,79
NE
12,53
1,65
520,23
0,92
58,65
2,48
3,03
0,99
1,18
0,94
0,57
1,04
0,91
N
8,35
1,64
519,79
1,00
58,64
2,38
2,95
0,92
1,04
0,87
0,51
1,02
0,92
SE
414,13
38,51
2734,77
23,24
1367,63
59,19
70,95
23,24
25,97
21,78
13,95
24,26
21,04
S
321,58
21,32
2719,51
24,09
1330,03
58,25
70,64
21,61
23,07
19,79
12,15
21,14
18,44
NE
377,17
42,59
1,1E+04
23,89
1456,20
70,02
75,90
25,57
30,09
24,17
15,32
26,47
23,57
N
237,54
48,65
1,8E+04 27,42
1464,43
71,43
77,62
26,04 26,98 23,28
Tabela 5.49: Estatísticas de erro dos modelos (ARC) – out-of-sample
14,77
28,02
25,06
Verificou-se a normalidade na versão multivariada do teste dos resíduos no
período out-of-sample, mostrados na Tabela 5.50. Todos os modelos não
rejeitaram a hipótese de normalidade.
110
Modelo
My‚÷y
M~ 5%
p-valor
1
2
3
4
5
6
7
8
9
10
11
12
13
0,52
0,43
0,04
1,77
0,54
0,15
0,47
0,00
0,27
0,47
0,13
0,03
0,02
7,81
7,81
7,81
7,81
7,81
7,81
7,81
7,81
7,81
7,81
7,81
7,81
7,81
0,92
0,93
1,00
0,62
0,91
0,99
0,92
1,00
0,97
0,93
0,99
1,00
1,00
Tabela 5.50: Testes de normalidade dos resíduos (ARC) – out-of-sample
Depois de analisar todos esses resultado, desde o número de parâmetros em
cada modelo, os Critérios de Informação, as estatísticas dos resíduos in-sample e
out-of-sample dos três tipos de previsão, o modelo que apresentou melhor ajuste
aos dados de Vazão de rios foi o modelo 12. Este modelo foi, então, o selecionado
para representar o STVAR-Tree no confronto com a modelagem Neuro-Fuzzy.
A Figura 5.12 ilustra a árvore estimada pelo modelo 12, identificando o
valor estimado pelo parâmetro de suavidade e de locação , além da
variável de transição ^hçk N.
Figura 5.12: Árvore estimada do modelo 12
A interpretação da árvore é feita da seguinte maneira: para estimar as séries
de Preço spot, o modelo STVAR-Tree mais adequado sugere uma árvore com dois
regimes, com uma transição bruta æ = 34,07 determinada pela primeira
defasagem do preço spot do sub-mercado Nordeste. O ponto de corte desta
variável de transição ocorre no valor = 2,94. Portanto, para Preço spot do
Nordeste (logaritmo) com valores menores que 2,94, as séries de Preço spot dos
quatro sub-mercados são estimadas pelo Regime 1, com 40% de pertinência. Para
Preço spot do Nordeste (logaritmo) com valores maiores ou iguais 2,94 as séries
de Preço spot dos quatro sub-mercados são estimadas pelo Regime 2, com 60% de
pertinência.
111
5.2.2.3.
Neuro-Fuzzy
O emprego de um sistema Neuro-Fuzzy permitiu que o processo de escolha
de “variáveis explicativas” e seus pesos relativos fossem encontrados de maneira
automática, sem a necessidade de decisões empíricas e arbitrárias, baseadas no
conhecimento ou experiência de especialistas. Para a estimação dos parâmetros da
modelagem Neuro-Fuzzy utilizou-se Sistema Adaptativo de Inferência NeuroFuzzy (ANFIS), tendo como saída as séries de Preço spot de cada um dos submercados (SE, S, NE e N), um por vez, e as estradas foram as defasagens destas
séries acrescidas das defasagens das séries de ENA e EARM, dos respectivos submercados.
Definiu-se uma estratégia de seleção para estimar automaticamente toda a
combinação possível de modelos levando-se em consideração o número de
defasagens e o número de variáveis explicativas. No caso em questão, temos três
variáveis (Preço, ENA e EARM). A Tabela 5.51 mostra as variáveis, para cada
sub-mercado, de acordo com a ordem da defasagem estipulada.
Ordem da
defasagem
Variáveis
1
Preço(t-1)
ENA(t-1)
EARM(t-1)
2
Preço(t-1)
ENA(t-1)
EARM(t-1)
3
Preço(t-1)
Preço(t-2)
ENA(t-2)
EARM(t-2)
ENA(t-1) EARM(t-1) Preço(t-2) ENA(t-2) EARM(t-2) Preço(t-3) ENA(t-3)
Tabela 5.51: Variáveis disponíveis de acordo com a ordem da defasagem
EARM(t-3)
Quando estipulamos o número máximo de defasagens igual a dois, temos
então um total de 63 combinações, sendo 6 modelos com uma variável de entrada,
15 com duas variáveis, 20 com três variáveis, 15 com quatro variáveis, 6 com
cinco variáveis e, finalmente, 1 com seis variáveis de entrada. Neste último caso,
entram no modelo todas as variáveis com defasagens t-1 e t-2.
Cabe aqui uma ressalva importante, pois quando o número máximo de
defasagens é maior que 2, o número de modelos a ser estimado é muito grande.
Por exemplo, para d=3 o total de modelos estimados será 511, o que eleva (e
muito) o tempo de execução do programa, particularmente quando o número de
variáveis de entrada de um modelo é superior a seis.
Os dados de entrada foram linearmente normalizados, de modo a pertencer
ao intervalo [-1,1]. O método utilizado é denominado Max-Min, dado por:
112
|_lk^ÅjÆc*jXk =
| − Åcl|
Åj| | − Åcl| (5.10)
Os 80% iniciais do banco de dados foi utilizado para “treinar” os modelos
neuro-fuzzy (estimar os parâmetros do sistema) e os 20% restantes para validar as
previsões a partir dos modelos. Definiu-se os seguintes parâmetros para o sistema
ANFIS:
1)
2)
3)
4)
100 épocas para o treinamento da rede;
Erro de aprendizado de 0,1%;
2 MF (membership functions);
Função de pertinência em formato de sino;
Uma análise dos resíduos foi feita para a escolha dos modelos mais
adequados, em cada sub-mercado. Em geral, dentre os 63 modelos estimados,
adotou-se que o melhor modelo era aquele com o menor MAPE no conjunto de
validação.
A Tabela 5.52 identifica os modelos mais adequados para cada submercado. O modelo para o Sudeste teve como variáveis de entrada, Preçot-1 e
ENAt-1. Para Sul e Norte, somente a variável Preçot-1 foi utilizada como entrada.
E, por fim, para o Nordeste, as variáveis de entrada selecionadas foram Preçot-1 e
EARMt-1.
Sub-mercado
Preçot-1
ENAt-1
SE
x
x
S
x
NE
x
N
EARMt-1
Preçot-2
ENAt-2
EARMt-2
x
x
Tabela 5.52: Modelos selecionados pela modelagem Neuro-Fuzzy
A Tabela 5.53 mostra as estatísticas MSE, RMSE, MAE e MAPE, de cada
um dos sub-mercados nos períodos in-sample e out-of-sample.
In-sample
Out-of-sample
MSE
RMSE
MAE
MAPE
MSE
RMSE
MAE
MAPE
SE
0,05
0,22
0,14
4,52
0,09
S
0,14
0,38
0,24
8,08
0,09
0,3
0,2
4,34
0,3
0,25
5,27
NE
0,17
0,41
0,26
9,23
0,4
0,63
0,57
11,92
N
0,11
0,31
6,7
0,34
0,2
7,18
0,18
0,42
Tabela 5.53: Estatísticas de erro dos modelos– in-sample e out-of-sample
113
5.2.2.4.
Neuro-Fuzzy
Estatisticamente,
os
modelos
STVAR-Tree
e
Neuro-Fuzzy foram
comparados pelas medidas de MAPE no período out-of-sample, apresentadas na
Tabela 5.54. Conclui-se que, em geral, a modelagem STVAR-Tree não teve um
ajuste superior ao ajuste da modelagem Neuro-Fuzzy. Entretanto, duas das três
estratégias de previsão do STVAR-Tree, RC e ARC, apresentaram MAPE
melhores para o sub-mercado Nordeste.
Out-of-sample
STVAR-Tree RC
STVAR-Tree MM
STVAR-Tree ARC
NeuroFuzzy
SE
9,72
9,97
24,26
4,34
S
8,20
7,82
21,14
5,27
10,05
10,08
26,47
11,92
NE
N
12,12
12,56
28,02
Tabela 5.54: Comparação dos modelos STVAR-Tree e Neuro-Fuzzy
6,70
Este resultado mostra que o modelo não-linear multivariado denominado
STVAR-Tree é capaz de ser aplicado a problemas reais e que pode competir com
modelos já existentes.
114
6
Conclusão
Nesta dissertação foi considerada uma nova formulação de modelo nãolinear multivariado, o qual combina o modelo não-linear STVAR (Smooth
Transition Vector Autoregressive) com a metodologia CART (Classification and
Regression Tree). O modelo resultante é denominado STVAR-Tree e tem como
base o conceito de múltiplos regimes, definidos por uma árvore binária
A especificação do modelo é feita através de testes de hipóteses LM
(Lagrange Multiplier). Desta forma, o crescimento da árvore é condicionado à
existência de não-linearidade nas séries modeladas.
Para cada divisão, são estimados os parâmetros lineares, por Mínimos
Quadrados Multivariados, e os parâmetros não-lineares, por Mínimos Quadrados
Não-Lineares. No momento em que o teste LM rejeita a hipótese de nãolinearidade (e divisão de todos os nós) na profundidade em que a árvore se
encontra, o procedimento de crescimento da árvore é finalizado e o modelo
estimado é o modelo final.
Como forma de avaliação do modelo STVAR-Tree proposto nesta
dissertação, foram realizados diversos experimentos de Monte Carlo com o
objetivo de constatar a funcionalidade tanto do teste LM quanto da estimação do
modelo STVAR-Tree.
Quanto à avaliação do teste LM conclui-se que o teste acusa problemas na
identificação de não-linearidade para amostras de tamanho pequeno, o que indica
uma tendência para a aceitação da linearidade. Por isso, quanto maior o tamanho
da amostra, maior o poder do teste LM, independente do nível de significância e
de valores dos parâmetros não-lineares.
Em relação à funcionalidade do modelo STVAR-Tree conclui-se que, para
amostras pequenas, a tendência é subestimar os parâmetros lineares, independente
do nível de significância do teste LM. Para amostras médias e grandes, o modelo
STVAR-Tree estima corretamente os parâmetros. Mas apesar de amostras
pequenas subestimarem os parâmetros, como resultado final da estimação, os
115
modelos conseguem capturar toda a estrutura e ajustar valores próximos aos
valores observados.
Na estimação dos parâmetros não-lineares constatou-se que, para valores de
γ_nominal muito baixos, o modelo STVAR-Tree superestima este parâmetro,
independente do tamanho da amostra e do nível de significância. Conforme
aumentamos o valor de γ_nominal, o modelo melhora as estimativas de æ, com
destaque para amostras grandes. O modelo STVAR-Tree não apresenta problemas
para estimar o parâmetro de locação c.
Após a realização dos experimentos de Monte Carlo, o modelo STVARTree foi aplicado às séries brasileiras de Vazão de Rios e às séries de Preço Spot
de energia elétrica do mercado brasileiro. Com a finalidade de evitar a estimação
de árvores complexas e também de reduzir o tempo computacional, limitou-se
árvores com no máximo 8 folhas (nós terminais).
No primeiro estudo, constatou-se, estatisticamente, que o modelo STVARTree comparado ao modelo PAR(p) através das medidas de MAPE no período
out-of-sample, teve um ajuste muito superior. Duas das três estratégias de
previsão do STVAR-Tree, RC e ARC, apresentaram MAPE muito melhores.
No segundo estudo, conclui-se que, em geral, a modelagem STVAR-Tree
não teve um ajuste superior ao ajuste da modelagem Neuro-Fuzzy. Entretanto,
duas das três estratégias de previsão do STVAR-Tree, RC e ARC, apresentaram
MAPE melhores para o sub-mercado Nordeste.
Estes resultados das duas aplicações mostram que o modelo não-linear
multivariado denominado STVAR-Tree é capaz de ser aplicado a problemas reais
e que pode competir com modelos já existentes, lineares ou não-lineares. No
primeiro caso, o modelo STVAR-Tree ganhou do modelo PAR(p) com uma
vantagem bastante expressiva. E no segundo, o modelo STVAR-Tree ganhou da
modelagem Neuro-Fuzzy em uma das quatro séries.
Como trabalho futuro fica a recomendação da extensão dos modelos nãolineares multivariados. E isto pode ser feito a partir da detecção da presença de um
vetor de co-integração num sistema. Então, ao invés de estimar o modelo
STVAR-Tree, deve-se desenvolver e estimar um modelo, o qual pode ser
denominado STVEC-Tree.
116
Referências Bibliográficas
[1]
AKAIKE, H. A new look at the statistical model identification. IEEE
Transactions on Automatic Control 19 (6): 716–723, 1974.
[2]
ALTISSIMO F, CORRADI V. Bounds for inference with nuisance
parameters present only under the alternative. Econometrics Journal 5:
494–519, 2002.
[3]
BALKE, N.; FOMBY; T. Threshold cointegration. International
Economic Review 38, 627–645, 1997.
[4]
BOX, G.; JENKINS, C.; REISEL, G. Time series analysis: Forecasting
and control. Englewood Cliffs: Prentice Hall, 1994.
[5]
BREIMAN, L.; FRIEDMAN, J.; OLSHEN, R.; STONE, C. J.
Classification and Regression Trees. Belmont Wadsworth Int. Group,
New York, 1984.
[6]
CAMACHO, M. Vector Smooth Transition Regression Models for US
GDP and the Composite Index of Leading Indicators. Journal of
Forecasting 23: 173-196, 2004.
[7]
CHAN, K.; TONG, H. On estimating thresholds in autoregressive
models. Journal of Time Series Analysis, 7, 179–190, 1986.
[8]
CLEMENTS, M.; KROLZIG, H. A comparison of the forecast
performance of Markov-switching and threshold autoregressive
models of US GNP. Econometrics Journal 1, C47–C75, 1998.
[9]
COSTA, F. et al. Modelagem Estocástica de Previsão de Vazões Mensais:
PREVIVAZM, XV Simpósio Brasileiro de Recursos Hídricos, Curitiba,
PR, Brasil, 2003.
[10]
EIRTHEIM, O., TERÄSVIRTA, T. Testing the adequacy of smooth
transition autoregressive models. Journal of Econometrics, Vol. 74, pp.
59-76, 1996
117
[11]
ENGLE, R.; GRANGER C. Co-Integration and Error Correction:
Representation, Estimation, and Testing. Econometrica, Vol. 55, No 2,
pp. 251-276, 1987.
[12]
EPPRECHT, C. Modelos de Transição Suave para Média e
Volatilidade Realizada Aplicados à Previsão de Retornos e Negociação
Automática. 132p. Dissertação de Mestrado, PUC-Rio, Departamento de
Engenharia Elétrica, Rio de Janeiro, 2008.
[13]
FRANSES, P.; TERÄSVIRTA, T. Introduction to the special issue:
nonlinear
modeling
of
multivariate
macroeconomic
relations.
Macroeconomic Dynamics, vol 5, 461-465, 2001.
[14]
GALVÃO, A. Structural Break Threshold VARs for Predicting US
Recessions Using the Spread. Journal of Applied Econometrics 21: 463–
487, 2006.
[15]
GODFREY, L. G. Misspecification Tests in Econometrics: the
Lagrange Multiplier Principle and Other Approaches. Cambridge
University Press, 1988.
[16]
GRANGER, C. Some Properties of Time Series Data and Their Use in
Econometric Model Specification. Journal of Econometrics, 121-130,
1981.
[17]
GRANGER, C.; TERÄSVIRTA, T. Modelling Nonlinear Economic
Relationships. Oxford University Press, Oxford, 1993.
[18]
HAMILTON, J. Time Series Analysis. Princeton University Press,
Princeton, 1994.
[19]
HANSEN, B. Testing linearity. Journal of Economic Surveys 13, 551–
576, 1999.
[20]
HILLEBRAND, E.; MEDEIROS, M. Forecasting realized volatility
models: the benefits of bagging and nonlinear specifications. Texto
para Discussão do Dept. de Economia, PUC-Rio, 2007.
[21]
HIPEL, K.; MCLOAD, A. Time Series Modelling of Water Resources
and Environmental Systems. Elsevier Science, 1994.
[22]
HORNIK,
K.;
(feedforward)
STINCHOMBE,
networks
Networks, 2, 359–366, 1989.
are
M.;
WHITE,
universal
H..
Multi-layer
approximators.
Neural
118
[23]
HUANG; CHEN; CAMACHO. Determinants of Japanese Yen Interest
Rate Swap Spreads: Evidence from a Smooth Transition Vector
Autoregressive Model. Journal of Futures Markets (28), No.1, pp 82107, 2008.
[24]
JOHANSEN, S. Statistical analysis of cointegrating vectors. Journal of
Economic Dynamics and Control, Vol. 12, pp. 231-254, 1988.
[25]
KASUYA, M. Regime-switching approach to monetary policy effects.
Applied Economics, Volume 37, Issue 3, pages 307 – 326, 2005.
[26]
KAVKLER; BÖHM, BORSIC. Smooth, Transition vector errorcorrection (STVEC) models: An application to real exchange rates.
[27]
KAVKLER; MIKEK; BÖHM, BORSIC, Nonlinear econometric models:
The smooth transition regression approach.
[28]
KOOP, G.; PESARAN M.; POTTER, S. Impulse response analysis in
nonlinear multivariate models. Journal of Econometrics, vol74; 119-147,
1996.
[29]
LEKKOS, I., MILAS, C.; PANAGIOTIDIS T. Forecasting interest rate
swap spreads using domestic and international risk factors: evidence
from linear and non-linear models. Journal of Forecasting, Forthcoming,
2006.
[30]
LEWIS, P.; STEVENS, J. Nonlinear modeling of time series using
multivariate adaptative regression splines. Journal of the American
Statistical Association, 86, 864–877, 1991.
[31]
LÜTKEPOHL, H. New Introduction to Multiple Time Series Analysis.
Springer, New York, 2005.
[32]
LUUKKONEN, R; SAIKKONEN, P; TERÄSVIRTA, T.
Testing
linearity against smooth transition autoregressive models. Biometrika
75, 491-499, 1988.
[33]
LO, M.; ZIVOT, E. Threshold Cointegration and Nonlinear
Adjustment to the Law of One Price. Macroeconomic Dynamics,
Volume 5, Issue 04, pp 533-576, 2001.
[34]
MACEIRA, M.; TERRY, L. et al. Chain of Optimization Models for
Setting the Energy Dispatch and Spot Price in the Brazilian System.
IEEE Power System Computation Conference, Servilla, Session 43, p. 1-7,
2002.
119
[35]
MCALEER, M.; MEDEIROS, M. Realized volatility: a review.
Econometric Reviews, 27, 10-45, 2008.
[36]
MEDEIROS, M. C., VEIGA, A. A flexible coefficient smooth transition
time series model. IEEE Transactions on Neural Networks, 16, 97-113,
2005.
[37]
MEDEIROS, M. C., VEIGA, A. Modeling multiple regimes in financial
volatility with a flexible coefficient GARCH model. Econometric
Theory, to appear, 2008.
[38]
MEDEIROS, M.; VEIGA, A. A hybrid linear-neural model for time
series forecasting. IEEE Transactions on Neural Networks, 11, 1402–
1412, 2000.
[39]
MEDEIROS, M.; VEIGA, A. Diagnostic checking in a flexible nonlinear time series model. Journal of Time Series Analysis, 24, 461–482,
2003.
[40]
MEDEIROS, M.; VEIGA, A.; PEDREIRA, E. Modeling Exchange rates:
smooth transition, neural networks, and linear models. IEEE
Transactions on Neural Networks, 12, 755-764, 2001.
[41]
RIPATTI A.; SAIKKONEN, P. Vector Autoregressive Processes with
Nonlinear Time Trends in Cointegrating Relations. Macroeconomic
Dynamics, Volume 5, Issue 04, pp 577-597, 2001.
[42]
ROSA, J. Modelos de Regressão com Transição Suave Estruturados
por Árvores. 157p. Tese de Doutorado, PUC-Rio, Departamento de
Engenharia Elétrica, Rio de Janeiro, 2005.
[43]
ROSA J., VEIGA, A., MEDEIROS, M. Tree structured smooth
transition regression models. Computational Statistics and Data
Analysis, 52, 2469-2488, 2008.
[44]
ROSA, J., RAMOS, G., VEIGA, A. Application of STAR-Tree Model to
Brazilian Stock Market Time Series. Working Paper do DEE, PUC-Rio,
Apr 2005.
[45]
ROSENBLAT, F. A comparison of several perceptron models. In:
Books, S., editor, SELF-ORGANIZING SYSTEMS, volume 1. Spartan
Books, Washington D.C., 1962.
[46]
ROTHMAN, P.; van DIJK, D; FRANSES, P. A Multivariate STAR
Analysis
of
the
Relationship
Between
Money
and
Output.
120
Macroeconomic Dynamics 5, 506-532, 2001.
[47]
ROTHMAN, P.; MILAS, C. Multivariate STAR unemployment rate
forecasts. Econometrics, num 0502010, 2005.
[48]
SALAS, J.; DELLEUR, J.; YEVJEVICH, V.; LANE, W. Applied
modelling of hydrologic time series. Water Resources Publications,
484p, 1980.
[49]
SCHWARZ, G. Estimating the dimension of a model. Annals of
Statistics 6 (2): 461–464, 1978.
[50]
SEO, B. Testing for Nonlinear Adjustment in Smooth Transition
Vector Error Correction Models. Econometric Society Far Eastern
Meetings, No. 749, 2004.
[51]
SIMS, C. Macroeconomics and reality. Econometrica, V.48, N0.1, 1-48,
1980.
[52]
SKALIN, J.; TERÄSVIRTA, T. Modeling Asymmetries and Moving
Equilibrium in Unemployment Rates. Macroeconomic Dynamics 6,
202-241, 2002.
[53]
SRIPINIT, T. Asymmetric Monetary Policy Responses in the US
Economy: Smooth Transition Vector Autoregressive. Working paper,
2008.
[54]
TAYLOR, S. Modelling Financial Time Series. John Wiley, Chichester,
UK, 1986.
[55]
TERÄSVIRTA, T. Specification, estimation, and evaluation of smooth
transition autoregressive models. Journal of the American Statistical
Association, 89, 208-218, 1994.
[56]
TONG, H. Non-linear Time Series: A Dynamical System Approach.
Oxford University Press, 1990.
[57]
TONG, H. On a threshold model. In: Chen, C, H., editor, In Patern
Recognition and Signal Processing, volume 5. Sijhoff Noordhoff,
Amsterdam, 1978.
[58]
TONG, H. Threshold models in non-linear time series analysis: lecture
notes in statistics 21. Berlin: Springer-Verlag, 1983.
[59]
TONG, H.; LIM, K. Threshold autoregressions, limit cycles, and data,
Journal of the Royal Statistical Society B 42, 245-92, 1980.
[60]
TSAY, R. Testing and modeling threshold autoregressive processes.
121
Journal of the American Statistical Association, 84, 231-240, 1989.
[61]
TSAY, R. Testing and modeling multivariate threshold models. Journal
of the American Statistical Association 93, 1188-1202, 1998.
[62]
VAN DIJK, D.; FRANSES, P. Modelling multiple regimes in the
business cycle. Macroeconomic Dynamics, 3:311–340, 1999.
[63]
VAN DIJK, D.; T.TERÄSVIRTA; FRANSES, P.. Smooth transition
autoregressive models - A survey of recent developments. Econometric
Reviews, 21, 1-47, 2002.
[64]
VAN DIJK, D. Smooth Transition Models: Extensions and Outlier
Robust Inference. Tinberg Institute: Amsterdam, 2001.
[65]
WEISE, C. The asymmetric effects of monetary policy: a nonlinear
vector autoregression Approach. Journal of Money, Credit, and Banking
31, 85-108, 1999.
[66]
ZADEH, L. Fuzzy sets. Information and Control, 8, 338–353, 1965.
Download

Alexandre José dos Santos Modelos Vetoriais Auto