O Básico da Análise de Regressão com Dados de Séries Jaci2 ED Séries2006 Mestrado em Informática/UFES Profs Flávio e Magnos Economics 20 - Prof. Anderson 1 Séries Temporais vs. Dados de corte transversal Séries temporais têm uma ordenação temporal; Passado pode afetar o futuro; Há aleatoriedade em dados temporais? Processo estocástico ou processo de série temporal; Não há amostras aleatórias de indivíduos, apenas a realização de um único processo estocástico. O tamanho da amostra de um conjunto de dados de séries temporais é o número de períodos em que observamos as variáveis de interesse. Economics 20 - Prof. Anderson 2 Exemplos de Modelos: Modelos Estáticos Um modelo estático relaciona duas variáveis contemporaneamente: yt = b0 + b1zt + ut Estático → modela uma relação contemporânea (entre duas ou mais variáveis); Interessante quando se acredita que z tem um efeito imediato em y. Exemplo clássico: curva de Philips estática (relaciona taxa de inflação e taxa de desemprego); Economics 20 - Prof. Anderson 3 Exemplos de Modelos: Modelos de Defasagens Distribuidas Finitas Permite que uma ou mais variáveis afetem y com defasagens: yt = a0 + d0zt + d1zt-1 + d2zt-2 + ut Um modelo de defasagens finitas de ordem q inclui q defasagens de z. Chamamos d0 de propensão de impacto ou mutiplicador de impacto. Chamamos d0 + d1 +…+ dq de propensão de longo prazo (PLP) ou de multiplicador de longo prazo. Devido à multicolinearidade (correlação substancial em zt ,zt-1, zt-2 …), Pode ser difícil conseguir estimativas individuais precisas dos dj . Economics 20 - Prof. Anderson 4 Hipóteses para Inexistência de Viés do MQO ST .1: Linear nos parâmetros: yt = b0 + b1xt1 + . . .+ bkxtk + ut ST .2: Média condicional zero: E(ut|X) = 0, t = 1, 2, …, n Obs.: A média condicional zero implica que o erro no tempo t, ut, é não-correlacionado com cada regressor em todos os períodos de tempo. Economics 20 - Prof. Anderson 5 Hipóteses para Inexistência de Viés do MQO Em E(ut|X) = 0, X é uma matriz de todas as variáveis independentes vs. o tempo; Exogeneidade contemporânea: E(ut|xt)=0; Exogeneidade estrita: E(ut|X) = 0; Economics 20 - Prof. Anderson 6 Hipóteses para Inexistência de Viés ST .3: Inexistência de colinearidade perfeita: nenhum regressor é constante ou é uma combinação linear perfeita dos outros. Sob essas 3 hipóteses os estimadores MQO são não-viesados; Economics 20 - Prof. Anderson 7 Hipóteses para Inexistência de Viés A hipótese de amostra aleatória foi descartada; Essa hipótese implicava que os ui eram independentes; ST .2 garante essa propriedade (exogeneidade strita); Economics 20 - Prof. Anderson 8 Homoscedasticidade ST .4: Homoscedasticidade: Var(ut|X) = Var(ut) = s2 Significa que Var(ut|X) não depende de X e é constante ao longo do tempo; Exige dos fatores não-observáveis que estejam afetando o regressando com uma variância constante ao longo do tempo; Economics 20 - Prof. Anderson 9 Inexistência de Correlação serial ST .5: Inexistência de Correlação serial: Os erros em dois períodos de tempo diferentes devem ser não correlacionados: Corr(ut,us| X)=0 for t s Economics 20 - Prof. Anderson 10 Variâncias Amostrais do MQO Sob essas 5 hipóteses de Gauss-Markov, as variâncias do MQO para dados de séries temporais são as mesmas do MQO para dados de corte transversal. Var(^βj|X) = s2/[SQTj (1 - Rj2)], j = 1, …k, MQO permanesce BLUE Economics 20 - Prof. Anderson 11 Inferência sob as Hipóteses do Modelo Linear Clássico Com a hipótese adicional ST .6: Normalidade (erros normais), não há nenhuma alteração no modo de como fazer inferência para MQO de séries temporais; Sob essas 6 hipóteses tudo que aprendemos sobre estimadores e inferência das regressões de corte transversal aplica-se diretamente às regressões em séries temporais. Economics 20 - Prof. Anderson 12 Variáveis DUMMY São variáveis independentes binárias (ou dummy); Principais componentes para fazer estudo de evento; Exemplo: gfr: taxa geral de fertilidade (para cada 1000 mulheres) pe: taxa de insenção de impostos ww2: = 1 para os anos de 1941 a 1945 (segunda guerra) pill: = 1 apartir de 1963 (1ª pílula anticoncepcinal) Economics 20 - Prof. Anderson 13 Variáveis DUMMY Cada variável é estatisticamente significante ao nível de 1%; ww2 = 24: Significa que houve cerca de 24 nascimentos a menos para cada 1000 mulheres durante a segunda guerra mundial; Economics 20 - Prof. Anderson 14 Números Índices Medida estatística idealizada para mostrar as oscilações de uma variável em função de: tempo, posição geográfica … Exemplo: Indices de Inflação/Preço; Valores Nominais vs.Valores reais; Usar índices de preço para transformar uma série temporal em valores nominal para valores reais; Economics 20 - Prof. Anderson 15 Tendência em Séries Temporais Muitas séries temporais econômicas têm uma tendência temporal; Não se pode assumir que duas séries com tendência (na mesma direção ou opostas) tenham uma relação causal; Provavelmente, essa falsa relação causal é devido a fatores não-observados diversos; Como capturar adequadamente uma tendência? Economics 20 - Prof. Anderson 16 Tendência Temporal Linear Uma tendência linear pode ser modelada como: yt = a0 + a1t + et, t = 1, 2, … Mantendo todos os outros fatores fixos (em et), a1 mede a mudança em yt em intervalo de tempo Outra possibilidade é: E(yt) = a0 + a1t Economics 20 - Prof. Anderson 17 Tendência Temporal Linear Economics 20 - Prof. Anderson 18 Tendência Temporal Exponencial Muitas séries econômicas são bem aproximadas por uma tendência exponencial, cujo modelo pode ser dado por: log(yt) = a0 + a1t + et, t = 1, 2, … Caracteriza uma taxa (percentual) média constante de crescimento; a1 = ∆log(yt) ≈ (yt – yt-1) /yt-1 Economics 20 - Prof. Anderson 19 Tendência Temporal Exponencial Economics 20 - Prof. Anderson 20 Tendência Temporal Quadrática Apesar de menos comum, algumas tendências mais complicadas podem requerer um modelo quadrático: yt = a0 + a1t + a2t2 + et, t = 1, 2, … Economics 20 - Prof. Anderson 21 Variáveis com Tendência e Análise de Regressão Variáveis com tendência não violam as hipóteses do modelo linear clássico; O problema da regressão espúria. A adição de uma tendência temporal elimina esse problema: É o mesmo que usar séries “destendenciadas”na regressão; O modelo reconhece que y pode ter uma tendência nãorelacionada aos regressores; Nesse caso, omitir t a regressão geralmente levará a estimadores viesados; Economics 20 - Prof. Anderson 22 Variáveis com Tendência e Análise de Regressão Exemplo: invpc : investimento imobiliário real per capita price: índice de preco de imóveis A elasticidade de invpc em relação a price é estatisticamente significante e não é estatisticamente ≠ 1 Economics 20 - Prof. Anderson 23 Variáveis com Tendência e Análise de Regressão Adicionando uma tendência temporal: A elasticidade de invpc em relação a price é negativa e não é estatisticamente ≠ 0 Não podemos concluir que invpc não é afetado por price; Fatores não-observados, que afetam invpc e price, não foram modelados; A tendência temporal indica um crescimento de 1% ,em média, em invpc; Economics 20 - Prof. Anderson 24 Variáveis com Tendência e Análise de Regressão Outro Exemplo (Equação da Fertilidade): gfr: taxa geral de fertilidade (para cada 1000 mulheres); pe: taxa de insenção de impostos; ww2: = 1 para os anos de 1941 a 1945 (segunda guerra); pill: = 1 apartir de 1963 (1ª pílula anticoncepcinal); Conclusão: O coeficiente pe triplicou e é muito mais significante; Curioso: pill deixou de ser significante; Economics 20 - Prof. Anderson 25 Variáveis com Tendência e Análise de Regressão Outro Exemplo (Equação da Fertilidade): Tgf apresentou tanto tendência crescente e decrescente durante o periodo de 1913 a 1984; O que sugere o uso de tendência quadrática: Conclusão: O coeficiente de pe aumentou ainda mais, permanescendo significante; pill passou a ter efeito em gfr, sendo marginalmente; Economics 20 - Prof. Anderson 26 Inclusão de uma Tendência Temporal: Retirada de Tendência É possível mostrar que β1 e β2 na equação: Podem ser obtidos assim: Compute a regressão de y1,xt1 e xt2 sobre uma constante e t; Economics 20 - Prof. Anderson 27 Inclusão de uma Tendência Temporal: Retirada de Tendência Encontre os resíduos: Ϋt pode ser entendida como uma variável que teve sua tendência temporal retirada; Fazendo a regressão de Ϋt sobre ¨xt1 e ¨xt2 encontramos β1 e β2; Economics 20 - Prof. Anderson 28 Inclusão de uma Tendência Temporal: Retirada de Tendência Obs.: o grau de ajuste (R2) quando a variável dependente apresenta uma tendência pode apresentar problemas; O autor sugere regredir primeiro Ϋt sobre ¨xt1 e ¨xt2 e depois calcular R2 assim(SSR=SQR): Economics 20 - Prof. Anderson 29 Sazonalidade Com certa freqüência, séries temporais exibem alguma periodicidade; Exemplo: Vendas trimestrais do varejo; A sazonalidade pode ser tratada com a inclusão de um conjunto de variáveis dummys sazonais; Economics 20 - Prof. Anderson 30 Sazonalidade Modelo geral para dados mensais: fevt …dezt são variáveis dummy; β0 é o intercepto de janeiro; Se não houver sazonalidade: δ1 ... δ11 = 0 (pode ser verificado por um teste F) Economics 20 - Prof. Anderson 31 Sazonalidade Assim como na inclusão de tendência temporal em uma regressão, a inclusão de variáveis dummy pode ser interpretada como dessazonalização dos dados; Isso pode ser concluído regredindo-se a variável dependente e todas independentes sobre as dummies mensais, em seguida regredindo-se a variável dependente sobre as independentes (sem as dummies); Economics 20 - Prof. Anderson 32