Previsão da precipitação pluviométrica na cidade de Natal-RN, com modelos de séries temporais Naje Clécio Nunes da Silva 1 Thelma Sáfadi 2 Joel Jorge Nuvunga3 Wederson Leandro Ferreira4 Oseas Machado Gomes5 André Barbosa Ventura da Silva6 INTRODUCÃO Uma série temporal é um conjunto de observações ordenadas no tempo, representada por Zt ; t 1, , n , e que pode ser representada por um modelo de decomposição de soma de três componentes não-observáveis, Zt Tt St at , (1) em que: Tt é a componente que explica a tendência da série, isto é, o aumento ou diminuição dos valores observados segundo um comportamento que pode ser polinomial ou exponencial; St é a componente que explica a sazonalidade da série, isto é, fenômenos que ocorrem regularmente (diariamente, semanalmente, mensalmente, entre outros); at é a componente aleatória ou erro. A suposição usual é que at seja uma série puramente aleatória ou ruído branco, com média zero e variância constante . Segundo Morettin & Toloi (2006), a tendência pode ser entendida como aumento ou diminuição gradual das observações ao longo do tempo, a sazonalidade indica possíveis flutuações ocorridas sempre em períodos menores ou iguais a doze meses e a componente aleatória mostra oscilações aleatórias irregulares. O principal interesse em considerar o modelo (1), é estimar a tendência Tt e a sazonalidade St , já que estas estão intrinsecamente ligadas, e faz com que a série Z t não atinja seu estágio estacionário, condição exigida na metodologia de ajuste dos modelos de Box e Jenkins. Uma vez estimadas Tt e St , elas são subtraídas de Z t , restando apenas uma estimativa da componente aleatória at . 1 Doutorando do Programa de Pós-Graduação em Estatística e Exp. Agropecuária – UFLA, agradecimento a FAPEMIG pelo apoio financeiro 2 Docente do Programa de Pós-Graduação em Estatística e Exp. Agropecuária – UFLA 3 Mestrando do Programa de Pós-Graduação em Estatística e Exp. Agropecuária – UFLA 4 Doutorando do Programa de Pós-Graduação em Estatística e Exp. Agropecuária – UFLA 5 Mestrando em Biometria e Estatística Aplicada - UFRPE 6 Mestre do Programa de Pós-Graduação em Estatística e Exp. Agropecuária – UFLA 1 O objetivo deste trabalho é ajustar uma série temporal aos dados anuais da série climatológica de precipitação pluviométrica da cidade de Natal - RN, no período de 1911 a 1977. MATERIAL E MÉTODOS A série temporal utilizada no presente estudo é climatológica referente à precipitação pluviométrica na cidade de Natal localizada no Estado do Rio Grande do Norte, situada a 05°47’42” de latitude Sul, 35°12’34” de longitude Oeste, da região nordeste do Brasil. Os dados são anuais e compreendem o período de 1911 a 1977, totalizando 67 observações. Inicialmente a série foi analisada graficamente para observar seu comportamento, em seguida para saber se a série possui ou não tendência foi utilizado o teste de CoxStuart (Morettin e Toloi, 2006), que consiste em agrupar as observações em pares Z1, Z1c , cada par , Z N c , Z N , onde c Zi , Zi c N N 1 , se N for par e c , se N for ímpar. A 2 2 será associado ou sinal “ ” se Zi Zi c , ou “ ” se Zi Zi c . Quando Zi Zi c , o par Zi , Zi c não é considerado. Seja n o número de pares onde Zi Zi c . Tem-se as seguintes hipótese a serem testadas: H 0 : P Zi Zi c P Zi Zi c , i , isto é, não há tendência; H1 : P Zi Zi c P Zi Zi c , i , isto é, há tendência. A estatística usada pelo teste é: se T2 n t , rejeita-se H 0 , em que: T2 é o número de pares com sinal “ ”, sendo que t é encontrada numa tabela de distribuição binomial com p 0,5 e n , para algum nível de significância considerado. Quando n 20 é recomendado utilizar distribuição normal aproximada da distribuição binomial. Se a série possui tendência determinística, ajusta-se a uma função do tempo como um polinômio, uma exponencial ou outra função suave de t. Em seguida, aplica-se a primeira (ou segunda) diferença nos dados originais e analisam-se os valores da função de autocorrelação. Para verificar sazonalidade da série pluviométrica, de acordo com Morettin & Toloi (2006), a componente sazonal ocorre regularmente em período de no máximo 12 meses. Como a série é anual não estuda a sazonalidade, pois só poderá ter ciclos. 2 Na determinação de qual o melhor modelo que se ajusta aos dados, utilizou-se os modelos propostos por Box & Jenkins (1970), auto-regressivos integrados de médias móveis - ARIMA (p,d,q), dados por: 1 B B 1 2 2 .... p B p 1 B Zt 1 1B 2 B 2 .... q B q at , d (2) Para testar qual melhor modelo se ajustou a série, Akaike (1973) sugere escolher o modelo cujas ordens p e q minimizem o critério. O critério de Akaike, na comparação de diversos modelos, com N fixo, pode ser expresso por: AIC (k , l ) N log ˆ a2 2(k l 2), (3) em que ˆ a2 é o estimador de máxima verossimilhança de a2 , 0 k p e 0 l q . O melhor modelo será aquele que apresentar menor AIC. Para testar a autocorrelação dos resíduos estimados foi utilizado o Teste de BoxPierce (1970), que tem como estatística , com uma distribuição aproximada da qui-quadrado 2 (4) com K – p – q graus de liberdade. Tem-se as seguintes hipóteses: H 0 : os resíduos estimados são ruídos brancos versus H1 : os resíduos estimados não são , então rejeita-se H 0 , ou seja, os resíduos ruídos brancos. Se estimados não são ruídos brancos para algum nível de significância considerado. Todas as análises foram feitas no software Gretl. RESULTADOS E DISCUSSÃO A Figura 1 mostra o gráfico da série anual de precipitação pluviométrica. Nota-se aparentemente que a série apresenta um comportamento estável ao longo dos anos evidenciando que a série é estacionária. Porém, deve-se verificar se a mesma possui tendência. 4000 Precipitação Pluviométrica 3500 3000 2500 2000 1500 1000 500 1910 1920 1930 1940 1950 1960 1970 Ano Figura 1: Gráfico da série anual de precipitação pluviométrica em Natal – RN, no período compreendido entre 1911 a 1977. 3 Aplicou-se o teste do sinal (Cox-Stuart) para verificar se a série possui tendência. Considerando-se o nível de tem-se que: de significância e tomando-se as 67 observações, e . O fato de obtém t . O número de sinais positivos , aproxima-se a distribuição binomial pela normal e 22,71 . Como T2 13 11, 29 34 22,71 n t , então rejeita-se H 0 ao nível de 5% de probabilidade, isto é, a série apresenta tendência, que mostrou-se ser determinística (polinomial de 1º grau). Para tornar a série estacionária foi necessária uma diferença. Da série estacionária aplicou-se a metodologia de Box & Jenkins. Observa-se na Figura 2, que a série diferenciada livre de tendência. Com base nas funções de autocorrelação (fac) e autocorrelação parcial (facp), foram propostos os seguinte modelos: modelo 1 ARIMA(1,1,0): (1 B) Zt 1Zt 1 modelo 2 ARIMA(0,1,1): (1 B) Zt at 1at 1 modelo 3 ARIMA(1,1,1) (1 B)Zt 1Zt 1at 1at 1 1500 1000 Precipitacao 500 0 -500 -1000 -1500 -2000 1910 1920 1930 1940 1950 1960 1970 Anos Figura 2: Gráfico da série diferenciada da precipitação pluviométrica pelo polinômio de 1º grau. Dos três modelos, o melhor pelo critério de Akaike foi o modelo ARIMA(1,1,1) sem constante (modelo 3) que apresentou menor Akaike. Sendo que os parâmetros do modelo ajustado pelo método da máxima verossimilhança são: ˆ1 =0,80 e ˆ1 =-0,60, ao nível de significância de 5%. O teste de Box & Pierce foi realizado e verificou-se que os resíduos são um ruído 2 33, 23 , ao nível de significância de 5%. branco, já que Q(24) 15,02 (22) 4 Na Figura 3, tem-se os valores reais de 1911 a 1977 da série de precipitação pluviométrica, bem como as previsões de 1978 a 1982, com o intervalo de confiança de 95% de probabilidade. 4000 Precipitacao previsão Intervalo a 95 por cento 3500 3000 2500 2000 1500 1000 500 1945 1950 1955 1960 1965 1970 1975 1980 Figura 3: Série de precipitação pluviométrica da cidade de Rio Grande do Norte com valores reais e previsões. CONCLUSÕES A precipitação pluviométrica na cidade de Natal – RN, apresenta uma tendência crescente e linear. Tendo se ajustado melhor ao modelo ARIMA(1,1,1), com boas previsões da precipitação pluviométrica. REFERÊNCIAS BIBLIOGRÁFICAS AKAIKE, H. Maximum likelihood identification of Gaussian autoregressive moving average models. Biometrika, 1973. v. 60, p. 255-265. BAIOCCHI, G.; DISTASO, W. GRETL: Econometric software for the GNU generation disponível em: http://gretl.sourceforge.net/win32/index_pt.html. BOX. G. E. P.; PIERCE, D. A. Distribution of residuals autocorrelations in autoregressive-integrated moving average time series models. Journal of the America Statistical Association, Washington, 1970. v. 65, p. 1509- 1526. BOX, G.; JENKINS, G. Time series analysis: forecasting and control. San Francisco: Holden-Day, 1970. 575 p. MORETTIN, P; TOLOI, C. Análise de series temporais. 2.ed. São Paulo: Edgard Blücher, 2004. 546p. 5