Uso de séries temporais na análise da temperatura média mensal da cidade de Mossoró, RN Ben Dêivide de Oliveira Batista 1 2 Tales Jesus Fernandes 2 Thelma Sáfadi2 Wesley de Oliveira Santos3 1 Introdução As mudanças climáticas terão grande influência nos sistemas naturais até 2023 e seus resultados serão expressos, principalmente, por meio do aumento da temperatura global. Os impactos gerados pelas mudanças climáticas significarão novos comportamentos em relação ao tema e será maior a pressão para a conservação e o manejo racional dos recursos ambientais no processo produtivo, inclusive com normas ambientais mais rı́gidas (EMBRAPA, 2008). Nas últimas décadas houve um progresso significativo no campo da previsão de tempo. Dentre essas previsões probabilı́sticas, os modelos de séries temporais da classe ARIMA (autorregressivo integrado de médias móveis) possuem grande destaque. Define-se uma série temporal como um conjunto de observações ordenadas em intervalo de tempo. A análise de séries temporais tenta procurar alguma relação de dependência temporal entre os dados, identificando o mecanismo gerador da série com o objetivo de extrair periodicidades relevantes nas observações, bem como, descrever o seu comportamento e fazer previsões (BAYER e SOUZA, 2010). No presente estudo, analisou-se uma série de temperatura média mensal da cidade de Mossoró, RN, com o objetivo de realizar a análise e a previsão da série temporal, por meio do modelo SARIMA (BOX e JENKINS, 1976). Também será verificado se o ruı́do branco, com média zero, tem variância constante ou condicionada ao longo do tempo. Caso tenha variância condicionada (volatilidade), será modelada pelo processo ARCH (MORETTIN e TOLOI, 2006). 2 Material e métodos Os dados de temperatura média usados neste trabalho são valores médios mensais coletados pela Estação Meteorológica da Universidade Federal Rural do Semiárido, a 1,5m de altura da superfı́cies, cujas coordenadas de posição são: latitude 5◦ 12’36” S; longitude 37◦ 18’43” 1 e-mail: [email protected] - UFLA. Agradecimentos a CAPES e FAPEMIG pelo apoio financeiro. 3 DCAT - UFERSA 2 DEX 1 W e altitude 40,5m acima do nı́vel do mar, estando localizado a apenas 40 km do Atlântico Norte. A série estudada compreende o perı́odo de janeiro de 1970 a junho de 2008, totalizando 38 anos e seis meses de observações. De acordo com a classificação climática de Köppen, o clima de Mossoró é do grupo BSwh’, isto é, tropical semiárido muito quente e com estação chuvosa ocorrendo no verão-outono, apresentando temperatura média de 27,4◦ C, precipitação pluviométrica anual muito irregular, com média de 673,9mm, e umidade relativa do ar de 68,9% (CARMO FILHO et. al., 1989). Inicialmente a série foi analisada graficamente e em seguida com o propósito de verificar a tendência utilizou-se o teste não paramétrico de Cox-Stuart. Para verificar a periodicidade, utilizou-se o teste de Fisher. Após identificar os componentes da série, utilizou-se o operador diferença para torná-la estacionária, já que é um pré-requisito para a utilização dos modelos Box e Jenkins. Foram ajustados os modelos do tipo autorregressivo integrado de médias móveis sazonal (SARIMA), em que a qualidade do ajuste foi verificado por meio do teste Box Pierce, com base na estatı́stica Q da autocorrelação. O modelo SARIMA(p,d,q)(P,D,Q) pode ser definido pela seguinte expressão: 12 φ(B)Φ(B12 )∆d ∆D 12 Zt = θ(B)Θ(B )at , (1) em que φ(B) = 1 − φ1 B − φ2 B2 − . . . − φ p B p é o operador autorregressivo de ordem p; θ(B) = 1 − θ1 B − θ2 B2 − . . . − θq Bq é o operador de médias móveis de ordem q; Φ(B12 ) = 1 − Φ1 B12 − Φ2 (B12 )2 − . . . − ΦP (B12 )P é o operador autorregressivo sazonal de ordem P; Θ(B12 ) = 1 − Θ1 B12 − Θ2 (B12 )2 − . . . − ΘQ (B12 )Q é o operador de médias móveis sazonal de ordem Q; ∆d é o operador diferença simples, d indicando o número de diferenças, e ∆D é o operador diferença sazonal, D indicando o número de diferenças sazonais; at é o ruı́do, que eventualmente, pode ser ruı́do branco; com a notação, tem-se que BZt = Zt−1 e ∆ = 1 − B. Os modelos ajustados foram avaliados por meio do critério de Akaike (AIC) para identificar o melhor modelo e o Critério do erro quadrático médio (EQM) para escolher o modelo que fornece as melhores previsões. Um processo at diz-se um processo ARCH de ordem q se, at = σt εt , 2 2 + . . . + αq at−q , com σt2 = α0 + α1 at−1 (2) em que σt é uma sequência não negativa de variâncias aleatórias, εt é uma sequência de variáveis aleatórias independentes e identicamente distribuı́das de valor médio nulo e variância unitária e os parâmetros αi têm de satisfazer um conjunto de condições (α > 0 e αi ≥ 0, i = 1, 2, . . . , q) de forma a assegurar que a variância não condicionada é positiva. Quando σt é constante ao longo do tempo então at é um ruı́do branco. 2 3 Resultados e discussões Na Figura 1 é apresentado a série temperatura média mensal da cidade de Mossoró, RN, e com a análise visual se observa a existência da sazonalidade, e uma mudança no nı́vel da série a partir de 1980, dando indı́cios de tendência. Pelo teste de Cox-Stuart, observou-se a presença da componente tendência na série. O teste Fisher detectou existência de sazonalidade de 12 meses na série, conforme em geral ocorre em séries de temperatura. Figura 1: Gráfico da série de temperatura média (◦ C) da cidade de Mossoró, RN de jan/1970 a jun/2008. Após tomar a primeira diferença, eliminou-se a tendência, e tomando uma diferença de doze para eliminar a sazonalidade, observou-se que ainda existem “lags” múltiplos de doze significativos na função de autocorrelação, indicando a existência da sazonalidade estocástica. Assim, se faz necessário utilizar os modelos do tipo SARIMA, pois será necessário acrescentar uma componente sazonal, no perı́odo máximo de 12 meses. Por meio da Função de Autocorrelação (FAC) e Função de Autocorrelação Parcial (FACP) com uma diferença e uma diferença sazonal de doze, Figura 2, será sugerido a ordem dos modelos ajustados. Figura 2: Função de Autocorrelação e Função de Autocorrelação Parcial da série de temperatura média (◦ C) da cidade de Mossoró, RN de jan/1970 a jun/2008. Os modelos ajustados são apresentados na Tabela 1, com os critérios AIC, EQM, estatı́stica Q e valor-p do teste Box-Pierce. Este último, confirma a qualidade do ajuste dos modelos, mostrando que seus resı́duos são ruı́dos brancos. Verificou-se que o modelo mais bem ajustado, informado pelo menor valor critério AIC, e melhor para previsão, informado pelo menor valor do critério EQM, entre os três modelo escolhidos, foi um SARIMA(2,1,1)(0,1,1). Assim, para esse modelo, na Tabela 2 observam-se os valores estimados para os coeficientes, assim como os respectivos erros-padrão. 3 Tabela 1: Critério para o melhor modelo ajustado e o melhor modelo de previsão. Critério Teste Box Pierce Modelo AIC MSE Q valor-p SARIMA(1,1,1)(0,1,1) 635,0852 0,25664 37,1730 0,7902 SARIMA(2,1,1)(0,1,1) 632,3582 0,25522 33,4242 0,8770 SARIMA(0,1,1)(0,1,1) 657,9350 0,27901 50,3533 0,3053 Tabela 2: Coeficientes do modelo SARIMA(1,1,1)(0,1,1) e respectivos erros-padrão. Coeficientes Estimativa Erro-padrão φ1 0,66165 0,0471609 φ2 0,10388 0,0474255 θ1 -1,00000 0,0456534 Θ1 -1,00000 0,0756167 Ainda para o modelo SARIMA(2,1,1)(0,1,1), será mostrado na Figura 3, a previsão e os valores reais de jan/2000 a jun/2008, bem como a previsão de julho a dezembro de 2008, Tabela 3, que não constaram no banco de dados, com o intervalo de confiança de 95% de probabilidade. Figura 3: Temperatura estimada e observada para o perı́odo de jan/2000 a jun/2008 Para identificar se o resı́duo tem variância constante ou condicionada, pegou-se a função de autocorrelação do resı́duo ao quadrado, Figura 4. Pode-se verificar que a variância não é constante, já que alguns “lags” estão fora do intervalo de confiança. Assim, com base na Figura 4, usou-se o modelo ARCH(1) para modelar a volatilidade, com as seguintes estimativas dos parâmetros α0 = 0, 197103 e α1 = 0, 164911, sendo o modelo da variância σt dado pela seguinte expressão: 2 σt = 0, 197103 + 0, 164911at−1 , (3) e verificando agora o correlograma do modelo 3, Figura 4, verifica-se que é um ruı́do branco. Esse resultado mostra que esse tipo de modelo não se usa somente para séries financeiras, verificando que séries climatológicas também possuem comportamentos dinâmicos ao longo do tempo. 4 Figura 4: Fac e Facp do resı́duo ao quadrado do modelo SARIMA(2,1,1)(0,1,1). Tabela 3: Temperatura média estimada pelo modelo SARIMA(2,1,1)(0,1,1) para o perı́odo de jul/2008 a dez/2008, com intervalo de confiança de 95% de probabilide. MÊS TEMP. ESTIMADA ERRO PADRÃO IC jul/08 26,00 0,4564 [25,11 - 26,90] ago/08 26,81 0,5472 [25,73 - 27,88] set/08 27,61 0,6005 [26,43 - 28,78] out/08 28,09 0,6313 [26,86 - 29,33] nov/08 28,32 0,6500 [27,05 - 29,60] dez/08 28,56 0,6614 [27,26 - 29,85] 4 Conclusões Os modelos SARIMA forneceram bons resultados quanto a previsão, reproduzindo a tendência e a periodicidade detectadas na série. Dos modelos ajustados quanto aos critérios AIC e EQM, o que se destacou foi o modelo SARIMA(2,1,1)(0,1,1), recomendado para prever a temperatura média de Mossoró, RN. Também, observou-se que séries climatológicas apresentam volatilidade como observada nas séries financeiras, ou seja, apresentam perı́odos de tempo em que se verificam grandes variações no seu comportamento e outros perı́odos em que não se verifica qualquer variação. Referências [1] EMBRAPA. Secretaria de Gestão e Estratégia. V Plano-Diretor da Embrapa: 20082011-2023. Brası́lia, DF: Embrapa 2008. 44p. [2] BAYER, F. M.; SOUZA, A. M. Wavelets e modelos tradicionais de previsão: um estudo comparativo. Revista Brasileira de Biometria. v. 28,n. 2, p. 40-61, 2010. [3] BOX, G.; JENKINS, G. Time Series analysis, forecasting and control. 3ed. PrenticeHall International, 1994. [4] CARMO FILHO, F. do; OLIVEIRA, O. F. de. Mossoró: um municı́pio do semiárido, caracterização climática e aspecto florı́stico. Mossoró: UFERSA, 1989. 62p. (Coleção Mossoroense, 672, série B). [5] MORETTIN, P. A.; TOLOI, C. M. C. Análise de séries temporais. 2ed. São Paulo: Edgard Blüsher, 2006. 538p. 5