Ajuste de modelos de séries temporais para pressão atmosférica de Uberlândia Valiana Alves Teodoro1 Mirian Fernandes Carvalho Araújo1 Lúcio Borges de Araújo1 1 Introdução Na comercialização de produtos originados do campo em mercados ou alimentadores das indústrias, o conhecimento do clima fazia-se necessário para garantir maior produtividade e melhoria das mercadorias em geral [5]. O desenvolvimento técnico-científico da sociedade no período pós-guerra permitiu a invenção de inúmeros aparelhos para mensuração dos elementos atmosféricos com maior confiabilidade [1]. Com o avanço na tecnologia, a meteorologia se beneficia das técnicas de computação e modelos matemáticos para que a sociedade seja capaz de fazer previsões e estudos avançados na área. O trabalho tem como objetivo modelar as taxas diárias da série temporal de pressão atmosférica da cidade de Uberlândia, a fim de estudar o comportamento, tendência, sazonalidade, função de autocorrelação (FAC) e autocorrelação parcial (FACP), ajustes de alguns modelos que possam explicar esta série e que possam fazer previsões futuras. 2 Material e métodos Os dados a serem analisados é a série temporal de pressão atmosférica coletados na estação climática da cidade de Uberlândia, localizada no Triângulo Mineiro do estado de Minas Gerais. A Estação climatológica está situada no Campus Santa Mônica da UFU e faz parte da rede de estações climatológicas do Instituto Nacional de Meteorologia (INMET), 5º Distrito de Meteorologia (5º DISME), órgão ligado ao Ministério da Agricultura. A série é composta de uma amostra de 951 dados, com início em 23 de janeiro de 2009 e término em 31 de agosto de 2011. Cada ponto da série refere-se à média diária da Estação climatológica do Campus Santa Mônica da UFU. Uma série pode exibir tendência de crescimento ou decrescimento com vários tipos possíveis de padrão [2]. Para verificar a tendência usou-se o teste de tendência, baseado no 1 FAMAT – UFU. e-mail: [email protected] 1 coeficiente de correlação de Spearman. Chama-se de o posto de dentre as n observações, se houver observações empatadas, use postos médios [3]. Assim: ∑ em que t= 1, 2, 3...n são postos dos instantes de tempo. O teste pode ser feito, também, em função do coeficiente de correlação de Spearman, dado por: As séries temporais ainda podem exibir um comportamento que tendem a se repetir a cada s períodos de tempo. Este comportamento é chamado de sazonalidade. Para verificar a existência utilizou-se um teste paramétrico que utiliza teste F da uma análise de variância. A estatística teste é: ̅ ∑ ̅ ̅ ∑ em que: k = 365, os dias do ano e n = tamanho da amostra. Sob a hipótese nula , a estatística tem distribuição Muitas séries contêm uma componente periódica sazonal que se repete a cada s observações (s >1). Neste caso tomar a primeira diferença não é suficiente para tornar a série (aproximadamente) estacionária. A forma de diferenciar dados com padrão sazonal acentuado é tomar diferenças no período sazonal [2]. Após identificar o que parece ser um modelo SARIMA razoável os parâmetros serão estimados por algum processo iterativo similar aos processos propostos para os modelos ARIMA. Esse modelo SARIMA multiplicado de ordem (p,d,q)(P,D,Q) é dado pela expressão: em que e A precisão deste modelo é feito com base no MAPE (média percentual de erro absoluto), que é uma medida de precisão em valores de séries temporais de dados estatísticos. Além disso, esta medida pode ser utilizada para selecionar o melhor modelo que é expressa pela fórmula: 2 em que: é o valor observado no tempo t; ̂ é o valor previsto , no tempo t e n: é o tamanho da amostra. A precisão de previsão do modelo é definida como: Outro critério de seleção AIC(Critério de informação de Akaike), é feito uma comparação entre dois modelos. O AIC é expresso por: em que: L: é a função de verossimilhança e k: é o número de parâmetros estimado. Software R [4] é um programa livre e este software oferece uma grande variedade de técnicas estatísticas. Neste software existe um pacote forecast especifico para Séries Temporais e contém a função auto.arima que seleciona o melhor modelo para previsões. 3 Resultados e discussões Com base na série descrita anteriormente, foram ajustados diversos modelos do tipo para a série a fim de identificar tendência, sazonalidade, melhor acuracidade dos modelos e um modelo sugerido pelo software R, a fim de comparar qual dos modelos possa ser melhor utilizado para explicar previsões futuras. Verifica-se pela tabela 1, que a série pressão atmosférica não apresentou tendência, mas apresentou sazonalidade. Tabela 1: Teste de tendência e sazonalidade da série pressão atmosférica Observa-se na figura 1 que a série é estacionária. Já na figura 2, que representa a função de autocorrelação, nota-se um decaimento exponencial e na figura 3, que representa a função de autocorrelação parcial, a série está truncada em 3, então para a FACP é zero. A função auto.arima(S3) do software R indicou um modelo para os dados de pressão atmosférica com três parâmetros para o auto-regressivo, dois parâmetros de médias móveis e uma diferença sazonal de 365, assim o modelo indicado é o SARIMA(3,0,2)(0,1,0)[365] (Tabela 2) . Este modelo apresentou um bom ajuste de até 99.89% de acuracidade. 3 920 y 915 910 0 200 400 600 800 Time Figura 1: Série de pressão atmosférica. Series y 0.0 0.4 0.2 -0.2 0.0 0.2 0.4 ACF Partial ACF 0.6 0.6 0.8 0.8 1.0 Series y 0 5 10 15 20 25 30 0 5 Lag 10 15 20 25 30 Lag Figura 2: FAC da série de pressão Figura 3: FACP da série de pressão atmosférica. atmosférica. Tabela 2: Modelo indicado pelo software R para a série de pressão atmosférica. SARIMA(3,0,2)(0,1,0)[365] 1 0.92 2 -0.61 3 0.40 1 0.24 2 0.39 MAPE(%) 0.10 Acuracidade(%) 99.89 AIC 255.42 Para ilustrar uma boa aderência do modelo, apresenta-se na figura 4, as predições com o modelo SARIMA(3,0,2)(0,1,0)[365] para os dados da série de pressão do ar com a predição dos 30 dias do mês de setembro do ano de 2011. 4 4 Conclusões A pressão atmosférica apresenta uma componente periódica sazonal que se repete a cada 365 observações, assim pelo software R, o modelo mais indicado é o SARIMA para explicar as séries e fazer predições futuras; Os dados originais permitiu a obtenção de boas previsões sem a necessidade de transformação dos dados; O modelo SARIMA apresentou um baixo valor para o MAPE e para o AIC, obtendo uma acuracidade de até 99% para pressão atmosférica. 5 Referências [1] AYODE, J. O. Introdução à climatologia para os trópicos. Rio de Janeiro: Editora Bertrand Brasil. 2002. 332p. [2] EHLERS, R. S. Análise de Séries Temporais. Disponível em: http://www.icmc.usp.br/ ehlers/stemp/stemp.pdf. Acesso em 07 de dezembro de 2011. [3] MORETTIN , P. A.; TOLOI, C. M. C. Análise de Séries Temporais. São Paulo: Edgard Blucher. 2003. 535p. [4] R Development Core Team. R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. ISBN 3-900051-07-0. Disponível em: http://www.R-project.org. Acesso em: 30 de abril de 2011. [5] MENDONÇA, F.; DANNI-OLIVEIRA, I. M. Climatologia: noções básicas e climas do Brasil. São Paulo: Oficina de textos. 2007. 208p. 5