PREVISÕES CLIMÁTICAS UTILIZANDO MODELOS ESTOCÁSTICOS COMPOSTOS NO INSTITUTO NACIONAL DE METEOROLOGIA – INMET/BRASIL Fabrício D. dos S. Silva1, Lauro T. G. Fortes1, Luiz André R. dos Santos1, Danielle B. Ferreira1, Mozar de A. Salvador1, Paulo S. Lucio2,3* 1 Instituto Nacional de Meteorologia. Eixo Monumental Via S-1, 70680-900, Brasília/DF. E-mails: [email protected], [email protected], [email protected], [email protected], [email protected] 2 Universidade Federal do Rio Grande do Norte – Departamento de Estatística. Centro de Ciências Exatas e da Terra, Natal/RN. E-mail: [email protected] 3 Centro de Geofísica de Évora – Universidade de Évora - Portugal. E-mail: [email protected] RESUMO: Este trabalho tem como objetivo apresentar a metodologia e os produtos de previsão climática trimestral gerada atualmente no Instituto Nacional de Meteorologia – INMET/BRASIL. Os dados utilizados são séries temporais de precipitação e temperatura média acumulados por trimestre, e valores de Temperatura da Superfície do Mar (TSM). Utilizam-se dois modelos estocásticos, ARIMA e HOLTWINTERS, que levam em consideração apenas às séries de dados meteorológicos de uma rede de estações meteorológicas sobre o território brasileiro. Emprega-se, ainda, o aplicativo “Climate Predictability Tool” (CPT), do International Research Institute for Climate Prediction (IRI), para obter previsões por correlação canônica e regressão por componentes principiais, que levam em conta as séries históricas nos pontos de estação e os valores de TSM. Utilizando-se hindcast, calcula-se a destreza (skill) de cada um dos modelos pela correlação, ponto a ponto, entre dados previstos e observados. A agregação dos resultados dos modelos é feita, ponto a ponto, pela média ponderada, onde os pesos são proporcionais ao quadrado das correlações obtidas, sendo desconsideradas as previsões com correlação inferior a um limite de significância. Os valores finais previstos para a precipitação trimestral acumulada são classificados em categorias, de “muito seca” a “muito chuvosa”, segundo os quantis em que se enquadrem dentro da distribuição de freqüências climatológica correspondente. A correlação entre a série de valores agregados previstos e observados para anos anteriores é calculada, ponto a ponto, como uma medida de destreza (skill) do modelo agregado. Isto possibilita a confecção de um mapa com o skill do modelo e, utilizando um procedimento de aproximação, baseado na hipótese de normalidade das distribuições climatológicas, a geração de uma previsão probabilística dos desvios de precipitação acumulada para o trimestre. Usando procedimento análogo, os modelos ARIMA e HOLT-WINTER são também empregados para produzir previsões de anomalias de temperatura média para o trimestre. ABSTRACT: CLIMATE FORECAST USING STATISTICAL MODELS AT NATIONAL INSTITUT OF METEOROLOGY - INMET / BRAZIL This paper presents the seasonal climate prediction products currently generated at the National Institute of Meteorology Institute- INMET/BRAZIL and the methodology employed to produce them The data used are time series of accumulated precipitation and average temperature for the three-month season under focus, as well as values of the Sea Surface Temperature (SST). Two stochastic models area employed, ARIMA and HOLT - WINTERS, which take into account only the series of meteorological data for a network of weather stations covering the Brazilian territory. Besides, the software "Climate Predictability Tool" (CPT), developed at the International Research Institute for Climate Prediction (IRI), is used to produce forecasts employing either the canonical correlation analysis or principal components regression, which take into account the meteorological data series and the observed TSM data. A hindcast approach is used to estimate the skill of each one of the models, at each station point, computing the linear correlation coefficient between predicted and observed values. A multi-model output is produced computing, at each point, the weighted average of the outputs of the each individual model, where the weights are proportional to the square of each model correlation at that point; models with correlation at the point below a significance level are discarded. The final values obtained for the cumulative precipitation seasonal prediction are classified in categories, varying from “very dry” to “very wet”, accordingly to the percentile-interval (quantile) they fall in the corresponding climatological frequency distribution. The correlation between the multi-model forecast values and the values observed in previous years is computed, at each station, as a measure of multi-model skill. These results are used to generate a map of the model skill over the Brazilian territory, and allow the production of a probabilistic forecast of the seasonal precipitation by means of an approximation scheme, based on the assumption of normality of the climatological distributions. Making use of similar procedures, ARIMA and HOLT-WINTERS models are also employed to produce forecasts of the seasonal average temperature. Palavras-Chave: Análise de Correlações Canônicas, Modelagem de Box-Jenkins, Modelagem de HoltWinters, Previsão Sazonal. 1. INTRODUÇÃO A finalidade deste trabalho é explorar o comportamento de séries temporais meteorológicas (ANEXO A) de precipitação e temperatura média, para produzir mensalmente, previsões quantitativas determinísticas e probabilísticas das chuvas acumuladas e das temperaturas médias que devem ocorrer no Brasil nos três meses seguintes. Com este propósito, propõe-se um modelo estocástico agregado, que combina os resultados dos modelos clássicos de Box-Jenkins (BOX e JENKINS, 1976) e Holt-Winters (HOLT, 1957; WINTERS, 1960), bem como, no caso de precipitação, as previsões geradas pelo aplicativo “Climate Predictability Tool – CPT” do IRI (BARNSTON e SMITH, 1996), que utiliza os métodos de correlações canônicas e regressão por componentes principais e a temperatura da superfície do mar (TSM) como variável preditora. 2. METODOLOGIA Neste trabalho, são utilizados modelos estocásticos do tipo Auto Regressivo Integrado a Médias Móveis (ARIMA), e um modelo de alisamento exponencial Holt-Winters. Os modelos autorregressivos analisam a variável dependente Y como funções do tempo – Yt , ou Y (t ) . Tais modelos podem ser descritos em termos de tendência e erros aleatórios associados ao tempo t. Neles, a componente tendência sazonal é retirada por meio de um amortecimento usando uma média móvel centrada e de tamanho (lag) igual a 12. Também, assume-se que os termos de erro ε t satisfazem às hipóteses de variância constante, independência e normalidade. A notação empregada para designação do modelo é normalmente ARIMA(p,d,q) onde p representa o número de parâmetros auto-regressivos, d é o número de diferenciações para que a série torne-se estacionaria, e que é o número de parâmetros de médias móveis. O modelo Holt-Winters, desenvolvido para descrever as técnicas de previsão para séries temporais, isola na série até três fatores ou coeficientes de alisamento: nível, tendência linear, fator sazonal e um elemento residual não previsível, chamado erro aleatório. Na estimação desses fatores usa-se o método de ajustamento exponencial, também chamado “suavização exponencial”. A próxima ferramenta utilizada para geração de previsões sazonais de precipitação é o software "Climate Predictability Tool" (CPT - IRI). Neste, pode-se trabalhar com Análise de Correlações Canônicas (ACC) e Regressão por Componentes Principais (RCP). Na metodologia atual, vem-se utilizando à ACC, onde a variável preditanda é explicada pela combinação linear de variáveis preditoras; em nosso caso, a precipitação é explicada pela TSM de reanálises da NOAA (National Ocean and Atmospheric Administration), com resolução espacial de 2,5º x 2,5º em uma janela que cobre boa parte das águas do Oceano Pacífico e Atlântico, a fim de serem preservadas as possíveis influências das áreas do Niños e dos grandes centros de Alta Pressão do Atlântico (Efeitos do Dipolo). As vantagens da ACC são a fácil interpretação, a consistência espacial e a alta sensibilidade nas respostas entre preditando e preditores. Para cada trimestre em foco e para cada ponto de estação, são geradas previsões de precipitação trimestral acumulada correspondentes a uma série de anos anteriores. A comparação entre as séries de valores previstos e obserrvados determina, para cada ponto e trimestre, um valor de correlação associado a cada um dos três modelos (ARIMA, Holt-Winters e ACC) (vide ANEXO B). Esta correlação representa a destreza (skill) do modelo naquele ponto, para o trimestre. O conhecimento desses valores, nos permite adotar um procedimento de agregação que dê maior peso relativo aos modelos de maior destreza. De posse da previsão gerada pelo modelo agregado, pode-se classificá-la em quantis (XAVIER et al., 2002). Pode-se, também, computar a destreza do modelo agregado como a correlação entre os valores observados e os previstos por este modelo para anos anteriores (hindcast). Conhecendo-se a média e variância da distribuição climatológica da precipitação acumulada em cada ponto, σ p2 , e o skill do modelo nesse ponto, r , e assumindo-se uma distribuição climatológica normal, pode-se estimar a variância da distribuição prevista como σ p2 = (1 − r 2 ).σ c2 (1) (SUGI, 2005; FORTES, 2007). Procedimento análogo pode também ser utilizado para geração de previsões de anomalias de temperaturas médias sazonais. O procedimento atualmente utilizado no INMET, contudo, emprega apenas os modelos ARIMA e Holt-Winters e adota, em cada ponto, a previsão do modelo que apresenta maior correlação. 3. RESULTADOS Apresentam-se, a seguir, resultados obtidos, recentemente, para o trimestre Janeiro-Fevereiro-Março (JFM) de 2008. A Figura 1 mostra a distribuição espacial das estações usadas para gerar prognósticos sazonais de precipitação e de anomalias de temperatura média. São utilizadas atualmente séries históricas de 160 estações para precipitação e de 201 estações para temperatura média. A Figura 2 mostra os limites inferior e superior da faixa normal para o trimestre JFM, correspondentes aos percentis 33% e 66% da distribuição de precipitação acumulada de cada série histórica (climatologia). Esta informação traduz para o usuário, em termos de milímetros de chuva, a previsão sazonal expressa em tercis. A Figura 3A mostra o mapa de destreza do modelo agregado. Nota-se que, em geral, o modelo capta bem a variabilidade sazonal, ou seja, apresenta bom skill na maior parte das regiões brasileiras, no trimestre JFM. Mapas de destreza para outros trimestres (não mostrados) indicam que os resultados obtidos pela agregação final dos resultados podem ser usados com confiança para gerar previsões climáticas sazonais. Os valores previstos para a precipitação acumulada trimestral são classificados em quantis. Os percentis 15%, 35%, 65% e 85% determinam os intervalos quantílicos associados aos eventos “muito seco”, “seco”, “normal”, “chuvoso” e “muito chuvoso”, que correm climatologicamente, com freqüências de 15%, 20%, 30%, 20% e 15%, respectivamente. Esta classificação é utilizada para produzir mapas como o da Figura 3B. Aproximando-se a distribuição prevista em cada ponto por uma normal com média dada pelo valor previsto e variância computada por (1), pode-se calcuklar as probabilidades previstas, em cada ponto, para cada tercil da distribuição climatológica, e produzir mapas como os das Figuras 4A e 4B. Para temperatura média, também são gerados mapas climatológicos dos limites inferior e superior da faixa normal (Figura 5A e 5B), e mapas de correlações e anomalias, para o trimestre (Figura 6A e 6B). Os mapas da Figura 5 auxiliam o usuário a converter a previsão expressa em anomalia para valores absolutos de temperatura. Figura 1: Distribuição geográfica das estações meteorológicas do INMET usadas para geração de prognósticos sazonais de precipitação (A) e temperatura média (B). Figura 2: Mapas dos limites inferiores (A) e superiores (B) à faixa normal para precipitação do trimestre Janeiro-Fevereiro-Março. Figura 3: (A) Mapa de correlações do modelo agregado para precipitação do trimestre Jan-Fev-Mar e (B) previsão para o trimestre Jan-Fev-Mar/2008 classificada em termos de faixas quantílicas. Figura 4: (A) Previsão probabilística da precipitação acumulada, e (B) previsão probabilística em tercis para o total de precipitação acumulada para o trimestre Jan-Fev-Mar/2008. Figura 5: Mapas dos limites inferiores (A) e superiores (B) da faixa normal para temperatura média do trimestre Janeiro-Fevereiro-Março. 4. CONCLUSÕES A proposta de usar um modelo final que agregue o potencial de previsão de mais de um modelo, levando-se em conta o skill relativo de cada um deles, para previsões climáticas sazonais de precipitação e anomalias de temperatura média vem sendo utilizada com sucesso no âmbito das pesquisas do Instituto Nacional de Meteorologia. A combinação de previsões mostra-se mais robusta que as previsões de modelos isolados. A análise das séries temporais pelos modelos estocásticos ARIMA e Holt-Winters, permite extrapolar o comportamento das séries trimestrais de precipitação segundo um processo com poucas oscilações. Tais valores, ao serem combinados com previsões provenientes da Análise de Correlações Canônicas, incorporam a influencia dinâmica imposta pelos efeitos da TSM nas circulações atmosféricas de grande escala, que são as principais responsáveis pelos regimes de chuvas verificados no Brasil, em diferentes épocas do ano. Figura 6: (A) Mapa de correlações do modelo agregado para temperatura média do trimestre Jan-Fev-Mar e (B) previsão de anomalias para o trimestre Jan-Fev-Mar/2008. 5. REFERÊNCIAS BIBLIOGRÁFICAS BARNSTON, A. G. e SMITH, T. M., 1996: Specification and prediction of global surface temperature and precipitation from global SST using CCA. Journal of Climate, 9: 2660–2697. BOX, G. E. P. e JENKINS, G. M. Time Series Analiysis: Forescasting and Control. San Francisco: Holden Day, 1976. FORTES, L.T. Relação entre a Destreza da Previsão Climática da Precipitação Sazonal e a Probabilidade do Tercil Médio. Nota Técnica. CDP/INMET. Brasília, fevereiro, 2007. HOLT, C. C. (1957) Forecasting seasonals and trends by exponentially weighted moving averages, ONR Research Memorandum, Carnegie Institute 52. SUGI, Masako. “Toward better probabilistic seasonal prediction for decision making”. Proceedings of the WMO Technical Conference on Climate as a Resource. Beijing, China, November, 2005. WINTERS, P. R. Forecasting sales by exponentially weighted moving averages, Management Science. 6: 324–342, 1960. XAVIER, T. de Ma. BEZERRA S.; SILVA, J. de F. ; REBELLO, E. R. G. ''A Técnica dos Quantis e suas Aplicações em Meteorologia, Climatologia e Hidrologia, com ênfase para as Regiões Brasileiras''. Thesaurus Editora de Brasília Ltda, Brasília-DF, pp144, 2002. ANEXO A: Na prática, uma série temporal pode ser observada como uma realização parcial de um processo estocástico cuja característica principal se fundamenta no fato das variáveis serem dependentes. {Y (t ), t ∈ T ⊂ ℵ} , em sua forma discretizada: Denotaremos a série temporal por {Y (t ), t ∈ T ⊂ ℵ} = Y (1),Y (2),...,Y (n ) onde n é o tamanho da série. Trabalharemos com séries temporais discretas, onde os dados são coletados ou convertidos em observações mensais. ANEXO B: O limite de significância das correlações depende do tamanho das séries sutilizadas em seu cômputo. Para uma significância de 95%, e 30 anos de série, o limite é uma correlação de 0,30. Para séries de 13 anos, atualmente utilizadas nas previsões climáticas do INMET, o limite é 0,475. Neste casos, tipicamente são consideradas correlações “fortes” aquelas correspondentes a valores entre 0,7 e 0,9 e “muito fortes” as correlações acima de 0,9.