PREVISÕES CLIMÁTICAS UTILIZANDO MODELOS ESTOCÁSTICOS COMPOSTOS
NO INSTITUTO NACIONAL DE METEOROLOGIA – INMET/BRASIL
Fabrício D. dos S. Silva1, Lauro T. G. Fortes1, Luiz André R. dos Santos1, Danielle B. Ferreira1,
Mozar de A. Salvador1, Paulo S. Lucio2,3*
1
Instituto Nacional de Meteorologia. Eixo Monumental Via S-1, 70680-900, Brasília/DF.
E-mails: [email protected], [email protected], [email protected],
[email protected], [email protected]
2
Universidade Federal do Rio Grande do Norte – Departamento de Estatística. Centro de Ciências Exatas e da Terra,
Natal/RN. E-mail: [email protected]
3
Centro de Geofísica de Évora – Universidade de Évora - Portugal. E-mail: [email protected]
RESUMO: Este trabalho tem como objetivo apresentar a metodologia e os produtos de previsão climática
trimestral gerada atualmente no Instituto Nacional de Meteorologia – INMET/BRASIL. Os dados utilizados
são séries temporais de precipitação e temperatura média acumulados por trimestre, e valores de
Temperatura da Superfície do Mar (TSM). Utilizam-se dois modelos estocásticos, ARIMA e HOLTWINTERS, que levam em consideração apenas às séries de dados meteorológicos de uma rede de estações
meteorológicas sobre o território brasileiro. Emprega-se, ainda, o aplicativo “Climate Predictability Tool”
(CPT), do International Research Institute for Climate Prediction (IRI), para obter previsões por correlação
canônica e regressão por componentes principiais, que levam em conta as séries históricas nos pontos de
estação e os valores de TSM. Utilizando-se hindcast, calcula-se a destreza (skill) de cada um dos modelos
pela correlação, ponto a ponto, entre dados previstos e observados. A agregação dos resultados dos modelos
é feita, ponto a ponto, pela média ponderada, onde os pesos são proporcionais ao quadrado das correlações
obtidas, sendo desconsideradas as previsões com correlação inferior a um limite de significância. Os valores
finais previstos para a precipitação trimestral acumulada são classificados em categorias, de “muito seca” a
“muito chuvosa”, segundo os quantis em que se enquadrem dentro da distribuição de freqüências
climatológica correspondente. A correlação entre a série de valores agregados previstos e observados para
anos anteriores é calculada, ponto a ponto, como uma medida de destreza (skill) do modelo agregado. Isto
possibilita a confecção de um mapa com o skill do modelo e, utilizando um procedimento de aproximação,
baseado na hipótese de normalidade das distribuições climatológicas, a geração de uma previsão
probabilística dos desvios de precipitação acumulada para o trimestre. Usando procedimento análogo, os
modelos ARIMA e HOLT-WINTER são também empregados para produzir previsões de anomalias de
temperatura média para o trimestre.
ABSTRACT: CLIMATE FORECAST USING STATISTICAL MODELS AT NATIONAL INSTITUT OF
METEOROLOGY - INMET / BRAZIL
This paper presents the seasonal climate prediction products currently generated at the National Institute of
Meteorology Institute- INMET/BRAZIL and the methodology employed to produce them The data used are
time series of accumulated precipitation and average temperature for the three-month season under focus, as
well as values of the Sea Surface Temperature (SST). Two stochastic models area employed, ARIMA and
HOLT - WINTERS, which take into account only the series of meteorological data for a network of weather
stations covering the Brazilian territory. Besides, the software "Climate Predictability Tool" (CPT),
developed at the International Research Institute for Climate Prediction (IRI), is used to produce forecasts
employing either the canonical correlation analysis or principal components regression, which take into
account the meteorological data series and the observed TSM data. A hindcast approach is used to estimate
the skill of each one of the models, at each station point, computing the linear correlation coefficient between
predicted and observed values. A multi-model output is produced computing, at each point, the weighted
average of the outputs of the each individual model, where the weights are proportional to the square of each
model correlation at that point; models with correlation at the point below a significance level are discarded.
The final values obtained for the cumulative precipitation seasonal prediction are classified in categories,
varying from “very dry” to “very wet”, accordingly to the percentile-interval (quantile) they fall in the
corresponding climatological frequency distribution. The correlation between the multi-model forecast
values and the values observed in previous years is computed, at each station, as a measure of multi-model
skill. These results are used to generate a map of the model skill over the Brazilian territory, and allow the
production of a probabilistic forecast of the seasonal precipitation by means of an approximation scheme,
based on the assumption of normality of the climatological distributions. Making use of similar procedures,
ARIMA and HOLT-WINTERS models are also employed to produce forecasts of the seasonal average
temperature.
Palavras-Chave: Análise de Correlações Canônicas, Modelagem de Box-Jenkins, Modelagem de HoltWinters, Previsão Sazonal.
1. INTRODUÇÃO
A finalidade deste trabalho é explorar o comportamento de séries temporais meteorológicas (ANEXO A) de
precipitação e temperatura média, para produzir mensalmente, previsões quantitativas determinísticas e
probabilísticas das chuvas acumuladas e das temperaturas médias que devem ocorrer no Brasil nos três
meses seguintes. Com este propósito, propõe-se um modelo estocástico agregado, que combina os resultados
dos modelos clássicos de Box-Jenkins (BOX e JENKINS, 1976) e Holt-Winters (HOLT, 1957; WINTERS,
1960), bem como, no caso de precipitação, as previsões geradas pelo aplicativo “Climate Predictability Tool
– CPT” do IRI (BARNSTON e SMITH, 1996), que utiliza os métodos de correlações canônicas e regressão
por componentes principais e a temperatura da superfície do mar (TSM) como variável preditora.
2. METODOLOGIA
Neste trabalho, são utilizados modelos estocásticos do tipo Auto Regressivo Integrado a Médias Móveis
(ARIMA), e um modelo de alisamento exponencial Holt-Winters. Os modelos autorregressivos analisam a
variável dependente Y como funções do tempo – Yt , ou Y (t ) . Tais modelos podem ser descritos em termos
de tendência e erros aleatórios associados ao tempo t. Neles, a componente tendência sazonal é retirada por
meio de um amortecimento usando uma média móvel centrada e de tamanho (lag) igual a 12. Também,
assume-se que os termos de erro ε t satisfazem às hipóteses de variância constante, independência e
normalidade. A notação empregada para designação do modelo é normalmente ARIMA(p,d,q) onde p
representa o número de parâmetros auto-regressivos, d é o número de diferenciações para que a série torne-se
estacionaria, e que é o número de parâmetros de médias móveis. O modelo Holt-Winters, desenvolvido para
descrever as técnicas de previsão para séries temporais, isola na série até três fatores ou coeficientes de
alisamento: nível, tendência linear, fator sazonal e um elemento residual não previsível, chamado erro
aleatório. Na estimação desses fatores usa-se o método de ajustamento exponencial, também chamado
“suavização exponencial”.
A próxima ferramenta utilizada para geração de previsões sazonais de precipitação é o software
"Climate Predictability Tool" (CPT - IRI). Neste, pode-se trabalhar com Análise de Correlações Canônicas
(ACC) e Regressão por Componentes Principais (RCP). Na metodologia atual, vem-se utilizando à ACC,
onde a variável preditanda é explicada pela combinação linear de variáveis preditoras; em nosso caso, a
precipitação é explicada pela TSM de reanálises da NOAA (National Ocean and Atmospheric
Administration), com resolução espacial de 2,5º x 2,5º em uma janela que cobre boa parte das águas do
Oceano Pacífico e Atlântico, a fim de serem preservadas as possíveis influências das áreas do Niños e dos
grandes centros de Alta Pressão do Atlântico (Efeitos do Dipolo). As vantagens da ACC são a fácil
interpretação, a consistência espacial e a alta sensibilidade nas respostas entre preditando e preditores.
Para cada trimestre em foco e para cada ponto de estação, são geradas previsões de precipitação
trimestral acumulada correspondentes a uma série de anos anteriores. A comparação entre as séries de
valores previstos e obserrvados determina, para cada ponto e trimestre, um valor de correlação associado a
cada um dos três modelos (ARIMA, Holt-Winters e ACC) (vide ANEXO B). Esta correlação representa a
destreza (skill) do modelo naquele ponto, para o trimestre. O conhecimento desses valores, nos permite
adotar um procedimento de agregação que dê maior peso relativo aos modelos de maior destreza. De posse
da previsão gerada pelo modelo agregado, pode-se classificá-la em quantis (XAVIER et al., 2002). Pode-se,
também, computar a destreza do modelo agregado como a correlação entre os valores observados e os
previstos por este modelo para anos anteriores (hindcast). Conhecendo-se a média e variância da
distribuição climatológica da precipitação acumulada em cada ponto, σ p2 , e o skill do modelo nesse ponto,
r , e assumindo-se uma distribuição climatológica normal, pode-se estimar a variância da distribuição
prevista como σ p2 = (1 − r 2 ).σ c2 (1) (SUGI, 2005; FORTES, 2007).
Procedimento análogo pode também ser utilizado para geração de previsões de anomalias de
temperaturas médias sazonais. O procedimento atualmente utilizado no INMET, contudo, emprega apenas os
modelos ARIMA e Holt-Winters e adota, em cada ponto, a previsão do modelo que apresenta maior
correlação.
3. RESULTADOS
Apresentam-se, a seguir, resultados obtidos, recentemente, para o trimestre Janeiro-Fevereiro-Março
(JFM) de 2008. A Figura 1 mostra a distribuição espacial das estações usadas para gerar prognósticos
sazonais de precipitação e de anomalias de temperatura média. São utilizadas atualmente séries históricas de
160 estações para precipitação e de 201 estações para temperatura média. A Figura 2 mostra os limites
inferior e superior da faixa normal para o trimestre JFM, correspondentes aos percentis 33% e 66% da
distribuição de precipitação acumulada de cada série histórica (climatologia). Esta informação traduz para o
usuário, em termos de milímetros de chuva, a previsão sazonal expressa em tercis.
A Figura 3A mostra o mapa de destreza do modelo agregado. Nota-se que, em geral, o modelo capta
bem a variabilidade sazonal, ou seja, apresenta bom skill na maior parte das regiões brasileiras, no trimestre
JFM. Mapas de destreza para outros trimestres (não mostrados) indicam que os resultados obtidos pela
agregação final dos resultados podem ser usados com confiança para gerar previsões climáticas sazonais. Os
valores previstos para a precipitação acumulada trimestral são classificados em quantis. Os percentis 15%,
35%, 65% e 85% determinam os intervalos quantílicos associados aos eventos “muito seco”, “seco”,
“normal”, “chuvoso” e “muito chuvoso”, que correm climatologicamente, com freqüências de 15%, 20%,
30%, 20% e 15%, respectivamente. Esta classificação é utilizada para produzir mapas como o da Figura 3B.
Aproximando-se a distribuição prevista em cada ponto por uma normal com média dada pelo valor
previsto e variância computada por (1), pode-se calcuklar as probabilidades previstas, em cada ponto, para
cada tercil da distribuição climatológica, e produzir mapas como os das Figuras 4A e 4B.
Para temperatura média, também são gerados mapas climatológicos dos limites inferior e superior da
faixa normal (Figura 5A e 5B), e mapas de correlações e anomalias, para o trimestre (Figura 6A e 6B). Os
mapas da Figura 5 auxiliam o usuário a converter a previsão expressa em anomalia para valores absolutos de
temperatura.
Figura 1: Distribuição geográfica das estações meteorológicas do INMET usadas para geração de
prognósticos sazonais de precipitação (A) e temperatura média (B).
Figura 2: Mapas dos limites inferiores (A) e superiores (B) à faixa normal para precipitação do trimestre
Janeiro-Fevereiro-Março.
Figura 3: (A) Mapa de correlações do modelo agregado para precipitação do trimestre Jan-Fev-Mar e (B)
previsão para o trimestre Jan-Fev-Mar/2008 classificada em termos de faixas quantílicas.
Figura 4: (A) Previsão probabilística da precipitação acumulada, e (B) previsão probabilística em tercis para
o total de precipitação acumulada para o trimestre Jan-Fev-Mar/2008.
Figura 5: Mapas dos limites inferiores (A) e superiores (B) da faixa normal para temperatura média do
trimestre Janeiro-Fevereiro-Março.
4. CONCLUSÕES
A proposta de usar um modelo final que agregue o potencial de previsão de mais de um modelo,
levando-se em conta o skill relativo de cada um deles, para previsões climáticas sazonais de precipitação e
anomalias de temperatura média vem sendo utilizada com sucesso no âmbito das pesquisas do Instituto
Nacional de Meteorologia. A combinação de previsões mostra-se mais robusta que as previsões de modelos
isolados. A análise das séries temporais pelos modelos estocásticos ARIMA e Holt-Winters, permite
extrapolar o comportamento das séries trimestrais de precipitação segundo um processo com poucas
oscilações. Tais valores, ao serem combinados com previsões provenientes da Análise de Correlações
Canônicas, incorporam a influencia dinâmica imposta pelos efeitos da TSM nas circulações atmosféricas de
grande escala, que são as principais responsáveis pelos regimes de chuvas verificados no Brasil, em
diferentes épocas do ano.
Figura 6: (A) Mapa de correlações do modelo agregado para temperatura média do trimestre Jan-Fev-Mar e
(B) previsão de anomalias para o trimestre Jan-Fev-Mar/2008.
5. REFERÊNCIAS BIBLIOGRÁFICAS
BARNSTON, A. G. e SMITH, T. M., 1996: Specification and prediction of global surface temperature and
precipitation from global SST using CCA. Journal of Climate, 9: 2660–2697.
BOX, G. E. P. e JENKINS, G. M. Time Series Analiysis: Forescasting and Control. San Francisco: Holden
Day, 1976.
FORTES, L.T. Relação entre a Destreza da Previsão Climática da Precipitação Sazonal e a Probabilidade do
Tercil Médio. Nota Técnica. CDP/INMET. Brasília, fevereiro, 2007.
HOLT, C. C. (1957) Forecasting seasonals and trends by exponentially weighted moving averages, ONR
Research Memorandum, Carnegie Institute 52.
SUGI, Masako. “Toward better probabilistic seasonal prediction for decision making”. Proceedings of
the WMO Technical Conference on Climate as a Resource. Beijing, China, November, 2005.
WINTERS, P. R. Forecasting sales by exponentially weighted moving averages, Management Science. 6:
324–342, 1960.
XAVIER, T. de Ma. BEZERRA S.; SILVA, J. de F. ; REBELLO, E. R. G. ''A Técnica dos Quantis e suas
Aplicações em Meteorologia, Climatologia e Hidrologia, com ênfase para as Regiões Brasileiras''. Thesaurus
Editora de Brasília Ltda, Brasília-DF, pp144, 2002.
ANEXO A:
Na prática, uma série temporal pode ser observada como uma realização parcial de um processo
estocástico cuja característica principal se fundamenta no fato das variáveis serem dependentes.
{Y (t ), t ∈ T ⊂ ℵ} , em sua forma discretizada:
Denotaremos
a
série
temporal
por
{Y (t ), t ∈ T ⊂ ℵ} = Y (1),Y (2),...,Y (n ) onde n é o tamanho da série. Trabalharemos com séries temporais
discretas, onde os dados são coletados ou convertidos em observações mensais.
ANEXO B:
O limite de significância das correlações depende do tamanho das séries sutilizadas em seu cômputo.
Para uma significância de 95%, e 30 anos de série, o limite é uma correlação de 0,30. Para séries de 13 anos,
atualmente utilizadas nas previsões climáticas do INMET, o limite é 0,475. Neste casos, tipicamente são
consideradas correlações “fortes” aquelas correspondentes a valores entre 0,7 e 0,9 e “muito fortes” as
correlações acima de 0,9.
Download

previsões climáticas utilizando modelos estocásticos