RECUPERAÇÃO DE DADOS CLIMATOLÓGICOS DO RIO GRANDE DO SUL E SANTA
CATARINA
Flavio Varone Gonçalves (1); Ilia S. Kim
(1) Curso Pós-Graduação em Meteorologia , Faculdade de Meteorologia, UFPel.
ABSTRACT
Climatological studies demand that the series meteorological data have a long observation period, but
these series generally possess many given missing. The situation in Brazil is more difficult, because the
observed series have a big percentile of flaws. Then we propose through the use of the method of
Multiple Linear Regression the recovery of monthly series of the temperatures (maxim, minimum and
mean) of the air and precipitation, with a long observation period, of 13 stations of Rio Grande do Sul and
Santa Catarina, of Brazil. The evaluation method of data recovery was made in the independent period,
through the analysis of the relative error ( ε ), what showed that the simulation of data was satisfactory.
1. Introdução
Os estudos climatológicos exigem que as séries de dados meteorológicos tenham um longo período
de observação. Porém, geralmente, tais séries, possuem dados faltosos. No Brasil, a situação é mais difícil,
pois as séries observadas tem um grande percentual de falhas.
Para resolver tal problema, foram desenvolvidos os métodos de controle e recuperação de dados.
Existem diferentes métodos de recuperação de dados, tais como, Análise Multivariada, com Componentes
Principais (Diniz, 1994, Ceballos e Braga, 1991) e Regressão Linear Múltipla.
Neste trabalho, propõe-se, através do uso do método de Regressão Linear Múltipla, a
recomposição das séries de temperatura máxima, temperatura mínima, temperatura média e precipitação,
com um longo período de observação, de 13 estações dos estados do Rio Grande do Sul e Santa Catarina,
pertencentes a região sul do Brasil.
A avaliação do método de recuperação dos dados foi feita no período independente, o que mostrou
que a simulação de dados faltosos foi satisfatória.
Este trabalho foi realizado dentro do projeto intitulado “ Elaborar um Banco de Dados e Desenvolver
Métodos de Previsão de Tempo e Clima para o Estado do Rio Grande do Sul “, FAPERGS.
2. Dados e Metodologia
Os dados de temperatura máxima, temperatura mínima, temperatura média e precipitação, de
estações do Rio Grande do Sul e Santa Catarina, utilizados neste trabalho, doze foram fornecidas pelo 8º
Distrito de Meteorologia (INMET) e uma pela Estação Agroclimatológica da Embrapa de Pelotas.
A recuperação dos dados foi feita com o uso do método de regressão linear múltipla:
yˆ = a 0 + a1 x1 + a 2 x 2 + ... + a n x n
onde, ŷ - dado recuperado, x1 , x 2 ,..., x n - valores dos dados meteorológicos de outras estações, a 0 , a1 ,
a 2 ,..., a n - coeficientes de regressão correspondentes.
As equações de Regressão Linear Múltipla foram criadas com a utilização do procedimento
Stepwise. A avaliação do método de recuperação de dados, foi feita através do cálculo dos erros relativo
( ε ), médio ( µ ) e absoluto ( δ ):
2
n
σ
ε = er ;
σs
σ er =
( yi − yˆ i )
∑
i =1
µ = y − yˆ i ;
n
2
(x j − x j )
∑
j =1
m
;
σs =
m
;
δ = y I − yˆ i ;
onde, σ er - erro quadrático, σ s - desvio padrão, n - número de casos a simular, y i - valores dos dados
reais, ŷ i - valores dos dados simulados, xi - valores dos dados da série, x - valor médio da série. Pode se
supor como boa a simulação em que ε ≤ 1 e ruim quando ε >1.
3. Resultados e Discussão
Foi feita a análise do percentual de dados faltosos para as temperaturas máxima, mínima e média, e
precipitação, desde o início das observações em cada estação. Tal análise mostrou que este percentual é,
em média, cerca de 20% em todas as variáveis. As estações de Bom Jesus, Caxias, Iraí, Lages e Torres
apresentaram os maiores percentuais de dados faltosos, entre 30 e 50%, enquanto que em Pelotas
praticamente não existem falhas. Os percentuais são apresentados na Tabela 1.
TABELA 1 – Média do percentual de dados faltosos em treze estações do Rio Grande do Sul e Santa
Catarina, para temperatura máxima, temperatura mínima, temperatura média e precipitação.
ESTAÇÃO
T. Máxima T. Média T. Mínima Precipitação
BAGÉ
13,0
14,4
9,8
8,2
BOM JESUS
56,1
58,0
55,8
54,9
CAXIAS
36,9
38,7
32,5
31,0
ENCRUZILHADA
19,7
16,1
17,5
13,4
FLORIANÓPOLIS
19,2
21,9
19,8
18,9
IRAÍ
38,1
37,7
35,0
35,1
LAGES
34,7
35,8
36,4
33,9
PORTO ALEGRE
9,5
22,8
9,4
7,2
SÂO LUIZ GONZAGA
11,0
12,1
10,8
8,7
SANTA MARIA
9,9
23,7
8,5
7,2
SANTA. VITÓRIA
8,7
10,1
10,1
8,2
TORRES
36,7
42,5
31,6
30,6
PELOTAS
1,4
0,0
0,0
0,0
MÉDIA
22,7
25,7
21,4
19,8
A recuperação de séries temporais das temperaturas máxima, mínima e média, e precipitação de
treze estações, foi feita através de Regressão Linear Múltipla, onde como preditores foram utilizados os
valores dos dados das outras estações. A análise dos coeficientes de regressão, mostrou que todos os
valores estão acima do nível de significância.
A avaliação da recuperação foi feita nos dados independentes. Foram retirados 36 valores de cada
variável e recuperados através do método, estes valores não foram utilizados para ciara as equações. Os
erros calculados foram analisados mensalmente e em cada estação.
Na Tabela 2 são apresentados os resultados em cada estação. A análise do erro relativo, para as
temperaturas máxima, mínima e média, mostrou que a recuperação nas estações localizadas no interior
foram mais satisfatórias do que as estações litorâneas, pois a grande maioria das estações utilizadas
situam-se mais distantes do litoral e consequentemente possuem características climatológicas diferentes.
Os melhores valores de ε variaram entre 0,43 e 049, para a temperatura máxima, 0,28 e 0,43 na
temperatura mínima e 0,33 e 0,39 na temperatura média, nas estações situadas no interior da região,
enquanto que nas estações litorâneas ficaram próximos de 0,60. Os erros absoluto e médio não sofrem
influência da localização das estações.
Para recuperação dos dados de precipitação, conforme Tabela 2, as estações, litorâneas ou no
interior, não apresentam diferenças. Os valores de ε mais representativos de ficaram no intervalo de 0,38
– 0,59.
A análise mensal dos erros, Tabela 3, mostrou que a recuperação dos dados sofre influência das
variações sazonais ao longo do ano. O erro relativo apresentou períodos onde a recuperação foi mais
satisfatória, na temperatura máxima março-julho e nas temperaturas mínima e média abril-agosto. Os
erros absoluto e médio, conforme a análise, não apresentaram variações consideráveis.
TABELA 2 – Média dos erros relativo, absoluto e médio para a temperatura máxima, temperatura
mínima, temperatura média e precipitação em treze estações do Rio Grande do Sul e Santa Catarina.
ESTAÇÕES
BAGÉ
BOM JESUS
CAXIAS
ENCRUZILHADA
FLORIANÓPOLIS
IRAÍ
LAGES
PORTO ALEGRE
S.LUIZ GONZAGA
SANTA MARIA
SANTA VITÓRIA
TORRES
PELOTAS
MÉDIA
T. MÁXIMA
ε
δ
µ
0,60 0,80 0,21
0,54 0,66 0,26
0,43 0,53 0,03
0,43 0,54 -0,08
0,63 0,53 0,22
0,48 0,60 0,06
0,57 0,64 0,02
0,53 0,74 0,11
0,49 0,63 0,27
0,48 0,67 -0,06
0,59 0,64 0,00
0,62 0,54 -0,11
0,51 0,54 0,19
0,53 0,62 0,09
T. MÍNIMA
ε
δ
µ
0,41 0,54 0,10
0,65 0,79 -0,03
0,28 0,33 -0,01
0,41 0,50 -0,20
0,48 0,43 -0,03
0,43 0,71 0,20
0,54 0,63 0,20
0,35 0,42 -0,12
0,29 0,39 0,09
0,36 0,49 -0,08
0,50 0,61 -0,07
0,48 0,48 0,30
0,47 0,55 0,15
0,43 0,53 0,04
T. MÉDIA
ε
δ
µ
0,34 0,39 0,03
0,39 0,41 -0,08
0,39 0,37 -0,01
0,33 0,36 -0,05
0,60 0,51 -0,06
0,48 0,51 0,13
0,48 0,44 0,08
0,33 0,35 0,04
0,37 0,40 0,18
0,44 0,46 -0,04
0,43 0,40 -0,03
0,58 0,50 0,24
0,45 0,61 -0,08
0,43 0,44 0,03
PRECIPITAÇÃO
ε
δ
µ
0,48 30,27 4,20
0,38 24,28 0,01
0,58 36,32 -6,31
0,55 33,01 12,88
0,64 40,51 6,40
0,72 45,06 11,13
0,59 34,89 -1,58
0,70 37,36 10,84
0,63 49,06 -5,52
0,61 42,06 12,47
0,68 39,97 7,91
0,45 28,02 9,28
0,70 39,95 17,57
0,59 36,98 6,10
TABELA 3 – Média mensal dos erros relativo, absoluto e médio para a temperatura máxima, temperatura
mínima, temperatura média e precipitação em treze estações do Rio Grande do Sul e Santa Catarina.
MÊS
JANEIRO
FEVEREIRO
MARÇO
ABRIL
MAIO
JUNHO
JULHO
AGOSTO
SETEMBRO
OUTUBRO
NOVEMBRO
DEZEMBRO
MÉDIA
T. MÁXIMA
ε
δ
µ
0,71 0,75 0,17
0,72 0,74 0,22
0,46 0,54 0,03
0,55 0,62 0,00
0,51 0,72 0,34
0,38 0,49 0,24
0,46 0,65 -0,18
0,60 0,77 -0,11
0,67 0,73 -0,03
0,56 0,63 0,06
0,58 0,61 0,19
0,49 0,61 0,16
0,56 0,65 0,09
T. MÍNIMA
ε
δ
µ
0,57 0,52 0,11
0,56 0,55 0,28
0,72 0,72 -0,05
0,29 0,39 0,05
0,30 0,49 -0,03
0,47 0,74 -0,35
0,32 0,54 -0,01
0,35 0,47 0,18
0,81 0,94 0,58
0,49 0,61 0,12
0,64 0,70 -0,23
0,77 0,71 -0,02
0,52 0,61 0,05
T. MÉDIA
ε
δ
µ
0,41 0,31 0,01
0,60 0,51 0,11
0,43 0,40 0,04
0,31 0,38 -0,03
0,29 0,42 0,07
0,35 0,47 0,08
0,31 0,44 -0,03
0,39 0,44 0,13
0,43 0,45 0,11
0,43 0,46 -0,24
0,68 0,56 0,00
0,54 0,46 0,09
0,43 0,44 0,03
PRECIPITAÇÃO
ε
δ
µ
0,59 36,55 -6,19
0,53 34,70 -3,55
0,72 41,64 12,56
0,56 38,71 13,44
0,48 32,89 9,47
0,57 36,11 10,95
0,66 41,98 4,03
0,50 32,71 3,96
0,54 30,18 -2,89
0,70 44,48 6,39
0,65 37,61 8,68
0,67 38,56 11,47
0,60 37,18 5,69
Para a precipitação verificou-se que os resultados mais satisfatórios ocorreram em meses isolados, que
tiveram um erro relativo inferior a 0,60. Para os erros absoluto e médio não há maiores considerações a
fazer.
Foram feitas as recuperações dos dados faltosos para as variáveis em estudo nas 13 estações do Rio
Grande do Sul e Santa Catarina com utilização de Regressão Linear Múltipla. E as séries com os dados
recuperados foram utilizadas em pesquisas climatológicas.
Na figura 1, como exemplo, são mostradas as variações dos dados observados e recuperados da
temperaturas máxima e mínima , e precipitação para o mês de julho na estação meteorológica de Bagé, a
partir do início das observações.
JU LH O -B AG É
24
T. MÁXIMA
22
R EAL
20
R EC
18
M É D IA
16
14
12
1910
1920
1930
1940
1950
1960
1970
1980
1990
AN O
(a)
JU LH O -B AG É
14
T. MÍNIMA
12
10
R EAL
8
R EC
6
M É D IA
4
2
1910
1920
1930
1940
1950
1960
1970
1980
1990
AN O
(b)
JU LH O -B AG É
PRECIPITAÇÃO
500
400
R E AL
300
REC
200
M ÉD IA
100
0
1910
1920
1930
1940
1950
1960
1970
1980
1990
AN O
(c)
Figura 1 – Séries observadas e recuperadas para o mês de julho em Bagé (RS): (a) temperatura máxima,
(b) temperatura mínima e (c) precipitação.
4. Conclusões
A análise da recuperação dos dados, para as temperaturas máxima, mínima e média, e precipitação,
de treze estações do Rio Grande do Sul e Santa Catarina, nos dados independentes, mostrou que a
recuperação dos dados é satisfatória, pois em nenhuma estação ou mês o erro relativo foi superior a um
( ε ≤ 1).
A análise nos mostra, para as temperaturas, que nas estações situadas no interior da região as recuperações
foram mais satisfatórios do que nas estações litorâneas. Tal fato não se verifica quando analisamos a
precipitação.
Portanto, podemos concluir que, a recuperação dos dados, através de Regressão Linear Múltipla, para
todas as variáveis estudadas, é satisfatória e, portanto, é possível usa-la para recuperar dados faltosos.
5. Referências Bibliográficas
BECKER, C. T., BRAGA, C. C., CEBALLOS, J. C. Regionalização da Precipitação e Temperatura no
Estado do Rio Grande do Sul a partir Análise Agrupamento. In: VII Congresso Brasileiro de
Meteorologia (7: 1992: São Paulo), Anais ..., São Paulo: Sociedade Brasileira de Meteorologia, 1992.
p. 225-232, v.1.
CEBALLOS, J.C; BRAGA, C.C. Simulação de Séries Temporais de Irradiação Solar: Uma aplicação ao
estado da Paraíba. Serimet; DCA/UFPb, n.3, p. 92, 1991.
CEBALLOS, J.C; BRAGA, C.C. Simulation of time series in a solarimetric network. Journal of
Cilmatology, 1994.
DINIZ, G. B. Séries Temporais de Irradiação Solar: Recuperação de Dados Mediante Componentes
Principais. Campina Grande , Universidade Federal da Paraíba, Dissertação de Mestrado, 1994.
DINIZ, G. B. Recomposição de Séries Temporais de Temperatura Máxima e Mínima de Estações do Rio
Grande do Sul e Santa Catarina Usando Análise Multivariada. Pelotas , Universidade Federal de
Pelotas, 1998.
Download

- cbmet.com - congressos brasileiros de meteorologia