RECUPERAÇÃO DE DADOS CLIMATOLÓGICOS DO RIO GRANDE DO SUL E SANTA CATARINA Flavio Varone Gonçalves (1); Ilia S. Kim (1) Curso Pós-Graduação em Meteorologia , Faculdade de Meteorologia, UFPel. ABSTRACT Climatological studies demand that the series meteorological data have a long observation period, but these series generally possess many given missing. The situation in Brazil is more difficult, because the observed series have a big percentile of flaws. Then we propose through the use of the method of Multiple Linear Regression the recovery of monthly series of the temperatures (maxim, minimum and mean) of the air and precipitation, with a long observation period, of 13 stations of Rio Grande do Sul and Santa Catarina, of Brazil. The evaluation method of data recovery was made in the independent period, through the analysis of the relative error ( ε ), what showed that the simulation of data was satisfactory. 1. Introdução Os estudos climatológicos exigem que as séries de dados meteorológicos tenham um longo período de observação. Porém, geralmente, tais séries, possuem dados faltosos. No Brasil, a situação é mais difícil, pois as séries observadas tem um grande percentual de falhas. Para resolver tal problema, foram desenvolvidos os métodos de controle e recuperação de dados. Existem diferentes métodos de recuperação de dados, tais como, Análise Multivariada, com Componentes Principais (Diniz, 1994, Ceballos e Braga, 1991) e Regressão Linear Múltipla. Neste trabalho, propõe-se, através do uso do método de Regressão Linear Múltipla, a recomposição das séries de temperatura máxima, temperatura mínima, temperatura média e precipitação, com um longo período de observação, de 13 estações dos estados do Rio Grande do Sul e Santa Catarina, pertencentes a região sul do Brasil. A avaliação do método de recuperação dos dados foi feita no período independente, o que mostrou que a simulação de dados faltosos foi satisfatória. Este trabalho foi realizado dentro do projeto intitulado “ Elaborar um Banco de Dados e Desenvolver Métodos de Previsão de Tempo e Clima para o Estado do Rio Grande do Sul “, FAPERGS. 2. Dados e Metodologia Os dados de temperatura máxima, temperatura mínima, temperatura média e precipitação, de estações do Rio Grande do Sul e Santa Catarina, utilizados neste trabalho, doze foram fornecidas pelo 8º Distrito de Meteorologia (INMET) e uma pela Estação Agroclimatológica da Embrapa de Pelotas. A recuperação dos dados foi feita com o uso do método de regressão linear múltipla: yˆ = a 0 + a1 x1 + a 2 x 2 + ... + a n x n onde, ŷ - dado recuperado, x1 , x 2 ,..., x n - valores dos dados meteorológicos de outras estações, a 0 , a1 , a 2 ,..., a n - coeficientes de regressão correspondentes. As equações de Regressão Linear Múltipla foram criadas com a utilização do procedimento Stepwise. A avaliação do método de recuperação de dados, foi feita através do cálculo dos erros relativo ( ε ), médio ( µ ) e absoluto ( δ ): 2 n σ ε = er ; σs σ er = ( yi − yˆ i ) ∑ i =1 µ = y − yˆ i ; n 2 (x j − x j ) ∑ j =1 m ; σs = m ; δ = y I − yˆ i ; onde, σ er - erro quadrático, σ s - desvio padrão, n - número de casos a simular, y i - valores dos dados reais, ŷ i - valores dos dados simulados, xi - valores dos dados da série, x - valor médio da série. Pode se supor como boa a simulação em que ε ≤ 1 e ruim quando ε >1. 3. Resultados e Discussão Foi feita a análise do percentual de dados faltosos para as temperaturas máxima, mínima e média, e precipitação, desde o início das observações em cada estação. Tal análise mostrou que este percentual é, em média, cerca de 20% em todas as variáveis. As estações de Bom Jesus, Caxias, Iraí, Lages e Torres apresentaram os maiores percentuais de dados faltosos, entre 30 e 50%, enquanto que em Pelotas praticamente não existem falhas. Os percentuais são apresentados na Tabela 1. TABELA 1 – Média do percentual de dados faltosos em treze estações do Rio Grande do Sul e Santa Catarina, para temperatura máxima, temperatura mínima, temperatura média e precipitação. ESTAÇÃO T. Máxima T. Média T. Mínima Precipitação BAGÉ 13,0 14,4 9,8 8,2 BOM JESUS 56,1 58,0 55,8 54,9 CAXIAS 36,9 38,7 32,5 31,0 ENCRUZILHADA 19,7 16,1 17,5 13,4 FLORIANÓPOLIS 19,2 21,9 19,8 18,9 IRAÍ 38,1 37,7 35,0 35,1 LAGES 34,7 35,8 36,4 33,9 PORTO ALEGRE 9,5 22,8 9,4 7,2 SÂO LUIZ GONZAGA 11,0 12,1 10,8 8,7 SANTA MARIA 9,9 23,7 8,5 7,2 SANTA. VITÓRIA 8,7 10,1 10,1 8,2 TORRES 36,7 42,5 31,6 30,6 PELOTAS 1,4 0,0 0,0 0,0 MÉDIA 22,7 25,7 21,4 19,8 A recuperação de séries temporais das temperaturas máxima, mínima e média, e precipitação de treze estações, foi feita através de Regressão Linear Múltipla, onde como preditores foram utilizados os valores dos dados das outras estações. A análise dos coeficientes de regressão, mostrou que todos os valores estão acima do nível de significância. A avaliação da recuperação foi feita nos dados independentes. Foram retirados 36 valores de cada variável e recuperados através do método, estes valores não foram utilizados para ciara as equações. Os erros calculados foram analisados mensalmente e em cada estação. Na Tabela 2 são apresentados os resultados em cada estação. A análise do erro relativo, para as temperaturas máxima, mínima e média, mostrou que a recuperação nas estações localizadas no interior foram mais satisfatórias do que as estações litorâneas, pois a grande maioria das estações utilizadas situam-se mais distantes do litoral e consequentemente possuem características climatológicas diferentes. Os melhores valores de ε variaram entre 0,43 e 049, para a temperatura máxima, 0,28 e 0,43 na temperatura mínima e 0,33 e 0,39 na temperatura média, nas estações situadas no interior da região, enquanto que nas estações litorâneas ficaram próximos de 0,60. Os erros absoluto e médio não sofrem influência da localização das estações. Para recuperação dos dados de precipitação, conforme Tabela 2, as estações, litorâneas ou no interior, não apresentam diferenças. Os valores de ε mais representativos de ficaram no intervalo de 0,38 – 0,59. A análise mensal dos erros, Tabela 3, mostrou que a recuperação dos dados sofre influência das variações sazonais ao longo do ano. O erro relativo apresentou períodos onde a recuperação foi mais satisfatória, na temperatura máxima março-julho e nas temperaturas mínima e média abril-agosto. Os erros absoluto e médio, conforme a análise, não apresentaram variações consideráveis. TABELA 2 – Média dos erros relativo, absoluto e médio para a temperatura máxima, temperatura mínima, temperatura média e precipitação em treze estações do Rio Grande do Sul e Santa Catarina. ESTAÇÕES BAGÉ BOM JESUS CAXIAS ENCRUZILHADA FLORIANÓPOLIS IRAÍ LAGES PORTO ALEGRE S.LUIZ GONZAGA SANTA MARIA SANTA VITÓRIA TORRES PELOTAS MÉDIA T. MÁXIMA ε δ µ 0,60 0,80 0,21 0,54 0,66 0,26 0,43 0,53 0,03 0,43 0,54 -0,08 0,63 0,53 0,22 0,48 0,60 0,06 0,57 0,64 0,02 0,53 0,74 0,11 0,49 0,63 0,27 0,48 0,67 -0,06 0,59 0,64 0,00 0,62 0,54 -0,11 0,51 0,54 0,19 0,53 0,62 0,09 T. MÍNIMA ε δ µ 0,41 0,54 0,10 0,65 0,79 -0,03 0,28 0,33 -0,01 0,41 0,50 -0,20 0,48 0,43 -0,03 0,43 0,71 0,20 0,54 0,63 0,20 0,35 0,42 -0,12 0,29 0,39 0,09 0,36 0,49 -0,08 0,50 0,61 -0,07 0,48 0,48 0,30 0,47 0,55 0,15 0,43 0,53 0,04 T. MÉDIA ε δ µ 0,34 0,39 0,03 0,39 0,41 -0,08 0,39 0,37 -0,01 0,33 0,36 -0,05 0,60 0,51 -0,06 0,48 0,51 0,13 0,48 0,44 0,08 0,33 0,35 0,04 0,37 0,40 0,18 0,44 0,46 -0,04 0,43 0,40 -0,03 0,58 0,50 0,24 0,45 0,61 -0,08 0,43 0,44 0,03 PRECIPITAÇÃO ε δ µ 0,48 30,27 4,20 0,38 24,28 0,01 0,58 36,32 -6,31 0,55 33,01 12,88 0,64 40,51 6,40 0,72 45,06 11,13 0,59 34,89 -1,58 0,70 37,36 10,84 0,63 49,06 -5,52 0,61 42,06 12,47 0,68 39,97 7,91 0,45 28,02 9,28 0,70 39,95 17,57 0,59 36,98 6,10 TABELA 3 – Média mensal dos erros relativo, absoluto e médio para a temperatura máxima, temperatura mínima, temperatura média e precipitação em treze estações do Rio Grande do Sul e Santa Catarina. MÊS JANEIRO FEVEREIRO MARÇO ABRIL MAIO JUNHO JULHO AGOSTO SETEMBRO OUTUBRO NOVEMBRO DEZEMBRO MÉDIA T. MÁXIMA ε δ µ 0,71 0,75 0,17 0,72 0,74 0,22 0,46 0,54 0,03 0,55 0,62 0,00 0,51 0,72 0,34 0,38 0,49 0,24 0,46 0,65 -0,18 0,60 0,77 -0,11 0,67 0,73 -0,03 0,56 0,63 0,06 0,58 0,61 0,19 0,49 0,61 0,16 0,56 0,65 0,09 T. MÍNIMA ε δ µ 0,57 0,52 0,11 0,56 0,55 0,28 0,72 0,72 -0,05 0,29 0,39 0,05 0,30 0,49 -0,03 0,47 0,74 -0,35 0,32 0,54 -0,01 0,35 0,47 0,18 0,81 0,94 0,58 0,49 0,61 0,12 0,64 0,70 -0,23 0,77 0,71 -0,02 0,52 0,61 0,05 T. MÉDIA ε δ µ 0,41 0,31 0,01 0,60 0,51 0,11 0,43 0,40 0,04 0,31 0,38 -0,03 0,29 0,42 0,07 0,35 0,47 0,08 0,31 0,44 -0,03 0,39 0,44 0,13 0,43 0,45 0,11 0,43 0,46 -0,24 0,68 0,56 0,00 0,54 0,46 0,09 0,43 0,44 0,03 PRECIPITAÇÃO ε δ µ 0,59 36,55 -6,19 0,53 34,70 -3,55 0,72 41,64 12,56 0,56 38,71 13,44 0,48 32,89 9,47 0,57 36,11 10,95 0,66 41,98 4,03 0,50 32,71 3,96 0,54 30,18 -2,89 0,70 44,48 6,39 0,65 37,61 8,68 0,67 38,56 11,47 0,60 37,18 5,69 Para a precipitação verificou-se que os resultados mais satisfatórios ocorreram em meses isolados, que tiveram um erro relativo inferior a 0,60. Para os erros absoluto e médio não há maiores considerações a fazer. Foram feitas as recuperações dos dados faltosos para as variáveis em estudo nas 13 estações do Rio Grande do Sul e Santa Catarina com utilização de Regressão Linear Múltipla. E as séries com os dados recuperados foram utilizadas em pesquisas climatológicas. Na figura 1, como exemplo, são mostradas as variações dos dados observados e recuperados da temperaturas máxima e mínima , e precipitação para o mês de julho na estação meteorológica de Bagé, a partir do início das observações. JU LH O -B AG É 24 T. MÁXIMA 22 R EAL 20 R EC 18 M É D IA 16 14 12 1910 1920 1930 1940 1950 1960 1970 1980 1990 AN O (a) JU LH O -B AG É 14 T. MÍNIMA 12 10 R EAL 8 R EC 6 M É D IA 4 2 1910 1920 1930 1940 1950 1960 1970 1980 1990 AN O (b) JU LH O -B AG É PRECIPITAÇÃO 500 400 R E AL 300 REC 200 M ÉD IA 100 0 1910 1920 1930 1940 1950 1960 1970 1980 1990 AN O (c) Figura 1 – Séries observadas e recuperadas para o mês de julho em Bagé (RS): (a) temperatura máxima, (b) temperatura mínima e (c) precipitação. 4. Conclusões A análise da recuperação dos dados, para as temperaturas máxima, mínima e média, e precipitação, de treze estações do Rio Grande do Sul e Santa Catarina, nos dados independentes, mostrou que a recuperação dos dados é satisfatória, pois em nenhuma estação ou mês o erro relativo foi superior a um ( ε ≤ 1). A análise nos mostra, para as temperaturas, que nas estações situadas no interior da região as recuperações foram mais satisfatórios do que nas estações litorâneas. Tal fato não se verifica quando analisamos a precipitação. Portanto, podemos concluir que, a recuperação dos dados, através de Regressão Linear Múltipla, para todas as variáveis estudadas, é satisfatória e, portanto, é possível usa-la para recuperar dados faltosos. 5. Referências Bibliográficas BECKER, C. T., BRAGA, C. C., CEBALLOS, J. C. Regionalização da Precipitação e Temperatura no Estado do Rio Grande do Sul a partir Análise Agrupamento. In: VII Congresso Brasileiro de Meteorologia (7: 1992: São Paulo), Anais ..., São Paulo: Sociedade Brasileira de Meteorologia, 1992. p. 225-232, v.1. CEBALLOS, J.C; BRAGA, C.C. Simulação de Séries Temporais de Irradiação Solar: Uma aplicação ao estado da Paraíba. Serimet; DCA/UFPb, n.3, p. 92, 1991. CEBALLOS, J.C; BRAGA, C.C. Simulation of time series in a solarimetric network. Journal of Cilmatology, 1994. DINIZ, G. B. Séries Temporais de Irradiação Solar: Recuperação de Dados Mediante Componentes Principais. Campina Grande , Universidade Federal da Paraíba, Dissertação de Mestrado, 1994. DINIZ, G. B. Recomposição de Séries Temporais de Temperatura Máxima e Mínima de Estações do Rio Grande do Sul e Santa Catarina Usando Análise Multivariada. Pelotas , Universidade Federal de Pelotas, 1998.