ESTIMATIVAS DE VELOCIDADE MÁXIMA DE VENTO EM PIRACICABA – SP VIA SÉRIES TEMPORAIS E TEORIA DE VALORES EXTREMOS. Gilberto Rodrigues LISKA1 Juliano BORTOLINI2 Thelma SÁFADI3 Luiz Alberto BEIJO4 RESUMO:Rajadas de vento com velocidades superiores a 20 m/s representam perigo para a sociedade e construções. Diante disso, prever a velocidade de ventos, por métodos confiáveis é de grande importância no planejamento urbano. A teoria de valores extremos (TVE) e a de séries temporais (ST) têm sido aplicadas com sucesso no tratamento estatístico de dados meteorológicos. Sendo assim, objetivou-se neste trabalho estimar os níveis extremos de velocidade de ventos do município de Piracicaba – SP pela TVE, utilizando a distribuição Gumbel, e por ST. A série diária de dados compreende o período de janeiro de 1980 a setembro de 2013 e referem-se aos registros de velocidade máxima de vento do município de PiracicabaSP. Para mensurar os erros provenientes das estimativas de velocidade máxima de vento em ambos os métodos, a série foi divididas em conjunto de treinamento, constituída por 31 anos, e de teste, constituída pelos dois últimos anos e calculou-se o erro quadrático médio de previsão (EQMP) e o erro percentual médio absoluto (MAPE). As duas metodologias foram satisfatórias, e o modelo em ST mais adequado foi o SARIMA(1,0,1)(1,1,1)12 com intervenção. As maiores frequências de rajadas de vento foram observadas nos meses de setembro a fevereiro pelos dois métodos, sendo essa informação de suma importância no planejamento urbano e agrícola da cidade de Piracicaba – SP. PALAVRAS-CHAVES: Velocidade máxima de vento; distribuição Gumbel; modelos auto regressivos sazonais; tempo de retorno; planejamento urbano. 1 Introdução O vento tem importância muito grande na atividade humana. Na agricultura, por exemplo, está diretamente associado ao desenvolvimento das plantas, ao facilitar as trocas 1 2 3 4 Universidade Federal de Lavras - UFLA, Programa de pós-graduação em Estatística e Experimentação Agronômica, CEP: 37200-000, Lavras, MG, Brasil. E-mail: [email protected] Universidade Federal do Mato Grosso - UFMT, Departamento de Estatística, CEP:78060-900, Cuiabá, Mato Grosso, Brasil. E-mail: [email protected] Universidade Federal de Lavras - UFLA, Departamento de Ciências Exatas, CEP: 37200-000, Lavras, MG, Brasil. E-mail: [email protected] Universidade Federal de Alfenas - UNIFAL, Instituto de Ciências Exatas, CEP: 37130-000, Alfenas, MG, Brasil. E-mail: [email protected] Rev. Bras. Biom., São Paulo, v.31, n.2, p.295-309, 2013 295 de calor, de dióxido de carbono e de vapor d’água entre a atmosfera e a vegetação, além de ajudar no processo de polinização das flores e poder ser utilizado como fonte de energia (energia eólica). Entretanto, quando se registram ventos de velocidades elevadas, normalmente de curta duração, os seus efeitos passam, geralmente, a ser danosos, provocando o estímulo excessivo à evapotranspiração, o acamamento das plantas, a queda de flores e frutos, a quebra de galhos e arrancamento de plantas, causando a erosão dos solos, a deformação da paisagem e danos em construções e instalações. A escala de Beaufort (NATIONAL WEATHER SERVICE, 2002) classifica a intensidade dos ventos, tendo em conta a sua velocidade e os efeitos resultantes das ventanias no mar e em terra em uma escala que varia de 1 a 11. Nessa escala, ventos com velocidade de até 10,7 m/s (escala 5) não oferecem perigo, velocidades de vento de até 17,1 m/s (escala 7) representam um nível de atenção e ventos com velocidade classificados em escalas acima de 8 (velocidade acima de 17,2 m/s) tem efeitos danosos. Sendo a ocorrência de ventos extremos um processo aleatório, que não permite uma previsão determinística com grande antecedência, o ajustamento de um modelo probabilístico que melhor descreva o processo se faz necessário, a fim de se fazer previsões. A teoria de valores extremos (TVE) desempenha um papel fundamental em estudos relacionados a medições físicas, em que é aplicada com a finalidade de descrever o comportamento de eventos raros e tem sido aplicada com sucesso no tratamento estatístico de dados meteorológicos, tais como precipitações máximas, temperaturas mínimas, ventos máximos, entre outros (BEIJO e AVELAR, 2010). A distribuição de probabilidade Gumbel é a que tem maior destaque na literatura (ROWINSKI et al., 2002). Vários trabalhos tem mostrado que é a distribuição que melhor se ajusta aos fenômenos meteorológicos que envolvam máximos, entre os quais a precipitação pluvial máxima (SANSIGOLO, 2008). Os registros de velocidades máximas de vento são feitos ao longo do tempo, então existe a possibilidade de que um registro num dado tempo seja influenciado por um registro anterior. Essa correlação inerente às observações de uma série é objeto de estudo das Séries Temporais (ST), onde são empregadas funções matemáticas a fim de modelar o mecanismo gerador da série e assim efetuar previsões (MORETTIN; TOLOI, 2006). Adicionalmente a essa classe de modelos, informações discrepantes das demais podem ser incorporadas no modelo, levando aos modelos com intervenção. Assim, tendo em vista a importância do conhecimento das possíveis velocidades de ventos máximos, este trabalho teve como objetivo empregar o uso das metodologias de TVE e ST e discutir as principais vantagens de cada método, a fim de fornecer informações mais precisas, de acordo com o interesse prático, sobre a ocorrência de ventos máximos no município de Piracicaba – SP, haja vista que informações do tipo são de grande importância para o planejamento urbano e de desenvolvimento. 2 Referencial Teórico 2.1 Teoria de Valores Extremos A distribuição generalizada de valores extremos (GVE) foi desenvolvida por Jenkinson (1955), e apresenta como casos particulares os três tipos de distribuições de 296 Rev. Bras. Biom., São Paulo, v.31, n.2, p.295-309, 2013 valores extremos, a saber, as distribuições Weibull, Gumbel e Fréchet (Figura 1). A função de distribuição acumulada de probabilidade da distribuição GVE é dada por x−β F ( x; β , α , ξ ) = exp − 1 + ξ α 1 − ξ (1) definida em, −∞ < x < β − α ξ para ξ < 0 , −∞ < x < ∞ para ξ tendendo a zero, β − α ξ < x < ∞ para ξ > 0 , sendo β , α e ξ os parâmetros de posição, escala e de forma respectivamente com α > 0 . Derivando-se (1) em relação à x , em que X representa a variável aleatória associada a valores máximos de velocidade do vento, obtém-se a função densidade de probabilidade f(x) da distribuição generalizada de valores extremos (GVE). A função densidade de probabilidades da distribuição Gumbel é obtida resolvendo lim f ( x ) , que é dada por x →0 x−β x − β exp − − exp − α α , α 1 β éo parâmetro de escala com α > 0 . em que − ∞ < x < ∞ , parâmetro de posição com −∞ <β <∞ e α é o 0.8 0.4 F(x) 0.06 0.6 0.08 0.10 Fréchet Gumbel Weibull Fréchet Gumbel Weibull 0.0 0.00 0.02 0.2 0.04 f(x) (2) 1.0 f ( x; β , α ) = 0 10 20 30 40 50 60 x 0 10 20 30 40 50 60 x FIGURA 1 - Gráfico da função densidade de probabilidade (esquerda) e probabilidade acumulada (direita) da distribuição GVE nos casos Fréchet, Weibull e Gumbel. De acordo com Beijo et al. (2005), assumindo independência entre as observações, os estimadores da máxima verossimilhança para os parâmetros β e α da distribuição Gumbel são respectivamente, Rev. Bras. Biom., São Paulo, v.31, n.2, p.295-309, 2013 297 1 n −x exp i ∑ αˆ n i =1 n − x xi exp i ∑ ˆ 1 n α αˆ = ∑ xi − i =1n n i =1 −x exp i ∑ αˆ i =1 βˆ = −αˆ ln (3) (4) em que ln é o operador do logaritmo neperiano. A probabilidade da variável aleatória X, de que ocorra uma rajada máxima de vento maior que certo valor x via distribuição Gumbel é dada por x − βˆ P [ X > x ] = 1 − F ( x; βˆ , αˆ ) = 1 − exp − exp − αˆ (5) em que, x é a velocidade do vento máximo do período e 0 < x < ∞ . O período de retorno estimado (expresso em anos) para o maior valor registrado em cada um dos meses do ano é dado por τ = 1 1− F ( x) (6) O nível de retorno associado ao período de retorno τ é obtido a partir da solução da equação ∫ xp −∞ ( ) f ( x )dx = 1 − p para p = 1 τ , ou seja, F x p = 1 − p , que invertendo resulta em 1 xˆ p = F −1 1 − p; βˆ , αˆ = βˆ − αˆ ln ln 1 − p ( ) (7) sendo xˆ p o quantil da distribuição Gumbel, dada a probabilidade p. 2.2 Séries temporais Toda série temporal {Zt , t = 1,..., n} pode ser decomposta na soma Z t = Tt + St + at , em que: a componente Tt explica a tendência da série, isto é, o aumento ou diminuição dos valores observados segundo um comportamento que pode ser polinomial ou exponencial; a componente S t explica a sazonalidade da série, isto é, fenômenos que ocorrem regularmente (diariamente, semanalmente, mensalmente etc); e a componente aleatória ou erro at . A suposição usual é que at seja uma série puramente aleatória ou ruído branco independente, com média zero e variância constante. Caso seja necessário estabilizar a variância ou tornar o efeito sazonal aditivo pode-se utilizar a transformação Box e Cox (1964) na série original Z t , tal como ilustrado em Cryer e Chan (2008). 298 Rev. Bras. Biom., São Paulo, v.31, n.2, p.295-309, 2013 A existência de tendência pode-se ser testada através do teste do sinal, proposto por Cox e Stuart (1955); a sazonalidade, em particular a periodicidade, pode ser testada através do teste de Fisher, descrito inicialmente em Fisher (1929) e estendido em Whittle (1952). A verificação se a componente aleatória at é ruído branco pode ser feita pelo teste proposto por Ljung e Box (1978), que tem como base a estatística Q da função de autocorrelação. O modelo SARIMA ( p, d , q )( P, D, Q )s considera a tendência e a sazonalidade da série, e pode ser representado por D φ p ( B ) Φ P ( B s ) (1 − B ) (1 − B s ) Zt = θ q ( B ) ΘQ ( B s ) at d em que: B é o operador translação φ p ( B ) = 1 − φ1 B − ... − φ p B p θ q ( B ) = 1 − θ1 B − ... − θ q B ΦP ( B s ) = 1− Φ B (B ) = 1− Θ B ΘQ s é o é q o para o passado, polinômio polinômio de (8) definido por B j Zt = Zt − j ; auto-regressivo de ordem médias móveis de p; ordem q; é o polinômio sazonal auto-regressivo de ordem P ; s − ... − Φ P B s − . − ΘQ B Qs é o polinômio sazonal de médias móveis de ordem Q ; 1 1 Ps d é o número de diferenças necessárias para retirar a tendência da série; D é o número de diferenças de “lag’s” s para retirar a sazonalidade estocástica da série. Uma classe geral de modelos, que leva em conta a ocorrência de múltiplas intervenções, segundo Morettin e Toloi (2006), é dada por k Z t = ∑υ j ( B ) X j ,t + N t (9) j =1 em que, X j ,t são variáveis de intervenções do tipo degrau ou impulso; υ j ( B) = wj ( B ) B δ j ( B) bj , com w j ( B ) = w j ,0 − w j ,1 B − … − w j , s B s e δ j ( B ) = 1 − δ j ,1 B − ... − δ j , r B r com polinômios em B , e b j é a defasagem no tempo para o início do efeito da j − ésima intervenção; N t é a série temporal livre do efeito das intervenções e é denominada série residual, geralmente representada por um modelo SARIMA . As estimativas do erro quadrático médio de previsão (EQMP) são dadas pela média dos quadrados das diferenças entre os valores observados Z e preditos Zˆ , com t +h t +h h = 1,..., n e n o número de previsões. O EQMP com origem em t é dado por: Rev. Bras. Biom., São Paulo, v.31, n.2, p.295-309, 2013 299 EQMPt = 1 n ∑ (Zt + h − Zˆt + h )2 n h =1 (10) Assim como o EQMP , o erro percentual médio absoluto (mean absolute percentage error - MAPE) também é utilizado para verificar o bom desempenho de ajuste de um modelo e é dado por: MAPEt = 1 n Z t + h − Zˆt + h ⋅100 ∑ Z n h =1 t+h (11) 3 Material e métodos Serão analisadas as séries históricas dos valores máximos diários de velocidade do vento (em m/s), registradas na Estação Agrometeorológica da ESALQ, USP, em Piracicaba, SP (latitude 22º42’30’’S, à longitude 47º 38’30”W e altura 546m). O clima da região é tropical úmido com chuvas de verão e seca no inverno (VILLA NOVA, 2003). A série diária compreende o período de janeiro de 1980 a setembro de 2013. Para analisar as séries via TVE, os dados serão agrupados em períodos mensais e será extraído o valor máximo de velocidade do vento observado de cada série, formando assim, vetores de valores máximos de cada período para cada mês estudado. Utilizando-se a distribuição Gumbel com as estimativas dos parâmetros obtidas pelo método da máxima verossimilhança,serão calculadas as estimativas de determinados níveis máximos de rajadas de vento ocorrerem, considerando-se os níveis de retorno de 2 a100 anos. Para analisar as séries via ST, será extraído o máximo de cada mês, formando ao final um vetor com todas as observações. O ajuste da distribuição aos dados será avaliado pelo teste Kolmogorov-Smirnov (KS) a um nível de 5% de significância, de acordo com Campos (1983). Este teste, no entanto, segundo Crutcher (1975), somente deve ser utilizado para distribuições completamente especificadas, isto é, quando não existem parâmetros desconhecidos que precisam ser estimados a partir da amostra. Caso contrário, o teste se apresenta muito conservador. Para corrigir este problema, foram obtidos, por meio de simulação, os níveis críticos para a estatística de Kolmogorov-Smirnov no caso em que se estimam os parâmetros da distribuição Gumbel, com um nível de significância 5%, para amostras de tamanho n = 32. Para avaliar a independência das séries, será utilizado o teste de LjungBox (LJUNG; BOX, 1978), cuja estatística de teste é comparada com o quantil de uma distribuição qui-quadrado com um grau de liberdade, também ao nível de 5% de significância. Neste trabalho, os modelos da classe SARIMA ( ARIMA sazonal) descritos e propostos por Box e Jenkins (1970), ou recentemente descritos por Box, Jenkins e Reinsel (2008), serão ajustados com o auxílio dos gráficos das funções de auto correlação amostral e auto correlação parcial amostral, conforme descritos em Morettin e Toloi (2006). O teste de Ljung-Box será utilizado para verificar se o os mesmos apresentam ruídos brancos. Os modelos ajustados serão comparados por meio do critério de 300 Rev. Bras. Biom., São Paulo, v.31, n.2, p.295-309, 2013 informação de Akaike (AIC) e, entre os modelos de séries temporais, será indicado aquele que fornecer o menor valor. Para mensurar os erros provenientes das estimativas de velocidade máxima de vento em ambos os métodos, a séries foi divididas em conjunto de treinamento, constituída por 31 anos, e de teste, constituída pelos dois últimos anos (2012 e 2013) e serão calculados o erro quadrático médio de previsão (EQMP) e o erro percentual médio absoluto (MAPE). Para realização das análises serão utilizados os pacotes estatísticos “EVD” e “TSA”do Sistema Computacional Estatístico R, conforme R Development Core Team(2013). 4 Resultados e Discussão 40 30 20 0 12 24 36 48 60 72 84 96 108 120 132 144 156 168 180 192 204 216 228 240 252 264 276 288 300 312 324 336 348 360 372 384 10 Velocidade do vento (m/s) A figura 2 apresenta o gráfico da série mensal de velocidade máxima de vento em Piracicaba – SP no período de janeiro de 1980 a dezembro de 2011. Observa-se que as rajadas de vento ocorrem com maior intensidade ao final e começo do ano. Observa-se a ocorrência de rajadas de vento superiores a 30m/s, consideradas como tempestades violentas segundo a escala de Beaufort (NATIONAL WEATHER SERVICE, 2002). Tempo (meses) FIGURA 2 - Gráfico da série mensal de velocidade máxima de vento em Piracicaba – SP no período de janeiro de 1980 a dezembro de 2011. A Figura 3 apresenta o gráfico da função de auto correlação e esta evidencia o comportamento não estacionário da série, uma vez que os valores da auto correlação apresentam um comportamento cíclico ao longo dos lags múltiplos de 12 meses, que são os lags com valores 1, 2 e 3 na figura 3. Rev. Bras. Biom., São Paulo, v.31, n.2, p.295-309, 2013 301 35 30 0.3 20 5 10 15 Amplitudes 25 0.2 fac 0.1 0.0 -0.1 0.0 0.5 1.0 1.5 2.0 2.5 3.0 12 Lag FIGURA 3 - Função de auto correlação amostral da série mensal de velocidade máxima de vento em Piracicaba – SP no período de janeiro de 1980 a dezembro de 2011. 14 16 18 20 22 24 Médias FIGURA 4 - Gráfico amplitude versus média para a série mensal de velocidade máxima de vento em Piracicaba – SP no período de janeiro de 1980 a dezembro de 2011. Analisando o gráfico amplitude versus média (figura 4) verifica-se que a média é proporcional a amplitude, nessa situação é apropriado a transformação do tipo Z t−0,5 para estabilizar a variância. A série não apresenta tendência, uma vez que a hipótese nula do teste do sinal de Cox-Stuart foi aceita ao nível de 5% de significância (Tobs=119< 177 =T0,05), mas parece apresentar comportamento semelhante ao longo dos anos. Para avaliar esse fato, foi utilizado o teste de Fisher considerando-se uma sazonalidade de período 12 meses e o resultado do teste é significativo, uma vez que a estatística do teste g obs = 0,164 > 0, 042 = g0,05 . Portanto, a série de velocidade máxima de vento em Piracicaba não apresenta tendência, porém apresenta uma sazonalidade anual. Observa-se ainda na figura 2 que a observação 315, referente ao mês de fevereiro de 2006, há um registro de velocidade máxima de vento de 44 m/s, configurando uma situação atípica das demais. Após sucessivos ajustes de modelos temporais, considerando-se a variável transformada, analisando-se as funções de autocorrelação amostral, parcial amostral e residual, o modelo que apresentou melhor ajuste e menor AIC foi o SARIMA(1,0,1)(1,1,1)12 com intervenção na observação 315 do tipo abrupta e temporária. As estimativas dos parâmetros desse modelo e resultado do teste de Ljung-Box e AIC estão na Tabela 1. As Figuras 5 e 6 e a estatística Q, que é menor do que o nível crítico tabela do da distribuição qui-quadrado com 24 graus de liberdade, cujo valor é 36,415, corroboram a escolha do modelo, uma vez seus resíduos podem ser considerados ruídos brancos. Assim, o modelo ajustado via séries temporais para a variável transformada Z t−0,5 sazonalmente ajustada de velocidade máxima de vento é dado por (1 − B ) Z 12 302 t = −0,125 X t + (1 − B12 ) Nt , em que, Rev. Bras. Biom., São Paulo, v.31, n.2, p.295-309, 2013 (1 − 0,965B ) (1 − 0,999 B12 ) Nt = 0, 246 + (1 + 0,853B ) (1 + 0,985B12 ) at e X t = 1 se t=315 e X t = 0 se t ≠ 315 Tabela 1 - Modelo de série temporal ajustado à série máxima de velocidade de vento da cidade de Piracicaba – SP do período de janeiro de 1980 a dezembro de 2011 e o respectivo valor de AIC e resultado do teste de Ljung-Box (Q) * Modelo Const. φ1 θ1 Φ1 Θ1 υ SARIMA(1,0,1)(1,1,1)12 0,246 0,965 -0,853 0,999 -0,985 -0,124 Erro Padrão 0,025 0,022 0,047 0,001 0,020 0,025 AIC -1689,990 Q 14,894 0.00 Fac (residuals) -0.05 0.00 -0.10 -0.10 -0.05 Fac (residuals) 0.05 0.05 0.10 0.10 * υ representa a estimativa do parâmetro para o modelo com intervenção. 0 1 2 3 4 Lag FIGURA 5 - Função de autocorrelação residual do modelo SARIMA(1,0,1)(1,1,1)12 0 1 2 3 4 Lag FIGURA 6 - Função de autocorrelação residual do modelo SARIMA(1,0,1)(1,1,1)12 com intervenção na obs. 315. Analisando as estimativas dos parâmetros da distribuição Gumbel, pode-se observar que, nos meses em que ocorre vento com velocidade menor, as estimativas dos parâmetros são menores, como ocorre de abril a agosto. Analogamente, para os meses que ocorrem maior quantidade de chuvas e intensidade solar, as estimativas dos parâmetros são maiores, como ocorre nos meses de setembro a fevereiro (Tabela 2). Rev. Bras. Biom., São Paulo, v.31, n.2, p.295-309, 2013 303 Tabela 2 - Estimativas dos parâmetros da distribuição Gumbel para as séries máximas mensais de velocidade do vento (m/s) ( ) ( ) Mês α̂ β̂ V (αˆ ) COV αˆ , βˆ V βˆ Janeiro Fevereiro Março Abril Maio Junho Julho Agosto Setembro Outubro Novembro Dezembro 16,813 16,545 15,207 13,518 13,968 13,254 12,774 13,938 17,480 17,606 16,396 17,600 3,166 3,188 3,599 2,631 3,432 3,473 2,291 3,050 3,832 3,517 2,982 3,583 0,348 0,355 0,443 0,237 0,407 0,420 0,182 0,325 0,510 0,430 0,308 0,446 0,082 0,083 0,099 0,055 0,098 0,098 0,042 0,077 0,120 0,099 0,070 0,104 0,191 0,183 0,258 0,147 0,243 0,222 0,097 0,172 0,281 0,225 0,165 0,237 Os resultados do teste de Kolmogorov-Smirnov, ao nível de 5% de significância, são apresentados na Tabela 3, bem como as diferenças máximas absolutas observadas entre os valores de probabilidade das funções de probabilidade acumulada empírica e de Gumbel (teórica), que são as estatísticas do teste, e os níveis críticos Dn ,α , para n = 32, com um nível de significância de 5%, obtidos por simulação. Para obter tais níveis críticos, inicialmente geraram-se 10.000 amostras de tamanho n = 32 de uma variável aleatória com distribuição Gumbel padrão. Em seguida, calculou-se, para cada uma, o valor da estatística de Kolmogorv-Smirnovcom os parâmetros da distribuição Gumbel estimados à partir da amostra e tomou-se, como nível crítico, o quantil de 95%. Comparando-se os valores da estatística para cada mês do ano com os níveis críticos, verifica-se que a distribuição de Gumbel ajusta-se bem aos dados em todos os meses do ano (Tabela 3).Esse procedimento é semelhante ao feito por Bautista et al. (2004). Pelo teste de Ljung-Box, as séries mensais são independentes, pois a hipótese nula do teste foi aceita para a série de todos os meses, uma vez que a estatística do teste é menor do que o nível crítico tabelado da distribuição qui-quadrado com 1 grau de liberdade ( χ1;2 0,05 ).Resultados semelhantes foram encontrados por Rajabi e Modarres (2008) para série anual de velocidade de vento máxima da estação de Isfahan no Irã e concluíram que a distribuição Gumbel é mais adequada do que a distribuição GVE. Na Tabela 4 são apresentadas as estimativas dos níveis de retorno de velocidade máxima de vento para os períodos de retorno de 2 a100 anos para todos os meses no município de Piracicaba- SP. Escolhendo-se 50 anos como o tempo de retorno adequado de ocorrer uma determinada velocidade máxima de vento para o período mensal, uma interpretação prática das informações pode ser feita do seguinte modo: espera-se que, em um tempo médio de 50 anos, o valor da velocidade máxima de vento no mês de dezembro seja superior a 31,6 m/s (Tabela 4). 304 Rev. Bras. Biom., São Paulo, v.31, n.2, p.295-309, 2013 Tabela 3 - Resultado do teste de Kolmogorov-Smirnov(D), teste de Ljung-Box (Q) e os respectivos níveis críticos de cada teste ( Dn;0,05 e χ1;2 0,05 ) para as séries máximas mensais de velocidade do vento (m/s) Mês Janeiro Fevereiro Março Abril Maio Junho Julho Agosto Setembro Outubro Novembro Dezembro χ1;2 0,05 Q 2,272 0,001 2,550 0,090 0,006 0,581 0,156 4,039 0,203 1,305 0,047 0,651 3,841 3,841 3,841 3,841 3,841 3,841 3,841 3,841 3,841 3,841 3,841 3,841 Dn;0,05 0,992 0,969 0,969 0,969 0,969 0,967 0,969 0,969 0,969 0,969 0,977 0,969 D 0,106 0,106 0,082 0,137 0,130 0,060 0,106 0,106 0,093 0,116 0,100 0,075 Tabela 4 - Níveis de retorno de velocidades de ventos máximos (m/s) para os tempos de retorno de 2 a100 anos para as séries mensais de máximos no município de Piracicaba-SP Mês Jan Fev Mar Abr Mai Jun Jul Ago Set Out Nov Dez 2 anos 18,0 17,7 16,5 14,5 15,2 14,5 13,6 15,1 18,9 18,9 17,5 18,9 5 anos 21,6 21,3 20,6 17,5 19,1 18,5 16,2 18,5 23,2 22,9 20,9 23,0 Tempo de retorno 10 anos 30 anos 23,9 27,5 23,7 27,3 23,3 27,4 19,4 22,4 21,7 25,6 21,1 25,0 17,9 20,5 20,8 24,3 26,1 30,4 25,5 29,5 23,1 26,5 25,7 29,7 50 anos 29,2 29,0 29,3 23,8 27,4 26,8 21,7 25,8 32,4 31,3 28,0 31,6 100 anos 31,4 31,2 31,8 25,6 29,8 29,2 23,3 28,0 35,1 33,8 30,1 34,1 Pode-se notar ainda que as estimativas das velocidades máximas de vento diário aumentam à medida que se aumenta o tempo de retorno (Tabela 4). No período de setembro a fevereiro, registram-se rajadas com velocidades acima de 17,2m/s, classificadas como ventos muito fortes, ou ventanias, segundo a escala de medida de intensidade dos ventos proposta por Beaufort (NATIONAL WEATHER SERVICE, 2002) (Tabela 4).Essa tabela mostra, ainda, que as estimativas para o nível de retorno de velocidade do vento são maiores nos meses referidos, em comparação com o Rev. Bras. Biom., São Paulo, v.31, n.2, p.295-309, 2013 305 resto de meses do ano. Ventos com intensidade como mencionado têm grande importância, já que nessas condições os barcos devem permanecer nos portos. Comparando-se as estimativas dos níveis de retorno do modelo ajustado via TVE (para tempo de retorno de 2 anos) e Séries Temporais, observa-se que o modelo de Séries Temporais apresentou menores MAPE e EQMP (Tabela 5). Como esses dois critérios são melhores para o modelo obtido via Séries Temporais, este seria o mais adequado para estimar rajadas de vento em Piracicaba – SP. Tabela 5 - Estimativas das velocidades máximas de vento (m/s) em séries mensais de Piracicaba – SP para o tempo de retorno de 2 anos via distribuição Gumbel e modelo ajustado via Séries Temporais e respectivos erro quadrático médio de previsão (EQMP) e erro percentual médio absoluto (MAPE) Ano Mês Janeiro Fevereiro Março Abril Maio Junho Julho Agosto Setembro Outubro Novembro Dezembro EQMP MAPE (%) 2012 Máximo Gumbel 19,3 18,0 20,7 17,7 16,8 16,5 13,4 14,5 13,1 15,2 16,7 14,5 11,6 13,6 12,4 15,1 21,6 18,9 18,0 18,9 20,5 17,5 10,5 18,9 Gumbel 67,99 23,94 ST 18,4 18,1 16,3 15,1 15,6 14,8 14,2 15,5 19,0 19,1 17,7 19,0 Máximo 20,9 32,3 19,4 11,5 12,4 15,2 35,7 14,8 18,2 2013 Gumbel 18,0 17,7 16,5 14,5 15,2 14,5 13,6 15,1 18,9 ST 18,2 17,9 16,2 14,9 15,5 14,7 14,1 15,4 18,9 ST 39,94 20,09 As comparações entre os dois modelos devem ser feitas com certa cautela. Essencialmente, modelos de séries temporais são utilizados para se fazer previsões, uma vez que os modelos dessa classe atribuem a cada observação da série, um componente sazonal e um de tendência, característica de séries não estacionárias, seguido de um erro de previsão. No caso das séries de valores extremos utilizando-se a TVE, atribui-se uma distribuição de probabilidade teórica às observações, que devem ser independentes, e uma vez conhecida essa distribuição, pode-se estimar quantidades importantes como o nível de retorno. Nesse caso, como não é feita uma decomposição de cada observação em quantidades a serem ajustadas e sim apenas o ajuste de uma distribuição de probabilidade às observações, com o intuito de melhor descrever a frequência de ocorrência de ventos máximos, não estamos essencialmente fazendo previsões, e sim determinando uma chance de ocorrência dado um tempo, no caso de níveis de retorno. Assim, as previsões obtidas via séries temporais representam valores médios e os níveis de retorno estimados via TVE representam a chance de ocorrência de um nível 306 Rev. Bras. Biom., São Paulo, v.31, n.2, p.295-309, 2013 modelo TVE (5 anos) modelo TVE (10 anos) modelo TVE (30 anos) modelo TVE (50 anos) modelo TVE (100 anos) 20 30 40 Máximos (teste) modelo ST modelo TVE (2 anos) 10 Velocidade do vento (m/s) 50 estimado de velocidade máxima do vento em um tempo médio de anos. Ou seja, um valor estimado para o mês de setembro de 2013 pode ser colocado da seguinte forma para os dois modelos: a previsão de velocidade máxima de vento pelo modelo ajustado via séries temporais é, em média, de 18,9 m/s e via TVE espera-se que, em um tempo médio de 2 anos, o valor da velocidade máxima de vento no mês de setembro seja superior a 18,9 m/s (Tabela 5). Logo, esse evento via TVE poderia ocorrer no mês de setembro de 2012 ou em setembro de 2013 e os valores observados da série de teste mostram que o evento ocorreu em setembro de 2012 (21,6 m/s) e não em setembro de 2013 (18,2 m/s), mas que também poderia ocorrer nos dois anos ou em nenhum deles. Em geral, se o objetivo da pesquisa é fazer previsões para um período relativamente pequeno, o uso da metodologia de séries temporais é mais adequado e se o objetivo é obter informações para um período de tempo muito longo, o uso da TVE seria mais adequado. A figura 7 ilustra os níveis de retorno estimados em diversos tempos de retorno e as previsões via ST para 21 meses, que foram apresentados na Tabela 5. jan mar mai jul set nov jan mar mai jul set Mês 2012 2013 FIGURA 7 - Níveis de retornos estimados via distribuição Gumbel (TVE) para os tempos de retorno de 2a100 anos e o modelo ajustado via Séries Temporais SARIMA(1,0,1)(1,1,1)12 com intervenção. Conclusões A distribuição Gumbel se ajustou aos dados mensais de velocidade máxima do vento do município de Piracicaba – SP. O mesmo pode-se afirmar do modelo ajustado via séries temporais, cujo modelo é o SARIMA(1,0,1)(1,1,1)12 com intervenção do tipo abrupta e temporária na observação 315. Ambos os modelos mostraram-se adequados para se obter informações desta variável, dependendo do interesse da pesquisa. O modelo SARIMA(1,0,1)(1,1,1)12apresentou melhores valores de EQMP e MAPE, sendo este modelo mais adequado para previsões de curto prazo. A distribuição Gumbel é mais adequada quando se objetivam extrapolações em longo prazo. As maiores estimativas de velocidades máximas foram observadas nos meses de setembro a fevereiro, condizendo com a realidade,sendo essa informação de suma importância no planejamento urbano e agrícola da cidade de Piracicaba - SP. Rev. Bras. Biom., São Paulo, v.31, n.2, p.295-309, 2013 307 Agradecimentos Os autores agradecem à CAPES e CNPq pelo apoio financeiro. LISKA, G. R.; BORTOLINI, J.; SÁFADI, T.; BEIJO, L. A. Maximum wind speeds estimates in Piracicaba-SP through time series and extreme value theory. Rev. Bras. Biom., São Paulo, v.31, n.2, p. 295-309, 2013. ABSTRACT: In this work we aim to estimate the extreme levels of wind speeds from Piracicaba, São Paulo, Brazil, using extreme value theory (Gumbel distribution) and time series (TS). The data considered in this paper refer to maximum wind speed by daily from Piracicaba of the period from January 1980 to September 2013. To measure the errors from estimates of maximum wind speed in both methods, the observations were divided into training set, constituted of 31 years, and test, established by the last two years and calculated the mean square error of prediction and the mean absolute percentage error. Both methods were satisfactory, and the TS model more appropriate was SARIMA(1,0,1)(1,1,1)12 with intervention. The highest frequency of wind gusts were observed between the months of September and February by the two methods, being this information extremely important at the urban planning and agricultural of the municipality of Piracicaba. KEY-WORDS: Maximum wind speed, Gumbel distribution, Season al autoregressive models, Return time, Urban planning. Referências BAUTISTA, E. A.; ZOCCHI, S. S.; ANGELOCCI, L. R. A Distribuição Generalizada de Valores Extremos aplicada ao ajuste dos dados de velocidade máxima do vento em Piracicaba, São Paulo, Brasil. Rev. Mat. Estat., São Paulo, v.22, n.1, p.95-111, 2004. BEIJO, L. A.; MUNIZ, J. A.; CASTRO NETO, P. Estudo do Tempo de Retorno das Precipitações Máximas em Lavras (MG) pela Distribuição de Valores Extremos do Tipo I. Ciência e Agrotecnologia, Lavras, v.29, n.3, p.657-667, maio/jun.2005. BEIJO, L. A.; AVELAR, F. G. Distribuição Generalizada de Valores Extremos no estudo de dados climáticos: uma breve revisão e aplicação. Revista da Estatística UFOP, v. 1, X Semana da Matemática e II Semana da Estatística, 2010. BOX, G. E. P.; COX, D. R. An analysis of transformations. Journal of the Royal Statistical Society. Series B, v.26, p.211-243, 1964. BOX, G. E. P.; JENKINS, G. M. Time series analysis: forecasting and control. San Francisco: Holden-Day, 1970, 575p. BOX, G. E. P.; JENKINS, G. M.; REINSEL, G. C. Time series analysis: forecasting and control.4. ed. Hoboken: John Wiley & Sons, 2008. 784p. CAMPOS, H. Estatística experimental não paramétrica. 4.ed. Piracicaba: ESALQ, 1983. 388p. COX, D. R.; STUART, A. Some quick tests for trend in location and dispersion. Biometrika, v.42, p.80-95, 1955. CRUTCHER, H.L. A note on the possible misuse of the Kolmogorov-Smirnov test. J. Appl. Metereol., Boston, v.14, p.1600-3, 1975. 308 Rev. Bras. Biom., São Paulo, v.31, n.2, p.295-309, 2013 CRYER, J. D.; CHAN, K. S. Time series analysis with applications in R. 2.ed. New York: Springer, 2008. 491p. FISHER, R. A. Tests of significance in harmonic analysis. Proceedings of the Royal Society. Series A, v.125, p.54-59, 1929. JENKINSON, A. F. The frequency distribution of the annual maximum (or minimum) values of meteorological elements. Q. J. Meteorol. Soc., Brackneel, v.81, p.158-71, 1955. LJUNG, G. M.; BOX, G. E. P. On a measure of lack of fit in time series models. Biometrika, v.65, p 297–303, 1978. MORETTIN, P. A.; TOLOI, C. M. C. Análise de series temporais. 2. ed. São Paulo: Edgard Blücher, 2006. 538p. NATIONAL WEATHER SERVICE. The Beaufort wind force scale. Disponível em: <http://www.crh.noaa.gov/lot/webpage/beaufort>. Acesso em: 20 fev. 2002. R DEVELOPMENT CORE TEAM (2013) R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. ISBN 3-900051-070, URL http://www.R-project.org/. RAJABI, M. R.; MODARRES, R. Extreme value frequency analysis of wind data from Isfahan, Iran. J. Wind Engin. Ind. Aerod., n.96, p.78–82, 2008. ROWINSKI, P. M.; STRUPCZEWSKI, W. G.; SINGH, V.P. A note on the applicability of log-Gumbel and log-logistic probability distributions in hydrological analyses: I. Know pdf. Hydrological Sciencie Journal, Walingford, Inglaterra, v.47, n.1, p.107-122, 2002. SANSIGOLO, C. A. Distribuições de Extremos de precipitação diária, temperatura máxima e mínima e velocidade do vento em Piracicaba, SP (1917-2006). Revista Brasileira de Meteorologia, v.23, n.3, p.341-346, 2008. VIEIRA, S. R.; LOMBARDI NETO, F.; BURROWS, I. T. Mapeamento da chuva diária máxima provável para o Estado de São Paulo. Revista Brasileira de Ciência do Solo, Campinas, v.15, p.93-98, 1991. VILLA NOVA, N. A. Dados meteorológicos do município de Piracicaba. Piracicaba: ESALQ/Departamento de Ciências Exatas, 2003, 2p. WHITTLE, P. The simultaneous estimation of a time series harmonic components and covariance structure. Trabajos de Estadítica, v.3, p.43-57, 1952. Recebido em 08.06.2013 Aprovado após revisão em 15.10.2013 Rev. Bras. Biom., São Paulo, v.31, n.2, p.295-309, 2013 309