Teoria de valores extremos aplicado aos dados de temperatura máxima em Campina Grande Sônia Eliane Gonçalves dos Santos 1 Samara Rilda de Sousa Bezerra 1 Lourivaldo Mota Lima 2 Maria Marle Bandeira3 Ricardo Alves de Olinda 1 Resumo: Neste trabalho teve-se por objetivo a caracterização dos dados de temperatura máxima do municı́pio de Campina Grande, estado da Paraı́ba, via Teoria de Valores Extremos (TVE), posteriormente, verificou-se o ajuste da distribuição Generalizada de Valores Extremos (GVE) a estes dados, na sequência, observou-se a adequabilidade do ajuste dos modelos aos dados de temperatura máxima por meio do teste de Kolmogorov-Sminorv e gráficos quantil-quantil. Diante do exposto, pode-se concluir que a distribuição GVE é de suma importância para dados climáticos extremos, podendo-se modelar de forma adequada os dados de temperatura máxima para o municı́pio de Campina Grande. Palavras-chave: Teoria de Valores Extremos, Temperatura Máxima, Máxima Verossimilhança. 1 Introdução Dentre os muitos aspectos climáticos apresentados pela Região Nordeste, o que mais se destaca é a seca, causada pela escassez de chuvas, o qual provoca problemas econômicos e sociais. Segundo o Instituto Nacional de Pesquisas Espaciais - INPE, existe alguns lugares do semiárido nordestino que a temperatura aumentou cerca de 3o C nos últimos 40 anos, e que a média da temperatura do mundo neste mesmo perı́odo foi de 0,4o C. Segundo Beltrão (2005) o Polı́gono das Secas apresenta um regime pluviométrico marcado por extrema irregularidade de chuvas, no tempo e no espaço. Neste cenário, a escassez de água constitui um forte entrave ao desenvolvimento socioeconômico e, até mesmo, à “subsistência”da população. Uma das perguntas mais importantes relacionadas aos eventos extremos é se as suas ocorrências estão aumentando ou diminuindo com o tempo (FARIA et al., 2010). Uma maneira de modelar estes eventos é através da Teoria de Valores Extremos (TVE). Neste trabalho teve-se por objetivo a caracterização dos dados de temperatura máxima do municı́pio de Campina Grande, estado da Paraı́ba, via TVE, posteriormente, verificou-se o ajuste da distribuição Generalizada de Valores Extremos (GVE) a estes dados. 1 Departamento de Estatı́stica, CCT - UEPB, e-mail: [email protected] de Fı́sica, CCT - UEPB. 3 Agência Executiva de Gestão das Águas, AESA - UFCG. 2 Departamento 2 Metodologia Conforme Olinda (2012), a TVE garante a existência de uma função limite FY (y) de Yn quando n −→∞. A distribuição GEV garante os limites do máximo para as distribuições Gumbel (Tipo I), Fréchet (Tipo II) e Weibull (tipo III). Logo, a famı́lia locação-escala e forma pode ser escrita partir de ( ) ξ (y − µ) 1/ξ Z (y; µ, σ, ξ) = exp − 1 − , σ (1) em que 1 − ξ (y − µ) /σ > 0, σ > 0 e µ e σ arbitrário. O caso ξ = 0 é interpretado ξ → 0, que é (y − µ) Z (y; µ, σ, 0) = exp − exp − . σ (2) Segundo ZAR(1999), a primeira etapa da análise consiste em verificar a hipótese de independência dos dados. Efetuando-se o teste, calcular-se a mediana da amostra observada, isto é y1 , ..., yn , obtém-se uma sequência dicotômica dessa mesma amostra A(y1 ), ..., A(yn ) , n1 , n2 , r, Ê(R) e V âr(R) e por último, calcula-se o valor-p por meio de P ! |r − E (R)| − 0, 5 p ≥ qr , Var (R) (3) em que, qr é o quantil de ordem α2 da normal padrão e, α é o nı́vel de significância adotado para o teste. Os máximos do logaritmo da função de máxima verossimilhanças da distribuição GEV ˆ T e θ̂Gumbel = (µ̂, σ̂)T são os vetores de estimativas de e de Gumbel em que, θ̂GEV = (µ̂, σ̂, ξ) máxima de verossimilhança. A estatı́stica de razão de verossimilhança (TLR ) é definido por TLR = −2 l θ̂G − l θ̂GEV = 2 l θ̂GEV − l θ̂G , (4) que tem distribuição assintótica χ2 com 1 grau de liberdade. A função de distribuição acumulada assumida para os dados é definida por F(y(i) ) e a função distribuição acumulada empı́rica de Y é descrita a seguir, F̂ y(i) = i , i = 1, 2, ..., n. n+1 (5) O gráfico pp-plot é constituı́do com pontos dados pela coordenadas, F̂ y(i) , F y(i) θ=θ̂ , i = 1, 2, ..., n, 0 (6) em que θ̂ são as estimativas de θ̂ = (µ, σ, ξ) , F(y(i) ) é a função de distribuição acumulada da GEV com as estimativas obtidas e F̂(y(i) ) é a distribuição empı́rica definida em (5). 2 3 Resultados e discussão Os dados de temperatura máxima foram obtidos no perı́odo de 1970 à 2010, fornecidos pela EMBRAPA algodão. Com objetivo de verificar a pressuposição de independência dos dados, utilizou-se o teste de chorrilho, ao nı́vel de 0,05 de significância. A Tabela 1 resume estas informações, em que, o valor-p maior que o nı́vel de significância (p > 0,05) nos leva a concluir a não rejeição da hipótese de independência. De acordo com Bautista (2002), o cumprimento dessa pressuposição garante a obtenção de inferências estatı́sticas satisfatórias. Em seguida, calcula-se as estimativas dos estimadores pontuais dos parâmetros da distribuição GEV, obtidos por meio do método de máxima verossimilhança para os meses em estudo. Tabela 1: Teste de chorrilho sob o pressuposto de independência aplicado aos dados de temperatura máxima no municı́pio de Campina Grande Meses Janeiro Fevereiro Março Abril Maio Junho Julho Agosto Setembro Outubro Novembro Dezembro Valor-P 0,0675 0,0540 0,4573 0,8550 0,4573 0,4411 0,7001 0,8550 0,7075 0,0523 0,0540 0,0532 Analisando-se o intervalo de confiança apresentado na Tabela 2, para o parâmetro de forma ξ, pode-se observar que o valor zero está contido na maioria dos meses em estudo. Dessa forma tem-se um bom ajuste para a distribuição Gumbel. Este resultado é corroborado pela estatı́stica ∗ , comparando-se o valor que se encontra na Tabela da razão de verossimilhança modificada TLR 2, com o valor tabelado de (χ21;0,05 = 3, 84). Tabela 2: Intervalo de 95% de confiança para o parâmetro de forma (ξ) e valores da estatı́stica ∗ . de razão de verossimilhança modificado TLR Mês Janeiro Fevereiro Março Abril Maio Junho Julho Agosto Setembro Outubro Novembro Dezembro Superior -0,4854 -0,7732 -0,7011 -0,4837 -0,4299 -0,4299 -0,4570 -0,5073 -0,6955 -0,4393 -0,6563 -0,6563 Limites de 95% de confiança para ξˆ Inferior 0,0761 -0,2594 0,1225 0,1310 0,2848 0,2848 0,0384 -0,0332 -0,1675 0,0128 -0,0373 -0,0373 ∗ TLR 1,8137 10,4944 2,4073 1,2288 0,1791 0,7702 2,1389 3,7949 6,9145 2,7027 7,5695 3,9853 Dando sequência as análises, pode-se observar por meio da Figura 1 os gráficos de quantil3 Figura 1: Gráficos de quantil-quantil para diagnóstico da distribuição Gumbel aos dados de precipitação máxima mensal quantil para o diagnóstico a distribuição Gumbel, associado aos meses de janeiro, março, abril, maio, junho, julho, agosto e outubro. O gráfico quantil-quantil compara o ajuste da distribuição teórica com a verdadeira distribuição dos dados em estudo. De acordo com Sansigolo(2006), tem-se uma maior precisão no ajuste da distribuição GEV quando se utiliza uma série histórica igual ou superior a 30 anos. Apresenta-se na Tabela 3 as probabilidades de ocorrência do perı́odo de retorno das temperaturas máximas, a partir dos limiares especificados. Consequentemente, estes ajustes podem ser utilizados com bastante confiabilidade para extrapolação em perı́odos mais longos, desde que não ocorram futuras variações climáticas significativas na região. Tabela 3: Probabilidade de ocorrência das temperaturas máximas para daqui há 30, 31 e 32 anos Mês Janeiro Fevereiro Março Abril Maio Junho Julho Agosto Setembro Outubro Novembro Dezembro > 30 0,000004 0,02759 0,07727 0,14280 0,66868 0,91471 0,969110 0,88684 0,58503 0,07902 0,01631 0,01308 4 > 31 0,04221 0,11646 0,30438 0,55387 0,85230 0,96479 0,98983 0,95650 0,88861 0,44709 0,18045 0,12477 > 32 0,44244 0,34346 0,57545 0,83581 0,93850 0,98569 0,99667 0,98366 0,99967 0,77467 0,66200 0,46051 4 Conclusão A distribuição generalizada de valores extremos com parâmetro ξ = 0 e ξ < 0, que corresponde á distribuição de valores extremos tipo I (Gumbel ), Tipo III (Weibull) é adequada para estudar o comportamento da temperatura máxima nos meses que foram analisados, no municı́pio de Campina Grande, estado da Paraı́ba. Estas distribuições apresentaram bons ajustes aos dados, fato comprovado por meio do gráfico pp-plot. A partir dessas distribuições pode-se determinar o perı́odo de retorno, a partir de um determinado limiar, de temperatura máxima. Referências [1] FISHER, R. A. and TIPPETT, L. H. C. (1928). Limiting forms of the frequency distribution of the largest or smallest member of a sample, Procs. Cambridge Philos. SOC. 24, 180-190. [2] FREIRE, F. R. e BEIJO, L. A. Análise dos métodos de estimação para os parâmetros da distribuição Gumbel na precipitação de chuvas máximas para a cidade de Piracicaba-SP outubro (2010). [3] MEDEIROS, E. S. Distribuição generalizada de valores estremos aplicada a dados de precipitação máxima na região de Moreilândia- PE dezembro (2011). [4] OLINDA, R. A. Modelagem estatı́stica de extremos espaciaisncom base em processos max-stable aplicados a dados metereológicos no estado do Paraná(2012). [5] SANSIGOLO, C. A. A distribuição de extremos e precipitação diária, temperatura máxima e mı́nima e velocidade do vento em Piracicaba, SP (1917 - 2006). Rev. Bras. Met., v.23,n.3, p.341-346, 2008. [6] ZAR , J. H. Biostatistical analysis. 4.ed. New Jersey: Prentice Hall, 1999. 911 p. 5