Teoria de valores extremos aplicado aos dados de
temperatura máxima em Campina Grande
Sônia Eliane Gonçalves dos Santos 1
Samara Rilda de Sousa Bezerra 1
Lourivaldo Mota Lima 2
Maria Marle Bandeira3
Ricardo Alves de Olinda 1
Resumo: Neste trabalho teve-se por objetivo a caracterização dos dados de temperatura máxima
do municı́pio de Campina Grande, estado da Paraı́ba, via Teoria de Valores Extremos (TVE),
posteriormente, verificou-se o ajuste da distribuição Generalizada de Valores Extremos (GVE)
a estes dados, na sequência, observou-se a adequabilidade do ajuste dos modelos aos dados
de temperatura máxima por meio do teste de Kolmogorov-Sminorv e gráficos quantil-quantil.
Diante do exposto, pode-se concluir que a distribuição GVE é de suma importância para dados
climáticos extremos, podendo-se modelar de forma adequada os dados de temperatura máxima
para o municı́pio de Campina Grande.
Palavras-chave: Teoria de Valores Extremos, Temperatura Máxima, Máxima Verossimilhança.
1
Introdução
Dentre os muitos aspectos climáticos apresentados pela Região Nordeste, o que mais se
destaca é a seca, causada pela escassez de chuvas, o qual provoca problemas econômicos e
sociais. Segundo o Instituto Nacional de Pesquisas Espaciais - INPE, existe alguns lugares do
semiárido nordestino que a temperatura aumentou cerca de 3o C nos últimos 40 anos, e que a
média da temperatura do mundo neste mesmo perı́odo foi de 0,4o C. Segundo Beltrão (2005)
o Polı́gono das Secas apresenta um regime pluviométrico marcado por extrema irregularidade
de chuvas, no tempo e no espaço. Neste cenário, a escassez de água constitui um forte entrave
ao desenvolvimento socioeconômico e, até mesmo, à “subsistência”da população. Uma das
perguntas mais importantes relacionadas aos eventos extremos é se as suas ocorrências estão
aumentando ou diminuindo com o tempo (FARIA et al., 2010). Uma maneira de modelar estes
eventos é através da Teoria de Valores Extremos (TVE). Neste trabalho teve-se por objetivo a
caracterização dos dados de temperatura máxima do municı́pio de Campina Grande, estado da
Paraı́ba, via TVE, posteriormente, verificou-se o ajuste da distribuição Generalizada de Valores
Extremos (GVE) a estes dados.
1 Departamento
de Estatı́stica, CCT - UEPB, e-mail: [email protected]
de Fı́sica, CCT - UEPB.
3 Agência Executiva de Gestão das Águas, AESA - UFCG.
2 Departamento
2
Metodologia
Conforme Olinda (2012), a TVE garante a existência de uma função limite FY (y) de Yn
quando n −→∞. A distribuição GEV garante os limites do máximo para as distribuições Gumbel
(Tipo I), Fréchet (Tipo II) e Weibull (tipo III). Logo, a famı́lia locação-escala e forma pode ser
escrita partir de
( )
ξ (y − µ) 1/ξ
Z (y; µ, σ, ξ) = exp − 1 −
,
σ
(1)
em que 1 − ξ (y − µ) /σ > 0, σ > 0 e µ e σ arbitrário. O caso ξ = 0 é interpretado ξ → 0, que é
(y − µ)
Z (y; µ, σ, 0) = exp − exp −
.
σ
(2)
Segundo ZAR(1999), a primeira etapa da análise consiste em verificar a hipótese de independência dos dados. Efetuando-se o teste, calcular-se a mediana da amostra observada, isto é
y1 , ..., yn , obtém-se uma sequência dicotômica dessa mesma amostra A(y1 ), ..., A(yn ) , n1 , n2 , r,
Ê(R) e V âr(R) e por último, calcula-se o valor-p por meio de
P
!
|r − E (R)| − 0, 5
p
≥ qr ,
Var (R)
(3)
em que, qr é o quantil de ordem α2 da normal padrão e, α é o nı́vel de significância adotado para
o teste. Os máximos do logaritmo da função de máxima verossimilhanças da distribuição GEV
ˆ T e θ̂Gumbel = (µ̂, σ̂)T são os vetores de estimativas de
e de Gumbel em que, θ̂GEV = (µ̂, σ̂, ξ)
máxima de verossimilhança. A estatı́stica de razão de verossimilhança (TLR ) é definido por
TLR = −2 l θ̂G − l θ̂GEV = 2 l θ̂GEV − l θ̂G ,
(4)
que tem distribuição assintótica χ2 com 1 grau de liberdade. A função de distribuição acumulada
assumida para os dados é definida por F(y(i) ) e a função distribuição acumulada empı́rica de Y
é descrita a seguir,
F̂ y(i) =
i
, i = 1, 2, ..., n.
n+1
(5)
O gráfico pp-plot é constituı́do com pontos dados pela coordenadas,
F̂ y(i) , F y(i) θ=θ̂ , i = 1, 2, ..., n,
0
(6)
em que θ̂ são as estimativas de θ̂ = (µ, σ, ξ) , F(y(i) ) é a função de distribuição acumulada da
GEV com as estimativas obtidas e F̂(y(i) ) é a distribuição empı́rica definida em (5).
2
3
Resultados e discussão
Os dados de temperatura máxima foram obtidos no perı́odo de 1970 à 2010, fornecidos pela
EMBRAPA algodão. Com objetivo de verificar a pressuposição de independência dos dados,
utilizou-se o teste de chorrilho, ao nı́vel de 0,05 de significância. A Tabela 1 resume estas
informações, em que, o valor-p maior que o nı́vel de significância (p > 0,05) nos leva a concluir
a não rejeição da hipótese de independência. De acordo com Bautista (2002), o cumprimento
dessa pressuposição garante a obtenção de inferências estatı́sticas satisfatórias. Em seguida,
calcula-se as estimativas dos estimadores pontuais dos parâmetros da distribuição GEV, obtidos
por meio do método de máxima verossimilhança para os meses em estudo.
Tabela 1: Teste de chorrilho sob o pressuposto de independência aplicado aos dados de temperatura máxima no municı́pio de Campina Grande
Meses
Janeiro
Fevereiro
Março
Abril
Maio
Junho
Julho
Agosto
Setembro
Outubro
Novembro
Dezembro
Valor-P
0,0675
0,0540
0,4573
0,8550
0,4573
0,4411
0,7001
0,8550
0,7075
0,0523
0,0540
0,0532
Analisando-se o intervalo de confiança apresentado na Tabela 2, para o parâmetro de forma
ξ, pode-se observar que o valor zero está contido na maioria dos meses em estudo. Dessa forma
tem-se um bom ajuste para a distribuição Gumbel. Este resultado é corroborado pela estatı́stica
∗ , comparando-se o valor que se encontra na Tabela
da razão de verossimilhança modificada TLR
2, com o valor tabelado de (χ21;0,05 = 3, 84).
Tabela 2: Intervalo de 95% de confiança para o parâmetro de forma (ξ) e valores da estatı́stica
∗ .
de razão de verossimilhança modificado TLR
Mês
Janeiro
Fevereiro
Março
Abril
Maio
Junho
Julho
Agosto
Setembro
Outubro
Novembro
Dezembro
Superior
-0,4854
-0,7732
-0,7011
-0,4837
-0,4299
-0,4299
-0,4570
-0,5073
-0,6955
-0,4393
-0,6563
-0,6563
Limites de 95% de confiança para ξˆ
Inferior
0,0761
-0,2594
0,1225
0,1310
0,2848
0,2848
0,0384
-0,0332
-0,1675
0,0128
-0,0373
-0,0373
∗
TLR
1,8137
10,4944
2,4073
1,2288
0,1791
0,7702
2,1389
3,7949
6,9145
2,7027
7,5695
3,9853
Dando sequência as análises, pode-se observar por meio da Figura 1 os gráficos de quantil3
Figura 1: Gráficos de quantil-quantil para diagnóstico da distribuição Gumbel aos dados de
precipitação máxima mensal
quantil para o diagnóstico a distribuição Gumbel, associado aos meses de janeiro, março, abril,
maio, junho, julho, agosto e outubro. O gráfico quantil-quantil compara o ajuste da distribuição
teórica com a verdadeira distribuição dos dados em estudo. De acordo com Sansigolo(2006),
tem-se uma maior precisão no ajuste da distribuição GEV quando se utiliza uma série histórica
igual ou superior a 30 anos. Apresenta-se na Tabela 3 as probabilidades de ocorrência do
perı́odo de retorno das temperaturas máximas, a partir dos limiares especificados. Consequentemente, estes ajustes podem ser utilizados com bastante confiabilidade para extrapolação em
perı́odos mais longos, desde que não ocorram futuras variações climáticas significativas na
região.
Tabela 3: Probabilidade de ocorrência das temperaturas máximas para daqui há 30, 31 e 32 anos
Mês
Janeiro
Fevereiro
Março
Abril
Maio
Junho
Julho
Agosto
Setembro
Outubro
Novembro
Dezembro
> 30
0,000004
0,02759
0,07727
0,14280
0,66868
0,91471
0,969110
0,88684
0,58503
0,07902
0,01631
0,01308
4
> 31
0,04221
0,11646
0,30438
0,55387
0,85230
0,96479
0,98983
0,95650
0,88861
0,44709
0,18045
0,12477
> 32
0,44244
0,34346
0,57545
0,83581
0,93850
0,98569
0,99667
0,98366
0,99967
0,77467
0,66200
0,46051
4
Conclusão
A distribuição generalizada de valores extremos com parâmetro ξ = 0 e ξ < 0, que corresponde á distribuição de valores extremos tipo I (Gumbel ), Tipo III (Weibull) é adequada
para estudar o comportamento da temperatura máxima nos meses que foram analisados, no
municı́pio de Campina Grande, estado da Paraı́ba.
Estas distribuições apresentaram bons ajustes aos dados, fato comprovado por meio do
gráfico pp-plot. A partir dessas distribuições pode-se determinar o perı́odo de retorno, a partir
de um determinado limiar, de temperatura máxima.
Referências
[1] FISHER, R. A. and TIPPETT, L. H. C. (1928). Limiting forms of the frequency distribution of the largest or smallest member of a sample, Procs. Cambridge Philos. SOC. 24,
180-190.
[2] FREIRE, F. R. e BEIJO, L. A. Análise dos métodos de estimação para os parâmetros da
distribuição Gumbel na precipitação de chuvas máximas para a cidade de Piracicaba-SP
outubro (2010).
[3] MEDEIROS, E. S. Distribuição generalizada de valores estremos aplicada a dados de
precipitação máxima na região de Moreilândia- PE dezembro (2011).
[4] OLINDA, R. A. Modelagem estatı́stica de extremos espaciaisncom base em processos
max-stable aplicados a dados metereológicos no estado do Paraná(2012).
[5] SANSIGOLO, C. A. A distribuição de extremos e precipitação diária, temperatura
máxima e mı́nima e velocidade do vento em Piracicaba, SP (1917 - 2006). Rev. Bras.
Met., v.23,n.3, p.341-346, 2008.
[6] ZAR , J. H. Biostatistical analysis. 4.ed. New Jersey: Prentice Hall, 1999. 911 p.
5
Download

Teoria de valores extremos aplicado aos dados de