1
4 HIDROLOGIA ESTATÍSTICA: conceitos e aplicações
4.1 Conceitos básicos de Probabilidades
Um conjunto de dados hidrológicos necessita ser previamente analisado com base
em alguns indicadores estatísticos básicos para que se possa, efetivamente, desenvolver a
teoria das probabilidades às situações práticas desejadas. Primeiramente, este conjunto de
dados hidrológicos é conhecido, no âmbito da hidrologia, como série histórica e consiste,
basicamente, de uma amostra extraída de uma população.
Com base nesta amostra, podemos calcular alguns indicadores e medidas
estatísticas importantes, como média, desvio padrão (variância), assimetria, curtose e
distribuição de freqüência dos dados observados na amostra. Estas medidas caracterizam
apenas a amostra e nada dizem a respeito da população em si. A distribuição de
freqüências demonstra o comportamento da amostra no tocante à sua simetria e é nosso
objetivo, na hidrologia estatística, modelar esta distribuição de freqüência com base num
modelo matemático, constituído de parâmetros, conhecido como Distribuição de
Probabilidades.
Primeiramente, é importante que caracterizemos algumas situações relativas à
amostra, contextualizada em termos da hidrologia. Podemos modelar uma distribuição de
freqüência no contexto de dados discretos, como por exemplo, o lançamento de uma moeda
ou no sorteio de números de alguma forma de loteria. No caso da hidrologia, pode-se,
eventualmente, considerar dias chuvosos como variáveis hidrológicas discretas, mas na
maioria das vezes, a hidrologia considera suas análises dentro do contexto de variáveis
contínuas.
Em se tratando de variáveis discretas, podemos responder à pergunta: qual a
probabilidade de um número qualquer ser sorteado (evento x) dentro de um espaço
amostral finito S qualquer, constituído por N números, sendo este um evento aleatório. A
resposta pode ser escrita da seguinte forma:
P(x ) =
mx
N
(1)
Observe que todos os números que constituem o espaço amostral S possuem a
mesma possibilidade de ser sorteados numa situação não viciada.
É importante, no entanto, diferenciarmos probabilidade de freqüência. Esta última
está associada ao número de vezes que um determinado evento ocorreu, enquanto que
probabilidade refere-se às possíveis situações de ocorrência, que no caso da equação 1, é
considerada como de igual de probabilidade. Assim, se um sorteio de cara e coroa é
realizado 10 vezes e “cara” for sorteado 7 vezes, sua freqüência será 0,7. Por lado, como
2
temos apenas duas possibilidades e estas são iguais (numa situação não viciada), o número
de vezes esperado para o sorteio de “cara” é 5 vezes, portanto, a probabilidade seria 0,5.
No entanto, na hidrologia, em grande parte das vezes, nos interessa, em termos
práticos, avaliar qual a possibilidade de um determinado evento ser maior ou igual (ou
menor ou igual) a um dado valor xi e isto remete ao conceito de uma variável contínua, como
por exemplo, vazões de um rio.
Existem diferenças importantes nos modelos probabilísticos para ambas as
situações. No caso de variáveis discretas busca-se estimar qual a P(x) ser igual a um valor;
no caso de variáveis contínuas, qual a P(x > xi) ou P(X<xi). Para variáveis discretas, o
modelo probabilístico pode ser ajustado com apenas um parâmetro, normalmente vinculado
à média, como no caso da Distribuição de Poisson. Em se tratando de variáveis contínuas, o
modelo probabilístico necessita de 2 ou 3 parâmetros para seu ajuste, e estes estão
vinculados às medidas estatísticas de média, variância e assimetria, ou seja, aos momentos
estatísticos de 1ª, 2ª e 3ª ordens.
4.1.1 Probabilidade Condicional
A probabilidade de ocorrência de um determinado evento A pode ser influenciado
pela ocorrência de outro evento B, uma vez que haverá redução do espaço amostral S para
a realização do evento A quando B ocorre. Neste caso, tem-se a seguinte definição:
P(A | B ) =
P(A ∩ B )
P(B )
(2)
Nesta equação, P(A | B ) significa a probabilidade do evento A, associada (ou
condicionada) ao evento B, P(A ∩ B ) significa a intersecção dos eventos A e B no plano
amostral S e P(B) é a probabilidade de ocorrência do evento B. Graficamente, teríamos:
S
B
A
Deste esquema, depreende-se também que:
P(A ∩ B )
3
P(A ∪ B ) = P(A ) + P(B ) − P(A ∩ B )
(3)
Exemplo de Aplicação 4.1
a) Sabendo-se que a probabilidade de ocorrer em janeiro uma precipitação total
superior 200 mm é de 0,098, recalcule esta probabilidade sabendo-se que já
ocorreram 130 mm no respectivo mês e que a probabilidade de se superar este
último valor é de 0,234.
Neste exemplo, o evento A consiste de P(A) = 0,098; o evento B é P(B) = 0,234.
Queremos a probabilidade do evento A mediante a condição de que já houve 130 mm no
mês de janeiro, ou seja, P(A|B):
P(A | B ) =
P(A ∩ B ) P(B ) − P(A )
0,098
=
= 1−
= 0,581
P(B )
P(B )
0,234
b) Considere 2 eventos probabilísticos, A e B, ambos associados à possibilidade da
vazão mínima de um curso d’água não atender à demanda de um projeto, que é 4
m3/s. O evento A implica que a probabilidade da vazão do córrego A ser inferior a 2
m3/s é de 0,0547 e do córrego B é de 0,0891. Qual a probabilidade do projeto não
receber a vazão mínima projetada, sabendo-se que o evento A está condicionado a
B [(P|B) = 0,65]?
P(A) = 0,0547; P(B) = 0,0891. A possibilidade do projeto não ser atendido implica em
P(A ∪ B ) (equação 3).
Como P(A|B) é 0,65, da equação 2, tem-se:
P(A ∩ B ) = P(A | B ) × P(B ) = 0,65 × 0,0891 = 0,0579
P(A ∪ B ) = P(A ) + P(B ) − P(A ∩ B ) = 0,0547 + 0,0891 − 0,0579 = 0,0859
4
4.2 Freqüência de Dados Hidrológicos
Os fenômenos hidrológicos podem ser caracterizados como aleatórios, podendo-se
associar aos mesmos, um caráter probabilístico envolvendo estes fenômenos. Em termos
de seu comportamento há de se ressaltar que, sempre haverá possibilidade de um dado
evento hidrológico ser superior ou inferior a um valor histórico já registrado. Isto é essencial
para o entendimento das variáveis hidrológicas, uma vez que esta é uma das principais
funções da hidrologia, que consiste em observar os eventos e modelar as freqüências de
ocorrência, possibilitando que sejam feitas previsões assumindo determinado risco.
As variáveis hidrológicas, na maioria das vezes, são consideradas contínuas, ou
seja, variáveis que em termos físicos, existem continuamente no tempo. Em termos
estatísticos, são aplicadas distribuições que modelam este caráter, trabalhando com
cálculos de áreas sob a curva de distribuição de probabilidades abaixo ou acima de
determinado valor de interesse prático ou entre valores. Percebe-se que neste caso, não se
pergunta qual a probabilidade de um determinado evento ser IGUAL a um valor específico,
como no sorteio de um número, e sim, deste evento ser maior ou menor que este valor, ou
estar entre 2 valores específicos. Este entendimento também é fundamental para aplicação
das distribuições de probabilidades aos fenômenos hidrológicos.
O primeiro passo para se modelar a freqüência de dados hidrológicos é fazer um
estudo de sua ocorrência, no que se estabelece um percentual com que uma variável
hidrológica pode ser maior que um dado valor. Isto é chamado freqüência de excedência e é
obtida diretamente de uma série histórica de dados. Contudo, pode-se trabalhar com a
freqüência de não excedência, ou seja, aquela em que se estuda o percentual de uma
variável ser menor ou igual a um dado valor. A escolha depende dos objetivos, os quais
serão discutidos na seqüência. Deve-se ressaltar que uma é o complemento da outra, ou
seja:
f exc = 1 − fnão − exc
(4)
Existem algumas definições de freqüência considerando variáveis contínuas,
destacando-se:
5
Tabela 4.1 Equações para estimativa da freqüência observada e suas aplicações.
Fórmula
fobs =
i
N +1
Autor
Weibull
Observações
Aplicação
ao
estudo
de
probabilidades
não
enviesadas (sem tendência) para qualquer modelo de
Distribuição.
fobs =
i − 0,44
N + 0,12
Gringorten
fobs =
i − 0,375
N + 0,25
Blom
fobs =
i − 0,50
N
Hazen
fobs =
i − 0,40
N + 0,20
Cunnane
Aplicada para estudos associados às Distribuições
Gumbel e GEV.
Aplicada para estudos associados às Distribuições
Normal e Log-normal.
Aplicada para estudos associados à Distribuição
Gama 3 parâmetros.
Aplicação
ao
estudo
de
probabilidades
não
enviesadas (sem tendência) para qualquer modelo de
Distribuição.
O termo i, no numerador, refere-se à posição que o dado ocupa dentro da série
histórica, a qual deve ser ordena em ordem crescente para freqüências de não excedência e
ordem decrescente para freqüência de excedência. Por outro lado, N, no denominador,
refere-se ao tamanho da série histórica. Ressalta-se que nos exemplos de aplicação aqui
desenvolvidos, será considerada apenas a equação proposta por Weibull.
Com base no estudo das freqüências de ocorrência, ajusta-se uma distribuição de
probabilidades e aquela que obtiver o melhor ajuste (menores diferenças entre as
freqüências observadas e estimadas) deve ser a escolhida. Note que o tamanho da série
histórica tem grande importância haja vista que ela representará a possibilidade de
ocorrência, ou seja, quanto maior esta, maior a representatividade do evento, tendo como
referência seu registro histórico. Portanto, o ajuste de uma distribuição de probabilidades
busca sua aplicação para estimar as freqüências de eventos que ainda não foram
registrados e que normalmente são aplicados a projetos hidráulicos.
A freqüência de excedência é bastante usada em hidrologia, especialmente quando
os dados a serem trabalhados constituem séries históricas de precipitação. No entanto, para
estudos de vazões, esta situação é também é importante, sendo que, neste caso, pode-se
gerar um gráfico conhecido como “Curva de Permanência”. Isto significa que pode-se obter
a percentagem de tempo (ou permanência) no qual um determinado evento é superado ou
igualado. Estudos com esta conotação têm várias importâncias práticas, como por exemplo,
na determinação de uma vazão mínima de um curso d’água para abastecimento ou
irrigação, ou ainda, a precipitação mínima num determinado período de um mês visando ao
balanço hídrico e fornecimento da lâmina de irrigação suplementar, ambas as grandezas
6
associadas a uma probabilidade de excedência. A Figura 4.1 ilustra uma curva de
permanência hipotética.
Figura 4.1 Representação gráfica de uma curva de permanência hipotética.
No gráfico acima, para um valor y de vazão, x é a percentagem de tempo com que
esta vazão é igualada ou superada, ou seja, sua permanência. Um valor prático extraído da
curva de permanência é o Q90%, o qual significa a vazão existente no curso d´água em 90%
do tempo, sendo aplicada à gestão dos recursos hídricos. Pela curva, observa-se que se
trata de uma vazão pequena. O risco assumido é de que há possibilidade de 10% da
mesma ser inferior ao valor estimado e neste caso, problemas com o fornecimento de água
ao projeto.
Uma observação adicional pode ser feita. Quanto menor o intervalo de análise dos
dados (dados diários, mensais ou anuais) mais segura será a interpretação da curva de
permanência. Isto quer dizer, por exemplo, que a análise de dados diários de vazão de um
determinado rio fornece um valor menor de vazão, para uma dada permanência, do que
dados mensais ou anuais. Estes últimos geram valores superestimados, sendo mais útil
para a gestão dos recursos hídricos, o estudo com observações diárias.
7
4.3 Conceito de Tempo de Retorno (TR)
O tempo de retorno representa o inverso da freqüência com que um evento pode ser
igualado ou superado, ou seja, reflete a probabilidade com que uma dada variável
hidrológica possa ser igualada ou superada, pelo menos uma vez, num ano qualquer. Ao se
ajustar uma distribuição de probabilidades aos dados de freqüência de uma série histórica,
utiliza-se a probabilidade de excedência para estimar um tempo de retorno, que é obtido em
anos. Por definição, tem-se:
TR =
1
F(X > xi)
(5)
Ao se assumir uma distribuição de probabilidades com F (X > xi) estimado por P (X >
xi), tem-se:
TR ≅
1
P(X > xi)
(6)
No entanto, quando o objeto de estudo consiste de uma série histórica de dados
hidrológicos mínimos ou dados que apresentem distribuição normal, o tempo de retorno a
ser estimado também está associado à probabilidade com que o valor mínimo considerado
pode ser inferior ao esperado, ou seja:
TR =
1
1
≅
F(X ≤ xi) P(X ≤ xi)
(7)
Esta situação é comum quando se trabalha com dados de vazão mínima visando à
gestão dos recursos hídricos e avaliação da disponibilidade de água para irrigação ou
abastecimento. Uma vazão específica corresponde ao valor da Q7,10, que significa um valor
mínimo de vazão em 7 dias consecutivos, com Tempo de Retorno de 10 anos. Isto significa
que há probabilidade de 10% de ocorrer uma vazão mínima com 7 dias consecutivos inferior
ao valor estimado, sendo interpretado como um fator de segurança, porém associado à
garantia de vazão no curso d’água.
Contudo, o cálculo de TR, com base no seu conceito, não é suficiente. Assim, é
possível calcular o “risco hidrológico” propriamente dito, o qual está associado à
probabilidade de um evento ser igualado ou superado, porém, num intervalo de tempo N
menor que TR e cuja definição prática está associada à vida útil da obra. Na realidade, esta
probabilidade pode ser calculada pensando-se na probabilidade de que o evento não ocorra.
A linha de raciocínio é a seguinte: dados que p é a probabilidade de ocorrência de um
evento num ano qualquer; seu complemento é k, ou seja, a probabilidade de não ocorrência.
Assim:
k = 1− p
(8)
8
Considera-se que a probabilidade do evento não ocorrer em qualquer dos anos, num
intervalo de N anos, é dada por:
K = kN
(9)
Da mesma forma, seu complemento, no sentido agora de ocorrência, será:
R = 1− K
(10)
Sendo R o risco de ocorrência do evento num período de N anos. Fazendo-se
algumas substituições, chega-se a:
R = 1− kN
(11)
R = 1 − (1 − p)N
(12)
R = 1− 1−
1
TR
N
(13)
Na realidade, esta seqüência de equações nada mais é do que a aplicação da
Distribuição Binomial, considerando a probabilidade de não ocorrência, ou seja, P(x=0). A
Distribuição Binomial apresenta a seguinte estrutura:
P(X = x ) =
N
N− x
⋅ p x ⋅ (1 − p )
x
(14)
Assim, para a situação de não ocorrência, ou seja, P (X=0), teremos:
P(X = 0 ) =
N
N
N
⋅ p 0 ⋅ (1 − p ) = (1 − p )
0
(15)
Para a situação de ocorrência:
P( X = x ) = 1 − (1 − p)N
(16)
Sendo P(X=x) o risco hidrológico R definido anteriormente. O desdobramento, em
função de TR, é idêntico ao apresentado anteriormente.
9
4.4 Classificação das Principais Séries Históricas Hidrológicas
Os dados históricos relativos a um evento hidrológico constituem uma série
hidrológica, a qual pode ser classificada em:
a) Série original: constituída por todos os valores registrados. Exemplo: 30 anos de
dados de precipitação mensal. A série será constituída por 30 x 12 valores.
b) Série anual: constituída por valores extremos (máximos ou mínimos) de cada ano. A
partir do exemplo anterior, ter-se-ia uma série com 30 valores. Normalmente, valores
mínimos anuais dizem respeito ao comportamento de vazões em cursos d’água.
Este tipo de estudo visa fornecer informações para projetos de abastecimento de
água e irrigação.
c) Série parcial: constituída pelos “N” maiores ou menores valores ocorridos nos “N”
anos de observação. A partir do exemplo inicial, ter-se-ia uma série constituída por
30 valores, os quais seriam os maiores ou menores da série original, sem haver a
vinculação com o ano de ocorrência. Uma outra alternativa seria constituir a série
com todos os maiores (ou menores) valores da série, referindo-se a uma situação na
qual a série histórica é pequena e há utilização de mais de um valor extremo por
ano.
As séries históricas mais trabalhadas em hidrologia são as seguintes:
a) Precipitação total anual: constituída pela soma das precipitações diárias ocorridas ao
longo de 1 ano, obtendo-se, desta forma, 1 valor para a série. É estruturada,
portanto, com valores totais de cada ano. Neste caso, normalmente objetiva-se ao
estudo comportamental do ciclo hidrológico, sendo importante para estudos
vinculados ao balanço hídrico climatológico bem como balanço hídrico anual em
bacias hidrográficas.
b) Precipitação total mensal, quinzenal e decendial: nestas séries históricas, pode-se
trabalhar considerando um mês específico do ano (de interesse regional, por
exemplo) e estudar os seus totais mensal, da 1a e 2a quinzenas e 1o, 2o e 3o
decêndios. Este estudo é importante quando se realiza balanço hídrico de culturas
visando ao manejo de irrigação. O produto gerado é conhecido como Precipitação
Provável e trabalha-se com probabilidade de excedência, ou seja, objetiva-se
garantir um valor mínimo com 75, 90 ou 95% de excedência, dependendo da cultura
em questão. Culturas de maior valor econômico trabalha-se com um nível de
10
probabilidade de excedência maior, estimando-se um valor menor de precipitação
provável, devido ao risco de prejuízos mais importantes.
c) Precipitação máxima diária anual: neste caso, toma-se, em determinado ano, a maior
precipitação diária registrada, sendo este valor 1 componente da série histórica. É
feito desta forma para vários anos, constituindo-se a série histórica. Seu estudo é
importante quando se deseja obter valores extremos máximos diários, visando ao
estudo da freqüência de ocorrência de precipitações intensas, inclusive para geração
das equações de chuvas intensas. Quando a disponibilidade de dados históricos é
pequena, pode-se trabalhar com os 2 maiores valores anuais, a fim de melhorar a
representatividade da série.
d) Precipitação máxima anual correspondente a um determinado tempo de duração da
precipitação: aqui, têm-se os mesmos objetivos anteriores, porém trabalhando-se
com pluviogramas, separando-se o valor máximo da precipitação num determinado
ano, para vários tempos de duração. Assim, constitui-se uma série histórica para
cada tempo de duração. Estas séries geram resultados mais precisos para o ajuste
da equação de chuvas intensas, pois trata-se de intensidades reais que ocorreram
num determinado local. Valores totais diários não expressam tal característica.
e) Vazões Máximas Diárias Anuais: são séries históricas aplicadas ao estudo de vazões
de cheia e de projeto em cursos d´água. São séries com característica assintótica,
assim como as de precipitações máximas, ou seja, com acúmulo de dados à
esquerda na distribuição de freqüências, gerando-se um caudal à direita.
f) Vazões Mínimas Diárias Anuais: são séries históricas muito aplicadas à hidrologia,
fundamentais em estudos ligados à disponibilidade de água em cursos d’água para
projetos e gestão de recursos hídricos. De forma semelhante às vazões máximas,
são assintóticas, com acúmulo de dados à direita na distribuição de freqüência,
gerando-se um caudal à esquerda.
g) Vazões médias anuais: são séries históricas aplicadas ao estudo do comportamento
do deflúvio médio anual, obtida pela média aritmética dos dados.
h) Evapotranspiração: séries históricas que permitem estudar o comportamento
evapotranspirativo em bacias hidrográficas. Importante nos estudos ligados ao
11
comportamento climático de regiões, bem como modelagem do balanço hídrico
climatológico.
4.5 Histogramas de Freqüência
Histogramas de freqüência dizem respeito à representação gráfica (normalmente em
barras) da freqüência de ocorrência de uma dada variável, podendo ser simples ou
acumulada (de excedência ou não excedência). A curva de permanência é um tipo de
histograma de excedência, com as classes acumulando-se à esquerda.
A seguir será
apresentada a metodologia clássica para o desenvolvimento de histogramas de freqüência.
1o) Determinação do número de classes (k)
-
até 100 dados = k =
-
acima de 100 dados =
n
k = 5 ⋅ log10 (n)
onde n é o número de observações.
2o) Amplitude total dos dados (A)
A = M − m , em que M é o valor máximo observado e m, o menor valor.
3o) Amplitude de classe (Ac)
Ac =
A + ∆x
, em que, ∆x é a precisão de leitura (por exemplo: dados com uma casa
k −1
decimal, a precisão é de 0,1).
4o) Limite inferior da 1a classe
LIclasse1 = m −
Ac
2
5o) Limite superior da 1a Classe
LSclasse1 = LIclasse1 + Ac
6o) As demais classes são computadas somando-se os limites à amplitude, e assim
sucessivamente.
LSclasse1 = LIclasse2
LSclasse2 = LIclasse2 + Ac
LSclasse2 = LIclasse3, e assim por diante.
12
4.6 Medidas estatísticas básicas aplicadas em hidrologia
4.6.1 Média Aritmética
A média aritmétrica de um conjunto de dados é expressa por:
n
xi
X = i =1
n
−
(17)
4.6.2 Moda
É definida como sendo o valor que aparece com mais freqüência num conjunto de
dados. Quando se tem um intervalo de classe, a moda será o ponto médio da classe que
contiver o maior número de ocorrências.
4.6.3 Mediana
Corresponde ao valor que representa exatamente 50% das ocorrências. Para obtê-lo
basta avaliar as freqüências de ocorrência, independentemente de ser de excedência ou
não-excedência. Para obter o valor exato de 50%, pode-se utilizar o procedimento de
interpolação dos dados vizinhos a este valor, quando não for possível obtê-lo diretamente.
4.6.4 Variância da Amostra
n
s2 =
i=1
−
2
xi − x
n −1
(18)
4.6.5 Desvio Padrão da Amostra
s = s2
(19)
Ao se avaliar tanto o desvio padrão quanto a variância, observa-se que quanto maior
ambos, maior a variação dos dados em torno da média.
4.6.6 Assimetria
A assimetria é um parâmetro importante na medida em que avalia a forma como os
dados estão distribuídos em relação à média. Para que os dados apresentem distribuição
normal, a assimetria deve ser próxima ou igual a zero. Nesta situação, a média, a moda e a
mediana são iguais. Contudo, quando este valor for distante de zero, apresentará um
padrão de distribuição com a maior quantidade de dados à esquerda (assimetria positiva) ou
à direita (assimetria negativa). Em termos de dados hidrológicos, por apresentarem um
padrão com limitação inferior (normalmente, valor mínimo é zero) e sem limitação superior
13
(os eventos hidrológicos podem ser superados), a assimetria é positiva. A assimetria pode
ser calculada da seguinte forma:
A=
3
−
n
i=1
xi − x
(20)
n
Na prática é mais comum a utilização do coeficiente de assimetria, que representa a
relação entre a assimetria e o desvio padrão ao cubo. Este coeficiente pode ser do tipo
corrigido ou comum. O último pode ser calculado por:
Ca =
A
(21)
s3
O coeficiente corrigido é determinado da seguinte forma:
−
n
3
xi − x
i=1
n
Ca =
⋅
(n − 1) ⋅ (n − 2)
s3
(22)
Além da análise geral dos dados, a média, o desvio padrão e o coeficiente de
assimetria são extremamente importantes, pois constituem-se nos parâmetros que permitem
o ajuste das distribuições de probabilidades.
4.6.7 Curtose
Quantifica o grau de “achatamento” da distribuição de freqüência de uma
determinada amostra. A referência para curtose é a curva normal e pode ser calculada pela
seguinte equação:
n
Cu =
i=1
−
4
xi − x
n
⋅
1
s4
−3
(23)
Se Cu for próximo a zero, a distribuição é intermediária, sendo conhecido como
“Mesocúrtica”; se for maior que zero, os dados estão distribuídos de forma “afilada”
(“Leptocúrtica”); se for menor que zero, forma “achatada” (Platicúrtica) (Figura 4.2).
14
Figura 4.2 Comportamento da distribuição normal em função do achatamento dos dados.
4.6.8 Co-variância amostral
Quando se relaciona um conjunto de dados de uma variável com valores de outra
variável que possa explicar o comportamento da primeira, aplica-se a co-variância amostral,
onde quanto maior este valor, maior a relação entre as variáveis, ou seja, mais uma variável
explica a outra. Este coeficiente pode ser calculado pela equação:
cov xy =
−⋅ −
1 n
⋅ x i ⋅ y i − x⋅ y
n i=1
(24)
A co-variância pode ser negativa ou positiva. No primeiro caso, significa que valores
mais baixos de uma variável explicam valores mais altos de outra variável. No segundo, as
variáveis possuem o mesmo comportamento em termos de crescimento. Em ambos os
casos, quanto maior o valor, em módulo, maior a explicação da variável dependente.
4.6.9 Coeficiente de correlação
É um coeficiente que adimensionaliza a co-variância e busca explicar, da mesma
forma anterior, a relação entre duas variáveis. Seu valor varia de –1 a 1 e quanto mais
próximo dos extremos, maior a explicação da variável. É calculada por:
15
r=
cov xy
(25)
(s x ⋅ s y )
Em que sx e sy são respectivamente, o desvio padrão das variáveis x e y.
4.7 Distribuições Contínuas de Probabilidades em Hidrologia
4.7.1 Equação Geral de Ven Te Chow
Há situações em que se necessita estimar valores de eventos associados a
recorrências muito altas, cujas freqüências não foram ainda obtidas, como é o caso de
estruturas civis, cuja falha coloque em risco vidas humanas. Nestas condições, recomendase o uso de Distribuições Teóricas de Probabilidades, as quais devem ser adequadas para
estimativa das freqüências observadas, sendo que estas são determinadas pelas
características dos dados, especialmente se forem assintóticas.
Ven Te Chow1 afirma que a maioria das funções de probabilidades, aplicáveis à
Hidrologia, visando associar valor (magnitude) da variável à probabilidade de sua
ocorrência, pode ser representada pela seguinte equação:
−
(26)
X TR = X+ K TR ⋅ S
−
Em que XTR é o valor da variável hidrológica associada à recorrência TR, X é a
média aritmética da série histórica, S é o desvio padrão da mesma e KTR é o fator associado
à freqüência, sendo função de TR e da distribuição de probabilidades. É também chamado
“variável reduzida”. Basicamente, este modelo geral é aplicado em quase todos os estudos
probabilísticos em hidrologia.
4.7.2 Principais Distribuições de Probabilidades em Hidrologia
As distribuições de probabilidades que serão apresentadas, com as respectivas
aplicações, são as seguintes:
-
Distribuição Normal ou de Gauss: adequada para séries originais (Ex.: totais
anuais de precipitação);
-
Distribuição de Gumbel para máximos (ou Assintótica de Valores Máximos
Extremos do tipo I): adequada para série de valores extremos máximos (série
de valores máximos diários de precipitação ou vazão);
1
Haan (2002).
16
-
Distribuição de Gumbel para mínimos (ou Assintótica de Valores Mínimos
Extremos do Tipo I): adequada para valores mínimos extremos (série de
valores mínimos de vazão);
-
Distribuição Log-Normal a 2 e 3 parâmetros: aplicável tanto a valores originais
quanto máximos e estimativa da precipitação provável;
-
Distribuição Gama: aplicável para estimativa da precipitação provável e séries
históricas de valores extremos;
-
Distribuição Weibull: aplicável a série histórica de vazões mínimas;
-
Distribuição de Extremos de Fréchet ou Log-Gumbel: aplicação voltada para
séries históricas de valores extremos máximos, especialmente vazões
máximas;
-
Distribuição Generalizada de Valores Extremos (GEV): distribuição que
engloba as distribuições de extremos Tipo I (Gumbel), Tipo II (Fréchet) e Tipo
III (Weibull).
O ajuste de uma distribuição de probabilidades é conduzido com base em 2 ou 3
parâmetros. A estimativa destes parâmetros é feita com base na Inferência Estatística,
sendo o método dos momentos, o qual calcula os parâmetros com base nos momentos
estatísticos de 1a, 2a e 3a ordem, associados, respectivamente, à média, variância e
assimetria, o mais simples. As distribuições Normal e de Gumbel possuem apenas os 2
primeiros parâmetros. A Log-Normal pode estar associada aos 2 primeiros, assim como a
Normal, ou aos 3 parâmetros. No entanto, este método, apesar de mais aplicado, é menos
preciso que outros. Os métodos da Máxima Verossimilhança e Momentos – L são também
aplicados para estimativa dos parâmetros e também serão apresentados e discutidos.
4.7.2.1 Distribuição Normal ou de Gauss
A distribuição de Gauss ou Normal (DN) é uma distribuição de probabilidades para
variável contínua, caracterizada pela média e desvio padrão. Os valores de uma série que
segue a DN se distribuem simetricamente em relação à média. Portanto, apresentam o
coeficiente de assimetria igual a zero. A relação entre os valores e a probabilidade de
ocorrência pode ser visualizada na Figura 4.3, cuja área até determinado ponto (ou valor),
no sentido da esquerda para direita, representa a probabilidade de ocorrer valores menores
ou iguais àquele valor (probabilidade de não excedência).
17
Figura 4.3 Representação da distribuição normal com seus principais parâmetros.
A função densidade de probabilidade (FDP) é dada pela seguinte equação:
FDP = f (x ) =
1
σ 2⋅π
⋅e
−0,5⋅
(x − µ ) 2
σ
(27)
Em que σ é o desvio padrão e µ é a esperança ou média, ambos da população, que serão
substituídas pelo desvio padrão e média amostrais, com o 1o e 2o momentos calculados da
seguinte forma:
^
^
σ = se µ = X
(28)
A probabilidade propriamente dita é obtida pela integração da função densidade de
probabilidade (FDP), gerando a Função Cumulativa de Probabilidades (FCP). A
probabilidade de não-excedência é obtida pela integração da FDP de − ∞ a um
determinado valor X. A probabilidade de excedência é obtida com base na equação 1, já
que a integração da FDP de − ∞ a + ∞ é igual a 1. Desta forma, tem-se para a
probabilidade de não-excedência:
18
FCP = F(x ) = Pr ob(x ≤ x i ) =
x
1
−∞ σ ⋅ 2 ⋅ π
⋅e
−0,5⋅
(x − µ ) 2
σ
dx
(29)
Para facilitar a generalização desta relação (valor e probabilidade), propõem-se a
distribuição normal padrão, que utiliza a chamada variável reduzida ou padrão z, que mede
o desvio de uma variável em relação à média, em termos do desvio padrão, ou seja:
−
x−x
z=
(30)
s
Observa-se que z faz o papel de KTR conforme equação geral proposta por Ven Te
Chow (equação 26). Verifica-se, portanto, que a variável KTR é equivalente a z, no caso da
DN. A distribuição normal passa a ser DN (0,1) que é a distribuição normal padrão e sua
FCP calculada por:
F(z ) = Pr ob (Z ≤ z ) =
1
⋅
z
2
e −0,5⋅z dz
(31)
2 ⋅ π −∞
Em que z é a variável reduzida.
Observa-se que esta integral não apresenta solução analítica. Desta forma, pode-se
utilizar a tabela de distribuição de Gauss ou tabela de z (Tabela 4.2), a qual foi gerada a
partir da solução numérica da equação 31. Esta tabela fornece os valores de probabilidade,
de − ∞ até o valor de z que corresponde ao valor da variável hidrológica X, correspondendo
a uma tabela com probabilidades de não excedência. Além desta metodologia, pode-se
trabalhar com uma aproximação razoável, utilizando a equação abaixo:
(
Pr ob(Z ≤ z ) = 1 − f (z ) ⋅ a 1 ⋅ q + a 2 ⋅ q 2 + a 3 ⋅ q 3
)
(32)
Em que:
f (z ) =
1
2⋅π
⋅ e −0,5⋅z
2
q = (1 + a 0 ⋅ z )−1
(33)
(34)
Os valores para as constantes são:
a0 = 0,33267; a1 = 0,43618; a2 = -0,12017; a3 = 0,9373
Devido à simetria da curva normal, a série pode ser dividida em valores “menores
que” e “maiores que” a média. Deve-se ressaltar que variáveis afastadas da média do
19
mesmo valor (com os mesmos desvios) têm o mesmo tempo de recorrência, independente
de ser menor ou maior que a média. Assim, se 2 valores da variável X (X1 e X2) distam da
média, o mesmo desvio, tem-se o mesmo tempo de retorno para ambas. Numa situação,
busca-se a possibilidade de um valor menor que a média voltar a se repetir e noutra, um
valor maior que a média. Nesta situação, o cálculo de TR é conduzido considerando-se as
seguintes situações:
Para valores menores que a média, objetiva-se conhecer o valor de não-
-
excedência;
Para valores maiores que a média, objetiva a probabilidade de excedência;
-
Pelas equações abaixo, tem-se, respectivamente, a forma de cálculo de TR para
cada situação:
TR =
1
; se o valor da variável for menor que a média;
P(x ≤ x i )
TR =
1
; se o valor da variável for maior que a média;
P(x ≥ x i )
Exemplo de Aplicação 4.2
Se a precipitação total anual média é de 1000 mm e o desvio padrão, 200 mm, qual o
TR para as precipitações de 1200 mm e 800 mm.
O cálculo de z por meio da equação 30 fornece um valor para a primeira situação,
igual a 1 e para a segunda, –1. Ao se consultar a tabela de z (Tabela 4.2), encontra-se uma
freqüência de não excedência para z = 1, de 0,84134 e para z = -1, 0,15865. Para o primeiro
caso, o cálculo de TR é dado pela segunda equação. Assim, tem-se:
TR =
1
= 6,3 anos ; o valor da probabilidade de excedência foi obtido por 1 –
0,15865
0,84134 = 0,15865.
Para o segundo caso, tem-se:
TR =
1
= 6,3 anos ;
0,15865
O valor da probabilidade de não excedência, neste caso, é obtido considerando-se o
aspecto de simetria dos dados, ou seja, como P(z ≤ 1) é igual a 0,84134, seu complemento
[P(z > 1)]
0,15865.
será 0,15865. Como os valores são simétricos, P(z ≤ −1) = P(z ≥ 1) e portanto,
20
Tabela
( F(z ) =
z
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
1.10
1.20
1.30
1.40
1.50
1.60
1.70
1.80
1.90
2.00
2.10
2.20
2.30
2.40
2.50
2.60
2.70
2.80
2.90
3.00
3.10
3.20
3.30
3.40
4.2
z
1
−∞
2⋅π
0.00
0.5
0.5398
0.5793
0.6179
0.6554
0.6915
0.7257
0.7580
0.7881
0.8159
0.8413
0.8643
0.8849
0.9032
0.9192
0.9332
0.9452
0.9554
0.9641
0.9713
0.9772
0.9821
0.9861
0.9893
0.9918
0.9938
0.9953
0.9965
0.9974
0.9981
0.9987
0.9990
0.9993
0.9995
0.9997
Tabela
de
⋅ exp −
z2
dz ).
2
0.01
0.5040
0.5438
0.5832
0.6217
0.6591
0.6950
0.7291
0.7611
0.7910
0.8186
0.8438
0.8665
0.8869
0.9049
0.9207
0.9345
0.9463
0.9564
0.9649
0.9719
0.9778
0.9826
0.9864
0.9896
0.9920
0.9940
0.9955
0.9966
0.9975
0.9982
0.9987
0.9991
0.9993
0.9995
0.9997
0.02
0.5080
0.5478
0.5871
0.6255
0.6628
0.6985
0.7324
0.7642
0.7939
0.8212
0.8461
0.8686
0.8888
0.9066
0.9222
0.9357
0.9474
0.9573
0.9656
0.9726
0.9783
0.9830
0.9868
0.9898
0.9922
0.9941
0.9956
0.9967
0.9976
0.9982
0.9987
0.9991
0.9994
0.9995
0.9997
z
considerando
0.03
0.5120
0.5517
0.5910
0.6293
0.6664
0.7019
0.7357
0.7673
0.7967
0.8238
0.8485
0.8708
0.8907
0.9082
0.9236
0.9370
0.9484
0.9582
0.9664
0.9732
0.9788
0.9834
0.9871
0.9901
0.9925
0.9943
0.9957
0.9968
0.9977
0.9983
0.9988
0.9991
0.9994
0.9996
0.9997
0.04
0.5160
0.5557
0.5948
0.6331
0.6700
0.7054
0.7389
0.7704
0.7995
0.8264
0.8508
0.8729
0.8925
0.9099
0.9251
0.9382
0.9495
0.9591
0.9671
0.9738
0.9793
0.9838
0.9875
0.9904
0.9927
0.9945
0.9959
0.9969
0.9977
0.9984
0.9988
0.9992
0.9994
0.9996
0.9997
probabilidade
0.05
0.5199
0.5596
0.5987
0.6368
0.6736
0.7088
0.7422
0.7734
0.8023
0.8289
0.8531
0.8749
0.8944
0.9115
0.9265
0.9394
0.9505
0.9599
0.9678
0.9744
0.9798
0.9842
0.9878
0.9906
0.9929
0.9946
0.9960
0.9970
0.9978
0.9984
0.9989
0.9992
0.9994
0.9996
0.9997
0.06
0.5239
0.5636
0.6026
0.6406
0.6772
0.7123
0.7454
0.7764
0.8051
0.8315
0.8554
0.8770
0.8962
0.9131
0.9279
0.9406
0.9515
0.9608
0.9686
0.9750
0.9803
0.9846
0.9881
0.9909
0.9931
0.9948
0.9961
0.9971
0.9979
0.9985
0.9989
0.9992
0.9994
0.9996
0.9997
de
0.07
0.5279
0.5675
0.6064
0.6443
0.6808
0.7157
0.7486
0.7794
0.8078
0.8340
0.8577
0.8790
0.8980
0.9147
0.9292
0.9418
0.9525
0.9616
0.9693
0.9756
0.9808
0.9850
0.9884
0.9911
0.9932
0.9949
0.9962
0.9972
0.9979
0.9985
0.9989
0.9992
0.9995
0.9996
0.9997
não
0.08
0.5319
0.5714
0.6103
0.6480
0.6844
0.7190
0.7517
0.7823
0.8106
0.8365
0.8599
0.8810
0.8997
0.9162
0.9306
0.9429
0.9535
0.9625
0.9699
0.9761
0.9812
0.9854
0.9887
0.9913
0.9934
0.9951
0.9963
0.9973
0.9980
0.9986
0.9990
0.9993
0.9995
0.9996
0.9997
excedência
0.09
0.5359
0.5753
0.6141
0.6517
0.6879
0.7224
0.7549
0.7852
0.8133
0.8389
0.8621
0.8830
0.9015
0.9177
0.9319
0.9441
0.9545
0.9633
0.9706
0.9767
0.9817
0.9857
0.9890
0.9916
0.9936
0.9952
0.9964
0.9974
0.9981
0.9986
0.9990
0.9993
0.9995
0.9997
0.9998
Exemplo de Aplicação 4.3
Com base na série histórica de alturas pluviométricas anuais de Lavras, MG, no
período de 1914-1943, 1946-1949 e 1951-1991, obter:
a) Distribuição de freqüência (tabela e gráfico), média, mediana, moda, desvio padrão e
coeficiente de assimetria.
21
b) Utilize a distribuição de Gauss para calcular os valores máximos e mínimos esperados
para os tempos de retorno de 10, 50, 100 e 1000 anos.
c) Compare as freqüências observada e teórica, associadas às precipitações de 1068,1
mm e 2042,2 mm.
d) Qual a probabilidade de ocorrer de um ano com precipitação superior a 2000 mm
sabendo-se que já ocorreram 1600 mm?
Tabela 4.3 Alturas pluviométricas anuais para Lavras, MG, e respectiva distribuição de
freqüência.
Ordem
P
Fnão-exc.
Ordem
P
Fnão-exc.
Ordem
P
Fnão-exc.
1
747,1
0,01316
29
1353,7
0,38158
57
1696,0
0,75
2
832,4
0,02632
30
1354,7
0,39474
58
1673,2
0,76316
3
999,2
0,03947
31
1355,7
0,40789
59
1683,5
0,77632
4
1001,3
0,05263
32
1374,4
0,42105
60
1686,6
0,78947
5
1068,1
0,06579
33
1377,9
0,43421
61
1689,4
0,80263
6
1093,5
0,07895
34
1380,4
0,44737
62
1705,5
0,81579
7
1109,9
0,09211
35
1393,6
0,46053
63
1719,1
0,82895
8
1170,6
0,10526
36
1398,7
0,47368
64
1726,6
0,84211
9
1171,3
0,11842
37
1413,1
0,48684
65
1728,5
0,85526
10
1183,2
0,13158
38
1427,3
0,50
66
1794,0
0,86842
11
1184,9
0,14474
39
1428,1
0,51316
67
1816,6
0,88158
12
1187,7
0,15789
40
1430,0
0,52632
68
1820,3
0,89474
13
1196,6
0,17105
41
1443,4
0,53947
69
1832,7
0,90789
14
1204,7
0,18421
42
1445,8
0,55263
70
1933,2
0,92105
15
1216,1
0,19737
43
1448,8
0,56579
71
1938,0
0,93421
16
1216,2
0,21053
44
1450,3
0,57895
72
1951,8
0,94737
17
1217,8
0,22368
45
1453,4
0,59211
73
2042,2
0,96053
18
1246,0
0,23684
46
1479,5
0,60526
74
2130,7
0,97368
19
1263,5
0,25
47
1496,3
0,61842
75
2485,6
0,98684
20
1266,7
0,26316
48
1555,8
0,63158
21
1268,6
0,27632
49
1567,4
0,64474
22
1282,5
0,28947
50
1584,3
0,65789
23
1288,8
0,30263
51
1585,1
0,67105
24
1301,2
0,31579
52
1589,1
0,68421
25
1313,0
0,32895
53
1590,0
0,69737
26
1319,8
0,34211
54
1634,1
0,71053
27
1326,6
0,35526
55
1634,1
0,72368
28
1352,8
0,36842
56
1665,3
0,73684
22
a) Distribuição de freqüência por classes
75 = 8,66 ≈ 8 classes
-
número de classes (k) =
-
amplitude total (A) = 2485,6 – 747,1 = 1738,5
-
amplitude de classe (Ac) =
-
LIclasse 1 = 747,1 – (248,4)/2 = 622,9
-
LSclasse 1 = 622,9 + 248,4 = 871,3
1738,5 + 0,1
= 248,4
8 −1
Tabela 4.4 Classes e distribuição de freqüência simples e acumulada.
No
Ponto médio da
observações
classe
622,9 – 871,3
2
747,1
0,02632
0,02632
871,3 – 1119,7
3
995,5
0,06579
0,09211
1119,7 – 1368,1
24
1243,9
0,31579
0,4079
1368,1- 1616,5
22
1492,3
0,28947
0,69737
1616,5 – 1864,9
16
1740,7
0,21053
0,9079
1864,9 – 2113,3
4
1989,1
0,05263
0,96053
2113,3 – 2361,7
1
2237,5
0,01316
0,97368
2361,7 – 2610,1
1
2485,9
0,01316
0,98685
Classes
F simples
F acumulada
não-excedência não-excedência
Moda: ponto da classe com maior número de observações. Portanto, 1243,9 mm.
Mediana: valor que corresponde a exatamente 50% dos dados. Na Tabela 4.1, 1427,3 mm.
Gráfico da distribuição de freqüência simples e acumulada.
23
Ca = 0,72 Observa-se que a assimetria dos dados é pequena, sugerindo-se que é possível
ajustar a distribuição normal aos dados.
b) Aplicação da distribuição normal de probabilidades
−
x = 1466,0 mm e s = 319,2 mm
Equação geral de Ven Te Chow:
x TR = 1466 + k TR ⋅ 319,2
Para TR = 10 anos tem-se, com base na definição deste e na condição de simetria
da curva normal:
P (x > xi) = 0,10; A probabilidade de não excedência é: P(x < xi) = 0,90. Consultando a
tabela de z, tem-se z = 1,28. Para calcular os valores máximos e mínimos procede-se da
seguinte forma:
Valor máximo
-
xTR = 1466 + 1,28 * 319,2 = 1874,6 mm
Valor mínimo
-
Pela simetria da curva normal, tem-se z = -1,28 e xTR = 1466 – 1,28 * 319,2 = 1057,4 mm.
Os demais tempos de retorno são obtidos a partir do mesmo procedimento.
c) Aplicacão da equação geral de Ven Te Chow
−
x−x
z=
s
=
1068,1 − 1466
= −1,25 → Pr ob(Z ≤ −1,25 ) = 0,10628
319,2
=
2042,2 − 1466
= 1,81 → Pr ob(Z ≤ 1,81) = 0,96447
319,2
−
x−x
z=
s
d) Evento A: precipitação anual superior a 2000 mm [P(X ≥ 2000 mm )]
Evento B: precipitação anual superior a 1600 mm [P(X ≥ 1600 mm )]
Busca-se estimar o evento A condicionado ao evento B, portanto:
P(A | B ) =
P(A ∩ B ) P(X ≥ 1600 mm ) − P(X ≥ 2000 mm )
=
P(B )
P(X ≥ 1600 mm )
24
−
x−x
z=
=
s
2000 − 1466
= 1,67 → P(Z ≤ 1,67 ) = 0,9525
319,2
P(X ≥ 2000 mm ) = 1 − 0,9525 = 0,0475
−
x−x
1600 − 1466
= 0,42 → P(Z ≤ 0,42) = 0,6628
s
319,2
P(X ≥ 1600 ) = 1 − 0,6628 = 0,3372
z=
P(A | B ) =
=
P(A ∩ B ) P(X ≥ 1600 mm) − P(X ≥ 2000 mm) 0,3372 − 0,0475
=
=
= 0,859
P(B )
P(X ≥ 1600 mm)
0,3372
Três observações sobre o exemplo são pertinentes:
a) À medida que TR aumenta, aumenta-se a precipitação máxima e diminui-se a mínima.
Isto ocorre porque quando o TR fica maior, menor será a probabilidade com a qual o
valor será maior (no caso de máximos) ou menor (no caso de mínimos) que um
determinado valor da variável. Isto significa que, como a probabilidade é cada vez menor
para que o evento ocorra, mais no extremo da curva normal o mesmo se encontrará.
P2 é maior que P1, assim como P1`é menor que P2`.: TR2 > TR1.
25
b) Pode-se observar também que, para probabilidades menores que 0,01316 e maiores
que 0,98684 não é possível obter o valor com base na freqüência observada, porque as
freqüências extremas correspondem a estes valores, ou seja, o tamanho da amostra
(série histórica) não foi suficiente para que se pudesse detectar e comparar os
estimados pela distribuição de probabilidades em relação às respectivas freqüências
observadas.
c) Pode-se verificar que os erros na estimativa dos eventos são pequenos, indicando que a
distribuição normal pode representar bem o fenômeno das precipitações totais anuais.
No entanto, deve-se aplicar um teste estatístico de aderência para se concluir de forma
mais efetiva, o qual será tratado em tópico específico deste capítulo.
4.7.2.2 Distribuição de Gumbel para máximos ou assintótica de valores máximos do
tipo I
A Função Densidade de Probabilidade (FDP) de Gumbel é dada por:
FDP = α ⋅ e
− α (x −µ )−e − α
(x − µ )
(35)
A integração da FDP fornece a função cumulativa de probabilidades (FCP):
P(x ≤ xi ) = e− e
− α(x − µ )
(36)
Esta distribuição apresenta os 2 primeiros parâmetros de uma distribuição de
probabilidades, ou seja, µ e σ , que são calculados pelas expressões abaixo, considerandose o método dos momentos:
α=
^
1,2826
s
^
−
µ = x − 0,45 ⋅ s
−
(37)
(38)
Em que x e s correspondem, respectivamente, à média e o desvio padrão da série
histórica.
26
Para estimativa de uma variável hidrológica x em função do TR, aplica-se a equação
abaixo, fruto da manipulação da equação 36 e da consideração de TR como função da
probabilidade de excedência:
− LN − LN 1 −
x TR =
1
TR
+µ
α
(39)
4.7.2.3 Distribuição Generalizada de Extremos – GEV
A distribuição GEV (do inglês “Generalized Extreme Value”) foi introduzida por
Jenkinson (1955), incorporando as 3 formas assintóticas: Gumbel (Tipo I), Fréchet (Tipo II) e
Weibull (Tipo III). Sua FDP é dada por:
1
x−µ
FDP = f (x ) = ⋅ 1 + ξ ⋅
σ
σ
−
1+ ξ
ξ
x−µ
⋅ exp − 1 + ξ ⋅
σ
−
1
ξ
(40)
Em que ξ, σ e µ são, respectivamente, os parâmetros de forma, escala e posição. Se
ξ for negativo, a GEV representa a forma assintótica de valores mínimos (Tipo III) e existe
apenas para x <
(µ − σ ) .
ξ
Se ξ for positivo, a GEV representa uma distribuição Tipo II
(Fréchet), definida para x >
(µ − σ ) . Se ξ = 0 , tem-se a Distribuição Gumbel. Sua FCP é
ξ
dada por:
x−µ
FCP = P( X ≥ xi) = exp − 1 + ξ ⋅
σ
−
1
ξ
(41)
A Distribuição GEV apresenta 3 momentos estatísticos:
E[x ] = x = µ +
Var (x ) =
σ
ξ
2
σ
⋅ [Γ(1 − ξ ) − 1]
ξ
[
(42)
]
⋅ Γ(1 − 2 ⋅ ξ) − Γ 2 (1 − ξ)
γ = CA = (sin al de ξ ) ⋅
(43)
− Γ(1 − 3 ⋅ ξ ) + 3 ⋅ Γ(1 − ξ) ⋅ Γ(1 − 2 ⋅ ξ) − 2 ⋅ Γ 3 (1 − ξ )
[Γ(1 − 2 ⋅ ξ) − Γ
2
(1 − ξ )]
3
2
(44)
27
Para estimar os parâmetros da Distribuição GEV deve-se inicialmente calcular o
parâmetro de forma pela equação 44. Para isto, é importante observar qual sinal ξ tem para
a situação em estudo, o que é obtido mediante análise do coeficiente de assimetria
(distorção). Para ξ = 0, γ = 1,1396; valores de γ superiores a este valor, ξ < 0; valores de γ
menores que 1,1396 implica em ξ > 0 até o valor de -1/3.
A estimativa de uma variável hidrológica associada a um tempo de retorno é dada
por, considerando-se freqüência de excedência:
x TR = µ +
−ξ
σ
1
⋅ 1 − − LN 1 −
ξ
TR
(45)
4.7.2.4 Distribuição de Fréchet ou Log-Gumbel
Também conhecida como Distribuição de Fréchet, consiste da aplicação da
Distribuição Gumbel aos valores logaritmizados da variável hidrológica. Fréchet aplicou-a
para estudar as freqüências de vazões de cheias, sendo muito útil aos estudos que
envolvem variáveis hidrológicas máximas. Sua FDP e FCP são, respectivamente:
FDP = f (x ) =
θ λ
⋅
λ x
θ+1
λ
x
⋅ exp −
λ
FCP = P(X ≥ xi) = 1 − exp −
x
θ
(46)
θ
para x > 0; θ, λ > 0
(47)
Sendo F(x) a freqüência de excedência. São 3 momentos estatísticos:
E(x ) = µ = λ ⋅ Γ 1 −
1
para θ > 1
θ
Var (x ) = σ 2x = λ2 ⋅ Γ 1 −
2
1
− Γ2 1−
θ
θ
2
θ
− 1 para θ > 2
1
1−
θ
(48)
para θ > 2
(49)
Γ 1−
CV =
Γ2
(50)
28
A obtenção dos parâmetros desta distribuição começa com a equação 50 a partir do
coeficiente de variação; em seguida, calcula-se o parâmetro λ com a equação 48, partindose da média. A estimativa de um valor x, associado a um TR, é dada por:
TR
= λ ⋅ LN
TR − 1
x TR
−
1
θ
(51)
4.7.2.5 Distribuição de Gumbel para mínimos ou assintótica de valores mínimos
extremos do tipo I
Esta distribuição de probabilidades consiste de uma versão da Distribuição de
Gumbel, com a diferença de se trabalhar com séries históricas de valores mínimos,
normalmente vazões mínimas. Na estimativa do parâmetro µ, troca-se o sinal. A definição
dos parâmetros da distribuição, pelo método dos momentos, é dada por:
α=
^
1,2826
s
^
−
(52)
(53)
µ = x + 0,45 ⋅ s
A FDP é definida por:
FDP = α ⋅ e
α⋅(x −µ )− eα
(x − µ )
(54)
A FCP é dada pela probabilidade de não excedência:
P(x ≤ x i ) = 1 − e −e
α (x − µ )
(55)
Para estimativa de uma variável hidrológica x em função do TR, aplica-se a equação
abaixo, fruto da manipulação da equação 55 e da consideração de TR como função da
probabilidade de não excedência:
LN − LN 1 −
x TR =
α
1
TR
+µ
(56)
29
Exemplo de Aplicação 4.4
Dada uma série histórica de 16 anos de precipitação máxima diária anual para a
cidade de Lavras, MG, no período de 1915 a 1930 (Tabela 4.5). Determinar:
a) Distribuição de freqüência simples de não-excedência dos dados;
b) Aplicar as distribuições Gumbel, GEV e Fréchet e determinar a precipitação máxima
diária para TR de 5, 10 e 20 anos;
c) Determinar o TR para as precipitações máximas diárias anuais de 80 e 90 mm;
Tabela 4.5 Precipitações máximas diárias anuais para Lavras, MG no período de 1915 a
1930 e respectivas freqüências observadas de não excedência.
Ordem
Precipitação
F não exced.
Ordem
(mm)
Precipitação
F não exced.
(mm)
1
46,2
0,05882
9
64,2
0,52941
2
50,0
0,11765
10
66,9
0,58824
3
50,4
0,17647
11
78,2
0,64706
4
57,0
0,23529
12
78,6
0,70588
5
58,7
0,29412
13
78,7
0,76471
6
60,2
0,35294
14
80
0,82353
7
61,6
0,41176
15
85,5
0,88240
8
63,4
0,47059
16
88,5
0,94120
30
Observa-se que as distribuições se ajustaram de forma razoável às freqüências
observadas, com destaque para a distribuição GEV para os valores mais baixos da série,
Fréchet para os intermediários e Gumbel para os maiores. Contudo, nenhuma delas se
ajustou bem aos dados próximos ao valor de 80 mm, uma vez que são números muito
próximos e com freqüências distintas, dificultando o ajuste da distribuição.
a) Estimativa dos valores de precipitação associados aos TRs de 5, 10 e 20 anos
Distribuição Gumbel
Os parâmetros ajustados para esta distribuição foram: α = 0,0968; µ = 60,80. Aplicando-se
estes parâmetros à equação 39 chega-se aos seguintes valores:
TR = 5 anos.: XTR = 76,30 mm
TR = 10 anos.: XTR = 84,05 mm
TR = 20 anos.: XTR = 91,50 mm
Distribuição GEV
Para esta distribuição, os parâmetros estimados foram: ξ = 0,2329; σ = 10,69; µ = 60,8685.
Aplicando-se a equação 45, chega-se aos seguintes valores:
TR = 5 anos . : XTR = 73,56 mm;
TR = 10 anos . : XTR = 77,94 mm;
TR = 20 anos . : XTR = 81,24 mm;
Distribuição Fréchet
Os parâmetros estimados para esta distribuição foram: θ = 7,313; λ = 60,68. Aplicando-se a
equação 51, chega-se aos seguintes valores:
TR = 5 anos.: XTR = 74,5 mm;
TR = 10 anos.: XTR = 82,54 mm;
TR = 20 anos.: XTR = 91,08 mm;
31
b) Estimativa de TR para as precipitações de 80 e 100 mm
Distribuição de Gumbel
Aplicando o inverso do complemento da equação 36, chega-se a:
P = 80 mm.: TR = 7 anos
P= 90 mm.: TR = 17,4 anos
Distribuição GEV
Aplicando-se a inversa da equação 41, chega-se aos seguintes valores:
P = 80 mm.: TR = 10,6 anos
P = 90 mm.: TR = 76 anos
Distribuição Fréchet
Aplicando-se o inverso da equação 47, chega-se aos seguintes valores:
P = 80 mm.: TR = 8,1 anos
P = 90 mm.: TR = 13,4 anos
Observa-se que a Distribuição GEV tende a superestimar o TR, especialmente para
valores mais altos, por se caracterizar, neste caso como uma distribuição Tipo III, a qual
para valores máximos, consiste de uma exponencial apenas, refletindo em valores mais
elevados. A partir de valores em torno de 80 mm (observar gráfico de ajuste), a distribuição
GEV proporciona ajustes mais distantes dos valores de freqüência observados, o que não
ocorre com as outras duas distribuições.
4.7.2.6 Distribuição Log-normal a 2 parâmetros
A função densidade de probabilidades (FDP) desta distribuição a seguinte:
FDP =
1
x ⋅ σn ⋅ 2 ⋅ π
⋅e
−0,5⋅
Ln(x )−µn
σn
2
(57)
Os parâmetros são determinados por:
n
(Ln(x ))
µ n = i=1
n
(58)
32
σn = desvio padrão dos dados transformados.
Os valores dos parâmetros desta distribuição podem ser estimados com base na
média e desvio padrão dos dados sem transformação logarítmica. As equações são:
µn =
−4
1
⋅ Ln
2
x
(59)
−2
x + s2
−2
x + s2
σ n = Ln
(60)
−2
x
Esta distribuição se assemelha à Normal, porém, trabalhando-se com o logarítmo
dos dados. A variável reduzida kTR é o próprio valor de z utilizado na Distribuição Normal.
Assim, a equação geral de Ven Te Chow é trabalhada da seguinte forma:
x TR = e µn + k TR ⋅ σn
(61)
4.7.2.7 Distribuição Log-normal a 3 parâmetros
Neste caso, a FDP é dada em função de 3 parâmetros, tendo-se a seguinte
estrutura:
FDP : f (x ) =
1
(x − β) ⋅ σ n ⋅
2⋅π
⋅e
−0,5⋅
Ln(x −β )−µn
σn
2
, com x ≥ β .
(62)
Para estimar os parâmetros da distribuição log-normal, com base numa série
histórica de dados, as seguintes equações são aplicadas:
−
β = x−
ηy =
s
ηy
(63)
(1 − φ )
23
(
− γ + γ2 + 4
φ=
(64)
φ1 3
2
)
0,5
(65)
33
Com base no coeficiente de assimetria - Ca (equação 22) calcula-se γ . Com isto,
estima-se φ (equação 65), ηy (equação 64) e com base neste último valor e na média e
desvio padrão dos dados, o parâmetro β , na equação 63. Os parâmetros µn e σn são
calculados com base nas seguintes equações:
µ n = Ln
(
)
s
− 0,5 ⋅ Ln η y 2 + 1
ηy
(
)
σ n = Ln η y 2 + 1
(66)
(67)
Neste caso, a variável xTR é calculada por:
x TR = e µn +k TR ⋅σn + β
(68)
Exemplo de Aplicação 4.5
Determinar a precipitação provável para 10, 75 e 90% de probabilidade, com base na
série histórica de precipitação associada ao 1o decêndio (Tabela 4.6) do mês de janeiro, de
1960 a 1981, para a cidade de Lavras, MG. Calcule também, o TR para uma precipitação
decendial de 310 mm nos primeiros 10 dias de janeiro. Aplique as distribuições log-normal
2P, log-normal 3P e GEV.
1o) Aplicação da Distribuição Log-normal a 2 parâmetros
A precipitação provável sugere um estudo probabilístico de valores mínimos a serem
garantidos, ou seja, visa-se à uma probabilidade de um dado valor x superar um xi. Esta
situação diz respeito, portanto, à probabilidade de excedência.
O cálculo dos parâmetros µ n e σ n foi feito com base no cálculo da média dos dados
logaritmizados, obtendo-se para o primeiro 4,358 e para o segundo 0,8985.
-
Para 10% de probabilidade, P(x>xi) = 10% .: P(x<xi) = 90%. Da tabela de z, o
valor deste, para 90% de probabilidade, é 1,28. Assim, a precipitação
provável associada a esta probabilidade:
x TR = e µn +k TR ⋅σn = e 4,358 +1,28⋅0,8985 = 246,7 mm . Disto conclui-se que, com uma
probabilidade de 10%, a precipitação provável para os primeiros 10 dias de janeiro é
de 246,7 mm.
34
-
Para 75% de probabilidade, P(x>xi) = 75%.: P(x<xi) = 0,25%. Da tabela de z,
obtém-se valor aproximadamente igual a –0,67. Da mesma forma anterior, a
precipitação provável será 42,78 mm. Espera-se uma precipitação mínima
para os primeiros 10 dias de janeiro, de 42,78 mm, com 75% de
probabilidade.
-
Para 90% de probabilidade, P(x>xi) = 90%.: P(x<xi) = 10%. Da tabela de z,
obtém-se este aproximadamente igual a –1,28. Da mesma forma anterior, a
precipitação provável será 24,7 mm.
Tabela 4.6 Série histórica de precipitação associada ao 1º decêndio de janeiro para Lavras,
MG, no período de 1960 a 1981, e respectivas freqüências observadas.
Ordem
Precipitação
Fexcedência
Ordem
(mm)
Precipitação
Fexcedência
(mm)
1
290
0,04545
12
84,8
0,54545
2
253,2
0,09091
13
78,5
0,59091
3
189,9
0,13636
14
69,9
0,63636
4
162,8
0,18182
15
53,5
0,68182
5
144,8
0,22727
16
52,4
0,72727
6
141,2
0,27273
17
42,2
0,77273
7
140,3
0,31818
18
29,2
0,81818
8
135,3
0,36364
19
25,5
0,86364
9
111,7
0,40909
20
17,6
0,90909
10
97,8
0,45455
21
8,4
0,95455
11
95,9
0,50000
Analisando os resultados, observa-se que quanto maior a probabilidade de um
evento exceder um dado valor, menor será o evento, uma vez que a probabilidade do valor
ser superado aumenta. Em contrapartida, quanto menor a probabilidade de excedência,
maior será o valor, haja vista que o risco assumido é maior (a probabilidade do valor ser
superado é maior).
Para determinar o TR para uma precipitação mínima de 340 mm, com base nesta
série histórica, procede-se da seguinte forma:
Determina-se kTR e com este valor, na tabela de z, a probabilidade de nãoexcedência. Determina-se então a de excedência, e aplica-se na definição de TR para
variáveis cujos estudos interessam a sua superioridade.
35
x TR = e µn + k TR ⋅ σn = 340 = e 4,358 + k TR ⋅0,8985
k TR = 1,64
Na tabela de z, obtém-se uma P(x<xi) = 0,94949 e P(x>xi) = 0,05051. O TR será
então igual a 19,8 anos. A probabilidade do valor de 340 mm ser igualado ou superado, pelo
menos uma vez, em 20 anos, é de 0,05051.
2o) Aplicando-se o modelo Log-normal a 3 parâmetros
Neste caso, o procedimento consiste no cálculo da média, desvio padrão e
coeficiente de assimetria dos dados. Assim:
−
x = 105,95 mm
s = 75,07 mm
Ca = 0,9845
Aplicando a equação 65, em que Ca = γ , determina-se φ :
(
− γ + γ2 + 4
φ=
2
)
0,5
(
− 0,9845 + 0,9845 2 + 4
=
)
0,5
= 0,6223
2
Na seqüência, aplicando-se a equação 64, obtém-se:
2
ηy =
(1 − φ ) =
23
φ1 3
1 − 0,6223 3
= 0,3175
1
0,6223 3
Com a equação 63, determina-se o 3o parâmetro, que representa a assimetria dos
dados:
−
β = x−
s
75,07
= 105,95 −
= −130,47
ηy
0,3175
Com estas informações, estima-se µ n e σ n com nas equações 66 e 67:
µ n = Ln
(
)
(
)
s
75,07
2
− 0,5 ⋅ Ln η y + 1 = Ln
− 0,5 ⋅ Ln 0,3175 2 + 1 = 5,418
ηy
0,3175
36
(
)
(
)
σ n = Ln η y 2 + 1 = Ln 0,3175 2 + 1 = 0,3099
-
Para P(x>xi) = 10%, o valor de z, conforme exemplo anterior,,é 1,28. Assim, a
precipitação será:
x TR = e µn +k TR ⋅σn + β = e 5,418 +1,28⋅0,3099 − 130,47 = 204,71 mm
-
Para P(x>xi) = 75%, o valor de z é –0,67, e a precipitação mínima será:
xTR = 52,7 mm
-
Para P(x>xi) = 90%, o valor de z é de –1,28 e a precipitação será:
xTR = 21,1 mm.
Cálculo de TR para 340 mm com base na distribuição com 3 parâmetros:
kTR = 2,37.: P(x<xi) = 0,9911 e P(x>xi) = 0,0089 e TR = 112,4 anos. Nota-se uma grande
diferença entre os cálculos dos dois modelos para a estimativa deste TR.
3o Aplicando a Distribuição GEV
O cálculo da assimetria dos dados produziu um valor de 0,9845. Aplicando-se a
equação 44, considerando sinal negativo, chega-se ao valor do parâmetro de forma desta
distribuição, o qual é igual a 0,02742. Na seqüência, aplicando o momento de segunda
ordem, encontra-se o parâmetro de escala
igual a 60,587. Com a equação 42 e os demais
parâmetros, é possível estimar o parâmetro de posição µ como sendo igual a 72,58. Desta
forma, com a equação 41, são estimados os valores de precipitação associados aos níveis
de probabilidade de excedência.
Para Prob (x>xi) = 90%: P = 21,5 mm;
Para Prob (x>xi) = 75%: P = 52,7 mm;
Para Prob (x>xi) = 10%: P = 204,8 mm.
Comparando-se as estimativas da precipitação pelas três distribuições ao valor
obtido com base na freqüência observada, é possível desenvolver o seguinte quadro
resumo dos resultados:
37
P(x>xi)
LN 2P (mm)
LN 3P (mm)
GEV (mm)
10
246,7
204,7
204,8
75
42,8
52,7
52,7
90
24,7
21,1
21,5
Obs.: A análise da distribuição de probabilidades que é mais precisa pode ser obtida
mediante testes estatísticos apropriados, os quais permitirão verificar a adequação da
distribuição bem como inferir sobre sua precisão propriamente dito.
4.7.2.8 Distribuição Gama
Consiste de uma distribuição de probabilidades com ampla aplicação à hidrologia,
com destaque para precipitação provável e vazões de maneira geral. Sua Função
Densidade de Probabilidades (FDP), considerando sua versão a 2 parâmetros, é:
FDP : f (x ) =
1
β υ × Γ(υ)
⋅x
υ−1
⋅e
−x
β
(69)
Os parâmetros desta distribuição são β e υ, os quais podem ser obtidos por:
β=
s2
(70)
X
(X)
υ=
2
(71)
s2
A função Gama de um número qualquer pode ser aproximada por2:
Γ(n) =
5 p
2π
i
⋅ po +
n
i=1 n + i
⋅ (n + 5.5 )n+0.5 ⋅ e − (n+5.5 )
(72)
Para esta estimativa considerar:
po = 1,000000000190015; p1 = 76,180091729471460; p2 = -86,505320329416770;
p3 = 24,014098240830910; p4 = -1,231739572450155; p5 = 1,208650973866179x10-3
No entanto, com auxílio do software Excel, é possível obter a função gama de um
número qualquer de forma rápida e precisa, utilizando a função “exp(LNGAMA(n))”, sendo n
o número cujo gama deseja-se obter.
2
Trabalho desenvolvido por Press et al. (1992) com erro absoluto menor que 2x10-10 e citado por Ferreira (2005).
38
A Função Cumulativa de Probabilidades (FCP) deve ser obtida, primeiramente, entre
cada um dos valores da variável x de forma ordenada, para posterior somatório. Para isto,
procede-se calculando as integrais para cada intervalo de x de forma numérica:
xi+1
xi
f (x ) ⋅ dx = (x i+1 − x i ) ⋅
[f (x i ) + f (x i+1 )]
2
(73)
Portanto, a FCP é calculada por:
x
P(X ≤ x ) = f (x ) ⋅ dx
(74)
0
A FDP para a versão a 3 parâmetros é:
FDP : f (x ) =
1
β υ × Γ(υ)
⋅ (x − µ )
υ −1
⋅e
− (x − µ )
β
(75)
A estimativa dos parâmetros desta equação, com base no método dos momentos, é:
υ=
β=
4
(76)
as 2
as ⋅ s
2
µ = X−
2⋅s
as
(77)
(78)
Em que s é o desvio padrão e as é o coeficiente de assimetria. A versão desta
distribuição a 3 parâmetros pode produzir melhores resultados, contudo, os graus de
liberdade do ajuste também podem ficar comprometidos. Alguns estudos desenvolvidos
para precipitação provável têm mostrado desempenho similar destas distribuições, optandose, normalmente pela versão a 2 parâmetros.
4.7.2.9 Distribuição Weibull
Esta distribuição apresenta aplicações a séries históricas de valores mínimos, sendo,
normalmente trabalhada para séries de vazões mínimas ou similares. A distribuição de
Weibull é uma derivação da distribuição Assintótica de Valores Extremos. Sua FDP é dada
por:
39
FDP : f (x ) = λ ⋅ β ⋅ x β −1 ⋅ e −λ⋅x
β
(79)
A Função Cumulativa de Probabilidades (FCP) é dada por:
FCP : P(X ≤ x ) = 1 − e −λ⋅x
β
(80)
Os parâmetros desta distribuição são λ e β, que estão associados à média e
variância, respectivamente, por:
1
µ=X=
λ
^
^
2
1
β
1
σ =s =
λ
2
⋅ Γ 1+
2
β
1
β
⋅ Γ 1+
(81)
2
1
− Γ 1+
β
β
2
(82)
O valor da variável x associada ao tempo de retorno (TR) pode ser calculado por:
1
Ln 1 −
TR
x=
-λ
1
β
(83)
Exemplo de Aplicação 4.6
Com base nas distribuições de probabilidade Weibull, Gumbel e GEV determinar a
vazão mínima de sete dias consecutivos para os TRs de 10, 20 e 50 anos, com base numa
série histórica de vazão mínima com 7 dias consecutivos, de 68 anos para o Rio Grande, sul
de Minas Gerais (Tabela 4.7). Calcule também, o TR para uma vazão mínima esperada de 6
m3 s-1 por ambas as distribuições.
40
Tabela 4.7 Série histórica de vazões mínimas com 7 dias consecutivos do Rio Grande com
seção de controle em Madre de Deus e respectivas freqüências observadas.
Ordem
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
Vazão
8,97
10,41
11,32
11,50
13,10
13,15
13,57
14,46
14,95
14,95
15,66
16,04
16,06
16,18
16,20
16,32
16,39
17,00
17,02
17,04
17,04
17,48
17,57
17,66
17,72
17,88
18,09
18,77
18,79
18,79
18,80
19,04
19,41
19,48
Fnão-excedência
0.01449
0.02899
0.04348
0.05797
0.07246
0.08696
0.10145
0.11594
0.13043
0.14493
0.15942
0.17391
0.18841
0.20290
0.21739
0.23188
0.24638
0.26087
0.27536
0.28986
0.30435
0.31884
0.33333
0.34783
0.36232
0.37681
0.39130
0.40580
0.42029
0.43478
0.44928
0.46377
0.47826
0.49275
Ordem
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
Vazão
19.49
19.53
19.67
19.87
19.89
19.98
20.11
20.21
20.39
20.83
21.08
21.61
22.11
22.16
22.40
22.41
22.72
22.84
23.19
23.79
24.76
24.78
25.16
25.24
25.41
25.72
26.60
26.62
26.96
27.90
29.24
30.30
32.50
38.25
Fnão-excedência
0.50725
0.52174
0.53623
0.55072
0.56522
0.57971
0.59420
0.60870
0.62319
0.63768
0.65217
0.66667
0.68116
0.69565
0.71014
0.72464
0.73913
0.75362
0.76812
0.78261
0.79710
0.81159
0.82609
0.84058
0.85507
0.86957
0.88406
0.89855
0.91304
0.92754
0.94203
0.95652
0.97101
0.98551
1o) Aplicação da distribuição de Weibull
Trabalhando com os dados da Tabela 4.7, calcula-se a média e desvio padrão dos
dados da mesma. Assim, tem-se:
−
x = 20,01 m3 s-1
s = 5,276 m3 s-1
Manipulando as equações 81 e 82, pode-se chegar à seguinte equação:
41
2
µ
2
σ =
Γ 1+
2
1
⋅ Γ 1+
− Γ 1+
β
β
1
β
2
(84)
Com isto, é possível estimar o parâmetro β e a partir daí, com a média dos dados, o
parâmetro λ na equação 81. Respectivamente, tem-se:
β = 4,283378; λ = 1,78219 x 10-6
Aplicando-se a equação 83, para todos os TRs, tem-se:
TR = 10 anos: Q = 13 m3/s;
TR = 20 anos: Q = 10,99 m3/s;
TR = 50 anos: Q = 8,84 m3/s;
Com base na equação abaixo, calcula-se TR para Q = 6 m3 s-1, ou seja:
TR =
1
1 − e − λ⋅ x
(85)
β
TR = 261 anos
2o) Aplicação da distribuição Gumbel (série de mínimos)
Cálculo dos parâmetros da distribuição:
^
α=
1,2826
= 0,2431
s
^
µ = X + 0,45 ⋅ s = 20,01 + 0,45 ⋅ 5,276 = 22,38
Para TR = 10 anos
LN − LN 1 −
x TR =
1
TR
α
LN − LN 1 −
+µ =
0,2431
1
10
+ 22,38 = 13,12 m3/s
Valendo-se do mesmo procedimento, tem-se para os demais tempos de retorno:
TR = 20 anos: Q = 10,16 m3 s-1
TR = 50 anos: Q = 6,33 m3 s-1
42
Determinação de TR:
TR =
1
1
=
P(X ≤ xi) 1 − exp(− exp(α ⋅ (x − µ )))
TR =
1
= 54,12 anos
1 − exp(− exp(0,2431 ⋅ (6 − 22,38 )))
3o Aplicando-se a Distribuição GEV
O coeficiente de assimetria da série histórica é igual a 0,7195, gerando os seguintes
parâmetros da GEV: σ = 0,5332; α= 5,7207; β = 18,8035. Com estes valores e aplicando a
equação correspondente, tem-se:
Para TR = 10 anos: Q = 12,79 m3/s;
Para TR = 20 anos: Q = 10,27 m3/s;
Para TR = 50 anos: Q = 7,33 m3/s.
O cálculo de TR para uma vazão mínima de 7 dias consecutivos igual a 6 m3/s,
produziu um valor de 78,5 anos.
Observações
A comparação das distribuições mostra que para valores mais altos de vazão, a
estimativa da freqüência tende a ser próxima, especialmente Weibull e GEV. Para valores
menores, observa-se discrepância nas estimativas, com a GEV mais próxima da
Distribuição Gumbel.
4.8 Estimação dos parâmetros das distribuições de probabilidades com base na
Máxima Verossimilhança
4.8.1 Definições
O Método da Máxima Verossimilhança consiste de uma metodologia desenvolvida
por Fisher em 1922, no qual se busca a maximização da probabilidade (plausibilidade) de
um parâmetro representar uma população, maximizando a densidade conjunta dos
elementos amostrais. A função de verossimilhança é matematicamente definida pelo
produtório das densidades de cada valor amostral, sendo este dado por x1, x2, x3, etc, ou
seja:
n
L = f (x1) ⋅ f (x 2) ⋅ f (x3 )...f (xn) = ∏ f (xi)
i=1
(86)
43
Assim, a máxima verossimilhança consiste em encontrar o ponto de máximo da
função acima, derivando-a em relação a cada um dos seus parâmetros, e igualando-se a
zero. Supondo uma distribuição de probabilidades com 1 parâmetro, como, por exemplo,
Poisson, tem-se:
P(x ) =
e −λ x
⋅λ
x!
(87)
Em que λ é o parâmetro e x uma variável aleatória discreta. Uma pergunta pode ser
feita: “Qual o melhor parâmetro λ que maximizará a probabilidade de x ser igual a 10?”
Assim, a idéia geral dos estimadores de Máxima Verossimilhança é a seguinte:
Pelo esquema acima, percebe-se que existem vários valores do parâmetro que
podem ser utilizados para calcular a probabilidade de x ser igual a 10. Matematicamente, o
que maximizará esta probabilidade é o valor de λ que satisfará a equação abaixo:
dP
=0
dλ
(88)
Para distribuições contínuas com mais de um parâmetro, tem-se uma superfície e
duas outras equações, constituindo um sistema para obtenção dos parâmetros
correspondentes ao ponto de máximo. Para facilitar a solução matemática do ponto de
44
máximo, é necessário linearizar a equação 86, obtendo-se a função logaritmo de
verossimilhança (log (L)):
log(L ) = log f (x1) + log f (x 2) + log f (x3 ) + ... + log f (xi) =
n
log f (xi)
(89)
i=1
Considerando uma distribuição contínua com parâmetros θ1 e θ2, tem-se:
∂ log(L )
=0
∂θ1
Sistema de Equações para obtenção dos parâmetros θ1 e θ2.
∂ log(L )
=0
∂θ2
A seguir serão apresentadas as soluções do sistema acima para as distribuições de
probabilidades apresentadas anteriormente.
4.8.2 Distribuição Normal
A Distribuição Normal é caracterizada pela seguinte expressão:
(
)
FDP. : f x; µ, σ 2 =
1
2π ⋅ σ 2
(x − µ )2
⋅ exp−
(90)
2 ⋅ σ2
Aplicando-se o conceito definido pela equação 89, tem-se:
n
n
L = ∏ f (xi) = ∏
i=1
i=1
1
2π ⋅ σ
2
⋅ exp−
(x − µ )2
2⋅σ
2
=
1
(2π ⋅ σ )
2
n
exp−
2
1
2σ
n
2
(xi − µ )2
i=1
(91)
Linearizando a equação 91, tem-se:
( )
n
n
1
ln(L ) = − ln(2π ) − ln σ 2 −
2
2
2σ 2
n
i=1
(xi − µ )2
(92)
Finalmente, derivando-se a equação acima em relação a µ e σ2, igualando-se a zero,
tem-se:
45
∂ ln L
∂σ
=−
2
n
2⋅σ
+
2
1
( )
2σ
2 2
⋅
n
i=1
(xi − µ )2
∂ ln L
1 n
= 2 ⋅ (xi − µ )
∂µ
σ i=1
(93)
(94)
Assim, igualando as equações acima a zero, é possível resolver em função dos
parâmetros µ e σ2, obtendo-se sua estimativa por Máxima Verossimilhança:
n
µ=
i=1
σ2 =
xi
−
=x
(95)
(n − 1) ⋅ S 2
(96)
n
n
Observa-se que estas equações são utilizadas na maioria das vezes em que a
Distribuição Normal é aplicada.
4.8.3 Distribuição Gumbel para máximos
A FDP da distribuição Gumbel é dada por:
f (x; α, µ ) = α ⋅ e
−α⋅(x −µ )−e − α⋅(x −µ )
(97)
Sua função logaritmo de verossimilhança é:
ln L =
ln L =
n
ln(α ) ⋅ e
−α⋅(xi−µ )−e − α (xi−µ )
i=1
n
n
1
⋅ ln(α ) + − α ⋅ (xi − µ ) + e − α⋅(xi−µ )
n
i=1
i=1
(98)
(99)
Derivando-se em relação a α e µ, igualando-se a zero, tem-se:
n
1
= X−
α
i=1
x i ⋅ exp(− α ⋅ x i )
n
i =1
exp(− α ⋅ x i )
(100)
46
n
exp(− α ⋅ µ ) =
i =1
exp(− α ⋅ x i )
n
(101)
A solução deste sistema de equações é desenvolvida solucionando-se a equação
100 para α e substituindo-se este valor na equação 101, encontrando-se µ.
Exemplo de Aplicação 4.7
Compare o comportamento das freqüências estimadas pela distribuição Gumbel,
com parâmetros obtidos pelos Métodos dos Momentos e da Máxima Verossimilhança. A
série histórica de chuvas máximas diárias anuais apresentada na Tabela 4.8 é do município
de Barbacena, MG.
A distribuição Gumbel ajustada com base no método dos momentos propiciou a
estimativa dos parâmetros α e µ, respectivamente iguais a 0,064829 e 68,57729. Pelo
método da máxima verossimilhança obteve-se, respectivamente, 0,0557329 e 67,74231. Os
gráficos da Figura 4.4, na seqüência, representam os ajustes das freqüências teóricas às
observadas.
Figura 4.4 Ajustes da distribuição Gumbel, por Máxima Verossimilhança (MV) e Método dos
Momentos (MM), para série histórica de precipitação máxima diária anual para a cidade de
Barbacena, MG.
47
Tabela 4.8 Série histórica de precipitação máxima diária para o município de Barbacena,
MG.
Ordem
hdia
Ordem
hdia
Ordem
hdia
1
43.20
25
73.20
49
97.20
2
43.80
26
74.00
50
97.60
3
47.60
27
74.20
51
100.00
4
47.60
28
75.40
52
100
5
49.00
29
77.00
53
100.20
6
49.40
30
78.20
54
101.00
7
49.80
31
79.00
55
105.50
8
50.00
32
81.00
56
111.50
9
50.20
33
82.00
57
116.40
10
53.20
34
82.60
58
121.00
11
57.00
35
83.00
12
58.00
36
86.40
13
58.40
37
88.20
14
60
38
88.20
15
63.20
39
89.00
16
65.00
40
90.00
17
65.00
41
90.40
18
65.60
42
92.60
19
66.00
43
93.00
20
66.00
44
93.20
21
68.00
45
95.00
22
70.00
46
95.00
23
72.60
47
96.20
24
72.60
48
96.60
É possível observar um melhor ajuste da distribuição Gumbel ajustada com base em
parâmetros estimados pela Máxima Verossimilhança, avaliando maior proximidade entre as
freqüências estimadas pela distribuição e as freqüências observadas. Isto também pode ser
comprovado pelo teste Qui-quadrado, onde obteve-se um valor de 7,3 para a distribuição
ajustada por máxima verossimilhança e 13,9 para a distribuição ajustada pelo método dos
momentos, enquanto o Qui-quadrado tabelado é de 14,1. Avalia-se que por este último
método, a distribuição quase não foi adequada e a grande diferença entre os valores de Quiquadrado reflete a precisão do ajuste3. Detalhes da aplicação do teste de Qui-quadrado
serão apresentados em tópico específico sobre Testes de Aderência.
3
Conforme Walpole & Mayers (1978).
48
4.8.4 Distribuição Gama
A distribuição Gama possui a seguinte formulação, na forma incompleta, para sua
FDP:
f (x; β, υ) =
1
β υ ⋅ Γ(υ)
⋅x
υ −1
⋅e
−x
β
(102)
Sua função log-verossimilhança é dada por:
n
ln L(β, υ) = −n ⋅ υ ⋅ ln(β ) − n ⋅ ln[Γ(υ)] + (υ − 1) ⋅ ln
xi
ln(xi) − i=1
β
i=1
n
(103)
As derivadas parciais de ln (L) em relação a α e β igualadas a zero produz:
ln(υ) − ψ(υ) = ln
X
(104)
XG
Em que ψ(υ) corresponde à função digama de υ e X G é a média geométrica dos
dados. A função digama pode ser aproximada por uma série de potência da seguinte forma:
ψ (υ) ≅ ln(υ) −
1
1
1
1
1
−
+
−
+
...
2 ⋅ υ 12 ⋅ υ 2 120 ⋅ υ 4 252 ⋅ υ 6 240 ⋅ υ 8
(105)
A solução da equação 105 permite estimar o valor de υ e assim, calcula-se β da
seguinte forma:
β=
X
υ
(106)
4.8.5 Log-normal 3 parâmetros
A FDP da distribuição log-normal 3 parâmetros é dada por:
f (x; a, σ, µ ) =
−1
1
(x − a ) ⋅ σ ⋅
2π
⋅e
2⋅σ 2
⋅(log(x −a )−µ )2
(107)
49
Para a estimativa dos parâmetros pela Máxima Verossimilhança, adota-se o seguinte
procedimento:
Faz-se x* = x – a e os parâmetros µ e σ são obtidos por:
n
µ=
i=1
(log x )
*
(108)
n
n
σ=
i
i=1
(
log x i * − µ
)
2
(109)
n
Assim, o parâmetro a é testado, avaliando-se a função log-verossimilhança, até que
haja maximização desta função. A função de log-verossimilhança é dada por:
ln L(x; µ, σ, a ) = −n ⋅ log(σ ) −
( )
(
n
n ⋅ log(2π ) n
1
− log x i * −
⋅ log x i * − µ
2
2
i=1
2 ⋅ σ i=1
)
2
(110)
Exemplo de Aplicação 4.8
Compare os ajustes das freqüências teóricas às observadas para vazões mínimas
anuais do Rio Aiuruoca, região Alto Rio Grande, MG, produzidos pelas distribuições Gama
Incompleta e Log-normal 3 parâmetros, ajustadas por máxima verossimilhança à série
histórica apresentada na Tabela 4.9.
50
Tabela 4.9 Série histórica de vazões mínimas diárias anuais do Rio Aiuruoca, região Alto
Rio Grande.
Ordem
Vazão
Ordem
Vazão
1
4,71
15
7,48
2
5,34
16
7,53
3
5,72
17
7,57
4
6,00
18
7,62
5
6,18
19
7,70
6
6,43
20
7,92
7
6,45
21
8,01
8
6,72
22
8,09
9
6,81
23
8,22
10
6,87
24
8,77
11
6,95
25
8,94
12
7,05
26
9,75
13
7,13
27
10,25
14
7,40
28
10,69
29
17,50
É possível observar um ligeiro melhor ajuste da distribuição log-normal 3 parâmetros,
o que pode ser constatado também pelos valores de Qui-quadrado calculados para ambos,
onde para a distribuição log-normal 3 parâmetros este valor foi de 0,233 enquanto para
distribuição Gama de 0,297.
Figura 4.5 Ajustes das distribuições Gama e log-normal 3 parâmetros, ajustadas pela
Máxima Verossimilhança, para série histórica de vazões mínimas diárias anuais do Rio
Aiuruoca, Alto Rio Grande, MG.
51
Exemplo de Aplicação 4.9
Comparar o ajuste das distribuições Gama, Log-normal 3 parâmetros e Gumbel,
ajustadas por máxima verossimilhança, às freqüências observadas da série de vazões
máximas diárias anuais do Rio Aiuruoca, apresentadas na Tabela 4.10.
Com base nos gráficos da Figura 4.6, verifica-se que a distribuição Gumbel
apresentou um melhor ajustamento das freqüências teóricas às observadas, seguida da
distribuição log-normal 3 parâmetros. Isto pode ser comprovado pelos valores de Quiquadrado das distribuições, sendo igual a 3,423 para distribuição Gumbel; 4,048 para lognormal 3 parâmetros e 4,315 para a distribuição Gama.
Tabela 4.10 Série histórica de vazões máximas diárias anuais do Rio Aiuruoca, região Alto
Rio Grande.
Ordem
Vazão
Ordem
Vazão
1
53,8
15
95,5
2
54,3
16
98,4
3
57,8
17
105
4
66,3
18
106
5
74,9
19
120
6
75,2
20
120
7
77,3
21
136
8
77,8
22
147
9
79,4
23
155
10
85,7
24
159
11
86,8
25
162
12
88,4
26
163
13
89,2
27
174
14
93,8
28
179
29
179
52
Figura 4.6. Distribuições Gumbel, log-normal 3 parâmetros e Gama, ajustadas por Máxima
Verossimilhança, para série histórica de vazões máximas diárias anuais do Rio Aiuruoca,
Alto Rio Grande, MG.
4.8.6 Weibull
A distribuição de Weibull possui sua FDP caracterizada por:
f (x; α, β ) = λ ⋅ x β −1 ⋅ β ⋅ e
− λ⋅ xβ
(111)
Em que: x ≥ 0 ;λ, β > 0
Aplicando-se os conceitos de máxima verossimilhança, chega-se ao seguinte
sistema de equações:
λ=
n
n
i=1
(112)
x iβ
β=
λ⋅
n
i=1
(x
n
i
β
)
⋅ ln(xi) −
n
ln(x i )
i=1
(113)
53
Utilizando-se o método de Newton-Raphson, obtém-se simultaneamente, β e λ.
4.8.7 GEV
A distribuição GEV possui sua FDP dada por:
1
x−µ
f (x ) = ⋅ 1 + ξ ⋅
σ
σ
−
1+ ξ
ξ
x−µ
⋅ exp − 1 + ξ ⋅
σ
−
1
ξ
(114)
Aplicando-se os conceitos de verossimilhança, chega-se à seguinte equação:
x −µ
1 n
L(µ, σ, ξ ) = ∏ f (x i ) = n ⋅ ∏ 1 + ξ ⋅ i
σ
i=1
σ i=1
n
−
1+ ξ
ξ
exp
n
i=1
x −µ
− 1+ ξ ⋅ i
σ
−
1
ξ
(115)
O logaritmo da função de verossimilhança produz:
l(x; ξ, σ, µ ) =
n
i=1
x −µ
1+ ξ
− ln(σ ) −
⋅ ln 1 + ξ ⋅ i
ξ
σ
x −µ
− 1+ ξ ⋅ i
σ
−
1
ξ
(116)
Derivando-se a equação 115 em relação aos respectivos parâmetros e fazendo-se
uma série de manipulações, chega-se ao seguinte sistema de equações:
1 n 1+ ξ − y i
⋅
σ i=1
σ
−
1
ξ
=0
1
−
(x i − µ ) ⋅ (1 + ξ ) − y i − ξ
n 1 n
+
⋅
σ σ 2 i=1
n
i=1
1− yi
−
1
ξ
yi
⋅
=0
(x − µ ) − (x i − µ ) = 0
1
⋅ ln(y i ) − i
2
ξ ⋅ σ ⋅ yi
σ ⋅ yi
ξ
Neste caso, tem-se que:
(117)
54
yi = 1+ ξ ⋅
xi − µ
σ
(118)
Para solução do sistema de equações, sugere-se iniciá-lo com base nos parâmetros
µ, σ e ξ oriundos do método dos momentos (equações 42, 43 e 44).
Exemplo de Aplicação 4.10
Ajustar a distribuição Weibull à série histórica de vazões mínimas de 7 dias
consecutivos do Rio Grande, na Região Alto Rio Grande (Tabela 4.7).
Os parâmetros ajustados foram: λ = 5,6482 x 10-6; β = 3,908993 e a aderência das
freqüências observadas às teóricas representada na Figura 4.7.
Figura 4.7 Ajuste da Distribuição Weibull à série histórica de vazões mínimas de 7 dias
consecutivos do Rio Grande, seção de Madre de Deus, MG.
Exemplo de Aplicação 4.11
Ajustar a distribuição GEV ajustada por Máxima Verossimilhança e Método dos
Momentos para a série histórica de precipitação decendial do mês de janeiro da Tabela 4.6.
55
Parâmetro
MV
MM
σ
54,08
60,59
µ
70,74
72,58
ξ
0,088
0,0274
Gráfico dos ajustes
A estimativa de erro médio das freqüências estimadas pelos respectivos métodos em
relação às observadas foi de 9,70% para o método dos momentos e de 9,49% para o
método da Máxima Verossimilhança, com o erro máximo de 52% para MM e de 44% para
MV. Segundo alguns autores, o desempenho da MV será superior quanto maior a série
histórica, que no caso deste exemplo, apesar de apenas 21 dados da série histórica, esta
metodologia mostrou-se ligeiramente superior.
4.9 Estimação de parâmetros das Distribuições de Probabilidades com base nos
Momentos – L
O método dos momentos – L consiste de uma abordagem estatística que permite
estimar os parâmetros de uma distribuição de probabilidades com base em mais momentos
estatísticos de ordem superior a 3, podendo permitir, em casos de pequenas amostras,
ajustar, com maior precisão, uma distribuição de probabilidades do que o Método da
Máxima Verossimilhança.
56
Hosking (1990) menciona que os valores numéricos de momentos amostrais, em
especial de pequenas amostras, podem ser muito diferentes daqueles que de fato
caracterizam uma determinada população, constituindo-se em erros de elevada magnitude
na estimativa da freqüência.
Desta forma, foram introduzidos os conceitos de momentos ponderados por
probabilidades (MPP), apresentando a seguinte expressão para estimativa dos momentos
amostrais:
^
αs =
N−i
s
1 N
⋅
⋅ xi
N i=1 N − 1
s
(119)
Em que N é o tamanho da amostra, s é um número inteiro que varia de 0 a 3 e xi a
variável hidrológica em questão. Os termos entre parênteses são obtidos pela análise
combinatória, ou seja:
N−i
(N − i)!
=
s
(N − i − s)!⋅s!
(120)
Os momentos que podem ser estimados pela equação 119 podem ser linearizados
de acordo com Hosking (1990), uma vez que, nesta forma, os momentos são de difícil
aplicação para modelagem (caracterização da forma e escala) de uma distribuição de
probabilidades. Assim, os momentos podem então ser estimados pelas equações, sendo
conhecidos como Momentos - L:
λ1 = α 0
λ 2 = α 0 − 2 ⋅ α1
λ 3 = α 0 − 6 ⋅ α1 + 6 ⋅ α 2
(121)
λ 4 = α 0 − 12 ⋅ α 1 + 30 ⋅ α 2 − 20 ⋅ α 3
O momento – L λ1 é equivalente à média. O coeficiente de variação, o qual está
associado ao parâmetro de escala, é dado por:
τ=
λ2
λ1
Os coeficientes de assimetria e curtose são obtidos respectivamente, por:
(122)
57
τ3 =
λ3
λ2
(123)
τ4 =
λ4
λ2
(124)
4.9.1 Aplicação às Distribuições de Probabilidades apresentadas
a) Distribuição Normal
^
µ = λ1 = α 0
(125)
^
σ = π ⋅ λ 2 = π ⋅ (α 0 − 2 ⋅ α 1 )
(126)
b) Distribuição Gumbel para Máximos
^
α=
ln(2)
λ2
^
µ = λ1 −
(127)
0,5772
^
(128)
α
c) Distribuição Gumbel para Mínimos
^
α=
ln(2)
λ2
^
µ = λ1 +
0,5772
^
(129)
α
d) Distribuição Gama
λ2
Γ(υ + 0,5 )
=
λ1
π ⋅ Γ(υ + 1)
β=
λ1
υ
(130)
(131)
58
e) GEV
(
^
ξ = (− 1) ⋅ 7,859 ⋅ C + 2,9554 ⋅ C 2
C=
2
ln(2)
−
3 + τ 3 ln(3 )
τ 3 = −3 +
^
σ=
(
2 ⋅ 1 − 3 −ξ
(1 − 2 )
−ξ
λ2 ⋅ ξ
(
Γ(1 + ξ ) ⋅ 1 − 2 −ξ
^
µ = λ1 −
)
(132)
(133)
)
(134)
)
(135)
α
⋅ [1 − Γ(1 + ξ )]
ξ
(136)
f) Log-normal
^
σN = 2 ⋅
z
(137)
2
Sendo z a variável Normal padrão correspondente à probabilidade
^
µ N = ln(λ 1 ) −
(σN )2
τ +1
.
2
(138)
2
Exemplo de Aplicação 4.12
Compare o ajuste da distribuição GEV obtido pela Máxima Verossimilhança (MV),
Método dos Momentos (MM) e Método dos Momentos – L (MML) para a série histórica de
precipitação decendial do mês de janeiro da Tabela 4.6. Os ajuste por MV e MM foram
apresentados no Exemplo de Aplicação 4.11.
Parâmetro
MV
MM
MML
σ
54,08
60,59
60,93
µ
70,74
72,58
70,77
ξ
0,088
0,0274
0,00000104
59
Gráfico dos ajustes
A estimativa de erro médio das freqüências estimadas pelos respectivos métodos em
relação às observadas foi de 9,70% para o método dos momentos, de 9,49% para o método
da Máxima Verossimilhança e 8,54% para o método dos momentos-L, com o erro máximo
de 52% para MM, de 44% para MV e 46,3% para MML. O desempenho de MML
normalmente é superior, especialmente para séries históricas menores, conforme
comentado anteriormente.
Exemplo de Aplicação 4.13
Com base na série histórica do Exemplo de Aplicação 4.4 (série da Tabela 4.5), a
qual diz respeito à precipitação máxima diária anual, ajuste a Distribuição de Gumbel pelo
método dos Momentos-L (ML), comparando o ajuste ao obtido pelo Método dos Momentos
(MM) e calcule a precipitação máxima diária anual para os TRs de 5, 10, 50 e 100 anos.
Os respectivos ajustes produziram os seguintes parâmetros, calculando-se os erros
médios absolutos entre as freqüências observadas e estimadas em cada um dos métodos.
60
Parâmetros
Erro (%)
MM
ML
0,09683
0,08930
60,7957
60,2926
16,81
13,64
Graficamente:
TR
MM
ML
5
76,29
77,09
10
84,04
85,49
50
101,09
104,00
100
108,30
111,81
Com base nos dados de erro absoluto acima, há indicativo de que o Método dos
Momentos-L gerou maior precisão do que o Método dos Momentos. No entanto, é
importante que esta análise possa ser conduzida com base em algum teste estatístico,
permitindo uma conclusão mais apropriada.
61
Exemplo de Aplicação 4.14
Ajuste as distribuições Gama 2P e GEV pelo método dos Momentos-L, comparando
os ajustes, à mesma série histórica do Exemplo 4.13 (Série da Tabela 4.5).
Os ajustes produziram um erro médio absoluto de estimativa das freqüências
observadas de 9,94% para a Distribuição Gama e de 13,81% para a Distribuição GEV. O
erro máximo observado na primeira situação foi de 24,1% e para a segunda, de 37,6%,
apontando para um melhor desempenho da distribuição Gama quando este método de
ajuste é aplicado. Graficamente, é possível perceber o melhor ajustamento das freqüências
estimadas às observadas pela Distribuição Gama.
Exemplo de Aplicação 4.15
Com base na série histórica de vazões mínimas consecutivas de 7 dias, do Rio
Grande (Tabela 4.7), ajuste as distribuições GEV e log-normal 2P pelo método dos
Momentos-L e calcule o valor correspondente ao TR de 10 anos por ambos os modelos.
Os parâmetros ajustados para a distribuição GEV foram:
= 6,91x10-5;
= 4,191;
= 17,588
Os parâmetros ajustados da distribuição log-normal 2P foram:
N
= 0,2588;
N
= 2,963
62
Para um TR de 10 anos, correspondendo a valores mínimos, portanto, probabilidade
de não excedência, estima-se uma Q7,10 para o Rio Grande na seção de controle de Madre
de Deus, um valor de 14,1 m3/s com aplicação da GEV e de 13,9 m3/s aplicando-se a
distribuição log-normal 2P. O desempenho das distribuições é semelhante.
Graficamente, tem-se:
4.10 Adequação Estatística de uma Distribuição de Probabilidades
Para a aplicação de uma distribuição de probabilidades é indispensável analisar se a
mesma representa adequadamente bem a relação funcional entre os valores do evento e as
respectivas freqüências de ocorrência dos mesmos. Para isto, há necessidade de se
comprovar previamente se a distribuição é adequada para a série histórica a ser trabalhada.
A comprovação é feita com base em testes estatísticos não paramétricos, os quais, na
seqüência, serão apresentados de forma detalhada aqueles mais usuais em hidrologia,
sendo que também são conhecidos como Testes de Aderência Estatística.
4.10.1 Teste de Kolmogorov-Smirnov
Neste teste, promove-se o cálculo da diferença entre as freqüências observadas
(amostrais) e as freqüências esperadas com base na distribuição de probabilidades,
comparando-se a maior diferença obtida a um valor que correspondente à estatística do
teste (Tabela 4.11). Esta estatística é obtida em função do tamanho da amostra (n) e nível
63
de significância (α ) a ser adotado (5% na maioria das vezes). A hipótese de nulidade a ser
testada é a Hipótese Ho de que a freqüência observada poderá ser estimada pela
distribuição de pobabilidades, ou seja, como o valor tabelado é estatisticamente nulo, podese concluir que valores menores ou iguais a este serão também estatisticamente nulos.
Desta forma, tem-se:
∆F calculadom áximo ≤ ∆F tabela (n,α )
Nesta
situação,
a
distribuição
(139)
de
probabilidades
será
adequada,
pois
[∆F]calculado máximo será nulo estatisticamente e, portanto, a freqüência observada não difere
da esperada. Observa-se que apenas a máxima diferença entre as freqüências é
considerada neste teste. Desta forma, o Teste de Kolmogorov-Smirnov é inteiramente
qualitativo, significando que o mesmo permite apenas a conclusão de que a distribuição de
probabilidades é adequada ou não, não havendo embasamento suficiente para se concluir a
respeito da precisão e comparação entre distribuições distintas. Se na equação 139 ocorrer
o contrário, a distribuição não será adequada, devendo-se buscar o ajuste de outra.
64
Tabela 4.11 Valores críticos do teste de Kolmogorov-Smirnov (Adaptado de Haan, 2002).
Tamanho da
Nível de Significância
Amostra (N)
0,20
0,15
0,10
0,05
0,01
1
0,900
0,925
0,950
0,975
0,995
2
0,684
0,726
0,776
0,842
0,929
3
0,565
0,597
0,642
0,708
0,829
4
0,494
0,525
0,564
0,624
0,734
5
0,446
0,474
0,510
0,563
0,669
6
0,410
0,436
0,470
0,521
0,618
7
0,381
0,405
0,438
0,486
0,577
8
0,358
0,381
0,411
0,457
0,543
9
0,339
0,360
0,388
0,432
0,514
10
0,322
0,342
0,368
0,409
0,486
15
0,268
0,283
0,304
0,338
0,404
20
0,231
0,246
0,264
0,294
0,352
25
0,210
0,220
0,240
0,264
0,320
30
0,190
0,200
0,220
0,242
0,290
40
-
-
-
0,210
0,250
50
-
-
-
0,190
0,230
60
-
-
-
0,170
0,210
70
-
-
-
0,160
0,190
80
-
-
-
0,150
0,180
90
-
-
-
0,140
-
100
-
-
-
0,140
-
4.10.2 Teste de Qui-quadrado
Este teste é mais rigoroso que o anterior por agrupar os dados da série histórica em
classes de freqüência e acumular os erros entre as freqüências observada e teórica, com
participação de todas as classes e não apenas a máxima diferença. A soma destes erros
(obtida pela soma dos erros de todas as classes) gera o valor de λ2calculado. A estatística do
teste é obtida por meio da tabela de λ2 (Tabela 4.12), adotando-se o valor tabelado com
base em graus de liberdade da distribuição e nível de significância. Para que a distribuição
de probabilidades tenha aderência aos dados, o valor de λ2calculado deve ser menor que o de
tabela. Assim, tem-se:
65
χ 2 calculado =
n
(fobsi − f teoricoi )2
i=1
f teoricoi
(140)
Em que n é o número de classes, fobsi e fteóricoi são, respectivamente, as freqüências
observada e teórica na classe i. As classes com menos de 3 valores devem ser agrupadas
com as classes vizinhas, seguindo os critérios de aplicação do teste. Os Graus de Liberdade
a serem adotados neste teste podem ser obtidos considerando-se uma situação
intermediária entre o número de classes menos 1 e o número de classes menos número de
parâmetros da distribuição menos 1. Por exemplo: para 6 classes, os graus de liberdade
devem estar, para uma Distribuição Normal (2 parâmetros) entre 5 e 3, adotando-se 4.
Ressalta-se que para um pequeno número de classes o teste perde precisão. Para maiores
detalhes para aplicação deste teste, consultar Ferreira (2005) e Haan (2002). Um detalhe
adicional é de que a equação 140 representa uma forma de cálculo do quadrado médio do
erro e todas as freqüências participam do mesmo. Desta forma, Walpole & Myers (1978)
consideram o teste de λ2 um cálculo de precisão do ajuste da distribuição de probabilidades.
131
Tabela 4.12 Quantis superiores da distribuição Qui-quadrado associados aos graus de liberdade (v) e diferentes níveis de significância
(adaptado de Ferreira 2005).
Graus de
Nível de Significância
Liberdade (v)
0,995
0,975
0,950
0,900
0,750
0,500
0,100
0,050
0,010
0,005
1
0,000039
0,000982
0,003932
0,015791
0,101532
0,455
2,706
3,841
6,635
7,879
2
0,010025
0,050636
0,102587
0,210721
0,575364
1,386
4,605
5,991
9,210
10,597
3
0,071721
0,215793
0,351843
0,584369
1,213
2,366
6,251
7,815
11,345
12,838
4
0,206989
0,484418
0,710723
1,064
1,923
3,357
7,779
9,488
13,277
14,860
5
0,411742
0,831212
1,145
1,610
2,675
4,351
9,236
11,070
15,086
16,750
6
0,675727
1,237
1,635
2,204
3,455
5,348
10,645
12,592
16,812
18,548
7
0,989256
1,690
2,167
2,833
4,255
6,346
12,017
14,067
18,475
20,278
8
1,344
2,180
2,733
3,490
5,071
7,344
13,362
15,507
20,090
21,955
9
1,735
2,700
3,325
4,168
5,899
8,343
14,684
16,919
21,666
23,589
10
2,156
3,247
3,940
4,865
6,737
9,342
15,987
18,307
23,209
25,188
15
4,601
6,262
7,261
8,547
11,037
14,339
22,307
24,996
30,578
32,801
20
7,434
9,591
10,851
12,443
15,452
19,337
28,412
31,410
37,566
39,997
25
10,520
13,120
14,611
16,473
19,939
24,337
34,382
37,652
44,314
46,928
30
13,787
16,791
18,493
20,599
24,478
29,336
40,256
43,773
50,892
53,672
40
20,707
24,433
26,509
29,051
33,660
39,335
51,805
55,758
63,691
66,766
50
27,991
32,357
34,764
37,689
42,942
49,335
63,167
67,505
76,154
79,490
60
35,534
40,482
43,188
46,459
52,294
59,335
74,397
79,082
88,379
91,952
120
83,852
91,573
95,705
100,624
109,220
119,334
140,233
146,567
158,950
163,648
240
187,324
198,984
205,135
212,386
224,882
239,334
268,471
277,138
293,888
300,182
480
403,949
421,189
430,198
440,745
458,754
479,334
520,11
532,075
555,006
563,561
∞
850,891
876,028
889,081
904,291
930,093
959,333
1016,566
1033,193
1064,867
1076,621
132
4.10.3 Teste de Filliben
Este teste foi introduzido por Filliben em 1975 para testar (verificar) a hipótese
H0 de normalidade, tendo sido adaptada para outras distribuições. Isto significa que o
teste verificará se uma determinada amostra y1, y2, y3, ..., yN, extraída de uma
população Y com distribuição de probabilidade F(y) também poderá ser representada
pela mesma distribuição.
Para isto, o teste de aderência estimará um coeficiente de correlação (r) entre
as observações yi e os quantis teóricos wi. Os valores de wi são obtidos pela inversa
da FCP, ou seja:
wi = Fy−1 (1 − qi)
(141)
Sendo Fy-1 a função inversa da distribuição F(y). Isto significa obter o valor da
variável hidrológica associada à freqüência observada q. Para a distribuição Normal, o
software Excel possui uma função conhecida como INV.NORM. Para as demais,
procede-se aplicando a estrutura da própria distribuição. A freqüência observada qi é
obtida pela seguinte equação:
qi =
i−a
N + 1− 2 ⋅ a
(142)
Sendo i a posição ocupada pelo valor na série amostrada, de preferência em
ordem crescente, N é o tamanho da amostra e a é um parâmetro a ser adotado de
acordo com a distribuição. Para a distribuição Normal e log-normal, a = 0,375; para
Weibull, a = 0; Gumbel, a = 0,44; GEV e outras, a = 0,40.
O coeficiente de correlação entre wi e yi é dado por:
N
rcalc =
i=1
N
i=1
(y
(y
i
i
)(
− y ⋅ wi − w
−y
)
2
⋅
N
i=1
(w
i
)
−w
)
2
(143)
Este valor deverá ser comparado a um valor crítico de r, considerando a
distribuição em questão. Se rcalc > rcr´tic, a amostra poderá ser representada pela
respectiva distribuição. Os valores de rcritic estão apresentados nas Tabelas 4.13, 4.14
e 4.15, respectivamente para as Distribuições Normal (log-normal), Gumbel (Weibull) e
GEV (adaptadas de Stedinger et al., 1993 por Naghettini & Pinto, 2007).
133
Tabela 4.13 Valores de rcritic para as Distribuições Normal e Log-Normal.
Tamanho da
Significância (α)
Amostra (N)
0,10
0,05
0,01
10
0,9347
0,9180
0,8804
15
0,9506
0,9383
0,9110
20
0,9600
0,9503
0,9290
30
0,9707
0,9639
0,9490
40
0,9767
0,9715
0,9597
50
0,9807
0,9764
0,9664
60
0,9835
0,9799
0,9710
75
0,9865
0,9835
0,9757
100
0,9893
0,9870
0,9812
Tabela 4.14 Valores de rcritic para as Distribuições Gumbel para máximos e Weibull.
Tamanho da
Significância (α)
Amostra (N)
0,10
0,05
0,01
10
0,9260
0,9084
0,8630
20
0,9517
0,9390
0,9060
30
0,9622
0,9526
0,9191
40
0,9689
0,9594
0,9286
50
0,9729
0,9646
0,9389
60
0,9760
0,9685
0,9467
70
0,9787
0,9720
0,9506
80
0,9804
0,9747
0,9525
100
0,9831
0,9779
0,9596
134
Tabela 4.15 Valores de rcritic para a Distribuição GEV.
Valores do Parâmetro σ
N
σ = -0,30
σ = -0,20
σ = -0,10
σ=0
σ = 0,10
σ = 0,20
5
0,777
0,791
0,805
0,817
0,823
0,825
10
0,836
0,845
0,856
0,866
0,876
0,882
20
0,839
0,855
0,878
0,903
0,923
0,932
30
0,834
0,858
0,890
0,920
0,942
0,953
50
0,825
0,859
0,902
0,939
0,961
0,970
100
0,815
0,866
0,920
0,959
0,978
0,985
Significância
(α)
0,01
0,05
5
0,853
0,863
0,869
0,874
0,877
0,880
10
0,881
0,890
0,900
0,909
0,916
0,920
20
0,898
0,912
0,926
0,938
0,948
0,953
30
0,903
0,920
0,937
0,952
0,961
0,967
50
0,908
0,929
0,950
0,965
0,974
0,979
100
0,914
0,940
0,963
0,978
0,985
0,989
5
0,888
0,892
0,896
0,899
0,901
0,903
10
0,904
0,912
0,920
0,927
0,932
0,936
20
0,920
0,932
0,943
0,952
0,958
0,962
30
0,928
0,941
0,953
0,962
0,969
0,973
50
0,935
0,950
0,963
0,973
0,979
0,982
100
0,944
0,961
0,974
0,983
0,988
0,991
0,10
4.10.4 Teste de Anderson-Darling
Este teste tem grande aplicabilidade em situações nas quais os dados
apresentam assimetria nas suas distribuições de freqüência, ou seja, séries históricas
caracterizadas por valores extremos, tanto no contexto de mínimos quanto de
máximos. Os demais testes analisam e comparam as freqüências observadas às
teóricas e normalmente verificam distorção significativa apenas em freqüências
intermediárias e não analisam de forma mais específica, os dados extremos (caudais).
Assim, distribuições do tipo Gumbel, log-normal, Weibull, GEV e log-Gumbel, dentre
outras, devem ser testadas por este teste sempre que possível.
Além desta aplicação, segundo Sharda et al. (2008) e D’Agostino & Stephens
(1986), este teste pode ser aplicado para analisar a “bondade do ajuste”, ou seja, a
precisão do mesmo quando se deseja comparar duas ou mais distribuições. A
estatística deste teste é a seguinte:
AD 2 = −N −
1
⋅
N
N
i=1
[(2 ⋅ i − 1)(ln(Pi ) + ln(1 − Pi ))]
(144)
135
Em que N é o tamanho da amostra, i é a posição de cada um dos dados na
série histórica posicionada em ordem crescente e Pi é o corresponde à probabilidade
calculada pela respectiva distribuição. O valor de AD2 deve ser comparado a um valor
crítico p, considerando um nível de significância α. Se AD2 > p (α), rejeita-se a
hipótese Ho de que a distribuição se ajusta de forma adequada aos dados de
freqüência. Na Tabela 4.16 estão apresentados os valores da estatística p (α) do teste
para as distribuições log-normal (normal), Weibull ou Gumbel, de acordo com
D’Agostino & Stephens (1986) e Naghettini & Pinto (2007).
Tabela 4.16 Valores críticos de p (α) para as distribuições log-normal (ou normal) e
Weibull e Gumbel.
Dsitribuição
α
p (α)
0,10
0,631
0,05
0,752
0,025
0,873
0,01
1,035
0,10
0,637
Weibull ou Gumbel para
0,05
0,757
máximos
0,025
0,877
0,01
1,038
Normal ou log-normal
Correção de A2
1+
0,75 2,25
+ 2
N
N
1+
0,2
N
Adaptado de D”Agostino & Stephens (1986) e Naghettini & Pinto (2007).
Exemplo de Aplicação 4.16
Verificar pelos testes de adequação de Kolmogorov-Smirnov, Qui-quadrado,
Filliben e Anderson-Darling a aplicação da Distribuição Normal à série histórica de
precipitação total anual do Exemplo de Aplicação 4.3.
136
a) Kolmogorov-Smirnov (Ao nível de significância de 5% de probabilidade)
Prec. (mm)
z
fteórica
fcalc.
747,1
-2,25
0,0122
0,0132
∆f
0,00094
Prec. (mm)
z
1427,3
fteórica
fcalc.
0,4522
0,5132
∆f
832,4
-1,98
0,0239
0,0263
0,00247
1428,1
-0,12
0,4522
0,5132
0,0609
999,2
-1,46
0,0721
0,0395
0,03267
1430,0
-0,11
0,4562
0,5263
0,0701
1001,3
-1,46
0,0721
0,0526
0,01951
1443,4
-0,07
0,4721
0,5395
0,0674
1068,1
-1,25
0,1056
0,0658
0,03985
1445,8
-0,06
0,4761
0,5526
0,0766
1093,5
-1,17
0,121
0,0789
0,04205
1448,8
-0,05
0,4801
0,5658
0,0857
1109,9
-1,12
0,1314
0,0921
0,03924
1450,3
-0,05
0,4801
0,5790
0,0989
1170,6
-0,93
0,1761
0,1053
0,07087
1453,4
-0,04
0,4840
0,5921
0,1081
1171,3
-0,92
0,1788
0,1184
0,06036
1479,5
0,04
0,5160
0,6053
0,0893
1183,2
-0,89
0,1867
0,1316
0,05515
1496,3
0,09
0,5359
0,6184
0,0826
1184,9
-0,88
0,1894
0,1447
0,04468
1555,8
0,28
0,6103
0,6316
0,0213
1187,7
-0,87
0,1922
0,1579
0,03426
1567,4
0,32
0,6255
0,6447
0,0192
1196,6
-0,84
0,2005
0,1711
0,0294
1584,3
0,37
0,6443
0,6579
0,0136
1204,7
-0,82
0,2061
0,1842
0,02189
1585,1
0,37
0,6443
0,6711
0,0268
1216,1
-0,78
0,2177
0,1974
0,020032
1589,1
0,39
0,6517
0,6842
0,0325
1216,2
-0,78
0,2177
0,2105
0,00716
1590,0
0,39
0,6517
0,6974
0,0456
1217,8
-0,78
0,2177
0,2237
0,00599
1634,1
0,53
0,7019
0,7105
0,0086
1246
-0,69
0,2451
0,2368
0,00825
1634,1
0,53
0,7019
0,7237
0,0217
1263,5
-0,63
0,2643
0,25
0,01434
1665,3
0,62
0,7324
0,7368
0,0045
1266,7
-0,62
0,2676
0,2632
0,00446
1673,2
0,65
0,7422
0,75
0,0079
1268,6
-0,62
0,2676
0,2763
0,0087
1683,5
0,68
0,7517
0,7632
0,0114
1282,5
-0,57
0,2843
0,2895
0,00514
1686,6
0,69
0,7549
0,7763
0,0214
1288,8
-0,56
0,2877
0,3026
0,0149
1689,4
0,70
0,7580
0,7895
0,0314
1301,2
-0,52
0,3015
0,3158
0,01426
1696
0,72
0,7642
0,8026
0,0384
1313
-0,48
0,3156
0,3289
0,01334
1705,5
0,75
0,7734
0,8158
0,0424
1319,8
-0,46
0,3228
0,3421
0,01936
1719,1
0,79
0,7852
0,8289
0,0437
1326,6
-0,44
0,3299
0,3553
0,0253
1726,6
0,82
0,7939
0,8421
0,0482
1352,8
-0,35
0,3632
0,3684
0,00526
1728,5
0,82
0,7939
0,8553
0,0614
1353,7
-0,35
0,3632
0,3816
0,01842
1794,0
1,03
0,8485
0,8684
0,0199
1354,7
-0,35
0,3632
0,3947
0,03158
1816,6
1,10
0,8643
0,8816
0,0173
1355,7
-0,35
0,3632
0,4079
0,04473
1820,3
1,11
0,8665
0,8947
0,0282
1374,4
-0,29
0,3859
0,4211
0,03515
1832,7
1,15
0,8749
0,9079
0,0329
1377,9
-0,28
0,3897
0,4342
0,04448
1933,2
1,46
0,9279
0,9210
0,0068
1380,4
-0,27
0,3936
0,4474
0,05379
1938,0
1,48
0,9306
0,9342
0,0037
1393,6
-0,23
0,4090
0,4605
0,05149
1951,8
1,52
0,9357
0,9474
0,0116
1398,7
-0,21
0,4168
0,4737
0,05685
2042,2
1,81
0,9649
0,9605
0,0043
1413,1
-0,17
0,4325
0,4868
0,05434
2130,7
2,08
0,9812
0,9737
0,0076
1427,3
-0,12
0,4522
0,5
0,04776
2485,6
3,19
0,9993
0,9868
0,0124
∆fcalc. máximo = 0,1081
Da tabela de valores da estatística do teste de Kolmogorov-Smirnov (Tabela
4.11), tem-se que ∆f(75,5%) = 0,155.
137
Conclusão: Como o valor calculado máximo é menor que o tabelado, conclui-se que a
Distribuição Normal foi adequada a esta série histórica de precipitação total anual.
b) Qui-quadrado (Ao nível de significância de 5% de probabilidade)
Observar procedimento estatístico desenvolvido no Exemplo de Aplicação 4.3,
para separação por classes de freqüência.
Classes
Fobs
z
LI
LS
Fteórica
λ
2
622,9
1119,7
7
-2,64
-1,08
10,11
0,959
1119,7
1368,1
24
-1,08
-0,31
18,04
1,968
1368,1
1616,5
22
-0,31
0,47
22,64
0,018
1616,5
1864,9
16
0,47
1,25
15,97
0,0
1864,9
2610,1
6
1,25
3,58
7,92
0,463
75
3,408
Exemplo de cálculos para a 1º classe
Com a média e o desvio padrão dos dados determina-se o valor de z para os limites
superior e inferior:
−
x = 1458,6 mm
s = 298,2 mm
z=
622,9 − 1458,6
= −2,64
298,2
z=
1119,7 − 1458,6
= −1,08
298,2
Na tabela de z encontram-se as probabilidades de não excedência de 0,00413
e 0,13898 respectivamente, para os limites inferior e superior. Assim, a freqüência
teórica para esta classe será:
Fteórica = (0,13898 − 0,00413 ) * 75 = 10,11
O valor de λ2 para o intervalo de classe será dado por:
λ2 =
(7 − 10,11) 2
= 0,959
10,11
Após o cálculo dos valores de λ2 para as demais classes, estes devem ser
somados e comparados ao valor do λ2 tabelado. A distribuição será adequada se
λ2calculado ≤ λ2tabelado. Os graus de liberdade deste exemplo estarão entre 4 (5 classes –
1) e 2 (5 classes – 2 parâmetros – 1), adotando-se 3.
138
No exemplo, λ2calculado = 3,41 e λ2tab(0,05;
3)
= 7,815. Portanto, a Distribuição Normal é
adequada a esta série histórica de precipitação total anual.
c) Teste de Filliben
O valor de qi, considerando-se N = 75 e a = 0,375, para i =1 produz valor de
0,008197, substituindo i =1 na equação 142. A inversa da Distribuição Normal, obtida
pela função INV.NORM do Excel, retorna um valor de 738,14 mm para esta
freqüência. Procede-se desta forma para os demais valores de precipitação ordenados
em ordem crescente.
O cálculo do coeficiente de correlação (equação 143) produz um valor de r
igual a 0,975. Consultando a Tabela de valores para rcrítico da DN, para nível de
significância de 0,05 e N = 75, obtém-se valor de 0,984. Como rcalc. < rcrítico, a amostra
não poderá ser representada pela Distribuição Normal.
d) Teste de Anderson-Darling
A estatística deste teste produziu AD2 igual a 0,874, o qual foi corrigido para
0,883 (os dados de posição e freqüência teórica estão apresentados na tabela do teste
de Kolmogorov-Smirnov). Adotando-se p (0,05), na Tabela 4.16, encontra-se valor de
0,752. Portanto, como AD2 é maior que p (0,05), rejeita-se a hipótese Ho de que a
série histórica pode ser representada pela Distribuição Normal.
Exemplo de Aplicação 4.17
Aplicar os testes de Kolmogorov-Smirnov, Qui-quadrado e Anderson-Darling
para verificação da adequação da distribuição Gumbel à série histórica de precipitação
máxima diária anual do Exemplo de Aplicação 4.4.
139
a) Kolmogorov-Smirnov (Ao nível de significância de 5% de probabilidade)
Precipitação (mm)
z (kTR)
fteórica
fcalculado
∆f
46,2
-1,55
0,016622
0,058824
0,042368
50,0
-1,26
0,059317
0,117647
0,059405
50,4
-1,23
0,065988
0,176471
0,111588
57,0
-0,74
0,234492
0,235294
0,0007
58,7
-0,61
0,292971
0,294118
0,000324
60,2
-0,49
0,349022
0,352941
0,00626
61,6
-0,39
0,396151
0,411765
0,015274
63,4
-0,25
0,461246
0,470588
0,010892
64,2
-0,19
0,488444
0,529412
0,042309
66,9
0,01
0,574377
0,588235
0,01351
78,2
0,86
0,829884
0,647059
0,183609
78,6
0,89
0,835743
0,705882
0,130658
78,7
0,90
0,837656
0,764706
0,073274
80
1,00
0,855703
0,823529
0,032148
85,5
1,42
0,913063
0,882353
0,030184
88,5
1,64
0,933702
0,941176
0,007346
∆fcalc. máximo = 0,184; ∆f(16,5%) = 0,328
Conclusão: Como o valor calculado é menor que o tabelado, conclui-se que a
distribuição de Gumbel foi adequada para esta série histórica de precipitação máxima
diária anual.
b) Qui-quadrado (Ao nível de significância de 5% de probabilidade)
Seguindo-se o mesmo raciocínio apresentado no exemplo anterior, tem-se:
K= 4,0 Classes
A = 42,3
Ac = 14,13
LIclasse 1 = 39,13
LIclasse 2 = 53,27
Reagrupando, tem-se:
Classe
Fobs
ktr
Ytr
LI
LS
LI
LS
P(x≤xi)
Fteór
λ
2
39,13
53,27
3
-2,09
-1,02
-2,10
-0,73 0,0003 0,1259
2,01
0,488
53,27
67,40
7
-1,02
0,05
-0,73
0,64
0,1259 0,5900
7,43
0,024
67,40
95,67
6
0,05
2,18
0,64
3,38
0,5900 0,9664
6,02
0,000
16
0,513
140
Os graus de liberdade, neste caso, estariam entre 0 e 2, portanto, 1. No
entanto, como o número de classes, definido de acordo com os critérios estatísticos é
pequeno, pode-se considerar o grau de liberdade igual a 2.
λ2calculado = 0,513
λ2tab(0,05;2) = 5,991
Conclusão: Como o valor calculado é menor que o tabelado, conclui-se, com ressalva
devido ao baixo valor dos graus de liberdade, que a distribuição de Gumbel foi
adequada à série histórica de precipitação máxima diária anual apresenta.
c) Anderson-Darling
De acordo com os dados da tabela aplicada ao teste de Kolmogorov-Smirnov,
foi calculado um valor de AD2 igual a 0,500 que corrigido pela respectiva equação
(Tabela 4.16), é igual a 0,525. Considerando p (0,05), o valor crítico da estatística é
0,757. Como AD2 é menor que p (0,05), aceita-se a hipótese Ho de que a série
histórica possa ser representada pela distribuição Gumbel.
Exemplo de Aplicação 4.18
Aplicar os testes de Kolmogorov-Smirnov e Qui-quadrado para verificação da
adequação de cada uma das distribuições de probabilidades aplicadas à série
histórica de precipitação decendial do Exemplo de Aplicação 4.5, acrescidas das
distribuições Normal, Gumbel e Gama.
141
Distribuição Log-normal a 2 parâmetros
a) Kolmogorov-Smirnov (Ao nível de significância de 5% de probabilidade)
Precipitação (mm)
z
fteórico
fcalculado
∆f
8,4
-2,48
0,00656
0,045455
0,038895
17,6
-1,66
0,04845
0,090909
0,042459
25,5
-1,25
0,10564
0,136364
0,030724
29,2
-1,09
0,13785
0,181818
0,043968
42,2
-0,69
0,24509
0,227273
0,017817
52,4
-0,44
0,32996
0,272727
0,057233
53,5
-0,42
0,33724
0,318182
0,019058
69,9
-0,12
0,45224
0,363636
0,088604
78,5
0,01
0,50398
0,409091
0,094889
84,8
0,09
0,53585
0,454545
0,081305
95,9
0,23
0,59095
0,5
0,09095
97,8
0,25
0,5987
0,545455
0,053245
111,7
0,40
0,65542
0,590909
0,064511
135,3
0,61
0,72906
0,636364
0,092696
140,3
0,65
0,74215
0,681818
0,060332
141,2
0,66
0,74537
0,727273
0,018097
144,8
0,69
0,7549
0,772727
0,017827
162,8
0,82
0,79389
0,818182
0,024292
189,9
0,99
0,83891
0,863636
0,024726
253,2
1,31
0,9049
0,909091
0,004191
290
1,46
0,92785
0,954545
0,026695
∆fcalc. máximo = 0,095; ∆f( 20,5%) ≈ 0,294
Conclusão: Como o valor calculado é menor que o tabelado, conclui-se que a
distribuição Log-normal a 2 parâmetros foi adequada a esta série histórica de dados
de precipitação decendial do mês de janeiro.
b) Qui-quadrado (Ao nível de significância de 5% de probabilidade)
Classe
1
Fobs
kTR
LI
LS
λ
0,1
94
10
-4,0
2
0,21
12,23
0,407
94
187,9
8
0,21
0,98
5,33
1,338
187,9
375,7
3
0,98
1,75
2,60
0,062
21
1
2
Fcalc
1,886
2
Este valor foi adotado para permitir aplicação da distribuição log-normal; Adotado devido ao fato de que
para z < que -4, a probabilidade é praticamente zero, sendo o limite inferior da tabela de z.
142
λ2calculado = 1,886; λ2tab(0,05,2) = 5,991.
Conclusão: Como o valor calculado é menor que o tabelado, conclui-se que a
distribuição Log-normal a 2 parâmetros foi adequada a esta série histórica de
precipitação decendial do mês de janeiro apresentada.
Distribuição Log-normal a 3 parâmetros.
a) Kolmogorov-Smirnov (Ao nível de significância de 5% de probabilidade)
Precipitação (mm)
z
fteórico
fcalculado
∆f
8,4
-1,56
0,05938
0,045455
0,013925
17,6
-1,36
0,08691
0,090909
0,003999
25,5
-1,19
0,11702
0,136364
0,019344
29,2
-1,11
0,15624
0,181818
0,025578
42,2
-0,86
0,19489
0,227273
0,032383
52,4
-0,68
0,24825
0,272727
0,024477
53,5
-0,66
0,25462
0,318182
0,063562
69,9
-0,38
0,35197
0,363636
0,011666
78,5
-0,24
0,40516
0,409091
0,003931
84,8
-0,15
0,44038
0,454545
0,014165
95,9
0,01
0,50398
0,5
0,00398
97,8
0,04
0,51595
0,545455
0,029505
111,7
0,23
0,59095
0,590909
4,1E-05
135,3
0,53
0,70194
0,636364
0,065576
140,3
0,59
0,7224
0,681818
0,040582
141,2
0,60
0,72574
0,727273
0,001533
144,8
0,64
0,73891
0,772727
0,033817
162,8
0,85
0,80233
0,818182
0,015852
189,9
1,13
0,87076
0,863636
0,007124
253,2
1,72
0,95728
0,909091
0,048189
290
2,01
0,97778
0,954545
0,023235
∆fcalc. máximo = 0,066; ∆f(16,5%) ≈ 0,294
Conclusão: Como o valor calculado é menor que o tabelado, conclui-se que a
distribuição Log-normal a 3 parâmetros foi adequada a esta série histórica de
precipitação decendial.
143
b) Qui-quadrado (ao nível de significância de 5% de probabilidade)
Classe
Fobs
0,1
94
kTR
LI
LS
10
-1,76
-0,01
2
Fcalc
λ
9,59
0,018
94
187,9
8
-0,01
1,11
7,78
0,006
187,9
375,7
3
1,11
2,61
2,71
0,031
21
0,055
λ2calculado = 0,055; λ2tab(0,05,2) = 5,991
Conclusão: Como o valor calculado é menor que o tabelado, conclui-se que a
distribuição Log-normal a 3 parâmetros foi adequada à série histórica de precipitação
decendial do mês de janeiro apresentada.
Distribuição Normal
a) Kolmogorov-Smirnov (Ao nível de significância de 5% de probabilidade)
Precipitação (mm)
z
fteórico
fcalculado
∆f
8,4
-1,30
0,0968
0,045455
0,051345
17,6
-1,18
0,119
0,090909
0,028091
25,5
-1,07
0,1423
0,136364
0,005936
29,2
-1,02
0,15386
0,181818
0,027958
42,2
-0,85
0,19766
0,227273
0,029613
52,4
-0,71
0,23885
0,272727
0,033877
53,5
-0,70
0,24196
0,318182
0,076222
69,9
-0,48
0,31561
0,363636
0,048026
78,5
-0,37
0,35569
0,409091
0,053401
84,8
-0,28
0,38973
0,454545
0,064815
95,9
-0,13
0,44828
0,5
0,05172
97,8
-0,11
0,4562
0,545455
0,089255
111,7
0,08
0,53188
0,590909
0,059029
135,3
0,39
0,65173
0,636364
0,015366
140,3
0,46
0,67724
0,681818
0,004578
141,2
0,47
0,68082
0,727273
0,046453
144,8
0,52
0,69846
0,772727
0,074267
162,8
0,76
0,77637
0,818182
0,041812
189,9
1,12
0,86864
0,863636
0,005004
253,2
1,96
0,975
0,909091
0,065909
290
2,45
0,99285
0,954545
0,038305
∆fcalc. máximo = 0,089255; ∆f(16,5%) ≈ 0,294
Conclusão: Como o valor calculado é menor que o tabelado, conclui-se que a
distribuição normal foi adequada a esta série histórica de precipitação decendial.
144
b) Qui-quadrado (ao nível de significância de 5% de probabilidade)
Classe
kTR
Fobs
0,1
94
LI
LS
10
-1,41
-0,16
2
Fcalc
λ
7,50
0,833
94
187,9
8
-0,16
1,09
8,94
0,099
187,9
375,7
3
1,09
3,59
2,89
0,004
21
0,936
λ2calculado = 0,936; λ2tab(0,05,2) = 5,991
Conclusão: Como o valor calculado é menor que o tabelado, conclui-se que a
distribuição normal foi adequada para a série histórica de precipitação decendial do
mês de janeiro apresentada.
Distribuição Gumbel
a) Kolmogorov-Smirnov (Ao nível de significância de 5% de probabilidade)
Precipitação (mm)
fteórico
fcalculado
∆f
8,4
0,05123
0,045455
0,005775
17,6
0,078914
0,090909
0,011995
25,5
0,108729
0,136364
0,027635
29,2
0,124553
0,181818
0,057265
42,2
0,188568
0,227273
0,038705
52,4
0,246205
0,272727
0,026522
53,5
0,252712
0,318182
0,06547
69,9
0,353631
0,363636
0,010005
78,5
0,407583
0,409091
0,001508
84,8
0,446659
0,454545
0,007886
95,9
0,513357
0,5
0,013357
97,8
0,524403
0,545455
0,021052
111,7
0,60104
0,590909
0,010131
135,3
0,711614
0,636364
0,07525
140,3
0,731708
0,681818
0,04989
141,2
0,735203
0,727273
0,00793
144,8
0,748813
0,772727
0,023914
162,8
0,808388
0,818182
0,009794
189,9
0,874674
0,863636
0,011038
253,2
0,95559
0,909091
0,046499
290
0,976061
0,954545
0,021516
∆fcalc. máximo = 0,07525; ∆f(16,5%) ≈ 0,294
Conclusão: Como o valor calculado é menor que o tabelado, conclui-se que a
distribuição Gumbel foi adequada a esta série histórica de precipitação decendial.
145
b) Qui-quadrado (Ao nível de significância de 5% de probabilidade)
Classe
0,1
P(X<xi)
Fobs
94
10
LI
LS
0,0325
0,5023
2
Fcalc
λ
9,87
0,0017
94
187,9
8
0,5023
0,8708
7,74
0,0087
187,9
375,7
3
0,8708
0,9944
2,60
0,0615
21
0,072
λ2calculado = 0,072; λ2tab(0,05,2) = 5,991
Conclusão: Como o valor calculado é menor que o tabelado, conclui-se que a
distribuição Gumbel foi adequada para a série histórica de precipitação decendial do
mês de janeiro apresentada.
Distribuição Gama
a) Kolmogorov-Smirnov (Ao nível de significância de 5% de probabilidade)
Precipitação (mm)
fteórico
fcalculado
∆f
8,4
0,00258
0,045455
0,042875
17,6
0,035235
0,090909
0,055674
25,5
0,075316
0,136364
0,061047
29,2
0,096836
0,181818
0,084982
42,2
0,179912
0,227273
0,047361
52,4
0,249833
0,272727
0,022894
53,5
0,25746
0,318182
0,060722
69,9
0,368768
0,363636
0,005131
78,5
0,424579
0,409091
0,015488
84,8
0,463693
0,454545
0,009147
95,9
0,528364
0,5
0,028364
97,8
0,538869
0,545455
0,006585
111,7
0,610467
0,590909
0,019558
135,3
0,711435
0,636364
0,075071
140,3
0,729602
0,681818
0,047784
141,2
0,73276
0,727273
0,005487
144,8
0,745065
0,772727
0,027663
162,8
0,799275
0,818182
0,018907
189,9
0,860971
0,863636
0,002666
253,2
0,944314
0,909091
0,035223
290
0,966266
0,954545
0,011721
∆fcalc. máximo = 0,0849; ∆f(16,5%) ≈ 0,294
Conclusão: Como o valor calculado é menor que o tabelado, conclui-se que a
distribuição Gama foi adequada a esta série histórica de precipitação decendial.
146
b) Qui-quadrado (Ao nível de significância de 5% de probabilidade)
Classe
0,1
Fobs
94
10
P(X<xi)
LI
LS
0,0
0,5225
2
Fcalc
λ
10,97
0,086
94
187,9
8
0,5225
0,8635
7,16
0,099
187,9
375,7
3
0,8635
0,9926
2,71
0,031
21
0,216
λ2calculado = 0,216; λ2tab(0,05,2) = 5,991
Conclusão: Pode-se observar que todas as distribuições de probabilidades testadas,
podem ser aplicadas à série histórica apresentada. Isto é importante, uma vez que na
aplicação da distribuição de probabilidades a um conjunto de dados quaisquer (não
necessariamente precipitação) de natureza desconhecida, deve-se testar as
distribuições e verificar qual possui o melhor ajuste, que pode ser analisado com base
nos valores de Qui-quadrado. Neste caso, em específico, o melhor ajuste foi obtido
pela distribuição log-normal 3 P, seguida da Distribuição Gumbel, pois seus valores de
Qui-quadrado calculados foram menores que os obtidos pelas outras distribuições.
Exemplo de Aplicação 4.19
Aplicar os testes de Kolmogorov-Smirnov, Qui-quadrado e Filliben para
verificação da adequação das distribuições Weibull, Gumbel e GEV para mínimos
aplicadas ao estudo de freqüência da série histórica de vazões mínimas com 7 dias
consecutivos (Exemplo de Aplicação 4.6).
147
Distribuição Weibull
a) Kolmogorov-Smirnov (Ao nível de significância de 5% de probabilidade)
Ordem
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
Vazão
8.97
10.41
11.32
11.50
13.10
13.15
13.57
14.46
14.95
14.95
15.66
16.04
16.06
16.18
16.20
16.32
16.39
17.00
17.02
17.04
17.04
17.48
17.57
17.66
17.72
17.88
18.09
18.77
18.79
18.79
18.80
19.04
19.41
19.48
Fobs.
0.01449
0.02899
0.04348
0.05797
0.07246
0.08696
0.10145
0.11594
0.13043
0.14493
0.15942
0.17391
0.18841
0.20290
0.21739
0.23188
0.24638
0.26087
0.27536
0.28986
0.30435
0.31884
0.33333
0.34783
0.36232
0.37681
0.39130
0.40580
0.42029
0.43478
0.44928
0.46377
0.47826
0.49275
Festim.
0.021255
0.03986
0.056575
0.060377
0.103095
0.104699
0.11891
0.153046
0.17423
0.17436
0.208418
0.228177
0.229246
0.235722
0.236811
0.243288
0.247301
0.282503
0.283876
0.285254
0.285254
0.312235
0.317937
0.323687
0.327547
0.338127
0.351907
0.398175
0.399272
0.399771
0.400269
0.417267
0.443878
0.448615
Ordem Vazão
Delta F
0.006763
35
19.49
0.010874
36
19.53
0.013097
37
19.67
0.002406
38
19.87
0.030631
39
19.89
0.017742
40
19.98
0.017461
41
20.11
0.037104
42
20.21
0.043796
43
20.39
0.029432
44
20.83
0.048998
45
21.08
0.054264
46
21.61
0.040841
47
22.11
0.032823
48
22.16
0.01942
49
22.40
0.011404
50
22.41
0.000924
51
22.72
0.021633
52
22.84
0.008514
53
23.19
0.004601
54
23.79
0.019094
55
24.76
0.006606
56
24.78
0.015396
57
25.16
0.024139
58
25.24
0.034772
59
25.41
0.038684
60
25.72
0.039397
61
26.60
0.007622
62
26.62
0.021018
63
26.96
0.035012
64
27.90
0.049006
65
29.24
0.046501
66
30.30
0.034383
67
32.50
0.044139
68
38.25
Fobs.
Festim.
Delta F
0.50725
0.52174
0.53623
0.55072
0.56522
0.57971
0.59420
0.60870
0.62319
0.63768
0.65217
0.66667
0.68116
0.69565
0.71014
0.72464
0.73913
0.75362
0.76812
0.78261
0.79710
0.81159
0.82609
0.84058
0.85507
0.86957
0.88406
0.89855
0.91304
0.92754
0.94203
0.95652
0.97101
0.98551
0.449543
0.452106
0.462479
0.476845
0.478307
0.484789
0.494641
0.501782
0.515041
0.547724
0.566047
0.604493
0.64057
0.64423
0.661379
0.66238
0.683783
0.691787
0.714979
0.753934
0.810447
0.811692
0.831429
0.835776
0.844275
0.858774
0.895732
0.896598
0.90871
0.937555
0.966363
0.980734
0.995158
0.999978
0.057703
0.069633
0.073753
0.073879
0.08691
0.094921
0.099562
0.106913
0.108147
0.089957
0.086126
0.062173
0.040589
0.051422
0.048766
0.062258
0.055348
0.061836
0.053137
0.028675
0.013346
9.75E-05
0.005342
0.004804
0.010797
0.010791
0.011674
0.001953
0.004334
0.010019
0.024334
0.024212
0.024143
0.014471
∆fcalc. máximo = 0,1081; ∆f( 68,5%) ≈ 0,160
Conclusão: Como o valor calculado é menor que o tabelado, conclui-se que a
distribuição Weibull foi adequada a esta série histórica de vazões mínimas com 7 dias
consecutivos.
148
b) Qui-quadrado (Ao nível de significância de 5% de probabilidade)
Classes
Fobs.
Prob (X<xi)
Fteo.
λ
2
6,87
15,27
10
0,00683
0,1892
12,40
0,465
15,27
19,47
23
0,1892
0,4479
17,59
1,664
19,47
23,67
20
0,4479
0,7462
20,28
0,004
23,67
27,87
10
0,7462
0,9368
12,96
0,676
27,87
40,47
5
0,9368
1,0
4,30
0,114
68
2,92
λ2calculado = 2,92; λ2tab(0,05,3) = 7,815
Conclusão: Como o valor calculado é menor que o tabelado, conclui-se que a
distribuição Weibull foi adequada para a série histórica de vazão mínima de 7 dias
consecutivos apresentada.
c) Teste de Filliben
Ordem
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
qi
0.014493
0.028986
0.043478
0.057971
0.072464
0.086957
0.101449
0.115942
0.130435
0.144928
0.15942
0.173913
0.188406
0.202899
0.217391
0.231884
0.246377
0.26087
0.275362
0.289855
0.304348
0.318841
0.333333
0.347826
0.362319
0.376812
0.391304
0.405797
0.42029
Vazão
8.97
10.41
11.32
11.5
13.1
13.15
13.57
14.46
14.95
14.95
15.66
16.04
16.06
16.18
16.2
16.32
16.39
17
17.02
17.04
17.04
17.48
17.57
17.66
17.72
17.88
18.09
18.77
18.79
wi
8.20
9.65
10.63
11.39
12.02
12.56
13.05
13.49
13.89
14.26
14.61
14.94
15.25
15.55
15.84
16.11
16.37
16.63
16.88
17.12
17.35
17.58
17.81
18.03
18.25
18.46
18.67
18.88
19.08
xi - x
-11.0378
-9.59779
-8.68779
-8.50779
-6.90779
-6.85779
-6.43779
-5.54779
-5.05779
-5.05779
-4.34779
-3.96779
-3.94779
-3.82779
-3.80779
-3.68779
-3.61779
-3.00779
-2.98779
-2.96779
-2.96779
-2.52779
-2.43779
-2.34779
-2.28779
-2.12779
-1.91779
-1.23779
-1.21779
wi - w
-11.82
-10.36
-9.39
-8.63
-8.00
-7.45
-6.97
-6.53
-6.13
-5.75
-5.41
-5.08
-4.76
-4.47
-4.18
-3.91
-3.64
-3.39
-3.14
-2.90
-2.66
-2.43
-2.21
-1.99
-1.77
-1.56
-1.35
-1.14
-0.93
Produto
130.4682
99.46987
81.55183
73.40884
55.24821
51.10832
44.86023
36.22712
30.99329
29.10611
23.50193
20.14158
18.80739
17.09629
15.92156
14.40927
13.17946
10.18794
9.378685
8.599425
7.900855
6.148125
5.380331
4.663208
4.047631
3.310196
2.579858
1.407941
1.135082
(xi - x )
121.832899
92.1176519
75.4777666
72.3825607
47.7176196
47.0293402
41.4451931
30.7780196
25.5812813
25.5812813
18.9033137
15.7433902
15.5850784
14.6520078
14.499296
13.5998255
13.0884343
9.04682545
8.92691369
8.80780192
8.80780192
6.3897431
5.94284016
5.51213722
5.23400192
4.52750781
3.67793428
1.53213428
1.48302251
2
(wi - w )
139.7155
107.4089
88.1147
74.4497
63.9672
55.5411
48.5567
42.6410
37.5503
33.1166
29.2192
25.7685
22.6959
19.9483
17.4833
15.2669
13.2711
11.4730
9.8533
8.3960
7.0873
5.9156
4.8711
3.9450
3.1302
2.4202
1.8096
1.2938
0.8688
2
149
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
0.434783
0.449275
0.463768
0.478261
0.492754
0.507246
0.521739
0.536232
0.550725
0.565217
0.57971
0.594203
0.608696
0.623188
0.637681
0.652174
0.666667
0.681159
0.695652
0.710145
0.724638
0.73913
0.753623
0.768116
0.782609
0.797101
0.811594
0.826087
0.84058
0.855072
0.869565
0.884058
0.898551
0.913043
0.927536
0.942029
0.956522
0.971014
0.985507
Média
18.79
18.8
19.04
19.41
19.48
19.49
19.53
19.67
19.87
19.89
19.98
20.11
20.21
20.39
20.83
21.08
21.61
22.11
22.16
22.4
22.41
22.72
22.84
23.19
23.79
24.76
24.78
25.16
25.24
25.41
25.72
26.6
26.62
26.96
27.9
29.24
30.3
32.5
38.25
20.00779
19.29
19.49
19.69
19.89
20.09
20.28
20.48
20.68
20.87
21.07
21.27
21.46
21.66
21.86
22.07
22.27
22.48
22.68
22.90
23.11
23.33
23.56
23.79
24.02
24.27
24.52
24.78
25.05
25.34
25.64
25.96
26.30
26.67
27.08
27.54
28.07
28.71
29.54
30.80
20.01639
-1.21779
-1.20779
-0.96779
-0.59779
-0.52779
-0.51779
-0.47779
-0.33779
-0.13779
-0.11779
-0.02779
0.102206
0.202206
0.382206
0.822206
1.072206
1.602206
2.102206
2.152206
2.392206
2.402206
2.712206
2.832206
3.182206
3.782206
4.752206
4.772206
5.152206
5.232206
5.402206
5.712206
6.592206
6.612206
6.952206
7.892206
9.232206
10.29221
12.49221
18.24221
-0.73
-0.53
-0.33
-0.13
0.07
0.27
0.46
0.66
0.86
1.05
1.25
1.45
1.65
1.85
2.05
2.25
2.46
2.67
2.88
3.10
3.32
3.54
3.77
4.01
4.25
4.50
4.76
5.04
5.32
5.62
5.94
6.29
6.66
7.07
7.53
8.06
8.69
9.52
10.78
0.887498
0.636814
0.3167
0.076795
-0.03659
-0.13794
-0.22121
-0.22272
-0.11791
-0.12396
-0.03473
0.147934
0.332916
0.705852
1.684543
2.415491
3.940121
5.60927
6.19949
7.407242
7.966775
9.604542
10.68153
12.75395
16.07999
21.40061
22.7379
25.95231
27.84939
30.38101
33.95177
41.44302
44.02742
49.13555
59.40224
74.37843
89.48318
118.9393
196.6504
1742.524
1.48302251
1.45876663
0.93662545
0.35735781
0.27856663
0.26811075
0.22828722
0.11410487
0.01898722
0.01387545
0.00077251
0.01044604
0.04088722
0.14608134
0.67602251
1.14962545
2.56706369
4.41926957
4.63199016
5.72264898
5.7705931
7.35606075
8.02139016
10.1264343
14.3050813
22.5834607
22.773949
26.5452255
27.3759784
29.1838284
32.629296
43.4571784
43.7212666
48.3331666
62.2869137
85.2336255
105.929502
156.055208
332.778075
1864.89237
0.5311
0.2780
0.1071
0.0165
0.0048
0.0710
0.2143
0.4347
0.7322
1.1074
1.5612
2.0950
2.7107
3.4106
4.1976
5.0752
6.0476
7.1197
8.2974
9.5877
10.9988
12.5403
14.2238
16.0632
18.0751
20.2797
22.7019
25.3726
28.3310
31.6273
35.3278
39.5222
44.3357
49.9513
56.6512
64.9057
75.5903
90.6510
116.2078
1722.7355
Com base nos dados da Tabela acima, obteve-se um coeficiente de correlação
calculado igual a 0,972 e o valor crítico deste coeficiente é de 0,969, a 5% de
significância. Sendo assim, como rcalc. > rcrítico, aceita-se a hipótese H0 de que a
amostra pode ser representada pela distribuição Weibull. Na Figura 4.8 é possível
observar a precisão do ajuste como reflexo do teste de Filliben.
150
Figura 4.8 Ajuste da distribuição Weibull pelo teste de Filliben.
151
Distribuição Gumbel
a) Kolmogorov-Smirnov (Ao nível de significância de 5% de probabilidade)
Ordem
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
Vazão
8.97
10.41
11.32
11.50
13.10
13.15
13.57
14.46
14.95
14.95
15.66
16.04
16.06
16.18
16.20
16.32
16.39
17.00
17.02
17.04
17.04
17.48
17.57
17.66
17.72
17.88
18.09
18.77
18.79
18.79
18.80
19.04
19.41
19.48
Fobs.
0.014493
0.028986
0.043478
0.057971
0.072464
0.086957
0.101449
0.115942
0.130435
0.144928
0.15942
0.173913
0.188406
0.202899
0.217391
0.231884
0.246377
0.26087
0.275362
0.289855
0.304348
0.318841
0.333333
0.347826
0.362319
0.376812
0.391304
0.405797
0.42029
0.434783
0.449275
0.463768
0.478261
0.492754
Festim.
0.03765
0.053008
0.065693
0.068506
0.099412
0.100565
0.110791
0.135615
0.15131
0.151406
0.177252
0.192643
0.193484
0.198602
0.199466
0.204627
0.207842
0.236661
0.237809
0.238961
0.238961
0.261911
0.266852
0.271869
0.275256
0.284618
0.296988
0.340029
0.341078
0.341555
0.342033
0.358491
0.384933
0.389729
Delta F
0.023157
0.024022
0.022215
0.010535
0.026948
0.013608
0.009342
0.019673
0.020875
0.006479
0.017832
0.01873
0.005079
0.004296
0.017925
0.027257
0.038535
0.024208
0.037553
0.050894
0.065386
0.05693
0.066481
0.075957
0.087063
0.092193
0.094317
0.065768
0.079212
0.093227
0.107242
0.105277
0.093328
0.103025
Ordem
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
Vazão
19.49
19.53
19.67
19.87
19.89
19.98
20.11
20.21
20.39
20.83
21.08
21.61
22.11
22.16
22.40
22.41
22.72
22.84
23.19
23.79
24.76
24.78
25.16
25.24
25.41
25.72
26.60
26.62
26.96
27.90
29.24
30.30
32.50
38.25
Fobs.
0.507246
0.521739
0.536232
0.550725
0.565217
0.57971
0.594203
0.608696
0.623188
0.637681
0.652174
0.666667
0.681159
0.695652
0.710145
0.724638
0.73913
0.753623
0.768116
0.782609
0.797101
0.811594
0.826087
0.84058
0.855072
0.869565
0.884058
0.898551
0.913043
0.927536
0.942029
0.956522
0.971014
0.985507
Festim.
0.390671
0.393281
0.403919
0.418869
0.420404
0.427244
0.43774
0.445423
0.459857
0.496382
0.517448
0.563019
0.607427
0.612018
0.633728
0.635006
0.662568
0.672994
0.703522
0.755651
0.831813
0.833476
0.859617
0.865303
0.876318
0.894737
0.938477
0.939425
0.952225
0.978176
0.995015
0.998946
0.999992
1
Delta F
0.116575
0.128459
0.132313
0.131856
0.144813
0.152466
0.156463
0.163272
0.163331
0.141299
0.134726
0.103648
0.073733
0.083634
0.076417
0.089632
0.076562
0.08063
0.064594
0.026958
0.034712
0.021881
0.03353
0.024723
0.021245
0.025172
0.054419
0.040875
0.039182
0.05064
0.052986
0.042424
0.028977
0.014493
∆fcalc. máximo = 0,1633; ∆f( 68,5%) ≈ 0,160
Conclusão: Como o valor calculado é maior que o tabelado, conclui-se que a
distribuição Gumbel não foi adequada a esta série histórica de vazões mínimas com 7
dias consecutivos.
152
b) Qui-quadrado (Ao nível de significância de 5% de probabilidade)
Classes
Fobs.
Prob (X<xi)
Fteo.
λ
2
6,87
15,27
10
0,0228
0,1625
9,51
0,026
15,27
19,47
23
0,1625
0,3889
15,39
3,763
19,47
23,67
20
0,3889
0,7451
24,23
0,739
23,67
27,87
10
0,7451
0,9775
15,80
2,129
27,87
40,47
5
0,9775
1,0
1,53
68
7,869
14,53
λ2calculado = 14,53; λ2tab(0,05,3) = 7,815
c) Teste de Filliben
Da mesma forma anterior, porém trabalhando com as equações de Gumbel
para mínimos para estimativa dos valores de wi, encontra-se rcalc igual a 0,930 contra
rcrítico de 0,983, a um nível de significância de 5% e considerando uma média de
valores de rcrítico presentes nas Tabelas para distribuição Normal e distribuição de
Gumbel/Weibull. Sendo assim, pelo teste de Filliben, a hipótese H0 pode ser rejeitada,
ou seja, a amostra não pode ser representada pela distribuição de Gumbel, resultado
prático semelhante ao teste de Qui-quadrado. Na Figura 4.9 é possível observar o
ajuste (rcalc x rcritic), o qual é visualmente inferior ao obtido pela distribuição Weibull.
Figura 4.9 Ajuste da distribuição Gumbel pelo teste de Filliben.
153
Distribuição GEV
a) Teste de Kolmogorov-Smirnov
Ordem
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
Vazão
8.97
10.41
11.32
11.5
13.1
13.15
13.57
14.46
14.95
14.95
15.66
16.04
16.06
16.18
16.2
16.32
16.39
17
17.02
17.04
17.04
17.48
17.57
17.66
17.72
17.88
18.09
18.77
18.79
18.79
18.8
19.04
19.41
19.48
Fobs.
0.0145
0.0290
0.0435
0.0580
0.0725
0.0870
0.1014
0.1159
0.1304
0.1449
0.1594
0.1739
0.1884
0.2029
0.2174
0.2319
0.2464
0.2609
0.2754
0.2899
0.3043
0.3188
0.3333
0.3478
0.3623
0.3768
0.3913
0.4058
0.4203
0.4348
0.4493
0.4638
0.4783
0.4928
Festim.
0.0338
0.0520
0.0674
0.0708
0.1081
0.1095
0.1216
0.1508
0.1690
0.1690
0.1981
0.2150
0.2159
0.2215
0.2225
0.2282
0.2315
0.2623
0.2633
0.2644
0.2644
0.2883
0.2933
0.2984
0.3019
0.3111
0.3236
0.3657
0.3670
0.3670
0.3677
0.3833
0.4079
0.4127
Delta F
0.0193
0.0230
0.0239
0.0128
0.0357
0.0225
0.0202
0.0349
0.0385
0.0240
0.0386
0.0411
0.0275
0.0186
0.0051
0.0037
0.0149
0.0014
0.0120
0.0255
0.0400
0.0306
0.0400
0.0494
0.0604
0.0657
0.0677
0.0401
0.0533
0.0678
0.0816
0.0805
0.0703
0.0800
Ordem
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
Vazão
19.49
19.53
19.67
19.87
19.89
19.98
20.11
20.21
20.39
20.83
21.08
21.61
22.11
22.16
22.4
22.41
22.72
22.84
23.19
23.79
24.76
24.78
25.16
25.24
25.41
25.72
26.6
26.62
26.96
27.9
29.24
30.3
32.5
38.25
Fobs.
0.5072
0.5217
0.5362
0.5507
0.5652
0.5797
0.5942
0.6087
0.6232
0.6377
0.6522
0.6667
0.6812
0.6957
0.7101
0.7246
0.7391
0.7536
0.7681
0.7826
0.7971
0.8116
0.8261
0.8406
0.8551
0.8696
0.8841
0.8986
0.9130
0.9275
0.9420
0.9565
0.9710
0.9855
Festim.
0.4134
0.4161
0.4257
0.4397
0.4411
0.4474
0.4566
0.4638
0.4768
0.5090
0.5276
0.5677
0.6059
0.6097
0.6281
0.6289
0.6527
0.6619
0.6886
0.7337
0.8034
0.8048
0.8305
0.8358
0.8468
0.8662
0.9159
0.9170
0.9336
0.9712
0.9988
0.9998
0.9999
0.9999
Delta F
0.0939
0.1056
0.1105
0.1111
0.1241
0.1323
0.1376
0.1449
0.1464
0.1287
0.1245
0.0990
0.0753
0.0859
0.0820
0.0957
0.0864
0.0917
0.0795
0.0489
0.0063
0.0068
0.0044
0.0048
0.0083
0.0034
0.0319
0.0184
0.0206
0.0436
0.0568
0.0433
0.0289
0.0144
Sendo assim:
∆fmax.= 0,146; ∆f( 68,5%) ≈ 0,160
Com isto, observa-se que a hipótese H0 do teste de Kolmogorov-Smirnov pode ser
aceita, ou seja, a amostra pode ser representada pela distribuição GEV.
154
b) Qui-quadrado (Ao nível de significância de 5% de probabilidade)
Classes
Fobs.
Prob (X<xi)
Fteo.
λ
2
6,87
15,27
10
0,0172
0,1817
11,19
0,127
15,27
19,47
23
0,1817
0,4120
15,66
3,440
19,47
23,67
20
0,4120
0,7247
21,26
0,075
23,67
27,87
10
0,7247
0,9702
16,69
2,682
27,87
40,47
5
0,9702
1,0
2,03
4,345
68
10,67
λ2calculado = 10,67; λ2tab(0,05,3) = 7,815
c) Teste de Filliben
O valor q1, considerando a = 0,40 e N = 68, é igual a 0,008798. A função GEV
inversa retorna um valor de 4,95 mm. O valor de rcalc. é igual a 0,941 e o rcrítico para
nível de significância de 0,05 é de aproximadamente 0,993. Portanto, rejeita-se a
hipótese H0 de que esta série histórica possa ser representada pela Distribuição GEV,
de forma semelhante ao obtido pelo teste Qui-quadrado. Assim, observa-se que a
única distribuição aceita por todos os testes foi a de Weibull, sendo a mesma
recomendada para estudos associados à vazão mínima. Na Figura 4.10 tem-se o
ajuste da distribuição GEV pelo teste de Filliben, o qual se assemelha com o ajuste
obtido para distribuição Gumbel.
155
Figura 4.10 Ajuste da distribuição GEV pelo teste de Filliben.
4.11 Identificação de “outliers” em uma série hidrológica
Valores “outliers” numa série histórica são aqueles considerados atípicos,
sendo que esta situação pode ser ocasionada por erros laboratoriais, equívocos de
medição e ou de processamento, como ocorre com razoável freqüência com dados de
precipitação, ou a ocorrência de um ano hidrológico atípico, com eventos extremos de
precipitação, provocando situação idêntica no comportamento das vazões.
No caso de problemas com laboratório ou tratamento e processamento
equivocado dos dados, é recomendável, após identificação, sua eliminação da análise,
uma vez que dados atípicos podem comprometer os testes estatísticos de
adequabilidade e posterior aplicação das distribuições de probabilidades.
No entanto, quando o evento hidrológico extremo ocorre, recomenda-se uma
análise cautelosa da série histórica, uma vez que, naturalmente, aquele valor pode
fazer parte das condições climáticas e hidrológicas da região, mesmo sendo
considerado como atípico pela estatística. Neste caso, recomenda-se manter o dado
na série.
156
O teste mais aplicado para as condições de séries hidrológicas é conhecido
como teste de Grubbs & Beck, descrito por Grubbs & Beck (1972). Para encontrar o
menor valor considerado como “não-outlier” aplica-se a seguinte equação:
XI = X − TN,α ⋅ S
(145)
O valor crítico de TN,α, pode ser inferido com base na Tabela 4.17, adaptada do
trabalho original de Grubbs & Beck (1972). Sendo assim, valores abaixo de XI,
teoricamente, podem ser considerados “outliers”. Sua remoção ou não dependerá de
uma análise mais aprofundada da série histórica em questão.
Tabela 4.17 Valores críticos de TN,α do Teste de Grubbs & Beck (1972), para valores
extremos inferiores, sendo N o tamanho da amostra e α, o nível de significância.
Tamanho da amostra
(N)
3
5
7
10
12
15
20
22
25
30
35
40
45
50
55
60
65
68
70
75
78
80
85
90
100
110
120
130
140
147
α = 1%
α = 5%
α = 10%
1,155
1,749
2,097
2,410
2,550
2,705
2,884
2,939
3,009
3,103
3,178
3,240
3,292
3,336
3,376
3,411
3,442
3,460
3,471
3,496
3,511
3,521
3,543
3,563
3,600
3,632
3,662
3,688
3,712
3,727
1,153
1,672
1,938
2,176
2,285
2,409
2,557
2,603
2,663
2,745
2,811
2,866
2,914
2,956
2,992
3,025
3,055
3,071
3,082
3,107
3,121
3,130
3,151
3,171
3,207
3,239
3,267
3,294
3,318
3,334
1,148
1,602
1,828
2,036
2,134
2,247
2,385
2,429
2,486
2,563
2,628
2,682
2,727
2,768
2,804
2,837
2,866
2,883
2,893
2,917
2,931
2,940
2,961
2,981
3,017
3,049
3,078
3,104
3,129
3,144
Para verificar se o último valor da série pode ser considerado “outlier”, aplica-se
a seguinte seqüência de equações:
TN,α =
S12
S2
(146)
157
Em que S12 é a variância da amostra (série histórica) sem o maior valor; S2 é a
variância da amostra completa e x 1 é média da amostra sem o último valor da série,
dada por:
N−1
i=1
x1 =
(x i )
(147)
N −1
O valor de TN,α (equação 146) for maior que o valor crítico (Tabela 4.18), o
valor não pode ser considerado “outlier”, uma vez que o valor de T calculado não será
significativo.
Tabela 4.18 Valores críticos de TN,α do Teste de Grubbs & Beck (1972), para valores
extremos superiores, sendo N o tamanho da amostra e α, o nível de significância.
Tamanho da amostra
(N)
4
5
7
10
12
15
20
22
25
30
35
40
45
50
55
60
65
68
70
78
80
90
100
110
120
130
140
147
α = 1%
α = 5%
α = 10%
0,000
0,0035
0,0440
0,1414
0,2043
0,2859
0,3909
0,4245
0,4680
0,5268
0,5730
0,6104
0,6412
0,6672
0,6894
0,7086
0,7253
0,7344
0,7401
0,7605
0,7650
0,7853
0,8020
0,8162
0,8284
0,8389
0,8481
0,8539
0,0008
0,0183
0,1020
0,2305
0,2996
0,3818
0,4804
0,5107
0,5495
0,6008
0,6405
0,6724
0,6985
0,7203
0,7390
0,7550
0,7690
0,7766
0,7813
0,7983
0,8021
0,8190
0,8329
0,8447
0,8548
0,8636
0,8712
0,8761
0,0031
0,0376
0,1479
0,2863
0,3552
0,4345
0,5270
0,5550
0,5906
0,6375
0,6737
0,7025
0,7261
0,7459
0,7627
0,7772
0,7898
0,7966
0,8009
0,8162
0,8197
0,8349
0,8475
0,8581
0,8672
0,8752
0,8821
0,8865
158
Exemplo de Aplicação 4.20
Verificar se os valores extremos da série histórica do Exemplo de Aplicação 4.6
(Tabela 4.7) podem ser considerados “outliers”.
Tamanho da Série: 68 dados
Nível de Significância: 10%
Média da série: 20,01 m3/s
Variância: 27,83 m6/s2
a) Para o menor valor: Tcrítico = 2,883 (Tabela 4.17)
XI = 20,01 − 2,883 × 27,83 = 4,80 m 3 / s
Como o valor é menor que o limite inferior da série (8,97 m3/s), este último não
poderá ser considerado como “outlier”.
b) Para o maior valor: Tcrítico = 0,7966 (Tabela 4.18)
S12 = 23,14 m6/s2
T68;10% = 23,14/27,83 = 0,831
Como o valor calculado para T é maior que o valor de Tcrítico, entende-se que não
houve significância e o último valor da série (38,25 m3/s) não pode ser considerado
“outlier”.
4.12 Outros testes não-paramétricos aplicados à Hidrologia
Estatisticamente, a aplicação de distribuições de probabilidades a séries
históricas é realizada tendo-se como referência uma amostra aleatória extraída de
uma população única cuja distribuição mais adequada não é conhecida. Para que isto
seja possível algumas premissas importantes devem ser consideradas, tratadas na
forma de hipóteses, as quais são analisadas mediante testes não-paramétricos. É
importante mencionar que os testes descritos anteriormente dizem respeito a testes
necessários para avaliar o grau de aderência da distribuição de probabilidades teórica,
caracterizada pela estimativa dos parâmetros populacionais, às freqüências
observadas, calculadas com base na série histórica (amostra). Estes testes não
avaliam se a série histórica apresenta as características necessárias para aplicação
das distribuições de probabilidades. Estas condições podem ser afetadas por vários
fatores como a construção de um barramento, retificação e ou alteração de um curso
159
d’água, alteração nas condições de uso do solo, eventos extremos e extraordinários,
fenômenos climáticos cíclicos, dentre outros.
As condições mencionadas anteriormente são tratadas como hipóteses e
podem ser resumidas da forma como se segue.
4.12.1 Hipótese de Aleatoriedade
Esta hipótese assume que as variações numa grandeza hidrológica são
devidas a causas naturais. Na existência de interferência antrópica, como
barramentos, é provável que as observações deixem de ser aleatórias. O teste de
aleatoriedade possui como hipótese H0, que a série histórica é constituída por dados
ou observações aleatórias. O comportamento de um hidrograma ao longo do tempo
permite verificar a existência de valores máximos e mínimos, conhecidos como
inflexões, e a presença deste tipo de observação, caracteriza a existência ou não de
aleatoriedade (Naghettini & Pinto, 2007). A estatística deste teste é dada por:
T=
Ni − E(Ni)
(148)
var (Ni)
Em que Ni representa o número de inflexões observadas na série histórica;
E(Ni) e var (Ni), são, respectivamente, a esperança e a variância de Ni, sendo
estimados por:
E(Ni) =
2 × (N − 2)
3
var (Ni) =
(149)
16 × N − 29
90
A hipótese H0 pode ser rejeitada se
(150)
T >z
1−
α
2
, sendo α o nível de
significância de z (Tabela 4.2). É importante mencionar que quando N for maior que
30, Ni segue uma distribuição aproximadamente Normal, recomendando-se a
aplicação do teste para séries com esta característica.
4.12.2 Hipótese de Estacionariedade
Esta hipótese estuda o comportamento de uma série histórica ao longo do
tempo, analisando se a mesma apresenta tendência temporal. A hipótese H0 do teste,
conhecido como Teste de Spearman, é de que os dados não apresentam tendência
160
temporal, ou seja, a série é estacionária. Uma série hidrológica pode apresentar
tendência temporal e não estacionariedade pela existência de ciclos nítidos na série
histórica, quando apresentar saltos na série provocados por alterações repentinas no
curso d’água ou na própria bacia e por mudanças climáticas embora, neste último
caso, seja necessário um longo período de tempo para análise. Mudanças graduais no
uso do solo de uma bacia hidrográfica também podem produzir alterações na
estacionariedade da serie histórica. A estatística do teste é obtida por:
T=
cs
(151)
var (cs )
O coeficiente cs é calculado por:
6⋅
cs = 1 −
N
i=1
(Fi − fi )2
(152)
N3 − N
var (cs) =
1
N −1
(153)
Na equação 152, fi denota a posição temporal da observação na série histórica
e Fi a posição que as observações, associadas a fi, ocupam, com a série organizada
em ordem crescente. A hipótese H0 pode ser rejeitada se T > z
1−
α
2
.
4.12.3 Hipótese de Independência
Esta hipótese considera que uma dada observação não influencia a ocorrência
nem a não ocorrência de outra observação ao longo do tempo. Isto é importante no
contexto de vazões haja vista que o escoamento subterrâneo (pequenas vazões) é
influenciado pelo armazenamento de água na bacia oriundo do período de chuvas e
liberado lentamente no período seco. Vazões diárias apresentam tendência de maior
dependência que vazões mensais, anuais ou extremas (máximos ou mínimos em um
dado ano). A hipótese H0 deste teste é de que as observações são independentes.
T=
r − E(r )
var (r )
(154)
A estimativa de r, E(r) e var(r) pode ser realizada da seguinte forma:
r=
N−1
i=1
Y1'⋅ Y1'+i + Y1'⋅ YN'
(155)
161
Nesta equação, Y’1, Y’i+1, etc, consiste da subtração dos Y valores da série
histórica pela média dos dados, ou seja:
−
Y'= Y − Y
(156)
A esperança de r (E(r)) e sua variância são obtidas por:
E(r ) = −
var (r ) =
s2
N −1
s 22 − s 4
+
N−1
(157)
s 22 − 2 ⋅ s 4
−
(N − 1) ⋅ (N − 2)
s 22
(158)
(N − 1)2
Em que s2 e s4 são os momentos amostrais de 2a e 4a ordem, obtidos por:
s2 =
s4 =
(Y )
(159)
(Y )
(160)
N
i=1
N
i=1
'
i
'
i
2
4
A hipótese H0 pode ser rejeitada se T > z
1−
α
2
.
4.12.4 Hipótese de Homogeneidade
Esta hipótese sugere que uma dada série histórica de vazões máximas esteja
associada a chuvas cuja freqüência de ocorrência seja normal (esperada). Vazões de
pico oriundas de eventos de chuvas históricas, ocorridas de forma atípica, causam
heterogeneidade à série histórica e a observação muito provavelmente se constituirá
num “outlier”.
A hipótese H0 deste teste considera que a série histórica é homogênea. Para
sua aplicação é recomendável que a série histórica seja dividida em duas partes
aproximadamente com o mesmo número de dados, constituindo-se duas subamostras. A estatística deste teste é dada por:
T=
V − E(V )
(161)
var (V )
A hipótese H0 será rejeitada se T > z
1−
α
2
.
O procedimento para cálculo de V, E(V) e var(V) é o seguinte:
162
- calcula-se o valor de V para a primeira sub-amostra:
V1 = N1 ⋅ N2 +
N1 ⋅ (N1 + 1)
− H1
2
(162)
Sendo N1, N2 e H1, respectivamente, o número de dados da 1a sub-amostra, o
número de dados da 2a sub-amostra e a soma das ordens de classificação da série
histórica da 1a sub-amostra (soma de Fi do teste de estacionariedade).
- calcula-se o valor de V para a 2a sub-amostra:
V2 = N1 ⋅ N 2 − V1
(163)
O valor de V a ser adotado no cálculo de T deve ser o menor valor entre V1 e
V2 .
E(V ) =
N1 ⋅ N 2
2
var (V ) =
N1 ⋅ N2 ⋅ (N1 + N2 + 1)
12
(164)
(165)
Exemplo de Aplicação 4.21
Verifique se a série histórica de vazões máximas do Rio Grande, com seção de
controle em Madre de Deus de Minas, apresenta aleatoriedade, estacionariedade,
independência e homogeneidade. Considere nível de significância para z igual a 0,05
(z=1,96).
163
Ano
1935
1936
1937
1938
1939
1940
1941
1942
1943
1944
1945
1946
1947
1948
1949
1950
1951
1952
1953
1954
1955
1956
1957
1958
1959
1960
1961
1962
1963
Posição
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
Qmáxima
114.69
195.46
196.34
194.14
170.82
283.15
126.38
193.26
258.85
131.22
181.82
262.45
176.98
196.34
175.66
187.10
140.02
170.82
125.50
95.83
114.28
161.58
213.50
204.70
231.54
152.78
271.45
245.35
226.70
fi
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
Fi
4
42
43
39
27
66
7
38
59
9
33
60
31
43
30
35
11
27
6
2
4
21
50
48
53
18
63
57
51
Y'
-79.81
0.96
1.84
-0.36
-23.68
88.65
-68.12
-1.24
64.35
-63.28
-12.68
67.95
-17.52
1.84
-18.84
-7.40
-54.48
-23.68
-69.00
-98.67
-80.22
-32.92
19.00
10.20
37.04
-41.72
76.95
50.85
32.20
Posição
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
Qmáxima
114.69
195.46
196.34
194.14
170.82
283.15
126.38
193.26
258.85
131.22
181.82
262.45
176.98
196.34
175.66
187.10
140.02
170.82
125.50
95.83
114.28
161.58
213.50
204.70
231.54
152.78
271.45
245.35
226.70
Fi
4
42
43
39
27
66
7
38
59
9
33
60
31
43
30
35
11
27
6
2
4
21
50
48
53
18
63
57
51
164
1964
1965
1966
1967
1968
1969
1970
1971
1972
1973
1974
1975
1976
1977
1978
1979
1980
1981
1982
1983
1984
1985
1986
1987
1988
1989
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
230.66
244.00
279.55
194.14
134.30
162.02
88.45
197.66
152.34
162.02
187.10
149.70
195.02
148.38
239.95
213.50
167.74
143.54
175.22
257.50
159.82
275.05
266.50
162.90
165.10
187.10
202.50
178.30
437.20
141.34
157.62
373.20
189.30
269.20
129.90
310.60
233.30
113.46
145.11
201.80
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
52
56
65
40
10
23
1
45
17
22
34
16
41
15
55
49
26
13
29
58
20
64
61
24
25
34
47
32
69
12
19
68
37
62
8
67
54
3
14
46
36.16
49.50
85.05
-0.36
-60.20
-32.48
-106.05
3.16
-42.16
-32.48
-7.40
-44.80
0.52
-46.12
45.45
19.00
-26.76
-50.96
-19.28
63.00
-34.68
80.55
72.00
-31.60
-29.40
-7.40
8.00
-16.20
242.70
-53.16
-36.88
178.70
-5.20
74.70
-64.60
116.10
38.80
-81.04
-49.39
7.30
30
31
32
33
34
230.66
244.00
279.55
194.14
134.30
Soma
52
56
65
40
10
1200
165
Resultados dos testes não-paramétricos aplicados.
Teste
Ni
Parâmetros do Teste
N
E(Ni)
Aleatoriedade
Conclusão: Hipótese H0
aceita (série aleatória)
39
69
Estacionariedade
Conclusão: Hipótese H0
aceita (série
estacionária, sem
dependência temporal)
cs
-
Independência
Conclusão: Hipótese H0
aceita (série
independente)
Homogeneidade
Conclusão: Hipótese H0
aceita (série
homogênea)
Var (Ni)
|T|
44,67
11,94
1,64
-
Var (cs)
|T|
0,01471
0,69
E(r)
Var(r)
|T|
-3820
909.212.690
0,20
0,0831
r
-
-9830
N1
N2
H1
V1
V2
E(v)
Var (v)
|T|
34
35
1200
585
605
595
6942
0,12
Com base nos respectivos testes não-paramétricos, observa-se que a série
histórica de vazões máximas do Rio Grande nesta seção, apresenta os requisitos
necessários para aplicação de distribuições de probabilidades. A hipótese de
aleatoriedade da série significa que as possíveis oscilações na série são devidas a
causas naturais, sem interferência antrópica. De fato, a montante desta seção de
controle, não se constata a existência de nenhum tipo de barramento no Rio Grande,
não verificando-se, portanto, influência nas vazões de jusante. A hipótese de
estacionariedade demonstra que a série histórica não apresenta tendência temporal,
ou seja, não se verificam ciclos ao longo do tempo no comportamento das vazões,
nem saltos na série, significando que não houve nenhum tipo de alteração na calha do
Rio Grande ou que esteja havendo alterações repentinas e importantes no uso do solo
na bacia. A independência da série histórica demonstra que não há influência de uma
observação em outra, ou seja, um determinado dado não é importante na ocorrência
nem na não ocorrência de outro dado. Hidrologicamente, é o que se espera de dados
de vazão máxima, os quais são caracterizados por precipitações importantes e a
influência do escoamento base não é da mesma magnitude do escoamento superficial
direto. A hipótese de homogeneidade da série demonstra que os picos verificados no
período não foram provocados por eventos extraordinários de precipitação e sim por
precipitações esperadas.
166
4.12.5 Teste de Mann-Kendall
O teste de Mann-Kendall (Kendall, 1975; Mann, 1945) consiste de um teste
não-paramétrico desenvolvido para aplicações a serie de dados temporais com o
objetivo de analisar se a série histórica apresenta algum tipo de tendência. Vem sendo
muito aplicado para estudos que envolvem tendência de dados hidrológicos e
climatológicos.
A hipótese Ho do teste é de que uma dada amostra (série histórica) é
independente e identicamente distribuída, ou seja, não há tendência nos dados. A
hipótese alternativa H1 é de que os dados apresentam tendência. A estatística do teste
é processada da seguinte forma:
S=
n −1
n
i =1 i = j + 1
(
sin al x j − x i
)
(166)
Em que xj são dados seqüenciais na série histórica de tamanho n. Assim, tem-se a
seguinte situação:
1 se x j > x i
sin al x j − x i = 0 se x j = x i
(
)
(167)
− 1 se x j < x i
Após o cálculo de S, determina-se a sua variância por:
V (S ) =
n ⋅ (n − 1) ⋅ (2 ⋅ n + 5 ) −
n
tp ⋅ p ⋅ (p − 1) ⋅ (2 ⋅ p + 5 )
p =1
18
(168)
Sendo tp corresponde ao número de agrupamentos com p dados. A estatística Z
padronizada do teste é dada por:
Z=
S −1
V (S )
para S > 0
Z = 0 para S = 0
S +1
Z=
para S < 0
V (S )
(169)
167
A estatística Z do teste é então comparada aos valores de Z obtidos da Tabela
de Z da distribuição Normal. Para os níveis de 0,01; 0,05 e 0,1, tem-se,
respectivamente, 2,58; 1,96 e 1,65. Quando Z < Z α a hipótese de nulidade Ho é
aceita, ou seja, os dados não apresentam tendência; caso contrário, rejeitada,
caracterizando-se possível presença de tendência. Para todas as séries climáticas
simuladas foi adotado o nível de significância de 0,05.
Exemplo de Aplicação 4.22
Para a série histórica de precipitação máxima diária anual da localidade de
Acaiaca, representada graficamente, aplique o teste de Mann-Kendall e verifique se há
algum tipo de tendência importante na série.
Aplicando-se a seqüência de equações anterior, foi encontrado um valor para S
igual -50 e para V(S) de 35622,67. O valor de Z estimado para a série foi de -0,259
que, considerando seu valor em módulo, é menor que os valores de Z para os níveis
de significância mais aplicados. Isto significa que aceita-se a hipótese de nulidade Ho
de que não há tendência na série histórica de precipitação máxima diária anual de
Acaiaca, a qual corresponde em uma série completa entre 1942 e 2009.
168
Exemplo de Aplicação 4.23
Aplique o teste de Mann-Kendall para a série de vazões máximas apresentada
no Exemplo de Aplicação 4.21.
O valor de S calculado pela equação 167 foi igual a 122 e o valor de V(S) igual
a 35675,33. O valor de Z da estatística do teste foi igual a 0,641. Como este número é
menor que os valores de Z /2, conclui-se que a série não apresenta tendência
temporal.
169
Referências Bibliográficas
CASELLA, G.; BERGER, R.L. Statistical Inference. Belmont, CA: Duxbury Press.
1990. 650p.
D’AGOSTINO, R.B.; STEPHENS, M.A. Goodness-of-fit techniques. New York:
Marcel Decker. 1986.
DURRANS, S. R.; PITT, R. Maximum likelihood estimators for coarsely resolved
precipitation data. Journal of Hydrologic Engineering, Reston, v. 9, n.1, p.13-27,
2004.
FERREIRA, D.F. Estatística Básica. Lavras: Editora UFLA, 2005. 664p.
GRUBBS, F.E.; BECK, G. Extension of sample sizes and percentage points for
significance tests of outlying observations. Technometrics, v. 14, n.4, p.847-854.
HAAN, C.T. Statistical Methods in Hydrology. Ames: The Iowa State University
Press. 2a Edição, 2002, 377p.
HOSKING, J.R.M. L - moments: analysis and estimation of Distributions using Linear
Combinations of Order Statistics. Journal of Royal Statistical Society, v.52, n.1,
p.105-124, 1990.
KATZ, R.W.; PARLANGE, M.B.; NAVEAU, P. Statistics of extremes in hydrology.
Advances in Water Resources, Amsterdan, v.25, p.1287-1304, 2002.
NAGHETTINI, M.; PINTO, E.J.A. Hidrologia Estatística. Belo Horizonte: CPRM,
2007.552p.
SHARDA, V.N.; DAS, P.K.; OJASVI, P.R. Probability distribution of extrem rainfall
series for conservation planning in a sub-humid climate. Applied Engineering in
Agriculture, v. 24, n.4, p.447-453, 2008.
SPIEGEL, M.R. Advanced Mathematics for Engineers and Scientists. New York:
Schaum´s Outline Series, McGraw-Hill Book Company, 1971. 407p.
170
WALPOLE, R.E.; MYERS, R.H. Probability and Statistics for Engineers and
Scientists. New York: Macmililan Publishing Co, 2. Edition, 1978. 580p.
Download

4 HIDROLOGIA ESTATÍSTICA: conceitos e aplicações - DEG