1 4 HIDROLOGIA ESTATÍSTICA: conceitos e aplicações 4.1 Conceitos básicos de Probabilidades Um conjunto de dados hidrológicos necessita ser previamente analisado com base em alguns indicadores estatísticos básicos para que se possa, efetivamente, desenvolver a teoria das probabilidades às situações práticas desejadas. Primeiramente, este conjunto de dados hidrológicos é conhecido, no âmbito da hidrologia, como série histórica e consiste, basicamente, de uma amostra extraída de uma população. Com base nesta amostra, podemos calcular alguns indicadores e medidas estatísticas importantes, como média, desvio padrão (variância), assimetria, curtose e distribuição de freqüência dos dados observados na amostra. Estas medidas caracterizam apenas a amostra e nada dizem a respeito da população em si. A distribuição de freqüências demonstra o comportamento da amostra no tocante à sua simetria e é nosso objetivo, na hidrologia estatística, modelar esta distribuição de freqüência com base num modelo matemático, constituído de parâmetros, conhecido como Distribuição de Probabilidades. Primeiramente, é importante que caracterizemos algumas situações relativas à amostra, contextualizada em termos da hidrologia. Podemos modelar uma distribuição de freqüência no contexto de dados discretos, como por exemplo, o lançamento de uma moeda ou no sorteio de números de alguma forma de loteria. No caso da hidrologia, pode-se, eventualmente, considerar dias chuvosos como variáveis hidrológicas discretas, mas na maioria das vezes, a hidrologia considera suas análises dentro do contexto de variáveis contínuas. Em se tratando de variáveis discretas, podemos responder à pergunta: qual a probabilidade de um número qualquer ser sorteado (evento x) dentro de um espaço amostral finito S qualquer, constituído por N números, sendo este um evento aleatório. A resposta pode ser escrita da seguinte forma: P(x ) = mx N (1) Observe que todos os números que constituem o espaço amostral S possuem a mesma possibilidade de ser sorteados numa situação não viciada. É importante, no entanto, diferenciarmos probabilidade de freqüência. Esta última está associada ao número de vezes que um determinado evento ocorreu, enquanto que probabilidade refere-se às possíveis situações de ocorrência, que no caso da equação 1, é considerada como de igual de probabilidade. Assim, se um sorteio de cara e coroa é realizado 10 vezes e “cara” for sorteado 7 vezes, sua freqüência será 0,7. Por lado, como 2 temos apenas duas possibilidades e estas são iguais (numa situação não viciada), o número de vezes esperado para o sorteio de “cara” é 5 vezes, portanto, a probabilidade seria 0,5. No entanto, na hidrologia, em grande parte das vezes, nos interessa, em termos práticos, avaliar qual a possibilidade de um determinado evento ser maior ou igual (ou menor ou igual) a um dado valor xi e isto remete ao conceito de uma variável contínua, como por exemplo, vazões de um rio. Existem diferenças importantes nos modelos probabilísticos para ambas as situações. No caso de variáveis discretas busca-se estimar qual a P(x) ser igual a um valor; no caso de variáveis contínuas, qual a P(x > xi) ou P(X<xi). Para variáveis discretas, o modelo probabilístico pode ser ajustado com apenas um parâmetro, normalmente vinculado à média, como no caso da Distribuição de Poisson. Em se tratando de variáveis contínuas, o modelo probabilístico necessita de 2 ou 3 parâmetros para seu ajuste, e estes estão vinculados às medidas estatísticas de média, variância e assimetria, ou seja, aos momentos estatísticos de 1ª, 2ª e 3ª ordens. 4.1.1 Probabilidade Condicional A probabilidade de ocorrência de um determinado evento A pode ser influenciado pela ocorrência de outro evento B, uma vez que haverá redução do espaço amostral S para a realização do evento A quando B ocorre. Neste caso, tem-se a seguinte definição: P(A | B ) = P(A ∩ B ) P(B ) (2) Nesta equação, P(A | B ) significa a probabilidade do evento A, associada (ou condicionada) ao evento B, P(A ∩ B ) significa a intersecção dos eventos A e B no plano amostral S e P(B) é a probabilidade de ocorrência do evento B. Graficamente, teríamos: S B A Deste esquema, depreende-se também que: P(A ∩ B ) 3 P(A ∪ B ) = P(A ) + P(B ) − P(A ∩ B ) (3) Exemplo de Aplicação 4.1 a) Sabendo-se que a probabilidade de ocorrer em janeiro uma precipitação total superior 200 mm é de 0,098, recalcule esta probabilidade sabendo-se que já ocorreram 130 mm no respectivo mês e que a probabilidade de se superar este último valor é de 0,234. Neste exemplo, o evento A consiste de P(A) = 0,098; o evento B é P(B) = 0,234. Queremos a probabilidade do evento A mediante a condição de que já houve 130 mm no mês de janeiro, ou seja, P(A|B): P(A | B ) = P(A ∩ B ) P(B ) − P(A ) 0,098 = = 1− = 0,581 P(B ) P(B ) 0,234 b) Considere 2 eventos probabilísticos, A e B, ambos associados à possibilidade da vazão mínima de um curso d’água não atender à demanda de um projeto, que é 4 m3/s. O evento A implica que a probabilidade da vazão do córrego A ser inferior a 2 m3/s é de 0,0547 e do córrego B é de 0,0891. Qual a probabilidade do projeto não receber a vazão mínima projetada, sabendo-se que o evento A está condicionado a B [(P|B) = 0,65]? P(A) = 0,0547; P(B) = 0,0891. A possibilidade do projeto não ser atendido implica em P(A ∪ B ) (equação 3). Como P(A|B) é 0,65, da equação 2, tem-se: P(A ∩ B ) = P(A | B ) × P(B ) = 0,65 × 0,0891 = 0,0579 P(A ∪ B ) = P(A ) + P(B ) − P(A ∩ B ) = 0,0547 + 0,0891 − 0,0579 = 0,0859 4 4.2 Freqüência de Dados Hidrológicos Os fenômenos hidrológicos podem ser caracterizados como aleatórios, podendo-se associar aos mesmos, um caráter probabilístico envolvendo estes fenômenos. Em termos de seu comportamento há de se ressaltar que, sempre haverá possibilidade de um dado evento hidrológico ser superior ou inferior a um valor histórico já registrado. Isto é essencial para o entendimento das variáveis hidrológicas, uma vez que esta é uma das principais funções da hidrologia, que consiste em observar os eventos e modelar as freqüências de ocorrência, possibilitando que sejam feitas previsões assumindo determinado risco. As variáveis hidrológicas, na maioria das vezes, são consideradas contínuas, ou seja, variáveis que em termos físicos, existem continuamente no tempo. Em termos estatísticos, são aplicadas distribuições que modelam este caráter, trabalhando com cálculos de áreas sob a curva de distribuição de probabilidades abaixo ou acima de determinado valor de interesse prático ou entre valores. Percebe-se que neste caso, não se pergunta qual a probabilidade de um determinado evento ser IGUAL a um valor específico, como no sorteio de um número, e sim, deste evento ser maior ou menor que este valor, ou estar entre 2 valores específicos. Este entendimento também é fundamental para aplicação das distribuições de probabilidades aos fenômenos hidrológicos. O primeiro passo para se modelar a freqüência de dados hidrológicos é fazer um estudo de sua ocorrência, no que se estabelece um percentual com que uma variável hidrológica pode ser maior que um dado valor. Isto é chamado freqüência de excedência e é obtida diretamente de uma série histórica de dados. Contudo, pode-se trabalhar com a freqüência de não excedência, ou seja, aquela em que se estuda o percentual de uma variável ser menor ou igual a um dado valor. A escolha depende dos objetivos, os quais serão discutidos na seqüência. Deve-se ressaltar que uma é o complemento da outra, ou seja: f exc = 1 − fnão − exc (4) Existem algumas definições de freqüência considerando variáveis contínuas, destacando-se: 5 Tabela 4.1 Equações para estimativa da freqüência observada e suas aplicações. Fórmula fobs = i N +1 Autor Weibull Observações Aplicação ao estudo de probabilidades não enviesadas (sem tendência) para qualquer modelo de Distribuição. fobs = i − 0,44 N + 0,12 Gringorten fobs = i − 0,375 N + 0,25 Blom fobs = i − 0,50 N Hazen fobs = i − 0,40 N + 0,20 Cunnane Aplicada para estudos associados às Distribuições Gumbel e GEV. Aplicada para estudos associados às Distribuições Normal e Log-normal. Aplicada para estudos associados à Distribuição Gama 3 parâmetros. Aplicação ao estudo de probabilidades não enviesadas (sem tendência) para qualquer modelo de Distribuição. O termo i, no numerador, refere-se à posição que o dado ocupa dentro da série histórica, a qual deve ser ordena em ordem crescente para freqüências de não excedência e ordem decrescente para freqüência de excedência. Por outro lado, N, no denominador, refere-se ao tamanho da série histórica. Ressalta-se que nos exemplos de aplicação aqui desenvolvidos, será considerada apenas a equação proposta por Weibull. Com base no estudo das freqüências de ocorrência, ajusta-se uma distribuição de probabilidades e aquela que obtiver o melhor ajuste (menores diferenças entre as freqüências observadas e estimadas) deve ser a escolhida. Note que o tamanho da série histórica tem grande importância haja vista que ela representará a possibilidade de ocorrência, ou seja, quanto maior esta, maior a representatividade do evento, tendo como referência seu registro histórico. Portanto, o ajuste de uma distribuição de probabilidades busca sua aplicação para estimar as freqüências de eventos que ainda não foram registrados e que normalmente são aplicados a projetos hidráulicos. A freqüência de excedência é bastante usada em hidrologia, especialmente quando os dados a serem trabalhados constituem séries históricas de precipitação. No entanto, para estudos de vazões, esta situação é também é importante, sendo que, neste caso, pode-se gerar um gráfico conhecido como “Curva de Permanência”. Isto significa que pode-se obter a percentagem de tempo (ou permanência) no qual um determinado evento é superado ou igualado. Estudos com esta conotação têm várias importâncias práticas, como por exemplo, na determinação de uma vazão mínima de um curso d’água para abastecimento ou irrigação, ou ainda, a precipitação mínima num determinado período de um mês visando ao balanço hídrico e fornecimento da lâmina de irrigação suplementar, ambas as grandezas 6 associadas a uma probabilidade de excedência. A Figura 4.1 ilustra uma curva de permanência hipotética. Figura 4.1 Representação gráfica de uma curva de permanência hipotética. No gráfico acima, para um valor y de vazão, x é a percentagem de tempo com que esta vazão é igualada ou superada, ou seja, sua permanência. Um valor prático extraído da curva de permanência é o Q90%, o qual significa a vazão existente no curso d´água em 90% do tempo, sendo aplicada à gestão dos recursos hídricos. Pela curva, observa-se que se trata de uma vazão pequena. O risco assumido é de que há possibilidade de 10% da mesma ser inferior ao valor estimado e neste caso, problemas com o fornecimento de água ao projeto. Uma observação adicional pode ser feita. Quanto menor o intervalo de análise dos dados (dados diários, mensais ou anuais) mais segura será a interpretação da curva de permanência. Isto quer dizer, por exemplo, que a análise de dados diários de vazão de um determinado rio fornece um valor menor de vazão, para uma dada permanência, do que dados mensais ou anuais. Estes últimos geram valores superestimados, sendo mais útil para a gestão dos recursos hídricos, o estudo com observações diárias. 7 4.3 Conceito de Tempo de Retorno (TR) O tempo de retorno representa o inverso da freqüência com que um evento pode ser igualado ou superado, ou seja, reflete a probabilidade com que uma dada variável hidrológica possa ser igualada ou superada, pelo menos uma vez, num ano qualquer. Ao se ajustar uma distribuição de probabilidades aos dados de freqüência de uma série histórica, utiliza-se a probabilidade de excedência para estimar um tempo de retorno, que é obtido em anos. Por definição, tem-se: TR = 1 F(X > xi) (5) Ao se assumir uma distribuição de probabilidades com F (X > xi) estimado por P (X > xi), tem-se: TR ≅ 1 P(X > xi) (6) No entanto, quando o objeto de estudo consiste de uma série histórica de dados hidrológicos mínimos ou dados que apresentem distribuição normal, o tempo de retorno a ser estimado também está associado à probabilidade com que o valor mínimo considerado pode ser inferior ao esperado, ou seja: TR = 1 1 ≅ F(X ≤ xi) P(X ≤ xi) (7) Esta situação é comum quando se trabalha com dados de vazão mínima visando à gestão dos recursos hídricos e avaliação da disponibilidade de água para irrigação ou abastecimento. Uma vazão específica corresponde ao valor da Q7,10, que significa um valor mínimo de vazão em 7 dias consecutivos, com Tempo de Retorno de 10 anos. Isto significa que há probabilidade de 10% de ocorrer uma vazão mínima com 7 dias consecutivos inferior ao valor estimado, sendo interpretado como um fator de segurança, porém associado à garantia de vazão no curso d’água. Contudo, o cálculo de TR, com base no seu conceito, não é suficiente. Assim, é possível calcular o “risco hidrológico” propriamente dito, o qual está associado à probabilidade de um evento ser igualado ou superado, porém, num intervalo de tempo N menor que TR e cuja definição prática está associada à vida útil da obra. Na realidade, esta probabilidade pode ser calculada pensando-se na probabilidade de que o evento não ocorra. A linha de raciocínio é a seguinte: dados que p é a probabilidade de ocorrência de um evento num ano qualquer; seu complemento é k, ou seja, a probabilidade de não ocorrência. Assim: k = 1− p (8) 8 Considera-se que a probabilidade do evento não ocorrer em qualquer dos anos, num intervalo de N anos, é dada por: K = kN (9) Da mesma forma, seu complemento, no sentido agora de ocorrência, será: R = 1− K (10) Sendo R o risco de ocorrência do evento num período de N anos. Fazendo-se algumas substituições, chega-se a: R = 1− kN (11) R = 1 − (1 − p)N (12) R = 1− 1− 1 TR N (13) Na realidade, esta seqüência de equações nada mais é do que a aplicação da Distribuição Binomial, considerando a probabilidade de não ocorrência, ou seja, P(x=0). A Distribuição Binomial apresenta a seguinte estrutura: P(X = x ) = N N− x ⋅ p x ⋅ (1 − p ) x (14) Assim, para a situação de não ocorrência, ou seja, P (X=0), teremos: P(X = 0 ) = N N N ⋅ p 0 ⋅ (1 − p ) = (1 − p ) 0 (15) Para a situação de ocorrência: P( X = x ) = 1 − (1 − p)N (16) Sendo P(X=x) o risco hidrológico R definido anteriormente. O desdobramento, em função de TR, é idêntico ao apresentado anteriormente. 9 4.4 Classificação das Principais Séries Históricas Hidrológicas Os dados históricos relativos a um evento hidrológico constituem uma série hidrológica, a qual pode ser classificada em: a) Série original: constituída por todos os valores registrados. Exemplo: 30 anos de dados de precipitação mensal. A série será constituída por 30 x 12 valores. b) Série anual: constituída por valores extremos (máximos ou mínimos) de cada ano. A partir do exemplo anterior, ter-se-ia uma série com 30 valores. Normalmente, valores mínimos anuais dizem respeito ao comportamento de vazões em cursos d’água. Este tipo de estudo visa fornecer informações para projetos de abastecimento de água e irrigação. c) Série parcial: constituída pelos “N” maiores ou menores valores ocorridos nos “N” anos de observação. A partir do exemplo inicial, ter-se-ia uma série constituída por 30 valores, os quais seriam os maiores ou menores da série original, sem haver a vinculação com o ano de ocorrência. Uma outra alternativa seria constituir a série com todos os maiores (ou menores) valores da série, referindo-se a uma situação na qual a série histórica é pequena e há utilização de mais de um valor extremo por ano. As séries históricas mais trabalhadas em hidrologia são as seguintes: a) Precipitação total anual: constituída pela soma das precipitações diárias ocorridas ao longo de 1 ano, obtendo-se, desta forma, 1 valor para a série. É estruturada, portanto, com valores totais de cada ano. Neste caso, normalmente objetiva-se ao estudo comportamental do ciclo hidrológico, sendo importante para estudos vinculados ao balanço hídrico climatológico bem como balanço hídrico anual em bacias hidrográficas. b) Precipitação total mensal, quinzenal e decendial: nestas séries históricas, pode-se trabalhar considerando um mês específico do ano (de interesse regional, por exemplo) e estudar os seus totais mensal, da 1a e 2a quinzenas e 1o, 2o e 3o decêndios. Este estudo é importante quando se realiza balanço hídrico de culturas visando ao manejo de irrigação. O produto gerado é conhecido como Precipitação Provável e trabalha-se com probabilidade de excedência, ou seja, objetiva-se garantir um valor mínimo com 75, 90 ou 95% de excedência, dependendo da cultura em questão. Culturas de maior valor econômico trabalha-se com um nível de 10 probabilidade de excedência maior, estimando-se um valor menor de precipitação provável, devido ao risco de prejuízos mais importantes. c) Precipitação máxima diária anual: neste caso, toma-se, em determinado ano, a maior precipitação diária registrada, sendo este valor 1 componente da série histórica. É feito desta forma para vários anos, constituindo-se a série histórica. Seu estudo é importante quando se deseja obter valores extremos máximos diários, visando ao estudo da freqüência de ocorrência de precipitações intensas, inclusive para geração das equações de chuvas intensas. Quando a disponibilidade de dados históricos é pequena, pode-se trabalhar com os 2 maiores valores anuais, a fim de melhorar a representatividade da série. d) Precipitação máxima anual correspondente a um determinado tempo de duração da precipitação: aqui, têm-se os mesmos objetivos anteriores, porém trabalhando-se com pluviogramas, separando-se o valor máximo da precipitação num determinado ano, para vários tempos de duração. Assim, constitui-se uma série histórica para cada tempo de duração. Estas séries geram resultados mais precisos para o ajuste da equação de chuvas intensas, pois trata-se de intensidades reais que ocorreram num determinado local. Valores totais diários não expressam tal característica. e) Vazões Máximas Diárias Anuais: são séries históricas aplicadas ao estudo de vazões de cheia e de projeto em cursos d´água. São séries com característica assintótica, assim como as de precipitações máximas, ou seja, com acúmulo de dados à esquerda na distribuição de freqüências, gerando-se um caudal à direita. f) Vazões Mínimas Diárias Anuais: são séries históricas muito aplicadas à hidrologia, fundamentais em estudos ligados à disponibilidade de água em cursos d’água para projetos e gestão de recursos hídricos. De forma semelhante às vazões máximas, são assintóticas, com acúmulo de dados à direita na distribuição de freqüência, gerando-se um caudal à esquerda. g) Vazões médias anuais: são séries históricas aplicadas ao estudo do comportamento do deflúvio médio anual, obtida pela média aritmética dos dados. h) Evapotranspiração: séries históricas que permitem estudar o comportamento evapotranspirativo em bacias hidrográficas. Importante nos estudos ligados ao 11 comportamento climático de regiões, bem como modelagem do balanço hídrico climatológico. 4.5 Histogramas de Freqüência Histogramas de freqüência dizem respeito à representação gráfica (normalmente em barras) da freqüência de ocorrência de uma dada variável, podendo ser simples ou acumulada (de excedência ou não excedência). A curva de permanência é um tipo de histograma de excedência, com as classes acumulando-se à esquerda. A seguir será apresentada a metodologia clássica para o desenvolvimento de histogramas de freqüência. 1o) Determinação do número de classes (k) - até 100 dados = k = - acima de 100 dados = n k = 5 ⋅ log10 (n) onde n é o número de observações. 2o) Amplitude total dos dados (A) A = M − m , em que M é o valor máximo observado e m, o menor valor. 3o) Amplitude de classe (Ac) Ac = A + ∆x , em que, ∆x é a precisão de leitura (por exemplo: dados com uma casa k −1 decimal, a precisão é de 0,1). 4o) Limite inferior da 1a classe LIclasse1 = m − Ac 2 5o) Limite superior da 1a Classe LSclasse1 = LIclasse1 + Ac 6o) As demais classes são computadas somando-se os limites à amplitude, e assim sucessivamente. LSclasse1 = LIclasse2 LSclasse2 = LIclasse2 + Ac LSclasse2 = LIclasse3, e assim por diante. 12 4.6 Medidas estatísticas básicas aplicadas em hidrologia 4.6.1 Média Aritmética A média aritmétrica de um conjunto de dados é expressa por: n xi X = i =1 n − (17) 4.6.2 Moda É definida como sendo o valor que aparece com mais freqüência num conjunto de dados. Quando se tem um intervalo de classe, a moda será o ponto médio da classe que contiver o maior número de ocorrências. 4.6.3 Mediana Corresponde ao valor que representa exatamente 50% das ocorrências. Para obtê-lo basta avaliar as freqüências de ocorrência, independentemente de ser de excedência ou não-excedência. Para obter o valor exato de 50%, pode-se utilizar o procedimento de interpolação dos dados vizinhos a este valor, quando não for possível obtê-lo diretamente. 4.6.4 Variância da Amostra n s2 = i=1 − 2 xi − x n −1 (18) 4.6.5 Desvio Padrão da Amostra s = s2 (19) Ao se avaliar tanto o desvio padrão quanto a variância, observa-se que quanto maior ambos, maior a variação dos dados em torno da média. 4.6.6 Assimetria A assimetria é um parâmetro importante na medida em que avalia a forma como os dados estão distribuídos em relação à média. Para que os dados apresentem distribuição normal, a assimetria deve ser próxima ou igual a zero. Nesta situação, a média, a moda e a mediana são iguais. Contudo, quando este valor for distante de zero, apresentará um padrão de distribuição com a maior quantidade de dados à esquerda (assimetria positiva) ou à direita (assimetria negativa). Em termos de dados hidrológicos, por apresentarem um padrão com limitação inferior (normalmente, valor mínimo é zero) e sem limitação superior 13 (os eventos hidrológicos podem ser superados), a assimetria é positiva. A assimetria pode ser calculada da seguinte forma: A= 3 − n i=1 xi − x (20) n Na prática é mais comum a utilização do coeficiente de assimetria, que representa a relação entre a assimetria e o desvio padrão ao cubo. Este coeficiente pode ser do tipo corrigido ou comum. O último pode ser calculado por: Ca = A (21) s3 O coeficiente corrigido é determinado da seguinte forma: − n 3 xi − x i=1 n Ca = ⋅ (n − 1) ⋅ (n − 2) s3 (22) Além da análise geral dos dados, a média, o desvio padrão e o coeficiente de assimetria são extremamente importantes, pois constituem-se nos parâmetros que permitem o ajuste das distribuições de probabilidades. 4.6.7 Curtose Quantifica o grau de “achatamento” da distribuição de freqüência de uma determinada amostra. A referência para curtose é a curva normal e pode ser calculada pela seguinte equação: n Cu = i=1 − 4 xi − x n ⋅ 1 s4 −3 (23) Se Cu for próximo a zero, a distribuição é intermediária, sendo conhecido como “Mesocúrtica”; se for maior que zero, os dados estão distribuídos de forma “afilada” (“Leptocúrtica”); se for menor que zero, forma “achatada” (Platicúrtica) (Figura 4.2). 14 Figura 4.2 Comportamento da distribuição normal em função do achatamento dos dados. 4.6.8 Co-variância amostral Quando se relaciona um conjunto de dados de uma variável com valores de outra variável que possa explicar o comportamento da primeira, aplica-se a co-variância amostral, onde quanto maior este valor, maior a relação entre as variáveis, ou seja, mais uma variável explica a outra. Este coeficiente pode ser calculado pela equação: cov xy = −⋅ − 1 n ⋅ x i ⋅ y i − x⋅ y n i=1 (24) A co-variância pode ser negativa ou positiva. No primeiro caso, significa que valores mais baixos de uma variável explicam valores mais altos de outra variável. No segundo, as variáveis possuem o mesmo comportamento em termos de crescimento. Em ambos os casos, quanto maior o valor, em módulo, maior a explicação da variável dependente. 4.6.9 Coeficiente de correlação É um coeficiente que adimensionaliza a co-variância e busca explicar, da mesma forma anterior, a relação entre duas variáveis. Seu valor varia de –1 a 1 e quanto mais próximo dos extremos, maior a explicação da variável. É calculada por: 15 r= cov xy (25) (s x ⋅ s y ) Em que sx e sy são respectivamente, o desvio padrão das variáveis x e y. 4.7 Distribuições Contínuas de Probabilidades em Hidrologia 4.7.1 Equação Geral de Ven Te Chow Há situações em que se necessita estimar valores de eventos associados a recorrências muito altas, cujas freqüências não foram ainda obtidas, como é o caso de estruturas civis, cuja falha coloque em risco vidas humanas. Nestas condições, recomendase o uso de Distribuições Teóricas de Probabilidades, as quais devem ser adequadas para estimativa das freqüências observadas, sendo que estas são determinadas pelas características dos dados, especialmente se forem assintóticas. Ven Te Chow1 afirma que a maioria das funções de probabilidades, aplicáveis à Hidrologia, visando associar valor (magnitude) da variável à probabilidade de sua ocorrência, pode ser representada pela seguinte equação: − (26) X TR = X+ K TR ⋅ S − Em que XTR é o valor da variável hidrológica associada à recorrência TR, X é a média aritmética da série histórica, S é o desvio padrão da mesma e KTR é o fator associado à freqüência, sendo função de TR e da distribuição de probabilidades. É também chamado “variável reduzida”. Basicamente, este modelo geral é aplicado em quase todos os estudos probabilísticos em hidrologia. 4.7.2 Principais Distribuições de Probabilidades em Hidrologia As distribuições de probabilidades que serão apresentadas, com as respectivas aplicações, são as seguintes: - Distribuição Normal ou de Gauss: adequada para séries originais (Ex.: totais anuais de precipitação); - Distribuição de Gumbel para máximos (ou Assintótica de Valores Máximos Extremos do tipo I): adequada para série de valores extremos máximos (série de valores máximos diários de precipitação ou vazão); 1 Haan (2002). 16 - Distribuição de Gumbel para mínimos (ou Assintótica de Valores Mínimos Extremos do Tipo I): adequada para valores mínimos extremos (série de valores mínimos de vazão); - Distribuição Log-Normal a 2 e 3 parâmetros: aplicável tanto a valores originais quanto máximos e estimativa da precipitação provável; - Distribuição Gama: aplicável para estimativa da precipitação provável e séries históricas de valores extremos; - Distribuição Weibull: aplicável a série histórica de vazões mínimas; - Distribuição de Extremos de Fréchet ou Log-Gumbel: aplicação voltada para séries históricas de valores extremos máximos, especialmente vazões máximas; - Distribuição Generalizada de Valores Extremos (GEV): distribuição que engloba as distribuições de extremos Tipo I (Gumbel), Tipo II (Fréchet) e Tipo III (Weibull). O ajuste de uma distribuição de probabilidades é conduzido com base em 2 ou 3 parâmetros. A estimativa destes parâmetros é feita com base na Inferência Estatística, sendo o método dos momentos, o qual calcula os parâmetros com base nos momentos estatísticos de 1a, 2a e 3a ordem, associados, respectivamente, à média, variância e assimetria, o mais simples. As distribuições Normal e de Gumbel possuem apenas os 2 primeiros parâmetros. A Log-Normal pode estar associada aos 2 primeiros, assim como a Normal, ou aos 3 parâmetros. No entanto, este método, apesar de mais aplicado, é menos preciso que outros. Os métodos da Máxima Verossimilhança e Momentos – L são também aplicados para estimativa dos parâmetros e também serão apresentados e discutidos. 4.7.2.1 Distribuição Normal ou de Gauss A distribuição de Gauss ou Normal (DN) é uma distribuição de probabilidades para variável contínua, caracterizada pela média e desvio padrão. Os valores de uma série que segue a DN se distribuem simetricamente em relação à média. Portanto, apresentam o coeficiente de assimetria igual a zero. A relação entre os valores e a probabilidade de ocorrência pode ser visualizada na Figura 4.3, cuja área até determinado ponto (ou valor), no sentido da esquerda para direita, representa a probabilidade de ocorrer valores menores ou iguais àquele valor (probabilidade de não excedência). 17 Figura 4.3 Representação da distribuição normal com seus principais parâmetros. A função densidade de probabilidade (FDP) é dada pela seguinte equação: FDP = f (x ) = 1 σ 2⋅π ⋅e −0,5⋅ (x − µ ) 2 σ (27) Em que σ é o desvio padrão e µ é a esperança ou média, ambos da população, que serão substituídas pelo desvio padrão e média amostrais, com o 1o e 2o momentos calculados da seguinte forma: ^ ^ σ = se µ = X (28) A probabilidade propriamente dita é obtida pela integração da função densidade de probabilidade (FDP), gerando a Função Cumulativa de Probabilidades (FCP). A probabilidade de não-excedência é obtida pela integração da FDP de − ∞ a um determinado valor X. A probabilidade de excedência é obtida com base na equação 1, já que a integração da FDP de − ∞ a + ∞ é igual a 1. Desta forma, tem-se para a probabilidade de não-excedência: 18 FCP = F(x ) = Pr ob(x ≤ x i ) = x 1 −∞ σ ⋅ 2 ⋅ π ⋅e −0,5⋅ (x − µ ) 2 σ dx (29) Para facilitar a generalização desta relação (valor e probabilidade), propõem-se a distribuição normal padrão, que utiliza a chamada variável reduzida ou padrão z, que mede o desvio de uma variável em relação à média, em termos do desvio padrão, ou seja: − x−x z= (30) s Observa-se que z faz o papel de KTR conforme equação geral proposta por Ven Te Chow (equação 26). Verifica-se, portanto, que a variável KTR é equivalente a z, no caso da DN. A distribuição normal passa a ser DN (0,1) que é a distribuição normal padrão e sua FCP calculada por: F(z ) = Pr ob (Z ≤ z ) = 1 ⋅ z 2 e −0,5⋅z dz (31) 2 ⋅ π −∞ Em que z é a variável reduzida. Observa-se que esta integral não apresenta solução analítica. Desta forma, pode-se utilizar a tabela de distribuição de Gauss ou tabela de z (Tabela 4.2), a qual foi gerada a partir da solução numérica da equação 31. Esta tabela fornece os valores de probabilidade, de − ∞ até o valor de z que corresponde ao valor da variável hidrológica X, correspondendo a uma tabela com probabilidades de não excedência. Além desta metodologia, pode-se trabalhar com uma aproximação razoável, utilizando a equação abaixo: ( Pr ob(Z ≤ z ) = 1 − f (z ) ⋅ a 1 ⋅ q + a 2 ⋅ q 2 + a 3 ⋅ q 3 ) (32) Em que: f (z ) = 1 2⋅π ⋅ e −0,5⋅z 2 q = (1 + a 0 ⋅ z )−1 (33) (34) Os valores para as constantes são: a0 = 0,33267; a1 = 0,43618; a2 = -0,12017; a3 = 0,9373 Devido à simetria da curva normal, a série pode ser dividida em valores “menores que” e “maiores que” a média. Deve-se ressaltar que variáveis afastadas da média do 19 mesmo valor (com os mesmos desvios) têm o mesmo tempo de recorrência, independente de ser menor ou maior que a média. Assim, se 2 valores da variável X (X1 e X2) distam da média, o mesmo desvio, tem-se o mesmo tempo de retorno para ambas. Numa situação, busca-se a possibilidade de um valor menor que a média voltar a se repetir e noutra, um valor maior que a média. Nesta situação, o cálculo de TR é conduzido considerando-se as seguintes situações: Para valores menores que a média, objetiva-se conhecer o valor de não- - excedência; Para valores maiores que a média, objetiva a probabilidade de excedência; - Pelas equações abaixo, tem-se, respectivamente, a forma de cálculo de TR para cada situação: TR = 1 ; se o valor da variável for menor que a média; P(x ≤ x i ) TR = 1 ; se o valor da variável for maior que a média; P(x ≥ x i ) Exemplo de Aplicação 4.2 Se a precipitação total anual média é de 1000 mm e o desvio padrão, 200 mm, qual o TR para as precipitações de 1200 mm e 800 mm. O cálculo de z por meio da equação 30 fornece um valor para a primeira situação, igual a 1 e para a segunda, –1. Ao se consultar a tabela de z (Tabela 4.2), encontra-se uma freqüência de não excedência para z = 1, de 0,84134 e para z = -1, 0,15865. Para o primeiro caso, o cálculo de TR é dado pela segunda equação. Assim, tem-se: TR = 1 = 6,3 anos ; o valor da probabilidade de excedência foi obtido por 1 – 0,15865 0,84134 = 0,15865. Para o segundo caso, tem-se: TR = 1 = 6,3 anos ; 0,15865 O valor da probabilidade de não excedência, neste caso, é obtido considerando-se o aspecto de simetria dos dados, ou seja, como P(z ≤ 1) é igual a 0,84134, seu complemento [P(z > 1)] 0,15865. será 0,15865. Como os valores são simétricos, P(z ≤ −1) = P(z ≥ 1) e portanto, 20 Tabela ( F(z ) = z 0.00 0.10 0.20 0.30 0.40 0.50 0.60 0.70 0.80 0.90 1.00 1.10 1.20 1.30 1.40 1.50 1.60 1.70 1.80 1.90 2.00 2.10 2.20 2.30 2.40 2.50 2.60 2.70 2.80 2.90 3.00 3.10 3.20 3.30 3.40 4.2 z 1 −∞ 2⋅π 0.00 0.5 0.5398 0.5793 0.6179 0.6554 0.6915 0.7257 0.7580 0.7881 0.8159 0.8413 0.8643 0.8849 0.9032 0.9192 0.9332 0.9452 0.9554 0.9641 0.9713 0.9772 0.9821 0.9861 0.9893 0.9918 0.9938 0.9953 0.9965 0.9974 0.9981 0.9987 0.9990 0.9993 0.9995 0.9997 Tabela de ⋅ exp − z2 dz ). 2 0.01 0.5040 0.5438 0.5832 0.6217 0.6591 0.6950 0.7291 0.7611 0.7910 0.8186 0.8438 0.8665 0.8869 0.9049 0.9207 0.9345 0.9463 0.9564 0.9649 0.9719 0.9778 0.9826 0.9864 0.9896 0.9920 0.9940 0.9955 0.9966 0.9975 0.9982 0.9987 0.9991 0.9993 0.9995 0.9997 0.02 0.5080 0.5478 0.5871 0.6255 0.6628 0.6985 0.7324 0.7642 0.7939 0.8212 0.8461 0.8686 0.8888 0.9066 0.9222 0.9357 0.9474 0.9573 0.9656 0.9726 0.9783 0.9830 0.9868 0.9898 0.9922 0.9941 0.9956 0.9967 0.9976 0.9982 0.9987 0.9991 0.9994 0.9995 0.9997 z considerando 0.03 0.5120 0.5517 0.5910 0.6293 0.6664 0.7019 0.7357 0.7673 0.7967 0.8238 0.8485 0.8708 0.8907 0.9082 0.9236 0.9370 0.9484 0.9582 0.9664 0.9732 0.9788 0.9834 0.9871 0.9901 0.9925 0.9943 0.9957 0.9968 0.9977 0.9983 0.9988 0.9991 0.9994 0.9996 0.9997 0.04 0.5160 0.5557 0.5948 0.6331 0.6700 0.7054 0.7389 0.7704 0.7995 0.8264 0.8508 0.8729 0.8925 0.9099 0.9251 0.9382 0.9495 0.9591 0.9671 0.9738 0.9793 0.9838 0.9875 0.9904 0.9927 0.9945 0.9959 0.9969 0.9977 0.9984 0.9988 0.9992 0.9994 0.9996 0.9997 probabilidade 0.05 0.5199 0.5596 0.5987 0.6368 0.6736 0.7088 0.7422 0.7734 0.8023 0.8289 0.8531 0.8749 0.8944 0.9115 0.9265 0.9394 0.9505 0.9599 0.9678 0.9744 0.9798 0.9842 0.9878 0.9906 0.9929 0.9946 0.9960 0.9970 0.9978 0.9984 0.9989 0.9992 0.9994 0.9996 0.9997 0.06 0.5239 0.5636 0.6026 0.6406 0.6772 0.7123 0.7454 0.7764 0.8051 0.8315 0.8554 0.8770 0.8962 0.9131 0.9279 0.9406 0.9515 0.9608 0.9686 0.9750 0.9803 0.9846 0.9881 0.9909 0.9931 0.9948 0.9961 0.9971 0.9979 0.9985 0.9989 0.9992 0.9994 0.9996 0.9997 de 0.07 0.5279 0.5675 0.6064 0.6443 0.6808 0.7157 0.7486 0.7794 0.8078 0.8340 0.8577 0.8790 0.8980 0.9147 0.9292 0.9418 0.9525 0.9616 0.9693 0.9756 0.9808 0.9850 0.9884 0.9911 0.9932 0.9949 0.9962 0.9972 0.9979 0.9985 0.9989 0.9992 0.9995 0.9996 0.9997 não 0.08 0.5319 0.5714 0.6103 0.6480 0.6844 0.7190 0.7517 0.7823 0.8106 0.8365 0.8599 0.8810 0.8997 0.9162 0.9306 0.9429 0.9535 0.9625 0.9699 0.9761 0.9812 0.9854 0.9887 0.9913 0.9934 0.9951 0.9963 0.9973 0.9980 0.9986 0.9990 0.9993 0.9995 0.9996 0.9997 excedência 0.09 0.5359 0.5753 0.6141 0.6517 0.6879 0.7224 0.7549 0.7852 0.8133 0.8389 0.8621 0.8830 0.9015 0.9177 0.9319 0.9441 0.9545 0.9633 0.9706 0.9767 0.9817 0.9857 0.9890 0.9916 0.9936 0.9952 0.9964 0.9974 0.9981 0.9986 0.9990 0.9993 0.9995 0.9997 0.9998 Exemplo de Aplicação 4.3 Com base na série histórica de alturas pluviométricas anuais de Lavras, MG, no período de 1914-1943, 1946-1949 e 1951-1991, obter: a) Distribuição de freqüência (tabela e gráfico), média, mediana, moda, desvio padrão e coeficiente de assimetria. 21 b) Utilize a distribuição de Gauss para calcular os valores máximos e mínimos esperados para os tempos de retorno de 10, 50, 100 e 1000 anos. c) Compare as freqüências observada e teórica, associadas às precipitações de 1068,1 mm e 2042,2 mm. d) Qual a probabilidade de ocorrer de um ano com precipitação superior a 2000 mm sabendo-se que já ocorreram 1600 mm? Tabela 4.3 Alturas pluviométricas anuais para Lavras, MG, e respectiva distribuição de freqüência. Ordem P Fnão-exc. Ordem P Fnão-exc. Ordem P Fnão-exc. 1 747,1 0,01316 29 1353,7 0,38158 57 1696,0 0,75 2 832,4 0,02632 30 1354,7 0,39474 58 1673,2 0,76316 3 999,2 0,03947 31 1355,7 0,40789 59 1683,5 0,77632 4 1001,3 0,05263 32 1374,4 0,42105 60 1686,6 0,78947 5 1068,1 0,06579 33 1377,9 0,43421 61 1689,4 0,80263 6 1093,5 0,07895 34 1380,4 0,44737 62 1705,5 0,81579 7 1109,9 0,09211 35 1393,6 0,46053 63 1719,1 0,82895 8 1170,6 0,10526 36 1398,7 0,47368 64 1726,6 0,84211 9 1171,3 0,11842 37 1413,1 0,48684 65 1728,5 0,85526 10 1183,2 0,13158 38 1427,3 0,50 66 1794,0 0,86842 11 1184,9 0,14474 39 1428,1 0,51316 67 1816,6 0,88158 12 1187,7 0,15789 40 1430,0 0,52632 68 1820,3 0,89474 13 1196,6 0,17105 41 1443,4 0,53947 69 1832,7 0,90789 14 1204,7 0,18421 42 1445,8 0,55263 70 1933,2 0,92105 15 1216,1 0,19737 43 1448,8 0,56579 71 1938,0 0,93421 16 1216,2 0,21053 44 1450,3 0,57895 72 1951,8 0,94737 17 1217,8 0,22368 45 1453,4 0,59211 73 2042,2 0,96053 18 1246,0 0,23684 46 1479,5 0,60526 74 2130,7 0,97368 19 1263,5 0,25 47 1496,3 0,61842 75 2485,6 0,98684 20 1266,7 0,26316 48 1555,8 0,63158 21 1268,6 0,27632 49 1567,4 0,64474 22 1282,5 0,28947 50 1584,3 0,65789 23 1288,8 0,30263 51 1585,1 0,67105 24 1301,2 0,31579 52 1589,1 0,68421 25 1313,0 0,32895 53 1590,0 0,69737 26 1319,8 0,34211 54 1634,1 0,71053 27 1326,6 0,35526 55 1634,1 0,72368 28 1352,8 0,36842 56 1665,3 0,73684 22 a) Distribuição de freqüência por classes 75 = 8,66 ≈ 8 classes - número de classes (k) = - amplitude total (A) = 2485,6 – 747,1 = 1738,5 - amplitude de classe (Ac) = - LIclasse 1 = 747,1 – (248,4)/2 = 622,9 - LSclasse 1 = 622,9 + 248,4 = 871,3 1738,5 + 0,1 = 248,4 8 −1 Tabela 4.4 Classes e distribuição de freqüência simples e acumulada. No Ponto médio da observações classe 622,9 – 871,3 2 747,1 0,02632 0,02632 871,3 – 1119,7 3 995,5 0,06579 0,09211 1119,7 – 1368,1 24 1243,9 0,31579 0,4079 1368,1- 1616,5 22 1492,3 0,28947 0,69737 1616,5 – 1864,9 16 1740,7 0,21053 0,9079 1864,9 – 2113,3 4 1989,1 0,05263 0,96053 2113,3 – 2361,7 1 2237,5 0,01316 0,97368 2361,7 – 2610,1 1 2485,9 0,01316 0,98685 Classes F simples F acumulada não-excedência não-excedência Moda: ponto da classe com maior número de observações. Portanto, 1243,9 mm. Mediana: valor que corresponde a exatamente 50% dos dados. Na Tabela 4.1, 1427,3 mm. Gráfico da distribuição de freqüência simples e acumulada. 23 Ca = 0,72 Observa-se que a assimetria dos dados é pequena, sugerindo-se que é possível ajustar a distribuição normal aos dados. b) Aplicação da distribuição normal de probabilidades − x = 1466,0 mm e s = 319,2 mm Equação geral de Ven Te Chow: x TR = 1466 + k TR ⋅ 319,2 Para TR = 10 anos tem-se, com base na definição deste e na condição de simetria da curva normal: P (x > xi) = 0,10; A probabilidade de não excedência é: P(x < xi) = 0,90. Consultando a tabela de z, tem-se z = 1,28. Para calcular os valores máximos e mínimos procede-se da seguinte forma: Valor máximo - xTR = 1466 + 1,28 * 319,2 = 1874,6 mm Valor mínimo - Pela simetria da curva normal, tem-se z = -1,28 e xTR = 1466 – 1,28 * 319,2 = 1057,4 mm. Os demais tempos de retorno são obtidos a partir do mesmo procedimento. c) Aplicacão da equação geral de Ven Te Chow − x−x z= s = 1068,1 − 1466 = −1,25 → Pr ob(Z ≤ −1,25 ) = 0,10628 319,2 = 2042,2 − 1466 = 1,81 → Pr ob(Z ≤ 1,81) = 0,96447 319,2 − x−x z= s d) Evento A: precipitação anual superior a 2000 mm [P(X ≥ 2000 mm )] Evento B: precipitação anual superior a 1600 mm [P(X ≥ 1600 mm )] Busca-se estimar o evento A condicionado ao evento B, portanto: P(A | B ) = P(A ∩ B ) P(X ≥ 1600 mm ) − P(X ≥ 2000 mm ) = P(B ) P(X ≥ 1600 mm ) 24 − x−x z= = s 2000 − 1466 = 1,67 → P(Z ≤ 1,67 ) = 0,9525 319,2 P(X ≥ 2000 mm ) = 1 − 0,9525 = 0,0475 − x−x 1600 − 1466 = 0,42 → P(Z ≤ 0,42) = 0,6628 s 319,2 P(X ≥ 1600 ) = 1 − 0,6628 = 0,3372 z= P(A | B ) = = P(A ∩ B ) P(X ≥ 1600 mm) − P(X ≥ 2000 mm) 0,3372 − 0,0475 = = = 0,859 P(B ) P(X ≥ 1600 mm) 0,3372 Três observações sobre o exemplo são pertinentes: a) À medida que TR aumenta, aumenta-se a precipitação máxima e diminui-se a mínima. Isto ocorre porque quando o TR fica maior, menor será a probabilidade com a qual o valor será maior (no caso de máximos) ou menor (no caso de mínimos) que um determinado valor da variável. Isto significa que, como a probabilidade é cada vez menor para que o evento ocorra, mais no extremo da curva normal o mesmo se encontrará. P2 é maior que P1, assim como P1`é menor que P2`.: TR2 > TR1. 25 b) Pode-se observar também que, para probabilidades menores que 0,01316 e maiores que 0,98684 não é possível obter o valor com base na freqüência observada, porque as freqüências extremas correspondem a estes valores, ou seja, o tamanho da amostra (série histórica) não foi suficiente para que se pudesse detectar e comparar os estimados pela distribuição de probabilidades em relação às respectivas freqüências observadas. c) Pode-se verificar que os erros na estimativa dos eventos são pequenos, indicando que a distribuição normal pode representar bem o fenômeno das precipitações totais anuais. No entanto, deve-se aplicar um teste estatístico de aderência para se concluir de forma mais efetiva, o qual será tratado em tópico específico deste capítulo. 4.7.2.2 Distribuição de Gumbel para máximos ou assintótica de valores máximos do tipo I A Função Densidade de Probabilidade (FDP) de Gumbel é dada por: FDP = α ⋅ e − α (x −µ )−e − α (x − µ ) (35) A integração da FDP fornece a função cumulativa de probabilidades (FCP): P(x ≤ xi ) = e− e − α(x − µ ) (36) Esta distribuição apresenta os 2 primeiros parâmetros de uma distribuição de probabilidades, ou seja, µ e σ , que são calculados pelas expressões abaixo, considerandose o método dos momentos: α= ^ 1,2826 s ^ − µ = x − 0,45 ⋅ s − (37) (38) Em que x e s correspondem, respectivamente, à média e o desvio padrão da série histórica. 26 Para estimativa de uma variável hidrológica x em função do TR, aplica-se a equação abaixo, fruto da manipulação da equação 36 e da consideração de TR como função da probabilidade de excedência: − LN − LN 1 − x TR = 1 TR +µ α (39) 4.7.2.3 Distribuição Generalizada de Extremos – GEV A distribuição GEV (do inglês “Generalized Extreme Value”) foi introduzida por Jenkinson (1955), incorporando as 3 formas assintóticas: Gumbel (Tipo I), Fréchet (Tipo II) e Weibull (Tipo III). Sua FDP é dada por: 1 x−µ FDP = f (x ) = ⋅ 1 + ξ ⋅ σ σ − 1+ ξ ξ x−µ ⋅ exp − 1 + ξ ⋅ σ − 1 ξ (40) Em que ξ, σ e µ são, respectivamente, os parâmetros de forma, escala e posição. Se ξ for negativo, a GEV representa a forma assintótica de valores mínimos (Tipo III) e existe apenas para x < (µ − σ ) . ξ Se ξ for positivo, a GEV representa uma distribuição Tipo II (Fréchet), definida para x > (µ − σ ) . Se ξ = 0 , tem-se a Distribuição Gumbel. Sua FCP é ξ dada por: x−µ FCP = P( X ≥ xi) = exp − 1 + ξ ⋅ σ − 1 ξ (41) A Distribuição GEV apresenta 3 momentos estatísticos: E[x ] = x = µ + Var (x ) = σ ξ 2 σ ⋅ [Γ(1 − ξ ) − 1] ξ [ (42) ] ⋅ Γ(1 − 2 ⋅ ξ) − Γ 2 (1 − ξ) γ = CA = (sin al de ξ ) ⋅ (43) − Γ(1 − 3 ⋅ ξ ) + 3 ⋅ Γ(1 − ξ) ⋅ Γ(1 − 2 ⋅ ξ) − 2 ⋅ Γ 3 (1 − ξ ) [Γ(1 − 2 ⋅ ξ) − Γ 2 (1 − ξ )] 3 2 (44) 27 Para estimar os parâmetros da Distribuição GEV deve-se inicialmente calcular o parâmetro de forma pela equação 44. Para isto, é importante observar qual sinal ξ tem para a situação em estudo, o que é obtido mediante análise do coeficiente de assimetria (distorção). Para ξ = 0, γ = 1,1396; valores de γ superiores a este valor, ξ < 0; valores de γ menores que 1,1396 implica em ξ > 0 até o valor de -1/3. A estimativa de uma variável hidrológica associada a um tempo de retorno é dada por, considerando-se freqüência de excedência: x TR = µ + −ξ σ 1 ⋅ 1 − − LN 1 − ξ TR (45) 4.7.2.4 Distribuição de Fréchet ou Log-Gumbel Também conhecida como Distribuição de Fréchet, consiste da aplicação da Distribuição Gumbel aos valores logaritmizados da variável hidrológica. Fréchet aplicou-a para estudar as freqüências de vazões de cheias, sendo muito útil aos estudos que envolvem variáveis hidrológicas máximas. Sua FDP e FCP são, respectivamente: FDP = f (x ) = θ λ ⋅ λ x θ+1 λ x ⋅ exp − λ FCP = P(X ≥ xi) = 1 − exp − x θ (46) θ para x > 0; θ, λ > 0 (47) Sendo F(x) a freqüência de excedência. São 3 momentos estatísticos: E(x ) = µ = λ ⋅ Γ 1 − 1 para θ > 1 θ Var (x ) = σ 2x = λ2 ⋅ Γ 1 − 2 1 − Γ2 1− θ θ 2 θ − 1 para θ > 2 1 1− θ (48) para θ > 2 (49) Γ 1− CV = Γ2 (50) 28 A obtenção dos parâmetros desta distribuição começa com a equação 50 a partir do coeficiente de variação; em seguida, calcula-se o parâmetro λ com a equação 48, partindose da média. A estimativa de um valor x, associado a um TR, é dada por: TR = λ ⋅ LN TR − 1 x TR − 1 θ (51) 4.7.2.5 Distribuição de Gumbel para mínimos ou assintótica de valores mínimos extremos do tipo I Esta distribuição de probabilidades consiste de uma versão da Distribuição de Gumbel, com a diferença de se trabalhar com séries históricas de valores mínimos, normalmente vazões mínimas. Na estimativa do parâmetro µ, troca-se o sinal. A definição dos parâmetros da distribuição, pelo método dos momentos, é dada por: α= ^ 1,2826 s ^ − (52) (53) µ = x + 0,45 ⋅ s A FDP é definida por: FDP = α ⋅ e α⋅(x −µ )− eα (x − µ ) (54) A FCP é dada pela probabilidade de não excedência: P(x ≤ x i ) = 1 − e −e α (x − µ ) (55) Para estimativa de uma variável hidrológica x em função do TR, aplica-se a equação abaixo, fruto da manipulação da equação 55 e da consideração de TR como função da probabilidade de não excedência: LN − LN 1 − x TR = α 1 TR +µ (56) 29 Exemplo de Aplicação 4.4 Dada uma série histórica de 16 anos de precipitação máxima diária anual para a cidade de Lavras, MG, no período de 1915 a 1930 (Tabela 4.5). Determinar: a) Distribuição de freqüência simples de não-excedência dos dados; b) Aplicar as distribuições Gumbel, GEV e Fréchet e determinar a precipitação máxima diária para TR de 5, 10 e 20 anos; c) Determinar o TR para as precipitações máximas diárias anuais de 80 e 90 mm; Tabela 4.5 Precipitações máximas diárias anuais para Lavras, MG no período de 1915 a 1930 e respectivas freqüências observadas de não excedência. Ordem Precipitação F não exced. Ordem (mm) Precipitação F não exced. (mm) 1 46,2 0,05882 9 64,2 0,52941 2 50,0 0,11765 10 66,9 0,58824 3 50,4 0,17647 11 78,2 0,64706 4 57,0 0,23529 12 78,6 0,70588 5 58,7 0,29412 13 78,7 0,76471 6 60,2 0,35294 14 80 0,82353 7 61,6 0,41176 15 85,5 0,88240 8 63,4 0,47059 16 88,5 0,94120 30 Observa-se que as distribuições se ajustaram de forma razoável às freqüências observadas, com destaque para a distribuição GEV para os valores mais baixos da série, Fréchet para os intermediários e Gumbel para os maiores. Contudo, nenhuma delas se ajustou bem aos dados próximos ao valor de 80 mm, uma vez que são números muito próximos e com freqüências distintas, dificultando o ajuste da distribuição. a) Estimativa dos valores de precipitação associados aos TRs de 5, 10 e 20 anos Distribuição Gumbel Os parâmetros ajustados para esta distribuição foram: α = 0,0968; µ = 60,80. Aplicando-se estes parâmetros à equação 39 chega-se aos seguintes valores: TR = 5 anos.: XTR = 76,30 mm TR = 10 anos.: XTR = 84,05 mm TR = 20 anos.: XTR = 91,50 mm Distribuição GEV Para esta distribuição, os parâmetros estimados foram: ξ = 0,2329; σ = 10,69; µ = 60,8685. Aplicando-se a equação 45, chega-se aos seguintes valores: TR = 5 anos . : XTR = 73,56 mm; TR = 10 anos . : XTR = 77,94 mm; TR = 20 anos . : XTR = 81,24 mm; Distribuição Fréchet Os parâmetros estimados para esta distribuição foram: θ = 7,313; λ = 60,68. Aplicando-se a equação 51, chega-se aos seguintes valores: TR = 5 anos.: XTR = 74,5 mm; TR = 10 anos.: XTR = 82,54 mm; TR = 20 anos.: XTR = 91,08 mm; 31 b) Estimativa de TR para as precipitações de 80 e 100 mm Distribuição de Gumbel Aplicando o inverso do complemento da equação 36, chega-se a: P = 80 mm.: TR = 7 anos P= 90 mm.: TR = 17,4 anos Distribuição GEV Aplicando-se a inversa da equação 41, chega-se aos seguintes valores: P = 80 mm.: TR = 10,6 anos P = 90 mm.: TR = 76 anos Distribuição Fréchet Aplicando-se o inverso da equação 47, chega-se aos seguintes valores: P = 80 mm.: TR = 8,1 anos P = 90 mm.: TR = 13,4 anos Observa-se que a Distribuição GEV tende a superestimar o TR, especialmente para valores mais altos, por se caracterizar, neste caso como uma distribuição Tipo III, a qual para valores máximos, consiste de uma exponencial apenas, refletindo em valores mais elevados. A partir de valores em torno de 80 mm (observar gráfico de ajuste), a distribuição GEV proporciona ajustes mais distantes dos valores de freqüência observados, o que não ocorre com as outras duas distribuições. 4.7.2.6 Distribuição Log-normal a 2 parâmetros A função densidade de probabilidades (FDP) desta distribuição a seguinte: FDP = 1 x ⋅ σn ⋅ 2 ⋅ π ⋅e −0,5⋅ Ln(x )−µn σn 2 (57) Os parâmetros são determinados por: n (Ln(x )) µ n = i=1 n (58) 32 σn = desvio padrão dos dados transformados. Os valores dos parâmetros desta distribuição podem ser estimados com base na média e desvio padrão dos dados sem transformação logarítmica. As equações são: µn = −4 1 ⋅ Ln 2 x (59) −2 x + s2 −2 x + s2 σ n = Ln (60) −2 x Esta distribuição se assemelha à Normal, porém, trabalhando-se com o logarítmo dos dados. A variável reduzida kTR é o próprio valor de z utilizado na Distribuição Normal. Assim, a equação geral de Ven Te Chow é trabalhada da seguinte forma: x TR = e µn + k TR ⋅ σn (61) 4.7.2.7 Distribuição Log-normal a 3 parâmetros Neste caso, a FDP é dada em função de 3 parâmetros, tendo-se a seguinte estrutura: FDP : f (x ) = 1 (x − β) ⋅ σ n ⋅ 2⋅π ⋅e −0,5⋅ Ln(x −β )−µn σn 2 , com x ≥ β . (62) Para estimar os parâmetros da distribuição log-normal, com base numa série histórica de dados, as seguintes equações são aplicadas: − β = x− ηy = s ηy (63) (1 − φ ) 23 ( − γ + γ2 + 4 φ= (64) φ1 3 2 ) 0,5 (65) 33 Com base no coeficiente de assimetria - Ca (equação 22) calcula-se γ . Com isto, estima-se φ (equação 65), ηy (equação 64) e com base neste último valor e na média e desvio padrão dos dados, o parâmetro β , na equação 63. Os parâmetros µn e σn são calculados com base nas seguintes equações: µ n = Ln ( ) s − 0,5 ⋅ Ln η y 2 + 1 ηy ( ) σ n = Ln η y 2 + 1 (66) (67) Neste caso, a variável xTR é calculada por: x TR = e µn +k TR ⋅σn + β (68) Exemplo de Aplicação 4.5 Determinar a precipitação provável para 10, 75 e 90% de probabilidade, com base na série histórica de precipitação associada ao 1o decêndio (Tabela 4.6) do mês de janeiro, de 1960 a 1981, para a cidade de Lavras, MG. Calcule também, o TR para uma precipitação decendial de 310 mm nos primeiros 10 dias de janeiro. Aplique as distribuições log-normal 2P, log-normal 3P e GEV. 1o) Aplicação da Distribuição Log-normal a 2 parâmetros A precipitação provável sugere um estudo probabilístico de valores mínimos a serem garantidos, ou seja, visa-se à uma probabilidade de um dado valor x superar um xi. Esta situação diz respeito, portanto, à probabilidade de excedência. O cálculo dos parâmetros µ n e σ n foi feito com base no cálculo da média dos dados logaritmizados, obtendo-se para o primeiro 4,358 e para o segundo 0,8985. - Para 10% de probabilidade, P(x>xi) = 10% .: P(x<xi) = 90%. Da tabela de z, o valor deste, para 90% de probabilidade, é 1,28. Assim, a precipitação provável associada a esta probabilidade: x TR = e µn +k TR ⋅σn = e 4,358 +1,28⋅0,8985 = 246,7 mm . Disto conclui-se que, com uma probabilidade de 10%, a precipitação provável para os primeiros 10 dias de janeiro é de 246,7 mm. 34 - Para 75% de probabilidade, P(x>xi) = 75%.: P(x<xi) = 0,25%. Da tabela de z, obtém-se valor aproximadamente igual a –0,67. Da mesma forma anterior, a precipitação provável será 42,78 mm. Espera-se uma precipitação mínima para os primeiros 10 dias de janeiro, de 42,78 mm, com 75% de probabilidade. - Para 90% de probabilidade, P(x>xi) = 90%.: P(x<xi) = 10%. Da tabela de z, obtém-se este aproximadamente igual a –1,28. Da mesma forma anterior, a precipitação provável será 24,7 mm. Tabela 4.6 Série histórica de precipitação associada ao 1º decêndio de janeiro para Lavras, MG, no período de 1960 a 1981, e respectivas freqüências observadas. Ordem Precipitação Fexcedência Ordem (mm) Precipitação Fexcedência (mm) 1 290 0,04545 12 84,8 0,54545 2 253,2 0,09091 13 78,5 0,59091 3 189,9 0,13636 14 69,9 0,63636 4 162,8 0,18182 15 53,5 0,68182 5 144,8 0,22727 16 52,4 0,72727 6 141,2 0,27273 17 42,2 0,77273 7 140,3 0,31818 18 29,2 0,81818 8 135,3 0,36364 19 25,5 0,86364 9 111,7 0,40909 20 17,6 0,90909 10 97,8 0,45455 21 8,4 0,95455 11 95,9 0,50000 Analisando os resultados, observa-se que quanto maior a probabilidade de um evento exceder um dado valor, menor será o evento, uma vez que a probabilidade do valor ser superado aumenta. Em contrapartida, quanto menor a probabilidade de excedência, maior será o valor, haja vista que o risco assumido é maior (a probabilidade do valor ser superado é maior). Para determinar o TR para uma precipitação mínima de 340 mm, com base nesta série histórica, procede-se da seguinte forma: Determina-se kTR e com este valor, na tabela de z, a probabilidade de nãoexcedência. Determina-se então a de excedência, e aplica-se na definição de TR para variáveis cujos estudos interessam a sua superioridade. 35 x TR = e µn + k TR ⋅ σn = 340 = e 4,358 + k TR ⋅0,8985 k TR = 1,64 Na tabela de z, obtém-se uma P(x<xi) = 0,94949 e P(x>xi) = 0,05051. O TR será então igual a 19,8 anos. A probabilidade do valor de 340 mm ser igualado ou superado, pelo menos uma vez, em 20 anos, é de 0,05051. 2o) Aplicando-se o modelo Log-normal a 3 parâmetros Neste caso, o procedimento consiste no cálculo da média, desvio padrão e coeficiente de assimetria dos dados. Assim: − x = 105,95 mm s = 75,07 mm Ca = 0,9845 Aplicando a equação 65, em que Ca = γ , determina-se φ : ( − γ + γ2 + 4 φ= 2 ) 0,5 ( − 0,9845 + 0,9845 2 + 4 = ) 0,5 = 0,6223 2 Na seqüência, aplicando-se a equação 64, obtém-se: 2 ηy = (1 − φ ) = 23 φ1 3 1 − 0,6223 3 = 0,3175 1 0,6223 3 Com a equação 63, determina-se o 3o parâmetro, que representa a assimetria dos dados: − β = x− s 75,07 = 105,95 − = −130,47 ηy 0,3175 Com estas informações, estima-se µ n e σ n com nas equações 66 e 67: µ n = Ln ( ) ( ) s 75,07 2 − 0,5 ⋅ Ln η y + 1 = Ln − 0,5 ⋅ Ln 0,3175 2 + 1 = 5,418 ηy 0,3175 36 ( ) ( ) σ n = Ln η y 2 + 1 = Ln 0,3175 2 + 1 = 0,3099 - Para P(x>xi) = 10%, o valor de z, conforme exemplo anterior,,é 1,28. Assim, a precipitação será: x TR = e µn +k TR ⋅σn + β = e 5,418 +1,28⋅0,3099 − 130,47 = 204,71 mm - Para P(x>xi) = 75%, o valor de z é –0,67, e a precipitação mínima será: xTR = 52,7 mm - Para P(x>xi) = 90%, o valor de z é de –1,28 e a precipitação será: xTR = 21,1 mm. Cálculo de TR para 340 mm com base na distribuição com 3 parâmetros: kTR = 2,37.: P(x<xi) = 0,9911 e P(x>xi) = 0,0089 e TR = 112,4 anos. Nota-se uma grande diferença entre os cálculos dos dois modelos para a estimativa deste TR. 3o Aplicando a Distribuição GEV O cálculo da assimetria dos dados produziu um valor de 0,9845. Aplicando-se a equação 44, considerando sinal negativo, chega-se ao valor do parâmetro de forma desta distribuição, o qual é igual a 0,02742. Na seqüência, aplicando o momento de segunda ordem, encontra-se o parâmetro de escala igual a 60,587. Com a equação 42 e os demais parâmetros, é possível estimar o parâmetro de posição µ como sendo igual a 72,58. Desta forma, com a equação 41, são estimados os valores de precipitação associados aos níveis de probabilidade de excedência. Para Prob (x>xi) = 90%: P = 21,5 mm; Para Prob (x>xi) = 75%: P = 52,7 mm; Para Prob (x>xi) = 10%: P = 204,8 mm. Comparando-se as estimativas da precipitação pelas três distribuições ao valor obtido com base na freqüência observada, é possível desenvolver o seguinte quadro resumo dos resultados: 37 P(x>xi) LN 2P (mm) LN 3P (mm) GEV (mm) 10 246,7 204,7 204,8 75 42,8 52,7 52,7 90 24,7 21,1 21,5 Obs.: A análise da distribuição de probabilidades que é mais precisa pode ser obtida mediante testes estatísticos apropriados, os quais permitirão verificar a adequação da distribuição bem como inferir sobre sua precisão propriamente dito. 4.7.2.8 Distribuição Gama Consiste de uma distribuição de probabilidades com ampla aplicação à hidrologia, com destaque para precipitação provável e vazões de maneira geral. Sua Função Densidade de Probabilidades (FDP), considerando sua versão a 2 parâmetros, é: FDP : f (x ) = 1 β υ × Γ(υ) ⋅x υ−1 ⋅e −x β (69) Os parâmetros desta distribuição são β e υ, os quais podem ser obtidos por: β= s2 (70) X (X) υ= 2 (71) s2 A função Gama de um número qualquer pode ser aproximada por2: Γ(n) = 5 p 2π i ⋅ po + n i=1 n + i ⋅ (n + 5.5 )n+0.5 ⋅ e − (n+5.5 ) (72) Para esta estimativa considerar: po = 1,000000000190015; p1 = 76,180091729471460; p2 = -86,505320329416770; p3 = 24,014098240830910; p4 = -1,231739572450155; p5 = 1,208650973866179x10-3 No entanto, com auxílio do software Excel, é possível obter a função gama de um número qualquer de forma rápida e precisa, utilizando a função “exp(LNGAMA(n))”, sendo n o número cujo gama deseja-se obter. 2 Trabalho desenvolvido por Press et al. (1992) com erro absoluto menor que 2x10-10 e citado por Ferreira (2005). 38 A Função Cumulativa de Probabilidades (FCP) deve ser obtida, primeiramente, entre cada um dos valores da variável x de forma ordenada, para posterior somatório. Para isto, procede-se calculando as integrais para cada intervalo de x de forma numérica: xi+1 xi f (x ) ⋅ dx = (x i+1 − x i ) ⋅ [f (x i ) + f (x i+1 )] 2 (73) Portanto, a FCP é calculada por: x P(X ≤ x ) = f (x ) ⋅ dx (74) 0 A FDP para a versão a 3 parâmetros é: FDP : f (x ) = 1 β υ × Γ(υ) ⋅ (x − µ ) υ −1 ⋅e − (x − µ ) β (75) A estimativa dos parâmetros desta equação, com base no método dos momentos, é: υ= β= 4 (76) as 2 as ⋅ s 2 µ = X− 2⋅s as (77) (78) Em que s é o desvio padrão e as é o coeficiente de assimetria. A versão desta distribuição a 3 parâmetros pode produzir melhores resultados, contudo, os graus de liberdade do ajuste também podem ficar comprometidos. Alguns estudos desenvolvidos para precipitação provável têm mostrado desempenho similar destas distribuições, optandose, normalmente pela versão a 2 parâmetros. 4.7.2.9 Distribuição Weibull Esta distribuição apresenta aplicações a séries históricas de valores mínimos, sendo, normalmente trabalhada para séries de vazões mínimas ou similares. A distribuição de Weibull é uma derivação da distribuição Assintótica de Valores Extremos. Sua FDP é dada por: 39 FDP : f (x ) = λ ⋅ β ⋅ x β −1 ⋅ e −λ⋅x β (79) A Função Cumulativa de Probabilidades (FCP) é dada por: FCP : P(X ≤ x ) = 1 − e −λ⋅x β (80) Os parâmetros desta distribuição são λ e β, que estão associados à média e variância, respectivamente, por: 1 µ=X= λ ^ ^ 2 1 β 1 σ =s = λ 2 ⋅ Γ 1+ 2 β 1 β ⋅ Γ 1+ (81) 2 1 − Γ 1+ β β 2 (82) O valor da variável x associada ao tempo de retorno (TR) pode ser calculado por: 1 Ln 1 − TR x= -λ 1 β (83) Exemplo de Aplicação 4.6 Com base nas distribuições de probabilidade Weibull, Gumbel e GEV determinar a vazão mínima de sete dias consecutivos para os TRs de 10, 20 e 50 anos, com base numa série histórica de vazão mínima com 7 dias consecutivos, de 68 anos para o Rio Grande, sul de Minas Gerais (Tabela 4.7). Calcule também, o TR para uma vazão mínima esperada de 6 m3 s-1 por ambas as distribuições. 40 Tabela 4.7 Série histórica de vazões mínimas com 7 dias consecutivos do Rio Grande com seção de controle em Madre de Deus e respectivas freqüências observadas. Ordem 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 Vazão 8,97 10,41 11,32 11,50 13,10 13,15 13,57 14,46 14,95 14,95 15,66 16,04 16,06 16,18 16,20 16,32 16,39 17,00 17,02 17,04 17,04 17,48 17,57 17,66 17,72 17,88 18,09 18,77 18,79 18,79 18,80 19,04 19,41 19,48 Fnão-excedência 0.01449 0.02899 0.04348 0.05797 0.07246 0.08696 0.10145 0.11594 0.13043 0.14493 0.15942 0.17391 0.18841 0.20290 0.21739 0.23188 0.24638 0.26087 0.27536 0.28986 0.30435 0.31884 0.33333 0.34783 0.36232 0.37681 0.39130 0.40580 0.42029 0.43478 0.44928 0.46377 0.47826 0.49275 Ordem 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 Vazão 19.49 19.53 19.67 19.87 19.89 19.98 20.11 20.21 20.39 20.83 21.08 21.61 22.11 22.16 22.40 22.41 22.72 22.84 23.19 23.79 24.76 24.78 25.16 25.24 25.41 25.72 26.60 26.62 26.96 27.90 29.24 30.30 32.50 38.25 Fnão-excedência 0.50725 0.52174 0.53623 0.55072 0.56522 0.57971 0.59420 0.60870 0.62319 0.63768 0.65217 0.66667 0.68116 0.69565 0.71014 0.72464 0.73913 0.75362 0.76812 0.78261 0.79710 0.81159 0.82609 0.84058 0.85507 0.86957 0.88406 0.89855 0.91304 0.92754 0.94203 0.95652 0.97101 0.98551 1o) Aplicação da distribuição de Weibull Trabalhando com os dados da Tabela 4.7, calcula-se a média e desvio padrão dos dados da mesma. Assim, tem-se: − x = 20,01 m3 s-1 s = 5,276 m3 s-1 Manipulando as equações 81 e 82, pode-se chegar à seguinte equação: 41 2 µ 2 σ = Γ 1+ 2 1 ⋅ Γ 1+ − Γ 1+ β β 1 β 2 (84) Com isto, é possível estimar o parâmetro β e a partir daí, com a média dos dados, o parâmetro λ na equação 81. Respectivamente, tem-se: β = 4,283378; λ = 1,78219 x 10-6 Aplicando-se a equação 83, para todos os TRs, tem-se: TR = 10 anos: Q = 13 m3/s; TR = 20 anos: Q = 10,99 m3/s; TR = 50 anos: Q = 8,84 m3/s; Com base na equação abaixo, calcula-se TR para Q = 6 m3 s-1, ou seja: TR = 1 1 − e − λ⋅ x (85) β TR = 261 anos 2o) Aplicação da distribuição Gumbel (série de mínimos) Cálculo dos parâmetros da distribuição: ^ α= 1,2826 = 0,2431 s ^ µ = X + 0,45 ⋅ s = 20,01 + 0,45 ⋅ 5,276 = 22,38 Para TR = 10 anos LN − LN 1 − x TR = 1 TR α LN − LN 1 − +µ = 0,2431 1 10 + 22,38 = 13,12 m3/s Valendo-se do mesmo procedimento, tem-se para os demais tempos de retorno: TR = 20 anos: Q = 10,16 m3 s-1 TR = 50 anos: Q = 6,33 m3 s-1 42 Determinação de TR: TR = 1 1 = P(X ≤ xi) 1 − exp(− exp(α ⋅ (x − µ ))) TR = 1 = 54,12 anos 1 − exp(− exp(0,2431 ⋅ (6 − 22,38 ))) 3o Aplicando-se a Distribuição GEV O coeficiente de assimetria da série histórica é igual a 0,7195, gerando os seguintes parâmetros da GEV: σ = 0,5332; α= 5,7207; β = 18,8035. Com estes valores e aplicando a equação correspondente, tem-se: Para TR = 10 anos: Q = 12,79 m3/s; Para TR = 20 anos: Q = 10,27 m3/s; Para TR = 50 anos: Q = 7,33 m3/s. O cálculo de TR para uma vazão mínima de 7 dias consecutivos igual a 6 m3/s, produziu um valor de 78,5 anos. Observações A comparação das distribuições mostra que para valores mais altos de vazão, a estimativa da freqüência tende a ser próxima, especialmente Weibull e GEV. Para valores menores, observa-se discrepância nas estimativas, com a GEV mais próxima da Distribuição Gumbel. 4.8 Estimação dos parâmetros das distribuições de probabilidades com base na Máxima Verossimilhança 4.8.1 Definições O Método da Máxima Verossimilhança consiste de uma metodologia desenvolvida por Fisher em 1922, no qual se busca a maximização da probabilidade (plausibilidade) de um parâmetro representar uma população, maximizando a densidade conjunta dos elementos amostrais. A função de verossimilhança é matematicamente definida pelo produtório das densidades de cada valor amostral, sendo este dado por x1, x2, x3, etc, ou seja: n L = f (x1) ⋅ f (x 2) ⋅ f (x3 )...f (xn) = ∏ f (xi) i=1 (86) 43 Assim, a máxima verossimilhança consiste em encontrar o ponto de máximo da função acima, derivando-a em relação a cada um dos seus parâmetros, e igualando-se a zero. Supondo uma distribuição de probabilidades com 1 parâmetro, como, por exemplo, Poisson, tem-se: P(x ) = e −λ x ⋅λ x! (87) Em que λ é o parâmetro e x uma variável aleatória discreta. Uma pergunta pode ser feita: “Qual o melhor parâmetro λ que maximizará a probabilidade de x ser igual a 10?” Assim, a idéia geral dos estimadores de Máxima Verossimilhança é a seguinte: Pelo esquema acima, percebe-se que existem vários valores do parâmetro que podem ser utilizados para calcular a probabilidade de x ser igual a 10. Matematicamente, o que maximizará esta probabilidade é o valor de λ que satisfará a equação abaixo: dP =0 dλ (88) Para distribuições contínuas com mais de um parâmetro, tem-se uma superfície e duas outras equações, constituindo um sistema para obtenção dos parâmetros correspondentes ao ponto de máximo. Para facilitar a solução matemática do ponto de 44 máximo, é necessário linearizar a equação 86, obtendo-se a função logaritmo de verossimilhança (log (L)): log(L ) = log f (x1) + log f (x 2) + log f (x3 ) + ... + log f (xi) = n log f (xi) (89) i=1 Considerando uma distribuição contínua com parâmetros θ1 e θ2, tem-se: ∂ log(L ) =0 ∂θ1 Sistema de Equações para obtenção dos parâmetros θ1 e θ2. ∂ log(L ) =0 ∂θ2 A seguir serão apresentadas as soluções do sistema acima para as distribuições de probabilidades apresentadas anteriormente. 4.8.2 Distribuição Normal A Distribuição Normal é caracterizada pela seguinte expressão: ( ) FDP. : f x; µ, σ 2 = 1 2π ⋅ σ 2 (x − µ )2 ⋅ exp− (90) 2 ⋅ σ2 Aplicando-se o conceito definido pela equação 89, tem-se: n n L = ∏ f (xi) = ∏ i=1 i=1 1 2π ⋅ σ 2 ⋅ exp− (x − µ )2 2⋅σ 2 = 1 (2π ⋅ σ ) 2 n exp− 2 1 2σ n 2 (xi − µ )2 i=1 (91) Linearizando a equação 91, tem-se: ( ) n n 1 ln(L ) = − ln(2π ) − ln σ 2 − 2 2 2σ 2 n i=1 (xi − µ )2 (92) Finalmente, derivando-se a equação acima em relação a µ e σ2, igualando-se a zero, tem-se: 45 ∂ ln L ∂σ =− 2 n 2⋅σ + 2 1 ( ) 2σ 2 2 ⋅ n i=1 (xi − µ )2 ∂ ln L 1 n = 2 ⋅ (xi − µ ) ∂µ σ i=1 (93) (94) Assim, igualando as equações acima a zero, é possível resolver em função dos parâmetros µ e σ2, obtendo-se sua estimativa por Máxima Verossimilhança: n µ= i=1 σ2 = xi − =x (95) (n − 1) ⋅ S 2 (96) n n Observa-se que estas equações são utilizadas na maioria das vezes em que a Distribuição Normal é aplicada. 4.8.3 Distribuição Gumbel para máximos A FDP da distribuição Gumbel é dada por: f (x; α, µ ) = α ⋅ e −α⋅(x −µ )−e − α⋅(x −µ ) (97) Sua função logaritmo de verossimilhança é: ln L = ln L = n ln(α ) ⋅ e −α⋅(xi−µ )−e − α (xi−µ ) i=1 n n 1 ⋅ ln(α ) + − α ⋅ (xi − µ ) + e − α⋅(xi−µ ) n i=1 i=1 (98) (99) Derivando-se em relação a α e µ, igualando-se a zero, tem-se: n 1 = X− α i=1 x i ⋅ exp(− α ⋅ x i ) n i =1 exp(− α ⋅ x i ) (100) 46 n exp(− α ⋅ µ ) = i =1 exp(− α ⋅ x i ) n (101) A solução deste sistema de equações é desenvolvida solucionando-se a equação 100 para α e substituindo-se este valor na equação 101, encontrando-se µ. Exemplo de Aplicação 4.7 Compare o comportamento das freqüências estimadas pela distribuição Gumbel, com parâmetros obtidos pelos Métodos dos Momentos e da Máxima Verossimilhança. A série histórica de chuvas máximas diárias anuais apresentada na Tabela 4.8 é do município de Barbacena, MG. A distribuição Gumbel ajustada com base no método dos momentos propiciou a estimativa dos parâmetros α e µ, respectivamente iguais a 0,064829 e 68,57729. Pelo método da máxima verossimilhança obteve-se, respectivamente, 0,0557329 e 67,74231. Os gráficos da Figura 4.4, na seqüência, representam os ajustes das freqüências teóricas às observadas. Figura 4.4 Ajustes da distribuição Gumbel, por Máxima Verossimilhança (MV) e Método dos Momentos (MM), para série histórica de precipitação máxima diária anual para a cidade de Barbacena, MG. 47 Tabela 4.8 Série histórica de precipitação máxima diária para o município de Barbacena, MG. Ordem hdia Ordem hdia Ordem hdia 1 43.20 25 73.20 49 97.20 2 43.80 26 74.00 50 97.60 3 47.60 27 74.20 51 100.00 4 47.60 28 75.40 52 100 5 49.00 29 77.00 53 100.20 6 49.40 30 78.20 54 101.00 7 49.80 31 79.00 55 105.50 8 50.00 32 81.00 56 111.50 9 50.20 33 82.00 57 116.40 10 53.20 34 82.60 58 121.00 11 57.00 35 83.00 12 58.00 36 86.40 13 58.40 37 88.20 14 60 38 88.20 15 63.20 39 89.00 16 65.00 40 90.00 17 65.00 41 90.40 18 65.60 42 92.60 19 66.00 43 93.00 20 66.00 44 93.20 21 68.00 45 95.00 22 70.00 46 95.00 23 72.60 47 96.20 24 72.60 48 96.60 É possível observar um melhor ajuste da distribuição Gumbel ajustada com base em parâmetros estimados pela Máxima Verossimilhança, avaliando maior proximidade entre as freqüências estimadas pela distribuição e as freqüências observadas. Isto também pode ser comprovado pelo teste Qui-quadrado, onde obteve-se um valor de 7,3 para a distribuição ajustada por máxima verossimilhança e 13,9 para a distribuição ajustada pelo método dos momentos, enquanto o Qui-quadrado tabelado é de 14,1. Avalia-se que por este último método, a distribuição quase não foi adequada e a grande diferença entre os valores de Quiquadrado reflete a precisão do ajuste3. Detalhes da aplicação do teste de Qui-quadrado serão apresentados em tópico específico sobre Testes de Aderência. 3 Conforme Walpole & Mayers (1978). 48 4.8.4 Distribuição Gama A distribuição Gama possui a seguinte formulação, na forma incompleta, para sua FDP: f (x; β, υ) = 1 β υ ⋅ Γ(υ) ⋅x υ −1 ⋅e −x β (102) Sua função log-verossimilhança é dada por: n ln L(β, υ) = −n ⋅ υ ⋅ ln(β ) − n ⋅ ln[Γ(υ)] + (υ − 1) ⋅ ln xi ln(xi) − i=1 β i=1 n (103) As derivadas parciais de ln (L) em relação a α e β igualadas a zero produz: ln(υ) − ψ(υ) = ln X (104) XG Em que ψ(υ) corresponde à função digama de υ e X G é a média geométrica dos dados. A função digama pode ser aproximada por uma série de potência da seguinte forma: ψ (υ) ≅ ln(υ) − 1 1 1 1 1 − + − + ... 2 ⋅ υ 12 ⋅ υ 2 120 ⋅ υ 4 252 ⋅ υ 6 240 ⋅ υ 8 (105) A solução da equação 105 permite estimar o valor de υ e assim, calcula-se β da seguinte forma: β= X υ (106) 4.8.5 Log-normal 3 parâmetros A FDP da distribuição log-normal 3 parâmetros é dada por: f (x; a, σ, µ ) = −1 1 (x − a ) ⋅ σ ⋅ 2π ⋅e 2⋅σ 2 ⋅(log(x −a )−µ )2 (107) 49 Para a estimativa dos parâmetros pela Máxima Verossimilhança, adota-se o seguinte procedimento: Faz-se x* = x – a e os parâmetros µ e σ são obtidos por: n µ= i=1 (log x ) * (108) n n σ= i i=1 ( log x i * − µ ) 2 (109) n Assim, o parâmetro a é testado, avaliando-se a função log-verossimilhança, até que haja maximização desta função. A função de log-verossimilhança é dada por: ln L(x; µ, σ, a ) = −n ⋅ log(σ ) − ( ) ( n n ⋅ log(2π ) n 1 − log x i * − ⋅ log x i * − µ 2 2 i=1 2 ⋅ σ i=1 ) 2 (110) Exemplo de Aplicação 4.8 Compare os ajustes das freqüências teóricas às observadas para vazões mínimas anuais do Rio Aiuruoca, região Alto Rio Grande, MG, produzidos pelas distribuições Gama Incompleta e Log-normal 3 parâmetros, ajustadas por máxima verossimilhança à série histórica apresentada na Tabela 4.9. 50 Tabela 4.9 Série histórica de vazões mínimas diárias anuais do Rio Aiuruoca, região Alto Rio Grande. Ordem Vazão Ordem Vazão 1 4,71 15 7,48 2 5,34 16 7,53 3 5,72 17 7,57 4 6,00 18 7,62 5 6,18 19 7,70 6 6,43 20 7,92 7 6,45 21 8,01 8 6,72 22 8,09 9 6,81 23 8,22 10 6,87 24 8,77 11 6,95 25 8,94 12 7,05 26 9,75 13 7,13 27 10,25 14 7,40 28 10,69 29 17,50 É possível observar um ligeiro melhor ajuste da distribuição log-normal 3 parâmetros, o que pode ser constatado também pelos valores de Qui-quadrado calculados para ambos, onde para a distribuição log-normal 3 parâmetros este valor foi de 0,233 enquanto para distribuição Gama de 0,297. Figura 4.5 Ajustes das distribuições Gama e log-normal 3 parâmetros, ajustadas pela Máxima Verossimilhança, para série histórica de vazões mínimas diárias anuais do Rio Aiuruoca, Alto Rio Grande, MG. 51 Exemplo de Aplicação 4.9 Comparar o ajuste das distribuições Gama, Log-normal 3 parâmetros e Gumbel, ajustadas por máxima verossimilhança, às freqüências observadas da série de vazões máximas diárias anuais do Rio Aiuruoca, apresentadas na Tabela 4.10. Com base nos gráficos da Figura 4.6, verifica-se que a distribuição Gumbel apresentou um melhor ajustamento das freqüências teóricas às observadas, seguida da distribuição log-normal 3 parâmetros. Isto pode ser comprovado pelos valores de Quiquadrado das distribuições, sendo igual a 3,423 para distribuição Gumbel; 4,048 para lognormal 3 parâmetros e 4,315 para a distribuição Gama. Tabela 4.10 Série histórica de vazões máximas diárias anuais do Rio Aiuruoca, região Alto Rio Grande. Ordem Vazão Ordem Vazão 1 53,8 15 95,5 2 54,3 16 98,4 3 57,8 17 105 4 66,3 18 106 5 74,9 19 120 6 75,2 20 120 7 77,3 21 136 8 77,8 22 147 9 79,4 23 155 10 85,7 24 159 11 86,8 25 162 12 88,4 26 163 13 89,2 27 174 14 93,8 28 179 29 179 52 Figura 4.6. Distribuições Gumbel, log-normal 3 parâmetros e Gama, ajustadas por Máxima Verossimilhança, para série histórica de vazões máximas diárias anuais do Rio Aiuruoca, Alto Rio Grande, MG. 4.8.6 Weibull A distribuição de Weibull possui sua FDP caracterizada por: f (x; α, β ) = λ ⋅ x β −1 ⋅ β ⋅ e − λ⋅ xβ (111) Em que: x ≥ 0 ;λ, β > 0 Aplicando-se os conceitos de máxima verossimilhança, chega-se ao seguinte sistema de equações: λ= n n i=1 (112) x iβ β= λ⋅ n i=1 (x n i β ) ⋅ ln(xi) − n ln(x i ) i=1 (113) 53 Utilizando-se o método de Newton-Raphson, obtém-se simultaneamente, β e λ. 4.8.7 GEV A distribuição GEV possui sua FDP dada por: 1 x−µ f (x ) = ⋅ 1 + ξ ⋅ σ σ − 1+ ξ ξ x−µ ⋅ exp − 1 + ξ ⋅ σ − 1 ξ (114) Aplicando-se os conceitos de verossimilhança, chega-se à seguinte equação: x −µ 1 n L(µ, σ, ξ ) = ∏ f (x i ) = n ⋅ ∏ 1 + ξ ⋅ i σ i=1 σ i=1 n − 1+ ξ ξ exp n i=1 x −µ − 1+ ξ ⋅ i σ − 1 ξ (115) O logaritmo da função de verossimilhança produz: l(x; ξ, σ, µ ) = n i=1 x −µ 1+ ξ − ln(σ ) − ⋅ ln 1 + ξ ⋅ i ξ σ x −µ − 1+ ξ ⋅ i σ − 1 ξ (116) Derivando-se a equação 115 em relação aos respectivos parâmetros e fazendo-se uma série de manipulações, chega-se ao seguinte sistema de equações: 1 n 1+ ξ − y i ⋅ σ i=1 σ − 1 ξ =0 1 − (x i − µ ) ⋅ (1 + ξ ) − y i − ξ n 1 n + ⋅ σ σ 2 i=1 n i=1 1− yi − 1 ξ yi ⋅ =0 (x − µ ) − (x i − µ ) = 0 1 ⋅ ln(y i ) − i 2 ξ ⋅ σ ⋅ yi σ ⋅ yi ξ Neste caso, tem-se que: (117) 54 yi = 1+ ξ ⋅ xi − µ σ (118) Para solução do sistema de equações, sugere-se iniciá-lo com base nos parâmetros µ, σ e ξ oriundos do método dos momentos (equações 42, 43 e 44). Exemplo de Aplicação 4.10 Ajustar a distribuição Weibull à série histórica de vazões mínimas de 7 dias consecutivos do Rio Grande, na Região Alto Rio Grande (Tabela 4.7). Os parâmetros ajustados foram: λ = 5,6482 x 10-6; β = 3,908993 e a aderência das freqüências observadas às teóricas representada na Figura 4.7. Figura 4.7 Ajuste da Distribuição Weibull à série histórica de vazões mínimas de 7 dias consecutivos do Rio Grande, seção de Madre de Deus, MG. Exemplo de Aplicação 4.11 Ajustar a distribuição GEV ajustada por Máxima Verossimilhança e Método dos Momentos para a série histórica de precipitação decendial do mês de janeiro da Tabela 4.6. 55 Parâmetro MV MM σ 54,08 60,59 µ 70,74 72,58 ξ 0,088 0,0274 Gráfico dos ajustes A estimativa de erro médio das freqüências estimadas pelos respectivos métodos em relação às observadas foi de 9,70% para o método dos momentos e de 9,49% para o método da Máxima Verossimilhança, com o erro máximo de 52% para MM e de 44% para MV. Segundo alguns autores, o desempenho da MV será superior quanto maior a série histórica, que no caso deste exemplo, apesar de apenas 21 dados da série histórica, esta metodologia mostrou-se ligeiramente superior. 4.9 Estimação de parâmetros das Distribuições de Probabilidades com base nos Momentos – L O método dos momentos – L consiste de uma abordagem estatística que permite estimar os parâmetros de uma distribuição de probabilidades com base em mais momentos estatísticos de ordem superior a 3, podendo permitir, em casos de pequenas amostras, ajustar, com maior precisão, uma distribuição de probabilidades do que o Método da Máxima Verossimilhança. 56 Hosking (1990) menciona que os valores numéricos de momentos amostrais, em especial de pequenas amostras, podem ser muito diferentes daqueles que de fato caracterizam uma determinada população, constituindo-se em erros de elevada magnitude na estimativa da freqüência. Desta forma, foram introduzidos os conceitos de momentos ponderados por probabilidades (MPP), apresentando a seguinte expressão para estimativa dos momentos amostrais: ^ αs = N−i s 1 N ⋅ ⋅ xi N i=1 N − 1 s (119) Em que N é o tamanho da amostra, s é um número inteiro que varia de 0 a 3 e xi a variável hidrológica em questão. Os termos entre parênteses são obtidos pela análise combinatória, ou seja: N−i (N − i)! = s (N − i − s)!⋅s! (120) Os momentos que podem ser estimados pela equação 119 podem ser linearizados de acordo com Hosking (1990), uma vez que, nesta forma, os momentos são de difícil aplicação para modelagem (caracterização da forma e escala) de uma distribuição de probabilidades. Assim, os momentos podem então ser estimados pelas equações, sendo conhecidos como Momentos - L: λ1 = α 0 λ 2 = α 0 − 2 ⋅ α1 λ 3 = α 0 − 6 ⋅ α1 + 6 ⋅ α 2 (121) λ 4 = α 0 − 12 ⋅ α 1 + 30 ⋅ α 2 − 20 ⋅ α 3 O momento – L λ1 é equivalente à média. O coeficiente de variação, o qual está associado ao parâmetro de escala, é dado por: τ= λ2 λ1 Os coeficientes de assimetria e curtose são obtidos respectivamente, por: (122) 57 τ3 = λ3 λ2 (123) τ4 = λ4 λ2 (124) 4.9.1 Aplicação às Distribuições de Probabilidades apresentadas a) Distribuição Normal ^ µ = λ1 = α 0 (125) ^ σ = π ⋅ λ 2 = π ⋅ (α 0 − 2 ⋅ α 1 ) (126) b) Distribuição Gumbel para Máximos ^ α= ln(2) λ2 ^ µ = λ1 − (127) 0,5772 ^ (128) α c) Distribuição Gumbel para Mínimos ^ α= ln(2) λ2 ^ µ = λ1 + 0,5772 ^ (129) α d) Distribuição Gama λ2 Γ(υ + 0,5 ) = λ1 π ⋅ Γ(υ + 1) β= λ1 υ (130) (131) 58 e) GEV ( ^ ξ = (− 1) ⋅ 7,859 ⋅ C + 2,9554 ⋅ C 2 C= 2 ln(2) − 3 + τ 3 ln(3 ) τ 3 = −3 + ^ σ= ( 2 ⋅ 1 − 3 −ξ (1 − 2 ) −ξ λ2 ⋅ ξ ( Γ(1 + ξ ) ⋅ 1 − 2 −ξ ^ µ = λ1 − ) (132) (133) ) (134) ) (135) α ⋅ [1 − Γ(1 + ξ )] ξ (136) f) Log-normal ^ σN = 2 ⋅ z (137) 2 Sendo z a variável Normal padrão correspondente à probabilidade ^ µ N = ln(λ 1 ) − (σN )2 τ +1 . 2 (138) 2 Exemplo de Aplicação 4.12 Compare o ajuste da distribuição GEV obtido pela Máxima Verossimilhança (MV), Método dos Momentos (MM) e Método dos Momentos – L (MML) para a série histórica de precipitação decendial do mês de janeiro da Tabela 4.6. Os ajuste por MV e MM foram apresentados no Exemplo de Aplicação 4.11. Parâmetro MV MM MML σ 54,08 60,59 60,93 µ 70,74 72,58 70,77 ξ 0,088 0,0274 0,00000104 59 Gráfico dos ajustes A estimativa de erro médio das freqüências estimadas pelos respectivos métodos em relação às observadas foi de 9,70% para o método dos momentos, de 9,49% para o método da Máxima Verossimilhança e 8,54% para o método dos momentos-L, com o erro máximo de 52% para MM, de 44% para MV e 46,3% para MML. O desempenho de MML normalmente é superior, especialmente para séries históricas menores, conforme comentado anteriormente. Exemplo de Aplicação 4.13 Com base na série histórica do Exemplo de Aplicação 4.4 (série da Tabela 4.5), a qual diz respeito à precipitação máxima diária anual, ajuste a Distribuição de Gumbel pelo método dos Momentos-L (ML), comparando o ajuste ao obtido pelo Método dos Momentos (MM) e calcule a precipitação máxima diária anual para os TRs de 5, 10, 50 e 100 anos. Os respectivos ajustes produziram os seguintes parâmetros, calculando-se os erros médios absolutos entre as freqüências observadas e estimadas em cada um dos métodos. 60 Parâmetros Erro (%) MM ML 0,09683 0,08930 60,7957 60,2926 16,81 13,64 Graficamente: TR MM ML 5 76,29 77,09 10 84,04 85,49 50 101,09 104,00 100 108,30 111,81 Com base nos dados de erro absoluto acima, há indicativo de que o Método dos Momentos-L gerou maior precisão do que o Método dos Momentos. No entanto, é importante que esta análise possa ser conduzida com base em algum teste estatístico, permitindo uma conclusão mais apropriada. 61 Exemplo de Aplicação 4.14 Ajuste as distribuições Gama 2P e GEV pelo método dos Momentos-L, comparando os ajustes, à mesma série histórica do Exemplo 4.13 (Série da Tabela 4.5). Os ajustes produziram um erro médio absoluto de estimativa das freqüências observadas de 9,94% para a Distribuição Gama e de 13,81% para a Distribuição GEV. O erro máximo observado na primeira situação foi de 24,1% e para a segunda, de 37,6%, apontando para um melhor desempenho da distribuição Gama quando este método de ajuste é aplicado. Graficamente, é possível perceber o melhor ajustamento das freqüências estimadas às observadas pela Distribuição Gama. Exemplo de Aplicação 4.15 Com base na série histórica de vazões mínimas consecutivas de 7 dias, do Rio Grande (Tabela 4.7), ajuste as distribuições GEV e log-normal 2P pelo método dos Momentos-L e calcule o valor correspondente ao TR de 10 anos por ambos os modelos. Os parâmetros ajustados para a distribuição GEV foram: = 6,91x10-5; = 4,191; = 17,588 Os parâmetros ajustados da distribuição log-normal 2P foram: N = 0,2588; N = 2,963 62 Para um TR de 10 anos, correspondendo a valores mínimos, portanto, probabilidade de não excedência, estima-se uma Q7,10 para o Rio Grande na seção de controle de Madre de Deus, um valor de 14,1 m3/s com aplicação da GEV e de 13,9 m3/s aplicando-se a distribuição log-normal 2P. O desempenho das distribuições é semelhante. Graficamente, tem-se: 4.10 Adequação Estatística de uma Distribuição de Probabilidades Para a aplicação de uma distribuição de probabilidades é indispensável analisar se a mesma representa adequadamente bem a relação funcional entre os valores do evento e as respectivas freqüências de ocorrência dos mesmos. Para isto, há necessidade de se comprovar previamente se a distribuição é adequada para a série histórica a ser trabalhada. A comprovação é feita com base em testes estatísticos não paramétricos, os quais, na seqüência, serão apresentados de forma detalhada aqueles mais usuais em hidrologia, sendo que também são conhecidos como Testes de Aderência Estatística. 4.10.1 Teste de Kolmogorov-Smirnov Neste teste, promove-se o cálculo da diferença entre as freqüências observadas (amostrais) e as freqüências esperadas com base na distribuição de probabilidades, comparando-se a maior diferença obtida a um valor que correspondente à estatística do teste (Tabela 4.11). Esta estatística é obtida em função do tamanho da amostra (n) e nível 63 de significância (α ) a ser adotado (5% na maioria das vezes). A hipótese de nulidade a ser testada é a Hipótese Ho de que a freqüência observada poderá ser estimada pela distribuição de pobabilidades, ou seja, como o valor tabelado é estatisticamente nulo, podese concluir que valores menores ou iguais a este serão também estatisticamente nulos. Desta forma, tem-se: ∆F calculadom áximo ≤ ∆F tabela (n,α ) Nesta situação, a distribuição (139) de probabilidades será adequada, pois [∆F]calculado máximo será nulo estatisticamente e, portanto, a freqüência observada não difere da esperada. Observa-se que apenas a máxima diferença entre as freqüências é considerada neste teste. Desta forma, o Teste de Kolmogorov-Smirnov é inteiramente qualitativo, significando que o mesmo permite apenas a conclusão de que a distribuição de probabilidades é adequada ou não, não havendo embasamento suficiente para se concluir a respeito da precisão e comparação entre distribuições distintas. Se na equação 139 ocorrer o contrário, a distribuição não será adequada, devendo-se buscar o ajuste de outra. 64 Tabela 4.11 Valores críticos do teste de Kolmogorov-Smirnov (Adaptado de Haan, 2002). Tamanho da Nível de Significância Amostra (N) 0,20 0,15 0,10 0,05 0,01 1 0,900 0,925 0,950 0,975 0,995 2 0,684 0,726 0,776 0,842 0,929 3 0,565 0,597 0,642 0,708 0,829 4 0,494 0,525 0,564 0,624 0,734 5 0,446 0,474 0,510 0,563 0,669 6 0,410 0,436 0,470 0,521 0,618 7 0,381 0,405 0,438 0,486 0,577 8 0,358 0,381 0,411 0,457 0,543 9 0,339 0,360 0,388 0,432 0,514 10 0,322 0,342 0,368 0,409 0,486 15 0,268 0,283 0,304 0,338 0,404 20 0,231 0,246 0,264 0,294 0,352 25 0,210 0,220 0,240 0,264 0,320 30 0,190 0,200 0,220 0,242 0,290 40 - - - 0,210 0,250 50 - - - 0,190 0,230 60 - - - 0,170 0,210 70 - - - 0,160 0,190 80 - - - 0,150 0,180 90 - - - 0,140 - 100 - - - 0,140 - 4.10.2 Teste de Qui-quadrado Este teste é mais rigoroso que o anterior por agrupar os dados da série histórica em classes de freqüência e acumular os erros entre as freqüências observada e teórica, com participação de todas as classes e não apenas a máxima diferença. A soma destes erros (obtida pela soma dos erros de todas as classes) gera o valor de λ2calculado. A estatística do teste é obtida por meio da tabela de λ2 (Tabela 4.12), adotando-se o valor tabelado com base em graus de liberdade da distribuição e nível de significância. Para que a distribuição de probabilidades tenha aderência aos dados, o valor de λ2calculado deve ser menor que o de tabela. Assim, tem-se: 65 χ 2 calculado = n (fobsi − f teoricoi )2 i=1 f teoricoi (140) Em que n é o número de classes, fobsi e fteóricoi são, respectivamente, as freqüências observada e teórica na classe i. As classes com menos de 3 valores devem ser agrupadas com as classes vizinhas, seguindo os critérios de aplicação do teste. Os Graus de Liberdade a serem adotados neste teste podem ser obtidos considerando-se uma situação intermediária entre o número de classes menos 1 e o número de classes menos número de parâmetros da distribuição menos 1. Por exemplo: para 6 classes, os graus de liberdade devem estar, para uma Distribuição Normal (2 parâmetros) entre 5 e 3, adotando-se 4. Ressalta-se que para um pequeno número de classes o teste perde precisão. Para maiores detalhes para aplicação deste teste, consultar Ferreira (2005) e Haan (2002). Um detalhe adicional é de que a equação 140 representa uma forma de cálculo do quadrado médio do erro e todas as freqüências participam do mesmo. Desta forma, Walpole & Myers (1978) consideram o teste de λ2 um cálculo de precisão do ajuste da distribuição de probabilidades. 131 Tabela 4.12 Quantis superiores da distribuição Qui-quadrado associados aos graus de liberdade (v) e diferentes níveis de significância (adaptado de Ferreira 2005). Graus de Nível de Significância Liberdade (v) 0,995 0,975 0,950 0,900 0,750 0,500 0,100 0,050 0,010 0,005 1 0,000039 0,000982 0,003932 0,015791 0,101532 0,455 2,706 3,841 6,635 7,879 2 0,010025 0,050636 0,102587 0,210721 0,575364 1,386 4,605 5,991 9,210 10,597 3 0,071721 0,215793 0,351843 0,584369 1,213 2,366 6,251 7,815 11,345 12,838 4 0,206989 0,484418 0,710723 1,064 1,923 3,357 7,779 9,488 13,277 14,860 5 0,411742 0,831212 1,145 1,610 2,675 4,351 9,236 11,070 15,086 16,750 6 0,675727 1,237 1,635 2,204 3,455 5,348 10,645 12,592 16,812 18,548 7 0,989256 1,690 2,167 2,833 4,255 6,346 12,017 14,067 18,475 20,278 8 1,344 2,180 2,733 3,490 5,071 7,344 13,362 15,507 20,090 21,955 9 1,735 2,700 3,325 4,168 5,899 8,343 14,684 16,919 21,666 23,589 10 2,156 3,247 3,940 4,865 6,737 9,342 15,987 18,307 23,209 25,188 15 4,601 6,262 7,261 8,547 11,037 14,339 22,307 24,996 30,578 32,801 20 7,434 9,591 10,851 12,443 15,452 19,337 28,412 31,410 37,566 39,997 25 10,520 13,120 14,611 16,473 19,939 24,337 34,382 37,652 44,314 46,928 30 13,787 16,791 18,493 20,599 24,478 29,336 40,256 43,773 50,892 53,672 40 20,707 24,433 26,509 29,051 33,660 39,335 51,805 55,758 63,691 66,766 50 27,991 32,357 34,764 37,689 42,942 49,335 63,167 67,505 76,154 79,490 60 35,534 40,482 43,188 46,459 52,294 59,335 74,397 79,082 88,379 91,952 120 83,852 91,573 95,705 100,624 109,220 119,334 140,233 146,567 158,950 163,648 240 187,324 198,984 205,135 212,386 224,882 239,334 268,471 277,138 293,888 300,182 480 403,949 421,189 430,198 440,745 458,754 479,334 520,11 532,075 555,006 563,561 ∞ 850,891 876,028 889,081 904,291 930,093 959,333 1016,566 1033,193 1064,867 1076,621 132 4.10.3 Teste de Filliben Este teste foi introduzido por Filliben em 1975 para testar (verificar) a hipótese H0 de normalidade, tendo sido adaptada para outras distribuições. Isto significa que o teste verificará se uma determinada amostra y1, y2, y3, ..., yN, extraída de uma população Y com distribuição de probabilidade F(y) também poderá ser representada pela mesma distribuição. Para isto, o teste de aderência estimará um coeficiente de correlação (r) entre as observações yi e os quantis teóricos wi. Os valores de wi são obtidos pela inversa da FCP, ou seja: wi = Fy−1 (1 − qi) (141) Sendo Fy-1 a função inversa da distribuição F(y). Isto significa obter o valor da variável hidrológica associada à freqüência observada q. Para a distribuição Normal, o software Excel possui uma função conhecida como INV.NORM. Para as demais, procede-se aplicando a estrutura da própria distribuição. A freqüência observada qi é obtida pela seguinte equação: qi = i−a N + 1− 2 ⋅ a (142) Sendo i a posição ocupada pelo valor na série amostrada, de preferência em ordem crescente, N é o tamanho da amostra e a é um parâmetro a ser adotado de acordo com a distribuição. Para a distribuição Normal e log-normal, a = 0,375; para Weibull, a = 0; Gumbel, a = 0,44; GEV e outras, a = 0,40. O coeficiente de correlação entre wi e yi é dado por: N rcalc = i=1 N i=1 (y (y i i )( − y ⋅ wi − w −y ) 2 ⋅ N i=1 (w i ) −w ) 2 (143) Este valor deverá ser comparado a um valor crítico de r, considerando a distribuição em questão. Se rcalc > rcr´tic, a amostra poderá ser representada pela respectiva distribuição. Os valores de rcritic estão apresentados nas Tabelas 4.13, 4.14 e 4.15, respectivamente para as Distribuições Normal (log-normal), Gumbel (Weibull) e GEV (adaptadas de Stedinger et al., 1993 por Naghettini & Pinto, 2007). 133 Tabela 4.13 Valores de rcritic para as Distribuições Normal e Log-Normal. Tamanho da Significância (α) Amostra (N) 0,10 0,05 0,01 10 0,9347 0,9180 0,8804 15 0,9506 0,9383 0,9110 20 0,9600 0,9503 0,9290 30 0,9707 0,9639 0,9490 40 0,9767 0,9715 0,9597 50 0,9807 0,9764 0,9664 60 0,9835 0,9799 0,9710 75 0,9865 0,9835 0,9757 100 0,9893 0,9870 0,9812 Tabela 4.14 Valores de rcritic para as Distribuições Gumbel para máximos e Weibull. Tamanho da Significância (α) Amostra (N) 0,10 0,05 0,01 10 0,9260 0,9084 0,8630 20 0,9517 0,9390 0,9060 30 0,9622 0,9526 0,9191 40 0,9689 0,9594 0,9286 50 0,9729 0,9646 0,9389 60 0,9760 0,9685 0,9467 70 0,9787 0,9720 0,9506 80 0,9804 0,9747 0,9525 100 0,9831 0,9779 0,9596 134 Tabela 4.15 Valores de rcritic para a Distribuição GEV. Valores do Parâmetro σ N σ = -0,30 σ = -0,20 σ = -0,10 σ=0 σ = 0,10 σ = 0,20 5 0,777 0,791 0,805 0,817 0,823 0,825 10 0,836 0,845 0,856 0,866 0,876 0,882 20 0,839 0,855 0,878 0,903 0,923 0,932 30 0,834 0,858 0,890 0,920 0,942 0,953 50 0,825 0,859 0,902 0,939 0,961 0,970 100 0,815 0,866 0,920 0,959 0,978 0,985 Significância (α) 0,01 0,05 5 0,853 0,863 0,869 0,874 0,877 0,880 10 0,881 0,890 0,900 0,909 0,916 0,920 20 0,898 0,912 0,926 0,938 0,948 0,953 30 0,903 0,920 0,937 0,952 0,961 0,967 50 0,908 0,929 0,950 0,965 0,974 0,979 100 0,914 0,940 0,963 0,978 0,985 0,989 5 0,888 0,892 0,896 0,899 0,901 0,903 10 0,904 0,912 0,920 0,927 0,932 0,936 20 0,920 0,932 0,943 0,952 0,958 0,962 30 0,928 0,941 0,953 0,962 0,969 0,973 50 0,935 0,950 0,963 0,973 0,979 0,982 100 0,944 0,961 0,974 0,983 0,988 0,991 0,10 4.10.4 Teste de Anderson-Darling Este teste tem grande aplicabilidade em situações nas quais os dados apresentam assimetria nas suas distribuições de freqüência, ou seja, séries históricas caracterizadas por valores extremos, tanto no contexto de mínimos quanto de máximos. Os demais testes analisam e comparam as freqüências observadas às teóricas e normalmente verificam distorção significativa apenas em freqüências intermediárias e não analisam de forma mais específica, os dados extremos (caudais). Assim, distribuições do tipo Gumbel, log-normal, Weibull, GEV e log-Gumbel, dentre outras, devem ser testadas por este teste sempre que possível. Além desta aplicação, segundo Sharda et al. (2008) e D’Agostino & Stephens (1986), este teste pode ser aplicado para analisar a “bondade do ajuste”, ou seja, a precisão do mesmo quando se deseja comparar duas ou mais distribuições. A estatística deste teste é a seguinte: AD 2 = −N − 1 ⋅ N N i=1 [(2 ⋅ i − 1)(ln(Pi ) + ln(1 − Pi ))] (144) 135 Em que N é o tamanho da amostra, i é a posição de cada um dos dados na série histórica posicionada em ordem crescente e Pi é o corresponde à probabilidade calculada pela respectiva distribuição. O valor de AD2 deve ser comparado a um valor crítico p, considerando um nível de significância α. Se AD2 > p (α), rejeita-se a hipótese Ho de que a distribuição se ajusta de forma adequada aos dados de freqüência. Na Tabela 4.16 estão apresentados os valores da estatística p (α) do teste para as distribuições log-normal (normal), Weibull ou Gumbel, de acordo com D’Agostino & Stephens (1986) e Naghettini & Pinto (2007). Tabela 4.16 Valores críticos de p (α) para as distribuições log-normal (ou normal) e Weibull e Gumbel. Dsitribuição α p (α) 0,10 0,631 0,05 0,752 0,025 0,873 0,01 1,035 0,10 0,637 Weibull ou Gumbel para 0,05 0,757 máximos 0,025 0,877 0,01 1,038 Normal ou log-normal Correção de A2 1+ 0,75 2,25 + 2 N N 1+ 0,2 N Adaptado de D”Agostino & Stephens (1986) e Naghettini & Pinto (2007). Exemplo de Aplicação 4.16 Verificar pelos testes de adequação de Kolmogorov-Smirnov, Qui-quadrado, Filliben e Anderson-Darling a aplicação da Distribuição Normal à série histórica de precipitação total anual do Exemplo de Aplicação 4.3. 136 a) Kolmogorov-Smirnov (Ao nível de significância de 5% de probabilidade) Prec. (mm) z fteórica fcalc. 747,1 -2,25 0,0122 0,0132 ∆f 0,00094 Prec. (mm) z 1427,3 fteórica fcalc. 0,4522 0,5132 ∆f 832,4 -1,98 0,0239 0,0263 0,00247 1428,1 -0,12 0,4522 0,5132 0,0609 999,2 -1,46 0,0721 0,0395 0,03267 1430,0 -0,11 0,4562 0,5263 0,0701 1001,3 -1,46 0,0721 0,0526 0,01951 1443,4 -0,07 0,4721 0,5395 0,0674 1068,1 -1,25 0,1056 0,0658 0,03985 1445,8 -0,06 0,4761 0,5526 0,0766 1093,5 -1,17 0,121 0,0789 0,04205 1448,8 -0,05 0,4801 0,5658 0,0857 1109,9 -1,12 0,1314 0,0921 0,03924 1450,3 -0,05 0,4801 0,5790 0,0989 1170,6 -0,93 0,1761 0,1053 0,07087 1453,4 -0,04 0,4840 0,5921 0,1081 1171,3 -0,92 0,1788 0,1184 0,06036 1479,5 0,04 0,5160 0,6053 0,0893 1183,2 -0,89 0,1867 0,1316 0,05515 1496,3 0,09 0,5359 0,6184 0,0826 1184,9 -0,88 0,1894 0,1447 0,04468 1555,8 0,28 0,6103 0,6316 0,0213 1187,7 -0,87 0,1922 0,1579 0,03426 1567,4 0,32 0,6255 0,6447 0,0192 1196,6 -0,84 0,2005 0,1711 0,0294 1584,3 0,37 0,6443 0,6579 0,0136 1204,7 -0,82 0,2061 0,1842 0,02189 1585,1 0,37 0,6443 0,6711 0,0268 1216,1 -0,78 0,2177 0,1974 0,020032 1589,1 0,39 0,6517 0,6842 0,0325 1216,2 -0,78 0,2177 0,2105 0,00716 1590,0 0,39 0,6517 0,6974 0,0456 1217,8 -0,78 0,2177 0,2237 0,00599 1634,1 0,53 0,7019 0,7105 0,0086 1246 -0,69 0,2451 0,2368 0,00825 1634,1 0,53 0,7019 0,7237 0,0217 1263,5 -0,63 0,2643 0,25 0,01434 1665,3 0,62 0,7324 0,7368 0,0045 1266,7 -0,62 0,2676 0,2632 0,00446 1673,2 0,65 0,7422 0,75 0,0079 1268,6 -0,62 0,2676 0,2763 0,0087 1683,5 0,68 0,7517 0,7632 0,0114 1282,5 -0,57 0,2843 0,2895 0,00514 1686,6 0,69 0,7549 0,7763 0,0214 1288,8 -0,56 0,2877 0,3026 0,0149 1689,4 0,70 0,7580 0,7895 0,0314 1301,2 -0,52 0,3015 0,3158 0,01426 1696 0,72 0,7642 0,8026 0,0384 1313 -0,48 0,3156 0,3289 0,01334 1705,5 0,75 0,7734 0,8158 0,0424 1319,8 -0,46 0,3228 0,3421 0,01936 1719,1 0,79 0,7852 0,8289 0,0437 1326,6 -0,44 0,3299 0,3553 0,0253 1726,6 0,82 0,7939 0,8421 0,0482 1352,8 -0,35 0,3632 0,3684 0,00526 1728,5 0,82 0,7939 0,8553 0,0614 1353,7 -0,35 0,3632 0,3816 0,01842 1794,0 1,03 0,8485 0,8684 0,0199 1354,7 -0,35 0,3632 0,3947 0,03158 1816,6 1,10 0,8643 0,8816 0,0173 1355,7 -0,35 0,3632 0,4079 0,04473 1820,3 1,11 0,8665 0,8947 0,0282 1374,4 -0,29 0,3859 0,4211 0,03515 1832,7 1,15 0,8749 0,9079 0,0329 1377,9 -0,28 0,3897 0,4342 0,04448 1933,2 1,46 0,9279 0,9210 0,0068 1380,4 -0,27 0,3936 0,4474 0,05379 1938,0 1,48 0,9306 0,9342 0,0037 1393,6 -0,23 0,4090 0,4605 0,05149 1951,8 1,52 0,9357 0,9474 0,0116 1398,7 -0,21 0,4168 0,4737 0,05685 2042,2 1,81 0,9649 0,9605 0,0043 1413,1 -0,17 0,4325 0,4868 0,05434 2130,7 2,08 0,9812 0,9737 0,0076 1427,3 -0,12 0,4522 0,5 0,04776 2485,6 3,19 0,9993 0,9868 0,0124 ∆fcalc. máximo = 0,1081 Da tabela de valores da estatística do teste de Kolmogorov-Smirnov (Tabela 4.11), tem-se que ∆f(75,5%) = 0,155. 137 Conclusão: Como o valor calculado máximo é menor que o tabelado, conclui-se que a Distribuição Normal foi adequada a esta série histórica de precipitação total anual. b) Qui-quadrado (Ao nível de significância de 5% de probabilidade) Observar procedimento estatístico desenvolvido no Exemplo de Aplicação 4.3, para separação por classes de freqüência. Classes Fobs z LI LS Fteórica λ 2 622,9 1119,7 7 -2,64 -1,08 10,11 0,959 1119,7 1368,1 24 -1,08 -0,31 18,04 1,968 1368,1 1616,5 22 -0,31 0,47 22,64 0,018 1616,5 1864,9 16 0,47 1,25 15,97 0,0 1864,9 2610,1 6 1,25 3,58 7,92 0,463 75 3,408 Exemplo de cálculos para a 1º classe Com a média e o desvio padrão dos dados determina-se o valor de z para os limites superior e inferior: − x = 1458,6 mm s = 298,2 mm z= 622,9 − 1458,6 = −2,64 298,2 z= 1119,7 − 1458,6 = −1,08 298,2 Na tabela de z encontram-se as probabilidades de não excedência de 0,00413 e 0,13898 respectivamente, para os limites inferior e superior. Assim, a freqüência teórica para esta classe será: Fteórica = (0,13898 − 0,00413 ) * 75 = 10,11 O valor de λ2 para o intervalo de classe será dado por: λ2 = (7 − 10,11) 2 = 0,959 10,11 Após o cálculo dos valores de λ2 para as demais classes, estes devem ser somados e comparados ao valor do λ2 tabelado. A distribuição será adequada se λ2calculado ≤ λ2tabelado. Os graus de liberdade deste exemplo estarão entre 4 (5 classes – 1) e 2 (5 classes – 2 parâmetros – 1), adotando-se 3. 138 No exemplo, λ2calculado = 3,41 e λ2tab(0,05; 3) = 7,815. Portanto, a Distribuição Normal é adequada a esta série histórica de precipitação total anual. c) Teste de Filliben O valor de qi, considerando-se N = 75 e a = 0,375, para i =1 produz valor de 0,008197, substituindo i =1 na equação 142. A inversa da Distribuição Normal, obtida pela função INV.NORM do Excel, retorna um valor de 738,14 mm para esta freqüência. Procede-se desta forma para os demais valores de precipitação ordenados em ordem crescente. O cálculo do coeficiente de correlação (equação 143) produz um valor de r igual a 0,975. Consultando a Tabela de valores para rcrítico da DN, para nível de significância de 0,05 e N = 75, obtém-se valor de 0,984. Como rcalc. < rcrítico, a amostra não poderá ser representada pela Distribuição Normal. d) Teste de Anderson-Darling A estatística deste teste produziu AD2 igual a 0,874, o qual foi corrigido para 0,883 (os dados de posição e freqüência teórica estão apresentados na tabela do teste de Kolmogorov-Smirnov). Adotando-se p (0,05), na Tabela 4.16, encontra-se valor de 0,752. Portanto, como AD2 é maior que p (0,05), rejeita-se a hipótese Ho de que a série histórica pode ser representada pela Distribuição Normal. Exemplo de Aplicação 4.17 Aplicar os testes de Kolmogorov-Smirnov, Qui-quadrado e Anderson-Darling para verificação da adequação da distribuição Gumbel à série histórica de precipitação máxima diária anual do Exemplo de Aplicação 4.4. 139 a) Kolmogorov-Smirnov (Ao nível de significância de 5% de probabilidade) Precipitação (mm) z (kTR) fteórica fcalculado ∆f 46,2 -1,55 0,016622 0,058824 0,042368 50,0 -1,26 0,059317 0,117647 0,059405 50,4 -1,23 0,065988 0,176471 0,111588 57,0 -0,74 0,234492 0,235294 0,0007 58,7 -0,61 0,292971 0,294118 0,000324 60,2 -0,49 0,349022 0,352941 0,00626 61,6 -0,39 0,396151 0,411765 0,015274 63,4 -0,25 0,461246 0,470588 0,010892 64,2 -0,19 0,488444 0,529412 0,042309 66,9 0,01 0,574377 0,588235 0,01351 78,2 0,86 0,829884 0,647059 0,183609 78,6 0,89 0,835743 0,705882 0,130658 78,7 0,90 0,837656 0,764706 0,073274 80 1,00 0,855703 0,823529 0,032148 85,5 1,42 0,913063 0,882353 0,030184 88,5 1,64 0,933702 0,941176 0,007346 ∆fcalc. máximo = 0,184; ∆f(16,5%) = 0,328 Conclusão: Como o valor calculado é menor que o tabelado, conclui-se que a distribuição de Gumbel foi adequada para esta série histórica de precipitação máxima diária anual. b) Qui-quadrado (Ao nível de significância de 5% de probabilidade) Seguindo-se o mesmo raciocínio apresentado no exemplo anterior, tem-se: K= 4,0 Classes A = 42,3 Ac = 14,13 LIclasse 1 = 39,13 LIclasse 2 = 53,27 Reagrupando, tem-se: Classe Fobs ktr Ytr LI LS LI LS P(x≤xi) Fteór λ 2 39,13 53,27 3 -2,09 -1,02 -2,10 -0,73 0,0003 0,1259 2,01 0,488 53,27 67,40 7 -1,02 0,05 -0,73 0,64 0,1259 0,5900 7,43 0,024 67,40 95,67 6 0,05 2,18 0,64 3,38 0,5900 0,9664 6,02 0,000 16 0,513 140 Os graus de liberdade, neste caso, estariam entre 0 e 2, portanto, 1. No entanto, como o número de classes, definido de acordo com os critérios estatísticos é pequeno, pode-se considerar o grau de liberdade igual a 2. λ2calculado = 0,513 λ2tab(0,05;2) = 5,991 Conclusão: Como o valor calculado é menor que o tabelado, conclui-se, com ressalva devido ao baixo valor dos graus de liberdade, que a distribuição de Gumbel foi adequada à série histórica de precipitação máxima diária anual apresenta. c) Anderson-Darling De acordo com os dados da tabela aplicada ao teste de Kolmogorov-Smirnov, foi calculado um valor de AD2 igual a 0,500 que corrigido pela respectiva equação (Tabela 4.16), é igual a 0,525. Considerando p (0,05), o valor crítico da estatística é 0,757. Como AD2 é menor que p (0,05), aceita-se a hipótese Ho de que a série histórica possa ser representada pela distribuição Gumbel. Exemplo de Aplicação 4.18 Aplicar os testes de Kolmogorov-Smirnov e Qui-quadrado para verificação da adequação de cada uma das distribuições de probabilidades aplicadas à série histórica de precipitação decendial do Exemplo de Aplicação 4.5, acrescidas das distribuições Normal, Gumbel e Gama. 141 Distribuição Log-normal a 2 parâmetros a) Kolmogorov-Smirnov (Ao nível de significância de 5% de probabilidade) Precipitação (mm) z fteórico fcalculado ∆f 8,4 -2,48 0,00656 0,045455 0,038895 17,6 -1,66 0,04845 0,090909 0,042459 25,5 -1,25 0,10564 0,136364 0,030724 29,2 -1,09 0,13785 0,181818 0,043968 42,2 -0,69 0,24509 0,227273 0,017817 52,4 -0,44 0,32996 0,272727 0,057233 53,5 -0,42 0,33724 0,318182 0,019058 69,9 -0,12 0,45224 0,363636 0,088604 78,5 0,01 0,50398 0,409091 0,094889 84,8 0,09 0,53585 0,454545 0,081305 95,9 0,23 0,59095 0,5 0,09095 97,8 0,25 0,5987 0,545455 0,053245 111,7 0,40 0,65542 0,590909 0,064511 135,3 0,61 0,72906 0,636364 0,092696 140,3 0,65 0,74215 0,681818 0,060332 141,2 0,66 0,74537 0,727273 0,018097 144,8 0,69 0,7549 0,772727 0,017827 162,8 0,82 0,79389 0,818182 0,024292 189,9 0,99 0,83891 0,863636 0,024726 253,2 1,31 0,9049 0,909091 0,004191 290 1,46 0,92785 0,954545 0,026695 ∆fcalc. máximo = 0,095; ∆f( 20,5%) ≈ 0,294 Conclusão: Como o valor calculado é menor que o tabelado, conclui-se que a distribuição Log-normal a 2 parâmetros foi adequada a esta série histórica de dados de precipitação decendial do mês de janeiro. b) Qui-quadrado (Ao nível de significância de 5% de probabilidade) Classe 1 Fobs kTR LI LS λ 0,1 94 10 -4,0 2 0,21 12,23 0,407 94 187,9 8 0,21 0,98 5,33 1,338 187,9 375,7 3 0,98 1,75 2,60 0,062 21 1 2 Fcalc 1,886 2 Este valor foi adotado para permitir aplicação da distribuição log-normal; Adotado devido ao fato de que para z < que -4, a probabilidade é praticamente zero, sendo o limite inferior da tabela de z. 142 λ2calculado = 1,886; λ2tab(0,05,2) = 5,991. Conclusão: Como o valor calculado é menor que o tabelado, conclui-se que a distribuição Log-normal a 2 parâmetros foi adequada a esta série histórica de precipitação decendial do mês de janeiro apresentada. Distribuição Log-normal a 3 parâmetros. a) Kolmogorov-Smirnov (Ao nível de significância de 5% de probabilidade) Precipitação (mm) z fteórico fcalculado ∆f 8,4 -1,56 0,05938 0,045455 0,013925 17,6 -1,36 0,08691 0,090909 0,003999 25,5 -1,19 0,11702 0,136364 0,019344 29,2 -1,11 0,15624 0,181818 0,025578 42,2 -0,86 0,19489 0,227273 0,032383 52,4 -0,68 0,24825 0,272727 0,024477 53,5 -0,66 0,25462 0,318182 0,063562 69,9 -0,38 0,35197 0,363636 0,011666 78,5 -0,24 0,40516 0,409091 0,003931 84,8 -0,15 0,44038 0,454545 0,014165 95,9 0,01 0,50398 0,5 0,00398 97,8 0,04 0,51595 0,545455 0,029505 111,7 0,23 0,59095 0,590909 4,1E-05 135,3 0,53 0,70194 0,636364 0,065576 140,3 0,59 0,7224 0,681818 0,040582 141,2 0,60 0,72574 0,727273 0,001533 144,8 0,64 0,73891 0,772727 0,033817 162,8 0,85 0,80233 0,818182 0,015852 189,9 1,13 0,87076 0,863636 0,007124 253,2 1,72 0,95728 0,909091 0,048189 290 2,01 0,97778 0,954545 0,023235 ∆fcalc. máximo = 0,066; ∆f(16,5%) ≈ 0,294 Conclusão: Como o valor calculado é menor que o tabelado, conclui-se que a distribuição Log-normal a 3 parâmetros foi adequada a esta série histórica de precipitação decendial. 143 b) Qui-quadrado (ao nível de significância de 5% de probabilidade) Classe Fobs 0,1 94 kTR LI LS 10 -1,76 -0,01 2 Fcalc λ 9,59 0,018 94 187,9 8 -0,01 1,11 7,78 0,006 187,9 375,7 3 1,11 2,61 2,71 0,031 21 0,055 λ2calculado = 0,055; λ2tab(0,05,2) = 5,991 Conclusão: Como o valor calculado é menor que o tabelado, conclui-se que a distribuição Log-normal a 3 parâmetros foi adequada à série histórica de precipitação decendial do mês de janeiro apresentada. Distribuição Normal a) Kolmogorov-Smirnov (Ao nível de significância de 5% de probabilidade) Precipitação (mm) z fteórico fcalculado ∆f 8,4 -1,30 0,0968 0,045455 0,051345 17,6 -1,18 0,119 0,090909 0,028091 25,5 -1,07 0,1423 0,136364 0,005936 29,2 -1,02 0,15386 0,181818 0,027958 42,2 -0,85 0,19766 0,227273 0,029613 52,4 -0,71 0,23885 0,272727 0,033877 53,5 -0,70 0,24196 0,318182 0,076222 69,9 -0,48 0,31561 0,363636 0,048026 78,5 -0,37 0,35569 0,409091 0,053401 84,8 -0,28 0,38973 0,454545 0,064815 95,9 -0,13 0,44828 0,5 0,05172 97,8 -0,11 0,4562 0,545455 0,089255 111,7 0,08 0,53188 0,590909 0,059029 135,3 0,39 0,65173 0,636364 0,015366 140,3 0,46 0,67724 0,681818 0,004578 141,2 0,47 0,68082 0,727273 0,046453 144,8 0,52 0,69846 0,772727 0,074267 162,8 0,76 0,77637 0,818182 0,041812 189,9 1,12 0,86864 0,863636 0,005004 253,2 1,96 0,975 0,909091 0,065909 290 2,45 0,99285 0,954545 0,038305 ∆fcalc. máximo = 0,089255; ∆f(16,5%) ≈ 0,294 Conclusão: Como o valor calculado é menor que o tabelado, conclui-se que a distribuição normal foi adequada a esta série histórica de precipitação decendial. 144 b) Qui-quadrado (ao nível de significância de 5% de probabilidade) Classe kTR Fobs 0,1 94 LI LS 10 -1,41 -0,16 2 Fcalc λ 7,50 0,833 94 187,9 8 -0,16 1,09 8,94 0,099 187,9 375,7 3 1,09 3,59 2,89 0,004 21 0,936 λ2calculado = 0,936; λ2tab(0,05,2) = 5,991 Conclusão: Como o valor calculado é menor que o tabelado, conclui-se que a distribuição normal foi adequada para a série histórica de precipitação decendial do mês de janeiro apresentada. Distribuição Gumbel a) Kolmogorov-Smirnov (Ao nível de significância de 5% de probabilidade) Precipitação (mm) fteórico fcalculado ∆f 8,4 0,05123 0,045455 0,005775 17,6 0,078914 0,090909 0,011995 25,5 0,108729 0,136364 0,027635 29,2 0,124553 0,181818 0,057265 42,2 0,188568 0,227273 0,038705 52,4 0,246205 0,272727 0,026522 53,5 0,252712 0,318182 0,06547 69,9 0,353631 0,363636 0,010005 78,5 0,407583 0,409091 0,001508 84,8 0,446659 0,454545 0,007886 95,9 0,513357 0,5 0,013357 97,8 0,524403 0,545455 0,021052 111,7 0,60104 0,590909 0,010131 135,3 0,711614 0,636364 0,07525 140,3 0,731708 0,681818 0,04989 141,2 0,735203 0,727273 0,00793 144,8 0,748813 0,772727 0,023914 162,8 0,808388 0,818182 0,009794 189,9 0,874674 0,863636 0,011038 253,2 0,95559 0,909091 0,046499 290 0,976061 0,954545 0,021516 ∆fcalc. máximo = 0,07525; ∆f(16,5%) ≈ 0,294 Conclusão: Como o valor calculado é menor que o tabelado, conclui-se que a distribuição Gumbel foi adequada a esta série histórica de precipitação decendial. 145 b) Qui-quadrado (Ao nível de significância de 5% de probabilidade) Classe 0,1 P(X<xi) Fobs 94 10 LI LS 0,0325 0,5023 2 Fcalc λ 9,87 0,0017 94 187,9 8 0,5023 0,8708 7,74 0,0087 187,9 375,7 3 0,8708 0,9944 2,60 0,0615 21 0,072 λ2calculado = 0,072; λ2tab(0,05,2) = 5,991 Conclusão: Como o valor calculado é menor que o tabelado, conclui-se que a distribuição Gumbel foi adequada para a série histórica de precipitação decendial do mês de janeiro apresentada. Distribuição Gama a) Kolmogorov-Smirnov (Ao nível de significância de 5% de probabilidade) Precipitação (mm) fteórico fcalculado ∆f 8,4 0,00258 0,045455 0,042875 17,6 0,035235 0,090909 0,055674 25,5 0,075316 0,136364 0,061047 29,2 0,096836 0,181818 0,084982 42,2 0,179912 0,227273 0,047361 52,4 0,249833 0,272727 0,022894 53,5 0,25746 0,318182 0,060722 69,9 0,368768 0,363636 0,005131 78,5 0,424579 0,409091 0,015488 84,8 0,463693 0,454545 0,009147 95,9 0,528364 0,5 0,028364 97,8 0,538869 0,545455 0,006585 111,7 0,610467 0,590909 0,019558 135,3 0,711435 0,636364 0,075071 140,3 0,729602 0,681818 0,047784 141,2 0,73276 0,727273 0,005487 144,8 0,745065 0,772727 0,027663 162,8 0,799275 0,818182 0,018907 189,9 0,860971 0,863636 0,002666 253,2 0,944314 0,909091 0,035223 290 0,966266 0,954545 0,011721 ∆fcalc. máximo = 0,0849; ∆f(16,5%) ≈ 0,294 Conclusão: Como o valor calculado é menor que o tabelado, conclui-se que a distribuição Gama foi adequada a esta série histórica de precipitação decendial. 146 b) Qui-quadrado (Ao nível de significância de 5% de probabilidade) Classe 0,1 Fobs 94 10 P(X<xi) LI LS 0,0 0,5225 2 Fcalc λ 10,97 0,086 94 187,9 8 0,5225 0,8635 7,16 0,099 187,9 375,7 3 0,8635 0,9926 2,71 0,031 21 0,216 λ2calculado = 0,216; λ2tab(0,05,2) = 5,991 Conclusão: Pode-se observar que todas as distribuições de probabilidades testadas, podem ser aplicadas à série histórica apresentada. Isto é importante, uma vez que na aplicação da distribuição de probabilidades a um conjunto de dados quaisquer (não necessariamente precipitação) de natureza desconhecida, deve-se testar as distribuições e verificar qual possui o melhor ajuste, que pode ser analisado com base nos valores de Qui-quadrado. Neste caso, em específico, o melhor ajuste foi obtido pela distribuição log-normal 3 P, seguida da Distribuição Gumbel, pois seus valores de Qui-quadrado calculados foram menores que os obtidos pelas outras distribuições. Exemplo de Aplicação 4.19 Aplicar os testes de Kolmogorov-Smirnov, Qui-quadrado e Filliben para verificação da adequação das distribuições Weibull, Gumbel e GEV para mínimos aplicadas ao estudo de freqüência da série histórica de vazões mínimas com 7 dias consecutivos (Exemplo de Aplicação 4.6). 147 Distribuição Weibull a) Kolmogorov-Smirnov (Ao nível de significância de 5% de probabilidade) Ordem 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 Vazão 8.97 10.41 11.32 11.50 13.10 13.15 13.57 14.46 14.95 14.95 15.66 16.04 16.06 16.18 16.20 16.32 16.39 17.00 17.02 17.04 17.04 17.48 17.57 17.66 17.72 17.88 18.09 18.77 18.79 18.79 18.80 19.04 19.41 19.48 Fobs. 0.01449 0.02899 0.04348 0.05797 0.07246 0.08696 0.10145 0.11594 0.13043 0.14493 0.15942 0.17391 0.18841 0.20290 0.21739 0.23188 0.24638 0.26087 0.27536 0.28986 0.30435 0.31884 0.33333 0.34783 0.36232 0.37681 0.39130 0.40580 0.42029 0.43478 0.44928 0.46377 0.47826 0.49275 Festim. 0.021255 0.03986 0.056575 0.060377 0.103095 0.104699 0.11891 0.153046 0.17423 0.17436 0.208418 0.228177 0.229246 0.235722 0.236811 0.243288 0.247301 0.282503 0.283876 0.285254 0.285254 0.312235 0.317937 0.323687 0.327547 0.338127 0.351907 0.398175 0.399272 0.399771 0.400269 0.417267 0.443878 0.448615 Ordem Vazão Delta F 0.006763 35 19.49 0.010874 36 19.53 0.013097 37 19.67 0.002406 38 19.87 0.030631 39 19.89 0.017742 40 19.98 0.017461 41 20.11 0.037104 42 20.21 0.043796 43 20.39 0.029432 44 20.83 0.048998 45 21.08 0.054264 46 21.61 0.040841 47 22.11 0.032823 48 22.16 0.01942 49 22.40 0.011404 50 22.41 0.000924 51 22.72 0.021633 52 22.84 0.008514 53 23.19 0.004601 54 23.79 0.019094 55 24.76 0.006606 56 24.78 0.015396 57 25.16 0.024139 58 25.24 0.034772 59 25.41 0.038684 60 25.72 0.039397 61 26.60 0.007622 62 26.62 0.021018 63 26.96 0.035012 64 27.90 0.049006 65 29.24 0.046501 66 30.30 0.034383 67 32.50 0.044139 68 38.25 Fobs. Festim. Delta F 0.50725 0.52174 0.53623 0.55072 0.56522 0.57971 0.59420 0.60870 0.62319 0.63768 0.65217 0.66667 0.68116 0.69565 0.71014 0.72464 0.73913 0.75362 0.76812 0.78261 0.79710 0.81159 0.82609 0.84058 0.85507 0.86957 0.88406 0.89855 0.91304 0.92754 0.94203 0.95652 0.97101 0.98551 0.449543 0.452106 0.462479 0.476845 0.478307 0.484789 0.494641 0.501782 0.515041 0.547724 0.566047 0.604493 0.64057 0.64423 0.661379 0.66238 0.683783 0.691787 0.714979 0.753934 0.810447 0.811692 0.831429 0.835776 0.844275 0.858774 0.895732 0.896598 0.90871 0.937555 0.966363 0.980734 0.995158 0.999978 0.057703 0.069633 0.073753 0.073879 0.08691 0.094921 0.099562 0.106913 0.108147 0.089957 0.086126 0.062173 0.040589 0.051422 0.048766 0.062258 0.055348 0.061836 0.053137 0.028675 0.013346 9.75E-05 0.005342 0.004804 0.010797 0.010791 0.011674 0.001953 0.004334 0.010019 0.024334 0.024212 0.024143 0.014471 ∆fcalc. máximo = 0,1081; ∆f( 68,5%) ≈ 0,160 Conclusão: Como o valor calculado é menor que o tabelado, conclui-se que a distribuição Weibull foi adequada a esta série histórica de vazões mínimas com 7 dias consecutivos. 148 b) Qui-quadrado (Ao nível de significância de 5% de probabilidade) Classes Fobs. Prob (X<xi) Fteo. λ 2 6,87 15,27 10 0,00683 0,1892 12,40 0,465 15,27 19,47 23 0,1892 0,4479 17,59 1,664 19,47 23,67 20 0,4479 0,7462 20,28 0,004 23,67 27,87 10 0,7462 0,9368 12,96 0,676 27,87 40,47 5 0,9368 1,0 4,30 0,114 68 2,92 λ2calculado = 2,92; λ2tab(0,05,3) = 7,815 Conclusão: Como o valor calculado é menor que o tabelado, conclui-se que a distribuição Weibull foi adequada para a série histórica de vazão mínima de 7 dias consecutivos apresentada. c) Teste de Filliben Ordem 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 qi 0.014493 0.028986 0.043478 0.057971 0.072464 0.086957 0.101449 0.115942 0.130435 0.144928 0.15942 0.173913 0.188406 0.202899 0.217391 0.231884 0.246377 0.26087 0.275362 0.289855 0.304348 0.318841 0.333333 0.347826 0.362319 0.376812 0.391304 0.405797 0.42029 Vazão 8.97 10.41 11.32 11.5 13.1 13.15 13.57 14.46 14.95 14.95 15.66 16.04 16.06 16.18 16.2 16.32 16.39 17 17.02 17.04 17.04 17.48 17.57 17.66 17.72 17.88 18.09 18.77 18.79 wi 8.20 9.65 10.63 11.39 12.02 12.56 13.05 13.49 13.89 14.26 14.61 14.94 15.25 15.55 15.84 16.11 16.37 16.63 16.88 17.12 17.35 17.58 17.81 18.03 18.25 18.46 18.67 18.88 19.08 xi - x -11.0378 -9.59779 -8.68779 -8.50779 -6.90779 -6.85779 -6.43779 -5.54779 -5.05779 -5.05779 -4.34779 -3.96779 -3.94779 -3.82779 -3.80779 -3.68779 -3.61779 -3.00779 -2.98779 -2.96779 -2.96779 -2.52779 -2.43779 -2.34779 -2.28779 -2.12779 -1.91779 -1.23779 -1.21779 wi - w -11.82 -10.36 -9.39 -8.63 -8.00 -7.45 -6.97 -6.53 -6.13 -5.75 -5.41 -5.08 -4.76 -4.47 -4.18 -3.91 -3.64 -3.39 -3.14 -2.90 -2.66 -2.43 -2.21 -1.99 -1.77 -1.56 -1.35 -1.14 -0.93 Produto 130.4682 99.46987 81.55183 73.40884 55.24821 51.10832 44.86023 36.22712 30.99329 29.10611 23.50193 20.14158 18.80739 17.09629 15.92156 14.40927 13.17946 10.18794 9.378685 8.599425 7.900855 6.148125 5.380331 4.663208 4.047631 3.310196 2.579858 1.407941 1.135082 (xi - x ) 121.832899 92.1176519 75.4777666 72.3825607 47.7176196 47.0293402 41.4451931 30.7780196 25.5812813 25.5812813 18.9033137 15.7433902 15.5850784 14.6520078 14.499296 13.5998255 13.0884343 9.04682545 8.92691369 8.80780192 8.80780192 6.3897431 5.94284016 5.51213722 5.23400192 4.52750781 3.67793428 1.53213428 1.48302251 2 (wi - w ) 139.7155 107.4089 88.1147 74.4497 63.9672 55.5411 48.5567 42.6410 37.5503 33.1166 29.2192 25.7685 22.6959 19.9483 17.4833 15.2669 13.2711 11.4730 9.8533 8.3960 7.0873 5.9156 4.8711 3.9450 3.1302 2.4202 1.8096 1.2938 0.8688 2 149 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 0.434783 0.449275 0.463768 0.478261 0.492754 0.507246 0.521739 0.536232 0.550725 0.565217 0.57971 0.594203 0.608696 0.623188 0.637681 0.652174 0.666667 0.681159 0.695652 0.710145 0.724638 0.73913 0.753623 0.768116 0.782609 0.797101 0.811594 0.826087 0.84058 0.855072 0.869565 0.884058 0.898551 0.913043 0.927536 0.942029 0.956522 0.971014 0.985507 Média 18.79 18.8 19.04 19.41 19.48 19.49 19.53 19.67 19.87 19.89 19.98 20.11 20.21 20.39 20.83 21.08 21.61 22.11 22.16 22.4 22.41 22.72 22.84 23.19 23.79 24.76 24.78 25.16 25.24 25.41 25.72 26.6 26.62 26.96 27.9 29.24 30.3 32.5 38.25 20.00779 19.29 19.49 19.69 19.89 20.09 20.28 20.48 20.68 20.87 21.07 21.27 21.46 21.66 21.86 22.07 22.27 22.48 22.68 22.90 23.11 23.33 23.56 23.79 24.02 24.27 24.52 24.78 25.05 25.34 25.64 25.96 26.30 26.67 27.08 27.54 28.07 28.71 29.54 30.80 20.01639 -1.21779 -1.20779 -0.96779 -0.59779 -0.52779 -0.51779 -0.47779 -0.33779 -0.13779 -0.11779 -0.02779 0.102206 0.202206 0.382206 0.822206 1.072206 1.602206 2.102206 2.152206 2.392206 2.402206 2.712206 2.832206 3.182206 3.782206 4.752206 4.772206 5.152206 5.232206 5.402206 5.712206 6.592206 6.612206 6.952206 7.892206 9.232206 10.29221 12.49221 18.24221 -0.73 -0.53 -0.33 -0.13 0.07 0.27 0.46 0.66 0.86 1.05 1.25 1.45 1.65 1.85 2.05 2.25 2.46 2.67 2.88 3.10 3.32 3.54 3.77 4.01 4.25 4.50 4.76 5.04 5.32 5.62 5.94 6.29 6.66 7.07 7.53 8.06 8.69 9.52 10.78 0.887498 0.636814 0.3167 0.076795 -0.03659 -0.13794 -0.22121 -0.22272 -0.11791 -0.12396 -0.03473 0.147934 0.332916 0.705852 1.684543 2.415491 3.940121 5.60927 6.19949 7.407242 7.966775 9.604542 10.68153 12.75395 16.07999 21.40061 22.7379 25.95231 27.84939 30.38101 33.95177 41.44302 44.02742 49.13555 59.40224 74.37843 89.48318 118.9393 196.6504 1742.524 1.48302251 1.45876663 0.93662545 0.35735781 0.27856663 0.26811075 0.22828722 0.11410487 0.01898722 0.01387545 0.00077251 0.01044604 0.04088722 0.14608134 0.67602251 1.14962545 2.56706369 4.41926957 4.63199016 5.72264898 5.7705931 7.35606075 8.02139016 10.1264343 14.3050813 22.5834607 22.773949 26.5452255 27.3759784 29.1838284 32.629296 43.4571784 43.7212666 48.3331666 62.2869137 85.2336255 105.929502 156.055208 332.778075 1864.89237 0.5311 0.2780 0.1071 0.0165 0.0048 0.0710 0.2143 0.4347 0.7322 1.1074 1.5612 2.0950 2.7107 3.4106 4.1976 5.0752 6.0476 7.1197 8.2974 9.5877 10.9988 12.5403 14.2238 16.0632 18.0751 20.2797 22.7019 25.3726 28.3310 31.6273 35.3278 39.5222 44.3357 49.9513 56.6512 64.9057 75.5903 90.6510 116.2078 1722.7355 Com base nos dados da Tabela acima, obteve-se um coeficiente de correlação calculado igual a 0,972 e o valor crítico deste coeficiente é de 0,969, a 5% de significância. Sendo assim, como rcalc. > rcrítico, aceita-se a hipótese H0 de que a amostra pode ser representada pela distribuição Weibull. Na Figura 4.8 é possível observar a precisão do ajuste como reflexo do teste de Filliben. 150 Figura 4.8 Ajuste da distribuição Weibull pelo teste de Filliben. 151 Distribuição Gumbel a) Kolmogorov-Smirnov (Ao nível de significância de 5% de probabilidade) Ordem 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 Vazão 8.97 10.41 11.32 11.50 13.10 13.15 13.57 14.46 14.95 14.95 15.66 16.04 16.06 16.18 16.20 16.32 16.39 17.00 17.02 17.04 17.04 17.48 17.57 17.66 17.72 17.88 18.09 18.77 18.79 18.79 18.80 19.04 19.41 19.48 Fobs. 0.014493 0.028986 0.043478 0.057971 0.072464 0.086957 0.101449 0.115942 0.130435 0.144928 0.15942 0.173913 0.188406 0.202899 0.217391 0.231884 0.246377 0.26087 0.275362 0.289855 0.304348 0.318841 0.333333 0.347826 0.362319 0.376812 0.391304 0.405797 0.42029 0.434783 0.449275 0.463768 0.478261 0.492754 Festim. 0.03765 0.053008 0.065693 0.068506 0.099412 0.100565 0.110791 0.135615 0.15131 0.151406 0.177252 0.192643 0.193484 0.198602 0.199466 0.204627 0.207842 0.236661 0.237809 0.238961 0.238961 0.261911 0.266852 0.271869 0.275256 0.284618 0.296988 0.340029 0.341078 0.341555 0.342033 0.358491 0.384933 0.389729 Delta F 0.023157 0.024022 0.022215 0.010535 0.026948 0.013608 0.009342 0.019673 0.020875 0.006479 0.017832 0.01873 0.005079 0.004296 0.017925 0.027257 0.038535 0.024208 0.037553 0.050894 0.065386 0.05693 0.066481 0.075957 0.087063 0.092193 0.094317 0.065768 0.079212 0.093227 0.107242 0.105277 0.093328 0.103025 Ordem 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 Vazão 19.49 19.53 19.67 19.87 19.89 19.98 20.11 20.21 20.39 20.83 21.08 21.61 22.11 22.16 22.40 22.41 22.72 22.84 23.19 23.79 24.76 24.78 25.16 25.24 25.41 25.72 26.60 26.62 26.96 27.90 29.24 30.30 32.50 38.25 Fobs. 0.507246 0.521739 0.536232 0.550725 0.565217 0.57971 0.594203 0.608696 0.623188 0.637681 0.652174 0.666667 0.681159 0.695652 0.710145 0.724638 0.73913 0.753623 0.768116 0.782609 0.797101 0.811594 0.826087 0.84058 0.855072 0.869565 0.884058 0.898551 0.913043 0.927536 0.942029 0.956522 0.971014 0.985507 Festim. 0.390671 0.393281 0.403919 0.418869 0.420404 0.427244 0.43774 0.445423 0.459857 0.496382 0.517448 0.563019 0.607427 0.612018 0.633728 0.635006 0.662568 0.672994 0.703522 0.755651 0.831813 0.833476 0.859617 0.865303 0.876318 0.894737 0.938477 0.939425 0.952225 0.978176 0.995015 0.998946 0.999992 1 Delta F 0.116575 0.128459 0.132313 0.131856 0.144813 0.152466 0.156463 0.163272 0.163331 0.141299 0.134726 0.103648 0.073733 0.083634 0.076417 0.089632 0.076562 0.08063 0.064594 0.026958 0.034712 0.021881 0.03353 0.024723 0.021245 0.025172 0.054419 0.040875 0.039182 0.05064 0.052986 0.042424 0.028977 0.014493 ∆fcalc. máximo = 0,1633; ∆f( 68,5%) ≈ 0,160 Conclusão: Como o valor calculado é maior que o tabelado, conclui-se que a distribuição Gumbel não foi adequada a esta série histórica de vazões mínimas com 7 dias consecutivos. 152 b) Qui-quadrado (Ao nível de significância de 5% de probabilidade) Classes Fobs. Prob (X<xi) Fteo. λ 2 6,87 15,27 10 0,0228 0,1625 9,51 0,026 15,27 19,47 23 0,1625 0,3889 15,39 3,763 19,47 23,67 20 0,3889 0,7451 24,23 0,739 23,67 27,87 10 0,7451 0,9775 15,80 2,129 27,87 40,47 5 0,9775 1,0 1,53 68 7,869 14,53 λ2calculado = 14,53; λ2tab(0,05,3) = 7,815 c) Teste de Filliben Da mesma forma anterior, porém trabalhando com as equações de Gumbel para mínimos para estimativa dos valores de wi, encontra-se rcalc igual a 0,930 contra rcrítico de 0,983, a um nível de significância de 5% e considerando uma média de valores de rcrítico presentes nas Tabelas para distribuição Normal e distribuição de Gumbel/Weibull. Sendo assim, pelo teste de Filliben, a hipótese H0 pode ser rejeitada, ou seja, a amostra não pode ser representada pela distribuição de Gumbel, resultado prático semelhante ao teste de Qui-quadrado. Na Figura 4.9 é possível observar o ajuste (rcalc x rcritic), o qual é visualmente inferior ao obtido pela distribuição Weibull. Figura 4.9 Ajuste da distribuição Gumbel pelo teste de Filliben. 153 Distribuição GEV a) Teste de Kolmogorov-Smirnov Ordem 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 Vazão 8.97 10.41 11.32 11.5 13.1 13.15 13.57 14.46 14.95 14.95 15.66 16.04 16.06 16.18 16.2 16.32 16.39 17 17.02 17.04 17.04 17.48 17.57 17.66 17.72 17.88 18.09 18.77 18.79 18.79 18.8 19.04 19.41 19.48 Fobs. 0.0145 0.0290 0.0435 0.0580 0.0725 0.0870 0.1014 0.1159 0.1304 0.1449 0.1594 0.1739 0.1884 0.2029 0.2174 0.2319 0.2464 0.2609 0.2754 0.2899 0.3043 0.3188 0.3333 0.3478 0.3623 0.3768 0.3913 0.4058 0.4203 0.4348 0.4493 0.4638 0.4783 0.4928 Festim. 0.0338 0.0520 0.0674 0.0708 0.1081 0.1095 0.1216 0.1508 0.1690 0.1690 0.1981 0.2150 0.2159 0.2215 0.2225 0.2282 0.2315 0.2623 0.2633 0.2644 0.2644 0.2883 0.2933 0.2984 0.3019 0.3111 0.3236 0.3657 0.3670 0.3670 0.3677 0.3833 0.4079 0.4127 Delta F 0.0193 0.0230 0.0239 0.0128 0.0357 0.0225 0.0202 0.0349 0.0385 0.0240 0.0386 0.0411 0.0275 0.0186 0.0051 0.0037 0.0149 0.0014 0.0120 0.0255 0.0400 0.0306 0.0400 0.0494 0.0604 0.0657 0.0677 0.0401 0.0533 0.0678 0.0816 0.0805 0.0703 0.0800 Ordem 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 Vazão 19.49 19.53 19.67 19.87 19.89 19.98 20.11 20.21 20.39 20.83 21.08 21.61 22.11 22.16 22.4 22.41 22.72 22.84 23.19 23.79 24.76 24.78 25.16 25.24 25.41 25.72 26.6 26.62 26.96 27.9 29.24 30.3 32.5 38.25 Fobs. 0.5072 0.5217 0.5362 0.5507 0.5652 0.5797 0.5942 0.6087 0.6232 0.6377 0.6522 0.6667 0.6812 0.6957 0.7101 0.7246 0.7391 0.7536 0.7681 0.7826 0.7971 0.8116 0.8261 0.8406 0.8551 0.8696 0.8841 0.8986 0.9130 0.9275 0.9420 0.9565 0.9710 0.9855 Festim. 0.4134 0.4161 0.4257 0.4397 0.4411 0.4474 0.4566 0.4638 0.4768 0.5090 0.5276 0.5677 0.6059 0.6097 0.6281 0.6289 0.6527 0.6619 0.6886 0.7337 0.8034 0.8048 0.8305 0.8358 0.8468 0.8662 0.9159 0.9170 0.9336 0.9712 0.9988 0.9998 0.9999 0.9999 Delta F 0.0939 0.1056 0.1105 0.1111 0.1241 0.1323 0.1376 0.1449 0.1464 0.1287 0.1245 0.0990 0.0753 0.0859 0.0820 0.0957 0.0864 0.0917 0.0795 0.0489 0.0063 0.0068 0.0044 0.0048 0.0083 0.0034 0.0319 0.0184 0.0206 0.0436 0.0568 0.0433 0.0289 0.0144 Sendo assim: ∆fmax.= 0,146; ∆f( 68,5%) ≈ 0,160 Com isto, observa-se que a hipótese H0 do teste de Kolmogorov-Smirnov pode ser aceita, ou seja, a amostra pode ser representada pela distribuição GEV. 154 b) Qui-quadrado (Ao nível de significância de 5% de probabilidade) Classes Fobs. Prob (X<xi) Fteo. λ 2 6,87 15,27 10 0,0172 0,1817 11,19 0,127 15,27 19,47 23 0,1817 0,4120 15,66 3,440 19,47 23,67 20 0,4120 0,7247 21,26 0,075 23,67 27,87 10 0,7247 0,9702 16,69 2,682 27,87 40,47 5 0,9702 1,0 2,03 4,345 68 10,67 λ2calculado = 10,67; λ2tab(0,05,3) = 7,815 c) Teste de Filliben O valor q1, considerando a = 0,40 e N = 68, é igual a 0,008798. A função GEV inversa retorna um valor de 4,95 mm. O valor de rcalc. é igual a 0,941 e o rcrítico para nível de significância de 0,05 é de aproximadamente 0,993. Portanto, rejeita-se a hipótese H0 de que esta série histórica possa ser representada pela Distribuição GEV, de forma semelhante ao obtido pelo teste Qui-quadrado. Assim, observa-se que a única distribuição aceita por todos os testes foi a de Weibull, sendo a mesma recomendada para estudos associados à vazão mínima. Na Figura 4.10 tem-se o ajuste da distribuição GEV pelo teste de Filliben, o qual se assemelha com o ajuste obtido para distribuição Gumbel. 155 Figura 4.10 Ajuste da distribuição GEV pelo teste de Filliben. 4.11 Identificação de “outliers” em uma série hidrológica Valores “outliers” numa série histórica são aqueles considerados atípicos, sendo que esta situação pode ser ocasionada por erros laboratoriais, equívocos de medição e ou de processamento, como ocorre com razoável freqüência com dados de precipitação, ou a ocorrência de um ano hidrológico atípico, com eventos extremos de precipitação, provocando situação idêntica no comportamento das vazões. No caso de problemas com laboratório ou tratamento e processamento equivocado dos dados, é recomendável, após identificação, sua eliminação da análise, uma vez que dados atípicos podem comprometer os testes estatísticos de adequabilidade e posterior aplicação das distribuições de probabilidades. No entanto, quando o evento hidrológico extremo ocorre, recomenda-se uma análise cautelosa da série histórica, uma vez que, naturalmente, aquele valor pode fazer parte das condições climáticas e hidrológicas da região, mesmo sendo considerado como atípico pela estatística. Neste caso, recomenda-se manter o dado na série. 156 O teste mais aplicado para as condições de séries hidrológicas é conhecido como teste de Grubbs & Beck, descrito por Grubbs & Beck (1972). Para encontrar o menor valor considerado como “não-outlier” aplica-se a seguinte equação: XI = X − TN,α ⋅ S (145) O valor crítico de TN,α, pode ser inferido com base na Tabela 4.17, adaptada do trabalho original de Grubbs & Beck (1972). Sendo assim, valores abaixo de XI, teoricamente, podem ser considerados “outliers”. Sua remoção ou não dependerá de uma análise mais aprofundada da série histórica em questão. Tabela 4.17 Valores críticos de TN,α do Teste de Grubbs & Beck (1972), para valores extremos inferiores, sendo N o tamanho da amostra e α, o nível de significância. Tamanho da amostra (N) 3 5 7 10 12 15 20 22 25 30 35 40 45 50 55 60 65 68 70 75 78 80 85 90 100 110 120 130 140 147 α = 1% α = 5% α = 10% 1,155 1,749 2,097 2,410 2,550 2,705 2,884 2,939 3,009 3,103 3,178 3,240 3,292 3,336 3,376 3,411 3,442 3,460 3,471 3,496 3,511 3,521 3,543 3,563 3,600 3,632 3,662 3,688 3,712 3,727 1,153 1,672 1,938 2,176 2,285 2,409 2,557 2,603 2,663 2,745 2,811 2,866 2,914 2,956 2,992 3,025 3,055 3,071 3,082 3,107 3,121 3,130 3,151 3,171 3,207 3,239 3,267 3,294 3,318 3,334 1,148 1,602 1,828 2,036 2,134 2,247 2,385 2,429 2,486 2,563 2,628 2,682 2,727 2,768 2,804 2,837 2,866 2,883 2,893 2,917 2,931 2,940 2,961 2,981 3,017 3,049 3,078 3,104 3,129 3,144 Para verificar se o último valor da série pode ser considerado “outlier”, aplica-se a seguinte seqüência de equações: TN,α = S12 S2 (146) 157 Em que S12 é a variância da amostra (série histórica) sem o maior valor; S2 é a variância da amostra completa e x 1 é média da amostra sem o último valor da série, dada por: N−1 i=1 x1 = (x i ) (147) N −1 O valor de TN,α (equação 146) for maior que o valor crítico (Tabela 4.18), o valor não pode ser considerado “outlier”, uma vez que o valor de T calculado não será significativo. Tabela 4.18 Valores críticos de TN,α do Teste de Grubbs & Beck (1972), para valores extremos superiores, sendo N o tamanho da amostra e α, o nível de significância. Tamanho da amostra (N) 4 5 7 10 12 15 20 22 25 30 35 40 45 50 55 60 65 68 70 78 80 90 100 110 120 130 140 147 α = 1% α = 5% α = 10% 0,000 0,0035 0,0440 0,1414 0,2043 0,2859 0,3909 0,4245 0,4680 0,5268 0,5730 0,6104 0,6412 0,6672 0,6894 0,7086 0,7253 0,7344 0,7401 0,7605 0,7650 0,7853 0,8020 0,8162 0,8284 0,8389 0,8481 0,8539 0,0008 0,0183 0,1020 0,2305 0,2996 0,3818 0,4804 0,5107 0,5495 0,6008 0,6405 0,6724 0,6985 0,7203 0,7390 0,7550 0,7690 0,7766 0,7813 0,7983 0,8021 0,8190 0,8329 0,8447 0,8548 0,8636 0,8712 0,8761 0,0031 0,0376 0,1479 0,2863 0,3552 0,4345 0,5270 0,5550 0,5906 0,6375 0,6737 0,7025 0,7261 0,7459 0,7627 0,7772 0,7898 0,7966 0,8009 0,8162 0,8197 0,8349 0,8475 0,8581 0,8672 0,8752 0,8821 0,8865 158 Exemplo de Aplicação 4.20 Verificar se os valores extremos da série histórica do Exemplo de Aplicação 4.6 (Tabela 4.7) podem ser considerados “outliers”. Tamanho da Série: 68 dados Nível de Significância: 10% Média da série: 20,01 m3/s Variância: 27,83 m6/s2 a) Para o menor valor: Tcrítico = 2,883 (Tabela 4.17) XI = 20,01 − 2,883 × 27,83 = 4,80 m 3 / s Como o valor é menor que o limite inferior da série (8,97 m3/s), este último não poderá ser considerado como “outlier”. b) Para o maior valor: Tcrítico = 0,7966 (Tabela 4.18) S12 = 23,14 m6/s2 T68;10% = 23,14/27,83 = 0,831 Como o valor calculado para T é maior que o valor de Tcrítico, entende-se que não houve significância e o último valor da série (38,25 m3/s) não pode ser considerado “outlier”. 4.12 Outros testes não-paramétricos aplicados à Hidrologia Estatisticamente, a aplicação de distribuições de probabilidades a séries históricas é realizada tendo-se como referência uma amostra aleatória extraída de uma população única cuja distribuição mais adequada não é conhecida. Para que isto seja possível algumas premissas importantes devem ser consideradas, tratadas na forma de hipóteses, as quais são analisadas mediante testes não-paramétricos. É importante mencionar que os testes descritos anteriormente dizem respeito a testes necessários para avaliar o grau de aderência da distribuição de probabilidades teórica, caracterizada pela estimativa dos parâmetros populacionais, às freqüências observadas, calculadas com base na série histórica (amostra). Estes testes não avaliam se a série histórica apresenta as características necessárias para aplicação das distribuições de probabilidades. Estas condições podem ser afetadas por vários fatores como a construção de um barramento, retificação e ou alteração de um curso 159 d’água, alteração nas condições de uso do solo, eventos extremos e extraordinários, fenômenos climáticos cíclicos, dentre outros. As condições mencionadas anteriormente são tratadas como hipóteses e podem ser resumidas da forma como se segue. 4.12.1 Hipótese de Aleatoriedade Esta hipótese assume que as variações numa grandeza hidrológica são devidas a causas naturais. Na existência de interferência antrópica, como barramentos, é provável que as observações deixem de ser aleatórias. O teste de aleatoriedade possui como hipótese H0, que a série histórica é constituída por dados ou observações aleatórias. O comportamento de um hidrograma ao longo do tempo permite verificar a existência de valores máximos e mínimos, conhecidos como inflexões, e a presença deste tipo de observação, caracteriza a existência ou não de aleatoriedade (Naghettini & Pinto, 2007). A estatística deste teste é dada por: T= Ni − E(Ni) (148) var (Ni) Em que Ni representa o número de inflexões observadas na série histórica; E(Ni) e var (Ni), são, respectivamente, a esperança e a variância de Ni, sendo estimados por: E(Ni) = 2 × (N − 2) 3 var (Ni) = (149) 16 × N − 29 90 A hipótese H0 pode ser rejeitada se (150) T >z 1− α 2 , sendo α o nível de significância de z (Tabela 4.2). É importante mencionar que quando N for maior que 30, Ni segue uma distribuição aproximadamente Normal, recomendando-se a aplicação do teste para séries com esta característica. 4.12.2 Hipótese de Estacionariedade Esta hipótese estuda o comportamento de uma série histórica ao longo do tempo, analisando se a mesma apresenta tendência temporal. A hipótese H0 do teste, conhecido como Teste de Spearman, é de que os dados não apresentam tendência 160 temporal, ou seja, a série é estacionária. Uma série hidrológica pode apresentar tendência temporal e não estacionariedade pela existência de ciclos nítidos na série histórica, quando apresentar saltos na série provocados por alterações repentinas no curso d’água ou na própria bacia e por mudanças climáticas embora, neste último caso, seja necessário um longo período de tempo para análise. Mudanças graduais no uso do solo de uma bacia hidrográfica também podem produzir alterações na estacionariedade da serie histórica. A estatística do teste é obtida por: T= cs (151) var (cs ) O coeficiente cs é calculado por: 6⋅ cs = 1 − N i=1 (Fi − fi )2 (152) N3 − N var (cs) = 1 N −1 (153) Na equação 152, fi denota a posição temporal da observação na série histórica e Fi a posição que as observações, associadas a fi, ocupam, com a série organizada em ordem crescente. A hipótese H0 pode ser rejeitada se T > z 1− α 2 . 4.12.3 Hipótese de Independência Esta hipótese considera que uma dada observação não influencia a ocorrência nem a não ocorrência de outra observação ao longo do tempo. Isto é importante no contexto de vazões haja vista que o escoamento subterrâneo (pequenas vazões) é influenciado pelo armazenamento de água na bacia oriundo do período de chuvas e liberado lentamente no período seco. Vazões diárias apresentam tendência de maior dependência que vazões mensais, anuais ou extremas (máximos ou mínimos em um dado ano). A hipótese H0 deste teste é de que as observações são independentes. T= r − E(r ) var (r ) (154) A estimativa de r, E(r) e var(r) pode ser realizada da seguinte forma: r= N−1 i=1 Y1'⋅ Y1'+i + Y1'⋅ YN' (155) 161 Nesta equação, Y’1, Y’i+1, etc, consiste da subtração dos Y valores da série histórica pela média dos dados, ou seja: − Y'= Y − Y (156) A esperança de r (E(r)) e sua variância são obtidas por: E(r ) = − var (r ) = s2 N −1 s 22 − s 4 + N−1 (157) s 22 − 2 ⋅ s 4 − (N − 1) ⋅ (N − 2) s 22 (158) (N − 1)2 Em que s2 e s4 são os momentos amostrais de 2a e 4a ordem, obtidos por: s2 = s4 = (Y ) (159) (Y ) (160) N i=1 N i=1 ' i ' i 2 4 A hipótese H0 pode ser rejeitada se T > z 1− α 2 . 4.12.4 Hipótese de Homogeneidade Esta hipótese sugere que uma dada série histórica de vazões máximas esteja associada a chuvas cuja freqüência de ocorrência seja normal (esperada). Vazões de pico oriundas de eventos de chuvas históricas, ocorridas de forma atípica, causam heterogeneidade à série histórica e a observação muito provavelmente se constituirá num “outlier”. A hipótese H0 deste teste considera que a série histórica é homogênea. Para sua aplicação é recomendável que a série histórica seja dividida em duas partes aproximadamente com o mesmo número de dados, constituindo-se duas subamostras. A estatística deste teste é dada por: T= V − E(V ) (161) var (V ) A hipótese H0 será rejeitada se T > z 1− α 2 . O procedimento para cálculo de V, E(V) e var(V) é o seguinte: 162 - calcula-se o valor de V para a primeira sub-amostra: V1 = N1 ⋅ N2 + N1 ⋅ (N1 + 1) − H1 2 (162) Sendo N1, N2 e H1, respectivamente, o número de dados da 1a sub-amostra, o número de dados da 2a sub-amostra e a soma das ordens de classificação da série histórica da 1a sub-amostra (soma de Fi do teste de estacionariedade). - calcula-se o valor de V para a 2a sub-amostra: V2 = N1 ⋅ N 2 − V1 (163) O valor de V a ser adotado no cálculo de T deve ser o menor valor entre V1 e V2 . E(V ) = N1 ⋅ N 2 2 var (V ) = N1 ⋅ N2 ⋅ (N1 + N2 + 1) 12 (164) (165) Exemplo de Aplicação 4.21 Verifique se a série histórica de vazões máximas do Rio Grande, com seção de controle em Madre de Deus de Minas, apresenta aleatoriedade, estacionariedade, independência e homogeneidade. Considere nível de significância para z igual a 0,05 (z=1,96). 163 Ano 1935 1936 1937 1938 1939 1940 1941 1942 1943 1944 1945 1946 1947 1948 1949 1950 1951 1952 1953 1954 1955 1956 1957 1958 1959 1960 1961 1962 1963 Posição 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 Qmáxima 114.69 195.46 196.34 194.14 170.82 283.15 126.38 193.26 258.85 131.22 181.82 262.45 176.98 196.34 175.66 187.10 140.02 170.82 125.50 95.83 114.28 161.58 213.50 204.70 231.54 152.78 271.45 245.35 226.70 fi 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 Fi 4 42 43 39 27 66 7 38 59 9 33 60 31 43 30 35 11 27 6 2 4 21 50 48 53 18 63 57 51 Y' -79.81 0.96 1.84 -0.36 -23.68 88.65 -68.12 -1.24 64.35 -63.28 -12.68 67.95 -17.52 1.84 -18.84 -7.40 -54.48 -23.68 -69.00 -98.67 -80.22 -32.92 19.00 10.20 37.04 -41.72 76.95 50.85 32.20 Posição 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 Qmáxima 114.69 195.46 196.34 194.14 170.82 283.15 126.38 193.26 258.85 131.22 181.82 262.45 176.98 196.34 175.66 187.10 140.02 170.82 125.50 95.83 114.28 161.58 213.50 204.70 231.54 152.78 271.45 245.35 226.70 Fi 4 42 43 39 27 66 7 38 59 9 33 60 31 43 30 35 11 27 6 2 4 21 50 48 53 18 63 57 51 164 1964 1965 1966 1967 1968 1969 1970 1971 1972 1973 1974 1975 1976 1977 1978 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 230.66 244.00 279.55 194.14 134.30 162.02 88.45 197.66 152.34 162.02 187.10 149.70 195.02 148.38 239.95 213.50 167.74 143.54 175.22 257.50 159.82 275.05 266.50 162.90 165.10 187.10 202.50 178.30 437.20 141.34 157.62 373.20 189.30 269.20 129.90 310.60 233.30 113.46 145.11 201.80 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 52 56 65 40 10 23 1 45 17 22 34 16 41 15 55 49 26 13 29 58 20 64 61 24 25 34 47 32 69 12 19 68 37 62 8 67 54 3 14 46 36.16 49.50 85.05 -0.36 -60.20 -32.48 -106.05 3.16 -42.16 -32.48 -7.40 -44.80 0.52 -46.12 45.45 19.00 -26.76 -50.96 -19.28 63.00 -34.68 80.55 72.00 -31.60 -29.40 -7.40 8.00 -16.20 242.70 -53.16 -36.88 178.70 -5.20 74.70 -64.60 116.10 38.80 -81.04 -49.39 7.30 30 31 32 33 34 230.66 244.00 279.55 194.14 134.30 Soma 52 56 65 40 10 1200 165 Resultados dos testes não-paramétricos aplicados. Teste Ni Parâmetros do Teste N E(Ni) Aleatoriedade Conclusão: Hipótese H0 aceita (série aleatória) 39 69 Estacionariedade Conclusão: Hipótese H0 aceita (série estacionária, sem dependência temporal) cs - Independência Conclusão: Hipótese H0 aceita (série independente) Homogeneidade Conclusão: Hipótese H0 aceita (série homogênea) Var (Ni) |T| 44,67 11,94 1,64 - Var (cs) |T| 0,01471 0,69 E(r) Var(r) |T| -3820 909.212.690 0,20 0,0831 r - -9830 N1 N2 H1 V1 V2 E(v) Var (v) |T| 34 35 1200 585 605 595 6942 0,12 Com base nos respectivos testes não-paramétricos, observa-se que a série histórica de vazões máximas do Rio Grande nesta seção, apresenta os requisitos necessários para aplicação de distribuições de probabilidades. A hipótese de aleatoriedade da série significa que as possíveis oscilações na série são devidas a causas naturais, sem interferência antrópica. De fato, a montante desta seção de controle, não se constata a existência de nenhum tipo de barramento no Rio Grande, não verificando-se, portanto, influência nas vazões de jusante. A hipótese de estacionariedade demonstra que a série histórica não apresenta tendência temporal, ou seja, não se verificam ciclos ao longo do tempo no comportamento das vazões, nem saltos na série, significando que não houve nenhum tipo de alteração na calha do Rio Grande ou que esteja havendo alterações repentinas e importantes no uso do solo na bacia. A independência da série histórica demonstra que não há influência de uma observação em outra, ou seja, um determinado dado não é importante na ocorrência nem na não ocorrência de outro dado. Hidrologicamente, é o que se espera de dados de vazão máxima, os quais são caracterizados por precipitações importantes e a influência do escoamento base não é da mesma magnitude do escoamento superficial direto. A hipótese de homogeneidade da série demonstra que os picos verificados no período não foram provocados por eventos extraordinários de precipitação e sim por precipitações esperadas. 166 4.12.5 Teste de Mann-Kendall O teste de Mann-Kendall (Kendall, 1975; Mann, 1945) consiste de um teste não-paramétrico desenvolvido para aplicações a serie de dados temporais com o objetivo de analisar se a série histórica apresenta algum tipo de tendência. Vem sendo muito aplicado para estudos que envolvem tendência de dados hidrológicos e climatológicos. A hipótese Ho do teste é de que uma dada amostra (série histórica) é independente e identicamente distribuída, ou seja, não há tendência nos dados. A hipótese alternativa H1 é de que os dados apresentam tendência. A estatística do teste é processada da seguinte forma: S= n −1 n i =1 i = j + 1 ( sin al x j − x i ) (166) Em que xj são dados seqüenciais na série histórica de tamanho n. Assim, tem-se a seguinte situação: 1 se x j > x i sin al x j − x i = 0 se x j = x i ( ) (167) − 1 se x j < x i Após o cálculo de S, determina-se a sua variância por: V (S ) = n ⋅ (n − 1) ⋅ (2 ⋅ n + 5 ) − n tp ⋅ p ⋅ (p − 1) ⋅ (2 ⋅ p + 5 ) p =1 18 (168) Sendo tp corresponde ao número de agrupamentos com p dados. A estatística Z padronizada do teste é dada por: Z= S −1 V (S ) para S > 0 Z = 0 para S = 0 S +1 Z= para S < 0 V (S ) (169) 167 A estatística Z do teste é então comparada aos valores de Z obtidos da Tabela de Z da distribuição Normal. Para os níveis de 0,01; 0,05 e 0,1, tem-se, respectivamente, 2,58; 1,96 e 1,65. Quando Z < Z α a hipótese de nulidade Ho é aceita, ou seja, os dados não apresentam tendência; caso contrário, rejeitada, caracterizando-se possível presença de tendência. Para todas as séries climáticas simuladas foi adotado o nível de significância de 0,05. Exemplo de Aplicação 4.22 Para a série histórica de precipitação máxima diária anual da localidade de Acaiaca, representada graficamente, aplique o teste de Mann-Kendall e verifique se há algum tipo de tendência importante na série. Aplicando-se a seqüência de equações anterior, foi encontrado um valor para S igual -50 e para V(S) de 35622,67. O valor de Z estimado para a série foi de -0,259 que, considerando seu valor em módulo, é menor que os valores de Z para os níveis de significância mais aplicados. Isto significa que aceita-se a hipótese de nulidade Ho de que não há tendência na série histórica de precipitação máxima diária anual de Acaiaca, a qual corresponde em uma série completa entre 1942 e 2009. 168 Exemplo de Aplicação 4.23 Aplique o teste de Mann-Kendall para a série de vazões máximas apresentada no Exemplo de Aplicação 4.21. O valor de S calculado pela equação 167 foi igual a 122 e o valor de V(S) igual a 35675,33. O valor de Z da estatística do teste foi igual a 0,641. Como este número é menor que os valores de Z /2, conclui-se que a série não apresenta tendência temporal. 169 Referências Bibliográficas CASELLA, G.; BERGER, R.L. Statistical Inference. Belmont, CA: Duxbury Press. 1990. 650p. D’AGOSTINO, R.B.; STEPHENS, M.A. Goodness-of-fit techniques. New York: Marcel Decker. 1986. DURRANS, S. R.; PITT, R. Maximum likelihood estimators for coarsely resolved precipitation data. Journal of Hydrologic Engineering, Reston, v. 9, n.1, p.13-27, 2004. FERREIRA, D.F. Estatística Básica. Lavras: Editora UFLA, 2005. 664p. GRUBBS, F.E.; BECK, G. Extension of sample sizes and percentage points for significance tests of outlying observations. Technometrics, v. 14, n.4, p.847-854. HAAN, C.T. Statistical Methods in Hydrology. Ames: The Iowa State University Press. 2a Edição, 2002, 377p. HOSKING, J.R.M. L - moments: analysis and estimation of Distributions using Linear Combinations of Order Statistics. Journal of Royal Statistical Society, v.52, n.1, p.105-124, 1990. KATZ, R.W.; PARLANGE, M.B.; NAVEAU, P. Statistics of extremes in hydrology. Advances in Water Resources, Amsterdan, v.25, p.1287-1304, 2002. NAGHETTINI, M.; PINTO, E.J.A. Hidrologia Estatística. Belo Horizonte: CPRM, 2007.552p. SHARDA, V.N.; DAS, P.K.; OJASVI, P.R. Probability distribution of extrem rainfall series for conservation planning in a sub-humid climate. Applied Engineering in Agriculture, v. 24, n.4, p.447-453, 2008. SPIEGEL, M.R. Advanced Mathematics for Engineers and Scientists. New York: Schaum´s Outline Series, McGraw-Hill Book Company, 1971. 407p. 170 WALPOLE, R.E.; MYERS, R.H. Probability and Statistics for Engineers and Scientists. New York: Macmililan Publishing Co, 2. Edition, 1978. 580p.