Elementos de Estatística Por LUCIANO MENESES CARDOSO DA SILVA Engenheiro Civil Especialista em Recursos Hídricos da ANA Doutor em Desenvolvimento Sustentável (UnB - CDS) M.Sc. Recursos Hídricos (UFRGS - IPH) Especialista em Saneamento Ambiental (Universidade de Linköping - Suécia) Slides próprios e obtidos de Tucci, Porto e Ahy. Conceitos básicos Variável aleatória: não possui um explicação determinista da sua ocorrência: P. Ex. a precipitação de um local; qual o número que sairá numa roleta População é o universo de possibilidades de ocorrência de uma variável aleatória. P. ex. num dado são seis possibilidades, sendo que cada número tem igual chance de ocorrer. Amostra é a quantidade de indivíduos (valores) que permite estimar as estatísticas da população. Por ex. após jogar o dado 1000 vezes é possível determinar qual a probabilidade de ocorrer cada um dos número e certamente será 1/6, mas se tivesse jogado o dado apenas 10 vezes, provavelmente minha estimativa da probabilidade seria errada porque minha amostra é pequena. Conceitos Estatísticas: uma variável aleatória tem várias estatísticas que a caracterizam como: média, desvio padrão, assimetria, etc. A média pode ser aritmética, geométrica, etc. A média aritmética é simplesmente a média dos valores da amostra; o desvio padrão retrata a distribuição dos valores da variável com relação a média. Quanto maior o valor, maior a dispersão em relação a média; A assimetria retrata como os dados se distribuem com relação a média. Uma assimetria positiva mostra que a maioria da freqüência do valores fica são maiores que a média. Número de intervalos (k): 2k ≥ n; k: menor inteiro; n: número de elementos da amostra Tipos de curva de freqüência Positiva Negativa Raiz quadrada da Variância Medida da dispersão dos dados Desvio quadrático médio da média Conceitos básicos Risco: é a possibilidade de ocorrência de valores da variável aleatória fora do planejado. Por ex. qual o risco de ocorrência de um número do dado maior que 4? Incerteza é o erro da diferença entre as estatísticas da amostra e da população na estimativa do risco. Em hidrologia a incerteza pode estar na medida das vazões, no processamento dos dados, no tamanho da amostra e na metodologia. Conceitos Variável estacionária: uma variável é estacionária quando as suas estatísticas não variam com o tempo e não-estacionária no caso contrário. Ex. a mudança da média do escoamento de uma bacia urbana devido a impermeabilização; aumento ou diminuição da vazão de estiagem depois da construção de uma barragem, são exemplos de variáveis nãoestacionárias. Hidrologia estocástica: trata da estatística temporal. Conceitos de probabilidade para avaliar a variabilidade temporal de uma variável aleatória. Conceitos Probabilidade e tempo de retorno: A probabilidade é a chance de ocorrência de uma variável. Esta probabilidade pode ser cumulativa ou individual. Ex. A probabilidade de sair o número 3 é de 1/6 a chance de que ocorra uma número maior que 3 é de 3/6 ou ½. O tempo de retorno (utilizado em hidrologia) retrata a freqüência seqüencial de ocorrência de valores. Ex. o número 3, em média, ocorre a cada seis jogadas. Portanto TR = 1/P Em hidrologia é utilizado para caracterizar a freqüência de repetição de um evento. Ex. Uma inundação que tem a chance de ser maior ou igual num ano qualquer de 0,05 ou 5%, tem um tempo de retorno de 1/0,05 = 20 anos. Significa que, em média, a inundação ocorrerá a cada 20 anos. Não significa repetição cíclica. QUESTÃO P ( x >=X)= ? Qual é a probabilidade P de uma variável hidrológica X ser igualada ou excedida em um ano qualquer ? Conceito: Período de Retorno ( ou Recorrência) T T = 1/P (anos) Intervalo de tempo médio, em anos, em que uma variável hidrológica é igualada ou excedida. Para não-excedência: T = 1/(1-P) Se uma vazão Q tem um período de recorrência de 50 anos isto significa que, em média(!), esta vazão é igualada ou excedida a cada 50 anos. Em outros termos: A vazão Q tem uma probabilidade P= 1/T = 0.02 (ou 2%) de ser igualada ou excedida, em um ano qualquer OBSERVAÇÃO IMPORTANTE: É um conceito probabilístico (não significa periodicidade!) Conceito : Risco de Falha Risco é a probabilidade de uma obra falhar pelo menos uma vez durante sua vida útil, N. Pode ser deduzido: R = 1 - (1 - 1/T)N Exemplo: Qual o risco que a canalização do rio Tamanduateí tem de falhar pelo menos uma vez durante sua vida útil, estimada em 50 anos? A obra foi projetada para T = 500 anos. Conceito : Risco de Falha R is c o ( % ) 100 T = 5 anos T = 10 anos 80 60 T = 50 anos 40 T = 100 anos 20 T = 500 anos 0 0 10 20 30 Vida Útil (anos) 40 50 Hidrologia Qual a vazão de projeto? É um dos problemas mais comuns (e importantes) em hidrologia, uma vez que envolve diretamente as dimensões da obra - e, portanto, o seu custo - e o risco que esta obra tem de falhar durante sua vida útil. Valores usuais de T (ANOS) Obras de microdrenagem 2 a 10 Obras de macro drenagem 25 a 500 Barragens 1000 a 10000 Hidrologia Solução: Risco de não ocorrer em qualquer ano = 90% = 0,90 Risco de não ocorrer 5 anos seguidos = (0,9)5 = 0,5905 ≈ 59% Condições Valores independentes: os valores da amostra não devem apresentar correlação entre si. P. ex. Numa amostra de vazões máximas anuais, o valor de cada ano não devem ter correlação com o do ano seguinte. Por isto que os valores são escolhidos dentro do ano hidrológico. Variável estacionária: as estatísticas da série não podem se alterar ao longo do tempo. Amostra representativa: as estatísticas da amostras devem ser representativas da população. O número de anos de uma amostra de valores é importante, mas não significa tudo. Exemplo de Blumenau Cheias máximas em Blumenau/SC: 1852 – 16,52 m 1880 – 17,10 m 1911 – 16,90 m 1983 - 15,34 m 1984 – 15,50 m Entre 1911 e 1984 não houve nenhuma inundação com cota maior que 16,90 m, período pouco representativo Função de distribuição Normal N(μ;σ) Observe como os valores de média (μ) de desvio padrão (σ) alteram a forma e aposição da curva {N(μ;σ)}. Variável reduzida (tabelada) A área sob a curva significa a probabilidade cumulativa de 0 a 1. Z = (X – μ)/σ 1xσ 2xσ 3xσ Z = (X – μ)/σ 10 Z = (X – μ)/σ A = 0,4 A = 0,5 =? Área = 0,4 Z ≈ 1,28 1 Z = (X – μ)/σ X = Z* σ + μ Exemplo: Qméd(μ) = 311 m³/s e desvio padrão (σ) = 169,7 m³/s. Calcule a vazão (X) com 200 anos de retorno (Tr = 200 anos). X = Z.σ + μ ; Para Tr = 200, Z = 2,5758 Então, X = 2,5758.169,7 + 311 = 748,1 m³/s Determinação da Relação Q = f (T) Metodologia 1.Processamento dos dados 2.Escolha da distribuição de probabilidades: determinação da relação entre a vazão (Q) e o tempo de retorno (T) Q = f(T) 1. Processamento dos dados a) coletar uma série de observações hidrológicas de vazões, a mais longa possível (N > 30 anos), de um posto próximo do local de interesse. b) escolher a maior vazão diária de cada ano hidrológico: 1. Processamento dos dados Q Ano 1 tempo (dias) Q Ano 2 tempo (dias) Ano N 1. Processamento dos dados c) ordenar as vazões em ordem decrescente (m) e atribuir a cada uma delas uma probabilidade empírica dada pela expressão: P(q > Q) = m/(N+1) Empírico como na Tabela: 1. Processamento dos dados Número de Vazão Probabilidade Período de Ordem m Q P(q>=Q) Retorno T=1/P 1 Q1 1/(N+1) (N+1) 2 Q2 2/(N+1) (N+1)/2 3 Q3 3/(N+1) (N+1)/3 | | | | | | | | QN N N/(N+1) (N+1)/N m 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 Média DP Vazão (m³/s) 348,59 614,24 696,50 1082,82 574,10 468,17 658,79 563,27 552,49 570,48 499,38 998,94 662,54 625,31 577,72 643,85 765,65 614,24 371,14 1044,87 492,40 610,56 354,99 730,87 765,65 614,24 420,63 485,45 872,34 630,352 188,531 Vazão (m³/s) Ordenada decrescente 1082,82 1044,87 998,94 872,34 765,65 765,65 730,87 696,50 662,54 658,79 643,85 625,31 614,24 614,24 614,24 610,56 577,72 574,10 570,48 563,27 552,49 499,38 492,40 485,45 468,17 420,63 371,14 354,99 348,59 630,352 188,531 Prob. 0,033 0,067 0,100 0,133 0,167 0,200 0,233 0,267 0,300 0,333 0,367 0,400 0,433 0,467 0,500 0,533 0,567 0,600 0,633 0,667 0,700 0,733 0,767 0,800 0,833 0,867 0,900 0,933 0,967 Média DP TR 30,000 15,000 10,000 7,500 6,000 5,000 4,286 3,750 3,333 3,000 2,727 2,500 2,308 2,143 2,000 1,875 1,765 1,667 1,579 1,500 1,429 1,364 1,304 1,250 1,200 1,154 1,111 1,071 1,034 Vazão (m³/s) Ajuste probabilístico de vazões máximas em Resende (rio Paraíba do Sul) 1200,00 1150,00 1100,00 1050,00 1000,00 950,00 900,00 850,00 800,00 750,00 700,00 650,00 600,00 550,00 500,00 450,00 400,00 350,00 300,00 250,00 200,00 150,00 100,00 50,00 0,00 0 5 10 15 20 Tempo de retorno (anos) Empírico Gumbel Exponencial 25 30 35 Distribuições de probabilidade Eventos máximos: Gumbel, Log-Normal (2 e 3 parâmetros), Pearson III e Log-Pearson III Eventos mínimos: Log-Normal (2 e 3 parâmetros), Pearson III, Log-Pearson III e Weibull e e Vazão (m³/s) 1082,82 1044,87 998,94 872,34 765,65 765,65 730,87 696,50 662,54 658,79 643,85 625,31 614,24 614,24 614,24 610,56 577,72 574,10 570,48 563,27 552,49 499,38 492,40 485,45 468,17 420,63 371,14 354,99 348,59 630,352 188,531 Prob. 0,033 0,067 0,100 0,133 0,167 0,200 0,233 0,267 0,300 0,333 0,367 0,400 0,433 0,467 0,500 0,533 0,567 0,600 0,633 0,667 0,700 0,733 0,767 0,800 0,833 0,867 0,900 0,933 0,967 Média DP TR 30,000 15,000 10,000 7,500 6,000 5,000 4,286 3,750 3,333 3,000 2,727 2,500 2,308 2,143 2,000 1,875 1,765 1,667 1,579 1,500 1,429 1,364 1,304 1,250 1,200 1,154 1,111 1,071 1,034 Gumbel 1042,997 938,549 876,312 831,307 795,701 766,001 740,340 717,601 697,058 678,211 660,701 644,256 628,664 613,756 599,390 585,442 571,801 558,364 545,029 531,689 518,227 504,507 490,359 475,559 459,785 442,531 422,913 399,070 365,570 624,196 165,852 Exponencial 1083,052 952,373 875,930 821,693 779,624 745,250 716,188 691,013 668,808 648,944 630,975 614,571 599,480 585,508 572,501 560,334 548,904 538,128 527,934 518,264 509,066 500,295 491,915 483,891 476,195 468,800 461,685 454,829 448,213 619,806 159,785 Vazões de cheia (m³/s) Tr ão ç a ol p a tr Ex 100 500 1000 Gumbel Exponencial 1221,7243 1310,039 1458,8988 1613,468 1560,863 1744,147 e DISTRIBUIÇÃO DE GUMBEL (TIPO 1) Papel de Probabilidades de Gumbel Posição de Plotagem 1.1 5 2 T(anos) 10 50 20 100 200 500 2000 1000 10000 5000 200 Qmax 180 Q100= 136 160 114.5 107.9 93. 5 92. 2 89. 9 81. 6 79. 5 73. 3 73. 1 71. 5 70. 3 69. 4 68. 7 68. 3 68. 3 67. 7 61. 9 60. 2 59. 6 59. 2 54. 8 52. 4 49. 7 48. 8 47. 0 44. 6 40. 7 40. 4 38. 4 33. 9 m3/s 140 120 100 80 Reta empírica 60 40 20 -1 1 Pro f. Dr. Ka mel Z a hed Filho 3 Pacu m m/ N+1 0.03 0.06 0.10 0.13 0.16 0.19 0.23 0.26 0.29 0.32 0.35 0.39 0.42 0.45 0.48 0.52 0.55 0.58 0.61 0.65 0.68 0.71 0.74 0.77 0.81 0.84 0.87 0.90 0.94 0.97 5 7 variável reduzida (y) Pro f. Dr.Ru bem L a L a in a Po rto T N +1 31. 00 15. 50 10. 33 7.75 6.20 5.17 4.43 3.88 3.44 3.10 2.82 2.58 2.38 2.21 2.07 1.94 1.82 1.72 1.63 1.55 1.48 1.41 1.35 1.29 1.24 1.19 1.15 1.11 1.07 1.03 9 Valores de Kt para Pearson III Tr Curva de permanência “Curva que indica a percentagem do tempo em que um determinado valor de vazão foi igualado ou ultrapassado durante um período de observações” Valores diários, semanais ou mensais Útil para: Critérios de outorga, navegação, qualidade da água, estudos hidrelétricos, etc. Hidrograma mensal X Curva de Permanência mensal X 10 200 000 - Rio Javari em Palmeiras do Javari 110 100 90 vazão (m3/s) 80 25 70 60 50 40 30 20 10 0 0 5 10 15 20 25 30 35 40 45 50 55 60 65 70 permanência (%) Q90 75 80 85 90 95 100 Curva de Permanência Manancial regularizado IMPORTANTÍSSIMO! Salários das carreiras de Especialista em Recursos Hídricos e de Geoprocessamento da Agência Nacional de Águas - ANA Ex-aluno(a) do OBCursos 3456732 30/06/2006 30/06/2006 PERGUNTAS?