Elementos de Estatística
Por
LUCIANO MENESES CARDOSO DA SILVA
Engenheiro Civil
Especialista em Recursos Hídricos da ANA
Doutor em Desenvolvimento Sustentável (UnB - CDS)
M.Sc. Recursos Hídricos (UFRGS - IPH)
Especialista em Saneamento Ambiental (Universidade de Linköping - Suécia)
Slides próprios e obtidos de Tucci, Porto e Ahy.
Conceitos básicos
Variável aleatória: não possui um explicação determinista da
sua ocorrência: P. Ex. a precipitação de um local; qual o
número que sairá numa roleta
População é o universo de possibilidades de ocorrência de uma
variável aleatória. P. ex. num dado são seis possibilidades,
sendo que cada número tem igual chance de ocorrer.
Amostra é a quantidade de indivíduos (valores) que permite
estimar as estatísticas da população. Por ex. após jogar o dado
1000 vezes é possível determinar qual a probabilidade de
ocorrer cada um dos número e certamente será 1/6, mas se
tivesse jogado o dado apenas 10 vezes, provavelmente minha
estimativa da probabilidade seria errada porque minha amostra
é pequena.
Conceitos
Estatísticas:
uma variável aleatória tem várias
estatísticas que a caracterizam como: média, desvio
padrão, assimetria, etc.
A média pode ser aritmética, geométrica, etc. A média
aritmética é simplesmente a média dos valores da
amostra;
o desvio padrão retrata a distribuição dos valores da
variável com relação a média. Quanto maior o valor,
maior a dispersão em relação a média;
A assimetria retrata como os dados se distribuem com
relação a média. Uma assimetria positiva mostra que a
maioria da freqüência do valores fica são maiores que a
média.
Número de intervalos (k):
2k ≥ n; k: menor inteiro; n: número de elementos da amostra
Tipos de curva de freqüência
Positiva
Negativa
Raiz quadrada da Variância
Medida da dispersão dos dados
Desvio quadrático médio da média
Conceitos básicos
Risco: é a possibilidade de ocorrência de valores da
variável aleatória fora do planejado. Por ex. qual o risco
de ocorrência de um número do dado maior que 4?
Incerteza é o erro da diferença entre as estatísticas da
amostra e da população na estimativa do risco.
Em hidrologia a incerteza pode estar na medida das
vazões, no processamento dos dados, no tamanho da
amostra e na metodologia.
Conceitos
Variável estacionária: uma variável é estacionária
quando as suas estatísticas não variam com o
tempo e não-estacionária no caso contrário.
Ex. a mudança da média do escoamento de uma bacia
urbana devido a impermeabilização; aumento ou
diminuição da vazão de estiagem depois da construção
de uma barragem, são exemplos de variáveis nãoestacionárias.
Hidrologia
estocástica:
trata da estatística
temporal. Conceitos de probabilidade para avaliar
a variabilidade temporal de uma variável
aleatória.
Conceitos
Probabilidade e tempo de retorno: A probabilidade é a
chance de ocorrência de uma variável. Esta probabilidade
pode ser cumulativa ou individual. Ex. A probabilidade de
sair o número 3 é de 1/6 a chance de que ocorra uma
número maior que 3 é de 3/6 ou ½.
O tempo de retorno (utilizado em hidrologia) retrata a
freqüência seqüencial de ocorrência de valores. Ex. o
número 3, em média, ocorre a cada seis jogadas.
Portanto TR = 1/P
Em hidrologia é utilizado para caracterizar a freqüência
de repetição de um evento. Ex. Uma inundação que tem
a chance de ser maior ou igual num ano qualquer de
0,05 ou 5%, tem um tempo de retorno de 1/0,05 = 20
anos. Significa que, em média, a inundação ocorrerá a
cada 20 anos. Não significa repetição cíclica.
QUESTÃO
P ( x >=X)= ?
Qual é a probabilidade P de uma variável hidrológica X ser
igualada ou excedida em um ano qualquer ?
Conceito:
Período de Retorno ( ou Recorrência) T
T = 1/P (anos)
Intervalo de tempo médio, em anos, em que uma variável
hidrológica é igualada ou excedida.
Para não-excedência: T = 1/(1-P)
Se uma vazão Q tem um período de
recorrência de 50 anos isto significa que, em
média(!), esta vazão é igualada ou excedida a
cada 50 anos.
Em outros termos: A vazão Q tem uma
probabilidade P= 1/T = 0.02 (ou 2%) de ser
igualada ou excedida, em um ano qualquer
OBSERVAÇÃO IMPORTANTE: É um conceito
probabilístico (não significa periodicidade!)
Conceito :
Risco de Falha
Risco é a probabilidade de uma obra falhar pelo
menos uma vez durante sua vida útil, N. Pode ser
deduzido:
R = 1 - (1 - 1/T)N
Exemplo: Qual o risco que a canalização do rio
Tamanduateí tem de falhar pelo menos uma vez
durante sua vida útil, estimada em 50 anos? A obra foi
projetada para T = 500 anos.
Conceito :
Risco de Falha
R is c o ( % )
100
T = 5 anos
T = 10 anos
80
60
T = 50 anos
40
T = 100 anos
20
T = 500 anos
0
0
10
20
30
Vida Útil (anos)
40
50
Hidrologia
Qual a vazão de projeto?
É um dos problemas mais comuns (e importantes)
em hidrologia, uma vez que envolve diretamente as
dimensões da obra - e, portanto, o seu custo - e o
risco que esta obra tem de falhar durante sua vida
útil.
Valores usuais de T (ANOS)
Obras de microdrenagem
2 a 10
Obras de macro drenagem
25 a 500
Barragens
1000 a 10000
Hidrologia
Solução:
Risco de não ocorrer em qualquer ano = 90% = 0,90
Risco de não ocorrer 5 anos seguidos = (0,9)5 = 0,5905
≈ 59%
Condições
Valores independentes: os valores da amostra
não devem apresentar correlação entre si. P. ex.
Numa amostra de vazões máximas anuais, o
valor de cada ano não devem ter correlação com
o do ano seguinte. Por isto que os valores são
escolhidos dentro do ano hidrológico.
Variável estacionária: as estatísticas da série não
podem se alterar ao longo do tempo.
Amostra
representativa:
as estatísticas da
amostras devem ser representativas da
população. O número de anos de uma amostra
de valores é importante, mas não significa tudo.
Exemplo de Blumenau
Cheias máximas em Blumenau/SC:
1852 – 16,52 m
1880 – 17,10 m
1911 – 16,90 m
1983 - 15,34 m
1984 – 15,50 m
Entre 1911 e 1984 não houve nenhuma
inundação com cota maior que 16,90 m, período
pouco representativo
Função de distribuição Normal
N(μ;σ)
Observe como os valores de média (μ) de desvio padrão (σ)
alteram a forma e aposição da curva {N(μ;σ)}.
Variável reduzida (tabelada)
A área sob a curva significa a probabilidade cumulativa de 0 a 1.
Z = (X – μ)/σ
1xσ
2xσ
3xσ
Z = (X – μ)/σ
10
Z = (X – μ)/σ
A = 0,4
A = 0,5
=?
Área = 0,4 
Z ≈ 1,28
1
Z = (X – μ)/σ
X = Z* σ + μ
Exemplo: Qméd(μ) = 311 m³/s e
desvio padrão (σ) = 169,7 m³/s.
Calcule a vazão (X) com 200 anos de
retorno (Tr = 200 anos).
X = Z.σ + μ ;
Para Tr = 200, Z = 2,5758
Então, X = 2,5758.169,7 + 311 =
748,1 m³/s
Determinação da Relação Q = f (T)
Metodologia
1.Processamento dos dados
2.Escolha
da
distribuição
de
probabilidades: determinação
da
relação entre a vazão (Q) e o tempo de
retorno (T)
Q = f(T)
1. Processamento dos dados
a) coletar uma série de observações
hidrológicas de vazões, a mais longa
possível (N > 30 anos), de um posto
próximo do local de interesse.
b) escolher a maior vazão diária de cada
ano hidrológico:
1. Processamento dos dados
Q
Ano 1
tempo (dias)
Q
Ano 2
tempo (dias)
Ano N
1. Processamento dos dados
c) ordenar as vazões em ordem
decrescente (m) e atribuir a cada uma
delas uma probabilidade empírica dada
pela expressão:
P(q > Q) = m/(N+1) Empírico
como na Tabela:
1. Processamento dos dados
Número de Vazão Probabilidade Período de
Ordem m
Q
P(q>=Q)
Retorno
T=1/P
1
Q1
1/(N+1)
(N+1)
2
Q2
2/(N+1)
(N+1)/2
3
Q3
3/(N+1)
(N+1)/3
|
|
|
|
|
|
|
|
QN
N
N/(N+1)
(N+1)/N
m
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
Média
DP
Vazão (m³/s)
348,59
614,24
696,50
1082,82
574,10
468,17
658,79
563,27
552,49
570,48
499,38
998,94
662,54
625,31
577,72
643,85
765,65
614,24
371,14
1044,87
492,40
610,56
354,99
730,87
765,65
614,24
420,63
485,45
872,34
630,352
188,531
Vazão (m³/s)
Ordenada decrescente
1082,82
1044,87
998,94
872,34
765,65
765,65
730,87
696,50
662,54
658,79
643,85
625,31
614,24
614,24
614,24
610,56
577,72
574,10
570,48
563,27
552,49
499,38
492,40
485,45
468,17
420,63
371,14
354,99
348,59
630,352
188,531
Prob.
0,033
0,067
0,100
0,133
0,167
0,200
0,233
0,267
0,300
0,333
0,367
0,400
0,433
0,467
0,500
0,533
0,567
0,600
0,633
0,667
0,700
0,733
0,767
0,800
0,833
0,867
0,900
0,933
0,967
Média
DP
TR
30,000
15,000
10,000
7,500
6,000
5,000
4,286
3,750
3,333
3,000
2,727
2,500
2,308
2,143
2,000
1,875
1,765
1,667
1,579
1,500
1,429
1,364
1,304
1,250
1,200
1,154
1,111
1,071
1,034
Vazão (m³/s)
Ajuste probabilístico de vazões máximas em Resende
(rio Paraíba do Sul)
1200,00
1150,00
1100,00
1050,00
1000,00
950,00
900,00
850,00
800,00
750,00
700,00
650,00
600,00
550,00
500,00
450,00
400,00
350,00
300,00
250,00
200,00
150,00
100,00
50,00
0,00
0
5
10
15
20
Tempo de retorno (anos)
Empírico Gumbel Exponencial
25
30
35
Distribuições de probabilidade
Eventos máximos:
Gumbel,
Log-Normal
(2
e
3
parâmetros), Pearson III e Log-Pearson
III
Eventos mínimos:
Log-Normal (2 e 3 parâmetros),
Pearson III, Log-Pearson III e Weibull
e e
Vazão (m³/s)
1082,82
1044,87
998,94
872,34
765,65
765,65
730,87
696,50
662,54
658,79
643,85
625,31
614,24
614,24
614,24
610,56
577,72
574,10
570,48
563,27
552,49
499,38
492,40
485,45
468,17
420,63
371,14
354,99
348,59
630,352
188,531
Prob.
0,033
0,067
0,100
0,133
0,167
0,200
0,233
0,267
0,300
0,333
0,367
0,400
0,433
0,467
0,500
0,533
0,567
0,600
0,633
0,667
0,700
0,733
0,767
0,800
0,833
0,867
0,900
0,933
0,967
Média
DP
TR
30,000
15,000
10,000
7,500
6,000
5,000
4,286
3,750
3,333
3,000
2,727
2,500
2,308
2,143
2,000
1,875
1,765
1,667
1,579
1,500
1,429
1,364
1,304
1,250
1,200
1,154
1,111
1,071
1,034
Gumbel
1042,997
938,549
876,312
831,307
795,701
766,001
740,340
717,601
697,058
678,211
660,701
644,256
628,664
613,756
599,390
585,442
571,801
558,364
545,029
531,689
518,227
504,507
490,359
475,559
459,785
442,531
422,913
399,070
365,570
624,196
165,852
Exponencial
1083,052
952,373
875,930
821,693
779,624
745,250
716,188
691,013
668,808
648,944
630,975
614,571
599,480
585,508
572,501
560,334
548,904
538,128
527,934
518,264
509,066
500,295
491,915
483,891
476,195
468,800
461,685
454,829
448,213
619,806
159,785
Vazões de cheia (m³/s)
Tr
ão
ç
a
ol
p
a
tr
Ex
100
500
1000
Gumbel
Exponencial
1221,7243
1310,039
1458,8988
1613,468
1560,863
1744,147
e
DISTRIBUIÇÃO DE GUMBEL (TIPO 1)
Papel de Probabilidades de Gumbel
Posição de Plotagem
1.1
5
2
T(anos)
10
50
20
100
200
500
2000
1000
10000
5000
200
Qmax
180
Q100= 136
160
114.5
107.9
93. 5
92. 2
89. 9
81. 6
79. 5
73. 3
73. 1
71. 5
70. 3
69. 4
68. 7
68. 3
68. 3
67. 7
61. 9
60. 2
59. 6
59. 2
54. 8
52. 4
49. 7
48. 8
47. 0
44. 6
40. 7
40. 4
38. 4
33. 9
m3/s
140
120
100
80
Reta empírica
60
40
20
-1
1
Pro f. Dr. Ka mel Z a hed Filho
3
Pacu m
m/ N+1
0.03
0.06
0.10
0.13
0.16
0.19
0.23
0.26
0.29
0.32
0.35
0.39
0.42
0.45
0.48
0.52
0.55
0.58
0.61
0.65
0.68
0.71
0.74
0.77
0.81
0.84
0.87
0.90
0.94
0.97
5
7
variável reduzida (y)
Pro f. Dr.Ru bem L a L a in a Po rto
T
N +1
31. 00
15. 50
10. 33
7.75
6.20
5.17
4.43
3.88
3.44
3.10
2.82
2.58
2.38
2.21
2.07
1.94
1.82
1.72
1.63
1.55
1.48
1.41
1.35
1.29
1.24
1.19
1.15
1.11
1.07
1.03
9
Valores de Kt para Pearson III
Tr
Curva de permanência
“Curva que indica a percentagem do
tempo em que um determinado valor de
vazão foi igualado ou ultrapassado
durante um período de observações”
Valores diários, semanais ou mensais
Útil para:
Critérios de outorga, navegação, qualidade da
água, estudos hidrelétricos, etc.
Hidrograma mensal
X
Curva de Permanência mensal
X
10 200 000 - Rio Javari em Palmeiras do Javari
110
100
90
vazão (m3/s)
80
25
70
60
50
40
30
20
10
0
0
5
10
15 20
25 30
35 40
45 50
55 60
65 70
permanência (%)
Q90
75 80
85 90
95 100
Curva de Permanência
Manancial regularizado
IMPORTANTÍSSIMO!
Salários das carreiras de Especialista em Recursos Hídricos
e de Geoprocessamento da Agência Nacional de Águas - ANA
Ex-aluno(a) do OBCursos
3456732

30/06/2006
30/06/2006
PERGUNTAS?
Download

Variável aleatória