Análise de Risco Fundamentos de Estatística (1) Prof. E.A.Schmitz Escolas de probabilidade Lógica Empírica Subjetivista Escola lógica Baseado em simetria Princípio da razão insuficiente de Laplace Def: Se um evento incerto apresenta N resultados, equiprováveis, mutuamente exclusivos e coletivamente completos e se um evento A contém Na destes resultados, a probabilidade do evento A é P(A)=Na/N. Empírica Baseado em experimentos Observação de resultados Def: Se um evento incerto ocorre um grande número de vezes M e o resultado de cada tentativa é independente dos anteriores e se um evento A ocorre Ma vezes então a probabilidade do evento A é igual a sua freqüência relativa, isto é P(A)=Ma/M. Subjetivista Baseado na percepção individual sobre o resultado de um processo “Probabilidades não existem” (De Finetti) Def: A probabilidade subjetiva de um evento A é um número entre 0 e 1, representando o grau de crença do indivíduo na ocorrência do evento A. Subjetividade deve ser coerente. Probabilidade – visão empírica Espaço amostral: conjunto de pontos que representa o resultado de um experimento. Quando o experimento é repetido - cada resultado aparece com uma determinada freqüência. Aumentando o número de vezes do experimento : cada resultado começa a aparecer com uma determinada freqüência com relação aos outros. Probabilidade: freqüência relativa de ocorrência de cada resultado quando o número de experimentos Variável aleatória Variável aleatória (VA): variável numérica definida num espaço amostral . Variável aleatória discreta (X): o número de valores para os quais X tem probabilidade diferente de zero é finita cada intervalo da escala real contém um número finito de valores Função de probabilidade X= { x1,x2,….xn} e {p1,p2,….pn} f(xi) = pi se x=xi (f(xi) = 0 se x xi) f(x) é a função de probabilidade de X. f(xi) = 1 P(a <X<b) = f(xi) xi in { a..b} Se a variável aleatória X é continua: f(x) >= 0 f(x) dx=1 Exemplo 1 Função de probabilidade para a variável aleatória X = “total de pontos obtidos ao jogar um dado”. Função distribuição cumulativa Funções discretas F(b) = P(X <= b)= f(xi) onde xi in { -..b} Funções contínuas f(x) dx F(b) = x in { -..b} P( a <X<b ) = F(b) - F(a) Exemplo 2 Função distribuição cumulativa para o total de pontos obtidos ao jogar um dado. 1 2 3 4 5 6 Exemplo 3-Total de pontos ao jogar dois dados 1 1 2 3 4 5 6 2 3 4 5 6 Exemplo 3 Função de probabilidade para o total de pontos obtidos ao jogar dois dados. Parâmetros das distribuições: Média m = xi*f(xi) - discreta m = x* f(x) dx - discreta Média representa o centro de massa do gráfico Parâmetros das distribuições: Variância s2= (xi - m)2*f(xi) - discreta s2 = (x- m )2* f(x) dx - contínua Variância representa a dispersão desvio padrão = s = s2 = Exemplo 4 X = “valor obtido ao jogar uma moeda”. Cara = 0, Coroa = 1 X = {0,1} {1/2,1/2} m= 0*1/2+1*1/2=1/2 s2 = (0-1/2)2*1/2 + (1-1/2)2*1/2= 1/4 Distribuição contínua 0..1 X = variável contínua entre 0..1 onde todos os valores são eqüiprováveis. m= s2 = x* f(x) dx = x* 1 dx= x2/2 ]= 1/2 (x- m )2* f(x) dx=1/12 Distribuição Triangular X = variável contínua onde : otimista (a), mais provável(m) e pessimista (b) m= (a+m+b)/3 s2= (a (a-m)+b(b-a)+m(m-b))/18 0.4 0.0 0.0 2.3 4.6 6.8 9.1 Teoremas importantes (1) Parâmetros das distribuições Seja X uma VA média=m e desvio padrão =s Teorema 1: se X1=c1*X + c2 Então X1 têm como parâmetros m1 = c1*m + c2 s12= c12 *s2 Se c1=(1/s) e c2=(-m/s) então... Teoremas importantes (2) Soma de n variáveis aleatórias independentes Z= xi i {1..n} Teorema 2: Se (mi,si ) são os parâmetros de xi. então Z tem como parâmetros: m= mi 2 2 s = si Distribuição Normal (1) -1/2 ((x- m)/ s) f(x) = k*e k = 1/(s.2) 2 Distribuição Normal (2) m =0 e s=1..10 Distribuição Normal (3) 0,45 0,4 0,35 0,3 0,25 0,2 0,15 0,1 0,05 0 3 2,6 2,2 1,8 1,4 1 0,6 0,2 -0,2 -0,6 -1 -1,4 -1,8 -2,2 -2,6 -3 Normal Reduzida (0,1) Distribuição Normal (4) 1,2 1 0,8 0,6 0,4 0,2 0 3 2,6 2,2 1,8 1,4 1 0,6 0,2 -0,2 -0,6 -1 -1,4 -1,8 -2,2 -2,6 -3 = cumulativa da normal reduzida Distribuição Normal (5) Números importantes da normal reduzida: P(m-s x m-s)= 0.68 (68%) P(m-2s xm+2s)=0.95 (95%) P(m-2.3s xm+2.3s)=0.98 (98%) P(m-3s xm+3s)=0.995 (99,5%) Teoremas importantes (3) Uso da distribuição normal reduzida Seja X normal e sua distribuição cumulativa com parâmetros F (m , s). Teorema 3: Seja a normal cumulativa reduzida (m=0 e s=1), então: P(a<x<=b)=F(b)-F(a)=((b- m)/ s )-((a- m)/ s ) Teoremas importantes (4) Soma de n variáveis aleatórias independentes Z= xi i {1..n} onde xi segue uma normal. Teorema 4: Se (mi, si) são os parâmetros de xi . Então Z segue uma distribuição Normal com : Média(Z) = m= mi 2 2 Variância(Z) = s = si Teoremas importantes (5) Teorema 5- Teorema central do limite (TCL) (forma forte) Z= xi i {1..n} xi (distribuição qualquer) Se (mi, si) são os parâmetros de xi então Z tende a uma distribuição normal: Média(Z) = m = mi Variância(Z) = s2 = si 2 (n , na prática n>30) Exercícios com CoRisco (1) 1-Simule um jogo de cara ou coroa. Verifique a freqüência do número de caras com: 10, 100 e 1000 lançamentos. 2-Simule o lançamento simultâneo de 20 moedas. Verifique a freqüência relativa do número total de caras para 10, 100 e 1000 lançamentos. Calcule a média e a variância do número total de caras. 3-Obtenha uma aproximação empírica para a soma de de 12 variáveis aleatórias que seguem uma distribuição uniforme 0..1. Calcule a média e a variância e faça um gráfico da distribuição de freqüência. 4-Obtenha uma aproximação empírica para a soma de n (n= 2,5,10) distribuições triangulares. Suponha que a distribuição i tem como parâmetros (i-1,i,i+1).Calcule a média e a variância e compare com os resultados teóricos. Exercícios com CoRisco (2) 4- Obtenha uma aproximação empírica para o produto de duas distribuições normais com média =0 e variância =1. 5-Obtenha estimativas para a função Máximo( Xi) (i=2,5,10) que representa a distribuição de probabilidade do máximo dentre i VAs cada uma delas representando uma Normal(0,1). 6-Compare os resultados obtidos nos exercícios 2 a 4 com aqueles obtidos usando-se o TCL. 7-Suponha um fluxo de caixa com 20 valores, cada um deles seguindo uma triangular com valores (8,10,12) descontados a uma taxa de 1% por período. Obtenha uma aproximação empírica para a distribuição de probabilidade do VPL e compare com o resultado obtido usando o TCL. Comente o resultado. O valor presente de um fluxo de caixa futuro, n períodos a frente é de: VP= VF/(1+t)n Geração de números aleatórios (1) Seja X uma VA uniforme 0..1 Seja Y uma VA com distribuição cumulativa G(y). Queremos: P(Xx)=P(Y y) (para todo y) P(X x)=U(x)=x U(x) = G(y) x=G(y) y=G-1(x) Geração de números aleatórios (2) F(t) 1 (t) F-1(t) 2 B A t Gerando amostras com densidade de probabilidade f(t) A M Função de Densidade de Probabilidade Triangular B t