Conteúdo A distribuição Lognormal A distribuição Normal Bivariada A distribuição Beta e sua relação com a Uniforme(0,1) IND 1115 Inferência Estatística Aula 6 Setembro de 2004 Mônica Barros [email protected] [email protected] 1 A distribuição Lognormal [email protected] [email protected] A Distribuição Lognormal A distribuição Lognormal é uma distribuição de probabilidade contínua usada para dados positivos. Esta distribuição é freqüentemente usada na modelagem do preço de ações e outros ativos financeiros, e também pode modelar o tempo até a ocorrência de um defeito de uma máquina. Como criar uma variável lognormal? Seja X ~ N(µ, σ2). Seja Y = exp(X). Então Y tem densidade Lognormal com 2 parâmetros µ e σ . A densidade de Y pode ser facilmente encontrada pelos métodos usuais (por exemplo, o método do Jacobiano), e é dada por: f ( y) = 1 . 1 .exp − ( log( y) − µ ) onde y > 0 2 2πσ [email protected] [email protected] 2 3 2 y [email protected] [email protected] 2σ 2 4 A Distribuição Lognormal A Distribuição Lognormal Exemplo – Lognormais com µ = 0.05 e 0.25 e σ = 0.30 1.323 1.5 1 f ( x, 0.05 , 0.30) f ( x, 0.25 , 0.30) 0.5 0 0 0 0.01 1 2 3 4 5 6 7 7 x [email protected] [email protected] 5 Lognormal como modelo para o preço de uma ação { ( )} 6 7 Note que, se σ = 0, a evolução dos preços é puramente determinística, e então: St +∆t = St .{exp ( µ .∆t )} onde Z é uma variável N(0,1) e µ e σ > 0 são parâmetros conhecidos. O parâmetro µ representa a taxa média de crescimento do preço ao longo do tempo. [email protected] [email protected] [email protected] [email protected] Lognormal como modelo para o preço de uma ação Uma forma de descrever a incerteza sobre o preço de uma ação é supor que as variações no preço entre os instantes t e t+∆t podem ser divididas em 2 componentes, uma aleatória e a outra determinística, como a seguir: St +∆t = St . exp µ .∆t + σ .Z ∆t Atenção: A distribuição Lognormal, ao contrário do que o nome indica, não significa a densidade do logaritmo de uma variável Normal, pois uma variável Normal admite valores negativos, onde o logaritmo não está definido. Uma variável aleatória com densidade Lognormal é encontrada tomando-se a exponencial de uma variável aleatória Normal! Nesta expressão percebemos que a tendência determinística dos preços é crescente desde que µ > 0. Se σ > 0 então existe uma componente aleatória no comportamento dos preços. Esta componente aleatória é dada por uma variável aleatória N(0,1), e assim o efeito desta variável pode ser o de atenuar o crescimento determinístico no preço, pois Z pode ser negativo. Note que a variável exp(Z) é Lognormal. [email protected] [email protected] 8 Propriedades da distribuição Lognormal Lognormal (para casa) Teorema (média e variância da Lognormal) Se Y ~ Lognormal(µ, σ2) então: E(Y) = exp( µ + σ2/2) ( ) VAR(Y ) = exp ( 2 µ + σ 2 ) . eσ − 1 2 Sejam Y1 e Y2 variáveis Normais independentes com médias 4 e 2 e variâncias iguais a 1. Sejam X1 e X2 definidos como: X1 = exp(Y1) e X2 = exp(Y2) . Defina uma nova variável W como: W = e 2 . X12 . X23 a) Calcule E(W) b) Calcule VAR(W) Demonstração – faça em casa – use a fgm de uma Normal. [email protected] [email protected] 9 10 A distribuição Normal Bivariada Lognormal (para casa) [email protected] [email protected] Dicas: 1) Se X tem densidade N(µ, σ2) então sua função geradora de momentos é: exp(µt + σ2t2/2) 2) Se U é uma variável qualquer então : VAR(U) = E(U2) - {E(U)}2 Não é necessário especificar completamente a densidade da variável W - você só precisa calcular sua média e variância. É uma distribuição conjunta para duas variáveis X1 e X2, ambas Normais e, a princípio dependentes. A densidade conjunta é dada por: f ( x1 , x2 ) = −1 .exp .R 2 2π (1 − ρ ) σ σ 2 (1 − ρ ) 1 2 2 1 2 2 Onde R é: 2 2 x − µ1 x2 − µ2 x1 − µ1 x2 − µ2 R= 1 + − 2.ρ . . σ σ σ1 σ 2 1 2 [email protected] [email protected] 11 [email protected] [email protected] 12 A distribuição Normal Bivariada A distribuição Normal Bivariada Esta densidade conjunta é chamada de densidade Normal Bivariada com parâmetros µ1, µ2 , ρ, σ12, σ22 , onde µ1 e µ2 são números reais quaisquer, ρ está restrito ao intervalo (-1,1) e σ12, σ22 são positivos. A densidade marginal de X1 é N(µ1,σ12) A densidade marginal de X2 é N(µ2,σ22) As densidades condicionais também são Normais. A densidade condicional de X1 dado X2 = x2 é: σ ( X | X = x ) ~ N µ + ρ . . ( x − µ ) , σ . (1 − ρ ) σ 1 Se (X1, X2) ~ N( µ1, µ2 , ρ, σ12, σ22 ) então: 2 13 1 1 2 2 2 1 2 2 A densidade condicional de X2 dado X1 = x1 é: ( X | X = x ) ~ N µ + ρ . σ . ( x − µ ) , σ . (1 − ρ ) 2 [email protected] [email protected] 2 1 1 2 2 σ1 [email protected] [email protected] 1 1 2 2 2 14 A distribuição Normal Bivariada A distribuição Normal Bivariada Dada uma densidade Normal bivariada, quais são as suas características mais importantes ? Pr( a < X1 < b, c < X2 < d) é encontrada pela integral dupla da densidade Normal bivariada sobre os intervalos (a, b) e (c, d). O parâmetro ρ na densidade Normal Bivariada é o coeficiente de correlação entre X1 e X2. Se ρ = 0, X1 e X2 são descorrelatados, mas da expressão da densidade Normal bivariada podemos perceber que a densidade conjunta reduz-se ao produto das densidades marginais. A integral dupla sobre todos os valores de X1 e X2 da densidade Normal bivariada é um. Logo, no caso da distribuição Normal bivariada (e apenas nele!!!!), correlação zero é equivalente à independência entre as duas variáveis aleatórias. [email protected] [email protected] 15 [email protected] [email protected] 16 A distribuição Normal Bivariada A distribuição Normal Bivariada Os valores esperados das densidades condicionais são funções lineares. Por exemplo: σ E ( X 2 | X 1 = x1 ) = µ2 + ρ . 2 . ( x1 − µ1 ) σ1 que não depende de X1. Na verdade, quanto maior (em módulo) a correlação entre X1 e X2, menor é a variância condicional (maior a informação que X1 trouxe para X2). 17 A distribuição Normal Bivariada [email protected] [email protected] 18 A distribuição Normal Bivariada - Exemplo Isto é, se a correlação entre as duas variáveis é grande (em módulo), o conhecimento de uma das variáveis (densidade condicional) implica numa redução substancial da incerteza (variância) da outra. Por outro lado, se a correlação entre as variáveis é pequena, o efeito de conhecer uma variável sobre a incerteza na densidade condicional é pequeno também, e a variância condicional está próxima da variância da variável "sozinha" ( variância da densidade marginal). No limite, se ρ = 0 , as variáveis são independentes, e conhecer uma delas não traz qualquer informação sobre a outra variável. [email protected] [email protected] As variâncias das densidades condicionais são constantes, e não dependem do valor da variável em que se está condicionando. Por exemplo: VAR( X 2 | X 1 = x1 ) = σ 22 . (1 − ρ 2 ) Note que este valor esperado é chamado de regressão de X2 em X1 e neste caso percebemos que a função de regressão é uma função linear de X1. [email protected] [email protected] 19 Sejam X1 ~ N(0, 1) e X2 ~ N(0, 4). Escreva a densidade Normal bivariada neste caso em função de ρ e calcule as densidades condicionais quando ρ = 0.5, -0.5, 0, 0.8, -0.8. Solução f ( x1 , x2 ) = x 2 x 2 −1 x x .exp . 1 + 2 − 2.ρ . 1 . 2 2 1 2 1 2 − ρ 2 1 ( ) 2π (1)(2) 1 − ρ 1 2 [email protected] [email protected] 20 A distribuição Normal Bivariada - Exemplo A distribuição Normal Bivariada - Exemplo Lembramos novamente que o caso ρ = 0 corresponde à independência entre X1 e X2 , pois neste caso a densidade conjunta anterior é apenas o produto das marginais, que são N(0,1) e N(0,4). 2 E ( X 2 | x1 ) = 0 + ρ . . ( x1 − 0 ) = 2.ρ .x1 1 VAR ( X 2 | x1 ) = ( 2 ) .(1 − ρ 2 ) = 4.(1 − ρ 2 ) 2 A densidade condicional de X2 dado X1 = x1 é Normal, com média e variância dadas por: A densidade condicional de X1 dado X2 = x2 é Normal com média e variância dadas por: 1 1 E ( X 1 | x2 ) = 0 + ρ . . ( x2 − 0 ) = .ρ .x2 2 2 VAR( X 1 | x2 ) = (1) .(1 − ρ 2 ) = 1 − ρ 2 2 [email protected] [email protected] 21 A distribuição Normal Bivariada - Exemplo 22 A distribuição Normal Bivariada - Exemplo A próxima tabela exibe os valores das médias e variâncias condicionais para os valores de ρ especificados. ρ -0.8 E(X2|x1) (-1.6)x1 VAR(X2|x1) 4(0.36) = 1.44 E(X1|x2) (-0.4)x2 VAR(X1|x2) 0.36 -0.5 (-1.0)x1 4(0.75) = 3.00 (-0.25)x2 0.25 0 0.5 0 (+1.0)x1 4 4(0.75) = 3.00 0 (+0.25)x2 1 0.25 0.8 (+1.6)x1 4(0.36) = 1.44 (+0.4)x2 0.36 [email protected] [email protected] [email protected] [email protected] 23 Da tabela notamos que, a variância incondicional de X2 (quando X1 não é levado em consideração, ou quando as duas variáveis são independentes) é 4. Esta variância se reduz quando o coeficiente de correlação aumenta em módulo. A média condicional de X2 dado x1 não depende de x1 quando as variáveis são independentes, e é uma reta quando ρ ≠ 0. O coeficiente angular desta reta varia de acordo com o valor de ρ, podendo ser negativo ou positivo. Comentários semelhantes se aplicam à distribuição condicional de X1 dado x2. [email protected] [email protected] 24 A distribuição Normal Bivariada - Exemplo A distribuição Normal Bivariada - Exemplo A seguir mostramos densidades Normais bivariadas com µ1 e µ2 = 0, σ12 = 1 σ22 = (4)2 = 16 e ρ com diversos valores. Verifique e compare as curvas de nível destas densidades. [email protected] [email protected] 25 A distribuição Normal Bivariada - Exemplo ρ = -0.8 (Densidade Bivariada) [email protected] [email protected] 26 A distribuição Normal Bivariada - Exemplo ρ = -0.8 (Curvas de Nível – são ELIPSES!) [email protected] [email protected] 27 ρ = -0.8 (Densidade Condicional de X1 dado X2) [email protected] [email protected] 28 A distribuição Normal Bivariada - Exemplo A distribuição Normal Bivariada - Exemplo ρ = -0.8 (Densidade Condicional de X2 dado X1) [email protected] [email protected] 29 A distribuição Normal Bivariada - Exemplo ρ = 0 (Densidade Bivariada) [email protected] [email protected] 30 A distribuição Normal Bivariada - Exemplo ρ = 0 (Curvas de Nível – são CÍRCULOS) [email protected] [email protected] 31 ρ = +0.8 (Densidade Bivariada) [email protected] [email protected] 32 A distribuição Normal Bivariada - Exemplo Distribuição Normal bivariada (para casa) ρ = +0.8 (Curvas de Nível – são ELIPSES!) [email protected] [email protected] a) A probabilidade da taxa de 30 14% e 18%. b) A probabilidade da taxa de 60 14% e 18%. c) A probabilidade da taxa de 30 14% e 18% sabendo que a taxa hoje em 22%. d) A probabilidade da taxa de 30 14% e 18% sabendo que a taxa hoje em 15%. e) A probabilidade da taxa de 60 14% e 18% sabendo que a taxa hoje em 18%. [email protected] [email protected] Num certo instante de tempo, as taxas de juros de 30 e 60 dias têm, conjuntamente, uma distribuição Normal bivariada com médias 16% e 16.8% ao ano, e desvios padrões 4% e 5% ao ano respectivamente. A correlação entre as taxas é 90%. Calcule: 33 Distribuição Normal bivariada (para casa) [email protected] [email protected] 34 Distribuição Normal bivariada (para casa) dias estar entre dias estar entre dias estar entre de 60 dias está dias estar entre de 60 dias está dias estar entre de 30 dias está 35 Fez-se uma pesquisa de preços de roupas masculinas num shopping center. Uma amostra dos produtos existentes revela que o preço das calças é uma variável Normal com média R$ 80 e desvio padrão R$ 30. O preço das camisas é, por sua vez, uma variável Normal com média R$ 60 e desvio padrão R$ 25. A correlação entre os preços de calças e camisas é 0.6. Calcule as seguintes probabilidades: a) De um par de calças custar entre R$ 60 e R$ 95. [email protected] [email protected] 36 Distribuição Normal bivariada (para casa) Distribuição Beta b) De um par de calças custar entre R$ 60 e R$ 95 sabendo que uma camisa custa R$ 75 nesta loja. c) De um par de calças custar entre R$ 60 e R$ 95 sabendo que uma camisa custa R$ 50 nesta loja. d) Qual é a distribuição condicional dos preços das camisas sabendo que o preço das calças é R$ 100? e) Qual é a distribuição condicional dos preços das camisas sabendo que o preço das calças é R$ 70? [email protected] [email protected] Definição (Função Beta) Sejam m e n > 0 (não necessariamente inteiros). A função Beta com argumentos m e n é definida por: β (m, n) = ∫ 1 o x m −1 (1 − x) n −1 dx = 2 Distribuição Beta Teorema - Propriedades da Função Beta β(m, n) = β(n, m) Γ ( m) Γ ( n ) Γ(m+n) Esta última propriedade é importante por que relaciona as funções Gama e Beta, e será útil na derivação dos momentos da densidade Beta. [email protected] [email protected] 39 o (sin θ ) 2 m −1 (cos θ ) 2 n −1 dθ [email protected] [email protected] Distribuição Beta β (m, n) = π /2 Aqui usamos a transformação x = sin2θ para obter a última integral do lado direito. 37 ∫ 38 Definição (Densidade Beta) A densidade de probabilidade Beta deve ser aplicada a variáveis aleatórias definidas no intervalo [0,1], e será importante no contexto de Estatística Bayesiana. A variável aleatória X tem densidade Beta(m, n), se sua densidade é: f ( x) = 1 x m −1 (1 − x) n −1 , 0 ≤ x ≤ 1, m,n > 0 β (m, n) [email protected] [email protected] 40 Distribuição Beta Distribuição Beta onde β(m, n) é a função Beta definida anteriormente. Note que, se m = n = 1 a densidade Beta se reduz à Uniforme no intervalo (0,1). Algumas densidades Beta 12 10 Beta(1,2) 8 Notação: X ~ Beta(m, n) Beta(1,3) 6 A densidade Beta é apropriada para modelar proporções, por causa do seu domínio (o intervalo (0,1)) e também pela variedade de formas que a densidade pode assumir, de acordo com os valores especificados de m e n. [email protected] [email protected] Beta(2,2) 4 Beta(2,3) 2 41 Distribuição Beta Teorema - (Média e variância de uma v.a. Beta) Se X ~ Beta (m, n) então: m E(X ) = m+n VAR( X ) = 1.0 0.9 0.8 0.7 [email protected] [email protected] Distribuição Beta 0.6 0.5 0.4 0.3 0.2 0.1 0 0.0 Beta(2,1) 42 Demonstração Segue do fato: Γ ( k + m )Γ ( m + n ) Γ ( m)Γ ( k + m + n ) Para todo k inteiro ≥ 1 E( X k ) = mn (m + n + 1) (m + n) 2 [email protected] [email protected] 43 [email protected] [email protected] 44 Distribuição Beta e relação com a Uniforme(0,1) Distribuição Beta e relação com a Uniforme(0,1) Teorema Sejam X1, X2, ... , Xn variáveis aleatórias independentes com densidade Unif(0,1). Seja Yr o r-ésimo maior número dentre os valores observados de X1, X2, ... , Xn . Então Yr tem densidade Beta com parâmetros r e n – r + 1. [email protected] [email protected] 45 Distribuição Beta e relação com a Uniforme(0,1) onde 0<y<1 A probabilidade deste número exceder 0.5 é: Pr (Y > 0.5 ) = ∫ 10 (1 − y ) dy 9 0.5 Faça a mudança de variável: t = 1 - y ⇒dt = dy e se y→ 0.5, t → 0.5 e se y→ 1, t → 0. Logo: 0.5 Pr (Y > 0.5 ) = ∫ 10t ( − dt ) = 10 ∫ t dt = t = ( 0.5 ) = 0.0977% 0 0 0.5 9 0.5 46 Considere uma amostra de tamanho n > 3 da densidade Uniforme(0,1). Calcule, como função do tamanho da amostra, as seguintes probabilidades: a) De que o maior número na amostra exceda 0.8; b) De que o menor número na amostra seja menor que 0.2. c) Faça um gráfico das probabilidades nos ítens a) e b) versus n. Γ (11) 10! 10 −1 9 9 y1−1 (1 − y ) = (1 − y ) = 10 (1 − y ) Γ (1) .Γ (10 ) 0!9! 1 [email protected] [email protected] Distribuição Beta (para casa) A densidade de Y é: f ( y) = Exemplo Um computador gera 10 números aleatórios uniformemente no intervalo (0,1). Calcule a probabilidade de que o menor destes números será maior que 0.5. Solução Pelo teorema anterior, a densidade do menor dos 10 números é uma Beta com parâmetros 1 e 10. Isto é, se Y denota este número temos: 9 10 10 0 [email protected] [email protected] 47 [email protected] [email protected] 48 Distribuição Beta (para casa) Distribuição Beta (para casa) Um computador gera 6 números aleatórios uniformemente distribuídos no intervalo (0,1). Calcule a probabilidade de que o menor destes números será maior que 0.2. Calcule o valor esperado do menor destes números. Encontre a densidade do 2o. menor destes números e calcule a sua média e variância. Calcule a probabilidade de que o maior destes números exceda 0.6. [email protected] [email protected] 49 Suponha que X tem distribuição Beta com parâmetros a e b. Mostre que Y = 1 - X tem distribuição Beta com parâmetros b e a. [email protected] [email protected] 50