Variáveis aleatórias e suas distribuições Métodos Numéricos e Estatı́sticos Parte II-Métodos Estatı́sticos Variáveis aleatórias e suas distribuições Luı́sa Morgado Lic. Eng. Biomédica e Bioengenharia-2009/2010 Luı́sa Morgado Variáveis aleatórias e suas distribuições Variáveis aleatórias e suas distribuições Variável aleatória É uma função, com propriedades especiais, que transforma eventos em números, ou mais genericamente, em vectores: A função X : Ω → RX ⊂ Rn diz-se uma variável aleatória (v.a.) se verifica a condição de mensurabilidade ∀x ∈ R, X −1 ((−∞, x]) ∈ A, onde X −1 ((−∞, x]) = {ω ∈ Ω : X (ω) ≤ x}, e o espaço de resultados Ω está associado à σ-álgebra A. A v.a. diz-se unidimensional se n = 1; bidimensional se n = 2; multidimensional se n > 2. ou ainda discreta, caso tome valores em RX em número finito ou numerável; contı́nua, quando o seu conjunto de valores é infinito não numerável. Luı́sa Morgado Variáveis aleatórias e suas distribuições Variáveis aleatórias e suas distribuições Função de probabilidade Seja X uma v.a. discreta (RX = {x1 , x2 , . . .} é um conjunto finito ou numerável). A função de probabilidade de X (f.p.) é dada por P(X = xi ), x = xi ∈ RX P(X = x) = P ({ω ∈ Ω : X (ω) = x}) = 0, c.c. e satisfaz P(X = x) > 0, ∀x ∈ RX ; P P P x∈R P(X = x) = x∈RX P(X = x) = i P(X = xi ) = 1. Luı́sa Morgado Variáveis aleatórias e suas distribuições Variáveis aleatórias e suas distribuições Exemplo Considere-se um teste americano com 3 questões, cujas respostas são dadas de forma independente. A resposta a cada questão pode estar correcta (C ), com probabilidade P(C ) = 0.5, ou incorrecta (C ), com probabilidade P(C ) = 0.5. A classificação das 3 questões é então uma e.a. cujo espaço de resultados é formado por 8 eventos elementares: Ω = {CCC , C C C , C CC , C CC , C C C , C C C , C C C , C C C }. Considerando a v.a. X = no de respostas correctas no teste, verificamos que o seu contradomı́nio é {0, 1, 2, 3} e portanto X é uma v.a. discreta. A sua f.p. é dada por P(X = 0) = P(C C C ) = P(C1 C2 C3 ) = P(C1 )P(C2 )P(C3 ) = 0.53 P(X = 1) = P(C C C ) + P(C C C ) + P(C C C ) = 3 × 0.53 P(X = 2) = P(CC C ) + P(C C ) + P(C CC ) = 3 × 0.53 P(X = 3) = P(CCC ) = 0.53 ou resumidamente P(X = x) = 1 , 8 3 , 8 0, x = 0, 3 x = 1, 2 outros valores de Luı́sa Morgado x Variáveis aleatórias e suas distribuições Variáveis aleatórias e suas distribuições Função de distribuição A função de distribuição (f.d.) de uma v.a. X (independentemente de esta ser discreta ou contı́nua) é dada por FX (x) = P(X ≤ x), x ∈ R. Nota: A f.d. tem como domı́nio R e toma valores no intervalo [0, 1] uma vez que se trata de uma probabilidade, i.e. FX (x) : R → [0, 1] quer X seja uma v.a. discreta ou contı́nua. Função de distribuição de uma v.a. discreta A f.d. de uma v.a. discreta (com contradomı́nio RX = {x1 , x2 , . . .}) pode escrever-se à custa da f.p de X: X FX (x) = P(X ≤ x) = P(X = xi ), x ∈ R. xi ≤x Luı́sa Morgado Variáveis aleatórias e suas distribuições Variáveis aleatórias e suas distribuições Exemplo No exemplo anterior, em que X =no de respostas correctas no teste americano, temos 0, x < 0 1 , 0≤x <1 81 3 1≤x <2 8 + 8, FX (x) = 3 3 1 + + , 2≤x <3 8 8 8 1 3 3 1 x ≥3 8 + 8 + 8 + 8, Luı́sa Morgado Variáveis aleatórias e suas distribuições Variáveis aleatórias e suas distribuições Uma v.a. pode ser caracterizada, embora parcialmente, por parâmetros que se podem dividir em três grupos: 1 Parâmetros de localização central valor esperado moda mediana 2 Parâmetros de localização não central 3 Parâmetros de dispersão quantil de probabilidade (ou quantil de ordem) p variância desvio padrão coeficiente de variação Luı́sa Morgado Variáveis aleatórias e suas distribuições Variáveis aleatórias e suas distribuições Valor esperado de uma v.a. discreta O valor esperado de uma v.a. discreta (com contradomı́nio RX = {x1 , x2 , . . .}) é dado por: X E (X ) = xP(X = x). x Luı́sa Morgado Variáveis aleatórias e suas distribuições Variáveis aleatórias e suas distribuições O valor esperado de uma v.a. X satisfaz as propriedades ∀b ∈ R; 1 E (b) = b, 2 E (aX + b) = aE (X ) + b∀a, b ∈ R; 3 Sendo Y = ψ(X ) uma v.a. função P mensurável da v.a. discreta X , E (Y ) = E [ψ(X )] = x ψ(x)P(X = x); 4 Geralmente, tem-se E [ψ(X )] 6= ψ[E (X )]; 5 Se X é uma v.a. inteira não negativa, i.e., RX = {0, 1, 2, 3, . . .}, então E (X ) = +∞ X +∞ X P(X > x) = [1 − FX (x)]. x=0 x=0 Luı́sa Morgado Variáveis aleatórias e suas distribuições Variáveis aleatórias e suas distribuições Recordemos o exemplo anterior, em que X = no de respostas correctas no teste americano e 1 8 , x = 0, 3 3 P(X = x) = , x = 1, 2 8 0, outros valores de x Assim E (X ) = 3 X xP(X = x) = 0 × x=0 1 3 3 1 + 1 × + 2 × + 3 × = 1.5 8 8 8 8 Nota: Note que o valor esperado não pertence ao conjunto de valores possı́veis da v.a. X . Luı́sa Morgado Variáveis aleatórias e suas distribuições Variáveis aleatórias e suas distribuições Moda de uma v.a. discreta A moda de uma v.a. discreta X , mo = mo(X ), é o valor da v.a. que ocorre com mais frequência e como tal, corresponde ao ponto de máximo da f.p. de X , i.e. mo(X ) : P(X = mo) = maxx P(X = x). Exemplo No exemplo que temos vindo a considerar, mo = mo(X ) = 1 e 2. Tal como este exemplo ilustra, nem sempre a moda é única. Diz-se, neste caso, que X é bimodal (tem duas modas). Luı́sa Morgado Variáveis aleatórias e suas distribuições Variáveis aleatórias e suas distribuições Mediana de uma v.a. discreta A mediana de uma v.a. discreta, me = me(X ) = FX−1 tem a particularidade de verificar P(X ≤ me) ≥ 12 P(X ≥ me) ≥ 12 1 2 , o que é equivalente a me : 1 1 ≤ FX (me) ≤ + P(X = me). 2 2 Nota: A mediana de uma v.a. discreta pode não ser única, passando, neste caso, a falar-se de classe mediana. Exemplo No exemplo que temos vindo a apresentar, a mediana não é única. Esta pode ser dada por qualquer valor no intervalo [1, 2]. Diz-se, neste caso, que o intervalo [1, 2] é a classe mediana. Luı́sa Morgado Variáveis aleatórias e suas distribuições Variáveis aleatórias e suas distribuições Quantil de probabilidade p de uma v.a. discreta O quantil de probabilidade p de uma v.a. discreta, χp = χp (X ) = FX−1 (p), tem a particularidade de verificar P(X ≤ χp ) ≥ p P(X ≥ χp ) ≥ 1 − p A mediana da v.a. discreta X , corresponde a χ 1 . Outros quantis frequentemente 2 usados: FX−1 1 χ 3 = FX−1 3 χ1 = 4 4 χ χ χ 1 100 = FX−1 n 100 = FX−1 1 10 = FX−1 4 1o quantil 3o quantil o 1 1 percentil 100 n n−ésimo percentil, n = 1, 2, 3, . . . , 99 100 o 1 1 decil 10 4 Luı́sa Morgado Variáveis aleatórias e suas distribuições Variáveis aleatórias e suas distribuições Variância A variância de uma v.a. X discreta ou contı́nua é dada por: V (X ) = E (X 2 ) − E 2 (X ). A variância de uma v.a. X satisfaz as propriedades ∀b ∈ R; 1 V (b) = 0, 2 V (X ) ≥ 0, qualquer que seja a v.a. X ; 3 V (aX + b) = a2 V (X )∀a, b ∈ R. A variância não é expressa nas mesmas unidades que a v.a., pelo que é costume recorrer-se a outra medida de dispersão absoluta: o desvio padrão. Luı́sa Morgado Variáveis aleatórias e suas distribuições Variáveis aleatórias e suas distribuições Desvio padrão É a raı́z quadrada positiva da variância de uma v.a. X discreta ou contı́nua: p DP(X ) = V (X ). Finalizamos, apresentando uma medida de dispersão relativa: Coeficiente de variação O coeficiente de variação de uma v.a. X discreta ou contı́nua, é dado por: DP(X ) CV (X ) = . |E (X )| Luı́sa Morgado Variáveis aleatórias e suas distribuições Variáveis aleatórias e suas distribuições Distribuição uniforme discreta Esta distribuição é razoável quando a v.a. discreta toma n valores distintos x1 < x2 < . . . < xn , todos com igual probabilidade. Distribuição uniforme discreta A v.a. X diz-se ter distribuição uniforme discreta no conjunto {x1 , x2 , . . . , xn }, e escreve-se X ∼ uniforme discreta({x1 , x2 , . . . , xn }), caso a sua f.p. seja igual a 1 n , x = x1 , x2 , . . . , xn P(X = x) = 0, c.c. P Valor esperado: E (X ) = n1 ni=1 xi 2 P P Variância: V (X ) = n1 ni=1 xi2 − n1 ni=1 xi Luı́sa Morgado Variáveis aleatórias e suas distribuições Variáveis aleatórias e suas distribuições Exemplo Um conjunto de n amostras de solo, das quais só uma está contaminada com uma perigosa substância quı́mica, chega a um laboratório. Suponhamos que a amostra de solo contaminado não foi devidamente etiquetada e consideremos a v.a. X que representa o no total de amostras inspeccionadas, obviamente sem reposição, até ser identificada a amostra contaminada.. Determinemos a f.p. de X . Ora: P(X = 1) = P(X = 2) = P(X = 3) = 1 n 1 n−1 1 = n n−1 n n−1n−2 1 1 = n n−1n−2 n .. . P(X = x) = 1 , x = 1, 2, . . . , n n 0, c.c. donde se conclui que X ∼ uniforme discreta({1, 2, . . . , n}). Luı́sa Morgado Variáveis aleatórias e suas distribuições Variáveis aleatórias e suas distribuições A f.d de X é: 0, x < 1 1 ,1 ≤ x < 2 n 2 n,2 ≤ x < 3 FX (x) = P(X ≤ x) = .. . n−1 ,n − 1 ≤ x < n n 1, x ≥ n P e atendendo a que nx=1 x = o valor esperado de X é E (X ) = n X n(n+1) 2 xP(X = x) = x=1 e Pn x=1 x2 = n(n+1)(2n+1) , 6 n n X 1 1X 1 n(n + 1) n+1 = x = x= n n n 2 2 x=1 x=1 e a variância de X é V (X ) = E (X 2 )−E 2 (X ) = n n+1 2 1X 2 n+1 2 n2 − 1 x − x 2 P(X = x)− = = 2 n x=1 2 12 x=1 n X Luı́sa Morgado Variáveis aleatórias e suas distribuições Variáveis aleatórias e suas distribuições Distribuição de Bernoulli Uma e.a. diz-se uma prova de Bernoulli se tiver apenas dois resultados possı́veis: um sucesso, que ocorre com probabilidade p, 0 ≤ p ≤ 1; um insucesso, que ocorre com probabilidade 1 − p Distribuição de Bernoulli A v.a. X =no de sucessos numa prova de Berrnoulli, tem distribuição de Bernoulli, com parâmetro p, e escreve-se X ∼Bernoulli(p), e a sua f.p. é dada por x p (1 − p)1−x , x = 0, 1 P(X = x) = 0, c.c. Valor esperado: E (X ) = p Variância: V (X ) = p(1 − p) Luı́sa Morgado Variáveis aleatórias e suas distribuições Variáveis aleatórias e suas distribuições Distribuição binomial Esta distribuição é particularmente útil na caracterização probabilı́stica do no de sucessos em n provas de Bernoulli, realizadas de forma independente e com probabilidade de sucesso comum p. Distribuição binomial A v.a. X =no de sucessos num conjunto de n provas de Bernoulli independentes com probabilidade de sucesso comum p, tem distribuição binomial, de parâmetros (n, p), e escreve-se X ∼binomial(n, p), e a sua f.p. é dada por n p x (1 − p)n−x , x = 0, 1, 2, . . . , n x P(X = x) = 0, c.c. n n! = x!(n−x)! . Valor esperado: E (X ) = np x Variância: V (X ) = np(1 − p) onde Luı́sa Morgado Variáveis aleatórias e suas distribuições Variáveis aleatórias e suas distribuições A f.d. da v.a. X ∼binomial (n, p) é dada por 0, x < 0 P n [x] p i (1 − p)n−i , 0 ≤ x < n FX (x) = P(X ≤ x) = i=0 i 1, x ≥ n onde [x] representa a parte inteira do real x, i.e., corresponde ao maior inteiro menor ou igual a x. Assim, note que [1.7] = 1 e [−1.7] = −2, por exemplo. Esta função encontra-se tabelada para alguns valores de n e p. Consultando as tabelas, podemos escrever, por exemplo v.a. X ∼ binomial(9, 0.1) X ∼ binomial(10, 0.4) Luı́sa Morgado x 4 8 FX (x) 0.9991 0.9983 Variáveis aleatórias e suas distribuições Variáveis aleatórias e suas distribuições No scilab, sendo X ∼ binomial(n, p), o comando pr=binomial(p,n) devolve um vector pr cujas entradas são os valores de P(X = x), x = 0, 1, 2, . . . , n. Assim sendo, pr(k+1) representa P(X = k), k = 0, 1, 2, . . . , n. O comando cdfbin(”PQ”,x,n,p,1-p) representa FX (x). Para obter os valores da tabela, terı́amos que executar os comandos cdfbin(”PQ”,4,9,0.1,0.9) cdfbin(”PQ”,8,10,0.4,0.6). Luı́sa Morgado Variáveis aleatórias e suas distribuições Variáveis aleatórias e suas distribuições Exemplo A probabilidade de as leis de Kirchhoff virem a ser violadas, durante um teste laboratorial a que se submete certo tipo e indutor, é igual a 0.1. Determinemos a probabilidade desta lei vir a ser violada mais de 4 vezes em 9 destes testes laboratoriais. Sendo X = no de violações das leis de Kirchhoff em 9 testes laboratoriais, tem-se X ' binomial(9, 0.1) A probabilidade pedida é dada por P(X > 4) = 1 − P(x ≤ 4) = 1 − 0.9991 = 0.0009. Luı́sa Morgado Variáveis aleatórias e suas distribuições Variáveis aleatórias e suas distribuições Distribuição geométrica Esta distribuição é útil quando pretendemos contabilizar o no total de provas de Bernoulli realizadas até o registo do 1o sucesso. Distribuição geométrica A v.a. X =no de provas de Bernoulli independentes com probabilidade de sucesso comum p, realizadas até à ocorrência do 1o sucesso, tem distribuição geométrica, de parâmetro p, e escreve-se X ∼geométrica(p), e a sua f.p. é dada por P(X = x) = Valor esperado: E (X ) = Variância: V (X ) = (1 − p)x−1 p, x = 0, 1, 2, . . . 0, c.c. 1 p 1−p p2 Luı́sa Morgado Variáveis aleatórias e suas distribuições Variáveis aleatórias e suas distribuições A f.d. da v.a. X ∼ geométrica(p) não está tabelada por se obter facilmente, uma vez que estamos a lidar com uma série geométrica. Com efeito: ( 0, x < 1 P[x] FX (x) = P(X ≤ x) = [x] i=1 (1 − p)i − 1p = 1 − (1 − p) , x ≥ 1 onde [x] representa a parte inteira de x. Luı́sa Morgado Variáveis aleatórias e suas distribuições Variáveis aleatórias e suas distribuições Exemplo Estudos efectuados indicaram que a probabilidade de ser detectada a presnça de alto teor de metais pesados numa amostra de solo proveniente de um certo local é de 0.01. determinemos o valor esperado do no total de amostras selecionadas ao acaso até que seja detectada a primeira com alto teor de metais pesados. Ora, sendo X = no total de amostras seleccionadas até que seja detectada a primeira com alto teor de metais pesados, tem-se X ∼ geométrica(0.01). O valor pedido é então dado por E (X ) = 1 = 100 amostras. 0.01 Luı́sa Morgado Variáveis aleatórias e suas distribuições Variáveis aleatórias e suas distribuições Distribuição hipergeométrica Distribuição hipergeométrica Considere-se que N =no total de elementos de uma população (dimensão da população); M =no de elementos dessa população que possuem uma determinada caracterı́stica (sucesso); N =no de extracções sem reposição. A v.a. X =no elementos com certa caracterı́stica (sucesso), em n extraı́dos ao acaso, sem reposição, da população de dimensão N, tem distribuição hipergeométrica, de parâmetros (N, M, n), e escreve-se X ∼hipergeométrica(N, M, n), e a sua f.p. é dada por P(X = x) = M x 0, ! N −M n−x ! N n ! , x = max{0, n − (N − M)}, . . . , min{n, M} c.c. Valor esperado: E (X ) = n M N Variância: V (X ) = n M 1− N M N N−n N−1 Luı́sa Morgado Variáveis aleatórias e suas distribuições Variáveis aleatórias e suas distribuições Exemplo Na fase de concepção de um processo de controlo de qualidade do fabrico, foram escolhidos 100 cabos dos quais apenas 2 apresentavam desvios superiores a 9.8 microns. Se desses 100 cabos forem seleccionados 10 ao acaso e sem reposição, qual a probabilidade de mais do que um ter um desvio superior a 9.8 microns? Ora, sendo N = 100, M = 2 e n = 10, a v.a. X =no de cabos com um desvio superior a 9.8 microns, em 10 cabos seleccionados ao acaso e sem reposição de um lote de 100, dos quais apenas 2 apresentam desvios superiores a 9.8 microns tem-se X ∼hipergeométrica(100, 2, 10). A probabilidade pedida é então dada por P(X > 1) = P(X = 2) = Luı́sa Morgado 2 2 100 − 2 10 − 2 100 10 = 1 . 110 Variáveis aleatórias e suas distribuições Variáveis aleatórias e suas distribuições Distribuição de Poisson É frequentemente utilizada na contagem de ocorrências de certo tipo de eventos, em perı́odos fixos de tempo. Exemplos do tipo de eventos são chegadas, partidas, acidentes, falhas de equipamento, no de excedências de nı́veis de pluviosidade, ondas, marés, etc. Distribuição de Poisson A v.a. X que tem distribuição de Poisson, de parâmetro λ, e escrevese X ∼Poisson(λ), tem a particularidade de possuir valor esperado e variância iguais ao parâmetro que define a sua distribuição. A sua f.p. é dada por P(X = x) = x e −λ λx! , x = 0, 1, 2, . . . 0, c.c. Valor esperado: E (X ) = λ Variância: V (X ) = λ Luı́sa Morgado Variáveis aleatórias e suas distribuições Variáveis aleatórias e suas distribuições A f.d. da v.a. X ∼Poisson(λ), dada por ( 0, x < 0 P[x] −λ λi FX (x) = P(X ≤ x) = i=0 e i! encontra-se tabelada. Podemos também recorrer ao scilab. X ∼Poisson(λ) λ = 0.05 λ=3 λ = 12 λ = 20 x 0 1 1 14 FX (x) (tabelas) FX (0) = 0.9512 FX (1) = 0.1991 FX (1) = 0.0001 FX (14) = 0.1049 Luı́sa Morgado FX (x) ←cdfpoi(”PQ”, x, λ) (scilab) cdfpoi(”PQ”, 0, 0.05) = 0.9512294 cdfpoi(”PQ”, 1, 3) = 0.1991483 cdfpoi(”PQ”, 1, 12) = 0.0000799 cdfpoi(”PQ”, 14, 20) = 0.1048643 Variáveis aleatórias e suas distribuições Variáveis aleatórias e suas distribuições Exemplo A procura de uma luxuosa marca de automóvel segue uma lei de Poisson. Sabe-se ainda que a probabilidade de numa semana não existir procura é igual a e −3 . Pretende-se saber qual a probabilidade de a procura semanal exceder pelo menos 2 automóveis. x Sabemos então que P(X = x) = e −λ λx! , x = 0, 1, 2, . . . e que P(X = 0) = e −3 . Daqui resulta que P(X = 0) = e −3 ⇔ e −λ λ0 = e −3 ⇔ λ = 3. 0! A probabilidade pedida é então dada por P(X ≥ 2) = 1 − P(X < 2) = 1 − P(X ≤ 1) = 1 − FPoisson(3) (1) = 1 − 0.1991 = 0.8009 Luı́sa Morgado Variáveis aleatórias e suas distribuições Variáveis aleatórias e suas distribuições Variável aleatória contı́nua A v.a X diz-se contı́nua ,caso possua f.d. FX (x) = P(X ≤ x) contı́nua em R e exista uma função real de variável real fX (x), que verifique fX (x) ≥ 0, ∀x ∈ R FX (x) = P(X ≤ x) = Rx −∞ fX (t)dt A função fX (x) é denominada de função densidade de probabilidade (f.d.p). Luı́sa Morgado Variáveis aleatórias e suas distribuições Variáveis aleatórias e suas distribuições Propriedades da f.d.p R +∞ −∞ fX (x)dx Rb a = 1; fX (x)dx = P(a < x ≤ b), ∀a < b. Note ainda que sendo X uma v.a. contı́nua: 1 P(X = x) = 0, ∀x ∈ R 2 P(a < x ≤ b) = FX (b) − FX (a), ∀a < b. Luı́sa Morgado Variáveis aleatórias e suas distribuições Variáveis aleatórias e suas distribuições Exemplo O tempo (em anos) entre duas colisões consecutivas de detritos espaciais com diâmetro maior que 1mm num satélite em MEO (Medium Earth Orbit) é uma v.a. contı́nua com f.d.p. dada por 0, x < 0 fX (x) = 0.4e −0.4x , x ≥ 0 Determinemos a probabilidade do tempo entre duas colisões consecutivas exceder um ano e três meses: Z 1.25 P(X > 1.25) = 1 − P(X ≤ 1.25) = 1 − fX (x)dx −∞ Z +∞ = fX (x)dx = e −0.5 . 1.25 Luı́sa Morgado Variáveis aleatórias e suas distribuições Variáveis aleatórias e suas distribuições Tal como no caso das v.a. discretas é importante sabermos determinar medidas de localização central localização não central dispersão. O processo é análogo ao caso discreto, tendo em conta que onde tı́nhamos P v.a. discreta: x∈R ou P(X = x) passamos a ter v.a. contı́nua: R +∞ −∞ ou fX (x) Luı́sa Morgado Variáveis aleatórias e suas distribuições Variáveis aleatórias e suas distribuições Distribuição uniforme contı́nua Distribuição uniforme contı́nua A v.a. X diz-se ter distribuição uniforme contı́nua no intervalo [a, b], e escreve-se X ∼ uniforme (a, b), caso a sua f.d.p. seja dada por 1 b−a , a ≤ x ≤ b fX (x) = 0, c.c. Valor esperado: E (X ) = Variância: V (X ) = a+b 2 (b−a)2 12 Luı́sa Morgado Variáveis aleatórias e suas distribuições Variáveis aleatórias e suas distribuições A f.d. da v.a. X ∼ uniforme (a, b) é igual a 0, x < a x−a ,a ≤ x ≤ b FX (x) = P(X ≤ x) = b−a 1, x > b Dada a sua simplicidade, não se encontra tabelada. Luı́sa Morgado Variáveis aleatórias e suas distribuições Variáveis aleatórias e suas distribuições Distribuição normal Esta distribuição surge associada à modelação de observações relativas a diversas medições. Distribuição normal A v.a. X diz-se ter distribuição normal de parâmetros µ e σ 2 , e escreve-se X ∼ normal (µ, σ 2 ), se a sua f.d.p. é fX (x) = √ (x−µ)2 1 e − 2σ2 2πσ Valor esperado: E (X ) = µ Variância: V (X ) = σ 2 A sua f.d. é Z x √ FX (x) = −∞ 1 2πσ e − (t−µ)2 2σ 2 dt que apenas pode ser obtida numericamente. Luı́sa Morgado Variáveis aleatórias e suas distribuições Variáveis aleatórias e suas distribuições Se X ∼ normal(µ, σ 2 ), então a v.a. Z = X σ−µ ∼ normal(0, 1). Rz t2 1 Z possui f.d. dada por FZ (z) = −∞ √2πσ e − 2 dt = Φ(z). A função Φ encontra-se tabelada. Podemos também recorrer ao scilab. z 0 1.07 4.04 Φ(z)(tabelas) 0.5 0.8577 0.99997 Φ(z) ← cdfnor(”PQ”, z, µ, σ) (scilab) cdfnor(”PQ”, 0, 0, 1)=0.5 cdfnor(”PQ”, 1.07, 0, 1)=0.8576903 cdfnor(”PQ”, 4.04, 0, 1)=0.9999733 Para o cálculo de Φ em valores negativos, recorrendo às tabelas, temos que atender em primeiro lugar à simetria da f.d.p. da normal padrão para concluir que dado z ∈ R, Φ(−z) = 1 − Φ(z) Exemplo Φ(−2.53) = 1 − Φ(2.53) = 0.0057 No scilab faz-se cdfnor(”PQ”, −2.53, 0, 1). Luı́sa Morgado Variáveis aleatórias e suas distribuições Variáveis aleatórias e suas distribuições Existem também tabelas de quantis da distribuição normal padrão. Os quantis de probabilidade p, 0.5 ≤ p ≤ 1, (FZ−1 (p), são obtidos sem dificuldade, como p.e., FZ−1 (0.975) = Φ−1 (0.975) = 1.9600. Mas note-se que os quantis de probabilidade p < 0.5 são negativos e p.e.: Φ−1 (0.023) = −Φ−1 (1 − 0.023) = −1.9954. No scilab para determinar o quantil de probabilidade p, (independentemente deste ser superior ou inferior a 0.5) de uma v.a. com distribuição normal, basta executar o comando cdfnor(”X ”, µ, σ, p, 1 − p). Luı́sa Morgado Variáveis aleatórias e suas distribuições Variáveis aleatórias e suas distribuições Exemplo As especificações sobre o diâmetro de em certo tipo de cabo admitem um desvio máximo, face ao valor de referência de ±10 mı́crons. Contudo, no seu fabrico apenas se consegue garantir que esse desvio tem distribuição normal de valor esperado igual a 0 mı́crons. que valor deve ter a variância para se poder garantir que em 95% dos cabos produzidos os desvios estão entre ±9.8 mı́crons? Recorrendo às tabelas: Considerando a v.a. X = desvio do diâmetro dos cabos face ao valor de referência, temos que X ∼normal(0, σ 2 ). −0 Ao considerar-se a v.a. Z = X σ = Xσ , temos Z ∼normal(0, 1). 2 Pretendemos assim o valor de σ tal que: Z z }| { −9.8 − 0 X −0 9.8 − 0 P(−9.8 ≤ X ≤ 9.8) = 0.95 ⇔ P( ≤ ≤ ) = 0.95 σ σ σ 9.8 9.8 9.8 ⇔Φ −Φ − = 0.95 ⇔ 2Φ − 1 = 0.95 σ σ σ 9.8 9.8 ⇔ = Φ−1 (0.975) ⇔ σ = ⇒ σ 2 = 25 σ 1.96 Luı́sa Morgado Variáveis aleatórias e suas distribuições Variáveis aleatórias e suas distribuições Ou Recorrendo ao scilab: P(−9.8 ≤ X ≤ 9.8) = 0.95 ⇔ FX (9.8) − FX (−9.8) = 0.95 2FX (9.8) − 1 = 0.95 ⇔ FX (9.8) = 0.975 O comando cdfnor(”Std”, p, 1 − p, x, µ) devolve o valor de σ tal que FX (x) = p, supondo X ∼normal(µ, σ 2 ). Neste caso terı́amos que fazer cdfnor(”Std”, 0.975, 1 − 0.975, 9.8, 0). Supondo X ∼normal(µ, σ ), explore no scilab os comandos 2 cdfnor(”Mean”, σ, p, 1 − p, x) e cdfnor(”X ”, µ, σ, p, 1 − p) Luı́sa Morgado Variáveis aleatórias e suas distribuições Variáveis aleatórias e suas distribuições Distribuição exponencial Trata-se da distribuição mais utilizada na caracterização da duração de equipamento. Surge também na modelação dos tempos entre ocorrências de eventos do mesmo tipo, como p.e., chegadas de clientes, falhas mecânicas, colisões, etc. Distribuição exponencial A v.a. X diz-se ter distribuição exponencial de parâmetro λ, e escreve-se X ∼ exponencial(λ), caso a sua f.d.p. seja dada por λe −λx , x ≥ 0 fX (x) = 0, c.c. Valor esperado: E (X ) = Variância: V (X ) = λ12 1 λ Luı́sa Morgado Variáveis aleatórias e suas distribuições Variáveis aleatórias e suas distribuições A sua f.d. é FX (x) = 1 − e −λx , x ≥ 0 0, c.c. que não se encontra tabelada dada a sua simplicidade. Luı́sa Morgado Variáveis aleatórias e suas distribuições