ALGUMAS DISTRIBUIÇÕES CONTÍNUAS DE PROBABILIDADE 4. 1 INTRODUÇÃO Serão apresentadas aqui algumas distribuições de probabilidade associadas a v.a.’s contínuas. A mais importante delas é a distribuição Normal (ou de Gauss) pois, além de ser aplicada a muitos experimentos aleatórios, é a base de boa parte da teoria de Inferência Estatística. Outras distribuições como a “t de Student”, a F e a de Qui-quadrado são fundamentais no desenvolvimento da teoria de distribuições amostrais. Em aplicações da Estatística a diversos problemas de engenharia vistos na Teoria de Filas, em Confiabilidade e em Análise de Sobrevivência, encontramos outras densidades de probabilidade. Entre elas, podemos citar a Log-normal, a Gama, a Beta, a Exponencial, a Weibull, etc. 4. 2 DISTRIBUIÇÃO UNIFORME Uma v.a. X contínua tem distribuição uniforme sobre o intervalo [a, b], se sua função densidade de probabilidade for dada por: ⎧ 1 ⎪ b − a , para a ≤ x ≤ b ⎪ f(x) = ⎨ ⎪ 0 , para outros valores de x ⎪ ⎩ Graficamente, f(x) 1/(b-a) x Note que todos os valores de x no intervalo de a até b são “igualmente prováveis” no sentido de que a probabilidade de x cair num subintervalo de 74 ESTATÍSTICA Notas de Aula _______________________________________________________________________________________ comprimento ∆x é a mesma que para qualquer outro subintervalo de mesmo comprimento dentro do intervalo [a, b]. A MÉDIA E A VARIANCIA SÃO: µ= a+b 2 σ2 = 121 ( b − a ) 2 EXEMPLO: Suponha que a roda de uma locomotiva tenha raio r e que x seja um ponto na sua circunferência medido a partir de um ponto 0. Quando os freios são aplicados, em algum ponto há o atrito e um desgaste. Para aplicações repetidas dos freios, é razoável assumir que x é uma v.a. que tem distribuição uniforme com a = 0 e b = 2πr. Ou seja, estamos assumindo que a incidência de atrito e desgaste da roda seja uniforme ao longo dela. Se isto estiver incorreto, ou ainda, se algum conjunto de pontos da roda fazem contato mais freqüentemente que outros, a roda eventualmente exibiria marcas de achatamento ou ficaria fora de centro. 4. 3 DISTRIBUIÇÃO GAMA A distribuição Gama tem na sua função densidade de probabilidade a Função Gama, estudada em muitas aplicações da Matemática. Esta função é definida por: ∞ Γ(α) = ∫ x α−1 e − x dx , para α > 0 0 Integrando por partes, tem-se que: Γ(α) = (α- 1) Γ(α- 1) Se α = n onde n é um inteiro, Γ(n) = (n - 1)! Em particular, Γ( 21 ) = π ___________________________________________________________________________________ Marcia Olandoski Erbano Depto. de Informática CEFET-PR ESTATÍSTICA 75 Notas de Aula ______________________________________________________________________________________ A v.a. X contínua tem distribuição Gama, com parâmetros α e β, se sua função densidade de probabilidade é dada por: ⎧0 , x≤ 0 ⎪ 1 f (x) = ⎨ α −1 e− x / β α ⎪⎩ β Γ (α ) x , x>0 Gráficos de algumas distribuições gama para valores especificados dos parâmetros α e β são apresentados a seguir: f (x) 1,0 α=1 , β=1 α=2 , β=1 0,5 0 1 2 3 α=4 , β=1 4 5 6 7 x 4. 4 DISTRIBUIÇÃO EXPONENCIAL Dado um processo de Poisson com parâmetro λ, seja o tempo zero o tempo no qual começamos a observar o processo (ou o tempo em que se observou um sucesso). Seja T o tempo decorrido até que o próximo sucesso ocorra. T tem distribuição exponencial com parâmetro λ > 0 e sua função densidade de probabilidade é dada por: λ e-λt , para t > 0 f(t) = 0 , para t ≤ 0 ___________________________________________________________________________________ Marcia Olandoski Erbano Depto. de Informática CEFET-PR 76 ESTATÍSTICA Notas de Aula _______________________________________________________________________________________ Graficamente, f (t) λ 0 µ=1/λ t Note que a distribuição exponencial é um caso particular da distribuição gama quando α = 1. A média e a variancia da distribuição exponencial são iguais a: µ = 1/λ σ 2 = 1 / λ2 A função de distribuição acumulada de T é dada por: 1 - e-λt , para t > 0 F(t) = P( T ≤ t) = 0 , para t ≤ 0 ___________________________________________________________________________________ Marcia Olandoski Erbano Depto. de Informática CEFET-PR ESTATÍSTICA 77 Notas de Aula ______________________________________________________________________________________ EXEMPLO Suponha que um sistema contem um certo tipo de componente cujo tempo em anos para falhar (duração de vida) é dado por uma v.a. T, distribuída exponencialmente com média de 5 anos. Se 5 destes componentes são instalados em sistemas diferentes, qual é a probabilidade de que pelo menos dois deles ainda estejam funcionando ao final de 8 anos? A função densidade de probabilidade da v.a. tem parâmetro λ = 1/5 e é dada por: 1/5 e-1/5t , para t ≥ 0 f(t) = 0 , para t < 0 Para o cálculo da probabilidade podemos usar a função de distribuição acumulada que, neste caso, é dada por: 1 - e-1/5 t , para t ≥ 0 F(t) = P( T ≤ t) = 0 , para t < 0 A probabilidade de que um componente qualquer ainda esteja funcionando após 8 anos é dada por: P ( T > 8) = 1 - P(T ≤ 8) = 1 - F(8) = 1 - [1 - e-(1/5)(8) ] = e-8/5 = 0,2 Seja X a v.a. igual ao número de componentes que funcionam após 8 anos. X tem distribuição binomial com parâmetros n = 5 (cinco componentes instalados) e p=0,2 (a probabilidade de um componente estar funcionando após 8 anos) e sua função de probabilidade é dada por: ⎛5 ⎞ p( x) = P( X = x) = ⎜ ⎟ 0,2 x 0,85− x , x = 0,1,...,5 ⎝ x⎠ Assim, P(X ≥ 2) = p(2) + p(3) + p(4) + p(5) = 0,2627. ___________________________________________________________________________________ Marcia Olandoski Erbano Depto. de Informática CEFET-PR 78 ESTATÍSTICA Notas de Aula _______________________________________________________________________________________ 4.5 DISTRIBUIÇÃO NORMAL Dizemos que uma v.a. X tem distribuição normal (ou de Gauss) com parâmetros µ e σ² se a sua função densidade de probabilidade é dada por: 1 f(x) = 2π σ − .e 1 ⎛ x - µ ⎞2 ⎜ ⎟ 2 ⎝ σ ⎠ , -∞ < x < ∞ OBSERVAÇÕES : ( a ) µ = E(x) e σ² = V(x) . ( b ) f(x) tende a zero quando x → -∞ ou x → ∞. ( c ) f(x) tem dois pontos de inflexão : µ - σ e µ + σ .σ ( d ) f(x) tem um ponto de máximo para x = µ e seu valor máximo é: 1 2πσ ( e ) f(x) é simétrica em relação a x = µ . ( f ) A área total abaixo da curva f(x) é igual a 1. Graficamente: f(x) µ−σ µ−σ µµ x µ+σ µ−σ µ−σ µ−σ f(x) 1 f(x) 2π σ 1 2π σ µ x µ ___________________________________________________________________________________ Marcia Olandoski Erbano Depto. de Informática CEFET-PR ESTATÍSTICA 79 Notas de Aula ______________________________________________________________________________________ Podemos mostrar que se X é uma v.a. com distribuição normal então: * entre µ - σ e µ + σ existe aproximadamente 68% da área total; * entre µ - 2σ e µ + 2σ existe aproximadamente 95% da área total; * entre µ - 3σ e µ + 3σ existe aproximadamente 99% da área total. µ−3σ µ−2σ µ−σ µ 68% µ+σ µ+2σ µ+3σ 95% 99% NOTAÇÃO: Se X é uma v.a. que tem distribuição normal com parâmetros µ e σ² escrevemos : X : N( µ, σ² ) onde µ é a média e σ² a variancia . 4.5.1 VARIÁVEL ALEATÓRIA REDUZIDA OU PADRONIZADA Z Se X : N ( µ,σσ² ), então a v.a. Z definida por: Z = X-µ σ terá uma distribuição normal com média µ µ= 0 e variancia σσ² = 1. f(z) -3 -2 -1 0 1 2 3 z ___________________________________________________________________________________ Marcia Olandoski Erbano Depto. de Informática CEFET-PR 80 ESTATÍSTICA Notas de Aula _______________________________________________________________________________________ Observe que Z calcula, para cada valor de X, a quantos desvios padrões cada ponto está afastado da média µµ. Se Z é negativo então é um ponto à esquerda da média e se é positivo então é um ponto à direita da média. 4.5.2 CÁLCULO DE PROBABILIDADES (USO DA TABELA) A tabela apresentada na página 91 fornece os valores da função de distribuição acumulada de Z para diversos pontos desde -3,49 até 3,49 com acréscimos de 0,01. Assim: tab (z 0 ) = F(z 0 ) = ∫ z0 1 -∞ 2π .e - 1 2 z 2 dz z zo 0 Suponha que X: N( µµ, σσ² ) e que se queira calcular P(a < X ≤ b). Esta a − µ b− µ probabilidade é igual a P ( σ < X ≤ σ ) . Para x = a: z = Para x = b: z = a - µ σ a b µ x b - µ σ 0 z OBSERVAÇÕES: 1) Um cuidado especial deve ser tomado ao utilizar outras tabelas (geralmente apresentadas em apêndices dos livros de Estatística), pois existem formas diferenciadas de apresentar estas probabilidades. 2) Um programa que gere estas probabilidades pode ser elaborado para calculadoras programáveis. Basta tomar o cálculo de áreas abaixo da curva da v.a. padronizada z e inserir num programa que resolva integrais. O limite inferior pode ser -4 (4 desvios padrões abaixo da média 0) pois sabemos que antes deste valor não existe praticamente qualquer área significativa. P ( Z ≤ z 0 ) = F( z 0 ) = z0 ∫ −4 1 2π − 2 z2 1 e dz ___________________________________________________________________________________ Marcia Olandoski Erbano Depto. de Informática CEFET-PR ESTATÍSTICA 81 Notas de Aula ______________________________________________________________________________________ EXEMPLO 1 Seja X : N ( 20,9 ) µµ = 20 σσ² = 9 (σ = 3 ) 11 14 17 20 23 26 29 x ( a ) P( X ≤≤ 18 ) = P( Z ≤≤ -0,67 ) = tab (-0,67) = 0,25142 Para x = 18 : x 18 20 z= -0,67 x - µ 18 - 20 = -0,67 = 3 σ z ( b ) P(X >21) = P(Z >0,33) = 1- P(Z ≤ 0,33) = 1- tab(0,33) = 1- 0,62930 = 0,37070 Para x = 21: 20 23 x z= 0 0,33 x - µ 21- 20 = 0,33 = 3 σ z ___________________________________________________________________________________ Marcia Olandoski Erbano Depto. de Informática CEFET-PR 82 ESTATÍSTICA Notas de Aula _______________________________________________________________________________________ ( c ) P( 16 < X ≤ 24 ) = P( -1,33 < Z < 1,33 ) = tab(1,33) - tab(-1,33) = 0,90824 - 0,09175 = 0,81649. Para x = 16 : z= x 16 20 24 x - µ 16 - 20 = -1,33 = 3 σ Para x = 24 : z= z 0 x - µ 24 - 20 = 1,33 = 3 σ EXEMPLO 2 O diâmetro de certo tipo de anel industrial é uma v.a. com distribuição normal de média 0,10 cm e desvio padrão 0,02 cm. Se o diâmetro de um anel diferir da média por mais de 0,03 cm, ele é vendido por 5 u.m.; caso contrário é vendido por 10 u.m.. Qual o preço médio de venda de cada anel? Seja a v.a. X = diâmetro do anel X : N( 0,10 ; 0,02²) ∴ µ = 0,10 e σ = 0,02 0,04 0,06 0,08 0.10 0,12 0,14 0,16 x P(X ≤ 0,07) = P(Z≤ -1,50) = tab(-1,50) = 0,06680 Para x = 0,07 : z= x-µ σ = 0,07 - 0,10 = -1,50 0,02 P(X > 0,13) = 1- P(X ≤ 0,13) = 1- P(Z<1,5) = 1- tab(1,5) = 0,06680 Para x = 0,13 : z= x - µ 0,13- 0,10 = = 1,50 σ 0,02 ___________________________________________________________________________________ Marcia Olandoski Erbano Depto. de Informática CEFET-PR ESTATÍSTICA 83 Notas de Aula ______________________________________________________________________________________ P(diâmetro diferir da média por mais de 0,03) = P(X ≤ 0,07 ou X >0,13) = = 0,06680 + 0,06680 = 0,13360. P(não diferir da média por mais de 0,03) = 1- 0,13360 = 0,86640 . Seja a v.a V = preço de venda. V tem a seguinte distribuição de probabilidade : v 5 10 p(v) 0,13360 0,86640 Preço médio de venda : E(V) = ∑ v.p(v) = 5.0,13360 +10.0.86640 = 9,332 u.m. v EXEMPLO 3 Uma máquina de empacotar determinado produto apresenta variações de peso com desvio padrão de 20g. Em quanto deve ser regulado o peso médio do pacote para que apenas 10% tenham menos de 400g ? Supor distribuição normal dos pesos dos pacotes. X: peso dos pacotes σ=20 0,10 X : N (µ,20²) x µ 400 P(X ≤ 400) = 0,10 P (Z < -2,33) = 0,10 0,10 z= −2,33 0 z x-µ σ ⇒ - 2,33 = 400 - µ 20 µ = 446,6 g . na tabela ___________________________________________________________________________________ Marcia Olandoski Erbano Depto. de Informática CEFET-PR 84 ESTATÍSTICA Notas de Aula _______________________________________________________________________________________ 4.5.3 APROXIMAÇÃO DA DISTRIBUIÇÃO BINOMIAL PELA DISTRIBUIÇÃO NORMAL Se uma v.a. X tem distribuição binomial com parâmetros n e p, a sua média é µ = n.p e sua variancia é σ² = n.p(1-p). Quando n→ ∞, a distribuição da v.a definida por : Z= X - np np(1- p) tem como distribuição limite a N ( 0,1 ). Note que isto é o mesmo que dizer que, para n grande a v.a. X tem distribuição N(µ,σ²) onde µ = np e σ² = np(1-p). A aproximação melhora à medida que n cresce e é muito boa para valores de p não muito próximos de 0 ou 1. EXEMPLO 1 Seja X uma v.a binomial com n = 16 e p = 0,5 ⎛16⎞ p(x) = ⎜ ⎟ 0,5x 0,516-x , x = 0,1,... ,16 ⎝x ⎠ µ = np = 8 , σ 2 = np(1- p) = 4 x 0;16 1;15 2;14 3;13 4;12 5;11 6;10 7;9 8 p(x) 0,00002 0,00024 0,00183 0,00854 0,02777 0,06665 0,12219 0,17456 0,19638 9 11 13 15 p(x) 0,20 0,18 0,16 0,14 0,12 0,10 0,08 0,06 0,04 0,02 1 2 3 4 5 6 5,5 7 8 µ 10 12 14 16 10,5 ___________________________________________________________________________________ Marcia Olandoski Erbano Depto. de Informática CEFET-PR x ESTATÍSTICA 85 Notas de Aula ______________________________________________________________________________________ ___________________________________________________________________________________ Marcia Olandoski Erbano Depto. de Informática CEFET-PR 86 ESTATÍSTICA Notas de Aula _______________________________________________________________________________________ ⎛16⎞ x=6 ⎝ x ⎠ 10 ( a ) P (6 ≤ X ≤ 10) = ∑⎜ ⎟ 0,5 x .0,516− x = 0,78988 Usando a aproximação normal, temos: PB = (6 ≤ X ≤ 10) ≅ PN (5,5 ≤ X < 10,5) = PN (-1,25 ≤ Z < 1,25) = 0,89435 - 0,10565 = 0,78870 ( b ) P(X = 8) ≅ PN (7,5 ≤ X ≤ 8,5) = PN (-0,25 ≤ Z ≤ 0,25) = 0,5987 - 0,4013 = 0,1974 ( c ) P(X < 6) ≅ PN ( X ≤ 5) = PN (Z < -1,25) = 0,10565 EXEMPLO 2 Uma máquina produz itens num certo processo de fabricação tal que 5% dos itens são defeituosos. Se uma amostra de 1000 itens é escolhida ao acaso, qual a probabilidade de que não mais do que 40 defeituosos ocorram na amostra ? X = n° de itens defeituosos na amostra n = 1000 p = 0,05 µ = np = 1000.0,05 = 50 σ² = np(1-p) = 1000.0,05.0,95 = 47,5 PB (X ≤ 40) ≅ PN (X ≤ 40,5) = PN (Z ≤ -1,38) = 0,084 . ___________________________________________________________________________________ Marcia Olandoski Erbano Depto. de Informática CEFET-PR