CE-003: Estatı́stica II, turma H 1a Prova - 2o semestre 2005 (22 Setembro de 2005) 1. (3,0 pontos) Assume-se que a durabilidade de um certo tipo de estrutura tem distribuição normal de média 50 anos e desvio padrão de 10 anos. X : durabilidade da estrutura (em anos) X ∼ N (50, 102 ) (a) Qual a porcentagem esperada de estruturas com durabilidade inferior a 45 anos? P [X < 45] = P [Z < 45 − 50 ] = 0.3085 10 Portanto 30.9% das estruturas devem durar menos que 45 anos. (b) Qual a porcentagem esperada de estruturas com durabilidade entre 37 e 65 anos? P [37 < X < 45] = P [ 37 − 50 65 − 50 <Z< ] = 0.8364 10 10 Portanto 93.2% das estruturas devem durar entre 37 e 65 anos. (c) O que acontecerá com a porcentagem do ı́tem anterior se os materiais forem trocados de modo que a durabilidade média passe a ser de 55 anos e o desvio padrão de 15 anos? P [37 < X < 45] = P [ 65 − 55 37 − 55 <Z< ] = 0.6324 15 15 Portanto, com esta média e este desvio padrão, 74.6% das estruturas devem durar entre 37 e 65 anos. (d) Mantendo o desvio padrão de 10 anos, de quanto deveria ser a durabilidade média para garantir que 90% ou mais das estruturas tenham durabilidade superior a 50 anos? P [X > 50] 50 − µ P [Z > ] 10 z 50 − µ 10 µ = 0.90 = 0.90 = −1.282 = −1.282 = 62.82 (e) Mantendo a média de 50 anos quanto deveria ser o desvio padrão para garantir que 95% das estruturas tenham durabilidade entre 46 e 54 anos? P [46 < X < 54] P [50 < X < 54] 54 − 50 P [Z > ] σ z 54 − 50 σ σ = 0.95 = 0.475 = 0.475 = 1.96 = 1.96 = 2.04 2. (2,5 pontos) O tempo de vida em anos de um componente eletrônico tem função de distribuição de probabilidade: 2 se 0 < x < 1 3x 1 − x3 se 1 ≤ x < 3 f (x) = 0 caso contrário Solução: Seja a v.a. X: tempo de vida do componente Vamos primeiro definir a função de distribuição > fx <- function(x) { + y <- rep(0, length(x)) + y[(x > 0 & x < 1)] <- (2/3) * x[(x > 0 & x < 1)] + y[(x >= 1 & x < 3)] <- 1 - (x[(x >= 1 & x < 3)]/3) + return(y) + } (a) justifique porque f (x) é uma f.d.p. válida Para ser f.d.p. válida vamos checar 2 condições: (i) f (x) ≥ 0 > x <- seq(0, 3, l = 101) > all(fx(x) >= 0) [1] TRUE R (ii) f (x)dx = 1 > integrate(fx, 0, 3)$value [1] 1 (b) qual a probabilidade Rde um componente durar entre 6 e 18 meses? 1,5 P [0, 5 < X < 1, 5] = 0,5 f (x)dx > integrate(fx, 0.5, 1.5)$value [1] 0.5416667 (c) qual o tempo mediano de vida? R md Tempo mediano: P [X < md] = 0, 5 ou seja, 0 f (x)dx = 0.5 > qfx <- function(x, quantil = 0.5) (quantil - integrate(fx, 0, x)$value)^2 > optimise(qfx, c(0, 3))$min [1] 1.267940 (d) qual o tempo médio de vida? R Tempo médio: µ = E[X] = xf (x)dx > efx <- function(x) x * fx(x) > integrate(efx, 0, 3)$value [1] 1.333333 3. (2,5 pontos) O quadro abaixo mostra os resultados da duração de válvulas usadas em uma indústria fornecidas por 3 diferentes companhias. Baseado nesta tabela responda as perguntas a seguir. Duração da válvula Fornecedor menos que 4 meses 4 a 8 meses mais que 8 meses X 64 120 16 Y 104 175 21 Z 27 48 5 > mat <- as.table(matrix(c(64, 104, 27, 120, 175, 48, 16, 21, 5), nc = 3)) > dimnames(mat) <- list(c("X", "Y", "Z"), c("<4", "4-8", ">8")) > mat <4 4-8 X 64 120 Y 104 175 Z 27 48 >8 16 21 5 > total <- sum(mat) > total [1] 580 > for.tot <- rowSums(mat) > for.tot X Y 200 300 Z 80 > tem.tot <- colSums(mat) > tem.tot <4 4-8 195 343 >8 42 Seja a notação: • X, Y ou Z : peça vir do fornecedor X, Y ou Z • T1: peça durar menos que 4 meses • T2: peça durar de 4 meses a 8 meses • T3: peça durar mais que 8 meses (a) Sorteando-se uma válvula qual a probabilidade de ter vindo do fornecedor X? P [X] = 200/580 = 0.345 (b) Qual a probabilidade de uma válvula do fornecedor Z durar menos que 4 meses? P [T 1|X] = 27/80 = 0.338 (c) Qual a probabilidade do uma válvula que durou mais de 8 meses ser do fornecedor Y ? P [Y |T 3] = 21/42 = 0.5 (d) Você diria que o tempo de duração independe do fornecedor? Justifique sua resposta. > prop.table(mat, mar = 1) <4 4-8 >8 X 0.3200000 0.6000000 0.0800000 Y 0.3466667 0.5833333 0.0700000 Z 0.3375000 0.6000000 0.0625000 Sim porque as proporções de tempos de duração são bastante parecidas entre os 3 fornecedores, conforma mostra a tabela acima. (e) Baseando-se nestes dados, comprando um lote de 10 peças do fornecedor Y qual a probabilidade de que todas durem menos que 8 meses? Solução: D : número de peças de Y que duram menos de 8 meses D ∼ Bin(n = 10, p = P [T 3|Y ]) p = P [T 3|Y ] = 48/300 = 0.16 µ ¶ 10 10 P [D = 10] = p (1 − p)10−10 10 = 1.1e − 08 (f) Inspeciona-se as peças que duraram 4 meses uma a uma até encontrar uma que veio do fornecedor X. Qual a probabilidade de que sejam inspecionadas mais que 3 peças até que se encontre a primeira vinda deste fornecedor? Solução: E : número de peças inspecionadas (que duraram 4 meses) até encontrar a primeira vinda de E ∼ Geo(p = P [X|T 1]) e = 1, 2, . . . p = P [X|T 1] = 64/195 = 0.328 P [E > 3] = 1 − P [E ≤ 3] = 1 − P [E = 1] − P [E = 2] − P [E = 3] = 1 − (p(1 − p)1−1 ) − (p(1 − p)2−1 ) − (p(1 − p)3−1 ) = 0.303 0 5 10 15 20 25 30 4. (2,0 pontos) Foram coletados dados do ı́ndice de desempenho de 3 grupos de operários em 30 tarefas. O gráfico abaixo resume os dados obtidos. Suponha que você tem que escolher um grupo para trabalhar num determinado projeto. Compare os grupos baseando-se nos gráficos, comentando sobre os desempenho mostrados cada grupo e apontando possı́veis vantagens e desvantagens de cada um deles. 1 2 3 Solução: O primeiro grupo apresenta a maior mediana, a menor variabilidade, distribuição simétrica e 3 dados claramente atı́picos, todos com valores baixos. O segundo grupo apresenta mediana bem inferior ao primeiro, com o 3o quartil inferior ao primeiro quartil do primeiro grupo. A distribuição é simétrica e há um ponto discrepante com valor elevado. A variabilidade deste grupo é ligeiramente maior do que a do primeiro grupo. O terceiro grupo apresenta mediana próxima à do primeiro, porém variabilidade bem maior que os demais grupos. A distribuição é assimétrica à direita com um dado atı́pico bem superior aos meais. Em função desta descrição deve-se discutir as vantagens e/ou desvantagens de cada grupo.