CE-003: Estatı́stica II, turma E 1a Prova - 1o semestre 2006 (24 Abril de 2006) 1. (10 pontos) Um programa computacional para detectar fraudes em cartões telefônicos rastreia, todo dia, o número de áreas metropolitanas de onde as chamadas se originam. Sabe-se que 1% dos usuários legı́timos fazem suas chamadas de 2 ou mais áreas metropolitanas em um único dia. Entretanto, 30% dos usuários fraudulentos fazem suas chamadas de 2 ou mais áreas metropolitanas em um único dia. A proporção de usuários fraudulentos é de 0,01%. Se o mesmo usuário fizer as suas chamadas de 2 ou mais áreas metropolitanas em um único dia, qual será a probabilidade de que o usuário seja fraudulento? Resposta: F: fraudulento , M: chamadas de 2 ou mais áreas P [F ] = 0, 0001 ; P [M |F̄ ] = 0, 01 ; P [M |F ] = 0, 03 P [F |M ] = ? P [F |M ] = P [M |F ]P [F ] = P [M |F ]P [F ] + P [M |F̄ ]P [F̄ ] > (0.03 * 1e-04)/(0.03 * 1e-04 + 0.01 * 0.9999) [1] 0.00029994 2. (20 pontos) Assume-se que o tempo de processamento de uma certa requisição tem distribuição normal de média 50 segundos e desvio padrão de 2 segundos. (a) Qual a porcentagem esperada de processos com o tempo de processamento inferior a 45 segundos? (b) Qual a porcentagem esperada de processos em que o tempo de processamento não se desvia da média em mais que 1,5 desvios padrão? (c) O que acontecerá com a porcentagem do ı́tem anterior se o servidor for trocado por outro que tem tempo médio de processamento de 45 segundos e o desvio padrão de 3 segundos? (d) Mantendo o desvio padrão de 2 segundos, em quanto deveria ser regulada a média para garantir que 90% ou mais dos processos tenham tempo de processamento inferior a 50 segundos? (e) Mantendo a média de 50 segundos quanto deveria ser o desvio padrão para garantir que 95% dos processos tenham tempo de processamento entre 46 e 54 segundos? Resposta (a) > pnorm(45, m = 50, sd = 2) [1] 0.006209665 (b) > pnorm(53, m = 50, sd = 2) - pnorm(47, m = 50, sd = 2) [1] 0.8663856 ou simplesmente > pnorm(1.5) - pnorm(-1.5) [1] 0.8663856 (c) a mesma da anterior > pnorm(1.5) - pnorm(-1.5) [1] 0.8663856 (d) > 50 - qnorm(0.9) * 2 [1] 47.4369 (e) > (54 - 50)/qnorm(0.975) [1] 2.040854 3. (05 pontos) Em média 5% dos produtos vendidos por uma loja são devolvidos. Qual a probabilidade de que, das quatro próximas unidades vendidas deste produto, duas sejam devolvidas? Resposta X : número de produtos devolvidos em quatro unidades vendidas X ∼ B(n = 4, p = 0.05) Ã ! 4 0.052 0.954−2 2 P [X = 2] = > dbinom(2, size = 4, prob = 0.05) [1] 0.0135375 4. (15 pontos) A demanda diária de arroz em um supermercado, em centenas de quilos, é uma variável aleatória com f.d.p.: 2x/3, se 0 ≤ x < 1 −x/3, se 1 ≤ x ≤ 3 f (x) = 0, se x < 0 ou x ≥ 3 (a) Qual a probabilidade de se vender mais de 150 kg num dia, escolhido ao acaso? (b) Em 30 dias, quanto o gerente do supermercado espera vender? (c) Qual a quantidade de arroz que deve ser deixada a disposição dos clientes para que não falte o produto em 90% dos dias? Resposta A função como apresentada no enunciado original não é uma função de probabilidade pois apresenta valores negativos para 1 ≤ x ≤ 3 e não integra 1. Portanto as questões não podem ser respondidas. Alternativamente poderia-se responder a questão corrigindo a função, que passaria a ser uma f.d.p. válida para: 2x/3, f (x) = se 0 ≤ x < 1 1 − x/3, se 1 ≤ x < 3 0, se x < 0 ou x ≥ 3 > fx <- function(x) { + y <- numeric(x) + y[x < 0 | x > 3] <- 0 + y[x >= 0 & x <= 1] <- 2 * x[x >= 0 & x <= 1]/3 + y[x >= 1 & x <= 3] <- 1 - (x[x >= 1 & x <= 3]/3) + return(y) + } > integrate(fx, 0, 3) 1 with absolute error < 1.1e-15 E neste caso as soluções seriam: (a) P [X > 150] = R3 1,5 f (x)dx = 0.375 > integrate(fx, 1.5, 3) 0.375 with absolute error < 4.2e-15 (b) 30E[X] = 30 R3 0 xf (x)dx > EX <- integrate(function(x) { + x * fx(x) + }, 0, 3)$value > EX [1] 1.333333 > 30 * EX * 100 [1] 4000 (c) P [X < k] = 0, 90 P [X ≥ k] = 0, 10 (3 − k)(1 − k/3) = 0, 10 > k <- optimize(function(k) (integrate(fx, k, 3)$value - 0.1)^2, + c(0, 3))$min > k [1] 2.225405 > round((3 - k) * (1 - (k/3))/2, dig = 4) [1] 0.1 5. (10 pontos) Os dados abaixo representam o valor das vendas semanais (em salários mı́nimos) de vendedores de gêneros alimentı́cios. Vendas semanais [30, 35) [35, 40) [40, 45) [45, 50) [50, 55) [55, 60) [60, 65) [65, 70) No de vendedores 2 10 18 50 70 30 18 2 (a) Faça o histograma das observações; (b) Calcule a média da amostra; (c) Calcule o desvio padrão da amostra; Respostas > vendas <- seq(32.5, 67.5, by = 5) > vendedores <- c(2, 10, 18, 50, 70, 30, 18, 2) > dados <- rep(vendas, vendedores) (a) > hist(dados, breaks = seq(30, 70, by = 5), xlab = "vendas", ylab = "no. vendedores", + main = "") 70 60 50 40 30 0 10 20 no. vendedores 30 40 50 vendas (b) Calcule a média da amostra; > mean(dados) [1] 51.2 > weighted.mean(vendas, vendedores) [1] 51.2 (c) Calcule o desvio padrão da amostra; > sd(dados) [1] 6.635522 60 70