CE-003: Estatı́stica II, turma E
1a Prova - 1o semestre 2006 (24 Abril de 2006)
1. (10 pontos) Um programa computacional para detectar fraudes em cartões telefônicos rastreia, todo dia, o
número de áreas metropolitanas de onde as chamadas se originam. Sabe-se que 1% dos usuários legı́timos fazem
suas chamadas de 2 ou mais áreas metropolitanas em um único dia. Entretanto, 30% dos usuários fraudulentos
fazem suas chamadas de 2 ou mais áreas metropolitanas em um único dia. A proporção de usuários fraudulentos
é de 0,01%. Se o mesmo usuário fizer as suas chamadas de 2 ou mais áreas metropolitanas em um único dia,
qual será a probabilidade de que o usuário seja fraudulento?
Resposta: F: fraudulento , M: chamadas de 2 ou mais áreas
P [F ] = 0, 0001 ; P [M |F̄ ] = 0, 01 ; P [M |F ] = 0, 03
P [F |M ] = ?
P [F |M ] =
P [M |F ]P [F ]
=
P [M |F ]P [F ] + P [M |F̄ ]P [F̄ ]
> (0.03 * 1e-04)/(0.03 * 1e-04 + 0.01 * 0.9999)
[1] 0.00029994
2. (20 pontos) Assume-se que o tempo de processamento de uma certa requisição tem distribuição normal de
média 50 segundos e desvio padrão de 2 segundos.
(a) Qual a porcentagem esperada de processos com o tempo de processamento inferior a 45 segundos?
(b) Qual a porcentagem esperada de processos em que o tempo de processamento não se desvia da média em
mais que 1,5 desvios padrão?
(c) O que acontecerá com a porcentagem do ı́tem anterior se o servidor for trocado por outro que tem tempo
médio de processamento de 45 segundos e o desvio padrão de 3 segundos?
(d) Mantendo o desvio padrão de 2 segundos, em quanto deveria ser regulada a média para garantir que 90%
ou mais dos processos tenham tempo de processamento inferior a 50 segundos?
(e) Mantendo a média de 50 segundos quanto deveria ser o desvio padrão para garantir que 95% dos processos
tenham tempo de processamento entre 46 e 54 segundos?
Resposta
(a) > pnorm(45, m = 50, sd = 2)
[1] 0.006209665
(b) > pnorm(53, m = 50, sd = 2) - pnorm(47, m = 50, sd = 2)
[1] 0.8663856
ou simplesmente
> pnorm(1.5) - pnorm(-1.5)
[1] 0.8663856
(c) a mesma da anterior
> pnorm(1.5) - pnorm(-1.5)
[1] 0.8663856
(d) > 50 - qnorm(0.9) * 2
[1] 47.4369
(e) > (54 - 50)/qnorm(0.975)
[1] 2.040854
3. (05 pontos) Em média 5% dos produtos vendidos por uma loja são devolvidos. Qual a probabilidade de que,
das quatro próximas unidades vendidas deste produto, duas sejam devolvidas?
Resposta
X
:
número de produtos devolvidos em quatro unidades vendidas
X ∼ B(n = 4, p = 0.05)
à !
4
0.052 0.954−2
2
P [X = 2] =
> dbinom(2, size = 4, prob = 0.05)
[1] 0.0135375
4. (15 pontos) A demanda diária de arroz em um supermercado, em centenas de quilos, é uma variável aleatória
com f.d.p.:


 2x/3, se 0 ≤ x < 1
−x/3, se 1 ≤ x ≤ 3
f (x) =

 0,
se x < 0 ou x ≥ 3
(a) Qual a probabilidade de se vender mais de 150 kg num dia, escolhido ao acaso?
(b) Em 30 dias, quanto o gerente do supermercado espera vender?
(c) Qual a quantidade de arroz que deve ser deixada a disposição dos clientes para que não falte o produto
em 90% dos dias?
Resposta A função como apresentada no enunciado original não é uma função de probabilidade pois apresenta
valores negativos para 1 ≤ x ≤ 3 e não integra 1. Portanto as questões não podem ser respondidas.
Alternativamente poderia-se responder a questão corrigindo a função, que passaria a ser uma f.d.p. válida para:


 2x/3,
f (x) =
se 0 ≤ x < 1
1 − x/3, se 1 ≤ x < 3

 0,
se x < 0 ou x ≥ 3
> fx <- function(x) {
+
y <- numeric(x)
+
y[x < 0 | x > 3] <- 0
+
y[x >= 0 & x <= 1] <- 2 * x[x >= 0 & x <= 1]/3
+
y[x >= 1 & x <= 3] <- 1 - (x[x >= 1 & x <= 3]/3)
+
return(y)
+ }
> integrate(fx, 0, 3)
1 with absolute error < 1.1e-15
E neste caso as soluções seriam:
(a) P [X > 150] =
R3
1,5 f (x)dx
= 0.375
> integrate(fx, 1.5, 3)
0.375 with absolute error < 4.2e-15
(b) 30E[X] = 30
R3
0
xf (x)dx
> EX <- integrate(function(x) {
+
x * fx(x)
+ }, 0, 3)$value
> EX
[1] 1.333333
> 30 * EX * 100
[1] 4000
(c)
P [X < k] = 0, 90
P [X ≥ k] = 0, 10
(3 − k)(1 − k/3) = 0, 10
> k <- optimize(function(k) (integrate(fx, k, 3)$value - 0.1)^2,
+
c(0, 3))$min
> k
[1] 2.225405
> round((3 - k) * (1 - (k/3))/2, dig = 4)
[1] 0.1
5. (10 pontos) Os dados abaixo representam o valor das vendas semanais (em salários mı́nimos) de vendedores de
gêneros alimentı́cios.
Vendas semanais
[30, 35)
[35, 40)
[40, 45)
[45, 50)
[50, 55)
[55, 60)
[60, 65)
[65, 70)
No de vendedores
2
10
18
50
70
30
18
2
(a) Faça o histograma das observações;
(b) Calcule a média da amostra;
(c) Calcule o desvio padrão da amostra;
Respostas
> vendas <- seq(32.5, 67.5, by = 5)
> vendedores <- c(2, 10, 18, 50, 70, 30, 18, 2)
> dados <- rep(vendas, vendedores)
(a) > hist(dados, breaks = seq(30, 70, by = 5), xlab = "vendas", ylab = "no. vendedores",
+
main = "")
70
60
50
40
30
0
10
20
no. vendedores
30
40
50
vendas
(b) Calcule a média da amostra;
> mean(dados)
[1] 51.2
> weighted.mean(vendas, vendedores)
[1] 51.2
(c) Calcule o desvio padrão da amostra;
> sd(dados)
[1] 6.635522
60
70
Download

CE-003: Estat´ıstica II, turma E