CE-003: Estatı́stica II, turma L
Prova Final - 2o semestre 2006 (08 de Dezembro de 2006)
1. (30 pontos) Um artigo no Journal of Structural Engineering (vol 115, 1989) descreve um experimento
para testar a resistência de tubos circulares com tampas soldadas nas extremidades. Os primeiros
dados (em kN) são: 96, 128, 102, 102, 104, 160, 96, 108, 126, 104, 128, 140, 156, 102 e 160.
(a) construa um gráfico box-plot para estes dados
(b) construa um diagrama ramo-e-folhas para estes dados
(c) obtenha a média, desvio padrão e coeficiente da variação dos dados
(d) obtenha a mediana, amplitude total e amplitude interquartı́lica
(e) obtenha um intervalo de confiança para a média populacional, indicando quais as suposições
feitas na obtenção deste intervalo
(f) teste a hipótese (α = 0, 10) de que a resistência média é superior a 110 kN.
Solução:
(a) > dados <- c(96, 128, 102, 102, 104, 160, 96, 108, 126, 104, 128, 140,
+
156, 102, 160)
> boxplot(dados, horizontal = TRUE)
100
110
120
130
140
150
(b) a seguir mostramos duas possı́veis formas se montar o ramo-e-folhas
> stem(dados)
The decimal point is 1 digit(s) to the right of the |
8
10
12
14
16
|
|
|
|
|
66
222448
688
06
00
> stem(dados, scale = 2)
160
The decimal point is 1 digit(s) to the right of the |
9
10
11
12
13
14
15
16
|
|
|
|
|
|
|
|
66
222448
688
0
6
00
(c) > mean(dados)
[1] 120.8
> sd(dados)
[1] 23.64983
> 100 * sd(dados)/mean(dados)
[1] 19.57767
(d) > median(dados)
[1] 108
> diff(range(dados))
[1] 64
> diff(fivenum(dados)[c(2, 4)])
[1] 32
(e) Supõe-se a normalidade dos dados. A seguir mostramos resultados para niveis de confiança de
90, 95 e 99%, respectivamente
> t.test(dados, conf = 0.9)$conf
[1] 110.0448 131.5552
attr(,"conf.level")
[1] 0.9
> t.test(dados, conf = 0.95)$conf
[1] 107.7032 133.8968
attr(,"conf.level")
[1] 0.95
> t.test(dados, conf = 0.99)$conf
[1] 102.6223 138.9777
attr(,"conf.level")
[1] 0.99
(f) O resultado abaixo mostra que a hipótese nula pode ser rejeitada para α = 0.10 e portanto
pode-se afirmar que a média é superior a 110 kN
> t.test(dados, conf = 0.9, alt = "greater", mu = 110)
One Sample t-test
data: dados
t = 1.7686, df = 14, p-value = 0.04936
alternative hypothesis: true mean is greater than 110
90 percent confidence interval:
112.5868
Inf
sample estimates:
mean of x
120.8
2. (10 pontos) A proporção de item com defeito numa fábrica de baterias é de 0,02. Um inspetor de
controle de qualidade testa baterias retiradas ao acaso da linha de montagem. Qual a probabilidade
que ele tenha que examinar mais de 20 baterias para obter uma com defeito? Qual a probabilidade
que ele tenha que examinar mais de 20 baterias para obter a terceira com defeito?
Solução:
X : número de baterias examinadas
P [X > 20]
(a) neste caso X ∼ Geométrica(p = 0, 02)
> pgeom(20, prob = 0.02, lower = F)
[1] 0.6542558
(b) neste caso X ∼ Binomial Negativa(r = 3, p = 0, 02)
> pnbinom(20, size = 3, prob = 0.02, lower = F)
[1] 0.9894965
3. (15 pontos) Seja a função f (x) = 3x2 0 < x < 1.
(a) mostre que f (x) é uma função de densidade de probabilidade
(b) encontre P [|X − 0, 5| > 0, 2]
(c) encontre a amplitude interquartı́lica
Solução:
> fx <- function(x) ifelse(x > 0 | x < 1, 3 * x^2, 0)
(a) f (x) ≥ 0 ∀ 0 < x < 1 e
R1
0
f (x)dx = 1
> integrate(fx, 0, 1)$value
[1] 1
(b) P [|X − 0, 5| > 0, 2] = P [X < 0, 3 ou X > 0, 7] = 1 −
R 0,7
0,3
f (x)dx = 0
> 1 - integrate(fx, 0.3, 0.7)$value
[1] 0.684
(c) AI = Q3 - Q1
Z q1
0
Z q3
0
3x2 dx = 0, 25 =⇒ q1 = 0.63
3x2 dx = 0, 25 =⇒ q3 = 0.909
AI = q3 − q1 = 0.279
4. (20 pontos) Os nı́veis de nicotina em fumantes são modelados por uma variável aleatória T com
distribuição normal de média 315 e variância 17161.
(a) qual a probabilidade de, sorteando-se ao acaso um fumante, ele ter nı́vel de nicotina inferior a
450?
(b) e qual a probabilidade do nı́vel estar entre 150 e 400?
(c) qual o percentil 95% da distribuição de nı́veis de nicotina?
(d) encontre a probabilidade P [|T − 315| ≤ 100]
(e) qual o nı́vel de nicotina para o qual 20% dos fumantes possuem teor superior e ele?
T : nı́vel de nicotina
T ∼ N (315; 17161)
(a) P [T < 450] = P [Z <
450−315
√
]
17161
= P [Z < 1.03] = 0.849
√
(b) P [150 < T < 400] = P [ 150−315
<Z<
17161
(c) P [T < t] = 0, 95 =⇒ P [Z <
t−315
√
]
17161
400−315
√
]
17161
= P [−1.26 < Z < 0.65] = 0.638
= 0, 95 =⇒ t = 530.5
√
(d) P [|T − 315| ≤ 100] = P [215 ≤ T ≤ 415] = P [ 215−315
<Z<
17161
0.555
(e) P [T > t] > 0, 20 =⇒ P [Z >
t−315
√
]
17161
> 0, 20 =⇒
t−315
√
17161
415−315
√
]
17161
= P [−0.76 < Z < 0.76] =
= 0.84 =⇒ t = 425.3
5. (10 pontos) Um tipo de tubo de PVC é manufaturado com diâmetro médio de 1,01 polegadas e um
desvio padrão de 0,003 polegadas. Encontre a probabilidade de que uma amostra de tamanha n = 9
tenha uma média amostral do diâmetro maior que 1,009 e menor que 1,012 polegadas.
Solução:
X : diâmetro do tubo
X ∼ N (1, 01; (0, 003)2 )
X̄9 ∼ N (1, 01; (0, 003)2 /9)
1, 009 − 1, 01
1, 012 − 1, 01
√
√ ] = P [−1 < Z < −1] = 0.819
P [1, 009 < X̄ < 1, 012] = P [
<Z<
0, 003/ 9
0, 003/ 9
6. (15 pontos) De 1000 casos selecionados ao acaso de câncer de pulmão, 823 resultaram em morte.
(a) Obtenha um intervalo de confiança (95%) para a taxa de óbitos de câncer de pulmão,
(b) qual deveria ser o tamanho amostral para que com confiança de ao menos 95% o erro na
estimação da taxa de óbitos seja inferior a 0,03?
Solução:
(a) Há duas possı́veis soluções vistas no curso: o intervalo assintótico, tomando p = p̂ ou conservador
onde p = 0, 5
> p.est <- 823/1000
> p.est + qnorm(c(0.025, 0.975)) * sqrt(p.est * (1 - p.est)/1000)
[1] 0.7993444 0.8466556
> p.est + qnorm(c(0.025, 0.975)) * sqrt(0.5 * (1 - 0.5)/1000)
[1] 0.7920102 0.8539898
(b) Aqui também há duas possı́veis soluções considerando p = p̂ ou p = 0, 5
P [|p̂ − p| < 0, 03] ≥ 0.95
z = 1, 96 =
0, 03 − 0
p(1 − p)/n
!2
1, 96
n =
p(1 − p)
0, 03
n = 622 para p = p̂
n = 1068 para p = 0.5
Download

formato PDF