CE-003: Estatı́stica II, turma L Prova Final - 2o semestre 2006 (08 de Dezembro de 2006) 1. (30 pontos) Um artigo no Journal of Structural Engineering (vol 115, 1989) descreve um experimento para testar a resistência de tubos circulares com tampas soldadas nas extremidades. Os primeiros dados (em kN) são: 96, 128, 102, 102, 104, 160, 96, 108, 126, 104, 128, 140, 156, 102 e 160. (a) construa um gráfico box-plot para estes dados (b) construa um diagrama ramo-e-folhas para estes dados (c) obtenha a média, desvio padrão e coeficiente da variação dos dados (d) obtenha a mediana, amplitude total e amplitude interquartı́lica (e) obtenha um intervalo de confiança para a média populacional, indicando quais as suposições feitas na obtenção deste intervalo (f) teste a hipótese (α = 0, 10) de que a resistência média é superior a 110 kN. Solução: (a) > dados <- c(96, 128, 102, 102, 104, 160, 96, 108, 126, 104, 128, 140, + 156, 102, 160) > boxplot(dados, horizontal = TRUE) 100 110 120 130 140 150 (b) a seguir mostramos duas possı́veis formas se montar o ramo-e-folhas > stem(dados) The decimal point is 1 digit(s) to the right of the | 8 10 12 14 16 | | | | | 66 222448 688 06 00 > stem(dados, scale = 2) 160 The decimal point is 1 digit(s) to the right of the | 9 10 11 12 13 14 15 16 | | | | | | | | 66 222448 688 0 6 00 (c) > mean(dados) [1] 120.8 > sd(dados) [1] 23.64983 > 100 * sd(dados)/mean(dados) [1] 19.57767 (d) > median(dados) [1] 108 > diff(range(dados)) [1] 64 > diff(fivenum(dados)[c(2, 4)]) [1] 32 (e) Supõe-se a normalidade dos dados. A seguir mostramos resultados para niveis de confiança de 90, 95 e 99%, respectivamente > t.test(dados, conf = 0.9)$conf [1] 110.0448 131.5552 attr(,"conf.level") [1] 0.9 > t.test(dados, conf = 0.95)$conf [1] 107.7032 133.8968 attr(,"conf.level") [1] 0.95 > t.test(dados, conf = 0.99)$conf [1] 102.6223 138.9777 attr(,"conf.level") [1] 0.99 (f) O resultado abaixo mostra que a hipótese nula pode ser rejeitada para α = 0.10 e portanto pode-se afirmar que a média é superior a 110 kN > t.test(dados, conf = 0.9, alt = "greater", mu = 110) One Sample t-test data: dados t = 1.7686, df = 14, p-value = 0.04936 alternative hypothesis: true mean is greater than 110 90 percent confidence interval: 112.5868 Inf sample estimates: mean of x 120.8 2. (10 pontos) A proporção de item com defeito numa fábrica de baterias é de 0,02. Um inspetor de controle de qualidade testa baterias retiradas ao acaso da linha de montagem. Qual a probabilidade que ele tenha que examinar mais de 20 baterias para obter uma com defeito? Qual a probabilidade que ele tenha que examinar mais de 20 baterias para obter a terceira com defeito? Solução: X : número de baterias examinadas P [X > 20] (a) neste caso X ∼ Geométrica(p = 0, 02) > pgeom(20, prob = 0.02, lower = F) [1] 0.6542558 (b) neste caso X ∼ Binomial Negativa(r = 3, p = 0, 02) > pnbinom(20, size = 3, prob = 0.02, lower = F) [1] 0.9894965 3. (15 pontos) Seja a função f (x) = 3x2 0 < x < 1. (a) mostre que f (x) é uma função de densidade de probabilidade (b) encontre P [|X − 0, 5| > 0, 2] (c) encontre a amplitude interquartı́lica Solução: > fx <- function(x) ifelse(x > 0 | x < 1, 3 * x^2, 0) (a) f (x) ≥ 0 ∀ 0 < x < 1 e R1 0 f (x)dx = 1 > integrate(fx, 0, 1)$value [1] 1 (b) P [|X − 0, 5| > 0, 2] = P [X < 0, 3 ou X > 0, 7] = 1 − R 0,7 0,3 f (x)dx = 0 > 1 - integrate(fx, 0.3, 0.7)$value [1] 0.684 (c) AI = Q3 - Q1 Z q1 0 Z q3 0 3x2 dx = 0, 25 =⇒ q1 = 0.63 3x2 dx = 0, 25 =⇒ q3 = 0.909 AI = q3 − q1 = 0.279 4. (20 pontos) Os nı́veis de nicotina em fumantes são modelados por uma variável aleatória T com distribuição normal de média 315 e variância 17161. (a) qual a probabilidade de, sorteando-se ao acaso um fumante, ele ter nı́vel de nicotina inferior a 450? (b) e qual a probabilidade do nı́vel estar entre 150 e 400? (c) qual o percentil 95% da distribuição de nı́veis de nicotina? (d) encontre a probabilidade P [|T − 315| ≤ 100] (e) qual o nı́vel de nicotina para o qual 20% dos fumantes possuem teor superior e ele? T : nı́vel de nicotina T ∼ N (315; 17161) (a) P [T < 450] = P [Z < 450−315 √ ] 17161 = P [Z < 1.03] = 0.849 √ (b) P [150 < T < 400] = P [ 150−315 <Z< 17161 (c) P [T < t] = 0, 95 =⇒ P [Z < t−315 √ ] 17161 400−315 √ ] 17161 = P [−1.26 < Z < 0.65] = 0.638 = 0, 95 =⇒ t = 530.5 √ (d) P [|T − 315| ≤ 100] = P [215 ≤ T ≤ 415] = P [ 215−315 <Z< 17161 0.555 (e) P [T > t] > 0, 20 =⇒ P [Z > t−315 √ ] 17161 > 0, 20 =⇒ t−315 √ 17161 415−315 √ ] 17161 = P [−0.76 < Z < 0.76] = = 0.84 =⇒ t = 425.3 5. (10 pontos) Um tipo de tubo de PVC é manufaturado com diâmetro médio de 1,01 polegadas e um desvio padrão de 0,003 polegadas. Encontre a probabilidade de que uma amostra de tamanha n = 9 tenha uma média amostral do diâmetro maior que 1,009 e menor que 1,012 polegadas. Solução: X : diâmetro do tubo X ∼ N (1, 01; (0, 003)2 ) X̄9 ∼ N (1, 01; (0, 003)2 /9) 1, 009 − 1, 01 1, 012 − 1, 01 √ √ ] = P [−1 < Z < −1] = 0.819 P [1, 009 < X̄ < 1, 012] = P [ <Z< 0, 003/ 9 0, 003/ 9 6. (15 pontos) De 1000 casos selecionados ao acaso de câncer de pulmão, 823 resultaram em morte. (a) Obtenha um intervalo de confiança (95%) para a taxa de óbitos de câncer de pulmão, (b) qual deveria ser o tamanho amostral para que com confiança de ao menos 95% o erro na estimação da taxa de óbitos seja inferior a 0,03? Solução: (a) Há duas possı́veis soluções vistas no curso: o intervalo assintótico, tomando p = p̂ ou conservador onde p = 0, 5 > p.est <- 823/1000 > p.est + qnorm(c(0.025, 0.975)) * sqrt(p.est * (1 - p.est)/1000) [1] 0.7993444 0.8466556 > p.est + qnorm(c(0.025, 0.975)) * sqrt(0.5 * (1 - 0.5)/1000) [1] 0.7920102 0.8539898 (b) Aqui também há duas possı́veis soluções considerando p = p̂ ou p = 0, 5 P [|p̂ − p| < 0, 03] ≥ 0.95 z = 1, 96 = 0, 03 − 0 p(1 − p)/n !2 1, 96 n = p(1 − p) 0, 03 n = 622 para p = p̂ n = 1068 para p = 0.5