CE-001: Bioestatı́stica, turma A Prova Final - 2o semestre 2004 15 de dezembro de 2004 Foi tomada uma amostra de um grupo de estudantes de um certo curso de graduação para verificar o conhecimento destes estudantes sobre o conteúdo uma certa disciplina. Os estudantes foram selecionados ao acaso, prestaram um exame e obtiveram as notas indicadas na tabela a seguir, onde é também indicado o sexo do estudante. Estudante sexo nota Estudante sexo nota 1 fem 83 13 fem 52 2 fem 57 14 fem 70 3 fem 77 15 fem 79 4 fem 65 16 masc 79 5 fem 74 17 masc 68 6 fem 74 18 masc 79 7 masc 70 19 fem 60 8 fem 73 20 fem 65 9 masc 48 21 masc 46 10 masc 70 22 masc 67 11 masc 75 23 fem 51 12 masc 68 24 masc 60 > sexo <- c(1, 1, 1, 1, 1, 1, 2, 1, 2, 2, 2, 2, 1, 1, 1, 2, 2, 2, 1, 1, 2, 2, + 1, 2) > sexo <- factor(sexo, levels = 1:2, labels = c("fem", "masc")) > nota <- c(83, 57, 77, 65, 74, 74, 70, 73, 48, 70, 75, 68, 52, 70, 79, 79, 68, + 79, 60, 65, 46, 67, 51, 60) 1. Para este problema descreva qual é a população, qual a amostra, quais as variáveis obtidas e quais são os tipos destas variáveis? Mencione ainda ao menos 3 cuidados que devem ser tomados ao selecionar a amostra, para que esta seja adequada ao estudo. 2. Faça um resumo adequado dos valores da variável sexo > tb <- table(sexo) > tb sexo fem masc 13 11 > prop.table(tb) sexo fem masc 0.5416667 0.4583333 > pie(tb) fem masc 3. Faça um resumo adequado dos valores da variável nota > summary(nota) Min. 1st Qu. 46.00 60.00 Median 69.00 Mean 3rd Qu. 67.08 74.25 Max. 83.00 > table(cut(nota, br = seq(30, 100, by = 10))) (30,40] 0 (40,50] 2 (50,60] 5 > par(mfrow = c(1, 2)) > hist(nota) > boxplot(nota) (60,70] 8 (70,80] 8 (80,90] (90,100] 1 0 0 50 1 2 60 Frequency 3 70 4 5 80 6 Histogram of nota 50 60 70 nota 80 4. Compare os grupos masculino e feminino usando o gráfico do tipo ”box-plot”. Comente os resultados. > boxplot(nota ~ sexo) 80 70 60 50 ● ● fem masc 5. Faça um teste de hipótese adequado para testar a 90% a hipótese de que os grupos masculino e feminino não são homogêneos (i.e. possuem variabilidades diferentes). > var.test(nota ~ sexo, conf = 0.9) F test to compare two variances data: nota by sexo F = 0.8718, num df = 12, denom df = 10, p-value = 0.81 alternative hypothesis: true ratio of variances is not equal to 1 90 percent confidence interval: 0.2992758 2.4003569 sample estimates: ratio of variances 0.8717834 6. Faça um teste de hipótese adequado para testar a 99% a hipótese de que o rendimento médio dos grupos masculino e feminino são diferentes. > t.test(nota ~ sexo, conf = 0.99, var.eq = TRUE) Two Sample t-test data: nota by sexo t = 0.3047, df = 22, p-value = 0.7635 alternative hypothesis: true difference in means is not equal to 0 99 percent confidence interval: -10.96474 13.62208 sample estimates: mean in group fem mean in group masc 67.69231 66.36364 7. Se forem selecionados ao acaso 4 estudantes entre os 24 que fizeram o exame qual a probabilidade de: (a) ao menos 1 seja do sexo feminino, em uma seleção com reposição (b) ao menos 1 seja do sexo masculino, em uma seleção sem reposição (c) todos sejam do sexo feminino, em uma seleção sem reposição (d) todos sejam do sexo masculino, em uma seleção com reposição > 1 - pbinom(0, size = 4, prob = 13/24) [1] 0.9558708 > 1 - (13/24) * (12/23) * (11/22) * (10/21) [1] 0.9327122 > (13/24) * (12/23) * (11/22) * (10/21) [1] 0.06728778 > dbinom(4, size = 4, prob = 11/24) [1] 0.04412917 8. Supondo que as notas dos estudantes possuem distribuição normal de média 60 e variância 225 qual a probabilidade de um indivı́duo selecionado ao acaso ter: (a) nota maior que 90, (b) nota entre 40 e 70, (c) nota menor que 30 ou maior que 80. (d) Qual a nota abaixo da qual deve-se encontrar 10% dos estudantes > pnorm(90, m = 60, sd = 15, low = F) [1] 0.02275013 > pnorm(70, m = 60, sd = 15) - pnorm(40, m = 60, sd = 15) [1] 0.6562962 > pnorm(30, m = 60, sd = 15) + pnorm(80, m = 60, sd = 15, low = F) [1] 0.1139614 > qnorm(0.1, m = 60, sd = 15) [1] 40.77673 9. Teste a 99% a hipótese de que a média do grupo masculino é superior à 60 unidades. > t.test(nota[sexo == "masc"], mu = 60, alt = "greater", conf = 0.99) One Sample t-test data: nota[sexo == "masc"] t = 1.912, df = 10, p-value = 0.04246 alternative hypothesis: true mean is greater than 60 99 percent confidence interval: 57.16494 Inf sample estimates: mean of x 66.36364 10. Teste a 95% a hipótese de que a variância do grupo feminino é inferior à 225 unidades2 . > chisq.c <- (13 - 1) * var(nota[sexo == "fem"])/225 > chisq.c [1] 5.665641 > p.value <- pchisq(chisq.c, df = 12) > p.value [1] 0.0680096