INSTITUTO POLITÉCNICO DE SETÚBAL ESCOLA SUPERIOR DE SAÚDE ESTATÍSTICA I Cursos: Licenciaturas Bi-Etápicas em Fisioterapia e em Terapia da Fala Teste Final 2 o Ano / 3o Semestre 2007/08 a Data: 2 feira, 14 de Janeiro de 2008 Duração: 10h às 12h Instruções: 1. Leia atentamente o teste antes de começar. 2. Justifique convenientemente todas as respostas. 3. É permitida a utilização individual de tabelas e de máquina de calcular. 4. O abandono da sala por desistência só deverá ocorrer depois de decorridos 45 minutos a partir do início da prova. O abandono da sala implica a entrega definitiva do teste/exame. Questões: 1. Na tabela seguinte, utiliza-se a frequência relativa acumulada para quantificar o número de cigarros consumidos diariamente por um grupo de 80 fumadores, seleccionados aleatoriamente. No cigarros [0, 10[ [10, 20[ [20, 30[ [30, 40] Fr 0.15 0.50 0.75 1 [1.0] (a) Complete a tabela de frequências; [1.5] (b) Determine valores aproximados para o consumo médio diário de cigarros e o respectivo desvio padrão, para o referido grupo de fumadores; [1.5] (c) Construa o diagrama de extremos e quartis (boxplot) para o consumo diário de cigarros e classifique a distribuição dos dados quanto à simetria; [2.5] (d) Determine o nível de confiança, de um intervalo para a proporção de indivíduos que fuma menos de 10 cigarros por dia, sabendo que a amplitude do I.C. é de 0.1857. 2. Num estudo sobre a apneia do sono, foram avaliados o Índice de Massa Corporal (IM C) e a Pressão Crítica (Pc ) nas vias respiratórias superiores, de um grupo de 15 indivíduos, tendo-se obtido os seguintes resultados: X X X xi = 435 yi = 22 xi yi = 1012.4 X x2i = 13069 X yi2 = 358.64 [1.5] (a) Identifique as variáveis dependente e independente e determine o coeficiente de correlação linear empírico entre elas; [2.0] (b) Determine a Pressão Crítica previsível nas vias respiratórias de um indivíduo com um IM C = 37. 3. Um estudo realizado sobre os hábitos tabágicos dos estudantes do Ensino Superior num dado país, revelou que 15% são fumadores. [1.0] (a) Caracterize a variável aleatória que representa o número de alunos fumadores num Instituto com 5000 alunos; [2.5] (b) Calcule a probabilidade aproximada de no referido Instituto, o número de alunos fumadores se situar entre 680 e 800 (inclusive). [3.0] 4. Um grupo de investigadores pretende estudar metodologias adequadas à recuperação de pacientes com lesão cerebral traumática, tendo seleccionado 11 doentes com esta patologia que foram distribuídos aleatoriamente, 6 para a Reabilitação Cognitiva Assistida por Computador (RCAC) e 5 para a Terapia da Fala (TF). A progressão da capacidade neurofisiológica de cada paciente é traduzida pelas pontuações apresentadas na tabela seguinte: RCAC 35 30 33 30 25 25 TF 25 30 20 25 15 Considerando a normalidade dos dados, averigue, utilizando o valor-p, se os doentes submetidos à RCAC tiveram uma progressão média mais elevada da capacidade neurofisiológica, considerando um nível de significância de 5%. [3.5] 5. As medidas restritivas anti-tabaco implementadas numa dada Escola de Saúde foram avaliadas pelos alunos finalistas dos cursos de Fisioterapia e de Terapia da Fala. A forma como manifestaram as suas opiniões está representada na tabela seguinte: A favor das medidas Contra as medidas Fisioterapia 62 22 Terapia da Fala 38 8 Teste, para um nível de significância de 5%, se a opinião sobre as restrições adoptadas depende do curso frequentado pelos alunos inquiridos. Fim. 2 Proposta de Resolução 1. Na tabela seguinte, utiliza-se a frequência relativa acumulada para quantificar o número de cigarros consumidos diariamente por um grupo de 80 fumadores, seleccionados aleatoriamente. No cigarros [0, 10[ [10, 20[ [20, 30[ [30, 40] Fr 0.15 0.50 0.75 1 [1.0] (a) Complete a tabela de frequências; R: [1.5] (b) Determine valores aproximados para o consumo médio diário de cigarros e o respectivo desvio padrão, para o referido grupo de fumadores; R: Média: X x ' fri xIi = = 0.15 × 5 + 0.35 × 15 + 0.25 × 25 + 0.25 × 35 = 21 Variância Corrigida: s2 ' ¢2 ¡ 1 X fai xIi − x = n−1 = i h 1 2 2 × 12 × (5 − 21) + ... + 20 × (35 − 21) = 79 = 8320 = 105.316 79 Desvio padrão: s' √ 105.316 = 10.26 [1.5] (c) Construa o diagrama de extremos e quartis (boxplot) para o consumo diário de cigarros e classifique a distribuição dos dados quanto à simetria; R: Classe do 1o quartil: l = [10; 20[ (primeira classe em que Fr > 0.25), sendo Q1 ≡ q0.25 = xmin + ∆l × l = 10 + 10 × 0.25 − Frl−1 = frl 0.25 − 0.15 ' 12.86 0.35 Classe Mediana - x e = q0.5 = 20 (limite superior da classe em que Fr = 0.5); o 3 quartil - Q3 ≡ q0.75 = 30 (limite superior da classe em que Fr = 0.75); Mínimo: 0; Máximo: 40. 3 Diagrama de extremos e quartis: Dado verificar-se uma menor dispersão dos dados entre o 1o quartil e a mediana do que entre a mediana e o 3o quartil tem-se uma assimetria positiva que pode ser confirmada pelo facto de q0.5 < x,ou calculando o coeficiente de assimetria: T2 = Q3 + Q1 − 2e x = Q3 − Q1 = 30 + 12.86 − 2 × 20 = 0.167 > 0 30 − 12.86 [2.5] (d) Determine o nível de confiança, de um intervalo para a proporção de indivíduos que fuma menos de 10 cigarros por dia, sabendo que a amplitude do I.C. é de 0.1857. R: Trata-se de um I.C para p sendo p∗ = 0.15; q ∗ = 1 − 0.15 = 0.85. Ao IC a (1 − α) % de Confiança: # ∗ p ∓ z1− α2 × r corresponde uma amplitude l = 2 × z1− α2 × isto é: l = 0.1857 ⇔ 2 × z1− α2 × ⇔ z1− α2 = r p∗ q ∗ n r " p∗ q ∗ n 0.15 × 0.85 = 0.1857 ⇔ 80 0.1857 ⇔ z1− α2 = 2.326 ⇒ 2 × 0.04 α = 0.99 ⇔ α = 0.02 2 Logo tem um nível de confiança 1 − α = 0.98 ⇒ 1− 2. Num estudo sobre a apneia do sono, foram avaliados o Índice de Massa Corporal (IM C) e a Pressão Crítica (Pc ) nas vias respiratórias superiores, de um grupo de 15 indivíduos, tendo-se obtido os seguintes resultados: X X X xi = 435 yi = 22 xi yi = 1012.4 X x2i X = 13069 4 yi2 = 358.64 [1.5] (a) Identifique as variáveis dependente e independente e determine o coeficiente de correlação linear empírico entre elas; R: X - Var. Independente - Índice de Massa Corporal (IM C) Y - Var. Dependente - Pressão Crítica (Pc ) Vamos averiguar a existência de relação linear entre as duas variáveis através do coeficiente de correlação linear empírico (r), considerando 22 x = 435 15 = 29 e y = 15 ' 1.47: P xi yi − n x y q r = ¡P 2 ¢ ¡P 2 ¢= xi − nx2 yi − ny 2 = ' 1012.4 − 15 × 29 × 1.47 p ' (13069 − 15 × 292 ) (358.64 − 15 × 1.472 ) 372.95 ' 0.97 384.85 O coeficiente de correlação linear r ' 0.97 é positivo e elevado indicando por um lado que as variáveis variam no mesmo sentido e por outro que essa variação pode ser traduzida através de uma linha recta. [2.0] (b) Determine a Pressão Crítica previsível nas vias respiratórias de um indivíduo com um IM C = 37. R: Começamos por estimar os coeficientes da recta de regressão: P P P n xi yi − xi yi b = P 2 P 2 = n xi − ( xi ) = 5616 15 × 1012.4 − 435 × 22 = ' 0.8247 15 × 13069 − 4352 6810 a = y − bx = = 1.47 − 0.8247 × 29 = −22.446 tendo-se: Deste modo obtém-se: yb = −22.446 + 0.8247x x = 37 ⇒ yb = −22.446 + 0.8247 × 37 = 8.068 3. Um estudo realizado sobre os hábitos tabágicos dos estudantes do Ensino Superior num dado país, revelou que 15% são fumadores. [1.0] (a) Caracterize a variável aleatória que representa o número de alunos fumadores num Instituto com 5000 alunos; R: X - No de alunos fumadores num Instituto com 5000 alunos. X ∼ B (n = 5000; p = 0.15) [2.5] (b) Calcule a probabilidade aproximada de no referido Instituto, o número de alunos fumadores se situar entre 680 e 800 (inclusive). R: Pretende-se calcular P (680 ≤ X ≤ 800) . Como ) n = 5000 > 30 np = 5000 × 0.15 = 750 > 5 ⇒ nq = 5000 × 0.85 = 4250 > 5 5 √ ¡ ¢ √ • X ∼N μ = np = 750; σ = npq = 750 × 0.85 ' 25.25 P (680 ≤ X ≤ 800) ≈ P µ ≈ Apr. Normal c/ correcção por continuidade 679.5 − 750 800.5 − 750 ≤Z≤ 25.25 25.25 ¶ = = Φ (2) − Φ (−2.79) = = 0.9772 − 1 + 0.9974 = 0.9746 [3.0] 4. Um grupo de investigadores pretende estudar metodologias adequadas à recuperação de pacientes com lesão cerebral traumática, tendo seleccionado 11 doentes com esta patologia que foram distribuídos aleatoriamente, 6 para a Reabilitação Cognitiva Assistida por Computador (RCAC) e 5 para a Terapia da Fala (TF). A progressão da capacidade neurofisiológica de cada paciente é traduzida pelas pontuações apresentadas na tabela seguinte: RCAC 35 30 33 30 25 25 TF 25 30 20 25 15 Considerando a normalidade dos dados, averigue, utilizando o valor-p, se os doentes submetidos à RCAC tiveram uma progressão média mais elevada da capacidade neurofisiológica, considerando um nível de significância de 5%. R: (a) Dados: α = 0.05; RCAC : ( x1 = 29.67 s1 = 4.0825 n1 = 6 e TF : ( x2 = 23 s2 = 5.7 n2 = 5 Queremos testar μ1 − μ2 com σ 1 e σ 2 desconhecidos, com n1 < 30 e n2 < 30, através do seguinte teste unilateral direito: n H0 : μ1 − μ2 ≤ 0 H1 : μ1 − μ2 > 0 A estatística adequada é: ¢ X 1 − X 2 − (μ1 − μ2 ) ∼ t(n1 +n2 −2) T = r³ ´ (n1 −1)s21 +(n2 −1)s22 1 1 n1 + n2 n1 +n2 −2 ¡ (29.67 − 23) − 0 T ∗ = q¡ ' 2.26 ¢ 1 1 5×16.67+4×32.5 + 6 5 9 Deste modo tem-se para o valor p: pv = P (T ≥ T ∗ ) = = P (T ≥ 2.26) = 1 − F (2.26) = tabela t9 = 1 − 0.975 = 0.025 Como pv = 0.025 < α = 0.05, rejeita-se H0 , isto é, os doentes submetidos à RCAC tiveram uma progressão média mais elevada da capacidade neurofisiológica, de acordo com os dados da amostra e para este nível de significância. 6 [3.5] 5. As medidas restritivas anti-tabaco implementadas numa dada Escola de Saúde foram avaliadas pelos alunos finalistas dos cursos de Fisioterapia e de Terapia da Fala. A forma como manifestaram as suas opiniões está representada na tabela seguinte: Fisioterapia 62 22 A favor das medidas Contra as medidas Terapia da Fala 38 8 Teste, para um nível de significância de 5%, se a opinião sobre as restrições adoptadas depende do curso frequentado pelos alunos inquiridos. R: (a) Formulação do teste: ½ H0 : pij = pi. p.j (A opinião sobre as medidas restritivas é independente do curso frequentado) H1 : pij 6= pi. p.j (A opinião sobre as medidas restritivas não é independente do curso frequentado) Estatística teste: Q= 2 X 2 X (Oij − Eij )2 ∼ χ2(r−1)(c−1) = χ2(1) E ij i=1 j=1 Opinião dos alunos A favor Contra Total Curso Fis. T.Fala 62 38 22 8 84 46 Opinião dos alunos A favor Contra Total Curso Fis. T.Fala 64.615 35.385 19.385 10.615 84 46 2 Q∗ = ⎫ Total ⎪ ⎪ ⎬ 100 frequências observadas ⎪ ⎪ 30 ⎭ 130 ⎫ Total ⎪ ⎪ ⎬ 100 frequências esperadas ⎪ ⎪ 30 ⎭ 130 2 (62 − 64.615) (8 − 10.615) + ... + = 1.296 64.615 10.615 Regra de decisão: Como Q∗ = 1.296 < χ2(1;0.95) = 3.84, não se rejeita H0 , isto é, de acordo com os dados da amostra e para este nível de significância, a opinião sobre as medidas restritivas é independente do curso frequentado. Fim da resolução do teste 7