Gabarito Profa. Dra. Graziela Dutra Rocha Gouvêa Medidas de dispersão 1. Para comparar quatro softwares estatísticos (A, B, C, D), foi feito um experimento, anotando o tempo gasto, em segundos, para realizar a análise estatística dos resultados de seis experimentos. Os resultados obtidos foram os seguintes: Experimento Software 1 2 3 4 5 6 A 13 10 11 17 12 11 B 15 13 14 10 11 10 C 14 10 11 12 11 13 D 12 12 12 12 12 12 a. Encontre a amplitude de cada software. Que inconveniente tem esta medida para expressar a variabilidade de uma amostra? AA = 17 − 10 = 7 AB = 15 − 10 = 5 AC = 14 − 10 = 4 AD = 12 − 12 = 0 A amplitude é influenciada por valores extremos, pois envolve apenas o valor mínimo e máximo da amostra. Considerar apenas os valores extremos da amostra pode não retratar a real variabilidade do conjunto de dados. b. Encontre a variância e o desvio padrão de cada software. A variância é dada por ∑ ∑ ou por ∑ O desvio padrão é dado pela raiz quadrada da variância. Sendo assim, podem-se estimar as medidas: 6,2667 e 2,5033 ! 4,5667 e ! 2,1667 $ 2,1667 e $ 1,4720 % 0 e % 0 c. Qual software teve tempo mais variável: B ou C? Que medida estatística você usou para comparar a variabilidade? Justifique; O software B apresentou tempo mais variável. A medida estatística utilizada para a variabilidade foi o desvio padrão, pois esta é uma medida da variabilidade absoluta dos dados em torno da média e a unidade do desvio padrão é a mesma dos dados, sendo mais fácil de interpretar. d. Multiplique os dados do software C por 10 e calcule o desvio padrão; Multiplicando todos os dados por uma constante K o novo desvio padrão fica multiplicado por K. Sendo assim, $' ( ) $ 10 ) 1,4720 14,72 2. No Posto Agrometeorológico da seção de Climatologia Agrícola da Embrapa, em Itaguaí – RJ, foram registrados a evaporação e a insolação durante o período de 1961 à 2003. As médias mensais encontradas durante período foram as seguintes: EVAPORAÇÃO (mm) 97,9 94,1 77,4 71,3 73,4 75,5 86,2 105,9 99,2 93,6 79,6 87,3 199,1 184,3 190,6 190,9 201,6 200,6 211,1 108,1 141,1 141,1 151,1 164,4 INSOLAÇÃO (horas) Qual atributo meteorológico é mais variável? Indique e justifique a medida estatística utilizada na comparação. Para calcular a variação dos atributos meteorológicos devemos calcular o coeficiente de variação (CV) pois as unidades dos valores (atributos) são diferentes. CV = S × 100% X Para evaporação X E = 86, 7 mm S E2 = 129, 96 S E = 11, 4 Então CVE = S 11, 4 × 100 = × 100 = 13,15% X 86, 7 Para Insolação X E = 173, 6h S E2 = 1024,17 h 2 S E = 32, 0h Então CVI = S 32, 0 × 100 = × 100 = 18, 43% X 173, 6 Assim, o atributo meteorológico mais variável é a insolação, pois este apresenta maior CV. 3. A distribuição de freqüência dos pesos, em Kg, de uma amostra de 60 estudantes é a seguinte: CLASSES FREQÜÊNCIAS [50 ; 56) 3 [56 ; 62) 13 [62 ; 68) 28 [68 ; 74) 14 [74 ; 80) 2 Calcule a média, o desvio padrão e o coeficiente de variação. Interprete. n X= ∑fX i =1 n i ∑f i =1 Variância i i = 3 × 53 + 13 × 59 + 28 × 65 + 14 × 71 + 2 × 77 3894 = = 64,9kg 60 60 n S 2 ∑ f (X = i =1 i i −X) n ∑ f −1 i =1 2 3 ( 53 − 64,9) + 13 ( 59 − 64,9) + 28 ( 65 − 64,9) + 14 ( 71 − 64,9) + 2 ( 77 − 64,9) = 60 2 2 2 2 i 1691,4 = 28,67kg 2 59 = Desvio Padrão S = S 2 = 28, 67 = 5,35kg Coeficiente de variação CV = 5,35 S × 100 = ×100 = 8, 2% X 64,9 4. As notas finais de estatística para alunos de um determinado curso foram as seguintes: 7,5,4,5,6,3,8,4,5,4,6,4,5,6,4,6,6,3,8,4,5,4,5,5 e 6. a. Determine a mediana, a média e o desvio padrão. +, ∑ ∑ ∑ 5,12 * - . 2 / 01 5 e √ , então, 1,7766 e 1,3329 b. Multiplique cada um dos dados por 1,21 e determine as novas medidas que foram pedidas na letra (a). 4 ( 1,21 ) 5,12 6,1952 ′ +,' (+, 1,21 ) 5 6,05 ' ( ) 1,21 ) 1,3329 1,6128 c. Some a cada um dos dados o valor 1,35 e determine as novas medidas que foram pedidas na letra (a). 4 6 ( 5,12 . 1,35 6,47 ′ 2 +,' (.+, 1,35 . 5 6,35 Somando ou subtraindo uma constante K aos dados o desvio padrão não se altera, logo, ' 1,3329 d. Separe o conjunto de dados original em dois grupos denominados “aprovados” com notas pelo menos igual a 5, e “reprovados” para os demais. Compare a variância desses dois grupos. Aprovados: o aluno será aprovado se obtiver notas 7 5, são eles: 7,5, 5,6, 8, 5, 6, 5,6, 6,6, 8, 5, 5,5, 6 Reprovados: o aluno será reprovado se obtiver notas 8 5, são eles: 4, 3, 4, 4, 4, 4, 3, 4, 4. Fazendo para aprovados e 9 para reprovados temos: 0,1944 e 9 1,05 Observe que a variância do grupo “reprovados” é muito menor, o que indica dados mais homogêneos. Note que para os alunos reprovados, só foram registradas notas 3 ou 4.