Universidade Federal do Paraná - Departamento de Estatı́stica Projeto de Extensão Estatı́stica com Recursos Computacionais Lista de Exercı́cios: Capı́tulo 1 1. Consideremos a amostra constituı́da pelo nº de irmãos de 20 alunos de uma determinada turma: 1 1 2 1 0 3 4 2 3 1 0 2 1 1 0 1 1 0 3 2 Construir a tabela de distribuição de freqüências composta por: freqüências absolutas, freqüências relativas e freqüências acumuladas. 2. A lista do número de irmãos dos alunos da turma H do 9º ano é a seguinte: 1 0 1 2 1 1 1 3 0 4 0 1 1 4 2 3 2 1 3 1 2 1 2 1 2 3 Utilizando os dados acima construa: a. Uma tabela de distribuição de freqüências. b. Um gráfico de barras. 3. Com os dados da tabela abaixo construa um gráfico de setores e um gráfico de barras para o conjunto de dados. Categoria profissional dos funcionários de uma Escola Secundária Classes Freqüência absoluta Freqüência relativa Auxiliar de Ação Educativa 20 0,47 Administrativo 12 0,29 Técnico de Ação Social 7 0,17 Operário 3 0,07 Total: 42 1,00 4. Tendo-se decidido registar os pesos dos alunos de uma determinada turma prática do 10º ano, obtiveram-se os seguintes valores (em kg): 52 56 62 54 52 51 60 61 56 55 56 54 57 67 61 49. a. Determine os quartis. 1 b. Um aluno com o peso de 61 kg, pode ser considerado ”normal”, isto é nem demasiado magro, nem demasiado obeso? 5. As alturas, em centı́metros, dos alunos de uma turma do 10º ano são as seguintes: 150 169 174 155 165 170 172 152 158 163 158 166 158 166 170 171 162 171 161 154 168 161 164 166 164 162 156 167 a. Construa a tabela de distribuição de frequências para os dados acima. b. Represente graficamente os dados, utilizando o tipo de gráfico que achar mais conveniente. 6. Na 2ª classe de certa escola o professor deu uma tarefa constituı́da por um certo número de contas para os alunos resolverem. Pretendendo determinar a dispersão dos tempos de cálculo, observam-se 10 alunos durante a realização da tarefa, tendose obtido os valores abaixo, calcule: Aluno Tempo (minutos) 1 13 2 15 3 14 4 18 5 25 6 14 7 16 8 17 9 20 10 17 total: 169 a. As medidas de tendência central e de variabilidade para a variável tempo de cálculo. b. Faça um box-plot. 7. (Exatas/Tecnológicas) Os dados abaixo representam 30 leituras de temperatura em graus Celsius de um pasteurizador de leite. 74,8 74,0 74,7 73,8 74,4 74,8 73,6 75,3 73,4 73,2 76,5 75,6 76,3 74,1 76,0 74,7 74,3 74,9 77,0 72,9 74,6 75,1 74,5 74,6 74,8 76,2 74,7 76,0 77,3 74,3 2 a. Construa uma tabela de freqüências. b. Com base na tabela do item a, calcule as medidas de tendência central e de variabilidade. 8. Considere as notas finais, relativas aos alunos de três turmas representada na tabela abaixo. Qual a turma onde as notas variaram menos? Notas dos alunos das turmas A, B e C Turma Notas dos Alunos A 4,0 5,0 5,0 6,5 6,0 7,0 5,0 7,0 8,0 B 1,0 2,0 4,0 6,0 6,0 9,0 10,0 10,0 C 2,0 6,5 7,5 8,0 5,5 7,0 9,5 9. (Humanas) As taxas de juros recebidas por 10 ações, em porcentagem, durante um certo perı́odo foram: 2,59 2,64 2,60 2,62 2,57 2,55 2,61 2,50 2,63 2,64 Calcule a média, a mediana e o desvio padrão. 10. (Humanas) Quer se estudar o número de erros de impressão de um livro. Para isso escolheu-se uma amostra de 50 páginas, encontrando-se o número de erros por páginas da tabela abaixo: a. Qual o número médio de erros por páginas? b. E o número mediano? c. Qual é o desvio padrão? d. Faça uma representação gráfica para a distribuição. e. Se o livro tem 500 páginas, qual o número total de erros esperado no livro? Erros 0 1 2 3 4 Frequência 25 20 3 1 1 11. (Humanas) Numa pesquisa realizada com 100 famı́lias, levantaram-se as seguintes informações: a. Qual a mediana do número de filhos? 3 b. Calcule a moda e interprete. c. Calcule a média e o desvio padrão. Número de filhos Frequência de Famı́lias 0 1 2 3 4 5 17 20 28 19 7 4 6 5 12. (Biológicas) Estudando-se o consumo diário de leite, verificou-se que, em certa região, 20% das famı́lias consomem até um litro, 50% consomem entre um e dois litros, 20% entre dois e três litros e o restante consome entre três e cinco litros. Para a variável em estudo: a. Escreva as informações acima na forma de uma tabela de freqüências. b. Construa o histograma. c. Calcule a média e a mediana. d. Calcule a variância e o desvio padrão. e. Calcule o valor do primeiro quartil e interprete. 13. (Biológicas) O apgar é um escore usado para avaliar reflexos de bebês recém-nascidos. Cada bebê é avaliado por um médico, a escala são valores inteiros de 0 a 10. Uma amostra de 1000 bebês em um certo paı́s foi avaliada: Escore 0 1 Número de bêbes 1 3 2 3 2 4 4 5 6 7 25 35 198 367 8 9 216 131 10 18 Calcule o 1º, 2º e 3º quartil, a moda, a mediana e o desvio padrão do apgar. 14. (Exatas/Tecnológicas) 16 estudantes mediram circunferência de uma bolas de tênis por diferentes métodos: Método A: Medição subjetiva, ou seja, a olho. Método B: Medição com uma régua. Método C: Medição apenas com a fita métrica. Os resultados foram os seguintes: Método A: 18 18 18 20 22 22 22,5 23 24 24 25 25 25 25 26 26 Método B: 18,8 18,9 18,9 19,6 20,1 20,4 20,4 20,4 20,4 20,5 21,2 22 22 22 22 23,6 Método C: 20 20 20 20,2 20,5 20,5 20,7 20,7 20,7 20,7 21 21,1 21,5 21,6 22,1 22,3 a. Calcule a média de cada um dos métodos. b. Calcule a mediana para cada método. 4 c. Calcule o primeiro e terceiro quartil para cada método. d. Calcule o desvio padrão das medidas de cada método. e. Qual método tem o maior desvio padrão? f. Calcule o coeficiente de variação. 15. (Exatas/Tecnológicas) Como parte de um estudo para melhorar o controle da qualidade de uma linha de produção, o peso (em onças) de 25 barras de sabão são medidos. Os resultados são os seguintes: 11,6 12,6 12,7 12,8 13,1 13,3 13,6 13,7 13,8 14,1 14,3 14,3 14,6 14,8 15,1 15,2 15,6 15,6 15,7 15,8 15,8 15,9 15,9 16,1 16,2 a. Construa um histograma para os dados. b. Construa o gráfico box-plot e responda se há outliers nesses dados. 16. (Humanas) A seguir está uma lista de número de sites com conteúdos considerados violentos, preconceituosos e de apologia às drogas em cada um dos 50 estados dos Estados Unidos em abril de 1995. Os dados são do livro The World Almanac and Book of facts 1996. 1 2 3 4 4 5 6 8 8 9 10 10 10 11 11 11 12 12 12 12 13 13 14 15 16 17 17 18 18 19 19 20 22 23 24 25 29 30 33 37 38 39 40 55 58 77 81 96 102 107 a. Construa um histograma para esses dados. b. Construa um gráfico box-plot e diga se há outliers. 17. (Humanas) Para uma amostra de 15 clientes de um pequeno mercado, foram observados os seguintes montantes de vendas em Reais, ordenados em ordem crescente: 10 10 25 25 25 35 40 53 90 125 135 245 271 309 410 Para esses valores de venda obtenha a média, moda, mediana, variância e o desvio padrão. 18. (Humanas) As rentabilidades dos últimos 6 meses das carteiras de investimento A e B estão apresentadas na tabela abaixo: 5 Média Desvio padrão A 5% 9% 15% 12% 9% 6% ? ? B 6% 7% 9% 7% 6% 8% ? ? a. Ache a média e o desvio padrão das carteiras. b. Qual das carteiras tem a maior dispersão? c. Se você fosse um investidor que preferisse ter o menor risco, qual carteira você iria obter? Justifique sua resposta. 19. (Biológicas) Há certa evidência de que o aumento da quantidade de cálcio na dieta contribui para baixar a pressão. Em um experimento médico, um grupo de homens tomou um suplemento diário de cálcio, enquanto que, a um grupo de controle, foi administrado um placebo (pı́lula sem qualquer efeito). Mediu-se a pressão sistólica de todos os homens sentados, antes do inicio do tratamento e novamente após 12 semanas. As distribuições da pressão nos dois grupos deveriam ser análogas no começo do experimento. Eis os valores da pressão inicial para os dois grupos: Grupo Cálcio Grupo Placebo 107 123 110 123 129 109 112 102 112 111 98 114 107 112 136 119 112 110 102 117 130 a. Construa um histograma para cada grupo e analise se os gráficos mostram alguma diferença para os dois grupos. b. Calcule média, moda e mediana para cada grupo e interprete. c. Qual dos grupos apresentou maior variância? 20. (Biológicas) Os botânicos desenvolveram variedades de milho com uma quantidade aumentada do aminoácido lisine. Em teste da qualidade da proteı́na desse milho, um grupo experimental de 20 pintos de 1 dia foi alimentado com uma ração contendo o novo tipo de milho. Um grupo de controle, composto de outros 20 pintos, recebeu ração idêntica, com a única diferença que continha o milho normal. Eis os ganhos de peso (em gramas ) após 21 dias: Grupo Grupo Grupo Grupo Controle Controle Experimental Experimental 380 339 361 467 321 399 447 407 366 350 401 427 6 356 384 375 420 283 316 434 477 349 272 403 392 402 345 393 430 462 455 426 339 356 360 406 410 410 431 318 326 a. Calcule a média, moda e mediana dos dois grupos. b. Faça um histograma para cada grupo. Há indicação de que os pintos alimentados com o milho com alto teor de lisine tenham crescido mais depressa? c. Existe outliers ou outros problemas? Como se verifica isso? 21. (Biológicas) O quadro abaixo dá os tempos de sobrevivência, em dias de 72 porquinhos daı́ndia após injetados neles bacilos de tuberculose, em um experimento médico. Faça um gráfico adequado e descreva a forma, o centro e a dispersão da distribuição dos tempos de sobrevivência. Há outliers? 43 45 53 56 56 57 58 66 67 73 74 79 80 80 81 81 81 82 83 83 83 84 88 89 91 91 92 92 92 97 99 99 100 100 101 102 102 102 103 104 107 108 109 113 100 101 102 102 102 103 104 107 108 109 113 100 101 102 102 102 103 104 107 108 109 113 100 101 102 102 102 103 104 107 108 109 113 114 118 121 123 126 128 137 138 139 144 145 147 156 162 174 178 179 184 191 198 211 214 243 249 329 380 403 511 522 592 22. (Exatas/Tecnológicas) Liste as variáveis registradas e classifique cada variável como categórica ou quantitativa. Veı́culo Acura 2.5TL Buick Skylark Audi A8 Quatro Chysler Concorde Tipo Procedência MPG* na cidade MPG* na rodovia Compacto Estrangeira 20 25 Compacto Nacional 22 32 Médio Estrangeira 17 25 Grande Nacional 19 27 *MGP: Milha por galão. 23. (Humanas) O teste de grau de poder de leitura (DRP) é usado freqüentemente para medir a capacidade de leitura de crianças. Eis os escores de DRP de 22 alunos da 3ª série, medidos durante uma pesquisa sobre como melhorar o desempenho da leitura. 40 26 39 14 42 18 25 43 46 27 19 47 19 26 35 34 15 44 40 38 31 46 a. Faça um histograma para estes dados. b. Calcule média, moda, mediana, desvio padrão e variância, analisando cada medida. 7 24. (Exatas/Tecnológicas) Para estimar a quantidade de água que seria necessária para abastecer uma comunidade, na próxima década, o conselho dessa comunidade pediu ao prefeito que descobrisse a quantidade de água que uma amostra de famı́lia utiliza atualmente. A amostra de 15 milhões utilizou o seguinte número de galões (em milhões). 11,2 21,5 16,4 19,7 14,6 16,9 32,2 18,2 13,1 23,8 18,3 15,5 18,8 27,7 14,0 a. Qual a quantidade média de água utilizada por famı́lia? E a mediana? b. O desvio padrão e o coeficiente de variação? 25. (Humanas) O departamento de Comércio Exterior do Banco Central possui 30 funcionários com a seguinte distribuição salarial em reais: Nº de funcionários 10 12 5 3 Salários em R$ 2000,00 3600,00 4000,00 6000,00 Obtenha as medidas descritivas. 26. Considere as medidas de altura (em cm) de uma amostra de 100 indivı́duos de uma faculdade: 151 166 169 175 181 152 166 169 175 181 154 166 169 176 181 155 166 169 176 182 158 167 169 176 182 159 167 169 176 182 159 167 169 177 183 160 167 169 177 184 161 167 170 177 185 161 168 170 177 186 161 168 170 178 187 162 168 170 178 188 163 168 173 178 190 163 168 173 179 190 163 168 174 179 a. Calcule a média, a mediana e o desvio padrão para a altura. b. Calcule a amplitude total. c. Calcule o número de faixa de valores pela regra de Sturges. d. Obtenha os limites de faixas. e. As frequências relativas e as frequências acumuladas. f. Construa um histograma. 164 168 174 180 165 168 174 180 165 168 175 180 165 168 175 180 27. (Exatas/Tecnológicas) Os dados seguintes representam 20 observações relativas ao ı́ndice pluviométrico, em milı́metros de chuva, em determinado municı́pio do estado. 8 144 152 159 160 160 151 157 146 154 145 151 150 142 146 142 141 141 150 143 158 a. Determinar o número de faixas pela regra de Sturges. b. Construir a tabela de frequências absolutas simples. c. Incluir na tabela as frequências absolutas acumuladas e as frequências relativas simples e acumuladas. 28. (Exatas/Tecnológicas) Foram observados os números de erros de impressão da primeira página de um jornal durante 50 dias, obteve-se os seguintes resultados: 5 5 5 6 6 6 7 7 7 7 7 8 8 8 8 8 8 8 9 9 10 10 10 10 10 11 11 11 11 12 12 12 12 12 12 12 12 12 13 14 14 14 14 14 14 14 15 16 19 22 a. Complete a tabela de distribuição de frequências. Classes 05 ` 08 08 ` 11 11 ` 14 14 ` 17 17 ` 20 20 ` 23 Total ni fi fac 11 14 14 9 1 1 50 - Na tabela acima foi usado a formula de Sturges para criar faixas de valores? 29. Considere a seguinte tabela: Classes 2,75 ` 2,80 2,80 ` 2,85 2,85 ` 2,90 2,90 ` 2,90 2,95 ` 3,00 3,00 ` 3,05 3,05 ` 3,10 3,10 ` 3,15 3,15 ` 3,20 3,20 ` 3,25 Total Identificar os seguintes itens da tabela: 9 ni 2 3 10 11 24 14 9 8 6 3 90 a. Frequência simples absoluta da quinta faixa. b. Frequência total. c. Limite inferior da sexta faixa. d. Limite superior da quarta faixa. e. Amplitude das faixas. f. Amplitude total. 30. O desvio médio para o conjunto de dados abaixo será: Xi ni 5 2 7 3 8 5 9 4 11 2 Referências [1] Barbetta, P. A., Estatı́stica Para Curso de Engenharia e Informática, São Paulo: Editora Atlas, 2008. [2] Morettin, P. A., Estatı́stica Básica, Saraiva, 2002. [3] http://alea-estp.ine.pt/html/nocoes/html/cap3 1 i.html [4] http://alea-estp.ine.pt/html/nocoes/html/cap1 1 i.html [5] http://www.larces.uece.br/ jlcs/disciplina/discProb/curso.html 10