Estatística 1 - 1º Semestre 2015 Lista de Exercícios 2 - 19/05/2015 Professores: Estela Maris e José Carlos Fogo 1) Um órgão do governo do estado está interessado em determinar padrões sobre investimento em educação, por habitante, realizado pelas prefeituras. De um levantamento em 10 cidades, foram obtidos os seguintes valores (codificados): Cidade A B C D E F G H I J Investimento 20 14 18 16 19 16 15 18 19 14 Determine e interprete: a) O valor da moda, a mediana, o valor médio, a média geométrica e a média harmônica. b) O coeficiente de variação. 2) Considere os dados das notas do teste verbal de 87 alunos como seleção para entrarem numa universidade americana. 2.5 2.8 2.8 3.2 3.5 3.6 3.7 3.8 3.9 4.0 4.1 4.1 4.1 4.1 4.2 4.5 4.6 4.7 4.7 4.7 4.7 4.8 4.8 4.9 4.9 5.0 5.0 5.1 5.1 5.1 5.2 5.2 5.2 5.2 5.2 5.3 5.3 5.3 5.3 5.4 5.4 5.4 5.4 5.5 5.5 5.5 5.6 5.7 5.7 5.8 5.9 5.9 5.9 5.9 6.0 6.1 6.1 6.1 6.1 6.2 6.2 6.2 6.3 6.4 6.4 6.4 6.4 6.5 6.5 6.5 6.5 6.5 6.6 6.6 6.7 6.7 6.7 6.7 6.8 6.9 6.9 7.0 7.0 7.1 7.2 7.3 7.5 a) Faça a distribuição de frequências e o respectivo histograma. Comente sobre a simetria dos dados. b) Calcule as medidas de posição e dispersão, bem como as médias geométrica e harmônica. Comente. c) Calcule a média aparada com trim = 0.10 e trim = 0.05. Compare com as medidas anteriores. d) Dê o coeficiente de variação e classifique a amostra quanto a homogeneidade dos dados. e) Construa o box-plot. Comente. f) Calcule a medida de skewness amostral nas três versões apresentadas pelo software R. Você acha razoável o valor obtido em função do comentário feito no item (a)? g) Calcule a curtose amostral e compare com a curva padrão (curtose igual a zero). 3) Considere as variáveis tempo para chegar na UFSCar (min) e idade (anos completos) do conjunto de dados dos alunos das turmas A e B de Estatística 1. a) Construa box-plot’s lado-a-lado das duas variáveis para cada turma. b) Calcule a média aparada para as duas variáveis excluindo os 10% maiores e 10% menores valores. c) Calcule as medidas de skewness e curtose para cada turma. d) Compare as duas turmas em função dos resultados obtidos. 4) Considere uma amostra x1, x2, …, xn. Mostre que a medida de skewness amostral pode ser escrita na forma: b1 1 n xi3 nx 3 3(n 1) x s 2 s3 e, consequentemente: b1 1 xi3 n 3(n 1) 3 . 3 n s cv (cv) 5) Uma indústria multinacional faz um levantamento das seguintes variáveis com seus gerentes: hobby, quantas vezes pratica esporte por semana, categoria de hotel em que se hospeda e tempo semanal com leitura de jornais e revistas. Os resultados do tempo de leitura, em h/sem, de 28 funcionários são dados abaixo: i) Ache a média e a mediana a moda. Qual representa melhor o tempo de leitura? Justifique. ii) Calcule o coeficiente de variação e classifique os dados quanto à dispersão. iii) Calcule a medida de assimetria e de curtose amostrais e comente os resultados. iv) Se os funcionários dobrarem os tempos de leitura, como são afetadas as medidas de assimetria e curtose? 1,2 1,3 1,3 1,3 1,5 1,6 1,7 1,8 2.0 2,1 2,2 2,3 2,5 2,5 2,7 2,9 3,2 3,6 3,6 4,3 4,5 4,7 4,8 5,8 6,5 8,7 10,7 11,2 6) Considere os dados Os dados abaixo representam os pesos (gramas) de 30 cobaias com 45 dias de vida. 36.7 38.2 37.3 41.0 43.0 62.8 81.4 24.3 41.7 53.6 39.6 65.4 58.4 73.5 36.3 29.3 28.2 84.5 52.8 54.1 77.7 46.5 38.8 51.2 42.6 27.8 55.4 49.0 50.9 40.7 a) Agrupar os dados numa tabela de frequências e construir o histograma; b) Calcule a media aparada a 16%. Quantos valores foram excluídos nas caudas inferior e superior? c) Calcule as medidas e assimetria e curtose amostrais e comente. d) Você acha necessário utilizar a média aparada para representar esses dados? Por que? 7) Um índice de inflação fictício construído pelos alunos de Estatística 1 do curso de Bacharelado em Estatística da UFSCar considera no seu cálculo gastos com saúde, alimentação, transportes, higiene+limpeza, água+luz, aluguéis e lazer com, respectivamente, os seguintes pesos: 0.20, 0.25, 0.12, 0.10, 0.08, 0.18 e 0.07. a) Se nos últimos três meses, os índices de aumento de cada item foram, receptivamente: 5.5%, 8.0%, 10.0%, 4.0%, 7.5%, 5.0% e 2.4%, qual foi o índice de inflação no período? b) Supondo que os aumentos foram mascados em 75% do real valor, como o verdadeiro índice foi afetado? 8) Os dados apresentados abaixo representam as notas obtidas em 4 testes aplicados na mesma turma, em tempos diferentes. O objetivo aqui é verificar se os métodos tendem a avaliar de forma diferente. a) Faça uma representação das notas em box-plot. Você diria que as notas dos alunos para os 4 métodos parecem apresentam comportamento distinto? b) Encontre os coeficientes de assimetria e curtose amostrais e compare os resultados. c) Assumindo pesos 0.14, 0.25,0.40 e 0.21 para cada método, respectivamente, encontre a média ponderada. d) Qual método mais se distancia da média ponderada? Qual o que menos se distância? alunos 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 método 1 0.71 0.61 0.72 0.83 0.92 1.16 1.26 1.53 1.53 2.16 2.79 3.60 4.86 5.58 6.03 6.93 7.74 9.54 10.0 10.0 10.0 método 2 0.63 0.69 0.77 0.80 1.00 1.30 1.38 1.59 2.07 2.43 3.42 4.32 5.04 5.85 6.39 7.74 8.91 10.0 10.0 10.0 10.0 método 3 0.85 0.92 0.92 1.00 1.24 1.45 1.86 1.83 2.34 2.70 3.69 4.32 5.04 6.57 6.93 7.83 8.28 9.54 10.0 10.0 10.0 método 4 0.44 0.55 0.60 0.77 1.00 1.25 1.56 1.86 2.25 2.25 3.60 4.05 4.41 5.31 5.85 6.12 6.84 8.73 8.91 9.99 10.0 9) Um pesquisador contou o número de ervilhas por vagem em 60 vagens coletadas aleatoriamente numa plantação, tendo obtido a seguinte distribuição: Ervilhas por vagem Freq. 1 2 2 4 3 21 4 18 5 10 6 4 7 1 a) Complete a tabela de frequências relativas. b) Sugira um procedimento para obter xi ; xi2 e xi3 . c) Com isso, obtenha a média, variância, o skewness e o coeficiente de variação amostrais? d) Comente sobre a simetria e dispersão dos dados. e) Encontre as médias aparadas a 15% e a 30%. 10) A tabela abaixo mostra a distribuição de frequências da elasticidade da madeira (milhões de psi) de uma variedade de pinheiro do sudeste dos USA. a) Com a tabela de frequências, calcule a média e o desvio padrão. b) Calcule a media e os quartis. c) Encontre as medidas de assimetria e curtose d) Comente. Elasticidade (milhões de psi) 0.4 |--- 0.6 0.6 |--- 0.8 0.8 |--- 1.0 1.0 |--- 1.2 1.2 |--- 1.4 1.4 |--- 1.6 1.6 |--- 1.8 Total ni 1 5 15 28 22 7 1 79 11) A tabela representa os dados de um estudo sobre a participação de famílias na coleta seletiva de lixo. Colabora com a coleta seletiva Grau de instrução do chefe da família SIM NÃO Primeiro grau incompleto 9 10 Primeiro grau completo 16 15 Segundo grau completo 30 22 Superior incompleto 13 19 Superior completo 26 27 a) Quantas famílias foram entrevistadas? b) Classifique as variáveis da tabela. c) Calcule os perfis coluna, ou seja, os percentuais em relação às categoria de colaboração e construa um gráfico comparativo. d) Comente. 12) Uma empresa de marketing tentando melhorar a imagem de um produto veiculou uma campanha publicitária ao final da qual foi medido o desempenho das vendas. Os dados estão representados abaixo. Vendas (mil R$) Frequência 07 |---- 09 4 09 |---- 11 8 11 |---- 13 10 13 |---- 15 12 15 |---- 17 6 a) b) c) d) Encontre a média mediana e moda de Czuber. Calcule o desvio-padrão e os quartis. Construa o box-plot. Comente sobre a simetria da dostribuição. Sabendo que a campanha foi um sucesso, desejou-se saber se as vendas estão sendo consistente. Para tanto, adotou-se o seguinte critério: se o total de vendas abaixo de ( x 1.5s ) e acima de ( x 1.5s ) não exceder 14%, então está havendo consistência nas vendas. Verifique se há consistência encontrando o percentual das vendas abaixo e acima destes limites. 13) A tabela abaixo representa a distribuição do salário dos funcionários da Companhia MB Empreendimentos Imobiliários. Salário ni 4 |---- 8 10 8 |---- 12 12 12 |---- 16 8 16 |---- 20 5 20 |---- 24 1 a) b) c) d) e) Faça o histograma. Encontre a média, a mediana e a a moda de Czuber. Compare as medidas. Calcule a variância e o intervalo interquartil. Calcule os coeficientes de assimetria e curtose. Analise a distribuição dos dados quanto à simetria e variabilidade. * Utilize o R na resolução da lista.