Estatística 1 - 1º Semestre 2015
Lista de Exercícios 2 - 19/05/2015
Professores: Estela Maris e José Carlos Fogo
1) Um órgão do governo do estado está interessado em determinar padrões sobre investimento em educação, por habitante,
realizado pelas prefeituras. De um levantamento em 10 cidades, foram obtidos os seguintes valores (codificados):
Cidade
A
B
C
D
E
F
G
H
I
J
Investimento
20
14
18
16
19
16
15
18
19
14
Determine e interprete:
a) O valor da moda, a mediana, o valor médio, a média geométrica e a média harmônica.
b) O coeficiente de variação.
2) Considere os dados das notas do teste verbal de 87 alunos como seleção para entrarem numa universidade americana.
2.5
2.8
2.8
3.2
3.5
3.6
3.7
3.8
3.9
4.0
4.1
4.1
4.1
4.1
4.2
4.5
4.6
4.7
4.7
4.7
4.7
4.8
4.8
4.9
4.9
5.0
5.0
5.1
5.1
5.1
5.2
5.2
5.2
5.2
5.2
5.3
5.3
5.3
5.3
5.4
5.4
5.4
5.4
5.5
5.5
5.5
5.6
5.7
5.7
5.8
5.9
5.9
5.9
5.9
6.0
6.1
6.1
6.1
6.1
6.2
6.2
6.2
6.3
6.4
6.4
6.4
6.4
6.5
6.5
6.5
6.5
6.5
6.6
6.6
6.7
6.7
6.7
6.7
6.8
6.9
6.9
7.0
7.0
7.1
7.2
7.3
7.5
a) Faça a distribuição de frequências e o respectivo histograma. Comente sobre a simetria dos dados.
b) Calcule as medidas de posição e dispersão, bem como as médias geométrica e harmônica. Comente.
c) Calcule a média aparada com trim = 0.10 e trim = 0.05. Compare com as medidas anteriores.
d) Dê o coeficiente de variação e classifique a amostra quanto a homogeneidade dos dados.
e) Construa o box-plot. Comente.
f) Calcule a medida de skewness amostral nas três versões apresentadas pelo software R. Você acha razoável o valor obtido
em função do comentário feito no item (a)?
g) Calcule a curtose amostral e compare com a curva padrão (curtose igual a zero).
3) Considere as variáveis tempo para chegar na UFSCar (min) e idade (anos completos) do conjunto de dados dos alunos
das turmas A e B de Estatística 1.
a) Construa box-plot’s lado-a-lado das duas variáveis para cada turma.
b) Calcule a média aparada para as duas variáveis excluindo os 10% maiores e 10% menores valores.
c) Calcule as medidas de skewness e curtose para cada turma.
d) Compare as duas turmas em função dos resultados obtidos.
4) Considere uma amostra x1, x2, …, xn. Mostre que a medida de skewness amostral pode ser escrita na forma:
b1 
1
n
 xi3  nx 3  3(n  1) x s 2
s3
e, consequentemente: b1 
1   xi3
n
3(n  1) 

 3 
.
3
n  s
cv 
(cv)
5) Uma indústria multinacional faz um levantamento das seguintes variáveis com seus gerentes: hobby, quantas vezes
pratica esporte por semana, categoria de hotel em que se hospeda e tempo semanal com leitura de jornais e revistas.
Os resultados do tempo de leitura, em h/sem, de 28 funcionários são dados abaixo:
i) Ache a média e a mediana a moda. Qual representa melhor o tempo de leitura? Justifique.
ii) Calcule o coeficiente de variação e classifique os dados quanto à dispersão.
iii) Calcule a medida de assimetria e de curtose amostrais e comente os resultados.
iv) Se os funcionários dobrarem os tempos de leitura, como são afetadas as medidas de assimetria e curtose?
1,2
1,3
1,3
1,3
1,5
1,6
1,7
1,8
2.0
2,1
2,2
2,3
2,5
2,5
2,7
2,9
3,2
3,6
3,6
4,3
4,5
4,7
4,8
5,8
6,5
8,7
10,7
11,2
6) Considere os dados Os dados abaixo representam os pesos (gramas) de 30 cobaias com 45 dias de vida.
36.7 38.2 37.3 41.0 43.0 62.8 81.4 24.3 41.7 53.6 39.6 65.4 58.4 73.5 36.3
29.3 28.2 84.5 52.8 54.1 77.7 46.5 38.8 51.2 42.6 27.8 55.4 49.0 50.9 40.7
a) Agrupar os dados numa tabela de frequências e construir o histograma;
b) Calcule a media aparada a 16%. Quantos valores foram excluídos nas caudas inferior e superior?
c) Calcule as medidas e assimetria e curtose amostrais e comente.
d) Você acha necessário utilizar a média aparada para representar esses dados? Por que?
7) Um índice de inflação fictício construído pelos alunos de Estatística 1 do curso de Bacharelado em Estatística da UFSCar
considera no seu cálculo gastos com saúde, alimentação, transportes, higiene+limpeza, água+luz, aluguéis e lazer com,
respectivamente, os seguintes pesos: 0.20, 0.25, 0.12, 0.10, 0.08, 0.18 e 0.07.
a) Se nos últimos três meses, os índices de aumento de cada item foram, receptivamente: 5.5%, 8.0%, 10.0%, 4.0%, 7.5%,
5.0% e 2.4%, qual foi o índice de inflação no período?
b) Supondo que os aumentos foram mascados em 75% do real valor, como o verdadeiro índice foi afetado?
8) Os dados apresentados abaixo representam as notas obtidas em 4 testes aplicados na mesma turma, em tempos diferentes.
O objetivo aqui é verificar se os métodos tendem a avaliar de forma diferente.
a) Faça uma representação das notas em box-plot. Você diria que as notas dos alunos para os 4 métodos parecem apresentam
comportamento distinto?
b) Encontre os coeficientes de assimetria e curtose amostrais e compare os resultados.
c) Assumindo pesos 0.14, 0.25,0.40 e 0.21 para cada método, respectivamente, encontre a média ponderada.
d) Qual método mais se distancia da média ponderada? Qual o que menos se distância?
alunos
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
método 1
0.71
0.61
0.72
0.83
0.92
1.16
1.26
1.53
1.53
2.16
2.79
3.60
4.86
5.58
6.03
6.93
7.74
9.54
10.0
10.0
10.0
método 2
0.63
0.69
0.77
0.80
1.00
1.30
1.38
1.59
2.07
2.43
3.42
4.32
5.04
5.85
6.39
7.74
8.91
10.0
10.0
10.0
10.0
método 3
0.85
0.92
0.92
1.00
1.24
1.45
1.86
1.83
2.34
2.70
3.69
4.32
5.04
6.57
6.93
7.83
8.28
9.54
10.0
10.0
10.0
método 4
0.44
0.55
0.60
0.77
1.00
1.25
1.56
1.86
2.25
2.25
3.60
4.05
4.41
5.31
5.85
6.12
6.84
8.73
8.91
9.99
10.0
9) Um pesquisador contou o número de ervilhas por vagem em 60 vagens coletadas aleatoriamente numa plantação, tendo
obtido a seguinte distribuição:
Ervilhas por vagem
Freq.
1
2
2
4
3
21
4
18
5
10
6
4
7
1
a) Complete a tabela de frequências relativas.
b) Sugira um procedimento para obter
 xi
;
 xi2
e
 xi3 .
c) Com isso, obtenha a média, variância, o skewness e o coeficiente de variação amostrais?
d) Comente sobre a simetria e dispersão dos dados.
e) Encontre as médias aparadas a 15% e a 30%.
10) A tabela abaixo mostra a distribuição de frequências da elasticidade da madeira (milhões de psi) de uma variedade de
pinheiro do sudeste dos USA.
a) Com a tabela de frequências, calcule a média e o desvio padrão.
b) Calcule a media e os quartis.
c) Encontre as medidas de assimetria e curtose
d) Comente.
Elasticidade (milhões de psi)
0.4 |--- 0.6
0.6 |--- 0.8
0.8 |--- 1.0
1.0 |--- 1.2
1.2 |--- 1.4
1.4 |--- 1.6
1.6 |--- 1.8
Total
ni
1
5
15
28
22
7
1
79
11) A tabela representa os dados de um estudo sobre a participação de famílias na coleta seletiva de lixo.
Colabora com a coleta seletiva
Grau de instrução do chefe da família
SIM
NÃO
Primeiro grau incompleto
9
10
Primeiro grau completo
16
15
Segundo grau completo
30
22
Superior incompleto
13
19
Superior completo
26
27
a) Quantas famílias foram entrevistadas?
b) Classifique as variáveis da tabela.
c) Calcule os perfis coluna, ou seja, os percentuais em relação às categoria de colaboração e construa um gráfico
comparativo.
d) Comente.
12) Uma empresa de marketing tentando melhorar a imagem de um produto veiculou uma campanha publicitária ao final da
qual foi medido o desempenho das vendas. Os dados estão representados abaixo.
Vendas (mil R$)
Frequência
07 |---- 09
4
09 |---- 11
8
11 |---- 13
10
13 |---- 15
12
15 |---- 17
6
a)
b)
c)
d)
Encontre a média mediana e moda de Czuber.
Calcule o desvio-padrão e os quartis.
Construa o box-plot. Comente sobre a simetria da dostribuição.
Sabendo que a campanha foi um sucesso, desejou-se saber se as vendas estão sendo consistente. Para tanto, adotou-se o
seguinte critério: se o total de vendas abaixo de ( x  1.5s ) e acima de ( x  1.5s ) não exceder 14%, então está havendo
consistência nas vendas. Verifique se há consistência encontrando o percentual das vendas abaixo e acima destes
limites.
13) A tabela abaixo representa a distribuição do salário dos funcionários da Companhia MB Empreendimentos Imobiliários.
Salário
ni
4 |---- 8
10
8 |---- 12
12
12 |---- 16
8
16 |---- 20
5
20 |---- 24
1
a)
b)
c)
d)
e)
Faça o histograma.
Encontre a média, a mediana e a a moda de Czuber. Compare as medidas.
Calcule a variância e o intervalo interquartil.
Calcule os coeficientes de assimetria e curtose.
Analise a distribuição dos dados quanto à simetria e variabilidade.
* Utilize o
R
na resolução da lista.
Download

Lista de exercícios 2 - Universidade Federal de São Carlos