Lista de exercícios – n° 03 – Resolução - Probabilidade e Estatística – PRE-401
Prof. Dr. Marcelo de Paula Corrêa
Medidas de Dispersão
1) As análises dos níveis de colesterol HDL (“colesterol bom”) no sangue medidos no
sangue de cinco pacientes foi de 29, 55, 58, 61 e 63 mg/dL de sangue. Determine: a) o
desvio médio; b) o desvio padrão; e c) a variância destas amostras.
a) Portanto o DM encontrado é de 9,68.
b) Uma vez que se trata de amostra usaremos a fórmula abaixo para calcular o desvio.
O desvio padrão encontrado é de 13,86
c) A variância consiste de s² e portanto vale 192,2
2) Utilize a tabela dada no exercício 1 da lista de exercícios n° 01 e calcule o desvio
padrão das emissões ocorridas naquele laboratório.
Uma vez que se trata de amostra usaremos a fórmula abaixo para calcular o desvio.
Tal que a média é 79,27 e utilizando x como ponto médio de cada classe encontra-se um
valor de 6,84.
3) Prove que s =
4) Em um laboratório foram observados os seguintes níveis médios da substância W
após dois conjuntos ensaios. No conjunto de ensaios A, a média foi a x = 1495 mg, e no
conjunto B, b x = 1875 mg. Os desvios padrão dos respectivos conjuntos foram: sa =
280 mg e sb = 310 mg. Qual conjunto de ensaios tem maior: a) dispersão absoluta; b)
dispersão relativa? (Mostre os cálculos).
DA = DP
Portanto, o conjunto B apresenta maior dispersão absoluta com o valor de 310 mg.
Dispersão relativa do conjunto A: (280*100)/1495 = 18,73
Dispersão relativa do conjunto B: (310*100)/1875 = 16,53
Portanto, o conjunto A apresenta maior dispersão relativa.
5) A vazão medida em um rio foi de 84 litros por hora. Sabe-se que a vazão média
histórica deste mesmo rio é de 76 L/h e desvio padrão de 10 L/h. Em outro rio, cuja
vazão média histórica é de 82 L/h e desvio padrão 16 L/h, mediu-se uma vazão de 82
L/h. Em qual dos rios a vazão relativa foi mais elevada? (dica: use o escore z).
z=
x−µ
σ
84 − 76

= 0,8

10
 z1 > z2 →∴ vazão relativa maior
82 − 82
z2 = 0 
=

16
z1
=
6) A média de um conjunto de dados é 100 e o desvio padrão 15. Usando o teorema de
Chebyshev faça uma análise da distribuição dos valores.
Se a média do conjunto é 100 e o desvio padrão é de 15. Pelo Teorema de
Chebychev temos que para k desvios padrões a porcentagem de dados englobados é de
(1 – (1/k²), portanto 75% dos dados estão a 2 desvios padrões da média. Ou seja, entre
70 e 130, enquanto que 89% dos dados estão a 3 desvios padrões da média. Isto é, entre
55 e 145.
7) O IMC medido em um grupo de 40 mulheres teve desvio padrão de 6,17. Deste
conjunto, foram retiradas aleatoriamente as seguintes amostras de IMC:
19,6
23,8
19,6
29,1
25,2
21,4
22
27,5
33,5
20,6
29,9
17,7
24
28,9
37,7
O desvio padrão desta amostra está razoavelmente próximo do desvio padrão da
população?
Sim, o valor encontrado para o desvio padrão da amostra é de 5,66 que está
razoavelmente próximo de 6,17.
8) Calcule o índice de assimetria de Pearson para a distribuição do exercício 7.
MÉDIA = 25,37
MEDIANA = 27,5
DESVIO PADRÃO = 5,66
IAP = -1,13 como IAP ≤ -1,00 os dados podem ser considerados significativamente
assimétricos.
9) Considere uma população composta dos valores 3, 6 e 9. Suponha que amostras de
dois valores sejam selecionadas aleatoriamente com reposição.
a) Ache a variância σ 2 da população {3, 6, 9}.
A variância é dada pelo quadrado do desvio padrão e é igual a 6.
b) Liste as nove diferentes possíveis amostras de dois valores selecionados com
reposição e a seguir ache a variância amostral s2 para cada uma delas. Se você seleciona
repetidamente dois valores amostrais, qual é o valor médio da variância amostral?
Amostras
s²
1
3
3
0
2
3
6
4,5
3
3
9
18
4
5
6
7
8
9
6
6
6
9
9
9
3
6
9
3
6
9
4,5
0
4,5
18
4,5
0
A média das variâncias amostrais é 6, contudo o valor mais apresentado de
variância é o de 4,5.
c) Para cada uma das nove amostras, ache a variância considerando cada amostra como
se fosse uma população (certifique-se de usar a fórmula para
σ
2
). Se você seleciona
repetidamente dois valores amostrais, qual é o valor médio das variâncias
populacionais?
População
σ²
1
2
3
4
5
6
7
8
9
3
3
3
6
6
6
9
9
9
3
6
9
3
6
9
3
6
9
0
2,25
9
2,25
0
2,25
9
2,25
0
A média das variâncias amostrais é 3, contudo o valor mais apresentado de
variância é o de 2,25.
d) Qual abordagem resulta em valores que são melhores estimativas deσ 2: parte (b) ou
parte (c) ? Por quê? Ao calcular variâncias de amostras, devemos dividir por n ou por n
–1?
Sim, pois tratamos como amostras para inferência de uma determinada população.
n–1
e) As partes precedentes mostram que s2 é um estimador não-viesado de σ2. E s é um
estimador não-viesado de σ?
Sim. A s2 é um estimador não viesado de σ2 pois a média das médias amostrais resulta
no parâmetro populacional em questão. Se calcularmos o desvio padrão da pop, temos σ
= 3. Porém se usamos a mesma técnica o item b para calcularmos s, teremos s = 1,89.
Ou seja, uma subestimativa do parâmetro populacional.
10) Dada a tabela com os níveis ordenados de cotinina medidos em 40 fumantes,
determine:
0
1
1
3
17
32
35
44
48
86
87
103
112
121
123
130
131
149
164
167
173
173
198
208
210
222
227
234
245
250
253
265
266
277
284
289
290
313
477
491
a) O valor do 68° percentil b) O intervalo interquartílico c) O ponto médio dos quartis
d) O intervalo percentílico e) P50 = Q2? Caso sim, P50 = Q2?
a) Ri = 27,88 que está entre os valores da casa 27 e 28. Por interpolação
encontra-se o valor de 233,16
Pelo excel, obtém-se: =PERCENTIL(H1:H40;0.68) = 230,64
b) Pelo statdisk:
1st Quartile: 86.5
2nd Quartile: 170
3rd Quartile: 251.5
intervalo interquartílico  Q3 – Q1 = 165,0
c) Q1+Q3/2 = 165/2 = 82,5
d) Faltaram dados no enunciado. O correto seria intervalo percentílico 10-90. Ou
seja, P90 – P10 = 289,1 – 15,6 = 273,5 (pelo Excel)
e) Sim, são iguais e o seu valor é de 170.
Download

Gabarito L3 - Marcelo de Paula Corrêa