Lista de exercícios – n° 03 – Resolução - Probabilidade e Estatística – PRE-401 Prof. Dr. Marcelo de Paula Corrêa Medidas de Dispersão 1) As análises dos níveis de colesterol HDL (“colesterol bom”) no sangue medidos no sangue de cinco pacientes foi de 29, 55, 58, 61 e 63 mg/dL de sangue. Determine: a) o desvio médio; b) o desvio padrão; e c) a variância destas amostras. a) Portanto o DM encontrado é de 9,68. b) Uma vez que se trata de amostra usaremos a fórmula abaixo para calcular o desvio. O desvio padrão encontrado é de 13,86 c) A variância consiste de s² e portanto vale 192,2 2) Utilize a tabela dada no exercício 1 da lista de exercícios n° 01 e calcule o desvio padrão das emissões ocorridas naquele laboratório. Uma vez que se trata de amostra usaremos a fórmula abaixo para calcular o desvio. Tal que a média é 79,27 e utilizando x como ponto médio de cada classe encontra-se um valor de 6,84. 3) Prove que s = 4) Em um laboratório foram observados os seguintes níveis médios da substância W após dois conjuntos ensaios. No conjunto de ensaios A, a média foi a x = 1495 mg, e no conjunto B, b x = 1875 mg. Os desvios padrão dos respectivos conjuntos foram: sa = 280 mg e sb = 310 mg. Qual conjunto de ensaios tem maior: a) dispersão absoluta; b) dispersão relativa? (Mostre os cálculos). DA = DP Portanto, o conjunto B apresenta maior dispersão absoluta com o valor de 310 mg. Dispersão relativa do conjunto A: (280*100)/1495 = 18,73 Dispersão relativa do conjunto B: (310*100)/1875 = 16,53 Portanto, o conjunto A apresenta maior dispersão relativa. 5) A vazão medida em um rio foi de 84 litros por hora. Sabe-se que a vazão média histórica deste mesmo rio é de 76 L/h e desvio padrão de 10 L/h. Em outro rio, cuja vazão média histórica é de 82 L/h e desvio padrão 16 L/h, mediu-se uma vazão de 82 L/h. Em qual dos rios a vazão relativa foi mais elevada? (dica: use o escore z). z= x−µ σ 84 − 76 = 0,8 10 z1 > z2 →∴ vazão relativa maior 82 − 82 z2 = 0 = 16 z1 = 6) A média de um conjunto de dados é 100 e o desvio padrão 15. Usando o teorema de Chebyshev faça uma análise da distribuição dos valores. Se a média do conjunto é 100 e o desvio padrão é de 15. Pelo Teorema de Chebychev temos que para k desvios padrões a porcentagem de dados englobados é de (1 – (1/k²), portanto 75% dos dados estão a 2 desvios padrões da média. Ou seja, entre 70 e 130, enquanto que 89% dos dados estão a 3 desvios padrões da média. Isto é, entre 55 e 145. 7) O IMC medido em um grupo de 40 mulheres teve desvio padrão de 6,17. Deste conjunto, foram retiradas aleatoriamente as seguintes amostras de IMC: 19,6 23,8 19,6 29,1 25,2 21,4 22 27,5 33,5 20,6 29,9 17,7 24 28,9 37,7 O desvio padrão desta amostra está razoavelmente próximo do desvio padrão da população? Sim, o valor encontrado para o desvio padrão da amostra é de 5,66 que está razoavelmente próximo de 6,17. 8) Calcule o índice de assimetria de Pearson para a distribuição do exercício 7. MÉDIA = 25,37 MEDIANA = 27,5 DESVIO PADRÃO = 5,66 IAP = -1,13 como IAP ≤ -1,00 os dados podem ser considerados significativamente assimétricos. 9) Considere uma população composta dos valores 3, 6 e 9. Suponha que amostras de dois valores sejam selecionadas aleatoriamente com reposição. a) Ache a variância σ 2 da população {3, 6, 9}. A variância é dada pelo quadrado do desvio padrão e é igual a 6. b) Liste as nove diferentes possíveis amostras de dois valores selecionados com reposição e a seguir ache a variância amostral s2 para cada uma delas. Se você seleciona repetidamente dois valores amostrais, qual é o valor médio da variância amostral? Amostras s² 1 3 3 0 2 3 6 4,5 3 3 9 18 4 5 6 7 8 9 6 6 6 9 9 9 3 6 9 3 6 9 4,5 0 4,5 18 4,5 0 A média das variâncias amostrais é 6, contudo o valor mais apresentado de variância é o de 4,5. c) Para cada uma das nove amostras, ache a variância considerando cada amostra como se fosse uma população (certifique-se de usar a fórmula para σ 2 ). Se você seleciona repetidamente dois valores amostrais, qual é o valor médio das variâncias populacionais? População σ² 1 2 3 4 5 6 7 8 9 3 3 3 6 6 6 9 9 9 3 6 9 3 6 9 3 6 9 0 2,25 9 2,25 0 2,25 9 2,25 0 A média das variâncias amostrais é 3, contudo o valor mais apresentado de variância é o de 2,25. d) Qual abordagem resulta em valores que são melhores estimativas deσ 2: parte (b) ou parte (c) ? Por quê? Ao calcular variâncias de amostras, devemos dividir por n ou por n –1? Sim, pois tratamos como amostras para inferência de uma determinada população. n–1 e) As partes precedentes mostram que s2 é um estimador não-viesado de σ2. E s é um estimador não-viesado de σ? Sim. A s2 é um estimador não viesado de σ2 pois a média das médias amostrais resulta no parâmetro populacional em questão. Se calcularmos o desvio padrão da pop, temos σ = 3. Porém se usamos a mesma técnica o item b para calcularmos s, teremos s = 1,89. Ou seja, uma subestimativa do parâmetro populacional. 10) Dada a tabela com os níveis ordenados de cotinina medidos em 40 fumantes, determine: 0 1 1 3 17 32 35 44 48 86 87 103 112 121 123 130 131 149 164 167 173 173 198 208 210 222 227 234 245 250 253 265 266 277 284 289 290 313 477 491 a) O valor do 68° percentil b) O intervalo interquartílico c) O ponto médio dos quartis d) O intervalo percentílico e) P50 = Q2? Caso sim, P50 = Q2? a) Ri = 27,88 que está entre os valores da casa 27 e 28. Por interpolação encontra-se o valor de 233,16 Pelo excel, obtém-se: =PERCENTIL(H1:H40;0.68) = 230,64 b) Pelo statdisk: 1st Quartile: 86.5 2nd Quartile: 170 3rd Quartile: 251.5 intervalo interquartílico Q3 – Q1 = 165,0 c) Q1+Q3/2 = 165/2 = 82,5 d) Faltaram dados no enunciado. O correto seria intervalo percentílico 10-90. Ou seja, P90 – P10 = 289,1 – 15,6 = 273,5 (pelo Excel) e) Sim, são iguais e o seu valor é de 170.