UNIVERSIDADE FEDERAL DE S€O CARLOS Centro de Ci•ncias Exatas e de Tecnologia Departamento de Estat‚stica Lista 1 – IPAEE Prof.’s Paulo/Estela/JCFogo - 01/2013 Observação: Para os exerc€cios 3, 9 e 10, identifique a unidade experimental (se poss€vel), o(s) fator(es), os tratamentos (n€veis do fator ou combina•‚o dos n€veis dos fatores) e a(s) variƒvel(eis) resposta. 1. a) b) Para resolu•‚o dos dois exerc€cios abaixo, consulte os cap€tulos 1 e 2 das notas de aula e as bibliografias indicadas que envolvem planejamento de experimentos e especifique: O problema com a formula•‚o do objetivo geral, espec€fico e da(s) hip„teses; Escolher o(s) fator(es) e seus n€veis que devem ser analisados no estudo; Escolher a(s) variƒvel(is) resposta(s) a serem analisadas e a forma como ser‚o medidas; Escolher a unidade experimental; Decidir sobre o n…mero de unidades experimentais a serem associadas a cada tratamento (n…mero de repeti•†es); Determinar (identificar) a forma como os tratamentos que ser‚o designados ‡s unidades experimentais (casualiza•‚o). Planeje um experimento para testar o efeito da aduba•‚o nitrogenada (4 n€veis) e dosagem de um determinado pesticida (3 n€veis) na produ•‚o de arroz. Planeje um experimento na sua ƒrea de pesquisa. 2. Classifique as variƒveis a seguir em: quantitativas discretas, quantitativas cont€nuas, qualitativas nominais e qualitativas ordinais. Justifique as suas respostas. a) b) c) d) e) f) g) O n…mero de cerdas abdominais em Drosophila; O tamanho da corola (tubo da flor) de Nicoriana longiflora (parente do tabaco); N…mero de gen„tipos diferentes poss€veis em um certo tipo de planta; Altura de plantas de determinada espˆcie; Atividade de fosfatase ƒcida nas hemƒcias para um tipo de gen„tipo; Pesos das sementes na planta Crinum longifolium; Conceito obtido pelo aluno numa disciplina de p„s-gradua•‚o em Genˆtica Evolutiva e Biologia Molecular da UFSCar; A cor dos olhos nas abelhas. h) 3. Um pesquisador realizou um experimento que tinha o objetivo de melhorar a qualidade do processo de formula•‚o de massa cer‰mica para pavimento. Os corpos de prova eram “biscoitos” que sa€am do processo de queima e a qualidade era avaliada por trŒs variƒveis, a saber: X1 = retra•‚o linear (%), X2 = resistŒncia mec‰nica (MPa) e X3 = absor•‚o da ƒgua (%). C = CONDI•ŽO EXPERIMENTAL O experimento foi realizado sob 8 condi•†es diferentes. Foram feitos 5 ensaios em cada uma das 8 condi•†es. Os dados s‚o apresentados abaixo: C 1 1 1 1 1 2 2 2 2 2 X1 8,9 9,2 8,0 8,7 8,7 12,6 13,6 11,6 10,1 12,1 X2 41,1 39,0 36,9 39,2 35,9 52,7 53,5 47,0 31,1 50,9 X3 5,5 4,8 6,2 5,7 5,5 0,9 0,4 1,3 1,8 1,1 C 3 3 3 3 3 4 4 4 4 4 X1 9,4 9,9 9,6 9,2 9,4 6,6 6,4 5,9 5,9 6,8 X2 50,0 48,3 50,1 49,9 56,2 31,2 25,3 22,8 27,5 31,9 X3 0,8 0,6 0,6 0,7 0,5 9,0 10,2 10,5 10,6 9,3 C 5 5 5 5 5 6 6 6 6 6 X1 13,4 13,4 13,6 13,4 12,4 9,6 10,6 8,9 7,5 8,9 X2 60,6 60,0 68,4 60,8 51,4 41,2 53,0 37,0 30,1 41,6 X3 0,5 0,5 0,2 0,7 1,0 3,9 4,5 3,3 3,0 3,5 C 7 7 7 7 7 8 8 8 8 8 X1 12,9 12,4 12,6 12,6 12,9 8,2 9,2 9,2 8,5 8,7 X2 41,1 39,0 36,9 39,2 35,9 40,8 43,8 48,6 46,9 46,2 X3 0,2 0,4 0,5 0,4 0,3 4,4 3,9 4,0 4,3 4,1 a) b) c) d) e) f) 4. Como as variƒveis X1, X2, X3 podem ser classificadas (qualitativas, quantitativas discretas ou cont€nuas)? Apresente a distribui•‚o de X1, X2 e X3 atravˆs de histogramas. Comente as formas das distribui•†es. Calcule a mˆdia e o desvio-padr‚o de X1, X2 e X3 para cada condi•‚o experimental. Quais informa•†es podem ser extra€das dessas medidas? Calcule a mediana e quartis para X1, X2 e X3. Construa boxplots para X1, X2, X3 para cada condi•‚o experimental. Compare as variƒveis em cada condi•‚o apresentada em termos de variabilidade. Use uma medida de dispers‚o apropriada. Apresentam-se abaixo algumas medidas descritivas da distribui•‚o de salƒrios, em reais (R$), de trŒs empresas do mesmo ramo. Empresa Média Desviopadrão A B C 300 400 420 100 180 350 Extremo inferior (mín.) 100 100 100 Q1 Mediana Q3 200 250 230 302 398 300 400 550 650 Extremo superior (máx.) 510 720 10.000 Construa representa•†es grƒficas apropriadas. 5. Uma empresa de marketing tentando melhorar a imagem de um produto veiculou uma campanha publicitƒria ao final da qual foi medido o desempenho das vendas. Os dados est‚o representados abaixo. Vendas (mil R$) Frequência 07 |------ 09 4 09 |------ 11 8 11 |------ 13 10 13 |------ 15 12 15 |------ 17 6 a) b) Encontre a mˆdia e o desvio-padr‚o. Sabendo que a campanha foi um sucesso, desejou-se saber se as vendas est‚o sendo consistente. Para tanto, adotou-se o seguinte critˆrio: se o total de vendas abaixo de ( x 15 . * s ) e acima de ( x 15 . * s ) n‚o exceder 14%, ent‚o estƒ havendo consistŒncia nas vendas. Verifique se hƒ consistŒncia encontrando o percentual das vendas abaixo e acima destes limites. 6. Considere o seguinte “banco de dados”: I X Y Z W 1 3 28 10 F 2 4 30 8 M 3 5 34 8 M 4 5 39 6 F 5 4 50 4 F 6 3 59 0 M com I: Usuƒrio de um servi•o de sa…de X: N…mero de vezes que utilizou o servi•o Y: Idade, em anos completos Z: Grau de satisfa•‚o, na escala 0 a 10 W: GŒnero (F: feminino, M: masculino) a) b) c) Compare as variabilidades das variƒveis X, Y e Z usando uma medida adequada. Existe algum ponto at€pico no conjunto de valores da variƒvel Z? Por quŒ? Compare o grau de satisfa•‚o entre os gŒneros dos usuƒrios. 7. Um estudo sobre a rotatividade de mão-de-obra na indústria foi realizado, anotando-se o número de empregos nos últimos 3 anos para operários especializados e não especializados. Os resultados obtidos estão abaixo: Não especializados Empregos Nro operários 1 106 2 222 3 338 4 292 5 ou mais 164 Empregos Nro operários 1 210 2 342 3 109 4 91 5 ou mais 35 Especializados a) b) c) d) Qual a variável observada? Classifique-a. Faça uma representação gráfica da rotatividade de mão-de-obra na indústria, sem diferenciar a especialização. Faça uma representação gráfica da rotatividade de mão-de-obra na indústria, diferenciando por especialização. Você acha que os trabalhadores especializados trocam menos de emprego? Justifique. 8. A tabela a seguir mostra as médias da pressão sanguínea sistólica de 12866 homens ao longo de um experimento clínico cujo objetivo era a prevenção de doenças cardíacas coronarianas. Os indivíduos foram classificados por grupo etário e por raça. A seguinte tabela fornece as médias das pressões sanguíneas sistólicas. Raça Brancos Não- brancos a) b) c) 9. c) Grupo etário 40-44 45-49 132,2 135,2 134,2 137,2 50-54 139,4 141,3 55-59 142,0 144,1 Represente graficamente as médias dos grupos, com a idade (grupo etário) no eixo x e a pressão sanguínea no eixo y. Para cada grupo racial, una os pontos correspondentes às diversas idades. Descreva os padrões observados. Parece haver diferenças entre os dois grupos raciais? Parece que a pressão sanguínea sistólica varia com a idade? Em caso afirmativo, como é essa variação? Há alguma interação? A anemia por deficiência de ferro é a forma mais comum de subnutrição nos países em desenvolvimento, afetando cerca de 50% das crianças e mulheres e 25% dos homens. Em muitos desses países, tradicionalmente se usavam panelas de ferro para cozinhar os alimentos, porém estas foram trocadas por panelas de alumínio mais baratas e mais leves. Há pesquisas que sugerem que a comida preparada em panelas de ferro contém mais ferro que a comida preparada em outros tipos de panela. Em um estudo planejado para se investigar esse assunto, comparou-se o conteúdo de ferro de determinados alimentos da Etiópia preparados em panelas de aluminio, de barro e de ferro. Foi analisado o conteúdo de ferro na carne de vaca preparada com diversos temperos locais, nos legumes cozidos e em um assado de verduras condimentado. Cozinharam-se 4 amostras de cada prato em cada tipo de panela. Mediu-se a quantidade de ferro na comida, em miligramas de ferro por 100 gramas de alimento preparado. TIPO DE PANELA ALUMINIO BARRO FERRO a) b) 35-39 131,0 132,2 Conteúdo de ferro TIPO DE ALIMENTO CARNE LEGUMES 1,77 2,36 1,96 2,14 2,40 2,17 2,41 2,34 2,27 1,28 2,48 2,68 2,41 2,43 2,57 2,48 5,27 5,17 4,06 4,22 3,69 3,43 3,84 3,72 VERDURAS 1,03 1,53 1,07 1,30 1,55 0,79 1,68 1,82 2,45 2,99 2,80 2,92 Calcule média, desvio-padrão, coeficiente de variação e quartis para cada tipo de panela. Faça um boxplot para cada tipo de panela. Comente sobre simetria, dispersão e pontos extremos (outliers) em cada caso. Calcule as médias por tipo de panela e por tipo de alimento. Represente graficamente essas médias e comente se o tipo de alimento e o tipo de panela parecem ou não influenciar o conteúdo de ferro. 10. Quatro tˆcnicos realizam seis determina•†es de concentra•‚o de am•nia contida em uma solu•‚o. Os resultados obtidos s‚o apresentados na tabela a seguir. Técnico A B C D a) b) c) 20,2 19,9 20,6 20,1 Concentração de Amônia (%) 19,9 20,1 20,4 20,2 20,2 19,5 20,4 19,4 20,5 20,7 20,6 20,8 19,9 20,2 19,9 21,1 20,4 20,0 21,0 20,0 Compare as determina•†es dos tˆcnicos usando medidas de centro e variabilidade e construindo um diagrama de pontos (dotplot). Construa os boxplots e verifique se ocorrem pontos at€picos. Se vocŒ tivesse que escolher um dos tˆcnicos, qual seria? Por quŒ? 11. Considere as duas amostras dadas a seguir: Amostra 1: 10; 9; 8; 7; 8; 6; 10 e 6 Amostra 2: 10; 6; 10; 6; 8; 10; 8 e 6 a) b) c) Calcule a amplitude para as duas amostras. VocŒ concluiria que as duas amostras exibem a mesma variabilidade? Explique. Calcule o desvio-padr‚o para as duas amostras. Essas grandezas indicam que as duas amostras tŒm a mesma variabilidade? Explique. Escreva um breve texto contrastando a amplitude da amostra com o desvio-padr‚o da amostra como medida de variabilidade. 12. Em 1789, Henry Cavendish estimou a densidade da Terra usando uma balan•a de tor•‚o. Suas 29 medidas est‚o apresentadas a seguir, expressas como uma um m…ltiplo da densidade da ƒgua. 5,50 5,30 5,27 5,44 5,29 4,07 a) b) c) 5,47 5,57 5,85 5,10 5,36 5,46 5,29 4,88 5,42 5,65 5,86 5,79 5,55 5,34 5,62 5,61 5,39 5,58 5,75 5,34 5,26 5,63 5,53 0,00 Calcule a mˆdia, o desvio-padr‚o, a mediana, os quartis, os pontos de m€nimo e mƒximo da amostra dos dados de Cavendish para a densidade. Construa um boxplot dos dados. Comente o grƒfico. Parece haver um outlier “baixo” nos dados? A mediana da amostra seria melhor estimativa da densidade da Terra do que a mˆdia da amostra? Comente.