UNIVERSIDADE FEDERAL DE MATO GROSSO Programa de Pós-graduação em Ciências Veterinárias Bioestatística 1ª Lista de Exercícios 1) Defina com suas palavras o que é Estatística. 2) Defina o que é uma variável. 3) Classifique quanto à natureza, as seguintes variáveis: condição de saúde (doente, não doente) – qualitativa nominal estado civil (solteiro, casado, separado, viúvo) – qualitativa nominal tipo de parto (normal, cesário) – qualitativa nominal escolaridade do chefe de família (0 a 7 anos / 8 a 11 anos / 12 anos e mais de estudo) – qualitativa ordinal tempo de um procedimento cirúrgico (minutos) – quantitativa continua grau de satisfação (muito insatisfeito, insatisfeito, indiferente, satisfeito, muito satisfeito) – qualitativa ordinal número de praias consideradas poluídas – quantitativa discreta custo do projeto de engenharia (reais) – quantitativa continua 4) É de interesse estudar o tempo que animal diagnosticado com doença grave, consegue sobreviver com o uso de uma determinada droga. Descreva o tipo de estudo indicado para esta situação. Neste caso o estudo indicado é do tipo experimental. 5) Um estudo foi realizado com o objetivo avaliar as ocorrências de tumores cutâneos em cães. Para isso foram revisados todos os protocolos de biópsia de pele canina, arquivados em um Laboratório de Patologia Veterinária entre o período de janeiro de 1960 e dezembro de 2010. a) Este estudo pode ser caracterizado como um estudo inferencial? O estudo não é inferencial, trata-se de um estudo descritivo retrospectivo. b) Quais as limitações das conclusões obtidas nesse estudo? A principal limitação deste estudo é que todas as conclusões referem-se apenas casuística do laboratório em que foram avaliados o protocolos de biópsia, não podendo fazer inferências a população de cães em geral. 6) Defina com suas palavras o que é média, e qual a vantagem da sua utilização. 7) Os dados a seguir mostram a ventilação pulmonar de repouso em 25 ovinos adultos (1/min) 8,3 8,0 9,9 6,1 5,5 10,3 6,5 7,6 7,6 7,6 6,9 10,3 7,8 7,3 8,9 UNIVERSIDADE FEDERAL DE MATO GROSSO Programa de Pós-graduação em Ciências Veterinárias Bioestatística 1ª Lista de Exercícios 10,1 7,6 9,1 8,3 4,8 10,2 6,5 9,1 7,0 11,9 a) Obtenha as medidas de posição. n x 8,3 ... 11,9 8,1 n 25 Mediana: Md x n 1 x 251 x13 7,8 Média; x i 1 i 2 2 Moda; Mo 7, 46 b) Obtenha as medidas de dispersão. Variância: S 2 x x i i n 1 2 8,3 8,1 2 ... 11,9 8,1 24 Desvio Padrão: S S 2 2,90 1,7 CV Coeficiente de Variação: S 1, 7 100% 100 20,98% X 8,1 c) Construa um representação gráfica adequada. Número de classes k n k 25 5 Amplitude Total A Max Min 11,9 4,8 7,1 Amplitude da Classe c A 7,1 7,1 1,8 k 1 5 1 4 Limite Inferior da primeira classe LI1 x1 c 1,8 4,8 4,8 0,9 3,9 2 2 69, 65 2,90 24 UNIVERSIDADE FEDERAL DE MATO GROSSO Programa de Pós-graduação em Ciências Veterinárias Bioestatística 1ª Lista de Exercícios fa fr fp FA FP 3,9 |– 5,7 2 0,08 8% 2 8% 5,7 |–7,5 6 0,24 24% 8 32% 7,5 |– 9,3 11 0,44 44% 19 76% 9,3 |– 11,1 5 0,20 20% 24 96% 11,1 |– 12,9 1 0,04 4% 25 100% 25 1,00 100% 8 6 0 2 4 Frequencia absoluta 10 12 Classe 3.9 5.7 7.5 9.3 11.1 12.9 Classes Figura 1: Histograma para ventilação pulmonar de repouso em 25 ovinos adultos (1/min) 8) Foi realizado na região Oeste do Paraná, no Município de Marechal Cândido Rondon, em 1992, um levantamento da produtividade leiteira diária de 30 produtores rurais, atendidos pelo plano “Panela Cheia” (Roesler, 1997). Os resultados da produção diária dos 30 produtores estão apresentados a serguir: 8,13 8,23 8,60 8,80 8,97 9,05 9,12 9,30 9,35 9,78 9,80 9,86 9,90 9,95 10,00 10,11 10,13 10,15 10,16 10,23 10,31 10,33 10,40 10,46 10,50 11,14 11,29 11,46 12,05 12,14 a) Obtenha as seguintes estimativas das medidas de posição e dispersão UNIVERSIDADE FEDERAL DE MATO GROSSO Programa de Pós-graduação em Ciências Veterinárias Bioestatística 1ª Lista de Exercícios n x 8,13 ... 12,14 9,99 n 30 x n x n 1 x15 x16 10 10,11 Mediana; Md 2 2 10, 06 2 2 2 Média; x i i 1 Moda; Mo 10,10 Variância: S 2 x x 2 i i n 1 8,13 9,99 2 ... 12,14 8,99 29 28,6316 0,9872 29 Desvio Padrão: S S 2 0,9872 0,99 CV Coeficiente de Variação: S 0,99 100% 100 9,91% X 9,99 b) Trace histograma e Baseado nestes gráficos, determine qual é a natureza da distribuição, quanto a simetria. Baseado nesta resposta, indique qual medida de posição é a mais adequada para representar os dados amostrais. Justifique. Número de classes k n k 30 5, 47 5 Amplitude Total A x n x1 x30 x1 12,14 8,14 4, 01 Amplitude da Classe c A 4, 01 4, 01 1, 00 k 1 5 1 4 Limite Inferior da primeira classe LI1 x1 c 1, 00 8,13 8,13 0,50 7, 63 2 2 UNIVERSIDADE FEDERAL DE MATO GROSSO Programa de Pós-graduação em Ciências Veterinárias Bioestatística 1ª Lista de Exercícios fa fr fp FA FP 7,63 |– 8,63 3 0,10 10% 3 10% 8,63 |– 9,63 6 0,20 20% 9 30% 9,63 |– 10,63 16 0,53 53% 25 83% 10,63 |– 11,63 3 0,10 10% 28 93% 11,63 |– 12,63 2 0,07 7% 30 100% 30 1,00 100% 10 0 5 Frequencia absoluta 15 Classe 7.63 8.63 9.63 10.63 11.63 12.63 Classes Figura 2: Histograma para produtividade leiteira diária de 30 produtores rurais. As três medidas, média, mediana e moda, estão muito próximas e isso é um indicativo que a distribuição é simétrica. Assim, quaisquer medidas pode ser usada para representar os dados. 9) Sabendo que as bibliotecas da UFMT possuem 300.000 volumes distribuídos da seguinte forma: 200.000 localizados na biblioteca central de Cuiabá, 50.000 em Rondonópolis, 35.000 no Araguaia e 15.000 em Sinop, faça uma tabela e um gráfico adequado para representar esses dados. UNIVERSIDADE FEDERAL DE MATO GROSSO Programa de Pós-graduação em Ciências Veterinárias Bioestatística 1ª Lista de Exercícios Tabela 1: Distribuição do número de volumes, segundo cada campus da UFMT. Mato Grosso, 2012. Campi fi fp Cuiabá 200000 66,7% Rondonópolis 50000 16,7% Araguaia 35000 11,7% Sinop 15000 5,0% Total 300000 100,0% Col 2: 200000 Col 2: 50000 Col 2: 35000 Col 2: 15000 10) Os dados seguintes mostram a distribuição das áreas, em ha, de 755 propriedades rurais de um município do Estado de Minas Gerais. Estes dados foram obtidos junto à EMATER, que mantém um escritório neste município: Área (ha) Proprietários Abaixo de 60 386 [60, 150) 237 [150, 250) 62 [250, 400) 43 [400, 600) 18 [600, 900) 7 900 ou mais 2 a) Quantas propriedades têm área abaixo de 300 há? As propriedades com 300ha estão contidas na classe [250, 400), para obter o número de propriedades com área abaixo de 300ha nessa classe UNIVERSIDADE FEDERAL DE MATO GROSSO Programa de Pós-graduação em Ciências Veterinárias Bioestatística 1ª Lista de Exercícios Área Proprietários Área Proprietários 400 250 43 150 43 43 x 50 43 x 14,33 14 300 250 x 50 x Assim o número de proprietários abaixo de 300ha é 386+237+62+14=699 b) Qual a % de propriedades com área acima de 120 há? As propriedades com 120ha estão contidas na classe [60, 150), para obter o número de propriedades com área acima de 120ha nessa classe Área 150 60 Proprietários Área Proprietários 386 90 386 90 x 30 386 x 79 150 120 x 30 x Assim o número de proprietários acima de 120ha é 79+62+43+18+7+2=211 c) Suponha que o governo esteja criando um programa de apoio aos produtores rurais deste município (Eletrificação Rural, Crédito para Investimento) limitando em 500 há a área mínima para participar do programa. Discuta a validade do programa para o município, propondo sugestões se necessário. Vamos obter o percentual de propriedade acima de 500ha. As propriedades com 500ha estão contidas na classe [400, 600), para obter o número de propriedades com área acima de 500ha nessa classe Área Proprietários Área Proprietários 600 400 18 200 18 200 x 100 18 x 9 600 500 x 100 x Assim o número de proprietários acima de 500ha é 9 7 2 18 18 propriedades corresponde a 2,38% do total, assim o programa não serie interessante beneficiaria poucas propriedades. 11) Um pesquisador estudando o cruzamento de plantas de ervilhas com sementes amarelas e lisas (AL) com outra de sementes verdes e rugosas (VR) obteve na UNIVERSIDADE FEDERAL DE MATO GROSSO Programa de Pós-graduação em Ciências Veterinárias Bioestatística 1ª Lista de Exercícios geração genética F2 uma amostra de 20 plantas, os resultados são apresentados abaixo, AL VL AL AL VL AL AL AR VL VL AR AR VR VL VR AR VL VL VR AR Sendo, AL (amerelas e lisas), VL (verdes e lisas), AR (amarelas e rugosas), VR (verdes e rugosas). a) Qual o tipo de variável? Qualitativa nominal b) Construção uma distribuição de freqüências com as freqüências absoluta, relativa e percentual; Tabela 2: Distribuição de freqüências para o tipo de semente obtidas na geração genética F2 uma amostra de 20 plantas de ervilha. Tipo de semente fa fr fp AL 5 0,25 25% AR 5 0,25 25% VL 7 0,35 35% VR 3 0,15 15% 20 1 100% c) Construa uma representação gráfica adequada 8 Frequência Absoluta 6 4 2 0 AL AR VL VR Tipo de sementes Figura 3: Distribuição de freqüências para o tipo de semente obtidas na geração genética F2 uma amostra de 20 plantas de ervilha. d) Do resultado do cruzamento qual foi a semente predominante? O tipo de semente predominante foi a verde e lisa. UNIVERSIDADE FEDERAL DE MATO GROSSO Programa de Pós-graduação em Ciências Veterinárias Bioestatística 1ª Lista de Exercícios