Estatística VI-Estatística não-paramétrica 1. Foi realizada uma sondagem em grande escala a uma população de um determinado país com o intuito de avaliar a opinião pública sobre a abolição da pena de morte. Obtiveram-se os seguintes resultados: Fortemente a favor 20% A favor 30% Indiferente 20% Contra 20% Fortemente contra 10% Numa amostra de 100 oficiais de justiça numa área citadina, foi observada a seguinte distribuição: Fortemente a favor 14 A favor 18 Indiferente 18 Contra 26 Fortemente contra 24 Total 100 Os dados fornecem evidência suficiente de que a opinião dos oficiais de justiça difere significativamente da opinião geral? 2. A população de uma determinada povoação, no interior do nosso país, apresenta a seguinte distribuição em relação à cor dos olhos: Azuis 6% Verdes 8% Castanhos 74% Pretos 12% Observou-se a cor dos olhos a 50 habitantes locais que sofrem de miopia (usam óculos ou lentes de contacto), escolhidos aleatoriamente, tendo-se encontrado a seguinte distribuição: Azuis 4 Verdes 6 Castanhos 30 Pretos 10 Há razões para afirmar que a distribuição da cor dos olhos é diferente na subpopulação míope? 3. As plantas obtidas de um cruzamento entre dois tipos de plantas podem pertencer aos genótipos A, B ou C. Um modelo genético sugere que a descendência proveniente do cruzamento desses dois tipos de plantas pertence aos genótipos A, B e C na razão de 1:2:1. Com o intuito de verificar experimentalmente o modelo, foram reproduzidas 90 plantas, cujas classificações genéticas foram registadas na seguinte tabela: Genótipos A B C 18 44 28 Estes dados contradizem o modelo genético? 1 4. A quantidade de poeira na atmosfera pode ser estimada usando um ultramicroscópio. Um pequeno volume de ar é iluminado por um raio de luz e o observador conta o número de partículas de poeira que vê. Repetindo esta operação um grande número de vezes, pode-se obter uma estimativa da quantidade de poeira num determinado volume de ar. Em 300 observações, foram obtidos os seguintes resultados: No de partículas Frequências 0 38 1 75 2 87 3 54 4 20 5 19 6 ou 7 5 a) Qual lhe parece ser a distribuição de frequência de probabilidade que melhor se poderá ajustar a estes dados? Porquê? b) Verifique, de um modo mais rigoroso, se a distribuição subjacente a estes dados pode ser bem aproximada por uma distribuição de Poisson com parâmetro igual à média da amostra. 5. Fundamentado em entrevistas de casais que pretendem o divórcio, um assistente social obteve os seguintes dados sobre a duração do casamento e a duração da relação antes deste: Duração da relação antes do casamento < 0.5 anos 0.5 − 1.5 anos > 1.5 anos Total Duração ≤ 4 anos 11 28 21 60 do casamento > 4 anos 8 24 19 51 Total 19 52 40 111 Teste a hipótese da duração do casamento ser independente da duração da relação antes do casamento. 6. Na tabela seguinte apresenta-se o resultado dum estudo das reacções de doentes que apresentam linfoma, a uma combinação de quimioterapia. Sexo \ Reacção Masculino Feminino Reagiu 13 5 Não reagiu 5 7 Verifique se os dados nos indicam a existência de interacção entre os dois factores em questão. 7. Num estudo levado a efeito numa grande empresa, mil trabalhadores foram classificados segundo a forma como encaram a sua participação na organização (atitude). Um quadro de resultados obtido foi o seguinte: Atitude \ Posição na empresa colaboradora indiferença ou hostilidade baixa 459 261 média 156 54 alta 45 25 Diga, para α = 0.05, se será de relacionar a atitude de um trabalhador com a posição que ocupa na empresa. 8. Verifique se, a partir da amostra aleatória de 50 portugueses que se segue, existe independência entre o hábito de fumar e a região onde habitam (considere α = 0.01). Região Norte Região Centro Região Sul Fumadores 7 8 5 2 Não Fumadores 11 9 10 9. Numa Assembleia de Juntas de Freguesia dos Concelhos de Lisboa, Funchal e Porto, obteve-se a seguinte distribuição dos votos respeitantes a certa proposta: Distribuição dos votos Lisboa Funchal Porto Sim 61 17 39 Abstenções 12 6 22 Não 60 1 7 Total 133 24 68 Total 117 40 68 225 Poderemos dizer, ao nível de significância de 0.05, que as Juntas de Freguesia daqueles Concelhos apresentam comportamentos idênticos face à proposta ? 10. Uma investigação é realizada com o intuito de determinar se a exposição de mulheres à radiação atómica tem influência na taxa de nascimentos de bébés com deficiências. Foi estudada uma amostra aleatória de 500 crianças cujas mães estiveram expostas às radiações resultantes da explosão atómica em Hiroshima. Para grupo de controlo foi considerada uma amostra aleatória de 400 crianças de uma ilha japonesa afastada. Suponha que foram obtidos os seguintes dados: Deficiências à nascença Presente Ausente Total Mãe exposta às radiações 84 416 500 Mãe não exposta às radiações 43 357 400 Total 127 773 900 Os dados evidenciam a existência de diferentes taxas de incidência de deficiências à nascença para os dois grupos de mães? 11. Num estudo sobre a incidência de alcoolismo em diferentes grupos profissionais, foram entrevistados membros do clero, educadores, executivos e comerciantes. Os dados obtidos foram os seguintes: Alcoólicos Não Alcoólicos Tamanho da amostra Clero Educadores Executivos Comerciantes 32 51 67 83 268 199 233 267 300 250 300 350 Total 233 967 1200 Teste a hipótese de a taxa de alcoólicos ser a mesma nos quatro grupos profissionais considerados. 3 12. Uma amostra de 150 portadores de um certo antigénio e uma amostra de 500 não portadores revelaram a seguinte distribuição em relação ao grupo sanguíneo: Grupo sanguíneo O A B AB Portadores 72 54 16 8 Não portadores 230 192 63 15 Podemos concluir que as populações de onde foram retiradas as amostras diferem quanto à distribuição do grupo sanguíneo? 13. Dez alunos estudaram para um exame. A tabela que se segue contém a informação do número de horas de estudo de cada estudante (x) e o correspondente número de respostas correctas (y). Horas de estudo (x) Respostas correctas (y) 5 6 9 16 17 18 1 1 2 3 21 21 3 7 29 20 7 15 100 22 Ao nível de significância de 0.05, verifique se existe relação entre x e y. (Use o teste de correlação ordinal de Spearman.) 14. Através do teste de correlação ordinal de Spearman, verifique se existe relação entre o salário de 10 profissões e os respectivos níveis de stress, tendo por base os ranks que se encontram na tabela seguinte. Salário Nível de stress 2 2 6 7 3 6 5 4 7 5 10 8 9 9 8 10 4 3 1 1 15. Vários pacientes com história de falha cardíaca congestiva participaram num estudo para averiguar o efeito do exercício físico em algumas funções corporais. Após um certo período de exercício, foram recolhidos os dados que se seguem, referentes à alteração percentual de norepinephrina no plasma sanguíneo (y) e à alteração percentual de consumo de oxigénio (x). Paciente x y 1 500 525 Paciente x y 10 50 60 2 475 130 11 175 105 3 390 325 4 325 190 12 130 148 5 325 90 13 76 75 14 200 250 6 205 295 15 174 102 7 200 180 16 201 151 8 75 74 9 230 420 17 125 130 Com base nesta amostra, pode-se concluir que existe associação entre as duas variáveis? 16. Numa determinada escola, foram analisadas as notas em todas as disciplinas. A seguinte tabela contém a nota numa determinada disciplina (x) e a nota numa outra determinada disciplina (y) de 36 desses alunos: x y 41 29 39 19 53 30 67 27 61 28 67 27 46 22 50 29 55 24 72 33 63 25 59 20 x y 53 28 62 22 65 27 48 22 32 27 64 28 59 30 54 29 52 21 64 36 51 20 62 29 x y 56 34 38 21 52 25 40 24 65 32 61 29 64 27 64 26 53 24 51 25 58 34 65 28 Ao nível de significância de 0.01, verifique se existe relação entre as duas notas através do teste de correlação ordinal de Spearman. 4