Teste t de Student para o caso de uma amostra (Teste de hipóteses para a média populacional) Exemplo: Quinze alunos foram inquiridos quanto ao seu grau de satisfação (numa escala de 0 a 100) em relação à sua Universidade, obtendo-se os seguintes resultados: 75 60 55 80 52 90 60 91 72 58 77 80 66 40 62 Teste a hipótese de que a média é 72, sendo α=5%. Resolução usando o SPSS: H 0 : µ1 = 72 H 1 : µ1 ≠ 72 (Teste bilateral) 1 Output T-Test One-Sample Statistics N Grau de satisfação 15 Mean 67,87 Std. Deviation 14,451 Std. Error Mean 3,731 One-Sample Test Test Value = 72 Grau de satisfação t -1,108 df 14 Sig. (2-tailed) ,287 2 Mean Difference -4,133 95% Confidence Interval of the Difference Lower Upper -12,14 3,87 Interpretação: Neste exemplo, dado tratar-se de um teste bilateral, compara-se directamente o valor de p-value=0.287 com α=0.05 (nível de significância). Como p-value=0.287 > 0.05 não se rejeita H0. Assim, não há evidência estatística para rejeitar a hipótese de que a média de satisfação (numa escala de 0 a 100) em relação à sua Universidade na população de alunos que frequentam aquela Universidade é 72, com α=0.05. Testes de hipóteses para a diferença entre duas médias populacionais) A) Teste t de Student para amostras independentes Exemplo: Com o objectivo de testar a influência do olfacto no sono dos recém nascidos, foi registado o tempo (em minutos) que um bebé com uma semana demora a adormecer, tendo sido considerados dois grupos de bebés: grupo I (em que se colocou no berço uma peça de roupa utilizada pela mãe) e grupo II (em que se colocou no berço uma peça de roupa utilizada por outra pessoa). Os resultados obtidos encontram-se no quadro seguinte: Grupo I 2 5 4 6 8 9 7 5 6 5 Grupo II 9 3 8 7 10 11 9 11 7 8 Sabendo que a variável em estudo segue uma distribuição normal, teste se existem diferenças significativas entre o tempo que os dois grupos de bebés levaram a adormecer (α=0.05). Resolução usando o SPSS: H 0 : µ1 − µ 2 = 0 ou H 0 : µ1 = µ 2 H1 : µ1 − µ2 ≠ 0 ou H1 : µ1 ≠ µ 2 (Teste bilateral) 3 Analyze/compare means/independent sample t-test 4 <Define Groups> <Continue> <OK> T-Test Group Statistics tempo levado até adormecer Grupo 1 2 N 10 10 Mean 5,70 8,30 5 Std. Deviation 2,003 2,359 Std. Error Mean ,633 ,746 Independent Samples Test Levene's Test for Equality of Variances F tempo levado Equal variance até adormece assumed Equal variance not assumed ,103 Sig. ,751 t-test for Equality of Means t Mean Std. Error Sig. (2-tailed) Difference Difference df 95% Confidence Interval of the Difference Lower Upper -2,657 18 ,016 -2,600 ,979 -4,656 -,544 -2,657 17,537 ,016 -2,600 ,979 -4,660 -,540 Interpretação: A primeira tabela apresenta as medidas descritivas dos dados (dimensão n de cada amostra), média, desvio-padrão e erro-padrão amostrais) e o segundo quadro diz respeito ao teste de Levene para a homogeneidade (igualdade) das variâncias e ao teste t para a comparação de duas médias no caso de duas amostras independentes. No teste de Levene, as hipóteses são: H 0 : σ 12 = σ 22 H 0 : σ 12 ≠ σ 22 Note que neste caso no que concerne ao teste de Levene p=0.751, pelo que não se rejeita a hipótese de que, neste exemplo, as variâncias são iguais. Assim, considera-se que as variâncias populacionais, embora desconhecidas, são iguais. O quadro anterior apresenta a seguir o valor da estatística do teste (t) para a igualdade das médias, o número de graus de liberdade e a probabilidade de significância do teste (nível de significância descritivo do teste/p-value - sig.). Neste exemplo, dado tratar-se de um teste bilateral, compara-se directamente pvalue=0.016 com α=0.05 (nível de significância). Como p-value=0.016 ≤ 0.05 rejeita-se H0. Assim, podemos afirmar com 95% de confiança que existem diferenças significativas entre o tempo que os dois grupos de bebés levaram a adormecer. Obs. Se o teste fosse unilateral comparava-se o valor de p-value/2 com o valor de α. 6 B) Teste t de Student para amostras emparelhadas; Exemplo: Um grupo de 10 pessoas é submetido a um tipo de dieta durante um mês, sendo avaliado o peso no início da dieta (X) e no final da dieta (Y), tendo-se obtido os seguintes resultados: X Y 120 116 104 102 93 90 87 83 85 86 98 97 102 98 106 108 88 82 90 85 Ao nível de 5%, podemos concluir que houve diminuição do peso médio pela aplicação da dieta? Resolução usando o SPSS: H 0 : µ1 − µ 2 = 0 ou H 0 : µ1 = µ 2 H1 : µ1 − µ2 > 0 ou H1 : µ1 > µ 2 (Teste unilateral à direita) 7 <Ok> Output T-Test Paired Samples Statistics Pair 1 Mean 97,30 94,70 X Y N Std. Deviation 10,924 11,499 10 10 Std. Error Mean 3,455 3,636 Paired Samples Correlations N Pair 1 X&Y 10 Correlation ,975 Sig. ,000 Paired Samples Test Paired Differences Pair 1 X - Y Mean Std. Deviation 2,600 2,591 Std. Error Mean ,819 Interpretação: O valor da estatística do teste é 3.174. 8 95% Confidence Interval of the Difference Lower Upper ,747 4,453 t 3,174 df 9 Sig. (2-tailed) ,011 Neste exemplo, como o teste é unilateral, o valor do p-value dado pelo output deve ser p − value dividido por 2 e comparado apenas com α. Assim, ≅ 0.0055 ≤ 0.05 , logo 2 rejeita-se H0, podendo afirmar-se, com 95% de confiança, que houve diminuição do peso médio pela aplicação da dieta. 9 Teste de aderência do Qui-Quadrado - Resolução no SPSS Exemplo 1: Um modelo de carro de determinada marca é vendido no mercado em 5 cores: vermelha, branca, preta, azul e cinzenta. Num estudo de mercado para saber a popularidade das várias cores, analisou-se uma amostra casual tendo-se obtido os seguintes resultados: Cor v b p a c Nº de Observações 88 65 52 45 50 Em face desta amostra, haverá razões para dizer que há preferência por determinada cor ? <Data> – <weight Cases> 10 Output: NPar Tests Chi-Square Test Frequencies 11 cor v b p a c Total Observed N 88 65 52 45 50 300 Expected N 60,0 60,0 60,0 60,0 60,0 Residual 28,0 5,0 -8,0 -15,0 -10,0 Test Statistics Chi-Squarea df Asymp. Sig. cor 19,967 4 ,001 a. 0 cells (,0%) have expected frequencies less than 5. The minimum expected cell frequency is 60,0. Exercício 2: Uma moeda foi lançada ao ar 100 vezes e observaram-se 42 caras e 58 coroas. Serão os resultados compatíveis com a hipótese de que a moeda é não viciada. Output: NPar Tests Chi-Square Test Frequencies face cara coroa Total Observed N 42 58 100 Expected N 50,0 50,0 Residual -8,0 8,0 12 Test Statistics Chi-Squarea df Asymp. Sig. face 2,560 1 ,110 a. 0 cells (,0%) have expected frequencies less than 5. The minimum expected cell frequency is 50,0. Exercício 3: O último algarismo de 60 números telefónicos escolhidos ao acaso de uma lista foi: Nº 0 1 2 3 4 5 6 7 8 9 Freq. 8 3 2 5 4 11 5 11 6 5 Será razoável admitir a equiprobabilidade dos números? Output: NPar Tests Chi-Square Test Frequencies 13 NUMERO 0 1 2 3 4 5 6 7 8 9 Total Observed N 8 3 2 5 4 11 5 11 6 5 60 Expected N 6,0 6,0 6,0 6,0 6,0 6,0 6,0 6,0 6,0 6,0 Residual 2,0 -3,0 -4,0 -1,0 -2,0 5,0 -1,0 5,0 ,0 -1,0 Test Statistics Chi-Squarea df Asymp. Sig. NUMERO 14,333 9 ,111 a. 0 cells (,0%) have expected frequencies less than 5. The minimum expected cell frequency is 6,0. 14 Teste de Homogeneidade do Qui-Quadrado Exemplo: Um investigador efectuou uma experiência para determinar o efeito da idade de um conferencista sobre a disposição estudantil para assistir às suas conferências. Para tal, foram eleitos ao acaso 50 estudantes. A todos os estudantes foi feita uma descrição igual do professor conferencista excepto no que diz respeito à idade: a metade foi dito que o professor tinha 65 anos e à outra metade foi dito que tinha 30 anos. Mais tarde foi pedido aos alunos que manifestassem a sua disposição para assistir à conferência, obtendo-se os seguintes resultados: Disposição para assistir à conf. Com disposição Situação experimental Estudantes a quem se Estudantes a quem se disse que o prof. disse que o prof. tinha 30 tinha 65 anos anos 8 15 Totais 23 Sem disposição 17 10 27 Totais 25 25 50 Será que existem diferenças entre os 2 grupos de estudantes quanto à disposição para assistir à conferência (α=0.05) ? Resolução no SPSS Disp_conf- “disposição para assistir à conferência” Idade – “Situação experimental” 15 16 Output: Crosstabs Case Processing Summary Valid N Disposição para assistir à conferência * Situação experimental Percent 50 100,0% 17 Cases Missing N Percent 0 ,0% Total N Percent 50 100,0% Chi-Square Tests Pearson Chi-Square Continuity Correctiona Likelihood Ratio Fisher's Exact Test N of Valid Cases Value 3,945b 2,899 4,000 df 1 1 1 Asymp. Sig. (2-sided) ,047 ,089 ,045 Exact Sig. (2-sided) Exact Sig. (1-sided) ,088 ,044 50 a. Computed only for a 2x2 table b. 0 cells (,0%) have expected count less than 5. The minimum expected count is 11,50. Teste de Independência do Qui-Quadrado Exemplo: Inquiriu-se 200 pessoas sobre a frequência com que vêem TV e sobre o tipo de analgésicos antipiréticos que consumiam. A informação obtida resultou na seguinte tabela: Frequência com que vê TV Nunca Por vezes Com frequência Total Analgésicos A B C 10 10 5 25 40 9 40 31 30 75 81 44 18 Total 25 74 101 200 Haverá alguma relação entre o consumo de analgésicos e a frequência com que se vê televisão ? Comente. Resolução no SPSS Output: Crosstabs Case Processing Summary Cases Missing N Percent Valid N Frequência com que vê TV * Analgésicos Percent 200 100,0% 0 19 ,0% Total N Percent 200 100,0% Chi-Square Tests Pearson Chi-Square Likelihood Ratio N of Valid Cases Value 12,215a 12,486 200 df 4 4 Asymp. Sig. (2-sided) ,016 ,014 a. 0 cells (,0%) have expected count less than 5. The minimum expected count is 5,50. 20 Teste de Fisher Exemplo: Um estudo sobre hábitos tabágicos e consumo de álcool pretendia comparar dois grupos de indivíduos, fumadores e não-fumadores, quanto à proporção de consumidores de álcool. Recolhida uma amostra de 9 pessoas, obtiveram-se os seguintes dados: Fumadores Não Fumadores Totais Consumidor de álcool 1 3 4 Não consumidor de álcool 3 2 5 Totais 4 5 9 Pretende-se testar se (α=0.05): a) a proporção de consumidores de álcool é menor no grupo de fumadores; b) a proporção de consumidores de álcool é maior no grupo de fumadores; c) a proporção de consumidores de álcool é igual nos dois grupos; Resolução no SPSS Output: Crosstabs Case Processing Summary Cases Missing N Percent 0 ,0% Valid N Alcool * Fumador 9 Percent 100,0% Alcool * Fumador Crosstabulation Count Fumador não Alcool Total não sim sim 2 3 5 Total 3 1 4 5 4 9 21 Total N 9 Percent 100,0% Chi-Square Tests Pearson Chi-Square Continuity Correctiona Likelihood Ratio Fisher's Exact Test Linear-by-Linear Association N of Valid Cases Value 1,102b ,141 1,137 ,980 df 1 1 1 1 Asymp. Sig. (2-sided) ,294 ,708 ,286 Exact Sig. (2-sided) Exact Sig. (1-sided) ,524 ,357 ,322 9 a. Computed only for a 2x2 table b. 4 cells (100,0%) have expected count less than 5. The minimum expected count is 1,78. Nota: Para realizar o teste de Fisher usa-se os mesmos comandos do SPSS usados no caso do teste do qui-quadrado. A nota de rodapé do 2º quadro indica que 100% dos Eij são inferiores a 5. Neste caso não se deve utilizar o teste do qui-quadrado. A alternativa é o teste de Fisher, cuja probabilidade de significância unilateral é 0.357. O SPSS fornece também a probabilidade de significância exacta para um teste bilateral, neste caso, igual a 0.524. Para decidir sobre a rejeição ou não da hipótese nula deve-se, em ambos os casos, comparar-se p-value com α, rejeitando-se a H0 quando p ≤ α. 22 Teste de McNemar Exemplo: Suponha que uma determinada empresa decide fazer uma campanha publicitária para promover um produto que tinha colocado no mercado há algum tempo. A admininstração da empresa pretende saber se as preferências dos consumidores se modificaram após a campanha publicitária. As respostas de 70 consumidores, aos quais se perguntou, antes e depois da campanha, se consumiam o produto em causa, encontram-se resumidas no quadro seguinte: Depois da campanha Não Sim Antes da campanha Sim 5 12 Não 33 20 Terá existido uma mudança significativa no consumo do produto em causa (α=0.05) ? Resolução no SPSS Input: <Analyse>- Nonparametric tests > - <two related samples tests> 23 Output: NPar Tests McNemar Test Crosstabs Antes & Depois Depois Antes 0 1 0 1 33 5 20 12 Test Statisticsb N Exact Sig. (2-tailed) Antes & Depois 70 ,004a a. Binomial distribution used. b. McNemar Test Sendo p = 0.004 < α = 0.05 rejeitamos H0 e concluímos que houve uma mudança significativa do consumo após a campanha publicitária. 24