ME623 Planejamento e Pesquisa Revisão de Experimentos Comparativos Simples 2 Comparação de Duas Médias Amostras Independentes Exemplo: Suplementação alimentar ajuda emagrecimento? Resposta: quilos perdidos UE Pessoa Supl. Placebo j y1j 1 1.85 -1.62 2 2.40 -0.75 3 -1.21 1.70 4 0.35 2.12 5 3.52 3.98 6 4.04 -4.87 7 4.96 -2.34 8 0.15 3.02 9 -.59 -0.08 10 2.57 -1.27 y2j 3 Análise Descritiva: Boxplot Existe diferença nas médias dos dois grupos? Essa diferença é estatisticamente significante? E a variância, é a mesma? 0 -4 -2 quilos 2 4 Placebo supl Figura: Boxplot da dos quilos perdidos em cada grupo 4 Comparar médias de 2 grupos Qual técnica estatística podemos usar? 5 Teste t (amostras independentes) Suposições: Hipóteses: Estatística do Teste: onde 6 Teste t (amostras independentes) E se as variâncias forem diferentes? Estatística do Teste: Sob Ho: t0 = y1. - y2. S12 S 22 + n1 n2 » tn æ s12 s22 ö ç + ÷ è n1 n2 ø n= 2 2 2 2 1 æ s1 ö 1 æ s2 ö ç ÷ + ç ÷ n1 -1 è n1 ø n2 -1 è n2 ø 2 7 Teste t (amostras independentes) Exemplo do suplemento Suplemento Placebo y1. =1.80 y2. = -0.01 S = 4.28 S 22. = 7.37 2 1. Qual é o valor de t 0? 8 Teste t (amostras independentes) No R: > y1 <- c(1.85, 2.40,-1.21, 0.35, 3.52, 4.04, 4.96, 0.15, -0.59, 2.57) > y2 <- c(-1.62, -0.75, 1.70, 2.12, 3.98, -4.87, -2.34, 3.02, -0.08, 1.27) > t.test(y1, y2, var.equal=FALSE) data: y1 and y2 t = 1.6815, df = 16.816, p-value = 0.1111 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -0.46421 4.09421 sample estimates: mean of x mean of y 1.804 -0.011 Conclusão? 9 Exemplo Um pesquisador quer testar se há diferença entre o tempo que homens e mulheres assistem TV. Na pesquisa com 59 homens e 116 mulheres, o tempo médio dos homens foi de 2.37 horas e o desvio padrão amostral 1.87, o tempo médio das mulheres foi de 1.95 horas com desvio padrão amostral de 1.51. 10 10 t= x1 - x2 - 0 s s + n1 n2 2 1 2 2 = 2.37 -1.95 - 0 2 2 1.87 1.51 + 59 116 = 1.495 p-valor = 0.13 11 Teste para Igualdade das Variâncias 12 Checar suposições do teste t Quais são as suposições? 13 Checar suposições do teste t Quais são as suposições? Normalidade Independência das populações Observações são variávies aleatórias independentes (Variâncias iguais) 14 Checar suposições do teste t Gráfico de Probabilidade Normal: o que podemos ver? 15 Comparação de Duas Médias Amostras Pareadas Exemplo: Suponha que queremos testar se existe diferença no desempenho dos alunos entre a P1 e P2. Selecionamos 10 alunos ao acaso Aluno Nota P1 Nota P2 j y1j y2j 1 7.5 6.3 2 3.2 4.5 3 5.4 6.2 4 1.5 2.7 5 6.0 6.9 6 9.2 7.7 7 7.9 8.5 8 3.5 1.2 9 4.7 7.2 10 6.2 6.5 16 Análise Descritiva: Boxplot Houve uma melhora nas notas? Essa diferença é estatisticamente significante? Figura: Boxplot das notas dos alunos na P1 e P2 17 Teste t (amostras pareadas) Diferença: Hipóteses: Estatística do Teste: onde 18 Teste t (amostras pareadas) Para as notas da P1 e P2, calcula-se as diferenças: Então Qual é o valor de ? 19 Teste t (amostras pareadas) No R: > > > > y1 <- c(7.5, 3.2, 5.4, 1.5, y2 <- c(6.3, 4.5, 6.2, 2.7, prova <- as.factor(rep(1:2, t.test(y1, y2, paired=TRUE, 6, 9.2, 7.9, 3.5, 4.7, 6.2) 6.9, 7.7, 8.5, 1.2, 7.2, 6.5) each=10)) equal.var=TRUE) Paired t-test data: y1 and y2 t = -0.5574, df = 9, p-value = 0.5909 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -1.3152424 0.7952424 sample estimates: mean of the differences -0.26 Conclusão: ? 20 Determinar o tamanho amostral Qual o tamanho da amostra a ser usada? Esse é um dos aspectos mais importantes de um experimento Duas formas de calcular o tamanho da amostra: 1. Intervalo de Confiança 2. Curva OC (Operating Characteristic) 21 Poder de um teste H0 Decisão sobre H0 Rejeitar Não Rejeitar Verdadeira Erro Tipo I (α) OK Falsa OK Erro Tipo II (β) • P(Rejeitar H0|H0 é verdadeira)=α: P(Erro Tipo I) • P(Não Rejeitar H0|H0 é falsa)=β: P(Erro Tipo II) • Poder do Teste P(Rejeitar H0|H0 é falsa) = 1 - P(Erro Tipo II) = 1-β 22 Poder de um teste Exemplo: em R simulacoes = 1000 rejeicoes = 0 for (i in 1:simulacoes) { amostra1 = rnorm(100) amostra2 = rnorm(100) if (t.test(amostra1,amostra2)$p.value < 0.05) rejeicoes = rejeicoes + 1 } alpha = rejeicoes/simulacoes 23 Determinar o tamanho amostral pelo Intervalo de Confiança Voltemos ao caso em que estamos testando e a diferença entre as médias é . Um Intervalo de Confiança (IC) para é: Qual a probabilidade de que, sob Ho, este intervalo contém a diferença populacional? 24 Determinar o tamanho amostral pelo Intervalo de Confiança Especificar um limite máximo para a margem de erro e resolver a equação para o tamanho de amostra: 25 Determinar o tamanho amostral pelo Intervalo de Confiança Exercício: Para o exemplo do suplemento, calcule o tamanho da amostra necessário para um intervalo de confiança de no máximo 1.3 26 Tamanho da Amostra Exemplo: Se uma população tem variancia s = 9 , o número de pessoas que posso entrevistar é n = 80, e queremos um I.C. para a média amostral com margem de erro m = 0.5, qual a será a confiança deste I.C.? Adriano Zambom 2 27 Determinar o tamanho amostral pela curva OC A escolha do tamanho amostral e a P(Erro Tipo II) = βestão diretamente ligadas Quando é falsa, não queremos erradamente não rejeitar H0. β depende da verdadeira diferença entre as médias Curvas OC (Operating Characteristic Curves): gráfico de βversus δpara um tamanho amostral particular 28 Determinar o tamanho amostral pela curva OC 29 Determinar o tamanho amostral pela curva OC A curva anterior é para as hipóteses de igualdade das médias com mesma variância (desconhecida),α=0.05 e dados balanceados O tamanho amostral para construir as curvas é na realidade n*=2n-1. 30 Determinar o tamanho amostral pela curva OC O parâmetro no eixo horizontal é: Dividir por 2sigma, permite usar o mesmo conjunto de curvas, sem se preocupar com a variância. Assim, a diferença das médias é expressa por unidades de desvio padrão! 31 Determinar o tamanho amostral pela curva OC Voltando a curva: 32 Determinar o tamanho amostral pela curva OC Quanto maior a diferença das médias, menor é a probabilidade de erro tipo II, para um tamanho amostral n e um dado alpha. O teste detecta diferenças maiores com mais facilidade! 33 Determinar o tamanho amostral pela curva OC Quando o tamanho amostral aumenta, a probabilidade do erro tipo II diminui. Conclusão: Quando o poder do teste aumenta? 34 Determinar o tamanho amostral Exemplo: argamassa de cimento Suponha que se a diferença é no mínimo 0.5, gostaríamos de detectá-la com probabilidade 0.80. Assuma que σ=0.25 Poder é 0.80, então β=0.20. Pela figura n*=10. Então 10 = 2n-1 => n = 6 35 36