COMPARAÇÃO DE DUAS POPULAÇÕES Spencer Barbosa da Silva DEEST - Suponha que estamos interessados em comparar duas populações com relação às suas médias. - Queremos realizar um teste de hipóteses onde a hipótese nula é Ho: µ1 = µ2 e a hipótese a aternativa é Ha: µ1 ≠ µ2 ou Ha: µ1 > µ2 ou Ha: µ1 < µ2 Erros associados ao teste de hipóteses Situação Ho verdadeira Ho falsa Rejeitar Ho Erro Tipo I Sem erro Não rejeitar Ho Sem erro Erro Tipo II Decisão α = P(erro Tipo I) = P(rejeitar Ho| Ho verdadeira) = nível de significância β = P(erro Tipo II) = P(não rejeitar Ho| Ho falsa) 1 - β = 1- P(não rejeitar Ho| Ho falsa) = P(rejeitar Ho| Ho falsa) = poder do teste - A região de rejeição de Ho (Ho: µ1 = µ2) depende da hipótese alternativa. Ha: µ1 ≠ µ2 Rejeitamos Ho se o modulo da estatistica de teste for maior que um valor critico. O valor critico é positivo e a area acima dele é igual a α/2. Ha: µ1 > µ2 Rejeitamos Ho se a estatistica de teste for maior que um valor critico. O valor critico é positivo e a area acima dele é igual a α. Ha: µ1 < µ2 Rejeitamos Ho se a estatistica de teste for menor que um valor critico. O valor critico é negativo e a area abaixo dele é igual a α. - Como vimos, se o nível de significância muda, a região critica também muda. - No entanto podemos concluir um teste de hipóteses com base no valor-p, que não muda com o nível de significância. - O valor-p é uma probabilidade que depende de Ha. - Se valor-p <= α rejeitamos Ho. Se valor-p > α não rejeitamos Ho. - Se valor-p <= α rejeitamos Ho. Se valor-p > α não rejeitamos Ho. Ha: µ1 > µ2 Rejeitamos Ho se a estatistica de teste for maior que um valor critico. O valor critico é positivo e a area acima dele é igual a α. valor-p = P (estatistica de teste > estatistica de teste observada) Ha: µ1 < µ2 Rejeitamos Ho se a estatistica de teste for menor que um valor critico. O valor critico é negativo e a area abaixo dele é igual a α. valor-p = P (estatistica de teste < estatistica de teste observada) - Se valor-p <= α rejeitamos Ho. Se valor-p > α não rejeitamos Ho. Ha: µ1 ≠ µ2 Rejeitamos Ho se o modulo da estatistica de teste for maior que um valor critico. O valor critico é positivo e a area acima dele é igual a α/2. i) se a estatistica de teste observada é negativa: valor-p = 2x P(estatistica de teste < estatistica de teste observada) ii) se a estatistica de teste observada é positiva: valor-p = 2x P(estatistica de teste > estatistica de teste observada) - Considere que tomamos uma amostra de tamanho n1 da população 1 e uma amostra de tamanho n2 da população 2. - Vamos estudar testes paramétricos para as hipóteses estabelecidas, ou seja, testes que só podem ser realizados quando as duas amostras vierem de populações Normais. - Caso as duas amostras não venham de população Normal mas tenham tamanhos grandes (maior ou igual a 30), os testes paramétricos ainda são válidos. - Caso alguma das amostras seja pequena e não venha de população precisamos realizar um teste de hipótese não paramétrico. - Aqui vamos considerar que as duas amostras vem de distribuição Normal e vamos trabalhar com amostras pequenas. Amostras pareadas x Amostras independentes Duas amostras são ditas pareadas quando a medida de interesse é feita para cada unidade amostral em dois momentos diferentes. A vantagem de trabalhar com amostras pareadas é eliminar possíveis fontes de confundimento. CASO 1: Amostras dependentes (teste t pareado) Exemplo: Queremos comparar a gasolina tradicional com um novo tipo de combustível. 12 carros são primeiramente abastecidos com a gasolina tradicional e mede-se o rendimento em km por litro. Em seguida, os 12 carros são abastecidos com o novo combustível e medese o rendimento em km por litro. Automovel Novo combustivel Gasolina tradicional D=novo-tradicional 1 2 3 4 5 6 7 8 9 10 11 12 11,6 8,8 9,9 9,5 11,6 9,1 10,6 10,8 13,4 10,6 10,5 11,4 8,1 7,9 6,8 7,8 7,6 7,9 5,7 8,4 8,0 9,5 8,0 6,8 3,5 0,9 3,1 1,7 4,0 1,2 4,9 2,4 5,4 1,1 2,5 4,6 Vamos testar as hipóteses Ho: µn = µt Ho: µn - µt = µD = 0 (o novo combustivel não altera o rendimento) Ha: µn > µt Ha: µn - µt = µD > 0 (o novo combustivel aumenta o rendimento) Como a variância populacional é desconhecida nosso teste será baseado na distribuição t com n-1 graus de liberdade. Nossa estatística de teste é D D 2,9 0 t 6,48 sD / n 2,4 12 Para α = 0,05 o valor crítico da tabela t com 11 graus de liberdade é 1,80. Como t>1,80 rejeitamos a hipótese nula, ou seja, a amostra fornece evidencia de que o novo combustível é eficaz na melhora do rendimento. valor-p = P(t>6,84)=1- P(t<6,84)= 1-0,9995=0,0005 Para α = 0,05 rejeitamos a hipótese nula, ou seja, a amostra fornece evidencia de que o novo combustível é eficaz na melhora do rendimento. Para α = 0,01 rejeitamos a hipótese nula, ou seja, a amostra fornece evidencia de que o novo combustível é eficaz na melhora do rendimento. valor-p < alfa: rejeito a hipótese nula ao nivel alfa de significancia, ou seja, as duas populaçõess tem variancias diferentes. valor-p > alfa: não rejeito a hipótese nula ao nivel alfa de significancia, ou seja, as duas populaçõess tem variancias iguais. CASO 2: Amostras independentes com variâncias populacionais conhecidas (teste Z) Exemplo: Queremos comparar dois medicamentos. 15 pacientes receberam o medicamento A e mediu-se o tempo até a cura (em dias). 15 pacientes receberam o medicamento B e mediu-se o tempo até a cura (em dias). Sabe-se que a variância populacional do tempo de cura para, tanto para o medicamento A quanto para o medicamento B, é de 10 dias. Paciente Medicamento A Medicamento B 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 182 185 193 175 184 192 175 173 186 178 162 179 164 182 186 192 176 176 190 197 190 186 193 100 115 185 180 190 186 194 Vamos testar as hipóteses Ho: µA = µB Ho: µA - µB = 0 (a eficiência dos dois tratamentos é a mesma) Ha: µA ≠ µB Ha: µA - µB ≠ 0 (a eficiência dos dois tratamentos não é a mesma) Como a variância populacional é conhecida nosso teste será baseado na distribuição Normal. Nossa estatística de teste é Z x A xB A2 nA B2 nB 179,73 177,67 2,65 10 10 15 15 Para α = 0,05 o valor crítico da tabela Normal é 1,960. Como |Z|>1,96 rejeitamos a hipótese nula, ou seja, a amostra fornece evidencia de que a eficiência dos dois tratamentos não é a mesma. valor-p = 2P(Z>2,65) = 2P(Z< -2,65) = 2.0,004 = 0,008 Para α = 0,05 rejeitamos a hipótese nula, ou seja, a amostra fornece evidencia de que a eficiência dos dois tratamentos não é a mesma. Para α = 0,01 rejeitamos a hipótese nula, ou seja, a amostra fornece evidencia de que a eficiência dos dois tratamentos não é a mesma. CASO 3: Amostras independentes com variâncias populacionais desconhecidas (teste t) a) Variâncias populacionais iguais (σ1= σ2) Exemplo: Queremos comparar dois medicamentos. 15 pacientes receberam o medicamento A e mediu-se o tempo até a cura (em dias). 15 pacientes receberam o medicamento B e mediu-se o tempo até a cura (em dias). Paciente Medicamento A Medicamento B 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 182 185 193 175 184 192 175 173 186 178 162 179 164 182 186 192 176 176 190 197 190 186 193 100 115 185 180 190 186 194 Vamos testar as hipóteses Ho: µA = µB Ho: µA - µB = 0 (a eficiência dos dois tratamentos é a mesma) Ha: µA > µB Ha: µA - µB > 0 (tratamento B é mais eficiente que tratamento A) Como a variância populacional é desconhecida nosso teste será baseado na distribuição t com n1+n2-2 graus de liberdade. Nossa estatística de teste é t x A xB 1 1 s n A nB 2 p onde 2 2 ( n 1 ) s ( n 1 ) s A 2 B s 2p 1 n1 n2 2 Então (n1 1)s A2 (n2 1)sB2 14.79,78 14.834,67 s 457,2 n1 n2 2 15 15 2 2 p t x A xB 1 1 s 2p n A nB 179,73 177,67 1 1 457,2 15 15 11,51 Para α = 0,05 o valor crítico da tabela t com 28 graus de liberdade é 1,701. Como t>1,701 rejeitamos a hipótese nula, ou seja, a amostra fornece evidencia de que o tratamento B é mais eficiente que o tratamento A. valor-p = P(t>11,51)=1- P(t<11,51) =1-1= 0 Para α = 0,05 rejeitamos a hipótese nula, ou seja, a amostra fornece evidencia de que o tratamento B é mais eficiente que o tratamento A. Para α = 0,01 rejeitamos a hipótese nula, ou seja, a amostra fornece evidencia de que o tratamento B é mais eficiente que o tratamento A. b) Variâncias populacionais diferentes (σ1 ≠ σ2) Exemplo: Queremos comparar dois medicamentos. 13 pacientes receberam o medicamento 1 e mediu-se o tempo até a cura (em dias). 12 pacientes receberam o medicamento 2 e mediu-se o tempo até a cura (em dias). Paciente Medicamento 1 Medicamento 2 1 182 192 2 185 196 x1 179,08 s12 88,91 x2 180,75 s22 458,39 3 193 176 4 5 6 7 8 9 10 11 12 13 175 184 192 175 173 186 178 162 179 164 190 197 190 186 193 148 127 185 189 Vamos testar as hipóteses Ho: µ1 = µ2 Ho: µ1 - µ2 = 0 (a eficiência dos dois tratamentos é a mesma) Ha: µ1 < µ2 Ha: µ1 - µ2 < 0 (tratamento 1 é mais eficiente que tratamento 2) Como a variância populacional é desconhecida nosso teste será baseado na distribuição t com v graus de liberdade. v s s 2 1 2 1 / n1 s / n2 2 2 2 2 2 2 / n1 s / n2 n1 1 n2 1 2 Nossa estatística de teste é x1 x2 179,08 180,75 0,25 2 2 88,91 458,39 s1 s2 13 12 n1 n2 t v s s 2 1 2 1 / n1 s / n2 2 2 2 2 2 2 / n1 s / n2 n1 1 n2 1 2 88,91/ 13 458,39 / 12 v 2 2 88,91/ 13 458,39 / 12 2 13 1 12 1 14,85 Para 5% de significância, o valor critico da tabela t com 15 graus de liberdade é -1,753. Como t=-0,25 não é menor que -1,753, não rejeitamos Ho. Ou seja, a amostra fornece evidencia de que a eficiência dos dois tratamentos é a mesma. valor-p = P(t < -0,25) = P(t > 0,25) = 1- P(t < 0,25) =1-0,6=0,4 Para α = 0,05 não rejeitamos a hipótese nula, ou seja, a amostra fornece evidencia de que a eficiência dos dois tratamentos é a mesma. Para α = 0,01 não rejeitamos a hipótese nula, ou seja, a amostra fornece evidencia de que a eficiência dos dois tratamentos é a mesma. Testes Paramétricos para comparação de duas médias Amostras Dependentes Amostras Independentes Teste t pareado gl = n-1 Variâncias populacionais conhecidas Teste Z Teste t Iguais Variâncias populacionais desconhecidas Diferentes gl = n1+ n2-2 Teste t gl = v Testes paramétricos aplicáveis se as duas populações seguem distribuição Normal. Caso as duas amostras sejam grandes (n>=30), testes paramétricos são validos mesmo se a distribuição não é Normal. Teste F para comparação de duas variâncias Ho: σ21 = σ22 Ha: σ21 ≠ σ22 A estatística de teste é 2 1 2 2 s F s Regiao de rejeicao de Ho Rejeitamos Ho se a estatistica F for menor que valor critico 1(f1) ou maior que valor critico 2 (f2). Os dois valores criticos (f1 e f2) sao positivos e podem ser obtidos na tabela F (n1-1 graus de liberdade no numerador e n2-1 graus de liberdade no denominador). f1 < f2 A area abaixo de f1 é igual a α/2 e a área acima de f2 é igual a α/2. Teste de Normalidade Ho: a amostra vem de uma população com distribuição Normal Ha: a amostra não vem de uma população com distribuição Normal valor-p < alfa: rejeito a hipótese nula ao nivel alfa de significancia, ou seja, a amostra não vem de uma população com distribuição Normal. valor-p > alfa: não rejeito a hipótese nula ao nivel alfa de significancia, ou seja, a amostra vem de uma população com distribuição Normal. Teste Z para duas proporções Suponha agora que estamos interessados em comparar duas populações com às suas proporções. Queremos realizar um teste de hipóteses onde a hipótese nula é Ho: p1 = p2 e a hipótese a aternativa é Ha: p1 ≠ p2 ou Ha: p1 > p2 ou Ha: p1 < p2 A estatitsica de teste é ^ Z ^ p1 p2 ^ ^ p(1 p)(1 / n1 1 / n2 ) ^ ^ n1 p1 n2 p2 p n1 n2 ^ O teste Z para proporcoes pode ser usado se n1 > 30 e n2>30.