Testes de Hipóteses para Diferença entre duas Médias Amostras independentes: variância conhecida e desconhecida Ivan Bezerra Allaman Introdução • Nas aulas anteriores o objetivo foi testar uma hipótese a respeito de um parâmetro de apenas uma população. • O interesse agora é comparar duas populações independentes quanto a um determinado parâmetro. • Tais comparações se dá por meio da diferença entre médias ou proporções destas populações com relação a um determinado valor hipotético. • Tecnicamente poderemos testar as seguintes hipóteses: • Em muitas aplicações µ0 = 0 ou π0 = 0, ou seja, na maioria dos casos o interesse é comparar se duas populações são iguais ou não. Considerando variância conhecida Estatística de teste • O estimador pontual da diferença entre duas médias populacionais µ1 − µ2 é X̄1 − X̄2 . • O erro padrão da diferença entre as médias populacionais é: s σX̄1 −X̄2 = σ12 σ2 + 2 n1 n2 • Portanto, a estatística de teste para comparar a diferença entre duas médias populacionais é: Z= (X̄1 − X̄2 ) − µ0 σX̄1 −X̄2 Exemplos 1. Considere os seguintes resultados, referentes a duas amostras aleatórias independentes tomadas de duas populações: Amostra 1 Amostra 2 n1 = 50 n2 = 35 X̄1 = 13, 6 X̄2 = 11, 6 σ1 = 2, 2 σ2 = 3 1 • Qual é a estimação por ponto da diferença entre as duas médias populacionais? xbarra1 = 13.6 xbarra2 = 11.6 xb1_xb2 = xbarra1 - xbarra2 xb1_xb2 ## [1] 2 • Qual é a estimação por ponto do erro padrão da diferença entre as duas médias populacionais? n1 = 50 sigma1 = 2.2 n2 = 35 sigma2 = 3 erro_paddif = sqrt(sigma1^2/n1 + sigma2^2/n2) erro_paddif ## [1] 0.5949 • Dado as seguintes hipótese, H0 : µ1 − µ2 = 0 H1 : µ1 − µ2 > 0 • Qual é o valor da estatística de teste? Z = (xb1_xb2 - 0)/erro_paddif Z ## [1] 3.362 • Qual é o p-valor? pvalor = 1-pnorm(Z) pvalor ## [1] 0.0003873 • Com α = 0, 05 qual é a sua conclusão? Resp: Como o p-valor é menor do que α, rejeita-se H0 com 95% de confiança. 2 Aplicações 1. Considere os dados seguintes, correspondentes a amostras aleatórias independentes tomadas de duas populações normais. Amostra 1 ## [1] 10 7 13 7 9 8 Amostra 2 ## [1] 8 7 8 4 6 9 Dados históricos anteriores forneceram os seguintes valores para as variâncias populacionais: σ12 = 6 e σ22 = 5.5 • Podemos afirmar com 99% de confiança que as duas populações são diferentes? Considerando variância desconhecida Introdução • Quando a variância for desconhecida, mais uma vez iremos nos recorrer a distribuição t-Student. • O erro padrão da diferença torna-se: s SX̄1 −X̄2 = S12 S2 + 2 n1 n2 • Logo, a estatística de teste é dada pela seguinte expressão: t= (X̄1 − X̄2 ) − µ0 SX̄1 −X̄2 Graus de liberdade • O cálculo do graus de liberdade é dada pela expressão de Satterthwaite: S12 S22 n1 + n2 2 2 φ= 1 n1 −1 S1 n1 + 2 1 n2 −1 • Usando o R para facilitar sua vida. • Vou fazer uma funçãozinha para fazer todo esse cálculo. 3 S22 n2 2 phi = function(var1,var2,n1,n2){ numerador = (var1/n1 + var2/n2)^2 denominador1 = 1/(n1-1) * (var1/n1)^2 denominador2 = 1/(n2-1) * (var2/n2)^2 res = numerador/(denominador1 + denominador2) return(res) } • Exemplo de como usá-la. • Copie e cole a função acima no seu script. Rode toda ela como qualquer objeto do R. • Agora supondo que var1 = 5, n1 = 10, var2 = 7 e n2 = 13. Então: var1 n1 = var2 n2 = = 5 10 = 7 13 gliberdade = phi(var1,var2,n1,n2) gliberdade ## [1] 20.76 Exemplos 1. O College Board divulgou comparações sobre as pontuações no Scholastic Aptitude Test (SAT) baseandose no nível educacional mais elevado obtido pelos pais da pessoa que faz os exames. Uma das hipóteses de pesquisa era que os estudantes cujos pais haviam obtido um nível mais elevado de educação obteriam uma pontuação média mais elevada no SAT. Durante 2003, a média global dos exames orais do SAT foi 507. As pontuações nos exames orais do SAT para amostras independentes de estudantes estão nos dados a seguir. A primeira amostra exibe pontuações nos exames orais do SAT correspondentes a estudantes cujos pais têm diplomas universitários com graus de bacharel. A segunta amostra exibe as pontuações nos exames orais do SAT de estudantes cujos pais têm diplomas do segundo grau, mais não tem diplomas universitários. Qua é a conclusão? dados <- read.table("http://nbcgib.uesc.br/lec/download/R/dados/sat_anderson_etal.txt", h = T) #----------------- Opção 1 - na unha! ----------------------# comdiploma <- subset(dados, instrucaopais=='comdiploma') semdiploma <- subset(dados, instrucaopais=='semdiploma') media_comdip <- with(comdiploma, mean(pontuacaoSAT)) var_comdip <- with(comdiploma, var(pontuacaoSAT)) n_comdip <- with(comdiploma, length(pontuacaoSAT)) media_semdip <- with(semdiploma, mean(pontuacaoSAT)) var_semdip <- with(semdiploma, var(pontuacaoSAT)) n_semdip <- with(semdiploma, length(pontuacaoSAT)) 4 # obtendo o estimador pontual da diferença entre médias mcom_sem <- media_comdip - media_semdip mcom_sem ## [1] 38.12 # obtendo o erro padrão da diferença erropad_dif <- sqrt(var_comdip/n_comdip + var_semdip/n_semdip) erropad_dif ## [1] 21.05 # obtendo os graus de liberdade glib <- phi(var_comdip, var_semdip, n_comdip, n_semdip) glib ## [1] 25.33 # obtendo a estatística t dif_hipotetica = 0 t_calc <- (mcom_sem - dif_hipotetica)/erropad_dif t_calc ## [1] 1.811 pvalor = 1-pt(t_calc,glib) pvalor ## [1] 0.04101 #----- Opção 2 - Utilizando uma função pronta do R --------# t.test(with(comdiploma, pontuacaoSAT), with(semdiploma, pontuacaoSAT), alternative = 'greater') ## ## ## ## ## ## ## ## ## ## ## Welch Two Sample t-test data: with(comdiploma, pontuacaoSAT) and with(semdiploma, pontuacaoSAT) t = 1.811, df = 25.33, p-value = 0.04101 alternative hypothesis: true difference in means is greater than 0 95 percent confidence interval: 2.184 Inf sample estimates: mean of x mean of y 525.1 487.0 5 Aplicações 1. A FedEx e a United Parcel Service (UPS) são dois dos principais serviços de entrega de encomendas em termos de volume e receita. De acordo com o Airports Council International, o Memphis International Airport (FedEx) e o Louisville International Airport (UPS) são dois dos maiores aeroportos de carga do mundo. As seguintes amostras aleatórias apresentam as toneladas de carga por dia manipuladas por esses dois aeroportos. Os dados estão expressos em milhares de toneladas. Memphis 9,1-15,1-8,8-10,0-7,5-10,5-8,3-9,1-6,0-5,8-12,1-9,3 Louisville 4,7-5,0-4,2-3,3-5,5-2,2-4,1-2,6-3,4-7,0 Podemos afirmar que os dois aeroportos movimentam em média o mesmo volume? 2. (Estudo de caso). O Clearwater National Bank realiza um estudo idealizado para identificar as diferenças na utilização das contas correntes pelos clientes em dois de seus bancos filiais. Uma amostra aleatória simples de 28 contas correntes é selecionada da filial situada em Cherry Grove e uma amostra aleatória simples independente é selecionada de sua filial em Beechmont. O saldo atual da conta corrente é registrado para cada uma das contas. Podemos afirmar que há diferença no saldo médio bancário entre os dois bancos filiais?. 6