ESTATÍSTICA APLICADA Capítulo 8 Inferências com Base em Duas Amostras Prof. Paulo Renato de Morais Amostragem Independente e Dependente Amostragem Independente e Dependente Independente 1. Fontes de dados diferentes Não relacionadas Independentes Dependente 1. Mesma fonte de dados Pares Medidas repetidas (antes/depois) Amostragem Independente e Dependente Independente 1. Fontes de dados diferentes Não relacionadas Independentes 2. Usa diferença entre as 2 médias amostrais X1 -X2 1. dados Dependente Mesma fonte de Pares Medidas repetidas (antes/depois) 2. Usa diferença entre cada par de observações Dn = X1n - X2n Exemplos de Populações Independentes 1. Um dentista deseja determinar se há diferença no número médio de cáries em 2 grupos de classes sociais diferentes. 2. O Ministério da Educação deseja comparar as notas no Provão entre alunos de universidades públicas e privadas. Exemplos de Populações Dependentes 1. A Nike deseja verificar se há diferença na durabilidade de 2 materiais para sola. Um tipo é colocado em um dos pés do tênis, o outro tipo é colocado no outro pé do mesmo par de tênis. 2. Uma universidade deseja comparar as notas de alunos em um simulado do Provão antes e depois de um curso de revisão. Testando Duas Médias Populacionais Dependentes Experimentos de Pares Teste para Diferença de Médias para Amostras aos Pares 1. Testa médias de 2 populações relacionadas Pares Medidas repetidas (antes/depois) 2. Elimina variação entre elementos 3. Hipóteses: Amostras aleatórias independentes Ambas populações com distribuição normal (caso de pequenas amostras somente) Tabela de Coleta de Dados para Teste de Amostras aos Pares Observação Grupo 1 Grupo 2 Diferença 1 x11 x21 D1 = x11-x21 2 x12 x22 D2 = x12-x22 ... ... ... i x1i x2i ... ... ... n x1n x2n ... Di = x1i - x2i ... Dn = x1n - x2n Teste t para Amostras aos Pares xD D0 t SD gl nD 1 nD n xD Di i 1 nD Média Amostral n SD i 1 2 Di nD D nD 1 Desvio Padrão Amostral 2 Exemplo de Teste t para Amostras aos Pares Você deseja saber se um programa de treinamento foi efetivo. Você coletou as seguintes notas de um teste padrão: Nome Antes (A) Depois (B) Samuel 85 94 Tadeu 94 87 Bruno 78 79 Marcos 87 88 Ao nível de 0,10, o treinamento foi efetivo? Tabela de Cálculos Observação Antes Depois Diferença Samuel 85 94 -9 Tadeu 94 87 7 Bruno 78 79 -1 Marcos 87 88 -1 Total -4 Solução da Hipótese Nula 1. O treinamento foi efetivo? 2. Efetivo significa ‘Depois’ > ‘Antes’. 3. Estatisticamente, significa B > A. 4. Rearranjando termos, dá 0 A - B. 5. Definindo D = A - B e substituindo em (4), dá 0 D ou D . 6. A hipótese alternativa é H1: D 0. Solução do Teste t para Amostras aos Pares H0: D = 0 (D = A - B) Estatística de Teste: H1: D < 0 xD D 0 1 0 t ,306 = 0,10 SD 6,53 gl = 4 - 1 = 3 nD 4 Valor Crítico: Decisão: Reject Não rejeitar com = 0,10 .10 -1.6377 0 t Conclusão: Não há evidência que treinamento foi efetivo Estimação por Intervalo: Diferença de Duas Médias Populacionais Independentes Caso de Amostras Grandes Intervalo de Confiança para Amostras Grandes 1. Hipóteses: Amostras aleatórias independentes Tamanho de ambas as amostras no mínimo 30 (n1 30 e n2 30 ) Se 1 e 2 desconhecidos, use dados amostrais Intervalo de Confiança para Amostras Grandes 1. Hipóteses: Amostras aleatórias independentes Tamanho de ambas as amostras no mínimo 30 (n1 30 e n2 30 ) Se 1 e 2 desconhecidos, use dados amostrais 2. Intervalo de confiança para 1 - 2: x1 x2 Zα/2 2 σ1 n1 2 σ2 n2 Exemplo de Estimação de Duas Médias (Amostras Grandes) Usando os seguintes dados sobre preços de automóveis, construa um intervalo com 95% de confiança para a diferença entre os preços médios populacionais. Tamanho amostra Média amostral D. padr. amostral EUA Vendas 50 $14.545 $ 1.989 Japão Vendas 30 $15.243 $ 1.843 Solução do Exemplo de Estimação x1 x2 Zα/2 2 σ1 n1 2 σ2 n2 14.545 15.243 1,96 1.989 2 50 698 1,96 438,57 698 860 (1.558, 162) 1.843 30 2 Testando Duas Médias Populacionais Independentes Teste Z para Amostras Grandes Teste Z de Duas Médias Independentes (Amostra Grande) 1. Hipóteses: Amostras aleatórias independentes Tamanho de ambas as amostras no mínimo 30 (n1 30 e n2 30 ) Teste Z para Duas Médias Independentes (Amostra Grande) 1. Hipóteses: Amostras aleatórias independentes Tamanho de ambas as amostras no mínimo 30 (n1 30 e n2 30 ) 2. Teste Z para duas amostras independentes: Z (X1 X 2 ) 1 2 2 1 2 2 n1 n2 (X1 X 2 ) 1 2 2 s1 n1 s2 2 n2 Exemplo de Teste Z para Amostras Grandes Você é um analista financeiro. Você deseja saber se há diferença nos rendimentos em dividendos entre ações listadas no NYSE e NASDAQ. Você coletou os seguintes dados: NYSE NASDAQ Número 121 125 Média 3,27 2,53 Desv. Pad. 1,30 1,16 Há diferença no rendimento médio ( = 0,05)? © 1984-1994 T/Maker Co. Solução do Teste Z para Amostras Grandes H0: 1 - 2 = 0 (1 = 2) H1: 1 - 2 0 (1 2) 0,05 n1 = 121, n2 = 125 Valores Críticos: Reject H0 Reject H0 .025 .025 -1.96 0 1.96 z Estatística de Teste: 3,27 2,5 z 4,69 3 1698 , 1353 , 121 125 Decisão: Rejeitar com = 0,05 Conclusão: Há evidência de diferença nas médias Comparando 2 Variâncias Populacionais Independentes: Teste F Teste F para Duas Variâncias 1. Testa a diferença entre 2 variâncias populacionais 2. Hipóteses Ambas populações são normalmente distribuídas Teste não é robusto quanto a violações Amostras aleatórias independentes Teste F para Variâncias: Hipóteses e Estatística de Teste 1. Hipóteses H0: 12 = 22 H1: 12 22 OU H0 : 1 2 2 2 H1: 12 22 (ou >) 2. Estatística de teste F = s12 /s22 Dois conjuntos de graus de liberdade 1 = n1 - 1; 2 = n2 - 1 Segue a distribuição F Teste F para 2 Variâncias: Valores Críticos 0 F Teste F para 2 Variâncias: Valores Críticos Rejeita H 0 0 Rejeita H 0 F Teste F para 2 Variâncias: Valores Críticos Reject H0 Reject H0 Do Not Reject H0 0 F Teste F para 2 Variâncias: Valores Críticos Reject H0 Reject H0 Do Not Reject H0 /2 0 /2 F Teste F para 2 Variâncias: Valores Críticos Reject H0 Reject H0 Do Not Reject H0 /2 0 /2 F FU ( / 2; 1, 2 ) Teste F para 2 Variâncias: Valores Críticos Reject H0 Reject H0 Do Not Reject H0 /2 /2 F 0 FL ( / 2; 1, 2 ) 1 FU ( / 2; 2 , 1 ) FU ( / 2; 1, 2 ) Note! Exemplo de Teste F para Variâncias Você é um analista financeiro. Você deseja comparar dividendos de ações listadas na NYSE e na NASDAQ. Você coletou os seguintes dados: NYSE NASDAQ Número 21 25 Média 3,27 2,53 Desv. Pad. 1,30 1,16 Há diferença de variâncias entre a NYSE e a NASDAQ ao nível de 0,05? © 1984-1994 T/Maker Co. Solução do Teste F para 2 Variâncias H0: 12 = 22 H1: 12 22 1 2 Valores Críticos: Estatística de Teste: Decisão: Conclusão: Solução do Teste F para 2 Variâncias H0: 12 = 22 H1: 12 22 0,05 1 20 2 24 Valores Críticos: Estatística de Teste: Decisão: Conclusão: Solução do Teste F para 2 Variâncias Reject H0 /2 = 0,025 Reject H0 Do Not Reject H0 /2 = 0,025 F 0 FU (.025; 20, 24 ) 2.33 FL (.025; 20, 24 ) 1 FU (.025; 24, 20) 1 0.415 2.41 Solução do Teste F para 2 Variâncias H0: 12 = 22 H1: 12 22 0,05 1 20 2 24 Valores Críticos: Reject Decisão: Reject .025 0 0.415 Estatística de Teste: .025 2.33 Conclusão: F Solução do Teste F para 2 Variâncias H0: 12 = 22 H1: 12 22 0,05 1 20 2 24 Valores Críticos: Reject F S12 S2 2 1,30 2 1,162 Decisão: Reject .025 0 0.415 Estatística de Teste: .025 2.33 Conclusão: F 1,25 Solução do Teste F para 2 Variâncias H0: 12 = 22 H1: 12 22 0,05 1 20 2 24 Valores Críticos: Reject F 2 1,30 2 1,162 1,25 Decisão: Não rejeitar com = 0,05 .025 2.33 S12 S2 Reject .025 0 0.415 Estatística de Teste: Conclusão: F Solução do Teste F para 2 Variâncias H0: 12 = 22 H1: 12 22 0,05 1 20 2 24 Valores Críticos: Reject F 2 1,30 2 1,162 1,25 Decisão: Não rejeitar com = 0,05 .025 2.33 S12 S2 Reject .025 0 0.415 Estatística de Teste: F Conclusão: Não há evidência de diferença nas variâncias Questão Você é um analista para a companhia de luz. Você deseja comparar o consumo de eletricidade de casas em 2 cidades. Você obteve os seguintes dados de uma amostra de casas: Cidade 1 Cidade 2 Número 25 21 Média $ 85 $ 68 Desv. Pad. $ 30 $ 18 Ao nível de 0,05, há evidência de diferença nas variâncias das duas cidades? Solução H0: H1: 1 24 2 Valores Críticos: Estatística de Teste: Decisão: Conclusão: Solução H0: 12 = 22 H1: 12 22 0,05 1 24 2 20 Valores Críticos: Estatística de Teste: Decisão: Conclusão: Solução Reject H0 /2 = 0,025 Reject H0 Do Not Reject H0 /2 = 0,025 F 0 FU (.025; 24, 20) 2.41 FL (.025; 24, 20) 1 FU (.025; 20, 24 ) 1 0.429 2.33 Solução H0: 12 = 22 H1: 12 22 0,05 1 24 2 20 Valores Críticos: Reject Decisão: Reject .025 0 0.429 Estatística de Teste: .025 2.41 Conclusão: F Solução H0: 12 = 22 H1: 12 22 0,05 1 24 2 20 Valores Críticos: Reject F S12 S2 2 30 2 182 Decisão: Reject .025 0 0.429 Estatística de Teste: .025 2.41 Conclusão: F 2,778 Solução H0: 12 = 22 H1: 12 22 0,05 1 24 2 20 Valores Críticos: Reject F 2 30 2 182 2,778 Decisão: Rejeitar com = 0,05 .025 2.41 S12 S2 Reject .025 0 0.429 Estatística de Teste: Conclusão: F Solução H0: 12 = 22 H1: 12 22 0,05 1 24 2 20 Valores Críticos: Reject F 2 30 2 182 2,778 Decisão: Rejeitar com = 0,05 .025 2.41 S12 S2 Reject .025 0 0.429 Estatística de Teste: F Conclusão: Há evidência de diferença nas variâncias Testando as Médias de Duas Populações Independentes Teste t para Amostras Pequenas Teste t para Duas Médias Independentes (Amostra Pequena) 1. Testa médias de 2 populações independentes com variâncias iguais 2. Hipóteses: Tamanho de ao menos uma das amostras menor que 30 Amostras aleatórias independentes Ambas populações com distribuição normal Variâncias populacionais são desconhecidas mas supostas iguais Teste t para Amostras Pequenas X 1 X 2 μ1 μ 2 t SP SP 2 2 1 1 n1 n 2 Diferença suposta n1 1 S 12 n 2 1 S 2 2 n1 n 2 2 gl n1 n 2 2 Exemplo de Teste t para Amostras Pequenas Você é um analista financeiro. Você deseja saber se há diferença nos rendimentos em dividendos entre ações listadas no NYSE e NASDAQ. Você coletou os seguintes dados: NYSE NASDAQ Número 21 25 Média 3,27 2,53 Desv. Pad. 1,30 1,16 Supondo populações normais, há diferença no rendimento médio ( = 0,05)? © 1984-1994 T/Maker Co. Solução do Teste t para Amostras Pequenas X1 X 2 μ1 μ2 3,27 2,53 0 t 1 1 SP n1 n2 2 SP 1 1 1,510 21 25 2 2 n 1 S n 1 S 2 1 2 2 1 n1 n2 2 21 1 1,30 2 25 1 1,16 2 21 25 2 1,510 2,03 Solução do Teste t para Amostras Pequenas H0: 1 - 2 = 0 (1 = 2) Ha: 1 - 2 0 (1 2) 0,05 gl 21 + 25 - 2 = 44 Valores Críticos: Reject H00 Reject H00 .025 .025 -2.0154 0 2.0154 t Estatística de Teste: t 3,27 2,53 1 1 1,510 21 25 2,03 Decisão: Rejeitar com = 0,05 Conclusão: Há evidência de diferença nas médias Teste Z para Diferenças entre Duas Proporções Teste Z para Diferença entre Duas Proporções 1. Hipóteses: Populações são independentes Populações seguem distribuição binomial Aproximação pela Normal pode ser usada np ˆ 3 npˆ 1 pˆ não contém 0 ou n Teste Z para Diferença entre Duas Proporções 1. Hipóteses: Populações são independentes Populações seguem distribuição binomial Aproximação pela Normal pode ser usada np ˆ 3 npˆ 1 pˆ não contém 0 ou n 2. Teste Z para duas proporções: pˆ 1 pˆ 2 p1 p2 Z 1 1 pˆ 1 pˆ n1 n2 X1 X 2 onde pˆ n1 n2 Exemplo de Teste Z para Duas Proporções Você quer testar a percepção de justiça de dois métodos de avaliação de desempenho. 63 de 78 empregados acharam o Método 1 justo. 49 de 82 acharam o Método 2 justo. Ao nível de 0,01, há diferença nas percepções? Solução do Teste Z para Duas Proporções ˆp1 X1 63 0,808 n1 78 ˆp2 X 2 49 0,598 n2 82 ˆp X1 X 2 63 49 0,70 n1 n2 78 82 Z pˆ 1 pˆ 2 p1 p2 ˆp 1 pˆ 1 1 n n 2 1 2,90 0,808 0,598 0 1 1 0,70 1 0,70 78 82 Solução do Teste Z para Duas Proporções H0: p1 - p2 = 0 H1: p1 - p2 0 = 0,01 n1 = 78 n2 = 82 Valores Críticos: Reject H00 Reject H00 .005 .005 -2.58 0 2.58 Z Estatística de Teste: Z 2.90 Decisão: Rejeitar com = 0,01 Conclusão: Há evidência de diferença nas proporções