ESTATÍSTICA APLICADA Capítulo 6 Estimativas e Tamanho de Amostras Prof. Paulo Renato de Morais Introdução à Estimação Estimadores 1. Variáveis aleatórias usadas para estimar um parâmetro populacional Média amostral, proporção amostral, mediana amostral 2. Exemplo: Média amostral`x é um estimador da média populacional m Se`x = 50, então 50 é a estimativa de m 3. Base teórica é a distribuição amostral Propriedades da Distribuição Amostral da Média 1. Não-viciada Média da distribuição igual à média populacional 2. Eficiente Média amostral aproxima-se mais da média populacional do que qualquer outro estimador não-viciado 3. Consistente Quando tamanho da amostra cresce, variação da média amostral decresce Não-Viciada P(`X) Não-viciada Viciada C A m `X Eficiente P(`X) Distribuição amostral da média B Distribuição amostral da mediana A m `X Consistente P(`X) Amostra maior B Amostra menor A m `X Processo de Estimação População Amostra Aleatória Média, m, é desconhecida MédiaJ J`X = 50 J J J J J Amostra J J J J Tenho 95% de confiança que m está entre 42 e 58. Parâmetros Desconhecidos da População são Estimados Estimar parâmetro populacional... Média m com estatística amostral `x Proporção p Variância s Diferenças 2 m1 - m 2 p^ s 2 `x1 -`x2 Métodos de Estimação Estimação Estimação por Ponto Estimação por Intervalo Estimação por Ponto Estimação por Ponto 1. Proporciona um único valor Baseada em observações de 1 amostra 2. Não dá informação sobre quão perto o valor está do parâmetro populacional desconhecido 3. Exemplo: Média amostral`x = 50 é estimativa por ponto da média populacional desconhecida Estimação por Intervalo Estimação por Intervalo 1. Proporciona intervalo de valores Baseada em observações de 1 amostra 2. Dá informação sobre proximidade do parâmetro populacional desconhecido Afirmação em termos de probabilidade Saber a proximidade exata requer conhecer o parâmetro populacional desconhecido 3. Exemplo: média populacional desconhecida está entre 42 e 58 com 95% de confiança Elementos Chaves da Estimação por Intervalo Uma probabilidade que o parâmetro populacional esteja em algum lugar dentro do intervalo. Estatística amostral (estimativa por ponto) Intervalo de confiança Limite de confiança (inferior) Limite de confiança (superior) Limites de Confiança para a Média Populacional Parâmetro = Estatística ± Erro (1) m X Erro (2) Erro X m ou X m (3) Z X m sx (4) Erro Zs x (5) m X Zs x © 1984-1994 T/Maker Co. Erro sx Nível de Confiança 1. Probabilidade que o parâmetro populacional desconhecido esteja dentro do intervalo 2. Denotado por (1 - a) % a é a probabilidade que o parâmetro não esteja no intervalo 3. Valores típicos são: 99%, 95%, 90% Intervalos e Nível de Confiança Distribuição Amostral da a/2 Média _ sx 1-a a/2 m`x = m _ X (1 - a) % dos intervalos contêm m. Intervalos vão de X - Zs`X a `X + Zs`X a % não. Número grande de intervalos Fatores que Afetam o Comprimento do Intervalo 1. Dispersão dos dados Medida por s Intervalos vão de `X - Zs`X a`X + Zs`X 2. Tamanho da amostra s`X = s / n 3. Nível de confiança (1 - a) Afeta Z © 1984-1994 T/Maker Co. Intervalo de Confiança para Estimar a Média (Amostra Grande) Intervalo de Confiança para a Média (Amostra Grande) 1. Hipóteses: Tamanho da amostra no mínimo 30 (n 30) Amostragem aleatória Se o desvio padrão populacional é desconhecido, use o desvio padrão amostral 2. Intervalo de Confiança: X Za / 2 s n m X Za / 2 s n Exemplo de Estimação da Média (Amostra Grande) A média de uma amostra aleatória com n = 36 é`X = 50. Construa um intervalo com 95% de confiança para m se s = 12. Exemplo de Estimação da Média (Amostra Grande) A média de uma amostra aleatória com n = 36 é`X = 50. Construa um intervalo com 95% de confiança para m se s = 12. X Za / 2 50 1,96 s n 12 36 m X Za / 2 m 50 1,96 46,08 m 53,92 s n 12 36 Questão Você é um inspetor de qualidade. O s para garrafas de 2 litros é 0,05 litros. Uma amostra aleatória de 100 garrafas forneceu`X = 1,99 litros. Qual é o intervalo com 90% de confiança para a média verdadeira da quantidade em garrafas de 2 litros? 22 liter liter © 1984-1994 T/Maker Co. Solução do Intervalo de Confiança X Za / 2 1,99 1,645 s n 0,05 m X Za / 2 s m 1,99 1,645 100 1,982 m 1,998 n 0,05 100 Achando o Tamanho da Amostra Achando o Tamanho da Amostra para Estimar m (1) (2) Z Xm sx Erro sx Erro Zs x Z Z s 2 (3) n 2 Erro 2 Eu não quero amostra muito grande nem muito pequena! s n Exemplo de Tamanho da Amostra Que tamanho de amostra é necessário para se estar com 90% de confiança de se estar correto dentro de 5? Um estudo piloto mostrou que o desvio padrão é 45. Exemplo de Tamanho da Amostra Que tamanho de amostra é necessário para se estar com 90% de confiança de se estar correto dentro de 5? Um estudo piloto mostrou que o desvio padrão é 45. 2 n (Za / 2 ) s Erro 2 2 1, 645 2 5 2 45 2 219 , 2 220 Questão Você trabalha em Recursos Humanos. Você deseja saber o gasto médio dos empregados com saúde. Você quer ter uma confiança de 95% que a média amostral esteja dentro de ± $50. Um estudo piloto mostrou que s é $400. Que tamanho de amostra você usará? Solução do Tamanho da Amostra 2 n (Za / 2 ) s Erro 2 2 1,96 400 50 2 2 2 245 ,86 246 Correção para População Finita Correção para População Finita 1. Usada quando tamanho da amostra é grande comparada ao tamanho da população Se n/N > 0,05, use o fator de correção Correção para População Finita 1. Usada quando tamanho da amostra é grande comparada ao tamanho da população Se n/N > 0,05, use o fator de correção 2. Fator de correção: Nn N 3. Intervalo de confiança para média com fator: X t a / 2, n 1 S n Nn N m X t a / 2, n 1 S n Diminui o comprimento do intervalo de confiança Nn N Intervalo de Confiança para Estimar a Média (Amostra Pequena) Intervalo de Confiança para a Média (Amostra Pequena) 1. Hipóteses: Tamanho da amostra menor que 30 (n < 30) População distribuída normalmente Desvio padrão populacional desconhecido 2. Usa distribuição t de Student Intervalo de Confiança para a Média (Amostra Pequena) 1. Hipóteses: Tamanho da amostra menor que 30 (n < 30) População distribuída normalmente Desvio padrão populacional desconhecido 2. Usa distribuição t de Student 3. Intervalo de confiança: X t a / 2, n 1 S n m X t a / 2, n 1 S n Distribuição t de Student Normal Padrão Forma de sino t (gl = 13) Simétrica Cauda mais ‘longa’ 0 Z t Tabela da t de Student Suponha: n=3 gl = n - 1 = 2 a = 0,10 a/2 = 0,05 a/2 v t.10 t.05 t.025 1 3.078 6.314 12.706 2 1.886 2.920 4.303 3 1.638 2.353 3.182 0,05 0 Valores de t 2,920 t Graus de Liberdade (gl) 1. Número de observações que podem variar após a estatística amostral ser calculada 2. Exemplo: Soma de 3 números é 6 X1 = X2 = X3 = Soma = 6 Graus de Liberdade (gl) 1. Número de observações que podem variar após a estatística amostral ser calculada 2. Exemplo: Soma de 3 números é 6 X1 = 1 (Ou outro número) X2 = 2 (Ou outro número) X3 = 3 (Não pode variar) Soma = 6 Graus de liberdade = n -1 = 3 -1 =2 Exemplo de Estimação da Média (Amostra Pequena) Uma amostra aleatória com n = 25 tem x = 50 e s = 8. Construa um intervalo com 95% de confiança para m. Exemplo de Estimação da Média (Amostra Pequena) Uma amostra aleatória com n = 25 tem x = 50 e s = 8. Construa um intervalo com 95% de confiança para m. X t a / 2,n1 50 2,0639 S n 8 25 m X t a / 2,n1 S m 50 2,0639 46,69 m 53,30 n 8 25 Questão Você é um analista estudando o tempo de manufatura de um produto. Os seguintes tempos foram medidos (em min.): 3,6; 4,2; 4,0; 3,5; 3,8; 3,1. Qual é o intervalo com 90% de confiança para o tempo médio de manufatura? Solução do Intervalo de Confiança `X = 3,7 S = 0,38987 n = 6, gl = n - 1 = 6 - 1 = 5 S / n = 0,38987 / 6 = 0,1592 t0,05;5 = 2,0150 3,7 - (2,015)(0,1592) m 3,7 + (2,015)(0,1592) 3,379 m 4,021 Intervalo de Confiança para uma Proporção Dados Qualitativos 1. Variáveis aleatórias qualitativas são classificadas por um atributo p.e., qualidade (perfeita, defeituosa) 2. As medidas refletem no em cada categoria 3. Escala nominal ou ordinal 4. Exemplos: As duas peças fabricadas encaixam ou não? A dimensão da peça está dentro do especificado ou não? Proporções 1. Envolve variáveis qualitativas 2. Fração ou % da população na categoria 3. Se houver apenas dois resultados possíveis, distribuição binomial Possui ou não possui a característica Proporções 1. Envolve variáveis qualitativas 2. Fração ou % da população na categoria 3. Se houver apenas dois resultados possíveis, distribuição binomial Possui ou não possui a característica ^ 4. Proporção amostral (p) p̂ x n número de sucessos tamanho da amostra Distribuição Amostral da Proporção 1. Aproximada por distribuição normal n pˆ 3 n pˆ (1 pˆ ) exclui 0 ou n 2. Média Desvio padrão s pˆ ^ P(P ) .3 .2 .1 .0 ^ P .0 m P p 3. Distribuição Amostral p (1 p ) n .2 .4 .6 m P p .8 1.0 Intervalo de Confiança para a Proporção 1. Hipóteses: Dois resultados possíveis População segue distribuição binomial Aproximação pela Normal pode ser usada n pˆ 3 n pˆ (1 pˆ ) não inclui 0 ou n 2. Intervalo de confiança: z p a 2 (1 p ) p n z pp a 2 p (1 p ) n Exemplo de Estimação da Proporção Uma amostra aleatória de 400 alunos mostrou que 32 fizeram pós-graduação. Construa um intervalo com 95% de confiança para p. Exemplo de Estimação da Proporção Uma amostra aleatória de 400 alunos mostrou que 32 fizeram pós-graduação. Construa um intervalo com 95% de confiança para p. p̂ Za / 2 0,08 1,96 p̂ (1 p̂) n 0,08 (1 0,08) p p̂ Za / 2 p 0,08 1,96 400 p̂ (1 p̂) n 0,08 (1 0,08) 400 0,053 p 0,107 Questão Você é responsável por anúncios no jornal. Você quer encontrar a % de erros. De 200 anúncios, 35 tinham erros. Qual é o intervalo com 90% de confiança para a proporção de erros? Solução do Intervalo de Confiança p̂ Z a / 2 0 ,175 1, 645 p̂ (1 p̂ ) n 0 ,175 0 ,825 p p̂ Z a / 2 p̂ (1 p̂ ) p 0 ,175 1, 645 200 0 ,1308 p 0 , 2192 n 0 ,175 0 ,825 200 Tamanho da Amostra para Estimar a Proporção p Tamanho da Amostra para Estimar a Proporção p 1. Quando se conhece uma estimativa p̂ 2 n ( Z a / 2 ) p̂ (1 p̂ ) Erro 2 p̂ 2. Quando não se conhece uma estimativa p̂ n (Za / 2 ) 4 Erro 2 2 Exemplo de Tamanho da Amostra para Estimar a Proporção p Que tamanho de amostra é necessário para se estimar a proporção de motoristas que falam ao celular enquanto dirigem com 95% de confiança de se estar correto dentro de uma margem de erro de 3%? A) Suponha que um estudo piloto mostrou que 18% dos motoristas falam ao celular. B) Suponha que não se tem qualquer informação sobre essa proporção. Exemplo de Tamanho da Amostra para Estimar a Proporção p A) 2 n ( Z a / 2 ) p̂ (1 p̂ ) Erro 2 2 1,96 0 ,18 0 ,82 0 , 03 2 630 , 02 631 B) n (Za / 2 ) 4 Erro 2 2 1,96 2 4 0 , 03 2 1 . 067 ,11 1 . 068 Intervalo de Confiança para a Variância Intervalo de Confiança para a Variância 1. Hipóteses: Amostragem aleatória População segue distribuição normal 2. Usa a distribuição qui-quadrado 3. Intervalo de confiança: (n 1) s 2 2 a / 2, n 1 2 s (n 1) s 2 2 1 a / 2, n 1 Exemplo de Estimação da Variância Uma amostra aleatória com n = 25 tem s2 = 8. Construa um intervalo com 95% de confiança para s2. Exemplo de Estimação da Variância Uma amostra aleatória com n = 25 tem s2 = 8. Construa um intervalo com 95% de confiança para s2. ( n 1) s 2 2 a / 2, n 1 ( 25 1) 8 s 2 s 2 39,364 4,88 s ( n 1) s 2 2 1 a / 2, n 1 ( 25 1) 8 12,401 2 15,48 Questão Você é um analista estudando o tempo de manufatura de um produto. Os seguintes tempos foram medidos (em min.): 3,6; 4,2; 4,0; 3,5; 3,8; 3,1. Qual é o intervalo com 90% de confiança para a variância do tempo de manufatura? Solução do Intervalo de Confiança `X = 3,7 S = 0,38987 S2 = 0,152 n = 6, gl = n - 1 = 6 - 1 = 5 20,05;5 = 11,071 20,95;5 = 1,145 5 (0,152)/11,071 s2 5 (0,152)/1,145 0,06865 s2 0,66376 0,26201 s 0,81471