UNIVERSIDADE FEDERAL DA PARAÍBA Distribuição Amostral Luiz Medeiros de Araujo Lima Filho Departamento de Estatística INTRODUÇÃO • A Inferência Estatística é um conjunto de técnicas que objetiva estudar a população através de evidências fornecidas por uma amostra. • É a amostra que contém os elementos que podem ser observados e, a partir daí, quantidades de interesse podem ser medidas. x • A Distribuição Amostral retrata o comportamento de uma estatística (média, proporção, entre outras), caso retirássemos todas as possíveis amostras de tamanho “n” de uma população. • Uma estatística é uma função da amostra. Uma amostra consiste de observações de uma variável aleatória. Assim, estatísticas também são variáveis aleatórias e, por isso, possuem uma distribuição de probabilidade. x DISTRIBUIÇÃO AMOSTRAL DA MÉDIA Considere uma população de 5 elementos (N = 5): 2, 3, 6, 8 e 11. Determine todas as amostras possíveis com reposição e calcule a média e a variância Solução: Na população, temos que µ=6 e σ2=10,8. Amostra (2,2) (2,3) (2,6) (2,8) (2,11) (3,2) .... (11,11) X 2 2,5 4 5 6,5 2,5 .... 11 S2 0 0,5 8 18 40,5 0,5 .... 0 • Seja X1, X2, ..., Xn uma a.a.s. retirada de uma população X. Temos que X1, X2, ..., Xn são independentes, com E(Xi) = µ e Var(Xi) = σ2. Assim, se X tem distribuição normal ou n > 30 (Teorema Central do Limite), temos que x • Suponha que podemos extrair todas as amostras de tamanho n (sem reposição) de uma população finita de tamanho N, neste caso temos que: µX = µ e σ X = σ n N −n N −1 N − n N − 1 A quantidade é conhecida como o fator de correção amostral para população finita, ou simplesmente “Fator de Correção”. • Se o tamanho da população for muito grande, infinito ou ainda a amostragem for feita com reposição, os resultados acima passam a ser: σ µX = µ e σ X = n Obs: Uma população que tem um limite superior definido é chamada de finita. Em estatística, considera-se como população finita quando (n/N) > 0,05, ou seja, quando a fração amostral x é maior do que 5 %. Distribuição Amostral de X quando a população é normal Distribuição Amostral de X quando a população não é normal e amostra suficientemente grande EXEMPLO 1 A altura dos estudantes da turma de Estatística tem distribuição normal com média 172 cm e desvio padrão 9 cm. Uma amostra de 25 estudantes é retirada. a) Qual a probabilidade de que a média amostral seja acima de 175 cm? b) Qual a probabilidade de que a média amostral esteja entre 170 e 176 cm? c) Qual deve ser a altura média dos estudantes que permita que em 90% das vezes a média amostral seja inferior a este valor. DISTRIBUIÇÃO AMOSTRAL DA PROPORÇÃO Considere uma população em que cada elemento é classificado de acordo com a presença ou ausência de determinada característica. Por exemplo, podemos pensar em eleitores escolhendo entre 2 candidatos, pessoas classificadas de acordo com o sexo, e assim por diante.Vamos considerar uma população em que a proporção de indivíduos com uma certa característica é p. Logo, podemos definir uma v.a. X como • Retira-se uma a.a.s. de tamanho n dessa população. Seja n S n = ∑ X i o número de indivíduos com a característica de i =1 interesse na amostra, temos que Sn ~ Binomial(n, p). • A variável aleatória Sn tem distribuição exata dada por uma binomial com parâmetros n e p. Desta forma, probabilidades envolvendo a proporção amostral podem ser calculadas de modo exato usando esta distribuição. • Caso o valor de n seja muito grande, essas probabilidades darão algum trabalho para serem calculadas e torna-se conveniente utilizar a aproximação Normal. TEOREMA CENTRAL DO LIMITE A Distribuição Amostral de p̂ pode ser aproximada por uma distribuição normal de probabilidade sempre que o tamanho da amostra for grande. Pode-se utilizar essa aproximação se são satisfeitas as seguintes condições: o np ≥ 5 o n(1-p) ≥ 5 Sn n • Sabemos que tem distribuição normal para n suficientemente grande. Seja pˆ = X , a proporção amostral, temos que: X = Obs: σ p̂ é conhecido como erro padrão da proporção. • Suponha que podemos extrair todas as amostras de tamanho n (sem reposição) de uma população finita de tamanho N, neste caso temos que: µ pˆ = p e σ pˆ = p(1 − p) N − n n N −1 N − n N − 1 A quantidade é conhecida como o fator de correção amostral para população finita, ou simplesmente “Fator de Correção”. • Se o tamanho da população for muito grande, infinito ou ainda a amostragem for feita com reposição, os resultados acima passam a ser: p (1 − p) x µ pˆ = p e σ pˆ = n Exemplo 2 Com base em dados históricos, uma companhia aérea estima em 15% a taxa de desistência entre seus clientes, isto é, 15% dos passageiros com reserva não aparecem na hora do vôo. Para otimizar a ocupação de suas aeronaves, essa companhia decide aceitar 400 reservas para os vôos em aeronaves que comportam apenas 350 passageiros. a) Qual a probabilidade de que essa companhia não tenha assentos suficientes em um desses vôos. Essa probabilidade é alta o suficiente para a companhia rever sua política de reserva? x Exemplo 3 De acordo com os estudos realizados pela Cagepa, no município de João Pessoa, o consumo mensal de água por residência tem distribuição normal com média 20 m3 e variância de 144 m3. a) Em uma amostra de 36 residências, qual a probabilidade de que a média amostral não se afaste da verdadeira média populacional por mais de 2 m 3? b) Devida a escassez de água nos reservatórios, a empresa deseja estipular um consumo médio de forma que em 95% das vezes o consumo médio amostral seja inferior a este valor. Qual deve ser o valor estipulado pela Cagepa? Exemplo 4 Com base em dados obtidos em uma pesquisa de mercado, observou-se a aceitação de um determinado sabonete é de 70%. A empresa entrevistou 100 consumidores. a) Qual deveria ter sido o tamanho da amostra com nível de confiança de 95% e um erro amostral de no máximo 3%? b) Qual a probabilidade de que a proporção amostral de aceitação do sabonete esteja entre 65% e 78%? c) Qual a probabilidade de que sejam encontradas 60 ou mais consumidores que tenham aprovado o produto?