Intervalos de Confiança para Média Ivan Bezerra Allaman Introdução • Agora que já entendemos como são constituídos os intervalos de confiança, vamos aprender como elaborar um intervalo de confiança para os estimadores com base no nível de confiança desejado. • Vamos abrir um parênteses apenas para as seguintes notações: – α é o símbolo utilizado para expressar o nível de significância ou grau de desconfiança; – Consequentemente, o grau de confiança é expresso como (1 − α). Intervalo de confiança para média: variância conhecida (σ 2 ) • Em geral desconhecemos a variância da população, e utilizamos S como estimador para se ter alguma idéia da dispersão da população. No entanto, há casos em que se tem grandes quantidades de dados históricos do fenômeno que se pretende estudar, e nestes casos, podemos considerar σ 2 como conhecido. • Foi visto que o estimador sempre vem acompanhado da margem de erro. Mas enfim, o que é a margem de erro? • A margem de erro da média amostral é dada pela seguinte expressão: Zα/2 ∗ σX̄ • em que: – Zα/2 é o quantil da distribuição normal padrão – σX̄ é o erro padrão da média • Logo, a forma geral de uma estimação por intervalo é dada pela seguinte expressão: X̄ ± Zα/2 ∗ σX̄ Aplicações 1. Uma amostra aleatória simples de 40 itens resultou em uma média amostral de 25. O desvio padrão da população é σ = 5. Qual é o erro padrão da média (σX̄ )? Para um grau de confiança de 95%, qual é a margem de erro? 2. Uma amostra aleatória simples de 50 itens de uma população, com σ = 6, resultou em uma média amostral igual a 32. Forneça um intervalo de confiança de 90% para a média populacional. Intervalo de confiança para média: variância desconhecida (σ 2 ) • Quando a variância é desconhecida, faz-se necessário utilizar o estimador S 2 . Consequentemente, a notação e cálculo para o erro padrão da média irá mudar para: 1 r SX̄ = S S2 =√ n n • Logo, ao invés da variável Z teremos uma nova variável denominada tφ com distribuição t de Student com φ graus de liberdade. • Portanto, a forma geral de estimação por intervalo é dada pela seguinte expressão: X̄ ± t(φ;α/2) ∗ SX̄ • O graus de liberdade é calculado como o tamanho da amostra (n) menos um, ou seja, φ=n−1 A forma da distribuição t • Assim como a normal padrão, a média da distribuição t é zero. A função densidade de probabilidade com 1 graus de liberdade é mostrada a seguir. • Agora, iremos utilizar a função pt e qt para calcularmos probabilidades e encontramos o quantil da distribuição t respectivamente. • Estas funções funcionam de maneira semelhante as funções pnorm e qnorm, tendo agora um argumento a mais para inserir na função: o graus de liberdade. pt(quantil t , graus de liberdade) ou qt(probabilidade , graus de liberdade) Aplicações 1. Para uma distribuição t com 16 graus de liberdade, encontre a área, ou probabilidade, em cada região apresentada a seguir: À direita de 2,120 gl = 16 # graus de liberdade 1-pt(2.12,gl) ## [1] 0.025 À esquerda de 1,337 pt(1.337,gl) ## [1] 0.9 Entre -1,746 e 1,746 2 t1 <- pt(-1.746,gl) t2 <- pt(1.746,gl) t2 - t1 ## [1] 0.9 2. Trinta Lanchonetes de Ilhéus foram frequentados durante o verão de 2014. Durante cada visita, o cliente ia ao balcão e pedia um lanche básico, como por exemplo um x-salada e uma coca. Foi registrado o tempo decorrido entre escolher a opção do cardápio e receber o pedido. Os tempos, em minutos, para as 30 visitas foram as seguintes 3.5 5.2 6.0 1.4 2.7 4.4 4.6 2.1 3.1 4.1 2.5 4.6 1.7 1.5 3.7 7.0 3.8 2.9 2.5 2.6 3.0 6.0 2.1 1.4 3.4 4.0 1.8 4.2 6.3 1.8 Apresente uma estimação por ponto da média populacional de tempo gasto nas lanchonetes. xbarra <- mean(tempo) xbarra ## [1] 3.463 Com 95% de confiança, qual é a margem de erro? n <- length(tempo) graus_liberdade <- n - 1 desvio_amostral <- sd(tempo) erro_padrao_media <- desvio_amostral/sqrt(n) alfa <- 0.05 alfa_dividido_2 <- alfa/2 t_alfa_dividido_2 <- abs(qt(alfa_dividido_2,graus_liberdade)) #obtendo o valor absoluto (sem sinal) margem_erro <- t_alfa_dividido_2 * erro_padrao_media margem_erro ## [1] 0.5797 Qual é a estimação por intervalo de confiança de 95% para a média populacional? IC_mu_95 <- c(xbarra-margem_erro,xbarra+margem_erro) IC_mu_95 ## [1] 2.884 4.043 3