INF 162 Prof. Luiz A. Peternelli CAPÍTULO 7 - Intervalos de confiança É uma maneira de calcularmos uma estimativa de um parâmetro desconhecido. Muitas vezes também funciona como um teste de hipóteses. A idéia é construir um intervalo de confiança para o parâmetro com uma probabilidade de 1 − α (nível de confiança) de que o intervalo contenha o verdadeiro parâmetro. Obs: α é o nível de significância, isto é, o erro que estaremos cometendo ao afirmarmos que, por exemplo, 95% das vezes o intervalo θˆ1 < θ < θˆ2 contém θ . Nesse caso, o erro seria de 5%. Nesse capítulo veremos apenas a “fórmula” final para se obter um intervalo de confiança. No entanto, pode-se demonstrar facilmente que intervalos de confiança são obtidos com base na teoria discutida no capítulo sobre testes de hipóteses. O leitor interessado pode procurar uma das literaturas apresentadas no primeiro dia de aula, ou com o professor. Intervalos de confiança para média e variância. Intervalo de confiança para média Será visto apenas o intervalo de confiança para a média populacional ( µ ) quando a variância (σ 2 ) populacional é desconhecida. I .C.(1 − α ) : X − t α 2 s ≤ µ ≤ X + tα n 2 s n Ex: A seguinte amostra: 9, 8, 12, 7, 9, 6, 11, 6, 10, 9 foi extraída de uma população normal. Construir o intervalo de confiança, de 95%, para µ . Solução: X = 8,7 s2 = (87) 2 10 ≅ 4,0 ⇒ s ≅ 2 10 − 1 793 − ∴ I.C.(95%) : 8,7 − 2,262 2 10 ≤ µ ≤ 8,7 + 2,262 2 10 = 7,27 ≤ µ ≤ 10,13 pelo fato de µ se um parâmetro e não uma v.a. o intervalo acima deve ser interpretado da seguinte maneira: 95% dos intervalos assim construídos conterão a verdadeira média. 87 INF 162 Prof. Luiz A. Peternelli Intervalo de confiança para a variância de uma população normal (n − 1)s 2 (n − 1)s 2 2 I.C. (1 − α) : ≤σ ≤ χ 2maior χ 2menor onde χ 2maior e χ 2menor são obtidos na tabela de χ 2 , com n − 1 graus de liberdade e nível de significância de acordo com a figura abaixo: Exemplo: Considerando a mesma amostra do exemplo anterior, calcule o I.C. para σ 2 ao nível de 90% de confiança (ou seja, α = 10% ). Solução: Temos: n = 10, s 2 = 4, g.!. = v = 9; α = 10% então: I .C.(90%) será: 9. 4 9.4 ≤ σ2 ≤ 16,9 3,33 ou 2,13 ≤ σ 2 ≤ 10,81 Intervalo de confiança para proporção Obs: O método apresentado abaixo é apropriado quando n for maior que 30. I .C.(1 − α ) será: f − Z α 2 f (1 − f ) f (1 − f ) ≤ p ≤ f + Zα n n 2 onde f é a estimativa da proporção p . Exemplo: Entre 500 pessoas inquiridas a respeito de suas preferências eleitorais, 260 mostraram-se favoráveis ao candidato B. Calcular o intervalo de confiança ao nível de 90% para a porcentagem (ou proporção) dos eleitores favoráveis a B. 88 INF 162 Prof. Luiz A. Peternelli 1 − α = 90% Solução: temos n = 500 x 260 f= = = 0,52 n 500 x = 260 I .C.(90%) = 0,52 − 1,64 0,52 . 0,48 ≤ p ≤ 0,52 + 1,64 500 0,52 . 0,48 500 ou Determinação do tamanho da amostra Será discutido no final desse capítulo. Exercícios Propostos 1) Em uma fábrica, colhida uma amostra de 30 peças para avaliação, obtiveram-se as seguintes informações sobre o diâmetro das peças: X = 13,13 e s 2 = 2,05 Construir um intervalo de confiança para a média sendo α = 5% . R.: 12,60 ≤ µ ≤ 13,66 2) Sendo X uma população tal que X ~ N ( µ , σ 2 ) em que µ e σ 2 são desconhecidos. Uma amostra de tamanho 15 forneceu os valores ∑ xi = 8,7 e ∑ xi2 = 27,3 . Determinar um intervalo de confiança de 95% para σ 2. R.: 0,85 ≤ σ 2 ≤ 3,95 3) Uma centena de componentes foi ensaiada e 93 deles funcionaram mais de 500 horas. Determinar um intervalo de confiança de 95% para a proporção. R.: 0,88 ≤ p ≤ 0,98 89 INF 162 Prof. Luiz A. Peternelli COMPLEMENTO DO CAPÍTULO 7 Exercícios Propostos 1) A força de compressão de concreto está sendo testada por um engenheiro civil. Ele testa 12 amostras e obtém os seguintes dados: 2216 2225 2318 2237 2301 2255 2249 2281 2275 2204 2263 2295 Assumindo-se distribuição normal pede-se: a) Construa o I.C. (95%) para a força média. b) Construa o I.C. (99%) para a força média. c) Ao nível de 5% de significância verificar se a verdadeira média da força de compressão difere de 2280. Realizar o teste t para uma média. d) Repetir o item c , porém usando α = 1%. e) Repetir o item c , porém verificando se a verdadeira força média difere de 2300. f) Compare as conclusões obtidas usando-se I.C. e teste de hipótese. 2)Tintas para marcação em asfalto de rodovias são oferecidas em duas cores, branca e amarela. O tempo de secagem dessas tintas é de muito interesse, e especificamente, suspeita-se que a tinta amarela seca mais rápido do que a branca. Amostras foram obtidas para a medição dos tempos de secagem (em minutos), em condições reais das duas tintas: tinta branca 120 132 123 122 140 110 120 107 tinta amarela 126 124 116 125 109 130 125 117 129 Assumindo distribuição normal pede-se: a) Obtenha o I.C. (95%) para o tempo médio de secagem de cada tipo de tinta; b) Realize um teste de hipótese para responder às questões apresentadas no enunciado do problema. Use α = 5% ; c) Obtenha o I.C. (95%) para a variância do tempo de secagem de cada tipo de tinta; d) Realize um teste F para verificar se ambas às tintas apresentam a mesma variabilidade no tempo de secagem. Use α = 5% . LEITURA COMPLEMENTAR (Faz parte do assunto do curso, mas não será cobrado em prova) Se considerarmos o intervalo ! ≤ θ ≤ L , onde ! é o limite inferior do intervalo, L é o limite superior do intervalo, e θ é o parâmetro desconhecido, então o comprimento L − ! do intervalo de confiança observado é uma medida importante da 90 120 INF 162 Prof. Luiz A. Peternelli qualidade da informação obtida da amostra. A metade do intervalo, ou seja, θ − ! ou L − θ , é chamado de precisão do estimador. Assim, quanto maior o intervalo de confiança, mais confiante nós estaremos de que realmente o intervalo calculado contenha o verdadeiro valor de θ . Por outro lado, quanto maior o intervalo, menos informação teremos sobre o verdadeiro valor de θ . Numa situação ideal, obtemos um intervalo relativamente curto com alta confiança. Intervalo de confiança para a média, quando a variância é conhecida. Se X é a média de uma amostra aleatória de tamanho n de uma população com variância conhecida σ , o I.C. 100 (1 − α ) % da média µ é dado por 2 X − zα 2 onde zα 2 σ σ ≤ µ ≤ X + zα 2 n n é obtido da distribuição normal reduzida. Exemplo: Um artigo no “Journal of Heat Transfer” (1974) apresenta os dados abaixo referentes à condutividade térmica (em Btu/hr.ft.oF) de uma amostra de 10 peças metálicas (ferro). 41,60 41,48 42,34 41,95 41,86 42,18 41,72 42,26 41,81 42,04 Obtenha o I.C. (95%) da média da condutividade térmica nessas peças metálicas. Solução: média = 41,924 desvio-padrão = 0,30 zα 2 = z 0,05 2 = z 0,025 = 1,96 Assim I.C. (95%): 41,738 < µ ≤ 42,110 Obs.1: A fórmula apresentada acima apresenta bons resultados para amostras oriundas da população normal, ou para amostras com n ≥ 30 de população não normal. O nível de confiança (1 − α ) não será exato para amostras pequenas de população não normais. Obs.2: Desde que o comprimento do I.C. mede a precisão da estimação, podemos observar que a precisão é inversamente relacionada com o nível de confiança. O desejável seria obter um I.C. que fosse curto o suficiente para o propósito de tomada de decisão, e que também tivesse uma confiança adequada. Uma maneira de conseguir isso seria pela escolha do tamanho da amostra n para ser grande o suficiente para dar um I.C. de um determinado comprimento com uma confiança definida. Escolha do tamanho da amostra 91 INF 162 Prof. Luiz A. Peternelli A precisão do I.C. é zα 2 σ n . Isto significa que em usar X para estimar µ , o erro E = X − µ é menor ou igual a zα 2 σ n com confiança 100 (1 – α). Isso poderia ser mostrado graficamente. Se o tamanho da amostra pode ser controlado, podemos escolher n de modo que nós estaremos 100 (1 – α) % confiantes de que o erro na estimação do µ será menor do que um erro específico E . Assim, o tamanho amostral apropriado será aquele de n tal que zα 2 σ zα 2 σ n = E, ou seja, n = E 2 . Obs.1: Se n não for inteiro, este deve ser aproximado para cima para garantir que o nível de confiança não fique menor que 100(1 – α)%. Obs.2: Observe que 2E é o comprimento do I.C. de interesse. Exemplo: Considerando os dados do exercício anterior, suponha que queremos que o erro na estimação da condutividade média naquela peça metálica seja menor do que 0,10 Btu/hr.ft.oF , com 95% de confiança. Solução: Já que σ = 0,30 e z0,025 = 1,96 2 1,96 . 0,30 n= = 34,57 ≈ 35 0,10 Observemos a relação geral entre tamanho da amostra, comprimento desejado do I.C. (2E), nível de confiança 100 (1 − α ) % e desvio padrão σ : • Se 2E diminui, o tamanho amostral n aumenta, para σ e nível de confiança constantes; • Se σ aumenta, n aumenta, para 2E fixo e 100 (1 − α ) % fixo. • Se o nível de confiança aumenta, n aumenta, para 2E fixo e σ fixo. Problemas Propostos 1) Um fabricante produz anéis de pistão para motores de automóveis. Sabe-se que o diâmetro do anel tem distribuição aproximadamente normal com desvio padrão σ = 0,001 mm. Uma amostra aleatória de 15 anéis apresentou diâmetro médio X = 74,036 mm. a) Construa o I.C. (99%) para o diâmetro médio do anel. b) Construa o I.C. (95%) para o diâmetro médio do anel. 2) Suponha que a vida em horas de lâmpadas de 75 Watt tenha distribuição aproximadamente normal com variância σ2 = (25 h)2. Uma amostra aleatória de 20 lâmpadas apresentou X =1014 horas. a) Construa o I.C. (95%) para a média de vida. 92 INF 162 Prof. Luiz A. Peternelli b) Suponha que desejamos ser 95% confiantes de que o erro na estimação da vida média é menor do que 5 horas. Qual tamanho amostral deveria ser usado? c) Suponha que nós queiramos um comprimento total do I.C. da média de vida ser de 6 horas ao nível de confiança de 95%. Qual tamanho amostral deveria ser usado? 3) Um Engenheiro Civil está analisando a força de compressão de concreto. Força de compressão é normalmente distribuído com σ2 = 1000 (psi)2. Uma amostra aleatória de 12 corpos de prova apresentou X =3250 psi. a) Construa o I.C. (95%) para a média da força de compressão. b) Construa o I.C. (99%) para a média da força de compressão. c) Compare o comprimento dos I.C. calculados em a e b . d) Suponha que seja desejado estimar a força de compressão com um erro menor do que 15 psi e uma confiança de 99%. Qual deverá ser o tamanho amostral? I.C. para Média quando σ2 é desconhecido Se X e s são, respectivamente, a média e o desvio padrão de uma amostra aleatória de uma população com distribuição normal com variância σ2 desconhecida, então o I.C. de 100 (1- α)% da média é dado por X − tα 2 onde t α 2 s ≤ µ ≤ X + tα 2 n é obtido da distribuição t de Student s , n Exemplo: Considere os 20 dados abaixo correspondentes ao tempo de resistência ao fogo (em segundos) de determinada vestimenta após tratamento com uma tintura especial: 9,85 9,87 9,83 9,95 9,93 9,67 9,92 9,95 9,75 9,94 9,74 9,93 9,77 9,85 9,99 9,92 9,67 9,75 9,88 9,89 Assuma que o tempo de resistência ao fogo segue uma distribuição normal. Obter o I.C. (95%) do tempo médio de resistência ao fogo. R.: 9,8073 ≤ µ ≤ 9,8977. Dizemos estar 95% confiantes de que a média do tempo de resistência ao fogo está entre 9,8073 e 9,8977 segundos. Escolha do tamanho da amostra Quando não conhecemos a variância σ2, a determinação do tamanho amostral n necessário para fornecer o I.C. com o comprimento de interesse não é fácil, já que o comprimento do I.C. depende de σ e do valor de n . Além disso n entra no I.C. de duas maneiras: 1 n e tσ 2, n−1 . Dessa forma, a obtenção de n ocorre por meio de tentativas e erros, usando uma estimativa de σ baseada, talvez, em experiência passada. 93 INF 162 Prof. Luiz A. Peternelli Outra possibilidade seria tomar uma amostra preliminar (amostra piloto) de n observações para estimar σ. Então, usando o desvio padrão amostral s como uma aproximação para σ usamos a equação zα 2 . σ n = E para calcular o valor requerido de n para fornecer a acurácia e o nível de confiança desejados. 2 94