INF 162
Prof. Luiz A. Peternelli
CAPÍTULO 7 - Intervalos de confiança
É uma maneira de calcularmos uma estimativa de um parâmetro desconhecido.
Muitas vezes também funciona como um teste de hipóteses.
A idéia é construir um intervalo de confiança para o parâmetro com uma
probabilidade de 1 − α (nível de confiança) de que o intervalo contenha o verdadeiro
parâmetro.
Obs: α é o nível de significância, isto é, o erro que estaremos cometendo ao afirmarmos que, por exemplo, 95% das vezes o intervalo θˆ1 < θ < θˆ2 contém θ . Nesse caso,
o erro seria de 5%.
Nesse capítulo veremos apenas a “fórmula” final para se obter um intervalo de
confiança. No entanto, pode-se demonstrar facilmente que intervalos de confiança são
obtidos com base na teoria discutida no capítulo sobre testes de hipóteses. O leitor
interessado pode procurar uma das literaturas apresentadas no primeiro dia de aula, ou
com o professor.
Intervalos de confiança para média e variância.
Intervalo de confiança para média
Será visto apenas o intervalo de confiança para a média populacional ( µ )
quando a variância (σ 2 ) populacional é desconhecida.
I .C.(1 − α ) : X − t α
2
s
≤ µ ≤ X + tα
n
2
s
n
Ex: A seguinte amostra: 9, 8, 12, 7, 9, 6, 11, 6, 10, 9 foi extraída de uma população
normal. Construir o intervalo de confiança, de 95%, para µ .
Solução:
X = 8,7
s2 =
(87) 2
10 ≅ 4,0 ⇒ s ≅ 2
10 − 1
793 −
∴ I.C.(95%) : 8,7 − 2,262
2
10
≤ µ ≤ 8,7 + 2,262
2
10
= 7,27 ≤ µ ≤ 10,13
pelo fato de µ se um parâmetro e não uma v.a. o intervalo acima deve ser interpretado
da seguinte maneira: 95% dos intervalos assim construídos conterão a verdadeira
média.
87
INF 162
Prof. Luiz A. Peternelli
Intervalo de confiança para a variância de uma população normal
(n − 1)s 2
(n − 1)s 2
2
I.C. (1 − α) :
≤σ ≤
χ 2maior
χ 2menor
onde χ 2maior e χ 2menor são obtidos na tabela de χ 2 , com n − 1 graus de liberdade e nível
de significância de acordo com a figura abaixo:
Exemplo: Considerando a mesma amostra do exemplo anterior, calcule o I.C. para
σ 2 ao nível de 90% de confiança (ou seja, α = 10% ).
Solução:
Temos: n = 10,
s 2 = 4, g.!. = v = 9; α = 10%
então:
I .C.(90%) será:
9. 4
9.4
≤ σ2 ≤
16,9
3,33
ou 2,13 ≤ σ 2 ≤ 10,81
Intervalo de confiança para proporção
Obs: O método apresentado abaixo é apropriado quando n for maior que 30.
I .C.(1 − α ) será: f − Z α
2
f (1 − f )
f (1 − f )
≤ p ≤ f + Zα
n
n
2
onde f é a estimativa da proporção p .
Exemplo: Entre 500 pessoas inquiridas a respeito de suas preferências eleitorais, 260
mostraram-se favoráveis ao candidato B. Calcular o intervalo de confiança ao nível de
90% para a porcentagem (ou proporção) dos eleitores favoráveis a B.
88
INF 162
Prof. Luiz A. Peternelli
1 − α = 90%
Solução: temos n = 500
x 260
f= =
= 0,52
n 500
x = 260
I .C.(90%) = 0,52 − 1,64
0,52 . 0,48
≤ p ≤ 0,52 + 1,64
500
0,52 . 0,48
500
ou
Determinação do tamanho da amostra
Será discutido no final desse capítulo.
Exercícios Propostos
1) Em uma fábrica, colhida uma amostra de 30 peças para avaliação, obtiveram-se as
seguintes informações sobre o diâmetro das peças: X = 13,13 e s 2 = 2,05
Construir um intervalo de confiança para a média sendo α = 5% .
R.: 12,60 ≤ µ ≤ 13,66
2) Sendo X uma população tal que X ~ N ( µ , σ 2 ) em que µ e σ 2 são
desconhecidos. Uma amostra de tamanho 15 forneceu os valores
∑ xi = 8,7 e ∑ xi2 = 27,3 . Determinar um intervalo de confiança de 95% para
σ 2.
R.: 0,85 ≤ σ 2 ≤ 3,95
3) Uma centena de componentes foi ensaiada e 93 deles funcionaram mais de 500
horas. Determinar um intervalo de confiança de 95% para a proporção.
R.: 0,88 ≤ p ≤ 0,98
89
INF 162
Prof. Luiz A. Peternelli
COMPLEMENTO DO CAPÍTULO 7
Exercícios Propostos
1) A força de compressão de concreto está sendo testada por um engenheiro civil. Ele
testa 12 amostras e obtém os seguintes dados:
2216
2225
2318
2237
2301
2255
2249
2281
2275
2204
2263
2295
Assumindo-se distribuição normal pede-se:
a) Construa o I.C. (95%) para a força média.
b) Construa o I.C. (99%) para a força média.
c) Ao nível de 5% de significância verificar se a verdadeira média da força de
compressão difere de 2280. Realizar o teste t para uma média.
d) Repetir o item c , porém usando α = 1%.
e) Repetir o item c , porém verificando se a verdadeira força média difere de 2300.
f) Compare as conclusões obtidas usando-se I.C. e teste de hipótese.
2)Tintas para marcação em asfalto de rodovias são oferecidas em duas cores, branca e
amarela. O tempo de secagem dessas tintas é de muito interesse, e especificamente,
suspeita-se que a tinta amarela seca mais rápido do que a branca. Amostras foram
obtidas para a medição dos tempos de secagem (em minutos), em condições reais das
duas tintas:
tinta branca
120
132
123
122
140
110
120
107
tinta amarela
126
124
116
125
109
130
125
117
129
Assumindo distribuição normal pede-se:
a) Obtenha o I.C. (95%) para o tempo médio de secagem de cada tipo de tinta;
b) Realize um teste de hipótese para responder às questões apresentadas no
enunciado do problema. Use α = 5% ;
c) Obtenha o I.C. (95%) para a variância do tempo de secagem de cada tipo de tinta;
d) Realize um teste F para verificar se ambas às tintas apresentam a mesma
variabilidade no tempo de secagem. Use α = 5% .
LEITURA COMPLEMENTAR
(Faz parte do assunto do curso, mas não será cobrado em prova)
Se considerarmos o intervalo ! ≤ θ ≤ L , onde ! é o limite inferior do
intervalo, L é o limite superior do intervalo, e θ é o parâmetro desconhecido, então o
comprimento L − ! do intervalo de confiança observado é uma medida importante da
90
120
INF 162
Prof. Luiz A. Peternelli
qualidade da informação obtida da amostra. A metade do intervalo, ou seja, θ − ! ou
L − θ , é chamado de precisão do estimador.
Assim, quanto maior o intervalo de confiança, mais confiante nós estaremos de
que realmente o intervalo calculado contenha o verdadeiro valor de θ . Por outro lado,
quanto maior o intervalo, menos informação teremos sobre o verdadeiro valor de θ .
Numa situação ideal, obtemos um intervalo relativamente curto com alta confiança.
Intervalo de confiança para a média, quando a variância é conhecida.
Se X é a média de uma amostra aleatória de tamanho n de uma população
com variância conhecida σ , o I.C. 100 (1 − α ) % da média µ é dado por
2
X − zα 2
onde zα
2
σ
σ
≤ µ ≤ X + zα 2
n
n
é obtido da distribuição normal reduzida.
Exemplo: Um artigo no “Journal of Heat Transfer” (1974) apresenta os dados abaixo
referentes à condutividade térmica (em Btu/hr.ft.oF) de uma amostra de 10 peças
metálicas (ferro).
41,60 41,48
42,34
41,95
41,86
42,18
41,72
42,26
41,81
42,04
Obtenha o I.C. (95%) da média da condutividade térmica nessas peças
metálicas.
Solução:
média = 41,924
desvio-padrão = 0,30
zα
2
= z 0,05 2 = z 0,025 = 1,96
Assim
I.C. (95%): 41,738 < µ ≤ 42,110
Obs.1: A fórmula apresentada acima apresenta bons resultados para amostras
oriundas da população normal, ou para amostras com n ≥ 30 de população não
normal. O nível de confiança (1 − α ) não será exato para amostras pequenas de
população não normais.
Obs.2: Desde que o comprimento do I.C. mede a precisão da estimação, podemos
observar que a precisão é inversamente relacionada com o nível de confiança. O
desejável seria obter um I.C. que fosse curto o suficiente para o propósito de
tomada de decisão, e que também tivesse uma confiança adequada. Uma
maneira de conseguir isso seria pela escolha do tamanho da amostra n para ser
grande o suficiente para dar um I.C. de um determinado comprimento com uma
confiança definida.
Escolha do tamanho da amostra
91
INF 162
Prof. Luiz A. Peternelli
A precisão do I.C. é zα 2 σ
n . Isto significa que em usar X para estimar
µ , o erro E = X − µ é menor ou igual a zα 2 σ
n com confiança 100 (1 – α). Isso
poderia ser mostrado graficamente. Se o tamanho da amostra pode ser controlado,
podemos escolher n de modo que nós estaremos 100 (1 – α) % confiantes de que o
erro na estimação do µ será menor do que um erro específico E . Assim, o tamanho
amostral apropriado será aquele de n tal que
zα 2 σ
 zα 2 σ
n = E, ou seja, n = 
 E
2

 .

Obs.1: Se n não for inteiro, este deve ser aproximado para cima para garantir que o
nível de confiança não fique menor que 100(1 – α)%.
Obs.2: Observe que 2E é o comprimento do I.C. de interesse.
Exemplo: Considerando os dados do exercício anterior, suponha que queremos que o
erro na estimação da condutividade média naquela peça metálica seja menor do
que 0,10 Btu/hr.ft.oF , com 95% de confiança.
Solução:
Já que σ = 0,30 e z0,025 = 1,96
2
 1,96 . 0,30 
n=
 = 34,57 ≈ 35
 0,10 
Observemos a relação geral entre tamanho da amostra, comprimento desejado
do I.C. (2E), nível de confiança 100 (1 − α ) % e desvio padrão σ :
• Se 2E diminui, o tamanho amostral n aumenta, para σ e nível de confiança
constantes;
• Se σ aumenta, n aumenta, para 2E fixo e 100 (1 − α ) % fixo.
• Se o nível de confiança aumenta, n aumenta, para 2E fixo e σ fixo.
Problemas Propostos
1) Um fabricante produz anéis de pistão para motores de automóveis. Sabe-se que o
diâmetro do anel tem distribuição aproximadamente normal com desvio padrão
σ = 0,001 mm. Uma amostra aleatória de 15 anéis apresentou diâmetro médio
X = 74,036 mm.
a) Construa o I.C. (99%) para o diâmetro médio do anel.
b) Construa o I.C. (95%) para o diâmetro médio do anel.
2) Suponha que a vida em horas de lâmpadas de 75 Watt tenha distribuição
aproximadamente normal com variância σ2 = (25 h)2. Uma amostra aleatória de
20 lâmpadas apresentou X =1014 horas.
a) Construa o I.C. (95%) para a média de vida.
92
INF 162
Prof. Luiz A. Peternelli
b) Suponha que desejamos ser 95% confiantes de que o erro na estimação da vida
média é menor do que 5 horas. Qual tamanho amostral deveria ser usado?
c) Suponha que nós queiramos um comprimento total do I.C. da média de vida
ser de 6 horas ao nível de confiança de 95%. Qual tamanho amostral deveria
ser usado?
3) Um Engenheiro Civil está analisando a força de compressão de concreto. Força de
compressão é normalmente distribuído com σ2 = 1000 (psi)2. Uma amostra
aleatória de 12 corpos de prova apresentou X =3250 psi.
a) Construa o I.C. (95%) para a média da força de compressão.
b) Construa o I.C. (99%) para a média da força de compressão.
c) Compare o comprimento dos I.C. calculados em a e b .
d) Suponha que seja desejado estimar a força de compressão com um erro menor
do que 15 psi e uma confiança de 99%. Qual deverá ser o tamanho amostral?
I.C. para Média quando σ2 é desconhecido
Se X e s são, respectivamente, a média e o desvio padrão de uma amostra aleatória
de uma população com distribuição normal com variância σ2 desconhecida, então o
I.C. de 100 (1- α)% da média é dado por
X − tα 2
onde t α 2
s
≤ µ ≤ X + tα 2
n
é obtido da distribuição t de Student
s
,
n
Exemplo: Considere os 20 dados abaixo correspondentes ao tempo de resistência ao
fogo (em segundos) de determinada vestimenta após tratamento com uma tintura
especial:
9,85
9,87
9,83
9,95
9,93
9,67
9,92
9,95
9,75
9,94
9,74
9,93
9,77
9,85
9,99
9,92
9,67
9,75
9,88
9,89
Assuma que o tempo de resistência ao fogo segue uma distribuição normal.
Obter o I.C. (95%) do tempo médio de resistência ao fogo.
R.: 9,8073 ≤ µ ≤ 9,8977. Dizemos estar 95% confiantes de que a média do tempo de
resistência ao fogo está entre 9,8073 e 9,8977 segundos.
Escolha do tamanho da amostra
Quando não conhecemos a variância σ2, a determinação do tamanho amostral
n necessário para fornecer o I.C. com o comprimento de interesse não é fácil, já que o
comprimento do I.C. depende de σ e do valor de n . Além disso n entra no I.C. de
duas maneiras: 1 n e tσ 2, n−1 .
Dessa forma, a obtenção de n ocorre por meio de tentativas e erros, usando
uma estimativa de σ baseada, talvez, em experiência passada.
93
INF 162
Prof. Luiz A. Peternelli
Outra possibilidade seria tomar uma amostra preliminar (amostra piloto) de n
observações para estimar σ. Então, usando o desvio padrão amostral s como uma
aproximação para σ usamos a equação
 zα 2 . σ 

n = 
E


para calcular o valor requerido de n para fornecer a acurácia e o nível de confiança
desejados.
2
94
Download

CAPÍTULO 7 - Intervalos de confiança