0
Sumário:
6. Intervalos de Confiança .......................................................................................01
6.1. A estimação por intervalos.........................................................................01
6.2. Intervalo de confiança para a média..........................................................02
6.2.1. Intervalo de confiança para a média com variância conhecida.....02
6.2.2. Intervalo de confiança para a média com variância
desconhecida .................................................................................06
6.2.3. Intervalo de confiança para a proporção .......................................09
6.3. Intervalo de confiança para a diferença entre duas médias de populações
independentes............................................................................................15
6.3.1. Intervalo de confiança para a diferença entre duas médias de
populações independentes com variâncias conhecidas ...............16
6.3.2. Intervalo de confiança para a diferença entre duas médias de
populações independentes com variâncias iguais e
desconhecidas ...............................................................................18
6.3.3. Intervalo de confiança para a diferença entre duas médias de
populações independentes com variâncias diferentes e
desconhecidas ...............................................................................22
6.3.4. Intervalo de confiança para a diferença entre duas proporções
em populações independentes ......................................................25
6.4. Intervalo de confiança para a variância de uma população normal..........27
6.5. Intervalo de confiança para a razão entre as variâncias de duas
populações normais...................................................................................30
6.6. Exercícios...................................................................................................34
1
Intervalos de confiança
6.1. A estimação por intervalo
Normalmente, no processo de investiga€•o de um par‚metro ,
necessitamos ir alƒm da sua estimativa pontual ̂. O fato de n•o se
conhecer o valor de  pode causar uma “inseguran€a” e levar a um
questionamento:
Qu•o pr†ximo estamos do valor real de  quando obtemos sua
estimativa?
A resposta depende da precis•o (ou vari‚ncia) do estimador e,
tambƒm, do valor real do par‚metro.
Uma maneira de contornar esse problema consiste em se encontrar
um intervalo em torno de ̂ que tenha alta probabilidade de englobar .
P( do intervalo [ a, b] englobar  ) = 
O intervalo [ a, b] , na pr‡tica, ser‡ construˆdo com a amostra, ou seja,
a partir dos dados e da distribui€•o amostral associada a ̂.
Logo, os valores a e b ser•o aleatórios, variando de uma amostra
para outra.
2
6.2. Intervalo de confiança para a média
6.2.1. Intervalo de confiança para a média com variância conhecida
Seja uma aa X1, X2, . . . , Xn, com média  e variância 2
conhecida. Para construir um intervalo de confiança para a média deve-se
considerar a distribuição da média amostral X ,
 2 
X  N , 
n


X 
 N ( 0 , 1)
/ n
Intervalo de confiança (1 – )100% para 
Para construir um I.C. para a  temos que obter constantes a e b tal
que Pa    b   (1  ) .
A probabilidade (1 – ) é chamada de nível de confiança do
intervalo e  de nível de significância.
X 
Então, da distribuição de
, temos:
/ n
X 


P z  / 2 
 z1 / 2   (1  )
/ n


3

 

P   z / 2
   X   z1 / 2
  (1  )
n
n



 

P X  z1 / 2
   X  z / 2
  (1  )
n
n

Como z1  / 2   z / 2 , teremos:

 

P X  z1 / 2
   X  z / 2
  (1  )
n
n

a
a  x  z / 2
b


e b  x  z / 2
.
n
n
Nota: observe que, nessa notação, z / 2  0 .
Portanto, um intervalo de confiança (1 – )100% para ,
com 2 conhecido, é dado por:

 

x

z
;
x

z
.
/2
/2

n
n 
Se  = 0.05,  / 2  0.025 e z0.025  1.96 , logo, um I.C. 95%
para , com 2 conhecido, é dado por:

 

x

1
.
96
;
x

1
.
96
.

n
n 
4
Exemplo 1: Testes de compressão foram aplicados na marca A de
cimento para avaliar sua resistência em concretos. Foram produzidos 13
corpos de prova e os testes foram aplicados no Laboratório de testes do
Departamento de Engenharia Civil da UFSCar.
(O corpo de prova padrão brasileiro, normatizado pela ABNT, é o cilíndrico,
com 15 cm de diâmetro, 30 cm de altura e a idade de referência é 28 dias)
Foi registrada a resistência à compressão simples (fc), para cada
corpo de prova com o intuito de calcular a resistência característica do
concreto à compressão (fck).
Um concreto concreto classe C30, por exemplo, corresponde a um
concreto com fck = 30 Mpa (Mpa = 106Pa).
Pascal (unidade)
O Pascal (símbolo: Pa) é a unidade padrão de pressão e tensão no
SI. Equivale a força de 1N aplicada uniformemente sobre uma superfície
de 1m2 (fonte: Wikipédia).
Dados (MPa):
31.04 31.11 39.56 24.83 36.97 34.86 29.44
39.15 27.82 34.96 35.19 39.68 34.27
xA = 33.76
sA = 4.665
A empresa afirma que o processo tem variabilidade 2A = 25MPa2.
Construir um intervalo de confiança 95% (nível de significância  = 0.05)
para a resistência à compressão média.
Estatística:
X A  A
~ N 0 ;1
A / nA
Encontrar a e b tais que: Pa   A  b   0.95
5


X  A
P  1.96  A
 1.96   0.95
 A / nA




 
P  1.96 A  X A   A  1.96 A   0.95
nA
nA 



 
P X A  1.96 A   A  X A  1.96 A   0.95
nA
nA 

Substituindo os valores da média amostral e tamanho da amostra
5
5 

P 33.76  1.96
  A  33.76  1.96
  0.95
13
13 

P 31.04   A  36.48   0.95
Ou seja:
a  33.76  1.96
5
 31.04 MPa
13
b  33.76  1.96
5
 36.48 MPa
13
Logo, ( 31.04, 36.48 ) é um I.C. 95% para A.
Interpretação: o intervalo (31.04 ; 36.48) tem probabilidade 0.95
(95%) de englobar o real valor da média A.
6
6.2.2. Intervalo de confiança para a média com variância
desconhecida
Seja uma aa X1, X2, . . . , Xn, com média  e variância 2
desconhecida. No caso da variância ser desconhecida devemos utilizar sua
estimativa dada pela variância amostral s2, porém, nesse caso a
distribuição associada à média amostral X não será mais a normal.
X 
tem distribuição t – Student com
s/ n
(n  1) graus de liberdade, ou seja
Resultado: a estatística
X 
~ tn 1
s/ n
Notas:
1) A razão
X 
pode ser escrita como:
s/ n
X  
X  

s/ n 
/ n s

X 
/ n
N (0 ,1)

(n  1) s 2 / 2
 2n 1
n 1
n 1
Ou seja, a distribuição t-Student é dada pela razão de uma N (0 , 1)
por  2 uma dividida pelos seus graus de liberdade.
7
2) Assim com a normal padronizada a distribui€•o t – Student tem
formato de sino, ou seja, ƒ simƒtrica em torno do zero, porƒm, para graus
de liberdade pequenos a moderados suas caudas s•o mais “pesadas”.
3) Se uma va T tem distribui€•o t – Student com k graus de liberdade,
ent•o:
k
e
E (T )  0
Var (T ) 
k 2
4) Quando os graus de liberdade crescem, a distribui€•o t – Student
se aproxima da N ( 0 ,1) .
5) A distribui€•o t – Student com 1 grau de liberdade ƒ conhecida
como distribui•‚o de Cauchy.
Para construir um I.C. para a  quando  ƒ desconhecida, devemos
proceder como nos casos anteriores, porƒm substituindo a distribui€•o
normal padr•o pela t-Student, ou seja:
8
X 


P t( n 1); / 2 
 t( n 1);1 / 2   (1  )
s/ n


s
s 

P  t( n 1); / 2
   X  t( n1);1 / 2
  (1  )
n
n

s
s 

P X  t( n 1);1 / 2
   X  t( n 1); / 2
  (1  )
n
n


Como t( n 1);1 / 2  t( n 1); / 2 , temos:
s
s 

P X  t( n 1); / 2
   X  t( n 1); / 2
  (1  )
n
n


Logo, um intervalo de confiança (1 – )100% para , com
2 desconhecido, é dado por
s
s 

x

t
;
x

t
( n 1);  / 2
( n 1);  / 2

n
n 
Exemplo 2: No caso dos testes de compressão em amostras de concreto,
o gerente da companhia, desconfiando de que a informação a respeito da
variância não seja verdadeira, refez os cálculos estimando a variância do
processo por s2.
Como o procedimento de cálculo é o mesmo, basta substituir o valor do
quantil da normal (Z0.025 = 1.96) pelo quantil das distribuição t – Student
com (n – 1) = 12 graus de liberdade.
Como nA  13 , então t( n 1); / 2  t12; 0.025  2.1788
Com xA = 33.76 e sA = 4.665 refazendo os cálculos temos que
9
xA  t( nA 1); 0.025
sA
4.665
 33.76  2.1788
 30.94 MPa
nA
13
xA  t( nA 1);0.025
sA
4.665
 33.76  2.1788
 36.58 MPa
nA
13
Portanto, ( 30.94 , 36.58 ) é um IC 95% para A para o caso em
que a variância é desconhecida
Interpretação: é mesma do caso anterior, porém, agora a variância é
desconhecida.
6.2.3. Intervalo de confiança para a proporção
Como a proporção p é de fato a média amostral de uma aa cuja va
tem distribuição de Bernoulli(p), para se construir intervalos de confiança
para p devemos seguir os mesmos procedimentos anteriores.
Considerando que o estimador da proporção p̂ tem valor esperado
p (1  p)
p e variância
, dada a distribuição
n
pˆ  p
 N ( 0 , 1) ,
p (1  p )
n
um I.C. (1 – )100% para a proporção é dado por:

p (1  p )
p (1  p ) 
ˆ
;
ˆ
.
p

z
p

z

/
2

/
2


n
n


10
Exemplo 3: Nos testes de compressão em amostras de concreto, se
a empresa afirma que 90% da produção atende ao valor do fck = 30Mpa,
construir um I.C. de 95% ( = 0.05) para a proporção de corpos de provas
com fc abaixo de fck.
Dos 13 corpos de prova os valores 24.83, 29.44 e 27.82 são
3
menores do que o fck de 30Mpa. Então, pˆ   0.231
13
Considerando que p = 0.10:
pˆ  z / 2
p (1  p)
0.10  0.90
 0.231  1.96
 0.0679
n
13
pˆ  z / 2
p (1  p)
0.10  0.90
 0.231  1.96
 0.3941
n
13
Ou seja: P 0.0679  p  0.3941   0.95
Portanto, ( 0.0679 ; 0.3941 ) é um I.C. 95% para p.
Interpretação: o intervalo (0.0679 ; 0.3941) tem probabilidade 0.95
(95%) de englobar o real valor do parâmetro p.
Nota: Como normalmente não conhecemos p, podemos construir
intervalos de confiança para a proporção substituindo p e (1 – p) por p̂ e
(1  pˆ ) , respectivamente. Neste caso o intervalo fica:

pˆ (1  pˆ )
pˆ (1  pˆ ) 
ˆ
;
ˆ
p

z
p

z
/2
/2

.
n
n


11
Outra possibilidade seria considerar o fato de p (1  p)  1 / 4 e
construir um intervalo conservador para p assumindo p = ½.
Neste caso:
p (1  p ) 1

n
4n
Logo, o intervalo de confiança conservador para p será

z / 2
z / 2 
p
ˆ

;
p
ˆ


.
4
n
4
n


Considerando  = 0.05, então, I.C.’s 95% para p, nos casos acima
serão dados por:
i) utilizando p̂:

pˆ (1  pˆ )
pˆ (1  pˆ ) 
ˆ
;
ˆ
p

1
.
96
p

1
.
96


n
n


ii) conservador p  ½:

1.96
1.96 
ˆ
;
ˆ
p

p


4n
4n 

O procedimento em (ii) fornece intervalos de confiança
excessivamente grandes quando p se distancia de ½ ( p  0 ou p  1)
(Bussab & Moretin, 2002). Para a utilização do intervalo conservador,
portanto, devemos ter algum conhecimento do valor p, garantindo que seu
valor esteja próximo de ½.
Exemplo: No exemplo do teste de compressão em concretos temos
3
pˆ   0.231, logo
13
12
i) utilizando p̂ :
pˆ  z / 2
pˆ (1  pˆ )
0.231  0.769
 0.231  1.96
 0.0019
n
13
pˆ  z / 2
pˆ (1  pˆ )
0.231 0.769
 0.231  1.96
 0.4601
n
13
Portanto, ( 0.0019 ; 0.4601 ) é um I.C. 95% para p.
ii) conservador p  ½:
pˆ 
z / 2
1.96
 0.231 
 0.0408 (< 0 !!)
4n
52
pˆ 
z / 2
1.96
 0.231 
 0.5028
4n
52
Portanto, ( – 0.0408 ; 0.5028 ) é um I.C. 95% conservador para p.
Note que no intervalo acima o limite inferior é negativo,
consequência da utilização da máxima variância de p e do fato de que a
proporção a ser estimada está longe do valor ½.
Nota: usualmente, nestes casos, arredondamos o limite inferior para 0
(zero), porém, o mais indicado é a utilização da estimativa p̂ .
13
Forma simplificada de representação:

n
i) Média com variância conhecida:
x  z / 2
ii) Média com variância desconhecida:
x  t( n 1); / 2
iii) Proporção:
pˆ  z / 2
s
n
pˆ (1  pˆ )
n
Exemplos:
1) Um provedor de acesso ƒ internet deseja implantar um plano sem limite
de horas. Para isso, verificou numa amostra de n = 25 usu„rios os tempos
de utiliza…†o mensal, obtendo: m‡dia amostral x  26.8 horas. Sabendo
que 2 = 6.25 horas2:
a) Encontre um intervalo de confian…a 90% para a m‡dia.
b) De quanto deve ser aumentado o tamanho da amostra para que, mantidas
as demais medidas, o comprimento do intervalo caia pela metade?
2) Observou-se a estatura de 20 rec‡m-nascidos num hospital conforme
dados abaixo. Pesquisas anteriores indicam que a estatura m‡dia das
crian…as nascidas neste hospital ‡ de ˆ = 51 cm.
Dados: x = 987 e x2 = 48845.25
a) Qual a probabilidade de que a estatura m‡dia da amostra n†o ultrapasse
50.20 cm?
b) Construa um I.C. 99% para a m‡dia.
3) 10 corpos de provas foram submetidos a um teste de corros†o onde foram
submersos em „gua salgada durante 60 segundos/dia. A corros†o foi
medida pela perda de peso em miligramas/dec‰metro quadrado/dia
(MDD). Os dados obtidos foram:
130.1 124.2 122.0 110.8 113.1 103.9 101.5 92.3 91.4 83.7
14
a) Encontre estimativas para a média e variância para a perda de peso em
MDD.
b) Construa um intervalo de 95% de confiança para a média.
c) Supondo que a verdadeira média seja  = 110, calcule a probabilidade de
que X seja superior ao máximo valor da amostra considerando:
i) desvio padrão conhecido  = 16; ii) desvio padrão desconhecido.
15
6.3. Intervalo de confiança para a diferença entre as médias de duas
populações independentes
Sejam duas populações A e B cujas médias são  A e  B e
variâncias 2A e 2B , respectivamente.
Um estimador não viciado para ( A  B ) é dado pela estatística
 X A  X B  e sua distribuição amostral é obtida conforme três diferentes
situações:
i) Populações independentes com variâncias conhecidas;
ii) Populações independentes com variâncias desconhecidas, porém,
iguais;
iii) Populações independentes com variâncias diferentes e desconhecidas.
Figura: Populações normais.
16
6.3.1. Intervalo de confiança para a diferença entre as médias de duas
populações independentes com variâncias conhecidas
Seja uma aa de tamanho nA , retirada da população A e uma aa de
tamanho nB retirada da população B, independentes. Considerando que
as variâncias 2A e 2B sejam ambas conhecidas, temos que:
X A  A
A / nA
e
X B  B
B / nB
são
N ( 0 , 1)
Da teoria da probabilidade temos que
E  X A  X B    A  B
2A B2
e Var  X A  X B  

nA nB
Logo, para o caso em que as variâncias 2A e 2B são conhecidas, a
distribuição amostral associada à estatística  X A  X B  é dada por:
 X A  X B    A   
B
2A B2

nA nB
 N ( 0 , 1)
Observe que a variável padronizada tem expressão similar aos
casos anteriores, ou seja, a diferença entre a va e sua média,
dividida pelo seu desvio padrão.
17
Podemos, assim, construir um I.C. para ( A  B ) a partir de





X

X







B
A
B
P  z / 2  A
 z1  / 2   (1  ) .
2
2


 A B



n
n
A
B


Ou seja, um I.C. (1  ) 100% para ( A  B ) considerando
amostras independentes e variâncias conhecidas é dado por:

 2A B2

 xA  xB   z / 2
nA nB

;  xA  xB   z / 2
2A B2 

.
nA nB 
Exemplo 4: Considere que no exemplo com os testes de compressão em
amostras de concretos, além da A uma segunda marca B tenha sido
avaliada com o intuito de que fossem comparadas.
Dados (MPa):
A
B
31.04 31.11 39.56 24.83 36.97 34.86 29.44 39.15
xA = 33.76
27.82 34.96 35.19 39.68 34.27
sA = 4.665
27.91 40.94 39.25 37.42 32.16 34.29 38.69 21.21
xB = 33.08
29.30 29.21 33.76 32.71 31.91 34.10 33.34
sB = 5.017
a) Sabendo que as empresas afirmam que ambos os processos têm
variabilidade 2 = 25MPa2, construir um I.C. para a diferença entre as
médias das duas marcas.
18
Solução:
a) Como 2A  B2  25 então:
 X A  X B    A   
B
2
A
2
B



nA nB
Logo, um I.C. 95% para ( A  B ) é dado por:

 2A B2

 xA  xB   z / 2
nA nB

;  xA  xB   z / 2
2A B2 

.
nA nB 
Ou seja:
 xA  xB   z / 2
2A 2B

nA nB
33.76  33.08  1.96 25  25
13 15
Portanto ( –3.034 , 4.394 ) é um I.C. 95% para ( A  B ) .
6.3.2. Intervalo de confiança para a diferença entre as médias de duas
populações independentes com variâncias iguais e
desconhecidas
Sejam duas populações A e B cujas médias são  A e  B e
variâncias desconhecidas, porém iguais, ou seja, 2A  2B  2
19
Nesse caso, contudo, tanto sA2 como sB2 estimam a variância comum,
logo, podemos utilizar as informações de ambas as amostras
para estimar a variância populacional.
O que se faz, na prática, é combinar as somas de quadrados das
duas variâncias amostrais e dividir pelos graus de liberdade total, ou seja
nA
2
2
 ( xAi  xA )  (nA  1) sA

(nA  1) = g.l. de sA2

(nB  1) = g.l. de sB2
i 1
nB
2
2
 ( xBi  xB )  (nB  1) sB
i 1
que combinadas, resultam em
nA
s 2p
s
2
p
nB
 ( xAi  xA )   ( xBi  xB ) 2

2
i 1
i 1
(nA  1)  ( nB  1)
(nA  1) sA2  (nB  1) sB2

nA  nB  2
A variância combinada s 2p (ou pooled), nada mais é do que
uma variância ponderada pelos graus de liberdade das duas amostras:
(nA  1) sA2  (nB  1) sB2
.
s 
nA  nB  2
2
p
Assim como sA2 e sB2 , s 2p é um estimador não viesado para 2 .
20
Prova:
(nA  1) E sA2   (nB  1) E sB2 
E s  
nA  nB  2
2
p
(nA  1) 2  (nB  1) 2

nA  nB  2

(nA  1  nB  1) 2

nA  nB  2
 2
Pelo fato de 2 ser desconhecida, temos que
X A  A 
s A / nA
 tnA 1
e
 X B  B 
sB / nB
 tnB 1 .
Como temos um estimador comum para a variância populacional,
podemos derivar uma distribuição de probabilidade para  X A  X B  .
Padronizando a diferença entre as médias amostrais teremos:
 X A  X B    A   B 
s 2p s 2p

nA nB

 X A  X B    A  B 
sp
1
1

nA nB
21
 X A  X B    A  B  
Resultado:
sp
1
1

nA nB
tnA  nB  2
Um I.C. (1 – )100% para ( A  B ) , quando as variâncias
são iguais e desconhecidas, é dado por:
 xA  xB   t( n
A  nB  2 ); / 2
sp
1 1

nA nB
Exemplo 5: Construir um I.C. 95% para a diferença entre as resistências
médias à compressão em concretos feitos com cimentos das marcas A e
B, considerando variâncias iguais e desconhecidas.
(você acha válida a suposição de variâncias iguais?)
xA = 33.76
sA = 4.665
nA = 13
xB = 33.08
sB = 5.017
nB = 15
12 ( 4.665) 2  14 (5.017) 2 613.5307
s 

 26.597
13  15  2
26
2
p
s p  4.8577
 t( nA  nB  2 ); / 2  t 26; 0.025  2.0555
22
Logo, um I.C. 95% para ( A  B ) é dado por:
 xA  xB   t26;0.025 s p 1  1
nA
nB
33.76  33.08  2.0555  4.8577 1  1
13 15
Portanto ( –3.105 , 4.465 ) é um I.C. 95% para ( A  B )
considerando variâncias iguais e desconhecidas.
6.3.3. Intervalo de confiança para a diferença entre as médias de duas
populações independentes com variâncias diferentes e
desconhecidas
Sejam duas populações A e B cujas médias são  A e  B e
variâncias diferentes e desconhecidas, 2A e 2B .
Com 2A e 2B diferentes e desconhecidas, devemos utilizar suas
estimativas sA2 e sB2 individualmente e, nesse caso, a distribuição da
estatística utilizada, apesar de continuar sendo a t-Student, não tem mais
os graus de liberdade obtidos diretamente, como nos casos anteriores, isto
é
 X A  X B    A  B 
sA2 sB2

nA nB
~ t ,
23
em que os graus de liberdade  são dados por:
2
 sA2 sB2 
  
n
n
  2  A2 B 2
sA / nA   sB / nB 2
nA  1 nB  1
Logo, um I.C. (1  ) 100% para ( A  B ) , quando as
variâncias são diferentes e desconhecidas, é dado por:
 xA  xB   t; / 2
sA2 sB2
.

nA nB
Exemplo 6: Com os dados de resistências à compressão em concretos
com cimentos das marcas A e B, considerando variâncias iguais e
desconhecidas.
xA = 33.76
xB = 33.08
sA = 4.665
sB = 5.017
sA2 = 21.759
nA = 13
sB2 = 25.174
nB = 15
2
 21.759 25.174 



11.23614
13
15 



2
2
21.759 / 13  25.174 / 15 0.43464
13  1
15  1
  25.86  26
24
Nota: Os graus de liberdade não precisam ser valores inteiros. De fato,
t25.86; 0.025  2.056071 (pelo R).
Enfim, um I.C. 95% para ( A  B ) é dado por:
sA2 sB2

nA nB
 xA  xB   t26;0.025
33.76  33.08  2.0555 21.759  25.174
13
15
Portanto ( –3.084 , 4.444 ) é um I.C. 95% para ( A  B )
considerando variâncias diferentes e desconhecidas.
Resumindo:
Variâncias
VariŠncias
conhecidas
VariŠncias
desconhecidas
e iguais
VariŠncias
desconhecidas
e diferentes
I.C. 95% p/
Estatística
 X A  X B    A   
B
2
A
2
B



nA nB
 X A  X B    A   
B
sp
1
1

nA nB
( A  B )
 N ( 0 , 1)
(–3.034 , 4.394)
 tnA  nB  2
(–3.105 , 4.465)
 X A  X B    A   B 
2
A
2
B
s
s

nA nB
~ t
(–3.084 , 4.444)
25
6.3.4. Intervalo de confiança para a diferença entre duas proporções
em populações independentes
Considere que se queira estimar a diferença entre duas proporções
p1 e p2 , associadas a duas populações independentes. Então, um
estimador não viesado para a diferença ( p1  p2 ) é dado por ( pˆ 1  pˆ 2 ) .
Sabendo que

p (1  p1 ) 
p̂1  N  p1 , 1

n1


e

p (1  p2 ) 
p̂2  N  p2 , 2

n2


Então:

p (1  p1 ) p2 (1  p2 ) 
( pˆ1  pˆ 2 )  N ( p1  p2 ) , 1


n
n2


1
Desta forma, um I.C. (1 – )100% para ( p1  p2 ) é dado por
( pˆ1  pˆ 2 )  z / 2
pˆ 1 (1  pˆ 1 ) pˆ 2 (1  pˆ 2 )

n1
n2
Exemplo 7: Um grupo de biólogos interessados em estudar populações de
animais em regiões isoladas por longas distâncias estão avaliando o
desenvolvimento de peixes de uma determinada espécie em duas lagoas
separadas por uma grande distância geográfica. Numa amostra de 116
peixes da primeira lagoa, 84 são da espécie em questão, enquanto que, de
uma amostra de 80 peixes da outra lagoa, 45 são da espécie estudada.
26
Estimar a diferença entre as proporções de peixes das duas lagoas e
construir um I.C. 90% para a diferença.
As estimativas individuais para p1 e p2 são:
pˆ 1 
84
 0.724
116
pˆ 2 
46
 0.575
80
Então, uma estimativa para a diferença entre p1 e p2 é dada por
pˆ 1  pˆ 2  0.724  0.575  0.149
e, a estimativa do desvio padrão da diferença
0.724  0.276 0.575  0.425

 0.04777 .
116
80
Logo, um I.C. 90% para a diferença entre as proporções é dado por
0.149  1.645 0.04777 ,
ou seja, ( 0.0353 , 0.2627 ) é o I.C. 90% para ( p1  p2 ) .
O que se pode concluir?
27
6.4. Intervalo de confiança para a variância de uma população normal
Considere uma população normal com média  e variância 2 ,
ambas desconhecidas. Em muitas aplicações práticas temos o interesse
em avaliar a variabilidade dos fenômenos em estudo. Nessa situação,
devemos estimar e, também, construir intervalos de confiança para a
variância populacional.
Considerando que a população seja normal, temos que
(n  1) s 2
  2n 1
2

Desta forma, a partir da distribuição 2n 1 podemos construir I.C.’s
para 2 a partir de seus quantis:
 2
(n  1) s 2

2
P  ( n 1); / 2 


  (1  )
(
n

1
);
1


/
2
2



28
2
 (2n 1); / 2
1 ( n 1);1 / 2 
  (1  )
P
 2
2
2 
(
n

1
)
s

(
n

1
)
s


2 
 (n  1) s 2
(
n

1
)
s
2
  (1  )
P 2
  2
 ( n1);1 / 2
( n 1); / 2 

a
b
(n  1) s 2
( n  1) s 2
e b 2
.
a 2
( n 1);1 / 2
( n1); / 2
Desta forma, um I.C. (1 – )100% para 2 é dado por:
 ( n  1) s 2
(n  1) s 2 
; 2
 2
.


( n 1); / 2 
 ( n 1);1 / 2
Exemplo 8: O peso de um componente mecânico é uma va com
distribuição normal com média  e variância 2 , desconhecidos. Pretendese estudar a variabilidade do processo de produção e, para isso, uma
amostra com n = 11 componentes foi avaliada. Os pesos (g) são dados
98 97 102 100 98 101 102 105 95 102 100
 x  1100 e  x 2  110080.
Portanto:
1100
x
 100 g
11
110080  11(100) 2
s 
 8 g2.
10
2
29
Construir um I.C. 95% para a variância populacional ( = 0.05).
2
10
; 0.025  3.25
e
2
10
; 0.975  20.48
( n  1) s 2 10  8
a 2

 3.906
 ( n 1);1 / 2 20.48
( n  1) s 2 10  8
b 2

 24.615
( n 1); / 2
3.25
Um I.C. 95% para 2 é dado por ( 3.906 , 24.615 ).
30
6.5. Intervalo de confiança para a razão entre as variâncias de duas
populações normais
É muito comum, em aplicações estatísticas, precisarmos comparar
as variâncias de duas populações, como, por exemplo, quando
comparamos a média dessas populações.
A comparação de duas variâncias não é feita pela diferença entre
elas, mas sim pela razão das mesmas.
Resultado:
Seja W1   2k1 e W2   2k2 , prova-se facilmente que a razão
W1
F
W2
k1
 Fk1 ;k2
k2
A razão de duas va independentes, com distribuição quiquadrado,
divididas pelos seus respectivos graus de liberdade (k1 e k2), tem
distribuição F de Snedecor, em que k1 são os graus de liberdade do
numerados e k2 os graus de liberdade do denominador.
Notas:
i) Se X  tk , então X 2  F1,k .
Prova: Sai direto do resultado (1) da distribuição t-Student.
ii) Existe uma relação entre os quantis das distribuições F, de forma
que
Fk1 ;k2 ; 
1
Fk2 ;k1 ;1
31
Sejam duas populações normais com variâncias 12 e 22 e sejam s12
e s22 seus estimadores a partir de amostras de tamanho n1 e n2 , então
(n1  1) s12 / 12
(n1  1)
F
(n2  1) s22 /  22
(n2  1)
 Fn1 1 ; n2 1
Mas a razão F acima pode ser simplificada por:
s12
F
s22
12
22
22 s12
 2 2  Fn1 1 ; n2 1
1 s2
Logo, um I.C. para razão entre duas variâncias é construído a partir
de:


 22 s12
P f1  2 2  f 2   (1  )
1 s2


em que: f1  F( n1 1);( n2 1); / 2 e f 2  F( n1 1);( n2 1);1  / 2 .
 s22
 22
s22 
P f1 2  2  f 2 2   (1  )
1
s1 
 s1
32
12
Portanto, escrevendo o resultado para 2 , um I.C. (1 – )100%
2
para a razão de variâncias é dado por:
 s12
12
s12 
  (1  )
P
 2 
2
2 
2
f1 s2 
 f 2 s2
Ou seja, o intervalo para a razão entre duas variâncias de
populações normais é definido por:


s12
s12
;
 2
.
2
s
F
s
F
2
( n1 1);( n2 1); / 2 
 2 ( n1 1);( n2 1);1 / 2
s12
Nota: O intervalo é construído de forma que 2 seja maior do que 1.
s2
Exemplo 9: Construir um I.C. 95% para a razão entre as variâncias da
resistência à compressão em concretos dos cimentos das marcas A e B.
sA2 = 21.759
nA = 13
sB2 = 25.174
nB = 15
sB2
Com 2  1 ,  F14;12; 0.025  0.3279 e F14;12; 0.975  3.2062 .
sA
sB2
sA2 F14;12; 0.975

25.174
 0.3608
21.759  3.2062
33
sB2
sA2 F14;12; 0.025

25.174
 3.5284
21.759  0.3279
2B
Assim, um I.C. 95% para 2 é dado por ( 0.3608 , 3.5284 ).
A
34
6.6. Exercícios
1. Deseja-se comparar a qualidade de um produto produzido por duas
indústrias. Essa qualidade será definida pela uniformidade com que o
produto é produzido. Tomaram-se duas amostras, uma de cada indústria,
medindo-se o tamanho dos produtos (cm).
a) A qualidade das duas fábricas é a mesma? Caso a sua resposta seja
negativa, dê um intervalo de confiança para indicar a intensidade dessa
desigualdade.
b) Construir um I.C. 99% para a diferença entre as médias, (  A   B )
Estatísticas
Indústria A
Indústria B
Tamanho da Amostra
21
17
Médias
21.15
21.12
Variâncias
0.0412
0.1734
2. Num estudo comparativo do tempo médio de adaptação dos empregados
de um grande complexo bancário, uma amostra aleatória, de 50 homens e
50 mulheres, produziu os seguintes resultados:
Estatísticas
Homens
Mulheres
Tamanho da Amostra
50
50
Médias
3.2 anos
3.7 anos
Desvios-padrões
0.8 anos
0.9 anos
Que conclusões você pode tirar para a população de homens e mulheres
desse banco? (Indique quais as suposições feitas)
3. Suponha que uma associação de defesa de consumidores deseja estimar o
consumo médio um novo modelo de automóvel que será lançado no
mercado. Para fazer esta verificação, a associação observa uma amostra de
10 veículos, conduzidos por motoristas treinados, num percurso de 100
milhas. O consumo, em galões, foi registrado com os seguintes resultados:
 x  43.28
e
 x 2  188.4886
Assumindo que estes valores representam uma amostra aleatória de uma
variável normalmente distribuída com média  e variância  2 .
a) Calcule estimativas pontuais para  e  2 .
b) Calcule um intervalo de 75 % de confiança para  2 .
35
4. Os dados abaixo s†o uma amostra aleat‹ria para estimar a propor…†o
estudantes de uma universidade que possuem autom‹vel.
Foi constru‰do o intervalo conservador de 90% de confian…a para p :
( 0.5555 ; 0.8845 )
Um segundo intervalo foi constru‰do considerando a normalidade de p̂ :
( 0.4887 ; 0.9513 )
a) Qual ‡ a estimativa pontual para p̂ ?
b) Qual ‡ o tamanho da amostra?
c) Qual o n‰vel de confian…a do segundo intervalo
5. Da popula…†o X  Normal(50; 100) retirou-se uma aa de n = 10
elementos e da popula…†o Y  Normal(60; 100) retirou-se uma aa de m = 6
elementos, independente da primeira, obtendo-se as variŠncias amostrais s12 e
s22 , respectivamente.
a) Encontre o valor de a, tal que Ps12 s22  a   0.95
b) Encontre o valor de b, tal que Ps12 s22  b   0.95
6. Uma das maneiras de medir o grau de satisfa…†o dos empregados de uma
mesma categoria quanto ƒ pol‰tica salarial ‡ por meio do desvio padr†o de
seus sal„rios. A F„brica A diz ser mais coerente na pol‰tica salarial do que a
F„brica B. Para verificar essa afirma…†o, sorteou-se uma amostra de 10
funcion„rios n†o especializados de A, e 15 de B, obtendo-se os desvios
padrŒes s A  1000 reais e sB  1600 reais. Qual seria a sua conclus†o?
36
Resolução:
1. Deseja-se comparar a qualidade de um produto produzido por duas
indústrias. Essa qualidade será definida pela uniformidade com que o
produto é produzido. Tomaram-se duas amostras, uma de cada indústria,
medindo-se o tamanho dos produtos (cm).
a) A qualidade das duas fábricas é a mesma? Caso a sua resposta seja
negativa, dê um intervalo de confiança para indicar a intensidade dessa
desigualdade.
n A  21
x A  21.15
s A2  0.0412
nB  17
xB  21.12
s B2  0.1734
 2B
I.C. 95% para 2 :
A
Limite inferior:
0.1734
0.1734

 1.652
0.0412 F16; 20; 0.975 0.0412  2.547
Como F16; 20; 0.025 
Limite superior:
1
F20;16;0.975

1
 0.3731
2.68
0.1734
0.1734

 11.280
0.0412 F16; 20; 0.025 0.0412  0.3731
 2B
O intervalo ( 1.652 ; 11.283 ) é um intervalo de confiança 95% para 2 .
A
Como o intervalo não engloba o valor 1, então, há evidência suficiente
para afirmar que  2A   2B .
Logo, a qualidade das duas indústrias não é a mesma. A indústria A, com
menor variabilidade, tem melhor qualidade.
37
b) I.C. 99% para (  A   B ) considerando variâncias diferentes.
2
 s A2 sB2 
  
n
n
  2  A2 B 2
sA / nA   sB / nB  2
nA  1 nB  1
2
 0.0412 0.1734 



21
17 


 22.1  22 gl
2
2
0.0412 / 21  0.1734 / 17 
20
16
 / 2  0.005  t 22; 0.005  2.8188
( x A  xB )  t 22 ;0.005
0.03  2.8188
s 2A s B2

n A nB
0.0412 0.1734

21
17
( –0.281 ; 0.341 ) é o I.C. 99% para a diferença entre as médias de
tamanhos dos produtos das indústrias A e B.
2. Num estudo comparativo do tempo médio de adaptação dos empregados
de um grande complexo bancário, uma amostra aleatória de 50 homens e 50
mulheres produziu os seguintes resultados:
A qualidade das duas fábricas é a mesma? (comparar as variâncias)
nH  50
nM  50
xH  3.2 anos
xM  3.7 anos
s H  0.8 anos
sM  0.9 anos
38
Que conclusões você pode tirar com relação ao tempo de adaptação de
homens e mulheres desse banco? (Indique quais suposições foram feitas)
 2M
I.C. 95% para 2 :
H
(0.9) 2
0.81

 0.7182
Limite inferior:
(0.8) 2 F49 ; 49;0.975 0.64  1.7622
(0.9) 2
0.81
Limite superior:

 2.2302
2
(0.8) F49 ; 49;0.025 0.64  0.5675
 2M
O intervalo ( 0.7182 ; 2.2302 ) é um intervalo 95% para 2 .
H
Como o intervalo engloba o valor 1, então, não há evidência suficiente
para afirmar que as variâncias são diferentes.
I.C. 90% para a diferença entre os tempos médios de adaptação entre
homens e mulheres, com variâncias iguais.
(nM  1) sM2  ( nH  1) s H2 49  0.64  49  0.81
s 

 0.725
nM  n H  2
98
2
p
 / 2  0.05  t98; 0.05  1.6606
( x M  xH )  t98; 0.05
(3.7  3.2)  1.6606
s 2p
nM

s 2p
nH
0.725 0.725

50
50
( 0.2172 ; 0.7828 ) é o I.C. 90% para a diferença entre os tempos médios
de adaptação de entre mulheres e homens.
39
O intervalo n†o engloba o zero, portanto, há evidências suficientes para
afirmar que os homens t•m um tempo de adapta…†o menor do que as
mulheres.
Suposições: Normalidade dos tempos de adapta…†o de homens e mulheres
3. Uma associa…†o de defesa de consumidores deseja estimar o consumo
m‡dio um novo modelo de autom‹vel que ser„ lan…ado no mercado. Para
fazer esta verifica…†o, a associa…†o observa uma amostra de 10 ve‰culos,
conduzidos por motoristas treinados, num percurso de 100 milhas. O
consumo, em galŒes, foi registrado com os seguintes resultados:
 x  43.28
e
 x 2  188.4886
Assumindo que estes valores representam uma amostra aleat‹ria de uma
vari„vel normalmente distribu‰da com m‡dia  e variŠncia  2 .
a) Calcule estimativas pontuais para  e  2 .
ˆ  x 
43.28
 4.328
10
188.4886  10(4.328) 2 1.17276
ˆ  s 

 0.13031
(10  1)
9
2
2
b) Calcule um intervalo de 75% de confian…a para  2 . (  0.25 )
 9; 0.125  4.507 e  9; 0.875  13.926
(n  1) s 2 1.17276

 0.0842
Limite inferior:
9 ;0.875
13.926
(n  1) s 2 1.17276
Limite superior:

 0.2602
9 ; 0.125
4.507
I.C. 75% para a variŠncia  2 ‡ dado por: ( 0.0842 ; 0.2602 )
40
4. Os dados abaixo s†o uma amostra aleat‹ria para estimar a propor…†o
estudantes de uma universidade que possuem autom‹vel.
Intervalo conservador de 90% de confian…a para p : ( 0.5555 ; 0.8845 )
Intervalo considerando a normalidade de p̂ : ( 0.4887 ; 0.9513 )
a) E pontual para p̂ ? (ponto médio dos intervalos)
pˆ 
0.5555  0.8845 0.4887  0.9513

 0.72
2
2
b) Qual ‡ o tamanho da amostra?
Sabe-se que o tamanho do I.C. 90% conservador ‡ dado por:
Z 0.05
1
 0.5555  0.72
4n
1.645
 0.1645
4n
4n  10a

n  25
c) Qual o n‰vel de confian…a do segundo intervalo
0.72  Z  / 2
Z / 2 
pˆ (1  pˆ )
 0.9513
25
5  (0.9513  0.72)
 2.576
0.72  0.28
O n‰vel de confian…a do I.C. ‡ (1  )  0.99 ou 99%.
41
5. Da popula…†o X  Normal(50;100) retirou-se uma aa de n = 10
elementos e da popula…†o Y  Normal(60;100) retirou-se uma aa de m = 6
elementos, independente da primeira, obtendo-se as variŠncias amostrais s12 e
s22 , respectivamente.
a) Encontre o valor de a, tal que Ps12 s22  a   0.95
Obs: 12   22  100
s12
Fn 1; m 1

s12
s22
Ps12 s22  a   0.95

a  F9;5; 0.95  4.772
s22
12

 22

F9 ;5
b) Encontre o valor de b, tal que Ps12 s22  b   0.95
Da rela…†o entre as distribui…Œes F’s
F9 ;5; 0.05 
1
F5;9; 0.95

1
 0.2872
3.482
Ps12 s22  b   0.95

b  F9;5; 0.05  0.2872
6. Uma das maneiras de medir o grau de satisfa…†o dos empregados de uma
mesma categoria quanto ƒ pol‰tica salarial ‡ por meio do desvio padr†o de
seus sal„rios. A F„brica A diz ser mais coerente na pol‰tica salarial do que a
F„brica B. Para verificar essa afirma…†o, sorteou-se uma amostra de 10
funcion„rios n†o especializados de A, e 15 de B, obtendo-se os desvios
padrŒes s A  1000 reais e sB  1600 reais. Qual seria a sua conclus†o?
O grau de satisfa…†o com o sal„rio ‡ o mesmo nas duas f„bricas?
(comparar as variâncias)
42
n A  10
s A  1000
s A2  1 106
nB  15
s B  1600
s B2  2.56  106
 2B
Construir um I.C. 95% para 2 e verificar se engloba o valor 1:
A
s B2
2.56  106
Limite inferior: 2

 0.6740
s A F14;9 ;0.975 1  106  3.7980
Como F14;9; 0.025 
1
F9 ;14; 0.975

1
 0.3116
3.209
s B2
2.56  106
Limite superior: 2

 8.2157
s A F14;9 ; 0.025 1 106  0.3116
 2B
I.C. 95% para 2 : ( 0.6740 ; 8.2157 )
A
O I.C. engloba o valor 1, portanto, não há evidência para sustentar a
afirmação da Fábrica A.
Download

Estat 2 - Intervalos de Confiança