Intervalos de Confiança
Gueibi Peres Souza
[email protected]
Introdução
• Mais comum: estimativas pontuais do
verdadeiro parâmetro;
• A medida real nunca será determinada
com absoluta confiança;
• Estimativa do parâmetro pode ser feita
através de intervalo de confiança;
• A probabilidade do intervalo conter o
parâmetro é especificada;
2
Introdução
• O intervalo é definido por dois limites que
possuem um grau de confiança;
• Este grau de confiança é escolhido (depende do grau
de precisão que desejamos obter na estimativa);
• Mais comum: P(90%, 95% e 99%);
• Vantagem: expressar o erro que aceitamos ao
calculá-la (ideia da precisão);
• Intervalo pequeno = alta precisão (do valor pontual);
• Quanto maior o grau de confiança exigido maior
a amplitude do intervalo (menor precisão do valor pontual);
3
Tipos de Intervalo de Confiança
1. Intervalo de confiança para a média
populacional (μ) quando a variância
populacional (σ2) é conhecida;
2. Intervalo de confiança para a média
populacional (μ), utilizando a distribuição
“t” (σ2 desconhecida) ;
3. Intervalo de confiança para a média
utilizando a desigualdade de Chebyshev;
4
Tipos de Intervalo de Confiança
4. Intervalo de confiança para proporção,
utilizando a distribuição normal;
5. Intervalo de confiança para o desvio
padrão e variância;
6. Intervalo de confiança para diferença
entre duas médias populacionais;
7. Intervalo de confiança para a diferença
entre duas proporções;
5
Intervalo de Confiança para μ
utilizando distribuição normal
• Quando a variância populacional (σ2) é
conhecida:
• O uso da distribuição normal na estimação
da média é garantida nos seguintes
casos:
• Para qualquer grande amostra (n ≥ 30);
• Para uma pequena amostra (n < 30) somente se a
população for normalmente distribuída e “σ” for
conhecido;
– Obs.: se n ≥ 30 e σ for desconhecido, para se obter os
limites de confiança emprega-se a estimativa da amostra
(s);
6
Intervalo de Confiança para μ
utilizando distribuição normal
• Os limites de confiança para a média
populacional são dados por X ± z c × σ X ou
vvcvvcv
X ± zc × sX ;
• Onde:
– X  média aritmética da amostra ;
– zc  valor do grau de confiança do intervalo ;
σ
σ
σX =
ou σ X =

n
n
z
90%   1,64
95%   1,96
99%   2,58
Só para distribuição
amostral
N-n
N-1
Obs.:
Grau de confiança = 1 – nível de
significância (α)
s
s
sX =
ou s X =

n
n
N-n
N-1
7
Intervalo de Confiança para μ
utilizando distribuição normal
• Ex.1: Seja “X” a duração da vida de uma
lâmpada. Cem lâmpadas foram testadas
obtendo-se uma duração de vida média
de 1000 horas com desvio padrão de 100
horas. Determine o intervalo de confiança
de 95% para a média de população.
n = 100
X ± zc × σX
σX =
σ
σ
ou σ X =

n
n
N-n
N-1
X ± zc × sX
sX =
s
s
ou s X =

n
n
N-n
N-1
X = 1000 h
s = 100 h
GC = 95%
8
Intervalo de Confiança para μ
utilizando distribuição normal
n = 100
n > 30
X = 1000 h
X ± zc × sX
s = 100 h
IC = 95%
1000  1,96 
0,475
- 1,96
0,475
0
X ± zc ×
100
100
1000  1,96  10 =
+1,96
P 980,4 h <  < 1019,6 h  = 95%
s
n
980,4 h
+ 1019,6 h
• Conclusão: podemos dizer com 95% de confiança que a
vida média de duração da lâmpada está entre 980,4h e
1019,6h.
9
Intervalo de Confiança para μ
utilizando distribuição normal
• Ex.2: O diâmetro das arruelas produzidas
por uma determinada indústria formam
uma população normalmente distribuída
onde o desvio padrão é 2 milímetros. Foi
extraída uma amostra de 15 arruelas
obtendo-se uma média de 12 mm.
Construa um intervalo de confiança de
99% para estimar o diâmetro das arruelas.
X ± zc × σX
σX =
σ
σ
ou σ X =

n
n
X ± zc × sX
N-n
N-1
sX =
s
s
ou s X =

n
n
N-n
N-1
10
Intervalo de Confiança para μ
utilizando distribuição normal
σ = 2 mm
n = 15
X = 12 mm
X ± zc × σX
σX =
σ

n
2
2
 σX =
= 0,52
3,87
15
13,34
12  2,57  0,52 =
10,66
P 10,66 < μ < 13,34 = 99%
0,495
- 2,57
0,495
0
+2,57
11
Intervalo de Confiança para μ
utilizando a distribuição “t”
• Utiliza-se a distribuição “t” de Gosset para
estimar a média populacional quando:
– n < 30;
– População normalmente distribuída;
– σ desconhecido.
• Então: X ± t c × s X
Graus de de liberdade (gl) de t c = n - 1
s
s
sX =
ou s X =

n
n
N-n
N-1
12
Intervalo de Confiança para μ
utilizando a distribuição “t”
• Ex.3: Em uma amostra realizada em 20
pilhas para máquina de calcular a média
de duração observada foi de 120 horas
com desvio padrão de 30 horas.
Determinar os limites de confiança de
95% para média de horas real.
X ± t c × sX
n = 20
gl = n - 1
X = 120 h
s = 30 h
sX =
s
s
ou s X =

n
n
N-n
N-1
13
Intervalo de Confiança para μ
utilizando a distribuição “t”
• Ex.3:
120  t c 
30
20
gl = n - 1
120  2,093 
0,025
0,025
0,95
- 2,09
0
gl = 20 - 1 = 19
30
=
20
134,02
105,98
P 105,98 h < μ < 134,02 = 0,95
2,09
• Conclusão: Pode-se afirmar com 95% de confiança que os limites
das médias de horas de duração das pilhas são de 105,98 h e
134,02 h.
14
Intervalo de Confiança para μ
utilizando a desigualdade de Chebyshev
• A desigualdade de Chebyshev é utilizada
para o cálculo do intervalo da média
populacional quando a amostra é pequena
(n < 30) e a população não é normalmente
distribuída;
X ± k c × σX
X ± k c × sX
• Onde:
sX =
s
s
ou s X =

n
n
1
1 - 2 = Grau de confiança
kc
N-n
N-1
1
= 1 - GC
2
kc
α
σX =
σ
σ
ou σ X =

n
n
1
k =
 kc =
α
2
c
N-n
N-1
1
α
15
Intervalo de Confiança para μ
utilizando a desigualdade de Chebyshev
• Ex.4: Foi testada uma amostra de 10
garrafas de uma certa marca de bebida com
relação ao seu teor de álcool. Foi encontrada
uma média de 40% Vol. e 2% Vol. de desvio
padrão. Sabendo que são produzidas
diariamente apenas 100 garrafas dessa
marca, as quais não se distribuem
normalmente, determine os limites de
confiança diários de 99% para a média real
de teor alcoólico desta marca de bebida.
X ± k c × σX
X ± k c × sX
σX =
σ
σ
ou σ X =

n
n
N-n
N-1
sX =
s
s
N1- n
ou s X = kc2 =
 kc =
Nα- 1
n
n
1
α
16
Intervalo de Confiança para μ
utilizando a desigualdade de Chebyshev
• Ex.4:
X ± k c × sX
n > 5% N
1
1 - 0,99
kc =
k c = 10
n = 10
X = 40% Vol.
s = 2% Vol.
s
sX =

n
N-n
N-1
0,02
sX =

10
100 - 10
100 - 1
N = 100
GC = 99%
sX =
0,02

10
X ± k c × sX
0, 4  10  0,0063  0,9535 =
90
99
0,4 ±10 
0,02

10
90
99
46% Vol.
34% Vol.
17
Intervalo de Confiança para a proporção
utilizando distribuição normal
• O uso da distribuição normal como
aproximação da binomial, para construção
de intervalo de confiança, é garantida
quando:
• n ≥ 30;
• np ≥ 5;
• Neste caso: p  z c  s p
– Onde:
ou
sp =
p q

n
N-n
N-1
18
Intervalo de Confiança para a proporção
utilizando distribuição normal
• Ex.5: Em 65 lotes testados de um
determinado processo produtivo, foram
rejeitados 26 por não estarem dentro dos
padrões
de
qualidade
aceitáveis.
Determinar os limites de confiança de
90% para a proporção de rejeições que
seria obtido em um grande número de
lotes gerados neste processo.
n = 65
26
p=
= 0,4
65
q = 0,6
GC = 90%
p  zc  sp
sp =
p q

n
N-n
N-1
19
Intervalo de Confiança para a proporção
utilizando distribuição normal
n = 65
26
p=
= 0,4
65
q = 0,6
GC = 90%
p  zc 
sp =
0,24
65
p q
n
sp =
0,45
0,45
0
0,24
65
0,300
0,4996
0,05
0,9
- 1,64
sp =
0,24
= 0,4  0,0996 =
65
0,4  1,64 
0,05
0,4  0,6
65
1,64
• Conclusão: podemos afirmar com 90% de confiança
que este processo produzirá entre 30 e 50% de
lotes defeituosos. E se elevássemos o GC? O que
significaria em termos de precisão?
20
Intervalo de Confiança para o
desvio padrão e a variância
• Desvio padrão:
2
n
1
s
 

2
superior
 σ 
2
n
1
s
 

2
inferior
• Variância:
 n - 1 s

2
superior
2
 σ 
Onde: gl = n – 1 para ambos os casos.
2
 n - 1 s
2
2
inferior
21
Intervalo de Confiança para o
desvio padrão e a variância
• Ex.6: O desvio padrão dos diâmetros de
16
esferas
produzidas
por
uma
determinada fábrica é de 240 mm.
Determine os limites de confiança de 95%
para o desvio padrão de todos os
diâmetros
de
esferas
que
serão
produzidas por esta fábrica.
 n - 1 s 2
n = 16
s = 240
GC = 95%
2
superior
 n - 1 s

2
superior
 σ 
2
 σ 
2
 n - 1 s 2
2
 inferior
 n - 1 s
2
inferior
gl = n - 1
2
22
Intervalo de Confiança para o
desvio padrão e a variância
 n - 1 s 2

2
superior
 σ 
 n - 1 s 2

gl = n - 1
gl = 16 - 1 = 15
2
inferior
16 - 1 2402
0,025
27,5
 σ 
16 - 1 2402
6, 26
0,025
0,95
177,25  σ  371,51
2
2
 0,025;
gl =  0,025; 15 = 27,5
2
2
 0,975;
gl =  0,975; 15 = 6,26
2
superior
2
 inferior
• Conclusão: podemos afirmar com 95% de confiança que
o desvio padrão do diâmetro de todas as esferas
produzidas por esta fábrica estarão entre 177,25 e
371,51 mm.
23
Intervalo de Confiança para o
desvio padrão e a variância
• Ex.7: Usando agora 20 esferas produzidas
pela mesma fábrica obteve-se um desvio
padrão igual a 100 mm. Determine o
intervalo de confiança de 90% para a
variância.
n = 20
s = 100 mm
GC = 90%
 n - 1 s 2
2
superior
 n - 1 s2
2
superior
 σ 
 σ 
2
 n - 1 s 2
2
 inferior
 n - 1 s2
gl = n - 1
2
inferior
24
Intervalo de Confiança para o
desvio padrão e a variância
 n - 1 s2

2
superior
 σ 
2
 n - 1 s2

 20 - 1 1002
2
inferior
 σ2 
2
superior
 20 - 1 1002
0,05
2
inferior
gl = 19
0,05
0,9

2
0,95; 19
 20 - 1 1002
30,1
2
 0,05;
19 = 30,1
= 10,1
2
 inferior
2
superior
 σ2 
 20 - 1 1002
10,1
6312,30  σ 2  18811,88
• Conclusão: podemos afirmar com 90% de confiança que
a variância do diâmetro de todas as esferas produzidas
pela fábrica estará entre 6.312,30 e 18.811,88 mm2.
25
Intervalo de Confiança para a diferença
entre duas médias populacionais
• Utilizando a distribuição normal:
X
1
 X2   zc  σX1 X2
• Onde:
σ X1 -X2 =
• Ou
X
1
σ12
σ 22
+
n1
n2
 X2   zc  sX1 X2
s X1 -X2 =
2
1
2
2
s
s
+
n1
n2
26
Intervalo de Confiança para a diferença
entre duas médias populacionais
• Utilizando a distribuição normal:
• Ex.8: A média de “dureza” para uma amostra de
30 blocos de motores produzidos por um
determinado fornecedor é de 180 Mg Pascal,
com desvio padrão amostral de 14 Mg Pascal.
Em outro fornecedor uma amostra aleatória de
40 blocos apresentou uma “dureza” média de
170 Mg Pascal com desvio amostral de 10 Mg
Pascal. Determine o intervalo de confiança de
99% para diferença entre as “durezas” médias
das duas fundições fornecedoras.
27
Intervalo de Confiança para a diferença
entre duas médias populacionais
• Utilizando a distribuição normal:
s X1 -X2 =
X
1
s12
s 22
+
n1
n2
sX1 -X2
142 102
=
+

30
40
196 100
+

30
40
6,533 + 2,5 = s X1 -X2 = 3
 X2   zc  sX1 X2  180  170   zc  3
180  170
 2,58  3  10  7,74 =
17,74
2,26
0,99
0,005
0,495
- 2,58
0,005
0,495
0
2,58
• Conclusão: podemos afirmar com 99% de confiança que
a diferença entre as durezas médias das duas empresas
fornecedoras está entre 2,26 e 17,74 Mg Pascal.
28
Intervalo de Confiança para a diferença
entre duas médias populacionais
• Utilizando a distribuição “t”:
X
1
 X 2   t c  s X1 X2 
1
1
+
n1
n2
• Onde:
gl = n1 + n 2 - 2
s X1 - X2 =
2
2
n
1
s
+
n
1
s
 1  1  2  2
n1 + n 2 - 2
29
Intervalo de Confiança para a diferença
entre duas médias populacionais
• Utilizando a distribuição “t”:
• Ex.9: Para uma amostra aleatória de 10
lâmpadas a vida média é de 4000 horas com
desvio padrão de 200 horas. Suponha-se que a
duração das lâmpadas tenha uma distribuição
normal. Para uma outra marca de lâmpada cuja
duração também se supõe normalmente
distribuída uma amostra de 8 lâmpadas
apresenta média de 4600 horas e desvio padrão
de 250 horas. Estime o intervalo de confiança
de 90% para a diferença entre a vida média de
operação das duas marcas de lâmpada.
30
Intervalo de Confiança para a diferença
entre duas médias populacionais
• Utilizando a distribuição “t”:
n1 = 10
X1 = 4000
s1 = 200
n2 = 8
X 2 = 4600
gl = 10 + 8 - 2 = 16
gl = n1 + n 2 - 2
sX1 -X2 =
10 - 1 2002
 4000  4600 
 8 - 1 2502
10 + 8 - 2
 1,75  223,6 
s 2 = 250
GC = 90%
600  183,63 =
-416,37
 223,26
1
1
+
10
8
0,9
0,05
0,45
-783,63
0,05
0,45
0
• Conclusão: podemos afirmar com 95% de confiança que
a diferença da vida média de operação da marca B em
relação a marca A está entre 416,37 e 783,63 horas.
31
Intervalo de Confiança para a
diferença entre duas proporções
 p1  p2 
 zc  σp1 p2
• Onde:
σp =
p1  q1
p2  q 2

n1
n2
32
Intervalo de Confiança para a
diferença entre duas proporções
• Ex.10: Uma pesquisa de mercado revelou que a
proporção de 0,4 crianças de uma amostra
aleatória de 100 em uma grande comunidade
preferem brinquedos de uma Companhia X. Em
uma outra grande comunidade 60 crianças de
uma amostra aleatória de 200 preferem os
brinquedos da mesma companhia. Determine o
intervalo de confiança de 90% para a diferença
na proporção de crianças das duas
comunidades que preferem o brinquedos da
companhia X.
 p1  p2 
 zc  σp1 p2
σp =
p1  q1
p  q2
 2
n1
n2
33
Intervalo de Confiança para a
diferença entre duas proporções
A
n A = 100
B
n B = 200
p A = 0,4
60
= 0,3
200
q B = 0,7
q A = 0,6
 0,4
pB =
0,9
0,05
0,45
- 1,64
σp =
0,45
0
0,05
1,64
0,4  0,6
0,3  0,7

= 0,059
100
200
 0,3  1,64  0,059  0,1  0,097 =
0,197
0,003
• Conclusão: podemos afirmar com 90% de confiança que
a diferença na proporção de crianças das duas
comunidades que preferem os brinquedos da Cia X está
entre 0,3% e 19,7%.
34
Download

Intervalos de Confiança