Estimação dos parâmetros
Estatística
Estimação dos parâmetros
Pontos mais importantes:
-método dos momentos
-método de máxima verosimilhança
-intervalos de confiança para a média de distr. normal: s2 conhecida
-intervalos de confiança para a média de distr. normal: s2 incógnita
-estimação de diferença na m entre duas populações normais
-intervalos de confiança para a variância de distr. Normal
-intervalos de confiança para a média de distr. Bernoulli
-eficiência de um estimador pontual: “mean square error” e “bias”
1
Estimação dos parâmetros
Estatística
Seja X1, X2,..., Xn uma amostra de F completamente definido pelo um
vector dos parâmetros P (e.g. uma distr. normal P={m s2}).
Teoria de probabilidades:
o vector P é supostamente conhecido questões de probabilidade
Estatística:
o vector P é incógnito estimação dos parâmetros com estimadores
estimação dos parâmetros  estimador pontual (um valor só)
estimação do intervalo a onde o parâmetro cai  intervalo
de confiança
2
Estatística
Estimação dos parâmetros
Método dos momentos
-Seja uma amostra X1, X2,..., Xn de F com parâmetro P incógnito.
-Suponha:
P=g(E[X])
-Assim:
ˆ = g X )
P
-Não todos os parâmetros podem ser escritas em função do E[X] só.
E.g. a variância:
s2 = E[X2 ] - E2[X] = g(E[X], E[X2 ])
3
Estatística
Estimação dos parâmetros
-Em geral:
P=g(E[X], E[X2],..., E[Xr])
e
ˆ = gM1, M2 ,...Mr )
P
-onde Mk representa o momento amostral de ordem k:
k
X
i=1 i
n
Mk =
n
4
Estatística
Estimação dos parâmetros
Exemplo: Determine o estimador da média e variância de uma população normal
com o método dos momentos.
m = E[X]
s2 = E[X2 ] - E2 [X]
solução:

mˆ =
n
i =1
i=1 X
n
sˆ 2 =
n
n
n
  Xi
  i =1
 n

i=1 Xi2  nX 2
n
=
2
i
Xi
n
 X )
2

 =


2
X
i=1 i
n
n
 X2 =
2 
2 
(
X

X
)
(
X

X
)


i
  s 2 = i =1 i

= i =1


n
n 1


n
n
5
Estatística
Estimação dos parâmetros
Método de máxima verosimilhança
Suponha que X1, X2,..., Xn são variáveis aleatórias. A função f(X1,
X2,..., Xn) é assumida ser conhecida excepto P.
Porque P é desconhecido, f(X1, X2,..., Xn) depende de P. A função
f(X1, X2,..., Xn| P) representa a probabilidade (ou densidade de
prob.) da mostra ser x1, x2,..., xn para o vector dos parâmetros P.
A estimativa máxima verosimilhança do P é o vector que
maximiza a probabilidade das observações serem x1, x2,..., xn, ou :

ˆ
max f x1, x 2 ,...x n | P
)
f(X1, X2,..., Xn| P) também chama-se função de verosimilhança.
6
Estatística
Estimação dos parâmetros
Amostra normal de tamanho n: X1, X2,..., Xn são v.a.s independentes, m
e s?
 ( x1  m ) 2  
 ( x n m ) 2 
 ( x i m ) 2
n
 1
1
1
2
2
2
f ( x1 ,...,x n | m s) = 
e 2s ...
e 2s  = 
e 2s =
 s 2
  s 2
 i =1 s 2

 

n
n
  ( x i m ) 2
1
2
 1 2 1
=   n e 2s
 2  s
-tirando o logaritmo:
2
(
x

m
)
n

i
ln f (x1 ,...,x n | m s) =  ln(2)  n ln s  1 2
2
2s
n
7
Estatística
Estimação dos parâmetros
-a estimativa máxima verosimilhança de m e s é obtida nos
pontos mˆ e sˆ igualando as derivadas a zero:
 ln f ( x1 ,...,x n | mˆ sˆ )
=0=
m
 ln f ( x1 ,...,x n | mˆ sˆ )
n
=0= 
s
s
 (x
n
1
i
 mˆ )
sˆ 2
x

 X )

 mˆ =
i
n
1 (x i  mˆ ) 2
n
sˆ
3
 (x
n

 sˆ =
1
i
n
 m) 2
 s )
8
Estatística
Estimação dos parâmetros
Intervalos da confiança para o valor média normal (s
conhecido)
m
X
mX
-Por vezes, é vantajoso definir um intervalo () tal:
PX    m  X  ) = 90; 95; 99; 99,5% etc.
-Sabemos que:
Z= n
X m
~ N(0,1)
s


X m
P  1,96  Z = n
 1,96 = 0,95
s


s
s 

P X  1,96
 m  X  1,96
 = 0,95
n
n

ou,
9
Estatística
Estimação dos parâmetros
s
s ,chama-se intervalo de
 m  X  1,96
n
n
confiança (“bilateral”) a 95%.
-O intervalo
X  1,96

Porquê 1,96 ?
P(Z<-1,96)=0,025,
P(Z>1,96)=0,025
0,025+0,025=0,05
Assim a probabilidade que m está no intervalo é 1-0,05=0,95
-“unilateral” intervalo de confiança:
s


P X  1,64
 m  = 0,95
n


“pelo menos”
ou
s 

P m  X  1,64
 = 0,95
n

“não é maior que”
10
Estimação dos parâmetros
Estatística
11
Estatística
Estimação dos parâmetros
-em geral o intervalo de confiança com nível de confiança P=1a :
s
s 

P X  Za / 2
 m  X  Za / 2
 = 1 a
n
n

s


P X  Za
 m = 1 a
n


PZ  z a 2 ) = PZ  z a 2 ) = a
a a
 =a
2 2
s 

P m  X  Za
 = 1 a
n

12
2
Estatística
Estimação dos parâmetros
Exemplo: Calcule o 95% intervalo de confiança para o coeficiente de transferência
do calor (h) num permutador de calor se os valores calculados após 9 experiências
são (W/m2K): 502, 488, 495, 504, 511, 493, 490, 512, 507 com s=8.
h=
h
n
i
=
502 488   507
= 500,2
9
8
8
500 ,2  1,96  m  500 ,2  1,96
3
3
mh =500,25,3 W/m2K com 95% confiança
13
Estatística
Estimação dos parâmetros
Intervalos da confiança para o valor média normal (s
incógnita)
Geralmente a variância de população não é conhecida, mas
podemos construir intervalos de confiança para t = n X  m a
s
mesma forma.
s
s 

P X  t a / 2,n 1
 m  X  t a / 2,n 1
 = 1 a
n
n

n
X m
~ t n -1
s
ou
s
s 

m   X  t a / 2,n 1
, X  t a / 2,n 1

n
n

com (1-a) percentagem de confiança
14
Estatística
Estimação dos parâmetros
Exemplo: Calcule o 95% intervalo de confiança para o coeficiente de transferência
do calor (h) num permutador de calor se os valores calculados após 9 experiências
são (W/m2K): 502, 488, 495, 504, 511, 493, 490, 512, 507.
h=500,2
t0.025,8=2,306
s=
2
2
h

n
h
 i
n 1
=
502  488    507 ) 9  500,2
500 ,2  2,306
2
2
2
8
2
= 10,3
10,3
10,3
 m  500 ,2  2,306
3
3
mh =500,2  7,9 W/m2K com 95% confiança
15
Estimação dos parâmetros
Estatística
16
Estatística
Estimação dos parâmetros
Estimação de diferença na m entre duas populações
normais
Sejam X1,..., Xn e Y1,..., Ym duas mostras normais e independentes.
Como podemos estimar mxmy e a correspondente intervalo de
confiança?
mˆ x = X
,
mˆ Y = Y
mX  mY 
mˆ X  mˆ Y = X  Y
2
s
X ~ N(m X , X
)

s 2X
s 2Y 
.
n indep
 X  Y ~ N m X  m Y ,


2
n
m
s


Y ~ N(m Y , Y )
m
17
Estatística
Estimação dos parâmetros
Assim já é fácil construir o intervalo de confiança para a diferença
porque:
Z=
X  Y  (m X  m Y )
s
s

n
m
2
X
2
Y
~ N(0,1)




X  Y  (m X  m Y )


P  Za / 2 
 Za / 2  = 1  a
2
2
s
s
X


 Y
n
m


(P(|Z|>za/2)=a)
ou
2
2
2
2


s
s
s
s
X
Y
X
Y

P XY

Za / 2  (m X  m Y )  X  Y 

Za / 2  = 1  a


n
m
n
m


18
Estatística
Estimação dos parâmetros
-se sX e sY forem desconhecidos, é complicado determinar o tipo
de distribuição:
X  Y  (m X  m Y )
s 2X s 2Y

n m
-de facto, só pode ser deduzida assumindo que sX = sY.






X  Y  (m X  m Y )
P  t a / 2 , n  m  2 
 t a / 2,n  m  2  = 1  a
2
2
 1   1  (n  1)s X  (m  1)s Y


  


nm2
n m


19
Estatística
Estimação dos parâmetros
Intervalos da confiança
distribuição normal
para
a
variância
da
Podemos calcular os intervalos de confiança para s2 simplesmente
usando a seguinte informação:
(n-1)s2/s2 ~ c2n-1
assim
 2

s2
P c 1a / 2,n 1  (n  1) 2  c 2 a / 2,n 1  = 1  a
s


ou
 (n  1)s 2
(n  1)s 2 
2
 = 1  a
P 2
s  2
c 1a / 2,n 1 
 c a / 2,n 1
20
Estatística
Estimação dos parâmetros
Exemplo: Tiramos uma amostra n=10 de vinho tinto e medimos a correspondente
concentração de açúcar (C, kg/l). Determine o intervalo de confiança a 90% para o
desvio padrão. Os resultados: 0,123, 0,124, 0,126, 0,120, 0,13, 0,133, 0,125,
0,128, 0,124 e 0,126
c20,05, 9 =16,917
c20,95, 9 =3,334
C

C=
n
s
2
C
C

=
2
i
 nC 2
n 1
i
=
0,123 0,124   0,126
= 0,1259
10
0,123  0,124    0,126 )10 0,1259
=
2
2
2
2
9
= 1,366105
1,36610-5
1,36610-5
2
9
s 9
16,917
3,334

s  2,696103 ; 6,072103
)
(kg/l)
21
Estimação dos parâmetros
Estatística
22
Estatística
Estimação dos parâmetros
Intervalos da confiança (aproximado) para o valor
média normal (p) de uma variável Bernoulli
Se np for suficientemente grande, uma variável binomial pode ser
aproximada:
X  np
~ N(0,1)
np(1  p)
Onde, p é a probabilidade de sucesso ou valor de esperança de
correspondente variável Bernoulli. Assim, uma aproximação do 1-a
intervalo de confiança para o valor média pode ser obtida a partir:

P  Z a / 2 



X  np
 Za / 2   1  a

np(1  p)

P Za
/2
 x) = a )
23
Estatística
Estimação dos parâmetros
Aplicando que um estimador pontual do P pode ser escrito:
p=X/n
Temos,




X

np
P  Za / 2 
 Za / 2   1  a


X
X(1  )


n


Arengar a equação anterior para P temos:


X
P 
n


X
X (1  )
n Z  p X 
a /2
n
n

X

X (1  )
n Z   1a
a /2

n


24
Estatística
Estimação dos parâmetros
Eficiência de um estimador pontual
Seja X1,..., Xn uma amostra com parâmetro P não conhecida.
ˆ como estimador do P. Quanto é que vale P
ˆ ?
Utiliza-se P
O valor de estimador pode ser caracterizado por o “ mean square
error” (desvio quadrático do parâmetro):
ˆ ,P)=E[(P
ˆ -P)2]
r(P
O estimador que minimiza r é o melhor estimador, infelizmente
raramente existe.
25
Estatística
Estimação dos parâmetros
Um bom estimador diz-se não-enviesado se o seu valor de
esperança matemática é igual com o parâmetro da população.
ˆ )):
Definição do enviesamento (bP(P

ˆ)=EP
ˆ P
bP (P
Seja X1,..., Xn uma amostra. b=? se a estimador de m foram 1) X1 e 2)
X
1)
E[X1]= m -> b1=0
2)
E[(X1+X2+,...,+Xn)/n]=m -> b2=0
Generalizando: bm=0 se:
n
mˆ =   i X i
i =1
n
se

i =1
i
=1
26
Estatística
Estimação dos parâmetros
-o “mean square error” de um estimador com b=0:
) 

)  
 ) = Var(Pˆ )
2
ˆ
ˆ
ˆ E P
ˆ
r P, P = E P  P = E P
2
-o “mean square error” de um estimador com b0:

) 
)
2
ˆ
ˆ
ˆ )  bP2 (P)
r P, P = E P  P = Var (P
-combinação de dois estimadores independentes:
ˆ = P
ˆ 1  (1  )P
ˆ2
P
ˆ , P) = Var (P
ˆ ) = 2Var (P
ˆ 1 )  (1  )2 Var (P
ˆ 2)
r(P
minimizar r:
ˆ , P)
d r (P
ˆ 1 )  2(1  )Var (P
ˆ 2) = 0
= 2Var (P
d
27
Estatística
Estimação dos parâmetros
1
s12
=
1 2 1 2
s1
s2
Exemplo: Suponha que mandamos duas amostras do rio Douro para dois laboratórios
independentes com o objectivo de determinar (estimar) a concentração dos ácidos na
água ma. Os resultados são (mg/l):
a1 = 10
s12 = 2
a 2 = 13
s 22 = 1
1
2 = 0,5 = 1
1 1
1,5 3
2 1
1
2
mˆ a = a1  (1   )a 2 = 10  13 = 12
3
3
=
28
Download

Estimação dos parâmetros