Estatística: Aplicação ao Sensoriamento Remoto
SER 202 - ANO 2015
Inferência Estatística
Camilo Daleles Rennó
[email protected]
http://www.dpi.inpe.br/~camilo/estatistica/
Inferência Estatística
Considere o experimento: retiram-se 3 bolas de uma urna (com
reposição). Define-se uma v.a. X cujo valor representa o número
total de bolas vermelhas dentre as 3 escolhidas. Qual a média e
variância de X?
Quais os valores possíveis de X?
X: {0, 1, 2, 3}
Qual a distribuição de probabilidade de X?
Binomial
Quais os parâmetros que definem uma Binomial?
nep
n=3
p=?
DISTRIBUIÇÃO CONHECIDA
PARÂMETRO(S) DESCONHECIDO(S)
2
Inferência Estatística
Numa imagem, um pixel é selecionado ao acaso. Define-se uma v.a.
X cujo valor representa seu valor digital. Qual a probabilidade
deste pixel possuir valor entre 100 e 150?
Quais os valores possíveis de X?
X: {0, 1, ..., 255} (considerando uma imagem 8 bits)
Qual a distribuição de probabilidade de X?
Desconhecida (discreta)
Que parâmetros são necessários para definir esta distribuição?
???????
DISTRIBUIÇÃO DESCONHECIDA
3
Inferência Estatística
inferir certas características
da população
amostra
S
distribuição desconhecida
e/ou
parâmetros desconhecidos
n elementos (ou objetos) da população
ex: sortear n pixels de uma imagem
(com ou sem reposição)
n realizações da v.a.
ex: medir a reflectância de um objeto
n vezes

a amostra constitui um conjunto de n v.a.
X1, X2, ..., Xn com mesma distribuição (desconhecida)

Amostra Aleatória
4
Estimação de Parâmetros
Amostra
População
Distribuição de Probabilidade (ou FDP)
Parâmetros
(valor fixo)
Estimação
Distribuição Amostral (Frequências)
estimar
Estatísticas
(variável aleatória)
pontual (estatísticas)
por intervalo (intervalos de confiança)
OBS: estatística: é a v.a. que estima (pontualmente) um parâmetro (populacional)
as vezes é chamada simplesmente de estimador
estimativa: é o valor do estimador obtido para uma amostra específica
5
Estimação Pontual
Seja X uma v.a. normalmente distribuída com a média () e a variância (2)
desconhecidas. Retira-se uma amostra de tamanho n com a finalidade de se
estimar  e 2.
• média populacional 
De que maneira os valores da amostra podem ser combinados a fim de se
produzir uma “boa” estimativa de ?
método dos momentos
método da máxima verossimilhança
6
Estimação Pontual
Seja X uma v.a. normalmente distribuída com a média () e a variância (2)
desconhecidas. Retira-se uma amostra de tamanho n com a finalidade de se
estimar  e 2.
• média populacional 
De que maneira os valores da amostra podem ser combinados a fim de se
produzir uma “boa” estimativa de ?
Suponha que seja possível produzir k diferentes estimadores para , sendo
ˆ k é o k-ésimo estimador de 
Mas qual é o melhor estimador pontual?
• não tendencioso
E (ˆ k )  
• variância mínima
Var (ˆk )  Var (ˆ j ) k  j
Exato
Impreciso
Inexato
Preciso
Tiro ao alvo
7
Estimação Pontual
Seja X uma v.a. normalmente distribuída com a média () e a variância (2)
desconhecidas. Retira-se uma amostra de tamanho n com a finalidade de se
estimar  e 2.
• média populacional 
De que maneira os valores da amostra podem ser combinados a fim de se
produzir uma “boa” estimativa de ?
n
ˆ  X 
x
i 1
n
i
N
  x j FR( X  x j )
média amostral
j 1
dados agrupados
8
Estimação Pontual
Seja X uma v.a. normalmente distribuída com a média () e a variância (2)
desconhecidas. Retira-se uma amostra de tamanho n com a finalidade de se
estimar  e 2.
• média populacional 
De que maneira os valores da amostra podem ser combinados a fim de se
produzir uma “boa” estimativa de ?
• verificando a tendenciosidade de X
 X  X2   Xn 
E(ˆ )  E( X )  E  1

n


1
n
 E  X1  X 2   X n  

n
n
estimador
não tendencioso
9
Estimação Pontual
Seja X uma v.a. normalmente distribuída com a média () e a variância (2)
desconhecidas. Retira-se uma amostra de tamanho n com a finalidade de se
estimar  e 2.
• média populacional 
De que maneira os valores da amostra podem ser combinados a fim de se
produzir uma “boa” estimativa de ?
• calculando a variância de X
 X  X2   Xn 
Var (ˆ )  Var ( X )  Var  1

n


1
n 2  2
 2 Var  X 1  X 2   X n   2 
n
n
n
10
Estimação Pontual
Seja X uma v.a. normalmente distribuída com a média () e a variância (2)
desconhecidas. Retira-se uma amostra de tamanho n com a finalidade de se
estimar  e 2.
• média populacional 
De que maneira os valores da amostra podem ser combinados a fim de se
produzir uma “boa” estimativa de ?
n
ˆ  X 
x
i 1
n
i
E (ˆ )  
Var ( ˆ ) 
2
n
11
Estimação Pontual
Seja X uma v.a. normalmente distribuída com a média () e a variância (2)
desconhecidas. Retira-se uma amostra de tamanho n com a finalidade de se
estimar  e 2.
• variância populacional 2
De que maneira os valores da amostra podem ser combinados a fim de se
produzir uma “boa” estimativa de 2?
n
ˆ 2 
 x
i 1
i  X
2
Mas será um estimador tendencioso?
n
12
Estimação Pontual
Seja X uma v.a. normalmente distribuída com a média () e a variância (2)
desconhecidas. Retira-se uma amostra de tamanho n com a finalidade de se
estimar  e 2.
• variância populacional 2
De que maneira os valores da amostra podem ser combinados a fim de se
produzir uma “boa” estimativa de 2?
n
ˆ 2 
 x
i  X
i 1
n
2
 X
i 1
i 1
n
i 1
n
i 1
n
n
X
i
n
i
n
  X  2 X  X i  nX 2
n
X
 X     X i2  2 XX i  X 2 
2
n
  X i  nX
i 1
2
i
i 1
  X i2  2nX 2  nX 2
i 1
n
  X i2  nX 2
i 1
13
Estimação Pontual
Seja X uma v.a. normalmente distribuída com a média () e a variância (2)
desconhecidas. Retira-se uma amostra de tamanho n com a finalidade de se
estimar  e 2.
• variância populacional 2
De que maneira os valores da amostra podem ser combinados a fim de se
produzir uma “boa” estimativa de 2?
n
ˆ 2 
 x
i 1
i  X
n
2
 n 2
2 
X

nX
 i
 1  n

2
i 1
  E   X i2   E  X 2 
E ˆ   E 
n

 n  i 1





1 n
  E  X i2   E  X 2 
n i 1
Var( X i )   2  E  X i2    E  X i    E  X i2    2  E  X i2    2   2
2
14
Estimação Pontual
Seja X uma v.a. normalmente distribuída com a média () e a variância (2)
desconhecidas. Retira-se uma amostra de tamanho n com a finalidade de se
estimar  e 2.
• variância populacional 2
De que maneira os valores da amostra podem ser combinados a fim de se
produzir uma “boa” estimativa de 2?
n
ˆ 2 
 x
i 1
Var ( X ) 
i  X
 n 2
2 
X

nX
 i
 1  n

2
i 1
  E   X i2   E  X 2 
E ˆ   E 
n

 n  i 1





1 n
  E  X i2   E  X 2 
n i 1
2
n
2
n
 EX
2
   E  X 
2
 EX
2

2
 EX
2

2
n
 2
15
Estimação Pontual
Seja X uma v.a. normalmente distribuída com a média () e a variância (2)
desconhecidas. Retira-se uma amostra de tamanho n com a finalidade de se
estimar  e 2.
• variância populacional 2
De que maneira os valores da amostra podem ser combinados a fim de se
produzir uma “boa” estimativa de 2?
n
ˆ 2 
 x
i 1
i  X
n
 
E X i2   2   2
 
E X
2

2
n
 2
2
 n 2
2 
X

nX
 i
 1  n

2
i 1
  E   X i2   E  X 2 
E ˆ   E 
n

 n  i 1





1 n
  E  X i2   E  X 2 
n i 1
2
n 2   2
n  1 2 estimador
   
 


tendencioso!
n
n
n
2
2
2
16
Estimação Pontual
Seja X uma v.a. normalmente distribuída com a média () e a variância (2)
desconhecidas. Retira-se uma amostra de tamanho n com a finalidade de se
estimar  e 2.
• variância populacional 2
De que maneira os valores da amostra podem ser combinados a fim de se
produzir uma “boa” estimativa de 2?
x  X 
n
ˆ 
2
i 1
i
n
n
s2 
2
  xi  X 
n
n 1
2
i 1
n 1
E  s2    2
estimador
não tendencioso
variância amostral
(ver Estimadores.xls)
17
Estimação Pontual de  e 2
Exemplo: uma amostra (n = 12) é retirada de uma população e os seguintes valores são
observados: 0, 2, 3, 5, 2, 1, 2, 1, 3, 3, 4, 2. Calcule a média e variância amostrais.
distribuição amostral
• média amostral X
Valor
n
X 
X 
x
i
i 1
n
0
1
2
3
4
5
(dados brutos)
0  2  3  ...  2 7

12
3
Total
Freq.
Absoluta
1
2
4
3
1
1
12
Freq.
Relativa
1/12
1/6
1/3
1/4
1/12
1/12
1
N
X
X
 x FA( X  x )
j 1
j
j
n
N
  x j FR( X  x j ) (dados agrupados)
j 1
0*1  1* 2  2* 4  3*3  4*1  5*1 7

12
3
X  0*
(usando FA)
1
1
1
1
1
1 7
 1*  2*  3*  4*  5* 
12
6
3
4
12
12 3
(usando FR)
18
Estimação Pontual de  e 2
Exemplo: uma amostra (n = 12) é retirada de uma população e os seguintes valores são
observados: 0, 2, 3, 5, 2, 1, 2, 1, 3, 3, 4, 2. Calcule a média e variância amostrais.
• variância amostral s2
x  X 
n
s2 
i 1
n
2
i

n 1
x
i 1
distribuição amostral
7
X 
3
2
i
0
1
2
3
4
5
 nX 2
(dados brutos)
n 1
2
2
2
(0  73 )2  (2  73 )2  ...  (2  73 ) 2 (0  2  ...  2 )  12*  73 
2
s 

 1,88
11
11
2
 x
N
s2 
j 1
 X  FA( X  x j )
n 1
Total
Freq.
Relativa
1/12
1/6
1/3
1/4
1/12
1/12
1
N
2
j
Freq.
Absoluta
1
2
4
3
1
1
12
Valor

 x FA( X  x )  nX
j 1
2
j
j
n 1
2
(dados agrupados)
2
2
2
(0  73 )2 *1  (1  73 )2 *2  ...  (5  73 )2 *1 (0 *1  1 *2  ...  5 *1) 12*  73 
2
s 

 1,88
11
11
2
19
Estimação Pontual de  e 2
Observações:
•
 e 2 são parâmetros que representam a população e portanto são
valores fixos sendo, em geral, desconhecidos
•
X e s2 são estatísticas calculadas a partir da amostra e representam
•
variáveis aleatórias (cada amostra apresenta um valor específico)
Não confunda variância amostral (s2) com variância da média amostral (Var(X ))
20
Download

06InfEstat - DPI