Estatística: Aplicação ao Sensoriamento Remoto SER 202 - ANO 2015 Inferência Estatística Camilo Daleles Rennó [email protected] http://www.dpi.inpe.br/~camilo/estatistica/ Inferência Estatística Considere o experimento: retiram-se 3 bolas de uma urna (com reposição). Define-se uma v.a. X cujo valor representa o número total de bolas vermelhas dentre as 3 escolhidas. Qual a média e variância de X? Quais os valores possíveis de X? X: {0, 1, 2, 3} Qual a distribuição de probabilidade de X? Binomial Quais os parâmetros que definem uma Binomial? nep n=3 p=? DISTRIBUIÇÃO CONHECIDA PARÂMETRO(S) DESCONHECIDO(S) 2 Inferência Estatística Numa imagem, um pixel é selecionado ao acaso. Define-se uma v.a. X cujo valor representa seu valor digital. Qual a probabilidade deste pixel possuir valor entre 100 e 150? Quais os valores possíveis de X? X: {0, 1, ..., 255} (considerando uma imagem 8 bits) Qual a distribuição de probabilidade de X? Desconhecida (discreta) Que parâmetros são necessários para definir esta distribuição? ??????? DISTRIBUIÇÃO DESCONHECIDA 3 Inferência Estatística inferir certas características da população amostra S distribuição desconhecida e/ou parâmetros desconhecidos n elementos (ou objetos) da população ex: sortear n pixels de uma imagem (com ou sem reposição) n realizações da v.a. ex: medir a reflectância de um objeto n vezes a amostra constitui um conjunto de n v.a. X1, X2, ..., Xn com mesma distribuição (desconhecida) Amostra Aleatória 4 Estimação de Parâmetros Amostra População Distribuição de Probabilidade (ou FDP) Parâmetros (valor fixo) Estimação Distribuição Amostral (Frequências) estimar Estatísticas (variável aleatória) pontual (estatísticas) por intervalo (intervalos de confiança) OBS: estatística: é a v.a. que estima (pontualmente) um parâmetro (populacional) as vezes é chamada simplesmente de estimador estimativa: é o valor do estimador obtido para uma amostra específica 5 Estimação Pontual Seja X uma v.a. normalmente distribuída com a média () e a variância (2) desconhecidas. Retira-se uma amostra de tamanho n com a finalidade de se estimar e 2. • média populacional De que maneira os valores da amostra podem ser combinados a fim de se produzir uma “boa” estimativa de ? método dos momentos método da máxima verossimilhança 6 Estimação Pontual Seja X uma v.a. normalmente distribuída com a média () e a variância (2) desconhecidas. Retira-se uma amostra de tamanho n com a finalidade de se estimar e 2. • média populacional De que maneira os valores da amostra podem ser combinados a fim de se produzir uma “boa” estimativa de ? Suponha que seja possível produzir k diferentes estimadores para , sendo ˆ k é o k-ésimo estimador de Mas qual é o melhor estimador pontual? • não tendencioso E (ˆ k ) • variância mínima Var (ˆk ) Var (ˆ j ) k j Exato Impreciso Inexato Preciso Tiro ao alvo 7 Estimação Pontual Seja X uma v.a. normalmente distribuída com a média () e a variância (2) desconhecidas. Retira-se uma amostra de tamanho n com a finalidade de se estimar e 2. • média populacional De que maneira os valores da amostra podem ser combinados a fim de se produzir uma “boa” estimativa de ? n ˆ X x i 1 n i N x j FR( X x j ) média amostral j 1 dados agrupados 8 Estimação Pontual Seja X uma v.a. normalmente distribuída com a média () e a variância (2) desconhecidas. Retira-se uma amostra de tamanho n com a finalidade de se estimar e 2. • média populacional De que maneira os valores da amostra podem ser combinados a fim de se produzir uma “boa” estimativa de ? • verificando a tendenciosidade de X X X2 Xn E(ˆ ) E( X ) E 1 n 1 n E X1 X 2 X n n n estimador não tendencioso 9 Estimação Pontual Seja X uma v.a. normalmente distribuída com a média () e a variância (2) desconhecidas. Retira-se uma amostra de tamanho n com a finalidade de se estimar e 2. • média populacional De que maneira os valores da amostra podem ser combinados a fim de se produzir uma “boa” estimativa de ? • calculando a variância de X X X2 Xn Var (ˆ ) Var ( X ) Var 1 n 1 n 2 2 2 Var X 1 X 2 X n 2 n n n 10 Estimação Pontual Seja X uma v.a. normalmente distribuída com a média () e a variância (2) desconhecidas. Retira-se uma amostra de tamanho n com a finalidade de se estimar e 2. • média populacional De que maneira os valores da amostra podem ser combinados a fim de se produzir uma “boa” estimativa de ? n ˆ X x i 1 n i E (ˆ ) Var ( ˆ ) 2 n 11 Estimação Pontual Seja X uma v.a. normalmente distribuída com a média () e a variância (2) desconhecidas. Retira-se uma amostra de tamanho n com a finalidade de se estimar e 2. • variância populacional 2 De que maneira os valores da amostra podem ser combinados a fim de se produzir uma “boa” estimativa de 2? n ˆ 2 x i 1 i X 2 Mas será um estimador tendencioso? n 12 Estimação Pontual Seja X uma v.a. normalmente distribuída com a média () e a variância (2) desconhecidas. Retira-se uma amostra de tamanho n com a finalidade de se estimar e 2. • variância populacional 2 De que maneira os valores da amostra podem ser combinados a fim de se produzir uma “boa” estimativa de 2? n ˆ 2 x i X i 1 n 2 X i 1 i 1 n i 1 n i 1 n n X i n i n X 2 X X i nX 2 n X X X i2 2 XX i X 2 2 n X i nX i 1 2 i i 1 X i2 2nX 2 nX 2 i 1 n X i2 nX 2 i 1 13 Estimação Pontual Seja X uma v.a. normalmente distribuída com a média () e a variância (2) desconhecidas. Retira-se uma amostra de tamanho n com a finalidade de se estimar e 2. • variância populacional 2 De que maneira os valores da amostra podem ser combinados a fim de se produzir uma “boa” estimativa de 2? n ˆ 2 x i 1 i X n 2 n 2 2 X nX i 1 n 2 i 1 E X i2 E X 2 E ˆ E n n i 1 1 n E X i2 E X 2 n i 1 Var( X i ) 2 E X i2 E X i E X i2 2 E X i2 2 2 2 14 Estimação Pontual Seja X uma v.a. normalmente distribuída com a média () e a variância (2) desconhecidas. Retira-se uma amostra de tamanho n com a finalidade de se estimar e 2. • variância populacional 2 De que maneira os valores da amostra podem ser combinados a fim de se produzir uma “boa” estimativa de 2? n ˆ 2 x i 1 Var ( X ) i X n 2 2 X nX i 1 n 2 i 1 E X i2 E X 2 E ˆ E n n i 1 1 n E X i2 E X 2 n i 1 2 n 2 n EX 2 E X 2 EX 2 2 EX 2 2 n 2 15 Estimação Pontual Seja X uma v.a. normalmente distribuída com a média () e a variância (2) desconhecidas. Retira-se uma amostra de tamanho n com a finalidade de se estimar e 2. • variância populacional 2 De que maneira os valores da amostra podem ser combinados a fim de se produzir uma “boa” estimativa de 2? n ˆ 2 x i 1 i X n E X i2 2 2 E X 2 2 n 2 2 n 2 2 X nX i 1 n 2 i 1 E X i2 E X 2 E ˆ E n n i 1 1 n E X i2 E X 2 n i 1 2 n 2 2 n 1 2 estimador tendencioso! n n n 2 2 2 16 Estimação Pontual Seja X uma v.a. normalmente distribuída com a média () e a variância (2) desconhecidas. Retira-se uma amostra de tamanho n com a finalidade de se estimar e 2. • variância populacional 2 De que maneira os valores da amostra podem ser combinados a fim de se produzir uma “boa” estimativa de 2? x X n ˆ 2 i 1 i n n s2 2 xi X n n 1 2 i 1 n 1 E s2 2 estimador não tendencioso variância amostral (ver Estimadores.xls) 17 Estimação Pontual de e 2 Exemplo: uma amostra (n = 12) é retirada de uma população e os seguintes valores são observados: 0, 2, 3, 5, 2, 1, 2, 1, 3, 3, 4, 2. Calcule a média e variância amostrais. distribuição amostral • média amostral X Valor n X X x i i 1 n 0 1 2 3 4 5 (dados brutos) 0 2 3 ... 2 7 12 3 Total Freq. Absoluta 1 2 4 3 1 1 12 Freq. Relativa 1/12 1/6 1/3 1/4 1/12 1/12 1 N X X x FA( X x ) j 1 j j n N x j FR( X x j ) (dados agrupados) j 1 0*1 1* 2 2* 4 3*3 4*1 5*1 7 12 3 X 0* (usando FA) 1 1 1 1 1 1 7 1* 2* 3* 4* 5* 12 6 3 4 12 12 3 (usando FR) 18 Estimação Pontual de e 2 Exemplo: uma amostra (n = 12) é retirada de uma população e os seguintes valores são observados: 0, 2, 3, 5, 2, 1, 2, 1, 3, 3, 4, 2. Calcule a média e variância amostrais. • variância amostral s2 x X n s2 i 1 n 2 i n 1 x i 1 distribuição amostral 7 X 3 2 i 0 1 2 3 4 5 nX 2 (dados brutos) n 1 2 2 2 (0 73 )2 (2 73 )2 ... (2 73 ) 2 (0 2 ... 2 ) 12* 73 2 s 1,88 11 11 2 x N s2 j 1 X FA( X x j ) n 1 Total Freq. Relativa 1/12 1/6 1/3 1/4 1/12 1/12 1 N 2 j Freq. Absoluta 1 2 4 3 1 1 12 Valor x FA( X x ) nX j 1 2 j j n 1 2 (dados agrupados) 2 2 2 (0 73 )2 *1 (1 73 )2 *2 ... (5 73 )2 *1 (0 *1 1 *2 ... 5 *1) 12* 73 2 s 1,88 11 11 2 19 Estimação Pontual de e 2 Observações: • e 2 são parâmetros que representam a população e portanto são valores fixos sendo, em geral, desconhecidos • X e s2 são estatísticas calculadas a partir da amostra e representam • variáveis aleatórias (cada amostra apresenta um valor específico) Não confunda variância amostral (s2) com variância da média amostral (Var(X )) 20