Estatística: Aplicação ao Sensoriamento Remoto ANO 2010 Camilo Daleles Rennó [email protected] http://www.dpi.inpe.br/~camilo/estatistica/ Variável Aleatória qualitativa discreta atributo quantitativa v.a. contínua S Definição: variável aleatória é a função que associa cada elemento de S a um número real. Variável Aleatória Experimento: jogar 2 moedas e observar o resultado (K = cara e C = coroa) X: número de caras em 2 lances de moeda KK KC CK CC S 0 1 X(CC) = 0 X(KC) = X(CK) = 1 X(KK) = 2 2 X(S) (imagem) P(X = 0) = P(CC) P(X = 1) = P(KC CK) P(X = 2) = P(KK) OBS: em P(X = x), a natureza funcional da v.a. foi suprimida. De fato, a expressão mais correta seria P(s S | X(s) = x). por definição, os valores de uma v.a. são sempre mutuamente exclusivos Variável Aleatória Discreta Definição: uma v.a. é discreta quando o conjunto de valores possíveis (imagem) for finito ou infinito numerável. P(X = xi) 0 para todo i P( X x ) 1 i i Função de Probabilidade f ( x ) P( X x ) Função de Distribuição Acumulada F ( x ) P( X x ) f ( x j ) para todo j onde xj < x j Variável Aleatória Discreta Exemplos: a) jogar um dado X: ponto obtido no dado X = {1, 2, 3, 4, 5, 6} X: = 1 se ponto for igual a 6 X: = 0 caso contrário X = {0, 1} b) jogar 5 moedas (ou uma moeda 5 vezes) X: número de caras em 5 lances X = {0, 1, 2, 3, 4, 5} c) jogar uma moeda até tirar uma cara X: número de jogadas até tirar uma cara (incluindo-se a cara) X = {1, 2, 3, ...} X: número de coroas até tirar uma cara X = {0, 1, 2, ...} Variável Aleatória Discreta Exemplos: d) sortear um ponto de uma imagem (8bits) X: valor de nível de cinza X = {0, 1, ..., 255} X: = 1 se valor de nível de cinza for menor que 100 X: = 0 caso contrário X = {0, 1} e) sortear 5 pontos em um mapa pedológico X: número de pontos correspondentes à classe Argissolo X = {0, 1, 2, 3, 4, 5} f) sortear pontos em um mapa de vegetação até que se encontre a classe Cerrado X: número de pontos sorteados (incluindo-se o ponto da classe Cerrado) X = {1, 2, 3, ...} X: número de pontos sorteados (excluindo-se o ponto da classe Cerrado) X = {0, 1, 2, ...} Variável Aleatória Contínua Definição: uma v.a. é contínua quando o conjunto de valores possíveis (imagem) for inumerável. Se o conjunto imagem é inumerável, não há sentido em falar de valores específicos e portanto: P(X = x) = 0 P(ase <X < b) 0 uma pessoa qualquer com Qual a probabilidade de escolher 1,7567234309... metros de altura? Função Densidade de Probabilidade (fdp) f(x) f ( x) 0 b P(a X b) P ( a X b) f ( x )dx f ( x )dx 1 a a Função de Distribuição Acumulada x F ( x) f ( x )dx b x Variável Aleatória Contínua Exemplos: a) X: distância entre dois pontos X = [0,+[ b) X: distância vertical de um ponto, relativa a uma superfície plana pré-definida X = ]-,+[ c) X: reflectância de um objeto X = [0,1] . o balanço (receita – despesa) de uma empresa (em reais) é uma v.a. contínua ou discreta? . temperatura é uma v.a. contínua ou discreta? Variável Aleatória e Probabilidade Problema: Define-se uma variável X como o número de caras em 6 lances de moeda. Qual a probabilidade de se obter mais que 4 caras nesses 6 lances? X = {0, 1, 2, 3, 4, 5, 6} P(X > 4) = P(X = 5) + P(X = 6) P(X = 5) = P(KKKKKC KKKKCK KKKCKK KKCKKK KCKKKK CKKKKK) = 6/64 P(X = 6) = P(KKKKKK) = 1/64 P(X > 4) = 7/64 Caracterização de uma Variável Aleatória Variável Y 0,5 0,5 0,4 0,4 P (Y = y) P (X = x) Variável X 0,3 0,2 0,1 0,3 0,2 0,1 0 0 1 2 3 4 5 6 1 2 3 X X 1 2 3 4 5 6 P(X = x) 0,10 0,15 0,25 0,25 0,15 0,10 4 Y Y 1 2 3 4 5 6 P(Y = y) 0,10 0,45 0,22 0,15 0,06 0,02 5 6 Medidas de Tendência Central X 1 2 3 4 5 6 0,5 P (X = x) 0,4 0,3 0,2 0,1 0 1 2 3 4 5 P(X = x) 0,10 0,15 0,25 0,25 0,15 0,10 6 X • Calcular o valor médio Média N xi P( X xi ) i 1 1*0,10 2*0,15 3*0, 25 4*0, 25 5*0,15 6*0,10 3,5 Medidas de Tendência Central Y 1 2 3 4 5 6 0,5 P (Y = y) 0,4 0,3 0,2 0,1 0 1 2 3 4 5 P(Y = y) 0,10 0,45 0,22 0,15 0,06 0,02 6 Y • Calcular o valor médio Média N yi P(Y yi ) i 1 1*0,10 2*0, 45 3*0, 22 4*0,15 5*0,06 6*0,02 2,68 Medidas de Tendência Central Média N xi P( X xi ) v.a. discretas i 1 xf ( x )dx v.a. contínuas OBS: média = 1o momento = esperança matemática = esperança = valor esperado Medidas de Tendência Central Y 1 2 3 4 5 6 0,51 0,4 P y) (Y = y) P (Y 0,75 0,3 0,5 0,2 0,25 0,1 00 1 21 2 33 4 5 46 5 y) P(Y = 0,10 0,45 0,55 0,22 0,77 0,15 0,92 0,06 0,98 0,02 1,00 6 Y • Identificar o ponto que divide a distribuição em duas partes iguais (equiprováveis) Mediana mediana = 2 Medidas de Tendência Central X 1 2 3 4 5 6 0.51 0.4 P x) (X = x) P (X 0,75 0.3 0,5 0.2 0,25 0.1 00 1 21 2 33 4 5 46 5 x) P(X = 0,10 0,15 0,25 0,25 0,50 0,25 0,75 0,15 0,90 0,10 1,00 6 X • Identificar o ponto que divide a distribuição em duas partes iguais (equiprováveis) Mediana mediana = 3,5 Medidas de Tendência Central Mediana P( X mediana) 0,5 e P( X mediana) 0,5 v.a. discretas mediana f ( x)dx 0,5 v.a. contínuas OBS: mediana: divide em 2 partes quartis: divide em 4 partes (mediana = 2o quartil) decis: divide em 10 partes (mediana = 5o decil) percentis: divide em 100 partes (mediana = 50o percentil) Medidas de Tendência Central Y 1 2 3 4 5 6 0.5 P (Y = y) 0.4 0.3 0.2 0.1 0 1 2 3 4 5 6 Y • Identificar o valor mais freqüente Moda moda = 2 P(Y = y) 0,10 0,45 0,22 0,15 0,06 0,02 Medidas de Tendência Central X 1 2 3 4 5 6 0.5 P (X = x) 0.4 0.3 0.2 0.1 0 1 2 3 4 5 P(X = x) 0,10 0,15 0,25 0,25 0,15 0,10 6 X • Identificar o valor mais freqüente Moda moda = {3, 4} OBS: 2 modas (bimodal) 3 modas (trimodal) muitas modas (multimodal) modas locais não definida 0,25 0,15 0,2 0,2 0,15 0,1 0,15 0,1 0,1 0,05 0,05 0,05 0 1 2 3 4 5 6 7 8 9 10 Medidas de Tendência Central Moda moda {x | k : P( X k ) P( X x)} v.a. discretas moda arg max f ( x): x | k : f (k ) f ( x) x v.a. contínuas 0.5 0.5 0.4 0.4 P (Y = y) P (X = x) Medidas de Dispersão 0.3 0.2 0.1 0.3 0.2 0.1 0 0 1 2 3 4 5 6 1 2 X 3 4 Y • Analisar a variação total da v.a. Xmáx - Xmín = 5 Ymáx - Ymín = 5 Amplitude Total 5 6 Medidas de Dispersão X- -2,5 -1,5 -0,5 0,5 1,5 2,5 0.5 3,5 P (X = x) 0.4 0.3 0.2 0.1 0 1 2 3 4 5 X 1 2 3 4 5 6 P(X = x) 0,10 0,15 0,25 0,25 0,15 0,10 6 X • Analisar os desvios da v.a. em relação à média N x P( X x ) 2,5*0,10 1,5*0,15 0,5*0, 25 i 1 i i N 0,5*0, 25 1,5*0,15 2,5*0,10 0 N N N N x P( X x ) x P( X x ) P( X x ) x P( X x ) P( X x ) i 1 i i i 1 i i 0 c.q.d. i 1 i i 1 i i = i i 1 =1 Medidas de Dispersão |X - | 2,5 1,5 0,5 0,5 1,5 2,5 0.5 3,5 P (X = x) 0.4 0.3 0.2 0.1 0 1 2 3 4 5 X 1 2 3 4 5 6 6 X • Analisar os desvios absolutos da v.a. em relação à média N x P( X x ) 2,5*0,10 1,5*0,15 0,5*0, 25 i 1 i i 0,5*0, 25 1,5*0,15 2,5*0,10 1,2 Desvio Absoluto Médio P(X = x) 0,10 0,15 0,25 0,25 0,15 0,10 Medidas de Dispersão 0.4 P (Y = y) |Y - | 1,68 0,68 0,32 1,32 2,32 3,32 2, 68 0.5 0.3 0.2 0.1 0 1 2 3 4 5 Y 1 2 3 4 5 6 6 Y • Analisar os desvios absolutos da v.a. em relação à média N y P(Y y ) i 1 i i 0,948 Desvio Absoluto Médio P(Y = y) 0,10 0,45 0,22 0,15 0,06 0,02 Medidas de Dispersão Desvio Absoluto Médio N DAM xi P( X xi ) v.a. discretas i 1 DAM x f ( x)dx v.a. contínuas Medidas de Dispersão (X - )2 6,25 2,25 0,25 0,25 2,25 6,25 0.5 3,5 P (X = x) 0.4 0.3 0.2 0.1 0 1 2 3 4 5 X 1 2 3 4 5 6 6 X • Analisar os desvios quadráticos da v.a. em relação à média N x P( X x ) 6, 25*0,10 2, 25*0,15 0, 25*0, 25 i 1 2 i i 0, 25*0, 25 2, 25*0,15 6, 25*0,10 2,05 Variância (2) P(X = x) 0,10 0,15 0,25 0,25 0,15 0,10 Medidas de Dispersão 0.4 P (Y = y) (Y - )2 2,822 0,462 0,102 1,742 5,382 11,022 2, 68 0.5 0.3 0.2 0.1 0 1 2 3 4 5 Y 1 2 3 4 5 6 P(Y = y) 0,10 0,45 0,22 0,15 0,06 0,02 6 Y • Analisar os desvios quadráticos da v.a. em relação à média N y P(Y y ) 1,318 i 1 2 i i Variância (2) OBS: Desvio Padrão () é a raiz quadrada da Variância (possui a mesma unidade de ) Medidas de Dispersão Variância N xi P( X xi ) 2 2 v.a. discretas i 1 2 x 2 f ( x)dx v.a. contínuas Medidas de Dispersão Qual v.a. tem maior variação, o tamanho de um determinado tipo de parafuso ou a produtividade agrícola de uma determinada cultura? Coeficiente de Variação CV . mede a variação relativa a média . adimensional . pode ser expresso em porcentagem Momentos Momento (ordinário) de ordem k: v.a. discreta v.a. contínua N E ( X ) x P X xi k i 1 x E( X ) k i k k f ( x)dx Momento centrado (na média) de ordem k v.a. discreta E ( X ) v.a. contínua (x ) P X x N k k i 1 OBS: E ( X ) i i E ( X ) k (x ) 1o momento 2 E ( X ) 2 2o momento centrado E ( X 2 ) E ( X ) 2 k f ( x)dx Propriedades da Esperança e Variância X 1 2 3 4 5 6 0.5 P (X = x) 0.4 0.3 0.2 0.1 0 1 2 3 4 5 P(X = x) 0,10 0,15 0,25 0,25 0,15 0,10 6 X N E ( X ) ? xi P( X xi ) 1*0,10 2*0,15 6*0,10 3,5 i 1 Var( X ) E( X 2 ) [ E( X )]2 E( X 2 ) 12 *0,10 22 *0,15 Var ( X ) 14,3 3,52 2,05 62 *0,10 14,3 Propriedades da Esperança e Variância X P(X = x) 1 0,10 2 0,15 3 0,25 4 0,25 5 0,15 6 0,10 Var ( X ) 2,05 E ( X ) 3,5 Y X o Ex: Y X 3 Y X P(X = x) 4 1 0,10 = +3 5 2 0,15 6 3 0,25 7 4 0,25 E (Y ) 4*0,10 5*0,15 8 5 0,15 9 6 0,10 9*0,10 6,5 Var (Y ) E(Y 2 ) [ E(Y )]2 44,3 42, 25 2,05 Propriedades da Esperança e Variância 0,25 0,2 0,15 0,1 40 30 20 0 10 E (Y ) E ( X o) E ( X ) o 0,05 0 Y X o X Var(Y ) Var( X o) Var( X ) 0,25 0,2 0,15 0,1 0,05 40 30 20 10 0 0 Y X 15 Propriedades da Esperança e Variância X P(X = x) 1 0,10 2 0,15 3 0,25 4 0,25 5 0,15 6 0,10 Var ( X ) 2,05 E ( X ) 3,5 Y gX Ex: Y 3 X Y X P(X = x) * 9 = 32 *3 3 1 0,10 6 2 0,15 9 3 0,25 12 4 0,25 E (Y ) 3*0,10 6*0,15 15 5 0,15 18 6 0,10 18*0,10 10,5 Var (Y ) E(Y 2 ) [ E(Y )]2 128,7 110, 25 18, 45 Propriedades da Esperança e Variância 0,25 0,2 0,15 0,1 40 30 20 0 10 E (Y ) E ( gX ) gE ( X ) 0,05 0 Y gX X Var(Y ) Var( gX ) g 2Var( X ) 0,25 0,2 0,15 0,1 0,05 40 30 20 10 0 0 Y 3X Propriedades da Esperança e Variância X P(X = x) 1 0,10 2 0,15 3 0,25 4 0,25 5 0,15 6 0,10 W P(W= w) Var ( X ) 2,05 E ( X ) 3,5 1 0,10 2 0,45 3 0,22 4 0,15 5 0,06 6 0,02 Var (W ) 1,318 E (W ) 2,68 Y X W Distribuição Conjunta de X e W Y = {2, {?, ..., ?} 12} X W 1 2 3 4 5 6 1 2 3 4 5 6 7 2 3 4 5 6 7 8 3 4 5 6 7 8 9 4 5 6 7 8 9 10 5 6 7 8 9 10 11 6 7 8 9 10 11 12 P(Y 3) P ? ( X 1;W 2) P( X 2;W 1) P( X 1;W 2) ? X P(W = wi) 1 0,10 2 0,45 3 0,22 4 0,15 5 0,06 6 0,02 P(X = xi) 0,10 0,15 0,25 0,25 0,15 0,10 1 W 1 2 3 4 5 6 Propriedades da Esperança e Variância X P(X = x) 1 0,10 2 0,15 3 0,25 4 0,25 5 0,15 6 0,10 W P(W= w) Var ( X ) 2,05 E ( X ) 3,5 1 0,10 2 0,45 3 0,22 4 0,15 5 0,06 6 0,02 Var (W ) 1,318 E (W ) 2,68 Y X W Distribuição Conjunta de X e W Y = {2, {?, ..., ?} 12} X W 1 2 3 4 5 6 1 2 3 4 5 6 7 2 3 4 5 6 7 8 3 4 5 6 7 8 9 4 5 6 7 8 9 10 5 6 7 8 9 10 11 6 7 8 9 10 11 12 X P(W = wi) 1 0,10 0,010 0,015 0,025 0,025 0,015 0,010 2 0,45 0,045 0,0675 0,1125 0,1125 0,0675 0,045 3 0,22 0,022 0,033 0,055 0,055 0,033 0,022 4 0,15 0,015 0,0225 0,0375 0,0375 0,0225 0,015 5 0,06 0,006 0,009 0,015 0,015 0,009 0,006 6 0,02 0,002 0,003 0,005 0,005 0,003 0,002 P(X = xi) 0,10 0,15 0,25 0,25 0,15 0,10 1 W 1 2 3 4 5 6 P(Y 3) P ? ( X 1;W 2) P( X 2;W 1) P( X 1;W 2) ?P( X 1) P(W 2) considerando que X e W sejam independentes Propriedades da Esperança e Variância X P(X = x) 1 0,10 2 0,15 3 0,25 4 0,25 5 0,15 6 0,10 W P(W= w) Var ( X ) 2,05 E ( X ) 3,5 1 0,10 3 0,22 E (W ) 2,68 Y X -W 4 0,15 5 0,06 E (Y ) yi P(Y yi ) i ( xi - w j ) P( X xi ;W w j ) E ( X - W ) ? Var (W ) 1,318 X j xi P( X xi ;W w j ) - w j P( X xi ;W w j ) i j i j xi P( X xi ;W w j ) - w j P( X xi ;W w j ) i j j i xi P( X xi ) - w j P(W w j ) i j E ( X ) - E (W ) 3,5 2,68 6,18 0,82 6 0,02 1 2 3 4 5 6 P(W = wi) 1 0,10 0,010 0,015 0,025 0,025 0,015 0,010 2 0,45 0,045 0,0675 0,1125 0,1125 0,0675 0,045 3 0,22 0,022 0,033 0,055 0,055 0,033 0,022 4 0,15 0,015 0,0225 0,0375 0,0375 0,0225 0,015 5 0,06 0,006 0,009 0,015 0,015 0,009 0,006 6 0,02 0,002 0,003 0,005 0,005 0,003 0,002 P(X = xi) 0,10 0,15 0,25 0,25 0,15 0,10 1 W i 2 0,45 E ( X W ) E ( X ) E (W ) Propriedades da Esperança e Variância X P(X = x) 1 0,10 2 0,15 3 0,25 4 0,25 5 0,15 6 0,10 W P(W= w) Var ( X ) 2,05 E ( X ) 3,5 1 0,10 2 0,45 E (W ) 2,68 3 0,22 4 0,15 2 Var ( X W ) ?E ( X W )2 E ( X W ) 2 E X 2 2 XW W 2 E ( X ) E (W ) 2 E( X 2 ) 2E( XW ) E(W 2 ) E( X )2 2E( X )E(W ) E(W )2 E( X 2 ) E( X )2 E(W 2 ) E(W )2 2 E( XW ) E( X )E(W ) Var ( X ) Var (W ) 6 0,02 Var (W ) 1,318 Y X W Var (Y ) E Y 2 E Y 5 0,06 COV ( X ,W ) covariância entre X e W Propriedades da Esperança e Variância X P(X = x) 1 0,10 2 0,15 3 0,25 4 0,25 5 0,15 6 0,10 W P(W= w) Var ( X ) 2,05 E ( X ) 3,5 1 0,10 2 0,45 E (W ) 2,68 3 0,22 4 0,15 5 0,06 6 0,02 Var (W ) 1,318 Y X W Var (Y ) E Y 2 E Y 2 Var ( X W ) ?E ( X W )2 E ( X W ) 2 E X 2 2 XW W 2 E ( X ) E (W ) 2 E( X 2 ) 2E( XW ) E(W 2 ) E( X )2 2E( X )E(W ) E(W )2 E( X 2 ) E( X )2 E(W 2 ) E(W )2 2 E( XW ) E( X )E(W ) Var ( X W ) Var ( X ) Var (W ) 2COV ( X ,W ) Propriedades da Esperança e Variância X P(X = x) 1 0,10 2 0,15 3 0,25 4 0,25 5 0,15 6 0,10 W P(W= w) Var ( X ) 2,05 E ( X ) 3,5 1 0,10 2 0,45 E (W ) 2,68 3 0,22 4 0,15 5 0,06 6 0,02 Var (W ) 1,318 Y X -W Var (Y ) E Y 2 E Y 2 Var ( X - W ) ?E ( X - W )2 E ( X - W ) 2 - 2 XW W 2 E ( X ) - E (W ) EX2 2 - 2E( XW ) E(W 2 ) E( X )2 + 2E( X ) E(W ) E(W )2 E( X 2 ) E( X 2 ) E( X )2 E(W 2 ) E(W )2 - 2 E( XW ) E( X )E(W ) Var ( X W ) Var ( X ) Var (W ) 2COV ( X ,W ) se X e W são independentes: E( XW ) E( X ) E(W ) Var ( X W ) 2,05 1,318 3,368 Var ( X W ) Var ( X ) Var (W ) Propriedades da Esperança e Variância Resumo: Y X o E (Y ) E ( X o) E ( X ) o Var(Y ) Var( X o) Var( X ) Y gX E (Y ) E ( gX ) gE ( X ) Var(Y ) Var( gX ) g 2Var( X ) Y X W E (Y ) E ( X W ) E ( X ) E (W ) Var (Y ) Var ( X W ) Var ( X ) Var (W ) 2COV ( X ,W ) Var (Y ) Var ( X W ) Var ( X ) Var (W ) (independentes) Propriedades da Esperança e Variância Imagem original (I) Inova = I + 50 Banda TM3/Landsat Inova = I + 100 Média: 29,07 Variância: 62,14 0 50 100 Média: 129,07 Variância: 62,14 Média: 79,07 Variância: 62,14 150 200 250 0 50 100 150 200 250 0 50 100 150 200 250 Propriedades da Esperança e Variância Imagem original (I) Inova = 2*I Banda TM3/Landsat Inova = 4*I Média: 29,07 Variância: 62,14 0 50 100 Média: 116,29 Variância: 994,21 Média: 58,14 Variância: 248,55 150 200 250 0 50 100 150 200 250 0 50 100 150 200 250 Propriedades da Esperança e Variância Imagem original (I) Inova = 5*I - 110 Banda TM3/Landsat Inova = -5*I + 370 Média: 35,36 Variância: 1553,45 Média: 29,07 Variância: 62,14 0 50 100 150 200 250 0 50 100 150 Média: 224,64 Variância: 1553,45 200 250 0 50 100 150 200 250 Propriedades da Esperança e Variância Aplicação em imagens: •alterar brilho (média) •alterar contraste (variância) Inova = gI + o Exemplo 1: Tem-se uma imagem qualquer com média 100 e variância 150. Desejase aumentar o contraste dessa imagem, aumentando-se sua variância para 300. Qual deve ser o ganho aplicado nessa imagem? Qual será a média da imagem após a aplicação desse ganho? Var(Inova ) g 2Var(I ) 300 g 2 150 300 g2 150 g 2 1, 4142 E ( I nova ) gE ( I ) 2100 141, 42 Propriedades da Esperança e Variância Aplicação em imagens: •alterar brilho (média) •alterar contraste (variância) Inova = gI + o Exemplo 2: Tem-se uma imagem qualquer com média 100 e variância 150. Desejase aumentar o contraste dessa imagem, aumentando-se sua variância para 600, sem alterar seu brilho (ou seja, mantendo a média em 100). Qual deve ser o ganho e o offset aplicados nessa imagem? Var(Inova ) g 2Var(I ) 600 g 2 150 600 g2 150 g 4 2 E(I nova ) gE(I ) o 100 2*100 o o 100 200 100 I nova 2I 100