Estatística: Aplicação ao Sensoriamento Remoto ANO 2010 Camilo Daleles Rennó [email protected] http://www.dpi.inpe.br/~camilo/estatistica/ Funções de Distribuição (Discreta) - Uniforme Discreta - Binomial - Bernoulli - Geométrica - Binomial Negativa (Pascal) - Hipergeométrica - Poisson Distribuição Uniforme Discreta Considere uma v.a. X cujos valores são inteiros de 1 a N, equiprováveis, ou seja, todos os valores têm igual probabilidade de ocorrência. Exemplo: Lança-se um dado e define-se uma v.a. X como o valor obtido neste dado. N X: {1, 2, 3, 4, 5, 6} E ( X ) xP( X x ) x 1 P(X = 1) = 1/6 P(X = 2) = 1/6 P(X = 3) = 1/6 P(X = 4) = 1/6 P(X = 5) = 1/6 P(X = 6) = 1/6 1 N 6 f(x) = ? E( X ) ? Var ( X ) ? 1 E( X ) N N x 1 N N ( N 1) 1 N ( N 1) 2 E( X ) N 2 E( X ) x 1 N 1 2 Distribuição Uniforme Discreta Considere uma v.a. X cujos valores são inteiros de 1 a N, equiprováveis, ou seja, todos os valores têm igual probabilidade de ocorrência. Exemplo: Lança-se um dado e define-se uma v.a. X como o valor obtido neste dado. X: {1, 2, 3, 4, 5, 6} Var( X ) E( X 2 ) [ E( X )]2 P(X = 1) = 1/6 P(X = 2) = 1/6 P(X = 3) = 1/6 P(X = 4) = 1/6 P(X = 5) = 1/6 P(X = 6) = 1/6 E ( X ) x 2 P( X x ) f(x) = 1 N E( X ) N 1 2 N 2 x 1 1 E( X ) N 2 N x 2 1 N N ( N 1)(2 N 1) 6 1 N ( N 1)(2 N 1) E( X 2 ) N 6 E( X 2 ) x 1 ( N 1)(2 N 1) 6 Distribuição Uniforme Discreta Considere uma v.a. X cujos valores são inteiros de 1 a N, equiprováveis, ou seja, todos os valores têm igual probabilidade de ocorrência. Exemplo: Lança-se um dado e define-se uma v.a. X como o valor obtido neste dado. X: {1, 2, 3, 4, 5, 6} P(X = 1) = 1/6 P(X = 2) = 1/6 P(X = 3) = 1/6 P(X = 4) = 1/6 P(X = 5) = 1/6 P(X = 6) = 1/6 f(x) = 1 N E( X ) N 1 2 Var( X ) E( X 2 ) [ E( X )]2 ( N 1)(2 N 1) ( N 1) 2 Var ( X ) 6 4 (2 N 1) ( N 1) Var ( X ) ( N 1) 6 4 4 N 2 3N 3 Var ( X ) ( N 1) 12 ( N 1) Var ( X ) ( N 1) 12 N 2 1 Var ( X ) 12 Distribuição Uniforme Discreta Considere uma v.a. X cujos valores são inteiros de 1 a N, equiprováveis, ou seja, todos os valores têm igual probabilidade de ocorrência. Exemplo: Lança-se um dado e define-se uma v.a. X como o valor obtido neste dado. f ( x) E( X ) 1 1 N 6 X: {1, 2, ..., N} 6} N 1 6 1 3,5 2 2 N 2 1 36 1 2,92 Var ( X ) 12 12 Distribuição Binomial Considere o experimento: retiram-se 3 bolas da urna (com reposição). Define-se uma v.a. X cujos valores representam o número total de bolas vermelhas dentre as 3 escolhidas. X: {0, 1, 2, 3} O experimento envolve 3 eventos independentes. Para cada evento: P(vermelha) = 5/7 = p (probabilidade de sucesso) P(azul) = 2/7 = q (probabilidade de fracasso, q = 1 - p) Distribuição Binomial Considere o experimento: retiram-se 3 bolas da urna (com reposição). Define-se uma v.a. X cujos valores representam o número total de bolas vermelhas dentre as 3 escolhidas. X: {0, 1, 2, 3} p = 5/7 n = 3 (número de bolas retiradas da urna) q = 2/7 2 2 2 2 3 8 P( X 0) 7 7 7 7 343 5 5 5 5 3 125 P( X 3) 7 7 7 7 343 qqq ppp 2 3! 5 2 2 5 2 60 3 P( X 1) 1!2! 7 7 7 7 7 343 pqq 2 3! 5 5 2 5 2 150 3 P( X 2) 2!1! 7 7 7 7 7 343 ppq n! p x qn x f (x) = ? x !( n x )! n f ( x ) p x qn x x Distribuição Binomial Considere o experimento: retiram-se 3 bolas da urna (com reposição). Define-se uma v.a. X cujos valores representam o número total de bolas vermelhas dentre as 3 escolhidas. X: {0, 1, 2, 3} n f ( x ) p x qn x x E( X ) ? Var ( X ) ? Analisando o caso particular onde n = 1: Bernoulli Distribuição Bernoulli Considere o experimento: retira-se uma bola da urna. Define-se uma v.a. X cujos valores são 1 se a bola escolhida for vermelha (sucesso) e 0 caso contrário (fracasso). X: {0, 1} P(X = 0) = 2/7 = q (probabilidade de fracasso, q = 1 - p) P(X = 1) = 5/7 = p (probabilidade de sucesso) x 1 x 5x 1 x 2 f(x) = ?p q 7 7 E( X ) ? Var ( X ) ? Distribuição Bernoulli Considere o experimento: retira-se uma bola da urna. Define-se uma v.a. X cujos valores são 1 se a bola escolhida for vermelha (sucesso) e 0 caso contrário (fracasso). 1 X: {0, 1} P(X = 0) = 2/7 P(X = 1) = 5/7 x 1 x f(x) = p q E ( X ) xP( X x ) x 0 E ( X ) 0q 1 p E( X ) p Distribuição Bernoulli Considere o experimento: retira-se uma bola da urna. Define-se uma v.a. X cujos valores são 1 se a bola escolhida for vermelha (sucesso) e 0 caso contrário (fracasso). X: {0, 1} Var( X ) E( X 2 ) [ E( X )]2 1 P(X = 0) = 2/7 P(X = 1) = 5/7 x 1 x f(x) = p q E( X ) p E ( X ) x 2 P( X x ) 2 x 0 E( X 2 ) 02 q 12 p E( X 2 ) p Distribuição Bernoulli Considere o experimento: retira-se uma bola da urna. Define-se uma v.a. X cujos valores são 1 se a bola escolhida for vermelha (sucesso) e 0 caso contrário (fracasso). X: {0, 1} P(X = 0) = 2/7 P(X = 1) = 5/7 Var( X ) E( X 2 ) [ E( X )]2 Var( X ) p p2 Var( X ) p(1 p) x 1 x f(x) = p q E( X ) p Var( X ) pq Distribuição Bernoulli Considere o experimento: retira-se uma bola da urna. Define-se uma v.a. X cujos valores são 1 se a bola escolhida for vermelha (sucesso) e 0 caso contrário (fracasso). x 1 x 5 2 f ( x) p x q1 x 7 7 E( X ) p 5 0,714 7 Var( X ) pq 5 2 10 0, 204 7 7 49 X: {0, 1} Distribuição Binomial Considere o experimento: retiram-se 3 bolas da urna (com reposição). Define-se uma v.a. X cujos valores representam o número total de bolas vermelhas dentre as 3 escolhidas. X: {0, 1, 2, 3} n f ( x ) p x qn x x A v.a. Binomial pode ser entendida como uma somatória de n v.a. Bernoulli, já que, para cada evento (tirar uma bola) há uma probabilidade p de sucesso (tirar bola vermelha) e q de fracasso (tirar bola azul). n X Yi onde cada Yi tem distribuição Bernoulli (0 ou 1) i 1 E( X ) ? Var ( X ) ? Y1 = 0 Y2 = 1 Y3 = 1 X=2 Por exemplo: q p p n n n E ( X ) E Yi E (Yi ) p np i 1 i 1 i 1 n n n Var( X ) Var Yi Var (Yi ) pq npq i 1 i 1 i 1 Distribuição Binomial Considere o experimento: retiram-se 3 bolas da urna (com reposição). Define-se uma v.a. X cujos valores representam o número total de bolas vermelhas dentre as 3 escolhidas. p = 5/7 q = 2/7 n=3 x 3 x n x n x 3 5 2 f ( x) p q x x 7 7 5 15 2,143 E ( X ) np 3 7 7 Var( X ) npq 3 5 2 30 0,612 7 7 49 X: {0, 1, ..., n} 2, 3} Distribuição Geométrica Considere o experimento: retiram-se bolas da urna (com reposição), até que se consiga uma bola vermelha. Define-se uma v.a. X cujos valores representam o número total de bolas azuis (fracassos) retiradas da urna até obter uma bola vermelha (sucesso). X: {0, 1, 2, ..., } O experimento envolve de 1 a infinitos eventos independentes. Para cada evento: P(vermelha) = 5/7 = p (probabilidade de sucesso) P(azul) = 2/7 = q (probabilidade de fracasso, q = 1 - p) Distribuição Geométrica Considere o experimento: retiram-se bolas da urna (com reposição), até que se consiga uma bola vermelha. Define-se uma v.a. X cujos valores representam o número total de bolas azuis (fracassos) retiradas da urna até obter uma bola vermelha (sucesso). X: {0, 1, 2, ..., } p = 5/7 q = 2/7 3 P( X 0) 2 2 2 5 2 5 40 P( X 3) 0,017 7 7 7 7 7 7 2401 5 0, 714 7 qqqp p P( X 1) 2 5 10 0, 204 7 7 49 qp 2 2 2 5 2 5 20 P( X 2) 0,058 7 7 7 7 7 343 qqp f (x) = ?pq x Distribuição Geométrica Considere o experimento: retiram-se bolas da urna (com reposição), até que se consiga uma bola vermelha. Define-se uma v.a. X cujos valores representam o número total de bolas azuis (fracassos) retiradas da urna até obter uma bola vermelha (sucesso). X: {0, 1, 2, ..., } E ( X ) xP( X x ) x 0 f ( x) pq x E ( X ) xpq x x 0 E ( X ) pq xq x 1 x 1 E( X ) ? Var ( X ) ? d q dq 1 q 1 2 p 1 E ( X ) pq 2 p E ( X ) pq dq x E ( X ) pq x 1 dq dq x dq d x q E ( X ) pq q dq x 1 1 q E( X ) q p Distribuição Geométrica Considere o experimento: retiram-se bolas da urna (com reposição), até que se consiga uma bola vermelha. Define-se uma v.a. X cujos valores representam o número total de bolas azuis (fracassos) retiradas da urna até obter uma bola vermelha (sucesso). X: {0, 1, 2, ..., } Var( X ) E( X 2 ) [ E( X )]2 E ( X ) x 2 P( X x ) 2 f ( x) pq x x 0 E ( X 2 ) x 2 pq x x 0 q2 q E( X ) p2 2 E( X ) q p Distribuição Geométrica Considere o experimento: retiram-se bolas da urna (com reposição), até que se consiga uma bola vermelha. Define-se uma v.a. X cujos valores representam o número total de bolas azuis (fracassos) retiradas da urna até obter uma bola vermelha (sucesso). X: {0, 1, 2, ..., } f ( x) pq x Var( X ) E( X 2 ) [ E( X )]2 q2 q q2 Var( X ) 2 p2 p Var ( X ) E( X ) q p q p2 Distribuição Geométrica Considere o experimento: retiram-se bolas da urna (com reposição), até que se consiga uma bola vermelha. Define-se uma v.a. X cujos valores representam o número total de bolas azuis (fracassos) retiradas da urna até obter uma bola vermelha (sucesso). p = 5/7 q = 2/7 5 2 f ( x) pq 77 x E( X ) x X: {0, 1, 2, ..., } q 27 2 0, 4 p 75 5 Var ( X ) 2 49 14 q 0,56 p 2 7 25 25 Distribuição Binomial Negativa Considere o experimento: retiram-se bolas da urna (com reposição), até que se consiga 3 bolas vermelhas. Define-se uma v.a. X cujos valores representam o número total de bolas azuis (fracassos) retiradas da urna até obter as 3 bolas vermelhas (sucessos). X: {0, 1, 2, ..., } O experimento envolve de 3 a infinitos eventos independentes. Para cada evento: P(vermelha) = 5/7 = p (probabilidade de sucesso) P(azul) = 2/7 = q (probabilidade de fracasso, q = 1 - p) Distribuição Binomial Negativa Considere o experimento: retiram-se bolas da urna (com reposição), até que se consiga 3 bolas vermelhas. Define-se uma v.a. X cujos valores representam o número total de bolas azuis (fracassos) retiradas da urna até obter as 3 bolas vermelhas (sucessos). X: {0, 1, 2, ..., } p = 5/7 q = 2/7 r=3 x r 1 r x f (x) = ? pq x 3 5 5 5 5 P( X 0) 0,364 7 7 7 7 ppp 3 3! 2 5 5 5 2 5 3 0,312 P( X 1) 1!2! 7 7 7 7 77 qppp 2 3 4! 2 2 5 5 5 2 5 6 0,178 P( X 2) 2!2! 7 7 7 7 7 7 7 qqppp Distribuição Binomial Negativa Considere o experimento: retiram-se bolas da urna (com reposição), até que se consiga 3 bolas vermelhas. Define-se uma v.a. X cujos valores representam o número total de bolas azuis (fracassos) retiradas da urna até obter as 3 bolas vermelhas (sucessos). X: {0, 1, 2, ..., } A v.a. Binomial Negativa pode ser entendida como uma somatória de r v.a. Geométrica. r x r 1 r x f ( x) pq x E( X ) ? Var ( X ) ? X Yi onde cada Yi tem distribuição Geométrica i 1 Y1 = 2 Y2 = 4 Y3 = 3 Por exemplo: q q p q q q q p q q q p X = 9 r q rq r r E ( X ) E Yi E (Yi ) p i 1 p i 1 i 1 r q r r rq Var( X ) Var Yi Var (Yi ) 2 2 p i 1 p i 1 i 1 Distribuição Binomial Negativa Considere o experimento: retiram-se bolas da urna (com reposição), até que se consiga 3 bolas vermelhas. Define-se uma v.a. X cujos valores representam o número total de bolas azuis (fracassos) retiradas da urna até obter as 3 bolas vermelhas (sucessos). p = 5/7 q = 2/7 r=3 x r 1 r x x 2 5 3 2 x f ( x) p q x x 7 7 E( X ) rq 27 6 3 1, 2 p 75 5 Var ( X ) 2 49 42 rq 3 1,68 7 25 25 p2 X: {0, 1, 2, ..., } Distribuição Hipergeométrica Considere o experimento: retiram-se 3 bolas da urna (sem reposição). Define-se uma v.a. X cujos valores representam o número total de bolas vermelhas dentre as 3 escolhidas. número de número bolas retiradas total número de bolas da de urna bolas na urna vermelhas na urna X: {1, 2, 3} P( X 0) n=3 M=7 210 0 765 aaa 2 1 3! 5 2 1 3 P( X 1) 42 7 1!2! 7 6 5 vaa P( X 2) 8 4 3! 5 4 2 3 42 7 2!1! 7 6 5 vva K=5 P( X 3) 5 4 3 12 2 7 6 5 42 7 vvv K! ( M K )! n! ( K x)! [( M K ) (n x)]! f (x) = ? M! x !(n x)! ( M n)! K M K x n x f ( x) M n Distribuição Hipergeométrica Considere o experimento: retiram-se 3 bolas da urna (sem reposição). Define-se uma v.a. X cujos valores representam o número total de bolas vermelhas dentre as 3 escolhidas. E( X ) n X: {1, 2, 3} K M Var ( X ) n K M K x n x f ( x) M n E( X ) ? Var ( X ) ? K M K M n M M M 1 OBS: se M for muito grande: K p (probabilidade de sucesso) M M K q (probabilidade de fracasso) M M n 1 E ( X ) np Var( X ) npq M 1 Hipergeométrica Binomial Distribuição Hipergeométrica Considere o experimento: retiram-se 3 bolas da urna (sem reposição). Define-se uma v.a. X cujos valores representam o número total de bolas vermelhas dentre as 3 escolhidas. M=7 K=5 n=3 K M K x n x f ( x) M n E( X ) n 5 2 x3 x 7 3 {?, 2, ...,3}?}n M K ),..., min(n, K )} X :{max(0, X: {1, K 5 3 2,143 M 7 Var ( X ) n K M K M n 5 2 4 120 3 0, 408 M M M 1 7 7 6 294 Distribuição de Poisson Suponha que uma central telefônica recebeu 270 chamadas num período de 3 horas, ou seja, 1,5 chamadas por minuto. Deseja-se calcular a probabilidade de que nos próximos 3 minutos sejam recebidas 0, 1, 2, etc chamadas. Considere que a qualquer instante, uma chamada é tão provável de ocorrer como em qualquer outro instante e assim, a probabilidade permanece constante. Pode-se considerar cada intervalo como uma Bernoulli, sendo sucesso receber 0 1 2 3 min uma chamada e fracasso não receber nenhuma chamada. Sendo assim, quanto vale p = P(sucesso)? E ( X ) 4, 5 (X é o número de chamadas recebidas em 3 minutos) como n = 9, então np = 4,5 portanto p = 0,5 9 9 x 9 x 9 f ( x ) 0,5 0,5 0,5 x x Problema: não considera a possibilidade de 2 ou mais chamadas dentro do mesmo intervalo! Distribuição de Poisson Suponha que uma central telefônica recebeu 270 chamadas num período de 3 horas, ou seja, 1,5 chamadas por minuto. Deseja-se calcular a probabilidade de que nos próximos 3 minutos sejam recebidas 0, 1, 2, etc chamadas. Considere que a qualquer instante, uma chamada é tão provável de ocorrer como em qualquer outro instante e assim, a probabilidade permanece constante. 0 1 2 3 min E ( X ) 4,5 como n = 18, então p = 0,25 18 x 18 x f ( x ) 0,25 0,75 x Problema: não considera a possibilidade de 2 ou mais chamadas dentro do mesmo intervalo! Distribuição de Poisson Suponha que uma central telefônica recebeu 270 chamadas num período de 3 horas, ou seja, 1,5 chamadas por minuto. Deseja-se calcular a probabilidade de que nos próximos 3 minutos sejam recebidas 0, 1, 2, etc chamadas. Considere que a qualquer instante, uma chamada é tão provável de ocorrer como em qualquer outro instante e assim, a probabilidade permanece constante. 0 1 2 3 min n intervalos Se n , então p 0 e f(x) tende para: E ( X ) 4,5 np então e x f ( x) x! p n n f ( x) x n x 1 n (distribuição de Poisson) n x E ( x) Var( x) Distribuição de Poisson Suponha que uma central telefônica recebeu 270 chamadas num período de 3 horas, ou seja, 1,5 chamadas por minuto. Deseja-se calcular a probabilidade de que nos próximos 3 minutos sejam recebidas 0, 1, 2, etc chamadas. Considere que a qualquer instante, uma chamada é tão provável de ocorrer como em qualquer outro instante e assim, a probabilidade permanece constante. 0,25 Binomial n = 10, p = 0,45 Binomial Binomial 20, pp==0,225 nn == 160, 0,028 0,2 0,15 0,1 0,05 Poisson 0 0 5 10 15 20 Dica para identificação: eventos em que somente é possível contar os sucessos mas não os fracassos Resumo Distribuições Discretas n=1 r=1