Variáveis Aleatórias • Uma variável aleatória associa um número real a cada resultado de um experimento aleatório. • Mais precisamente… Variáveis Aleatórias • Uma variável aleatória é uma função (mensurável) X: W R que associa um número real a cada resultado de um experimento aleatório. Exemplos de variáveis aleatórias • Moeda honesta lançada 3 vezes W = {ccc, cck, ckc, …} X = número de caras Y = número de transições Quando se observa cck: X=2 Y=1 Exemplos de variáveis aleatórias • Moeda honesta lançada 3 vezes W = {ccc, cck, ckc, …} X = número de caras Y = número de transições x P(X=x) 0 1 2 3 Exemplos de variáveis aleatórias • Moeda honesta lançada 3 vezes W = {ccc, cck, ckc, …} X = número de caras Y = número de transições x P(X=x) 0 1/8 1 3/8 2 3/8 3 1/8 função de massa de probabilidade (fmp) de X Exemplos de variáveis aleatórias • Moeda honesta lançada 3 vezes W = {ccc, cck, ckc, …} X = número de caras Y = número de transições y P(Y=y) 0 1 2 Exemplos de variáveis aleatórias • Moeda honesta lançada 3 vezes W = {ccc, cck, ckc, …} X = número de caras Y = número de transições y P(Y=y) 0 1/4 1 2/4 2 1/4 Função de Distribuição Acumulada • A função de distribuição acumulada de uma variável aleatória X é a função FX: RR definida por FX(x) = P(X ≤ x) Função de Distribuição Acumulada • Exemplo: x 0 1 2 3 P(X=x) 1/8 3/8 3/8 1/8 1 7/8 1/2 1/8 1 2 3 Se x < 0: P(X≤x) = 0 Se 0 ≤ x <1: P(X≤x) = P(X=0) = 1/8 Se 1 ≤ x <2: P(X≤x) = P(X=0 ou X=1) = 1/8 + 3/8 = 1/2 Função de Distribuição Acumulada • Roleta numerada continuamente de 0 a 10 X = prêmio ganho 0, se x < 0 x/10, se 0 ≤ x ≤ 10 1, se x > 10 P(X ≤ x) = 1 10 Função de Distribuição Acumulada • Lança moeda honesta; se tirar cara, gira roleta numerada continuamente de 0 a 10 X = prêmio ganho Função de Distribuição Acumulada • Lança moeda honesta; se tirar cara, gira roleta numerada continuamente de 0 a 10 X = prêmio ganho 0, se x < 0 ½ + ½ x/10, se 0 ≤ x ≤ 10 1, se x > 10 P(X ≤ x) = 1 10 Tipos de Variáveis Aleatórias • Discretas FX(x) = xi x P(X = xi) • (Absolutamente) Contínuas FX(x) = xi x fX(x) dx (onde fX(x) é a densidade de probabilidade de X) • Mistas FX(x) = xi x P(X = xi) + xi x fX(x) dx (Há outras, mais patológicas …) Exemplo 1 10 P(X = 0) = ½ fX(x) = 0, se x < 0 1/20, se 0 x 10 0, se x > 10 Propriedades da F.D.A. • FX é não-decrescente • lim x– FX(x) = 0, lim x+ FX(x) = 1 • lim xa+ FX(x) = F(a) (continuidade à direita) Função de Distribuição Acumulada • A f.d.a. caracteriza completamente a distribuição de qualquer v.a. (ou seja, conhecendo a f.d.a. podemos obter a probabilidade de qualquer evento envolvendo a v.a.) P(X = 2) = F X (x ) P(X = 3) = 1 0 ,6 5 P(X < 3) = 0 ,4 1 3 x P(1 X 3) = Principais Distribuições Discretas • • • • • Bernoulli Binomial Geométrica Hipergeométrica Poisson Principais Distribuições Contínuas • Uniforme • Exponencial • Normal (e associadas: c2, t, F) Bernoulli • Espaço amostral binário (sucessofracasso, sim-não, 1-0) 1, com probabilidade p • X= 0, com probabilidade 1–p Notação: X be(p) Binomial • Sequência de n experimentos de Bernoulli, independentes e com mesma probabilidade p de sucesso • X = número de sucessos Binomial • Sequência de n experimentos de Bernoulli, independentes e com mesma probabilidade p de sucesso • X = número de sucessos Cada uma das n seqüências com k sucessos e n–k k fracassos tem probabilidade pk (1–p)n-k . Logo: n k nk P( X k ) p (1 p) , k 0,1,..., n k Notação: X B(n, p) Geométrica • Sequência de experimentos de Bernoulli, independentes e com mesma probabilidade p de sucesso • X = lançamento em que ocorre o primeiro sucesso. Geométrica • Sequência de experimentos de Bernoulli, independentes e com mesma probabilidade p de sucesso • X = lançamento em que ocorre o primeiro sucesso. X = k k–1 fracassos seguido de um sucesso P( X k ) (1 p) k 1 Notação: X G(p) p, k 1,2,3,... Hipergeométrica • Urna com N bolas, sendo B brancas, de onde são extraídas n bolas, sem reposição. • X = número de bolas brancas extraídas B N B b n b P ( X b) N n Notação: X HG(N, B, n) Exemplo • Amostra de tamanho n extraída de uma população com N indivíduos, dos quais b são favoráveis a um candidato. • Qual é a distribuição do número de pessoas favoráveis ao candidato na amostra? Exemplo • Amostra de tamanho n extraída de uma população com N indivíduos, dos quais B são favoráveis a um candidato. • Qual é a distribuição do número de pessoas favoráveis ao candidato na amostra? • Resposta: HG(N, B, n) Exemplo • Amostra de tamanho n extraída de uma população com N indivíduos, dos quais b são favoráveis a um candidato. • Qual é a distribuição do número de pessoas favoráveis ao candidato na amostra? • Resposta: HG(N, B, n) Mas, se n << N, aproximadamente B(n, B/N) Distribuição de Poisson • Em média, um site de internet tem l = 0,5 acessos por segundo. Qual é o modelo apropriado para a distribuição do número de acessos efetuados em um segundo? Distribuição de Poisson • Discretizar 1 segundo em n intervalos de duração 1/n • Como o número de usuários é grande, é razoável considerar a existência de acessos neste intervalos como eventos independentes, cada um com probabilidade p. • Para que o número médio de acessos por minuto seja igual a l, deve-se ter np = l. Distribuição de Poisson P ( X k ) lim P (Y k ), onde Y ~ B ( n, p n l n k l l P ( X k ) lim 1 n n k!( n k )! n n! n k l nk n( n 1)...( n k 1) l l lim 1 1 k k ! n n n n k l k! e l ) , k 0,1,2,... k Distribuição de Poisson • Caso limite da distribuição binomial, quando n e np se mantém constante – Acessos a sites – Chegadas de consumidores a um banco – Número de erros tipográficos em um texto – Número de partículas radioativas emitidas Exemplo • No caso da página de internet, qual é a probabilidade de que haja pelo menos um acesso em um dado segundo? Exemplo • No caso da página de internet, qual é a probabilidade de que haja pelo menos um acesso em um dado segundo? P(X>0) = 1– P(X=0) = 1 – e-0.5 = 0,395 Exemplo • Qual é a distribuição do número de acessos em um minuto? Exemplo • Qual é a distribuição do número de acessos em um minuto? Poisson (30) Em geral, o número de acessos em um intervalo de duração t tem distribuição Poisson (lt) Esperança • Idéia: a esperança (ou valor esperado) de uma v.a. é o valor médio que se espera obter ao se repetir um experimento aleatório um grande número de vezes. Esperança • Exemplo: Quem acerta um dos 25 grupos no jogo do bicho ganha 18 vezes o valor apostado. Qual é o ganho esperado para quem aposta R$ 1,00? Esperança • Exemplo: Quem acerta um dos 25 grupos no jogo do bicho ganha 18 vezes o valor apostado. Qual é o ganho esperado para quem aposta R$ 1,00? Ganha-se 17 com probabilidade 1/25 -1 com probabilidade 24/25 Após um grande número n de apostas, o ganho médio é, aproximadamente: 17 . 1 n ( 1). 25 24 25 n n 7 25 R $ 0 , 28 Esperança • O valor esperado de uma v.a. discreta X é: EX = i xi. P(X=xi) (ou seja, a média dos valores assumidos por X, ponderados por sua probabilidade) • EX pode ser um número real, +, – , ou não estar definida. Esperança EX x i P ( X x i ) x i P ( X x i ) xi 0 xi 0 finito finito EX R – finito EX = – finito + EX = + – + EX não definido Paradoxo de S. Petersburgo • Jogo em que chance de vitória é 1/3, mas cuja aposta é 1:1. • Estratégia: jogar até vencer, sempre dobrando o valor da aposta. • Variáveis aleatórias de interesse: X = ganho quando se aposta 1. N = número de apostas até a saída. Y = ganho na saída. Paradoxo de S. Petersburgo • X= –1, com prob. 2/3 1, com prob. 1/3 EX = –1/3. • N é finito com prob. 1 2 2 1 2 1 EN . 1 . . 2 . . 3 .... 3 3 3 3 3 3 1 • Y=1 Paradoxo de S. Petersburgo • Mas seja C o capital usado até a vitória EC 1 2 .1 3 2 1 2 1 2 . . 3 . . 7 .... 3 3 3 3 3 n 1 1 n . .( 2 1) ... 3 Propriedades • E(aX + b) = aEX + b • Mas, em geral, E(g(X)) g(E(X)) • Exemplo: Y = X2 EX = (–1).0,2.(–1)+0.0,4+1.0,4 = 0,2 EY = 0.0,4+1.0,6 = 0,6 • Note que X p –1 0,2 0 0,4 1 0,4 EY = 02.P(X=0) + 12 .P(X=1) + (–1)2 .P(X=–1) Y p 0 0,4 1 0,6 Propriedades • Para X discreta: E(g(X)) = i g(xi) P(X=xi) (Law of the unconscious statistician) Propriedades • E(X+Y) = EX + EY (sempre!) • E(XY) = EX EY, se X e Y são independentes Exemplo • a) b) Urna com 10 bolas, das quais 4 são brancas. Cinco bolas são retiradas. Qual é o número esperado de bolas brancas retiradas: com reposição? sem reposição? Variância • Var(X) = E(X–EX)2 = E(X2) –(EX)2 Propriedades • Var(aX+b) = a2 Var(X) • Var(X+Y) = Var(X) + Var(Y) + 2Cov(X,Y) Propriedades • Se X1, X2, …, Xn são independentes, então Var(X1 + X2 +…+ Xn ) = Var(X1) + Var(X2) + …+ Var(Xn) Exemplo • X ~ binomial(p) Variáveis Aleatórias Contínuas F(x) = • • • • x - f(t) dt f 0 é a densidade de X b P(a < X < b) = a f(t) dt + - f(t) dt = 1 f(x) = F’ (x) • P(x–/2 < X < x+/2 ) f(x) x Exemplo • Seja X a abscissa de um ponto escolhido ao acaso no triângulo da figura. Qual é a densidade de X? 1 1 Solução 1 F ( x) P( X x) x.x / 2 x 2 1.1 / 2 x f ( x) d dx F ( x) d dx x 2 2x (0 x 1) 1 Outra solução 1 f ( x) kx 1 kx 0 1 2 kx 2 k 1 k 2 2 0 f ( x) 2 x (0 x 1) x 1 Esperança – discreta: EX xi P( X xi ) i – contínua: EX xi P( X xi ) x f X ( x)dx i – mista: EX x f X ( x)dx Principais Distribuições Contínuas • • • • Uniforme Exponencial Gama Normal (e associadas: c2, t, F) Distribuição Uniforme fX FX 1/(b-a) a b a b 1 Distribuição Exponencial • De volta ao exemplo do site na Internet. Qual é a distribuição do tempo de espera X até a ocorrência do primeiro acesso? • X > t se e só se o número de acessos em [0, t] é igual a 0 • Logo, P(X>t) = P(N = 0), onde N~Poisson(lt) • Portanto, P(X>t) = e-lt Distribuição Exponencial • X tem distribuição exponencial com parâmetro l quando FX (x) = 1–e – lx, para x >0 • Ou seja, fX(x) = le – lx , para x > 0 Exemplo • O tempo de vida, em meses, de um componente tem distribuição exponencial de parâmetro l = 0,5. a) Qual é a probabilidade de que um componente novo dure pelo menos 2 meses? b) Dado que um componente usado já tem 1 mês de vida, qual é a probabilidade de que ele dure pelo menos mais dois meses? Processo de Poisson • Tempo entre chegadas consecutivas independentes, com distribuição exponencial (l) • Número de chegadas em intervalos disjuntos independentes e com distribuição Poisson (lt), onde t é o comprimento do intervalo Exemplo • Os acidentes em uma rodovia ocorrem de acordo com um Processo de Poisson de taxa 2 acidentes por dia – – – – Número médio de acidentes por semana? Número médio de dias sem acidentes por semana? Intervalo médio entre acidentes? Probabilidade de que haja 2 acidentes na 2a e 1 na 3a? – Probabilidade de que o primeiro acidente em um certo dia só ocorra depois das 12 horas? Distribuição Normal • A distribuição normal padrão é a distribuição da variável aleatória Z de densidade f Z ( z) 1 2 e • Notação: Z ~ N(0, 1) EZ = 0, Var Z = 1 z 2 2 Distribuição Normal • Uma variável X tem distribuição normal com parâmetros m (média) e s2 (variância) quando é da forma X = sZ + m, onde Z~N(0,1) • Notação: X~N(m, s2) Distribuição Normal • Qual é a densidade da distribuição X~N(m, s2)? • De modo geral, qual é a densidade de g(X), onde g é uma função inversível e X é uma v. a. de densidade f? Transformando uma v. a. • A densidade de Y = g(X) é dada por fY ( y ) f X ( x) | g ' ( x) | onde x é tal que g( x) = y. Transformando uma v.a. • Caso particular: Se X tem densidade f, então Y = aX + b (a>0) tem densidade X= Y/2 X y b f a a 1 Y = 2X Y Densidade da distribuição normal • A densidade da v.a. X com distribuição normal N(m, s2) é f X ( x) 1 2 s e ( xm ) 2s 2 2 Exemplo • As notas dos alunos em um teste têm distribuição normal com média 70 e desvio padrão 10. – Se um aluno for escolhido ao acaso, qual é a probabilidade de que sua nota seja maior que 85? – Qual é a nota correspondente ao percentil 95%? V. A. Multidimensionais • Exemplo: moeda honesta lançada 3 vezes X = número de caras Y = número de transições x 0 1 2 3 P(X=x) 1/8 3/8 3/8 1/8 y 0 1 2 P(Y=y) 1/4 2/4 1/4 Qual é a probabilidade de que X = 2 e Y =1? V. A. Multidimensionais • Não se pode responder (em geral) a partir das distribuições individuais (marginais) de X e Y. • Pode-se responder com base na distribuição de (X, Y), também chamada de distribuição conjunta de X e Y. Distribuição Conjunta w X ccc 3 cck 2 ckc 2 kcc 2 ckk 1 kck 1 kkc 1 kkk 0 Y 0 1 2 1 1 2 1 0 Distribuição Conjunta w ccc cck ckc kcc ckk kck kkc kkk P 1/8 1/8 1/8 1/8 1/8 1/8 1/8 1/8 X 3 2 2 2 1 1 1 0 Y 0 1 2 1 1 2 1 0 X Y 0 1 2 0 1 2 3 Distribuição Conjunta w ccc cck ckc kcc ckk kck kkc kkk P 1/8 1/8 1/8 1/8 1/8 1/8 1/8 1/8 X 3 2 2 2 1 1 1 0 Y 0 1 2 1 1 2 1 0 X 0 1 2 3 0 1/8 - - 1/8 1 - 2/8 2/8 - 2 - 1/8 1/8 - Y P(X=2 e Y =1) = 2/8 Distribuição Conjunta • A distribuição conjunta de X = (X1, X2, ..., Xn) completamente caracteriza probabilidades envolvendo X1, X2, ..., Xn e quaisquer subconjuntos delas (distribuições marginais). Distribuição Conjunta X Y 0 1 2 X 0 1 2 3 1/8 - 2/8 1/8 2/8 1/8 1/8 - Y Distribuição Conjunta X 0 1 2 3 Y 2/8 1/8 3/8 2/8 1/8 3/8 1/8 1/8 1/4 1/2 1/4 X 1/8 1/8 Y 0 1 2 Função de Distribuição Acumulada • A distribuição conjunta de X = (X1, X2, ..., Xn) é completamente caracterizada pela sua função de distribuição acumulada. FX1, X2, ... Xn (x1, x2, ..., xn) = P(X1 x1, X2 x2, ..., Xn xn) • Exemplo FX1(x1) = ? Função de Distribuição Acumulada • A distribuição conjunta de X = (X1, X2, ..., Xn) é completamente caracterizada pela sua função de distribuição acumulada. FX1, X2, ... Xn (x1, x2, ..., xn) = P(X1 x1, X2 x2, ..., Xn xn) • Exemplo FX1(x1) = limx2 , ..., xn FX1, X2, ... Xn (x1, x2, ..., xn) Tipos de distribuição conjunta • Discretas Quando existe um conjunto enumerável A = {x1, x2, ...} tal que P(X A) = 1. Neste caso, P(X B) = xi B P(X = xi) Tipos de distribuição conjunta • Discretas Quando existe um conjunto enumerável A = {x1, x2, ...} tal que P(X A) = 1. Neste caso, P(X B) = xi B P(X = xi) • Contínuas Quando existe uma função de densidade f tal que FX , X ,..., X ( x1, x2 ,..., xn ) 1 2 n x1 x2 xn ... f (t1, t 2 ,...t n )dtn ...dt2 dt1 Neste caso: P( X B) ... B f (t1, t 2 ,...t n )dtn ...dt2 dt1 Exemplo • Um ponto (X, Y) é escolhido no quadrado unitário com densidade proporcional a x+y. – Qual é a função de densidade? – Qual é a probabilidade de que X seja menor que 1/2? Propriedades • Esperança de funções de v.a. multidimensionais E(g(X)) = i g(xi) P(X=xi) (discreta) E(g(X)) = Rn g(x) fX(x) dx (contínua) • Casos particulares: • EX = R2 x fX,Y(x,y) dy dx • E(X+Y) = R2 (x+y) fX,Y(x,y) dy dx = = R2 x fX,Y(x,y) dy dx + R2 y fX,Y(x,y) dy dx = EX +EY Propriedades • Em geral, E (XY) EX EY • Mas E(XY) = EX EY se X e Y são independentes. E ( XY ) xy f X ,Y ( x, y ) dy dx xy f X ( x ) f Y ( y ) dy dx x f ( x ) y f ( y ) dy dx X Y x f X ( x ) dx y f Y ( y ) dy EX EY Observação • X, Y independentes E(XY) = EX EY • E(XY) = EX EY X, Y independentes não correlacionadas Covariância e Correlação • Cov(X, Y) = E(X–EX)(Y–EY) = = E(XY) – EX EY • r(X, Y) = Cov(X,Y)/s(X)s(Y) • Teorema: –1 ≤ r(X, Y) ≤ 1