3 Distribuição e Densidade de Probabilidade Albertazzi.Variáveis Aleatórias Contínuas. (3.1) variáveis aleatórias • São funções definidas sobre os elementos de um espaço amostral – ex: soma de dois dados, cotação do Dollar, precipitação diária de chuva em uma cidade, limite de resistência de uma peça, etc • Podem ser – discretas – contínuas • Convenção: – variáveis aleatórias: X, Y, ... (letras maiúsculas) – valores possíveis das variáveis aleatórias: x, y, ... (minúsculas) Albertazzi.Variáveis Aleatórias Contínuas. (3.2) variáveis aleatórias discretas • A função que atribui a probabilidade a cada valor possível de uma variável aleatória discreta é denominada distribuição de probabilidade f(x) = P(X = x) • exemplo: – dado honesto: f(x) = 1/6, para x=1, 2, 3, 4, 5 ou 6 – como seria f(x) para a soma de dois dados? • Propriedades: f ( x) 0 f ( x) 1 todos X Albertazzi.Variáveis Aleatórias Contínuas. (3.3) função distribuição (acumulada) • A função distribuição acumulada de uma variável aleatória X associa a cada valor possível de X a probabilidade deste valor ser menor ou igual a x. Denota-se F(x) F(x) = P(X x) • exemplo: f(x) F(x) 0,50 1,00 0,25 0,50 x x 1 2 3 4 5 1 2 3 4 5 Albertazzi.Variáveis Aleatórias Contínuas. (3.4) média e variância de uma distribuição calculada a partir de sua distribuição de probabilidades • Média (ou valor esperado) x. f ( x) E( x) todosx • Variância 2 ( x ) . f ( x) 2 todosx Albertazzi.Variáveis Aleatórias Contínuas. (3.5) variáveis aleatórias contínuas – Assumem valores reais f(x) f(x) = função densidade de probabilidade x a b b P( X x) 0 P(a X b) f ( x) dx a Albertazzi.Variáveis Aleatórias Contínuas. (3.6) variáveis aleatórias contínuas – Propriedades: f(x) f ( x) 0, x x f ( x)dx 1 a b P(a X b) P(a X b) P(a X b) P(a X b) Albertazzi.Variáveis Aleatórias Contínuas. (3.7) função probabilidade acumulada – A função probabilidade acumulada de uma variável aleatória X associa a cada valor possível de X a probabilidade deste valor ser menor ou igual a x. Denota-se F(x) f(x) x F ( x) P( X x) f ( )d x d F ( x) f ( x) dx a 1,00 b F(x) F(b) P(a X b) F (b) F (a) x F(a) a b Albertazzi.Variáveis Aleatórias Contínuas. (3.8) média e variância de uma VA contínua • Média (ou valor esperado) x f ( x)dx E ( x) • Variância ( x ) f ( x) dx x f ( x) dx 2 2 2 2 Albertazzi.Variáveis Aleatórias Contínuas. (3.9) Distribuição de probabilidade uniforme ou retangular probabilidade 1/6 Probabilidade (1/6) 1.2 1 0.8 0.6 0.4 0.2 0 0 1 2 3 4 5 6 Lançamento de um dado 1 2 3 4 5 6 Valores Albertazzi.Variáveis Aleatórias Contínuas. (3.10) 7 Distribuição de probabilidade triangular probabilidade (1/36) 6 4 2 1,0 1,5 2,0 2,5 3,0 3,5 4,0 4,5 5,0 5,5 6,0 Média de dois dados Albertazzi.Variáveis Aleatórias Contínuas. (3.11) Distribuição de probabilidade triangular Probabilidade (1/36) 7 6 5 4 3 2 1 0 0 1 2 3 4 5 6 7 Média de 2 dados Albertazzi.Variáveis Aleatórias Contínuas. (3.12) Lançamento de um dado Probabilidade (1/6) 1.2 1 0.8 0.6 0.4 0.2 0 0 1 2 3 4 5 6 7 Valores Albertazzi.Variáveis Aleatórias Contínuas. (3.13) Média de dois dados P rob a b ilid ade (1/36) 7 6 5 4 3 2 1 0 0 1 2 3 4 5 6 7 M é di a d e 2 d a do s Albertazzi.Variáveis Aleatórias Contínuas. (3.14) Média de três dados Pro bab ilid ade (1/216) 30 25 20 15 10 5 0 0 1 2 3 4 5 6 7 M é di a d e 3 d a do s Albertazzi.Variáveis Aleatórias Contínuas. (3.15) Média de quatro dados Pro bab ilid ad e (1/1296) 16 0 14 0 12 0 10 0 80 60 40 20 0 0 1 2 3 4 5 6 7 M é di a d e 4 d a do s Albertazzi.Variáveis Aleatórias Contínuas. (3.16) Média de seis dados Pro ba bili dad e ( 1/ 46656) 50 0 0 45 0 0 40 0 0 35 0 0 30 0 0 25 0 0 20 0 0 15 0 0 10 0 0 50 0 0 0 1 2 3 4 5 6 7 M é di a d e 6 d a do s Albertazzi.Variáveis Aleatórias Contínuas. (3.17) Média de oito dados Probabilidade (1/1679616) 160000 140000 120000 100000 80000 60000 40000 20000 0 0 1 2 3 4 5 6 7 Média de 8 dados Albertazzi.Variáveis Aleatórias Contínuas. (3.18) Curva normal pontos de inflexão desvio padrão média assíntota assíntota Albertazzi.Variáveis Aleatórias Contínuas. (3.19) distribuição normal (ou gaussiana) • Observada no século XVIII: “curva normal de erros” 1 f ( x) e 2 ( x )2 2 2 x f(x) - Ponto de inflexão + Albertazzi.Variáveis Aleatórias Contínuas. (3.20) distribuição normal (ou gaussiana) Função probabilidade acumulada: 1 F ( x) 2 x e ( ) 2 2 2 d Não pode ser integrada de forma explícita. É calculada numericamente e tabelada. Problema: para cada valor de e seria necessária uma tabela diferente! Solução: distribuição normal padronizada. Albertazzi.Variáveis Aleatórias Contínuas. (3.21) variável distribuição =3 =2 f(x) X 0 3 =0 =2 f(y) Y X 3 0 3 =0 =1 f(z) X 3 Z 2 0 3 Albertazzi.Variáveis Aleatórias Contínuas. (3.22) distribuição normal padronizada • Mudança de variável para que = 0 e 2 = 1 Z X 1 f ( z) e 2 1 F ( z) 2 z z2 2 e 2 / 2 z d F(z) é tabelado Albertazzi.Variáveis Aleatórias Contínuas. (3.23) propriedade para uso da tabela: F(-z) = ? F(-z) 1 - F(z) -z 0 z F ( z ) 1 F ( z ) Albertazzi.Variáveis Aleatórias Contínuas. (3.24) exemplo: Calcule a probabilidade de um VA com distribuição normal com = 3 e = 2 apresentar valores entre 2 e 5. =3 =2 P F ( z5 ) F ( z 2 ) 53 z5 1,00 2 0 2 3 5 23 z2 0,50 F (0,50) 1 F (0,50) 2 P F (1,00) [1 F (0,50)] 0.8413 - [1 - 0.6915] 0.5328 Albertazzi.Variáveis Aleatórias Contínuas. (3.25) distribuição uniforme f(x) 1 1 , x , f ( x) 0 , caso contrário 2 1 2 12 2 ex: erro de arredondamento de um mostrador digital Albertazzi.Variáveis Aleatórias Contínuas. (3.26) distribuição triangular f(x) 2 2 1 2 24 2 efeito do arredondamento na diferença entre duas indicações digitais Albertazzi.Variáveis Aleatórias Contínuas. (3.27) valor esperado • Definição: o valor esperado (ou esperança ou valor médio) de uma função de uma variável aleatória (VA) é dado por: E[ g ( x)] g ( x) f ( x) dx Albertazzi.Variáveis Aleatórias Contínuas. (3.28) propriedades do valor esperado • caso particular: g(X) = X E( X ) x • caso particular 2: g(X) = (X - x)2 E[( X x ) ] Var ( X ) 2 2 x Albertazzi.Variáveis Aleatórias Contínuas. (3.29) propriedades do valor esperado • outros casos de interesse: E (aX b) a E ( X ) b Var (aX b) a Var ( X ) aX b a X b 2 2 aX b a 2 2 X Albertazzi.Variáveis Aleatórias Contínuas. (3.30) propriedades do valor esperado e variância • Seja X1, X2, ... , Xk VA com média Xi E (a1 X 1 a2 X 2 ... ak X k ) k a1 E ( X 1 ) a2 E ( X 2 ) ... ak E ( X k ) ai X i i 1 • Exemplo: 2 X X 1 2 3 X 3 2 X1 X 2 3 X 3 Albertazzi.Variáveis Aleatórias Contínuas. (3.31) propriedades do valor esperado e variância • Seja X1, X2, ... , Xk VA independentes e com variância 2Xi Var (a1 X 1 a2 X 2 ... ak X k ) k a12Var ( X 1 ) a22Var ( X 2 ) ... ak2Var ( X k ) ai2 xi2 i 1 • Exemplos: 22X X 1 2 3 X 3 4 X2 1 X2 2 9 X2 3 X X 1 2 2 X1 2 X2 X X 1 2 2 X1 2 X2 Albertazzi.Variáveis Aleatórias Contínuas. (3.32) propriedades do valor esperado e variância • Seja X1, X2, ... , Xk VA independentes e com variância 2Xi Var[ g ( X 1 , X 2 , ... , X k )] 2 2 g g g Var ( X 1 ) Var ( X 2 ) ... X 1 X 2 X k 2 Var ( X k ) • Exemplo: 2 2 X1 / X 2 1 2 X1 X2 2 X1 2 2 X 2 X2 Albertazzi.Variáveis Aleatórias Contínuas. (3.33) propriedades do valor esperado e variância Seja X1, X2, ... , Xk VA independentes, todas com média e var. 2 X 1 X 2 ... X k 1 X k X 1 1k X 2 ... 1k X k k X E ( X ) 1k E ( X 1 ) 1k E ( X 2 ) ... 1k E ( X k ) 1k 1k ... 1k kk X2 Var ( X ) k1 Var ( X 1 ) k1 Var ( X 2 ) ... k1 Var ( X k ) 2 X 1 k2 2 2 2 k1 2 ... k1 2 kk 2 2 2 2 2 k k Albertazzi.Variáveis Aleatórias Contínuas. (3.34) covariância • Definição: covariância entre X1 e X2 cov( X 1 , X 2 ) X1 X 2 E[( X 1 X1 )( X 2 X 2 )] E ( X 1. X 2 ) X1 . X 2 X2 X2 X2 X1 X X 0 1 2 X2 X1 X X 0 1 2 X1 X X 0 1 2 X1 X X 0 1 2 Albertazzi.Variáveis Aleatórias Contínuas. (3.35) correlação • Quando dividida pelos respectivos desvios-padrão de cada variável, a covariância é normalizada e recebe o nome de “Coeficiente de correlação” X X 1 2 X1 X 2 cov( X 1 , X 2 ) Var ( X 1 ).Var ( X 2 ) X1 . X 2 1 X1 X 2 1 Albertazzi.Variáveis Aleatórias Contínuas. (3.36) correlação • Se X1 e X2 são VA independentes, então X1X2 = X1X2 = 0 X1X2 = X1X2 = 0 • Se X1, X2, ... , Xk são dependentes, então: Var (a1 X 1 a2 X 2 ... ak X k ) a12Var ( X 1 ) a22Var ( X 2 ) ... ak2Var ( X k ) 2 i j k a a j 2 i j cov( X i , X j ) Albertazzi.Variáveis Aleatórias Contínuas. (3.37) verificação de normalidade • Uma distribuição é normal? Escores normais: conjunto de “n” valores que dividem a distribuição normal idealizada em “n+1”faixas com igual probabilidade e organizados em ordem crescente exemplo: n=4 F(-0,84) = 0,20 F(-0,25) = 0,40 F(0,25) = 0,60 F(0,84) = 0,80 0,2 0,2 -0,84 0,2 -0,25 0,25 0,2 0,2 0,84 Albertazzi.Variáveis Aleatórias Contínuas. (3.38) verificação de normalidade • Roteiro: 1 - Calcule e a partir dos dados experimentais 2 - Ordene os dados de forma crescente 3 - Obtenha os escores normais sendo “n” o número de dados experimentais 4 - Plote o i-ésimo valor experimental versus o i-ésimo escore normal 5 - Se o gráfico resultante se aproxima de uma reta esse indica que a distribuição dos dados é próxima da normal Normalmente 15 n 20, embora seja comum n > 20, mas não se recomenda n < 15 Albertazzi.Variáveis Aleatórias Contínuas. (3.39) valores -5, 16, 6, -15 valores ordenados -15, -5, 6, 16 0.2 0.4 0.6 0.8 EN Val -0.842 -15 -0.253 -5 0.253 6 0.842 16 15 Valores da variável P 20 10 5 0 -1 -0.5 -5 0 0.5 1 -10 -15 -20 Escores normais Albertazzi.Variáveis Aleatórias Contínuas. (3.40) verificação de normalidade • Exemplos: 3 3 2 2 1 1 0 -3 -2 -1 -1 0 0 1 2 3 -1 -2 -2 -3 -3 distribuição normal 0 0,2 0,4 0,6 0,8 distribuição uniforme Albertazzi.Variáveis Aleatórias Contínuas. (3.41) 1