3
Distribuição e Densidade de Probabilidade
Albertazzi.Variáveis Aleatórias Contínuas. (3.1)
variáveis aleatórias
• São funções definidas sobre os elementos de um espaço
amostral
– ex: soma de dois dados, cotação do Dollar, precipitação diária de
chuva em uma cidade, limite de resistência de uma peça, etc
• Podem ser
– discretas
– contínuas
• Convenção:
– variáveis aleatórias: X, Y, ... (letras maiúsculas)
– valores possíveis das variáveis aleatórias: x, y, ... (minúsculas)
Albertazzi.Variáveis Aleatórias Contínuas. (3.2)
variáveis aleatórias discretas
• A função que atribui a probabilidade a cada valor possível de
uma variável aleatória discreta é denominada distribuição de
probabilidade
f(x) = P(X = x)
• exemplo:
– dado honesto: f(x) = 1/6, para x=1, 2, 3, 4, 5 ou 6
– como seria f(x) para a soma de dois dados?
• Propriedades:
f ( x)  0
 f ( x)  1
todos X
Albertazzi.Variáveis Aleatórias Contínuas. (3.3)
função distribuição (acumulada)
• A função distribuição acumulada de uma variável aleatória X
associa a cada valor possível de X a probabilidade deste
valor ser menor ou igual a x. Denota-se F(x)
F(x) = P(X  x)
• exemplo:
f(x)
F(x)
0,50
1,00
0,25
0,50
x
x
1
2
3
4
5
1
2
3
4
5
Albertazzi.Variáveis Aleatórias Contínuas. (3.4)
média e variância de uma distribuição
calculada a partir de sua distribuição de
probabilidades
• Média (ou valor esperado)

 x. f ( x)  E( x)
todosx
• Variância
 
2
 ( x   ) . f ( x)
2
todosx
Albertazzi.Variáveis Aleatórias Contínuas. (3.5)
variáveis aleatórias contínuas
– Assumem valores reais
f(x)
f(x) = função densidade
de probabilidade
x
a
b
b
P( X  x)  0
P(a  X  b)   f ( x) dx
a
Albertazzi.Variáveis Aleatórias Contínuas. (3.6)
variáveis aleatórias contínuas
– Propriedades:
f(x)
f ( x)  0, x
x

 f ( x)dx  1
a
b

P(a  X  b)  P(a  X  b)  P(a  X  b)  P(a  X  b)
Albertazzi.Variáveis Aleatórias Contínuas. (3.7)
função probabilidade acumulada
– A função probabilidade acumulada de uma variável aleatória X
associa a cada valor possível de X a probabilidade deste valor ser
menor ou igual a x. Denota-se F(x)
f(x)
x
F ( x)  P( X  x) 
 f ( )d
x

d F ( x)
 f ( x)
dx
a
1,00
b
F(x)
F(b)
P(a  X  b)  F (b)  F (a)
x
F(a)
a
b
Albertazzi.Variáveis Aleatórias Contínuas. (3.8)
média e variância de uma VA contínua
• Média (ou valor esperado)

   x f ( x)dx  E ( x)

• Variância


   ( x   ) f ( x) dx   x f ( x) dx  
2
2

2
2

Albertazzi.Variáveis Aleatórias Contínuas. (3.9)
Distribuição de probabilidade uniforme ou
retangular
probabilidade
1/6
Probabilidade (1/6)
1.2
1
0.8
0.6
0.4
0.2
0
0
1
2
3
4
5
6
Lançamento de um dado
1
2
3
4
5
6
Valores
Albertazzi.Variáveis Aleatórias Contínuas. (3.10)
7
Distribuição de probabilidade triangular
probabilidade (1/36)
6
4
2
1,0
1,5
2,0
2,5
3,0
3,5
4,0
4,5
5,0
5,5
6,0
Média de dois dados
Albertazzi.Variáveis Aleatórias Contínuas. (3.11)
Distribuição de probabilidade triangular
Probabilidade (1/36)
7
6
5
4
3
2
1
0
0
1
2
3
4
5
6
7
Média de 2 dados
Albertazzi.Variáveis Aleatórias Contínuas. (3.12)
Lançamento de um dado
Probabilidade (1/6)
1.2
1
0.8
0.6
0.4
0.2
0
0
1
2
3
4
5
6
7
Valores
Albertazzi.Variáveis Aleatórias Contínuas. (3.13)
Média de dois dados
P rob a b ilid ade (1/36)
7
6
5
4
3
2
1
0
0
1
2
3
4
5
6
7
M é di a d e 2 d a do s
Albertazzi.Variáveis Aleatórias Contínuas. (3.14)
Média de três dados
Pro bab ilid ade (1/216)
30
25
20
15
10
5
0
0
1
2
3
4
5
6
7
M é di a d e 3 d a do s
Albertazzi.Variáveis Aleatórias Contínuas. (3.15)
Média de quatro dados
Pro bab ilid ad e (1/1296)
16 0
14 0
12 0
10 0
80
60
40
20
0
0
1
2
3
4
5
6
7
M é di a d e 4 d a do s
Albertazzi.Variáveis Aleatórias Contínuas. (3.16)
Média de seis dados
Pro ba bili dad e ( 1/ 46656)
50 0 0
45 0 0
40 0 0
35 0 0
30 0 0
25 0 0
20 0 0
15 0 0
10 0 0
50 0
0
0
1
2
3
4
5
6
7
M é di a d e 6 d a do s
Albertazzi.Variáveis Aleatórias Contínuas. (3.17)
Média de oito dados
Probabilidade (1/1679616)
160000
140000
120000
100000
80000
60000
40000
20000
0
0
1
2
3
4
5
6
7
Média de 8 dados
Albertazzi.Variáveis Aleatórias Contínuas. (3.18)
Curva normal
pontos de inflexão
  desvio padrão
  média
assíntota


assíntota

Albertazzi.Variáveis Aleatórias Contínuas. (3.19)
distribuição normal (ou gaussiana)
• Observada no século XVIII: “curva normal de erros”
1
f ( x) 
e
2 
( x )2
2 2
   x  
f(x)
-

Ponto de
inflexão
+
Albertazzi.Variáveis Aleatórias Contínuas. (3.20)
distribuição normal (ou gaussiana)
Função probabilidade acumulada:
1
F ( x) 
2 
x
e
 (   ) 2
2 2
d

Não pode ser integrada de forma explícita.
É calculada numericamente e tabelada.
Problema:
para cada valor de  e  seria necessária uma tabela diferente!
Solução:  distribuição normal padronizada.
Albertazzi.Variáveis Aleatórias Contínuas. (3.21)
variável
distribuição
=3
=2
f(x)
X
0
3
=0
=2
f(y)
Y  X 3
0
3
=0
=1
f(z)
X 3
Z
2
0
3
Albertazzi.Variáveis Aleatórias Contínuas. (3.22)
distribuição normal padronizada
• Mudança de variável para que  = 0 e 2 = 1
Z
X 

1
f ( z) 
e
2
1
F ( z) 
2
z
 z2
2
e

 2 / 2
   z  
d
F(z) é tabelado
Albertazzi.Variáveis Aleatórias Contínuas. (3.23)
propriedade para uso da tabela:
F(-z) = ?
F(-z)
1 - F(z)
-z
0
z
F ( z )  1  F ( z )
Albertazzi.Variáveis Aleatórias Contínuas. (3.24)
exemplo:
Calcule a probabilidade de um VA com distribuição normal com
 = 3 e  = 2 apresentar valores entre 2 e 5.
=3
=2
P  F ( z5 )  F ( z 2 )
53
z5 
 1,00
2
0
2 3
5
23
z2 
 0,50 F (0,50)  1  F (0,50)
2
P  F (1,00)  [1  F (0,50)]  0.8413 - [1 - 0.6915]  0.5328
Albertazzi.Variáveis Aleatórias Contínuas. (3.25)
distribuição uniforme
f(x)
1
 


 1
,  x ,

f ( x)     
0 , caso contrário


2
1
2
     
12
2
ex: erro de arredondamento de um mostrador digital
Albertazzi.Variáveis Aleatórias Contínuas. (3.26)
distribuição triangular
f(x)
2
 





2
1
2
     
24
2
efeito do arredondamento na diferença entre duas indicações
digitais
Albertazzi.Variáveis Aleatórias Contínuas. (3.27)
valor esperado
• Definição: o valor esperado (ou esperança ou valor médio)
de uma função de uma variável aleatória (VA) é dado por:

E[ g ( x)] 
 g ( x) f ( x) dx

Albertazzi.Variáveis Aleatórias Contínuas. (3.28)
propriedades do valor esperado
• caso particular: g(X) = X
E( X )   x
• caso particular 2: g(X) = (X - x)2
E[( X   x ) ]  Var ( X )  
2
2
x
Albertazzi.Variáveis Aleatórias Contínuas. (3.29)
propriedades do valor esperado
• outros casos de interesse:
E (aX  b)  a E ( X )  b

Var (aX  b)  a Var ( X )
aX b  a  X  b
2


2
aX  b
a 
2
2
X
Albertazzi.Variáveis Aleatórias Contínuas. (3.30)
propriedades do valor esperado e variância
• Seja X1, X2, ... , Xk VA com média Xi
E (a1 X 1  a2 X 2  ...  ak X k ) 
k
a1 E ( X 1 )  a2 E ( X 2 )  ...  ak E ( X k )   ai  X i
i 1
• Exemplo:
2 X  X
1
2 3 X 3
 2 X1   X 2  3 X 3
Albertazzi.Variáveis Aleatórias Contínuas. (3.31)
propriedades do valor esperado e variância
• Seja X1, X2, ... , Xk VA independentes e com variância 2Xi
Var (a1 X 1  a2 X 2  ...  ak X k ) 
k
a12Var ( X 1 )  a22Var ( X 2 )  ...  ak2Var ( X k )   ai2 xi2
i 1
• Exemplos:
 22X  X
1
2 3 X 3
 4 X2 1   X2 2  9 X2 3
 X X   
1
2
2
X1
2
X2
 X X    
1
2
2
X1
2
X2
Albertazzi.Variáveis Aleatórias Contínuas. (3.32)
propriedades do valor esperado e variância
• Seja X1, X2, ... , Xk VA independentes e com variância 2Xi
Var[ g ( X 1 , X 2 , ... , X k )] 
2
2
 g
 g 
 g 

 Var ( X 1 )  
 Var ( X 2 )  ...  
 X 1 
 X 2 
 X k
2

 Var ( X k )

• Exemplo:
2

2
X1 / X 2
 1  2
  X1
 
 X2 
2
  X1  2
  2   X 2
 X2 
Albertazzi.Variáveis Aleatórias Contínuas. (3.33)
propriedades do valor esperado e variância
Seja X1, X2, ... , Xk VA independentes, todas com média  e var. 2
X 1  X 2  ...  X k 1
X
 k X 1  1k X 2  ...  1k X k
k
 X  E ( X )  1k E ( X 1 )  1k E ( X 2 )  ...  1k E ( X k ) 
 1k   1k   ...  1k   kk   
 X2  Var ( X )  k1 Var ( X 1 )  k1 Var ( X 2 )  ...  k1 Var ( X k ) 
2

X 
1
k2
2
2
 2  k1  2  ...  k1  2  kk  2 
2
2
2
2
k

k
Albertazzi.Variáveis Aleatórias Contínuas. (3.34)
covariância
• Definição: covariância entre X1 e X2
cov( X 1 , X 2 )   X1 X 2  E[( X 1   X1 )( X 2   X 2 )] 
 E ( X 1. X 2 )   X1 . X 2
X2
X2
X2
X1
 X X 0
1
2
X2
X1
X X 0
1
2
X1
X X 0
1
2
X1
X X 0
1
2
Albertazzi.Variáveis Aleatórias Contínuas. (3.35)
correlação
• Quando dividida pelos respectivos desvios-padrão de cada
variável, a covariância é normalizada e recebe o nome de
“Coeficiente de correlação”
X X
1
2
 X1 X 2
cov( X 1 , X 2 )


Var ( X 1 ).Var ( X 2 )  X1 . X 2
 1   X1 X 2  1
Albertazzi.Variáveis Aleatórias Contínuas. (3.36)
correlação
• Se X1 e X2 são VA independentes, então X1X2 = X1X2 = 0
X1X2 = X1X2 = 0
• Se X1, X2, ... , Xk são dependentes, então:
Var (a1 X 1  a2 X 2  ...  ak X k )  a12Var ( X 1 )  a22Var ( X 2 )  ...
 ak2Var ( X k )  2
i j
k
a a
j 2
i
j
cov( X i , X j )
Albertazzi.Variáveis Aleatórias Contínuas. (3.37)
verificação de normalidade
• Uma distribuição é normal?
Escores normais: conjunto de “n” valores que dividem a distribuição
normal idealizada em “n+1”faixas com igual probabilidade e
organizados em ordem crescente
exemplo: n=4
F(-0,84) = 0,20
F(-0,25) = 0,40
F(0,25) = 0,60
F(0,84) = 0,80
0,2
0,2
-0,84
0,2
-0,25 0,25
0,2
0,2
0,84
Albertazzi.Variáveis Aleatórias Contínuas. (3.38)
verificação de normalidade
• Roteiro:
1 - Calcule  e  a partir dos dados experimentais
2 - Ordene os dados de forma crescente
3 - Obtenha os escores normais sendo “n” o número de dados
experimentais
4 - Plote o i-ésimo valor experimental versus o i-ésimo escore normal
5 - Se o gráfico resultante se aproxima de uma reta esse indica que a
distribuição dos dados é próxima da normal
Normalmente 15  n  20, embora seja comum n > 20, mas não se
recomenda n < 15
Albertazzi.Variáveis Aleatórias Contínuas. (3.39)
valores
-5, 16, 6, -15
valores ordenados
-15, -5, 6, 16
0.2
0.4
0.6
0.8
EN
Val
-0.842
-15
-0.253
-5
0.253
6
0.842
16
15
Valores da variável
P
20
10
5
0
-1
-0.5
-5 0
0.5
1
-10
-15
-20
Escores normais
Albertazzi.Variáveis Aleatórias Contínuas. (3.40)
verificação de normalidade
• Exemplos:
3
3
2
2
1
1
0
-3
-2
-1
-1
0
0
1
2
3
-1
-2
-2
-3
-3
distribuição normal
0
0,2
0,4
0,6
0,8
distribuição uniforme
Albertazzi.Variáveis Aleatórias Contínuas. (3.41)
1
Download

Distribuição e densidade de probabilidade