10. Momentos e Função Característica Conjunta
Dadas duas v.a’s X e Y e uma função g(x,y) define-se a v.a.
Z = g( X, Y ). O valor médio de Z é dado por:

 

 
Z  E(Z )   z f Z ( z)dz  
ou
E[ g ( X , Y )]  
 




g ( x, y) f XY ( x, y)dxdy.
g ( x, y) f XY ( x, y)dxdy.
Se X e Y são variáveis aleatórias discretas, então
E[ g ( X , Y )]   g ( xi , y j ) P( X  xi , Y  y j ).
i
j
Uma vez que o valor esperado é um operador linear,


E   ak gk ( x, y )    ak E[ gk ( xi , y j )].
 k
 k
1
Covariância: Dadas duas v.a.’s quaisquer X e Y, definese
Cov( X , Y )  E( X   X )(Y  Y ).
Expandindo o lado direito da equação, tem-se:
____
__ __
Cov( X , Y )  E ( XY )   X Y  E ( XY )  E ( X ) E (Y )  XY  X Y .
É fácil mostrar que
Cov( X , Y )  Var( X )Var(Y ) .
Prova: Seja U = aX + Y.
2
Var(U )  E a ( X   X )  (Y  Y )


 a 2Var( X )  2a Cov( X , Y )  Var(Y )  0 .
Resolvendo a equação em a.
 2 cov(X , Y )  4Cov( X , Y ) 2  4Var ( X )Var (Y )
a
2Var ( X )
2
Se a equação de segundo grau é positiva para qualquer valor
de a, então o seu discriminante é não positivo, isto é:
2
Cov ( X , Y )  Var ( X ) Var (Y )  0
Dividindo por Var(X)Var(Y) e chamando o parâmetro
normalizado de coeficiente de correlação, tem-se
 XY 
Cov( X , Y )
Cov( X , Y )

,
 X Y
Var( X )Var(Y )
 1   XY  1,
Se
então as variáveis aleatórias X e Y são
descorrelacionadas, e então.
Se X e Y são v.a.'s então E ( XY )  E ( X ) E (Y ), e  XY  0,
implica em descorrelação. A recíproca não é verdadeira.
Se E(XY) = 0, as v.a.’s são ortogonais.
3
Se duas variáveis aleatórias são estatisticamente
independentes, então elas não podem ter ter qualquer
correlação entre elas (  XY  0). No entanto, a recíproca não é
verdadeira, isto é correlação não implica em independência.
V.a.’s podem ser descorrelacionadas sem serem
independentes.
Exemplo 10.1: Sejam X  U (0,1), Y U (0,1). Suponha que X
e Y são independentes. Define-se Z = X + Y, W = X - Y .
Mostre que Z e W não são v.a.’s independentes, mas são
descorrelacionadas.
Solução: E(ZW )  E( X  Y )( X  Y )  E( X 2 )  E(Y 2 )  0,
E (W )  E ( X  Y )  0,
Cov( Z ,W )  E ( ZW )  E ( Z ) E (W )  0
4
Exemplo 10.2: Seja Z  aX  bY . Determine a variância de Z
em termos de X , Y e  XY . Solução:
Z  E( z)  E(aX  bY )  a X  bY

2
Z
 Var( z )  E ( Z   )   E a ( X  
Z
)  b(Y  Y ) 
2
2
X

 a 2 E ( X   X )2  2abE( X   X )(Y  Y )   b2 E (Y  Y )2
 a 2 X2  2ab XY X  Y  b2 Y2 .
Em particular se X e Y são independentes, então  XY  0, e
 Z2  a2 X2  b2 Y2 .
Portanto a variância da soma de duas variáveis aleatórias
independentes é igual à soma de suas variâncias.
Momentos
E[ X Y ]  
k
m





x k y m f XY ( x, y )dx dy,
5
Função característica conjunta
A função característica conjunta entre duas v.a.‘s X e Y é
definida como:
 XY (u, v)  E e
j ( XuYv )
  




e j ( XuYv ) f XY ( x, y )dxdy.
Note que:  XY (u, v)   XY (0,0)  1.
1  2 XY (u, v )
É fácil mostrar que E ( XY )  2
j
uv
.
u  0 ,v  0
Se X e Y são variáveis aleatórias independentes, então:
 XY (u, v)  E(e juX ) E(e jvY )   X (u)Y (v).
 X (u)   XY (u,0), Y (v)   XY (0, v).
6
Variáveis Aleatórias Gaussianas
Se X e Y são variáveis aleatórias conjuntamente Gaussianas,
isto é, N (X , Y , X2 , Y2 ,  ), a função característica conjunta
de X e Y é dada por:
1
 XY (u, v)  E (e j ( XuYv ) )  e
Se v  0 ,
j (  X u  Y v )  ( X2 u 2  2  X  Y uv  Y2 v 2 )
2
 X (u)   XY (u,0)  e
1
j X u   X2 u 2
2
.
,
Covariância entre X e Y : Cov(X,Y)=E(XY)-E(X)E(Y)
Calculando a derivada
1  2 XY (u, v )
E ( XY )  2
j
uv
.
u  0 ,v  0
e substituindo o valor de E(X) e E(Y)
Cov( X ,Y )    X  Y .
7
Então,  em N (  X , Y , X2 , Y2 ,  ) é o coeficiente de correlação
Se   0
f XY ( X , Y )  f X ( x) fY ( y ).
Se X e Y são conjuntamente gaussianas, descorrelação
implica em independencia entre as duas variáveis aleatórias
O caso de variáveis aleatórias é a única exceção onde esta
afirmativa é verdadeira.
Exemplo 10.3: seja X e Y variáveis aleatórias
conjuntamente gaussianas com parâmetros N (X , Y , X2 , Y2 ,  ).
Define-se Z  aX  bY . Determine f Z (z ).
Solução: Neste caso pode-se usar a função característica
para resolver o este problema.
 Z (u)  E (e jZu )  E (e j ( aX bY ) u )  E (e jauX  jbuY )
  XY (au, bu).
8
Portanto, substituindo u e v por au bu em
 XY (u, v)  E (e j ( XuYv ) )  e
Tem-se:
 Z (u )  e
onde:
1
j (  X u  Y v )  ( X2 u 2  2  X  Y uv  Y2 v 2 )
2
1
j ( a X bY ) u  ( a 2 X2  2 ab X  Y b2 Y2 ) u 2
2
e
1
jZ u   Z2 u 2
2

Z 
a X  bY ,

 Z2 
a 2 X2  2 ab X  Y  b2 Y2 .
Portanto a função característica da v.a. Z tem a mesma forma
da função característica de uma v.a. gaussiana, portanto,
conclui-se que a v.a. Z=aX + bY é ainda gaussiana.
Assim qualquer combinação linear de variáveis aleatórias
conjuntamente gaussianas gera uma variáveis aleatórias
9
gaussiana.
,
.
Exemplo 10.4: Suponha que X e Y são v.a. conjuntamente
gaussianas. Define-se as combinações lineares:
Z  aX  bY ,
W  cX  dY .
O que se pode dizer a respeito da distribuição conjunta de Z
e W ? Solução:
A função característica de Z e W é dada por:
 ZW (u, v )  E (e j ( Zu Wv ) )  E (e j ( aX bY ) u  j ( cX dY ) v )
 E (e jX ( au cv ) jY ( bu dv ) )   XY (au  cv, bu  dv).
O que siganifica substituir, u= au + cv and v = bu + dv, na
expressão da função característica de uma v.a. gaussiana,
 ZW (u, v)  e
1
2 2
j ( Z u  W v )  ( Z2 u 2 2  ZW  X  Y uv  W
v )
2
,
10
 ZW (u, v)  e
onde
1
2 2
j ( Z u  W v )  ( Z2 u 2 2  ZW  X  Y uv  W
v )
2
 Z  a X  bY ,
W  c X  dY ,
 Z2  a 2 X2  2ab  X  Y  b2 Y2 ,
 W2  c 2 X2  2cd  X  Y  d 2 Y2 ,
e
ZW 
ac X2  (ad  bc)  X  Y  bd Y2
 Z W
.
Conclui-se portanto que as variáveis aleatórias Z e W são
conjuntamente gaussianas.
11
,
Teorema do Limite Central: Suponha que X1, X 2 ,, X n
formam um conjunto de variáveis aleatórias independentes,
com média zero e identicamente distribuídas(i.i.d), com
dada distribuição. Considere a soma escalada
X1  X 2    X n
Y 
.
n
n  ,
Então assintóticamente, quando
Y  N (0, 2 ).
Prova: Sejam a média e a variância da v.a. Xi , i=1, 2, ...,n.
E ( X i )  0,
Var( X i )  E( X i2 )   2 .
i=1, 2, ...,n.
Visto que as v.a. X1, X2 ... X2 são independentes pode-se
n
escrever:
j ( X  X  X ) u / n
jX u / n
jYu
Y (u )  E ( e

)Ee
1
2
n
   E (e
i
)
i 1
n
   X i (u / n )
i 1
12
Tomando-se o desenvolvimento em série da função
característica da v.a. Xi .
E (e jXiu /
2
2 2
3 3 3
2 2


jX
u
j
X
u
j
X
u

u
 1 
n
i
i
i
)  E 1 


   1 
 o 3 / 2 ,
3/ 2
2! n
3! n
2n
n
n 


n
n
Como Y (u)   E (e jX u / n )    X (u / n )
i
i 1
i 1
i
e substituindo E(e jX u / n ) na equação acima, tem-se:
i
n
  u
 1 
Y (u )  1 
 o 3 / 2  ,
2n
 n 

2 2
n
x

x
lim
1


e
. Calcula-se o limite


Usando-se a relação n
n

lim Y (n )  e
n 
 2u 2 / 2
,
que é a função característica de uma v.a. gaussiana
13
O teorema do limite central estabelece que a soma de um
grande número de variáveis aleatórias independentes, cada
uma com variância finita tende a se comportar como uma
variável aleatória gaussiana. Assim as funções densidade de
probabilidade individual de cada variável aleatória torna-se
sem importância para a análise do conjunto de variáveis.
Se um fenômeno ruidoso é modelado como um grande
número de variáveis aleatórias independentes, então o
teorema nos permite concluir que o ruído se comporta como
um uma variável aleatória gaussiana.
O requisito de que a variância das variáveis aleatórias seja
finita é importante para o teorema do limite central seja uma
boa aproximação para a representação da distribuição de
14
probabilidade do conjunto de variáveis aleatórias.
Exemplo: Considere um conjunto de variáveis aleatórias independentes
identicamente distribuídas com distribuição de Cauchy. lembrando que
a distribuição de Cauchy tem variância indefinida. Solução: Seja
X1  X 2    X n
Y 
.
n
onde cada v.a. Xi tem distribuição de Cauchy X i ~ C( ).
A função característica para cada Xi é dada por:
 Xi (u)  e|u| ,
Então:
n
Y (u )    X (u / n )  e  |u|/
n
~ C ( / n ),
i 1
O que mostra que Y é ainda uma v.a. de Cauchy com parâmetro  / n .
Em outras palavras o teorema do limite central não é uma boa
aproximação para um conjunto de variáveis aleatórias de Cauchy visto
15
que suas variâncias são indefinidas.
A função característica é útil na determinação da f.d.p de
combinações lineares de variáveis aleatórias. Por exemplo,
se X e Y são variáveis aleatórias independentes de Poisson
com parâmetros 1 e 2 respectivamente, ou seja:
Z  X Y.
Então  Z (u)   X (u)Y (u).
As funções características para as v.a.’s X e Y são:
1 ( e ju 1)
 X (u)  e
,
2 ( e ju 1)
Y (u)  e
Desta forma que
( 1 2 )( e ju 1) 
Z (u)  e
P(1  2 )
Isto é, a soma de variáveis aleatórias independentes de
Poisson é ainda uma variável aleatória de Poisson.
16
Download

aula12_momentosconj