TESTE PARA ESTRUTURA ESPECIAL DE
CORRELAÇÃO


A estrutura de correlações iguais para todos os pares de
variáveis é uma estrutura importante na qual os autovalores da
matriz de variância não são todos distintos entre si.
Vamos apresentar aqui um teste das hipóteses
1

H 0 :   0  



  
1 ...  
  

  1
versus H1 :   0
Um teste pode ser baseado na estatística da razão de
verossimilhança, sob a suposição de normalidade.
TESTE PARA ESTRUTURA ESPECIAL DE
CORRELAÇÃO


Lawley (1963) demonstrou que um procedimento de teste
equivalente ao teste da R.V. pode ser cosntruído a partir dos
elementos fora da diagonal da matriz R de correlações
amostrais.
O procedimento de Lawley requer o uso das seguintes
quantidades:
1 p
rk 
r jk , k  1,..., p

p  1 j 1
jk
p 1 p
2
r
rjk e


p ( p  1) j 1 k  j 1

( p  1) 2 1  (1  r ) 2
ˆ 
p  ( p  2)(1  r ) 2

TESTE PARA ESTRUTURA ESPECIAL DE
CORRELAÇÃO

O teste de nível de significância  para
grandes amostras é da forma: rejeite a
hipótese nula se
p
(n  1)  p 1 p
2
2
2
ˆ




T
r

r


r

r




k
( p 1)( p  2 ) / 2 (1   )
2   jk
(1- r)  j 1 k  j 1
k 1

Exercício: realize o teste de correlações iguais para a base de dados dos
caranguejos.
ANÁLISE FATORIAL INTRODUÇÃO



É usada para descrever, se possível, as relações de
covariância entre muitas variáveis em função de poucas
quantidades aleatórias subjacentes, não-observáveis,
chamadas FATORES.
Suponha que as variáveis possam ser agrupadas pelas
suas correlações. Isto é, todas as variáveis dentro de
um particular grupo são altamente correlacionadas entre
si, mas têm correlações relativamente pequenas com
variáveis de outros grupos.
Nesse caso é razoável pensar em constructos ou fatores
subjacentes que são responsáveis pelas correlações
observadas.
ANÁLISE FATORIAL - INTRODUÇÃO



A análise fatorial pode ser pensada como
uma extensão da Análise em Componentes
Principais.
Ambas podem ser olhadas como tentativas
de aproximar a matriz de covariâncias .
Porém a aproximação baseada na Análise
Fatorial é mais elaborada.
MODELO FATORIAL ORTOGONAL
Seja X px1 talque E[ X ]  , Var( X )  .
O modelo fatorial postula que o vetor aleatório X é linearmente
dependente de poucas variáveis não-observáveis F1 , F2 , ..., Fm ,
chamadas FATORES COMUNS e p fontes adicionais de variação
1 , 2 , ..., p , chamadas erros ou FATORES ESPECÍFICOS.
X 1  1  l11 F1  l12 F2    l1m Fm   1
X 2   2  l21 F1  l22 F2    l2 m Fm   2

X p   p  l p1 F1  l p 2 F2    l pm Fm   p
ou, em notaçãomatricial,
X    LF  
MODELO FATORIAL ORTOGONAL



Os coeficientes ljk são chamados CARGAS dos
fatores (loadings) da j-ésima variável sobre o k-ésimo
fator tal que a matriz é a matriz de cargas dos fatores.
Observe que o j-ésimo fator específico, j , é
associado somente com a j-ésima variável Xj .
Os p desvios Xj -μj , j=1,2,...,p são expressos em
função de p+m quantidades aleatórias F1 , F2 , ..., Fm
, 1 , 2 , ..., p , que são não-observáveis.
MODELO FATORIAL ORTOGONAL



Isso diferencia o modelo fatorial do modelo
de regressão multivariada para o qual as
variáveis explicativas podem ser observadas.
Com tantas quantidades não-observáveis,
uma verificação direta do modelo fatorial a
partir de observações é impraticável.
Porém, algumas suposições adicionais sobre
os vetores F e  implicam em certas relações
de covariância que podem ser verificadas.
MODELO FATORIAL ORTOGONAL: suposições
adicionais

Assumimos que:
EF   0, COV ( F )  E[ F F ]  I ,
T
E   0, COV ( )  E[  ]    diag 1 , 2 ,, p 
T
COV ( , F )  0 pm
Essas suposições constituem o modelo de análise
fatorial ortogonal (ANFAT).
MODELO FATORIAL ORTOGONAL: suposições
adicionais

As suposições apresentadas implicam numa
estrutura especial da matriz de covariância ,
do vetor aleatório X.
X   X   
T
 ( L F   )(L F   )T 
 L F ( L F )T     L F    ( L F ) T

T
T
  COV ( X )  LLT  
Também, com essas suposições, tem-se:
X   
T
 (LF   )F  LF F   F
COV ( X , F )  L
T
T
T
tal que
ESTRUTURA DE COVARIÂNCIA NO MODELO FATORIAL
ORTOGONAL
(1) COV ( X )  LLT   ou
Var ( X j )  l 2j1  l 2j 2    l 2jm  j e
COV ( X j , X s )  l j1lr1  l j 2lr 2    l jmlrm
(2) COV ( X , F )  L ou COV(X j ,Fk )  l jk
O modelo X-μ=LF+ é linear nos fatores comuns. Se as p
variáveis originais são de fato relacionadas aos fatores
subjacentes, mas a relação não é linear, então a estrutura
de covariância obtida para  pode não ser mais adequada.
MODELO FATORIAL ORTOGONAL


A porção da variância da j-ésima variável
contribuída pelos m fatores comuns é
chamada de COMUNALIDADE.
A porção de Var(Xj)=σjj devida ao fator
específico é chamada variância específica,
outro termo também usado é uniqueness.
Var( X j )   jj  l 2j1  l 2j 2   l 2jm  j  h2j  j , j  1,2,..., p
ANÁLISE FATORIAL





O modelo fatorial assume que as p+p(p-1)/2=p(p+1)/2 variâncias e
covariâncias de X podem ser reproduzidas pelas pm cargas e p
variâncias específicas (uniqueness).
Quando m=p, qualquer  pode ser reproduzida exatamente por LLT tal
que =0.
Porém, quando m<<p, a análise fatorial é mais útil. Nesse caso o
modelo fatorial fornece uma explicação simples da estrutura de
covariância de X com poucos parâmetros em relação aos p(p+1)/2
parâmetros originais em .
Por exemplo, se p=12 e m=2, p(p+1)/2=78 e pm+p=36.
Observação: a maioria das matrizes de covariância não pode ser
escrita na forma: =LLT+ com m<<p.
Análise Fatorial

Quando m>1, existe uma ambigüidade
associada com o modelo fatorial. Para
verificar essa característica faça Q uma
matriz ortogonal de ordem pxp, tal que
QQT=I. X    LF    (LQ)Q F    L F   , com
T
*
*
L*  LQ e F  QT F .
Como
*
E[ F ]  0 e COV ( F )  I ,
*
*
é impossível, com base nas observações em X, distinguir as cargas
em L das cargas em L*.
Análise Fatorial



Conclusão: os fatores F e F*=QTF possuem as
mesmas propriedades estatísticas e, apesar das
cargas em L* serem diferentes das cargas em L,
ambas gerarão a mesma matriz de covariância ,
isto é:
LLT+LQQTLT+L*(L*)T+.
Essa ambigüidade fornece fundamentos para os
“fatores de rotação”, pois matrizes ortogonais
correspondem à matrizes de rotação (e reflexões)
do sistema de coordenadas de X.
Análise Fatorial





As cargas dos fatores L são determinadas somente através da matriz
ortogonal Q tal que L*=LQ e L ambas fornecem a mesma
representação.
As comunalidades dadas pelos elementos da diagonal de (LLT=L*(L*)T)
também não são afetadas pela escolha de Q.
A análise do modelo fatorial prossegue com a imposição de condições
que permitam a estimação de L e  de forma única.
Obtidas as estimativas, a matriz L é então rotacionada de modo que a
matriz de rotação Q é escolhida por algum critério de “facilidade de
interpretação”.
Uma vez que cargas e variâncias específicas são obtidas, fatores são
identificados e valores dos fatores são estimados para cada
observação. Esses valores são chamados escores dos fatores.
Análise Fatorial: Métodos de Estimação



Sejam x1, x2, ..., xn n observações sobre p
variáveis correlacionadas.
“O modelo de análise fatorial (ANFAT) com
um pequeno número de fatores representa
os dados de forma adequada?”
Em essência: lidamos com esse problema de
modelagem verificando a relação LLT+.
Análise Fatorial: Métodos de Estimação



A matriz de covariância amostral S é um estimador
não tendencioso de .
Se os elementos fora da diagonal de S são
pequenos ou as correlações amostrais em R são
desprezíveis, as variáveis não são correlacionadas
e o modelo ANFAT não será útil.
Nessas circunstâncias, os fatores específicos
tomam o papel dominante, enquanto que o foco
principal da ANFAT é determinar poucos, porém,
importantes, fatores comuns às p variáveis originais.
Análise Fatorial: Métodos de Estimação




Se  parece desviar-se significativamente de uma matriz
diagonal, então ANFAT pode ser considerada e o problema
inicial será de estimar as cargas dos fatores, ljk , e as variâncias
específicas (uniqueness), j.
Os métodos mais populares de estimação em ANFAT são o
método das componentes principais e o método da máximaverossimilhança.
A solução obtida qualquer que seja o método empregado
pode ser rotacionada de modo a facilitar a interpretação dos
fatores.
É sempre prudente tentar mais de um método. Se, de fato, o
modelo ANFAT for adequado aos dados, as soluções obtidas
por métodos distintos serão consistentes umas com as
outras.
Método das componentes
principais
Sejam   Var ( X ) e ( j , e j )
os paresde aut o - valores,aut o - vet oresde  com
1  2  ...   p  0. Ent ão
Σ  1 e1 e1  2 e 2 e 2  ...   p e p e p 
T


1 e1
T
2 e 2
T

 1 e1T 

T 
2 e 2 

p e p 
 

T 
  p e p 

Método das componentes principais





A última equação ajusta  por
=LLT+0=LLT. (*)

Exceto pelo fator de escala
, asj cargas do j-ésimo fator
serão os coeficientes da j-ésima CP.
Apesar da representação ANFAT de  em (*) ser exata, ela não é
particularmente útil.
Ela emprega tantos fatores comuns quantas são as variáveis
originais do problema, não permitindo variações nos fatores
específicos j, j=1,2,...,p.
É preferível um modelo que explique a estrutura de covariância
em função de poucos fatores comuns.
Método das componentes principais

Uma abordagem aqui, quando os últimos (p-m) auto-valores são
bem pequenos, é desprezar a contribuição de
para  .
m1 em1 eTm1  m2 em2 eTm2  ...   p e p eTp
Desprezando essa contribuição, obtemos:

  1 e1
2 e 2 
com L de dimensão pxm.
 1 e1T 

T 

e
m e m  2 2   LLT
  

T
 m e m 

Método das componentes principais



A representação de  obtida assume que os fatores
específicos são de menor importância e podem ser
ignorados na decomposição da matriz.
Se fatores específicos são incluídos no modelo,
suas variâncias podem ser tomadas como os
elementos da diagonal de -LLT.
Permitindo fatores específicos a aproximação tornase

  LLT    1 e1
2 e 2 
 1 e1T   1 0

T  
2 e 2   0  2

m e m

    

T  
 m e m   0 0

 0
 0 
  

  p 
m
com j   jj   l 2jk para j  1,2,..., p.
k 1
Para aplicar essa abordagem a um conjunto de n observações
x
x1, x2, ..., xn sobre p variáveis correlacionadas é costume primeiro
subtrair das observações o vetor de média amostral
.
Lembre que as observações centradas têm a mesma matriz
covariância amostral S.
Método das componentes
principais




Nos casos em que as variáveis apresentam ordens de magnitude muito
diferentes, geralmente é preferível trabalhar com a matriz de correlação
amostral R.
A padronização evita problemas de se ter uma variável com variância
grande comparada à magnitude das demais variâncias, influenciando
fortemente a determinação das cargas dos fatores.
A decomposição obtida, quando aplicada à matriz de covariância
amostral S ou à matriz de correlação amostral R é conhecida como
solução de componentes principais.
O nome é devido ao fato de que as cargas dos fatores são os
coeficientes, amenos de uma constante de proporcionalidade, das
primeiras CP’s.
Solução do método das CP’s

A ANFAT via método das CP’s da matriz S é
especificada em função de seus pares de
auto-valores, auto-vetores
(ˆ j , eˆ j ),
j  1,2,..., p com ˆ1  ˆ2  ...  ˆp  0.
Seja m<p o número de fatores comuns. A matriz estimada
das cargas dos fatores é dada por:
~
L   ˆ1 eˆ1

ˆ2 eˆ 2 
ˆm eˆ m .

Solução do método das CP’s

As variâncias específicas estimadas são
fornecidas pelos
elementos da diagonal de
~~
S  L LT talque Ψˆ  diag{ˆ1 ,ˆ 2 ,...,ˆ p }
com
m
~
ˆ j  s jj   l jk2 .
k 1
As comunalidades são estimadas por
~2 m ~2
h j   l jk .
k 1
Solução do método das CP’s



A ANFAT via CP’s da matriz de correlação amostral R é obtida
usando-se R no lugar de S.
Na solução via CP’s, as cargas estimadas dos fatores não se
alteram se aumentarmos o número de fatores a serem
considerados.
Pela definição de ,os
ˆ j elementos da diagonal de S serão
iguais aos elementos da diagonal de
~ ~T ˆ
L L  .
Quantos fatores reter?



Se o número de fatores não é determinado por considerações a
priori, tais como pela teoria subjacente aos dados ou o trabalho
de outros pesquisadores, a escolha de m pode ser baseada nos
auto-valores estimados da mesma forma que em ACP.
Considere a matriz residual
~ ~são
~
T
Os elementos da diagonal dessaSmatriz
nulos
outros
 L L   e se os(I)
elementos dessa matriz forem pequenos, podemos
subjetivamente considerar como apropriado o modelo ANFAT a
m fatores.


Quantos fatores reter?

Analiticamente, tem-se:
Soma de quadrados das
entradas da matriz residual
 

~ ~T ~
S  L L    λˆm2 1  λˆm2 2    ˆ2p (II)
Conseqüentemente, um valor pequeno da soma de quadrados
dos auto-valores desprezados, implica num valor pequeno da
soma de quadrados dos erros de aproximação.
De modo ideal, as contribuições dos primeiros poucos fatores às
variâncias amostrais das variáveis deve ser grande. A contribuição
para a variância amostral sjj do primeiro fator comum é l 2
j1
Quantos fatores reter?

A contribuição total para a variância amostral
tr(S)= s11+ s22+...+ spp devido ao primeiro fator é:
T
lˆ  lˆ  ...  lˆ   ˆ1 eˆ1   ˆ1 eˆ1   ˆ1 ,

 

2
11
2
21
2
p1
A proporção da variação total devida ao j-ésimo
fator é:  ˆ j
, para ANFAT via S

 tr ( S )
 ˆ
  j , para ANFAT via R
 p
Quantos fatores reter?


O número de fatores retidos no modelo vai
aumentando até que uma “proporção
adequada” da variação total amostral seja
explicada.
Outra regra também usada, quando a ANFAT
é via R, é fazer m igual ao número de autovalores maiores que 1.
Método da máximaverossimilhança


Se os fatores comuns F e os fatores
específicos  podem ser supostos como
normalmente distribuídos, então as
estimativas de máxima-verossimilhança das
cargas dos fatores e das variâncias
específicas podem ser obtidas.
Quando Fj e j são conjuntamente normais as
observações
X i    LF i   i
Função de verossimilhança sob normalidade
 1  1 n
T
T 
L(  , )  (2 ) |  | exp tr   ( x i  x )(x i  x )  n( x   )(x   ) 
i 1

 2 
( n 1) p
( n 1)


 1  1 n
T 
2
2
 (2 )
||
exp tr   ( x i  x )(x i  x ) 
i 1

 2 
 (2 )

np
2

p
2

||

n
2
1
2
 n

exp ( x   ) 1 ( x   )T 
 2

A f.v. depende de L e  através de LLT+.
Método da máxima-verossimilhança


O modelo ainda não está bem definido
devido à multiplicidade de escolhas para L.
É desejável impor condição de unicidade:
LT  1 L  
deve ser uma matriz diagonal.
Observação: No pacote R, a função factanal (factor analysis)
Sempre ajusta o modelo ANFAT usando o método da
máxima-verossimilhança.
Download

MODELO FATORIAL ORTOGONAL