ANÁLISE
DISCRIMINANTE
Objectivo:
Encontrar uma função discriminante que
permita distinguir grupos de amostras,
conhecidos a priori (traning set). Esta
função pode depois ser usada para
classificar amostras anónimas.
2
Habitualmente em Análise Discriminante
consideram-se dois grupos de indivíduos,
A e B, caracterizados por p propriedades.
Training set sobre o qual
assenta a discriminação
O objectivo é encontrar um eixo U (ou função discriminante, construída
como uma combinação linear das propriedades de partida) que maximize o
quociente de projecções (sobre U) entre a inércia inter-classes (B, de
Between) e a inércia intra-classes (W, de Within).
3
Seja a matriz de dados X, de termo geral xij, constituída por n indivíduos e por p
propriedades, segmentada em dois blocos A e B, de dimensão nA e nB:
j
p
1
1 n
x j   xij
n i
é a média geral por coluna
1 nA
x Aj   xij
nA i
é a média geral por coluna em A
1 nB
xBj   xij
nB i
é a média geral por coluna em B
A
X
nA
i
1
B
nB
n=nA+nB
Centros de gravidade
4
A matriz B tem como termo geral









nA
nB
b jj ' 
x Aj  x j x Aj '  x j ' 
xBj  x j xBj '  x j '
n
n

A matriz W tem como termo geral


nB

1  nA
wij '   xij  x Aj xij '  x Aj '   xij  xBj xij '  xBj ' 
n i
i

5
Os eixos discriminantes serão calculados de modo a maximizar o quociente entre a inércia inter-grupos
e a inércia intra-grupos.
Pelo Teorema de Huygens, maximizar B/W é o mesmo que maximizar B/T, onde T é a matriz de
inércia (matriz variância-covariância) de X, de termo geral:


1 n
tij '   xij  x j xij '  x j '
n i

A solução do problema discriminante para variáveis quantitativas, é dada pela diagonalização da
matriz T-1B, cujo vector próprio é U e cujo valor próprio mede o poder discriminante e é dado por:
U ' BU

U ' TU
A matriz T tem uma função meramente normativa, para que  esteja contido em [0,1]. Quanto mais
próximo  for de 1, maior a parte da inércia total T que é explicada por B, e mais “perfeita” é a
discriminação.
6
Caso da Discriminação em 2 Classes:
Para o caso da matriz X estar segmentada apenas em 2 classes (k=2), existe um só eixo discriminante
(U), o qual pode ser obtido sem diagonalizar T-1B.






nA
nB
b

x

x
x

x

xBj  x j xBj '  x j ' ), pode escreverAj
j
Aj '
j'
A matriz B (de termo geral: jj '
n
n
se, para o caso de duas classes de centros de gravidade Y1 e Y2 e efectivos n1 e n2, do seguinte modo:




n1n2
B  2 y1  y2 y1  y2
n
Fazendo em B o vector C dado por:
C 
n1  n2
n
y
1
 y2

vem,
B  CC '
7
Tomando agora a equação que dá U (T-1BU=U) e substituindo B por CC’, vem:
T-1CC’U=U
Pré-multiplicando por C’, vem:
C’T-1CC’U=C’U
C’T-1C
Em resumo, o problema da Análise Discriminante em duas classes resolve-se calculando:
C 
n1  n2
n
y
1
 y2

e
T-1
8