9.641 Redes Neurais
Conjunto de Problema 5: PCA e redes lineares
1. Análise do componente principal (PCA) usando dados MNIST.
(a) Use o comando cov para calcular a diferença comum entre todos os “dois” em mnistabridged.mat. Em seguida,
use o comando eig para encontrar os eigenvetores e os eigenvalores. Exiba os dez eigenvetores correspondentes aos
dez maiores eigenvalores. Estes são os principais componentes e devem ser exibidos como imagens.
(b) Usar o comando eig não é eficaz, porque ele busca todos os eigenvetores em vez apenas dos que você quer.
Mostre que repetir
Cx
x :=
|Cx|
converge no eigenvetor principal de quase todas as condições iniciais. Simule-o numericamente e verifique que
o resultado é o mesmo que o eigenvetor principal obteve usando eig.
2. Considere as duas redes lineares de neurônio
dx1
+ x1
τ
dt
dx2
+ x2
τ
dt
com
=
b1 + W11 x1 + W12 x2
(1)
=
b2 + W21 x1 + W22 x2
(2)
W =
�
�
−1/4 1
1/2 1/4
(3)
(a) Calcule a reação do estado estacionário de b1 = 1 e b2 = 2 resolvendo a equação linear (I − W )x = b para
x.
(b) Ache os eigenvalores de W . Quais são os ganhos dos eigenmodos correspondentes?
(c) Ache os eigenvetores esquerdos e direitos de W . Por W não ser simétrico, os eigenvetores esquerdo e direito
são diferentes um do outro. Você observará modos comuns e diferenciais, mas eles não são tão simples quanto
os que deduzimos em aula para um par reciprocamente inibitório.
(d) Use os eigenvetores e os eigenvalores para fatorar W como SΛS −1 .
(e) Agora, calcule a reação do estado estacionário nas três etapas a seguir. Você deve receber a mesma resposta
que recebeu ao resolver (I − W )x = b, porque (I − W ) −1 = S(I − Λ)−1 S −1 .
i. Expresse b como uma combinação linear de eigenvetores direitos.
ii. Multiplique os coeficientes desta combinação linear pelos ganhos apropriados.
iii. Use estes resultados para reunir os eigenvetores direitos, produzindo a reação do estado estacionário x.
3. Considere a rede linear constante de neurônios N através da rotação
τ
N
�
dxi
+ xi = bi +
Wij xj
dt
j=1
onde W é uma matriz circulante

w0
 w1

W =
 .
 .
wN −1
wN −1
w0
w1
.
wN −2
1
dx
+ x = b + Wx
dt
ou
τ
.
.
.
.
.
w1
wN −1
w0
.
.

w1

w2 

. 
wN −1 
w0
(4)
(5)
Esta fórmula significa que a força da interação entre dois neurônios depende somente de sua separação, se você imaginar
que os neurônios são organizados de forma seqüencial em volta de u m a n e l . O vetor b consiste em entradas N para os
neurônios, e o vetor x consiste em atividades neurais N. Vamos seguir a convenção que indica executar de 0 a
N − 1, de forma que x 0 , . . . , xN −1 sejam as atividades neurais etc.
(a) Defina N th da raiz da unidade z = exp(2πi/N ) e a matriz de Fourier Fmn = z mn . Os modos de Fourier
são definidos como vetores da coluna F . Mostre que os modos de Fourier são eigenvetores de W e ache os
eigenvalores desses modos em função do registro na matriz circulante.
(b) Considere o exemplo do acoplamento vizinho mais próximo. Neste exemplo especial, w1 = wN −1 = c enquanto o
resto da matriz circulante é zero. Para quais valores de c a rede é estável? Nas perguntas a seguir, restrinja c
a estes valores.
(c) Limite-se ao exemplo inibitório c < 0.
i. Resolva o estado estacionário x = (I − W )−1 b quando houver uma entrada simples e todo o resto for zero
(reação ao impulso). Descreva de forma verbal e esboce graficamente as características qualitativas da solução.
ii. Represente graficamente os eigenvalores da matriz de ganho (I − W ) −1 como uma função do índice do modo
de Fourier (número de ondas). Quais modos são ampliados e quais são atenuados?
(d) Limite-se ao exemplo excitatório c > 0.
i. Resolva o estado estacionário x = (I − W )−1 b quando houver uma entrada simples e todo o resto for zero
(reação ao impulso). Descreva de forma verbal e esboce graficamente as características qualitativas da solução.
ii. Represente graficamente os eigenvalores da matriz de ganho (I − W ) −1 como uma função do índice do modo
de Fourier (número de ondas). Quais modos são ampliados e quais são atenuados?
2
Download

9.641 Redes Neurais Conjunto de Problema 5: PCA e redes lineares