Redes de Funções de Base Radial
Radial Basis Functions (RBFs)
Germano C. Vasconcelos
Centro de Informática - UFPE
©2000 Germano Vasconcelos
Introdução
“Em uma RBF, a rede é definida do ponto de vista de
um problema de aproximação de funções”
Uma superfície F no espaço multidimensional é
definida como uma combinação linear de funções
de base radial
F  comb. linear de funções de base radial
©2000 Germano Vasconcelos
Estrutura de uma RBF
camada intermediária
camada
de entrada
x1
x2
Cj
1|X-C1|
w1
2|X-C2|
3|X-C3|
w2
camada
de saída
w3
Y=F(X)
F(X)=jwj.j|X-Cj|
wk
xn
w0
k|X-Cn|
bias
©2000 Germano Vasconcelos
Características das RBFs
• Estrutura do tipo feedforward com uma mistura de
treinamento supervisionado e não-supervisionado
• Normalmente uma camada de neurônios que
computam as funções de base radial
• Os pesos na camada intermediária representam
centroids
• Os pesos na camada de saída ponderam as saídas
da camada intermediária
©2000 Germano Vasconcelos
Características das RBFs
• São aproximadores universais de funções
• Estimam a probabilidade a posteriori do
ponto de vista Bayesiano
• Apresentam requerimentos de memória em
geral mais altos que redes do tipo MLP
©2000 Germano Vasconcelos
Características das RBFs
• Estratégias de treinamento diferentes para as
funções radiais, os centroids e os pesos da camada
de saída
• Regra de propagação = função radial
Ex: Distância Euclideana  netj = |X-C| =  (xi - ci)2
• Função de ativação = função local
Ex: Gaussiana  oj = f(netj) = exp(- netj2/cj2)
©2000 Germano Vasconcelos
Trabalhos com RBFs
•
•
•
•
Broomhead & Lowe (1988)
Moody & Darken (1989)
Poggio & Girosi (1990)
Niranjan & Fallside (1990)
E muitos outros ...
©2000 Germano Vasconcelos
Treinamento
• Três conjuntos de parâmetros a serem
estimados
• As larguras d das funções básicas
• Os centros Cj
• Os pesos Wji da camada de saída
©2000 Germano Vasconcelos
As Larguras d
• Valor definido a priori
• Técnica de gradiente descendente
• Heurística do vizinho mais próximo
©2000 Germano Vasconcelos
Os Centros Cj
• Distribuir uniformemente ou aleatoriamente
• Tomar uma amostra do conjunto de
treinamento
• Método não supervisionado de agrupamento
(clustering)
• Gradiente descendente
©2000 Germano Vasconcelos
Pesos Wji na Camada de Saída
• Processo de otimização linear
• Solução de mínimo global
Esquema de Correção
de Erros
Procedimento direto
©2000 Germano Vasconcelos
Mínimo Erro
Quadrado (LMS)
Newton-like
Method
Manipulação de
matrizes
Manipulação de Matrizes
(Pseudo-inverse method)
E[f] =  np (yp – f(xp ))2
\
f(xp) =  wj.  (|xp – cj|)
W = (GT . G +  Go )-1
onde...
©2000 Germano Vasconcelos
. GT.
Y
G=
 (|x1 – c1|)  (|x1 – c2|) ... (|x1 – c3|)
 (|x2 – c1|)  (|x2 – c2|) ... (|x2 – ck|)
 (|xp – c1|)  (|xp – c2|) ... (|xp – ck|)
Go =
 (|c1 – c1|)  (|c1 – c2|) ... (|c1 – c3|)
 (|c2 – c1|)  (|c2 – c2|) ... (|c2 – ck|)
 (|cp – c1|)  (|cp – c2|) ... (|cp – ck|)
©2000 Germano Vasconcelos
Treinamento por Gradiente
Descendente
ej = dj – F (X)
= dj -  wi.  (||xi – ti||ci)
1. Camada de saida
 E(n)/ Wi(n) = ej(n).  (||xi – ti(n)||ci)
Wi (n+1) = Wi(n) - 1  E(n)/ Wi(n) i=1,2…,M
©2000 Germano Vasconcelos
Treinamento por Gradiente
Descendente
2. Centros
 E(n)/ ti(n) = 2 Wi ej(n). ’(||xj – tj(n)||ci) -1 [xj – tj(n)]
ti (n+1) = ti(n) - 2  E(n)/ ti(n) i=1,2…,M
©2000 Germano Vasconcelos
Treinamento por Gradiente
Descendente
3. Larguras das funções
 E(n)/  -1 i(n) = -Wi ej(n). ’(||xj – tj(n)||ci) Qji(n)
Qji(n) = [xj – ti(n)] [xj – ti(n)] T
ci-1i (n+1) = -1i (n) - 3  E(n)/  -1i (n) i=1,2…,M
©2000 Germano Vasconcelos
RBFs Construtivas
• Um conjunto de modelos RBFs tem sido
desenvolvidos dentro do paradigma
construtivo...
• DDA (Dynamic Decay Adjustment)
– Berthold & Diamond (1995)
©2000 Germano Vasconcelos
Princípio de Funcionamento do
Algoritmo DDA
B
+
A
novo padrão
de entrada - classe A
Ver Berthold & Diamond - NIPS’7
©2000 Germano Vasconcelos
Funcionamento do Algoritmo DDA
Ver Berthold & Diamond - NIPS’7
©2000 Germano Vasconcelos
Aplicações
•
•
•
•
•
•
•
•
Reconhecimento de voz
Diagnose médica
Reconhecimento de caracteres
Análise de crédito
Reconhecimento de alvos
Classificação de fonemas
Análise de crédito
Previsão e controle
©2000 Germano Vasconcelos
Um Problema Potencial com uma RBF
Considere a figura abaixo:
Mostre que é possível para uma RBF
com duas entradas, duas unidades
intermediárias e duas saídas definir
superfícies de decisão como
mostradas. Uma superfície fechada é
definida para uma das classes; para a
outra classe a superfície é aberta.
©2000 Germano Vasconcelos
Download

Aplicações de Redes Neurais - Centro de Informática da UFPE