UPE – Caruaru – Sistemas de Informação Disciplina: Mineração de Dados Prof.: Paulemir G. Campos Redes Neurais Artificiais (Parte 2) 11/5/2015 MD - Prof. Paulemir Campos 1 Roteiro da Aula Redes Neurais Artificiais (RNAs): Principais Modelos Conexionistas e Aplicações Referências. 11/5/2015 MD - Prof. Paulemir Campos 2 Principais Modelos Conexionistas e Aplicações 11/5/2015 MD - Prof. Paulemir Campos 3 Introdução Há vários tipos de Redes Neurais Artificiais (RNAs); As principais RNAs são: 11/5/2015 MLP (Multilayer Perceptron); RBF (Radial Basis Function); ART (Adaptive Resonance Theory); SOM (Self-Organizing Maps); Redes Recorrentes; e, Redes Fuzzy. MD - Prof. Paulemir Campos 4 Redes MLP As Redes MLP (Multilayer Perceptron) geralmente são constituídas por: 11/5/2015 uma camada de entrada; uma ou mais camadas escondidas; e, uma camada de saída. MD - Prof. Paulemir Campos 5 Redes MLP Arquitetura de uma Rede MLP Direta com Duas Camadas Escondidas 11/5/2015 MD - Prof. Paulemir Campos 6 Redes MLP Redes MLP são treinadas usando aprendizado supervisionado; O algoritmo back-propagation é o mais popular utilizado no treinamento de redes MLP; 11/5/2015 MD - Prof. Paulemir Campos 7 Redes MLP O funcionamento do algoritmo backpropagation consiste de duas fases: 11/5/2015 a fase para frente: os pesos das conexões são mantidos fixos e propaga-se os valores dos nodos de entrada, camada-a-camada, para obter-se a saída da rede; a fase para trás: os pesos das conexões são ajustados, da camada de saída para a camada de entrada, de acordo com o erro (diferença entre a saída da rede e a saída desejada) atingido pela rede. MD - Prof. Paulemir Campos 8 Redes MLP Aplicações: Redes MLP treinadas com o algoritmo back-propagation foram aplicadas na solução de vários problemas difíceis, como: 11/5/2015 Diagnóstico médico; Detecção de falhas mecânicas; Previsão de séries temporais, etc. MD - Prof. Paulemir Campos 9 Redes RBF Uma rede RBF (Radial Basis Function) é do tipo direta, assim como uma MLP, e contém três camadas com regras bem distintas: 11/5/2015 Camada de entrada: composta pelos atributos de entrada de um conjunto de dados; Uma única camada escondida: formada por funções de base radial, geralmente Gaussiana, responsáveis por efetuar uma transformação nãolinear do espaço de entrada para o espaço da camada escondida; MD - Prof. Paulemir Campos 10 Redes RBF Uma rede RBF (Radial Basis Function) é do tipo direta, assim como uma MLP, e contém três camadas com regras bem distintas (Cont.): 11/5/2015 E, camada de saída: fornece a resposta da rede, resultante de uma combinação linear (somatório, por exemplo) do produto dos valores de saída dos nodos escondidos pelos seus respectivos pesos com o nodo da camada de saída. MD - Prof. Paulemir Campos 11 Redes RBF Arquitetura de uma Rede RBF Onde: x é o vetor de entrada; i são as m funções de base radial de cada nodo escondido; e wi os pesos de cada nodo escondido com o nodo de saída. 11/5/2015 MD - Prof. Paulemir Campos 12 Redes RBF Aplicações: 11/5/2015 As redes RBF foram primeiramente utilizadas na solução de problemas de interpolação multivariado; Atualmente, a aplicação de redes RBF em análise numérica tornou-se um significativo campo de pesquisas. MD - Prof. Paulemir Campos 13 Redes ART As redes ART (Adaptive Resonance Theory), diferentemente das redes MLP e RBF, empregam aprendizado nãosupervisionado de forma competitiva para gerar clusters (agrupamentos) a partir do conjunto de dados de entrada. 11/5/2015 MD - Prof. Paulemir Campos 14 Redes ART Aprendizado em redes ART: 11/5/2015 Em função do grau de similaridade entre um padrão de entrada e os padrões contidos nos clusters da rede, um cluster é escolhido e apenas os seus pesos são ajustados; Caso esse grau de similaridade não supere um certo limiar, de modo que nenhum cluster seja ativado, um novo cluster é criado para acomodar o padrão da entrada da rede. MD - Prof. Paulemir Campos 15 Redes ART Onde: F1-a é a camada de entrada; F1-b é a camada de interface; F2 é a camada de clusters ou camada de saída; R (reset) é um nodo para controlar o grau de similaridade dos padrões localizados num mesmo cluster; G1 e G2 são nodos conectados às camadas F1 e F2 da rede para prover um controle do processo de aprendizagem Arquitetura Básica de uma Rede ART1 11/5/2015 MD - Prof. Paulemir Campos 16 Redes ART Aplicações de Alguns Modelos: 11/5/2015 Rede ART1: processa apenas padrões de entrada binários; Rede ART2: capaz de processar padrões de entrada com valores contínuos; Rede ARTMAP: uma rede mais sofisticada que permite aprendizado incremental supervisionado. MD - Prof. Paulemir Campos 17 Redes SOM Uma rede SOM (Self-Organizing Maps) ou Mapas de Kohonen é identificada pela formação de um mapa topográfico dos padrões de entrada; As localizações espaciais dos nodos disparados neste mapa são um indicativo de características estatísticas intrínsecas contidas nos padrões de entrada. 11/5/2015 MD - Prof. Paulemir Campos 18 Redes SOM Semelhante às redes ART, as redes SOM são baseadas numa aprendizagem não-supervisionada competitiva, em que os nodos da camada de saída competem entre si resultando em apenas um nodo vencedor (winner takes all neuron). 11/5/2015 MD - Prof. Paulemir Campos 19 Redes SOM O principal objetivo de uma rede SOM é transformar os sinais de um padrão de entrada de dimensão arbitrária num mapa discreto uni ou bidimensional; Por esta razão, as redes SOM também são denominadas mapas de características. 11/5/2015 MD - Prof. Paulemir Campos 20 Redes SOM Arquitetura de uma Rede SOM Bidimensional 11/5/2015 MD - Prof. Paulemir Campos 21 Redes SOM Aplicações: As redes SOM foram bem aplicadas na solução de problemas como: 11/5/2015 geração de música por computador; reconhecimento de caracteres; seleção de características; e, no bem conhecido problema do caixeiro viajante (traveling salesman problem). MD - Prof. Paulemir Campos 22 Redes Recorrentes São RNAs com um ou mais caminhos de realimentação (feedback loops); Por exemplo, considerando-se uma rede MLP, várias arquiteturas de redes recorrentes podem ser obtidas construindo-se caminhos de realimentação dos nodos de saída e/ou dos nodos escondidos para os nodos de entrada. 11/5/2015 MD - Prof. Paulemir Campos 23 Redes Recorrentes Os caminhos de realimentação habilitam as redes recorrentes a registrarem temporariamente estados definidos pelos espaços de entrada e saída da rede. 11/5/2015 MD - Prof. Paulemir Campos 24 Redes Recorrentes Redes Recorrentes são utilizadas basicamente com duas finalidades: Memórias Associativas: Redes de Mapeamento Entrada-Saída: 11/5/2015 Redes de Hopfield; e, BAM (Bidirectional Associative Memory). Redes NARX; Rede de Elman; MLP Recorrente; e, Rede Recorrente de Segunda Ordem. MD - Prof. Paulemir Campos 25 Redes Recorrentes Aplicações: Redes Recorrentes são bastante úteis em diversas aplicações, como: 11/5/2015 modelagem e predição não-linear; equalização adaptativa de canais de comunicação; processamento de voz; e, diagnóstico de motores automotivos. MD - Prof. Paulemir Campos 26 Redes Fuzzy Compreende todas as redes neurais que empregam conceitos da lógica fuzzy em sua concepção; Usualmente, redes fuzzy apresentam a topologia de uma rede MLP direta com pesos, propagação e funções de ativação diferentes de redes comuns ou não-fuzzy. 11/5/2015 MD - Prof. Paulemir Campos 27 Redes Fuzzy Por exemplo, a seguir é apresentada uma rede fuzzy com três camadas onde: 11/5/2015 suas unidades usam operadores de conjuntos fuzzy (união ou interseção) ao invés das funções de ativação normalmente utilizadas por RNAs; os pesos são conjuntos fuzzy; e, a camada escondida representa regras fuzzy. MD - Prof. Paulemir Campos 28 Redes Fuzzy Onde: 1(1), 2(1) e 3(1) representam conjuntos fuzzy definidos para a entrada x1 1(2), 2(2) e 3(2) representam conjuntos fuzzy definidos para a entrada x2 Exemplo de Rede Fuzzy 11/5/2015 MD - Prof. Paulemir Campos 29 Redes Fuzzy Outros modelos conexionistas também estão sendo fuzzyficados, como: 11/5/2015 Redes SOM; e, Redes ART. MD - Prof. Paulemir Campos 30 Redes Fuzzy A motivação para o crescente interesse no desenvolvimento de redes fuzzy deve-se as seguintes vantagens sobre as redes tradicionais: 11/5/2015 Servem como ferramentas de engenharia do conhecimento e estatísticas; São relativamente resistentes ao “esquecimento catastrófico”, isto é, tendem a não “esquecerem” o conhecimento adquirido quando necessitam treinarem com novos dados; MD - Prof. Paulemir Campos 31 Redes Fuzzy A motivação para o crescente interesse no desenvolvimento de redes fuzzy deve-se as seguintes vantagens sobre as redes tradicionais (Cont.): 11/5/2015 Interpolam e extrapolam bem em regiões onde os dados são esparsos; E, aceitam tanto dados de entrada reais quanto fuzzy. MD - Prof. Paulemir Campos 32 Referências Braga, A. P.; Ludermir, T. B. e Carvalho, A. C. P. L. F. Redes Neurais Artificiais: Teoria e Aplicações. Editora LTC, 2000. Notas de aulas da Profa. Teresa B. Ludermir do CIn/UFPE. 11/5/2015 MD - Prof. Paulemir Campos 33 Referências Fausett, L. V. Fundamentals of Neural Networks: Architectures, Algorithms, and Applications. New Jersey, Prentice-Hall, 1994. Haykin, S. Neural Networks, A Comprehensive Foundation. 2nd ed. Prentice Hall, 1999. 11/5/2015 MD - Prof. Paulemir Campos 34 Referências Zurada, J. M. Introduction to Artificial Neural Systems. St. PaulMN, USA, West Publishing Company Inc., 1992. 11/5/2015 MD - Prof. Paulemir Campos 35