Gleiph Ghiotto Lima de Menezes Definição Aprender Ficar sabendo, reter na memória, tomar conhecimento. (Michaelis) Pesquisas: ML e MAS ML SMA Pesquisas: ML e MAS Inteligência esta diretamente ligada a autonomia, com o objetivo de tomar decisões de forma independente. Pesquisas: ML e MAS Domínio desconhecido Aprender Aprendizado Distribuído Agente Agente Hipótese Agente Agente Agente Comunicação? Cooperação? Algoritmos? Aprendizado de um agente Vs Multi-agente Algoritmos voltados para um agente Agente simples: individual Multi-agente: interação com os vizinhos Um caso: Agente que não esta ciente de outros agentes (agente simples) Quando utilizar aprendizado distribuido? Aprendizado On-line Vs Off-line Métodos On-line (incremental) Calcula novas hipóteses Base de treinamento Métodos Off-line Case de treinamento que representa um momento no tempo Aplicações Aprendizado reativo Em sistemas reativos, o comportamento global surge a partir de interação de comportamentos individuais. indivíduos trabalham em informações baseadas em valor que foi produzido de um convívio social. Q-Learning Agente com pouco conhecimento Baseia-se na reposta do ambiente Aprendizado reativo Aprendizado baseado em lógica Aprendizado Baseado em Explicação Lógica de Programação Indutiva Aprendizado Baseado em Explicação Muito utilizado em IA para aumento de desempenho Adquirem conhecimento Regras em relação a um evento Problemas similares podem ter diferentes soluções Lógica de Programação Indutiva Calcula hipótese indutivas a partir de bases de treinamento Conhecimento do Domínio Respostas LPI Definição Exemplos de treinamento ABE e LPI O uso destas duas técnicas combinadas tem demonstrado bons resultados Aprendizado Social População já formada Benefício das experiências de outros agentes Recém nascido Agentes Reais X Agentes de Software Prós e Contras Detector de spans Professor Aprendizado Social Condições nas quais será vantajoso para os indivíduos a aprender com os outros em vez de descobrir coisas por si mesmos Modelos de transmissão cultural Na transmissão de geração Pastoreio comportamento Aprendizado Social Quando o Aprendizado Social é o mais recomendado? Opinião Coletiva Risco financeiro Agentes de software tomem decisão que envolva gasto financeiro para o dono Situações com grau de dinamismo intermediário ○ Caso de pequeno e grande dinamismo. Mecanismos para Aprendizado Social As que mais de destacam são as de imitação Dificuldades Mecanismos de Aprendizado Social Contagious behaviour Stimulus enhancement Observational learning Matched-dependent behaviour Cross-modal matching Contagious behaviour “Se os outros fogem, fuja também” Um comportamento como gatilho inicial Conjunto de Aves Stimulus enhancement “Seguir alguém mais velho que você e aprender tudo o que acontece” Criança seguindo o comportamento dos pais Observational learning “Preste atenção àquilo que os outros estão fazendo e experimentando, e se os resultados para eles parecem ser bons ou maus, em seguida, aprender com isso.” Macacos em uma jaula. Observational learning "Preste atenção ao que os outros estão comendo e faça o mesmo." Ratos Matched-dependent behaviour Um exemplo é quando os animais são treinados para determinada ação realizar uma tarefa Ratos e Pombos Cross-modal matching Imitação dos sons de aves “Se alguém move sua cabeça, então faça o mesmo movimento”. Conclusão A capacidade de aprendizado é essencial para sistemas inteligentes, especialmente em SMA. Agentes Baseados em Lógica, vantagem devido a sua facilidade de aprendizado. Bibliografia Learning in Multi-Agent Systems Safe learning agents? Logic-based agents! Duvidas Aprendizado em SMA com BDI Introdução Sucesso em aplicações Diagnósticos para espaços lineares Dificuldades Carência de aprendizado em SMA. Maneira de tratar a complexidade de agentes e SMA. Aprendizado em SMA pode auxiliar no entendimento de sistemas naturais e artificiais. Agência BDI Agente de Software Sistema de computador que comportamento flexível e autônomo. exibe O Modelo BDI Beliefs (p-state r1 ok) (p-at sander free) (p-at board free) (p-handfree r1 left) (p-handfree r1 right) (p-at sprayer free) O Modelo BDI Desires (achieve(p-sander board)) O Modelo BDI Intentions (achieve(p-sander board)) O Modelo BDI Planos O Modelo BDI Pilha de Eventos Percepções do agente são mapeados em eventos que são empilhados. Agentes BDI Aprendendo Quais elementos da performance são melhorados? Agentes podem aprender sobre o contexto do plano Não aprendem sobre o plano, mas sim quando usa-lo Agentes BDI Aprendendo Qual representação é utilizada por estes elementos? Fórmulas de crença ○ Literais de primeira ordem Fórmulas de situação ○ Anteriores mais, conjunções e disjunções Agentes BDI Aprendendo Qual retorno é disponível? Ter retorno sobre as respostas dos planos ○ Sucesso ou fracasso ○ log Agentes BDI Aprendendo Qual a principal informação disponível? Biblioteca de planos Rastro de predicados, funções e suas assinaturas Agentes BDI Aprendendo É um caso de aprendizado centralizado ou distribuído? Nível 1 ○ Interações com o ambiente Nível 2 ○ Interações com outros agentes, mensagens Nível 3 ○ Observação de outros agentes Árvore de Decisão Gera Nó (conj. de registros, lista de atributos independentes) Verificar a quantas classes distintas pertencem os registros desta partição dos dados; Se número de classes > 1 Se atributos independentes restantes > 0 Escolher o atributo independente adequado para representar o nó corrente; Para cada possível valor do atributo independente que representa o nó corrente: Gera Nó (respectiva partição, atributos independentes restantes); Senão Criar folha com a classe predominante e sua taxa de erro; Senão Criar folha com a respectiva classe (taxa de erro=0) Árvore de Decisão Salário 5.000 5.000 Idade B 40 40 T. Empr. C Ind., Pesq. B Autônomo A Exemplo (acheive (p-sanded board)) Conjunto de treinamento Fundamento teórico Configuração da ACE, aprendizado a partir de um sistema de interpretação Exemplo .kb Exemplo .kb Exemplo rmode? Determina a linguagem #? Variáveis locais +? Variáveis que devem ser instanciadas .kb Exemplo Compact notation of pruned tree: plan_context(A,B) ? +--yes: p_state(A,painted) ? | +--yes: [failure] [2.0/2.0] | +--no: [success] [3.0/3.0] +--no: [succes] [1.0/1.0] Learning in BDI Multi-agent Systems 197 Equivalent logic program: n1:-plan_context(A,B). n2:-plan_context(A,B),p_state(A,painted). class([failure]):-plan_context(A,B),p_state(A,painted). class([succes]):-not(n1). class([succes]):-plan_context(A,B),not(n2). [teste/acertos] Conclusões Bibliografia Learning in BDI Multi-agent Systems Gleiph Ghiotto Lima de Menezes