Aprendizagem
Viviane Torres da Silva
[email protected]
http://www.ic.uff.br/~viviane.silva/isma
Introdução

Sistemas de aprendizagem são sistemas adaptáveis e com
técnicas de aprendizagem

O conjunto de situações é tão grande que não definimos todas
as possibilidades quando descrevemos o problema

Aprendizagem: melhora do comportamento futuro baseada na
experiência passada

Normalmente dizemos que se o agente inteligente então é
porque ele tem a capacidade de aprener. E se tem a capacidade
de aprender então é porque o agente é inteligente.
Aprendizagem

Aprendizagem de um agente
– O agente tem a capacidade de aprender e melhorar seu rendimento e o
rendimento do sistema

Aprendizagem do sistema multi-agente
– Não é simplesmente a soma da aprendizagem de todos os agentes do
sistema de maneira isolada
– A aprendizagem de um agente é influenciada pelos demais agentes
– Vários agentes podem aprender de uma maneira distribuída e interativa
como se fossem um único corpo
Categoria principal

Processo de aprendizagem: planejamento, inferência e passos
de decisões

Aprendizagem centralizado (aprendizagem isolada)
– Todos as etapas do processo de aprendizagem são executadas por um
único agente que não interage com os outros
– O agente é completamente independente dos outros

Aprendizagem descentralizada (aprendizagem interativa)
– Vários agentes estão envolvidos no processo de aprendizagem
– As atividades do processo de aprendizagem são executadas por
diferentes agentes
Características da aprendizagem

I/IV
Grau de descentralização
– Distribuição e paralelismo das atividades do processo de aprendizagem

Características especificas da interação
– Nível de interação (desde pura observação até diálogos complexos
como a negociação)
– Persistência da interação (desde pouca até muita)
– Freqüência da interação (desde pouca interação até muita)
– Padrão de interação (desde completamente não estruturada até
hierárquica)
– Variedade da interação (desde fixa até variável)

Características específicas do envolvimento
– Relevância do envolvimento
– Papel desempenhado na interação (generalista, aquele executa todas as
tarefas do processo de aprendizagem, ou especialista, que executa
somente algumas)
Características da aprendizagem

II/IV
Características específicas do objetivo
– Tipo de melhora que o agente deseja alcançar com a aprendizagem
– Compatibilidade entre os objetivos de aprendizagem dos agentes

Método ou estratégia de aprendizagem
– Aprendizagem direta (implantação do conhecimento sem necessidade de
inferência do aprendiz)
– Aprendizagem a partir de um conselho ou instrução (aprende quando
recebe um conselho, não foi una experiência do agente)
– Aprendizagem por exemplos ou práticas (extração ou refinamento do
conhecimento a partir de experiências positivas ou negativas)
– Aprendizagem por analogia (conhecimento adquirido a partir de
soluções de problemas similares)
– Aprendizagem por descoberta (conhecimento adquirido a partir de
observações, execuções de experimentos, teste de hipóteses,…)
Características da aprendizagem

III/IV
Reação da aprendizagem
– Aprendizagem inspecionada
• a resposta enviada pelo aprendiz especifica as atividades desejadas
• o objetivo da aprendizagem é encontrar as ações desejadas
– Aprendizagem por reforço
• a resposta somente informa a utilidade da atividade realizada pelo
aprendiz
• o objetivo da aprendizagem é maximizar a função de utilidade
– Aprendizagem não inspecionada
• Nenhuma resposta é fornecida
• O objetivo é encontrar atividades úteis e desejadas utilizando o
processo de tentativa e errp
Características da aprendizagem

IV/IV
Reação da aprendizagem
– As respostas à ações são fornecidas pelo ambiente ou por outros agentes
do sistema
– São eles que “ensinam” o agente no caso de aprendizagem inspecionada
– São eles que “criticam” o agente no caso de aprendizagem por reforço
– São eles que “observam” o agente no caso de aprendizagem não
inspecionada
Problema da atribuição de créditos e culpas

A resposta do ambiente e dos outros agentes avaliam o
comportamento do agente

A resposta dará crédito para os comportamentos bons e punirá
o agente por mal comportamento

Avaliação inter-agente:
– Avalia todo o comportamento em geral (varias ações de uma só vez)
– Problema no caso de sistemas multi-agente: Como saber qual agente
executou qual tarefa?

Avaliação intra-agente:
– Avalia uma determinada ação do agente
Problema da aprendizagem por reforço em SMA

Aprendizagem por reforço pode ser utilizada quando:
– Os agentes têm pouco ou nenhum conhecimento do domínio
– Os agentes têm pouca informação sobre as capacidades e os objetivos
dos outros agentes

Problemas:
– Pouca informação sobre os outros agentes torna a coordenação ainda
mais difícil
– Quando os agentes necessitam comunicar-se para coordenar-se, se a
qualidade da comunicação é má, a coordenação é afetada
Características da aprendizagem por reforço em SMA

Acoplamento entre os agentes:
– Uma ação de um agente pode afeta muito ou pouco os planos de outros
agentes

Relação entre os agentes
– Os agentes podem estar agrupados para alcançar um objetivo
– Os agentes interagem através do recurso que utilizam
– Os agentes tem interesses distintos

Tempo de resposta
– O tempo de resposta do ambiente depois que a ação foi executada pode
variar de um domínio para outro

Combinações de comportamentos
– Quantas combinações de comportamento irão encontrar um solução
ótima?
Exemplos
1.
Os agentes aprendem a empurrar uma caixa de um local ao local
objetivo
–
–
–
–
2.
Acoplamento entre os agentes: muito acoplados
Relação entre os agentes: cooperação ou competição
Tempo de resposta: imediato
Combinações de comportamentos: múltiplos comportamentos ótimos
Dois agentes que necessitam aprender a compartilhar um recurso
– Acoplamento entre os agentes: muito acoplados
– Relação entre os agentes: cooperação
– Tempo de resposta: com atraso (não sabem em um determinado momento
se estão fazendo bem)
– Combinação de comportamentos: único comportamento ótimo
Aprendendo a partir de outros agentes

Aprendendo os papéis de una organização:
– Os agentes necessitam aprender a executar de acordo com os papéis que
irão desempenhar
– Necessitam aprender a estrutura dos papéis da organização para
colaborar com os demais agentes

Aprendendo para se beneficiar da negociação:
– Os agentes necessitam se adaptar às condições do ambiente onde está
ocorrendo a negociação
– Os agentes podem aprender como os demais agentes “pensam” para
tentar melhorar a negociação. Ex: o vendedor aprende quais são os
desejos do comprador

Aprendendo para melhor combater o oponente
– O agente pode aprender quais são os golpes que o oponente executa,
qual é a melhor maneira de se esquivar dos golpes e os pontos de
debilidade do oponente
Aprendizagem e Comunicação I/II

Aprendendo a comunicar-se:
– A aprendizagem é um método para o aprendiz aprender a se comunicar

Comunicação como método de aprendizagem:
– A comunicação é o método utilizado para o aprendiz aprender

O que comunicar?
– Que informação é de interesse para os outros?

Quando comunicar?
– Quanto tempo o agente deve dedicar-se somente a solucionar um
problema antes de comunicar-se com outros agentes?
Aprendizagem e Comunicação II/II

Com quem comunicar?
– Quais agentes estão interessados na informação?
– Quais agentes devem ser perguntados?

Como comunicar?
– Qual linguagem deve utilizada?
Download

Aprendizagem