Universidade Federal de Campina Grande
Departamento de Sistemas e Computação
Curso de Bacharelado em Ciência da Computação
Fonte: José Francisco Salm Junior (Diretor de Engenharia de Sistemas Instituto Stela)
Inteligência Artificial I
Introdução a Agentes
(Adicional II)
Prof.a Joseana Macêdo Fechine
[email protected]
Carga Horária: 60 horas
DSC/CCT/UFCG
Agentes
Tópico

Caracterização dos Agentes
2
DSC/CCT/UFCG
Agentes

Propriedades de um ambiente
 acessível (completamente observável) x
inacessível (parcialmente observável)
 estático x dinâmico
 determinístico x não-determinístico
 discreto x contínuo
 episódico x não-episódico (seqüencial)
3
DSC/CCT/UFCG
Ambientes: propriedades

Acessível: quando os sensores do agente
conseguem perceber o estado completo do
ambiente.

Determinístico: o próximo estado do ambiente
pode ser completamente determinado pelo estado
atual e as ações selecionadas pelo agente.

Episódico: a experiência do agente é dividida em
episódios. Cada episódio consiste em o agente
perceber e então agir. Cada episódio não depende
das ações que ocorreram em episódios prévios.
4
DSC/CCT/UFCG
Ambientes: propriedades

Estático: o ambiente não muda enquanto o agente
está escolhendo a ação a realizar.
 Semi-dinâmico: o ambiente não muda enquanto
o agente delibera, mas o "score" do agente muda.

Discreto: quando existe um número distinto e
claramente definido de percepções e ações em cada
turno.

Contínuo: percepções e ações mudam em um
espectro contínuo de valores.
5
DSC/CCT/UFCG
Agentes - Estrutura

Agentes reativos simples

Agentes reativos baseados em modelo

Agentes baseados em objetivos

Agentes baseados na utilidade

Agentes com aprendizagem
6
DSC/CCT/UFCG
ambiente
Agente Reativo Simples
sensores
Agente
Qual a aparência atual do mundo?
Que ação devo executar agora?
Regras
“condição-ação”
atuadores
7
DSC/CCT/UFCG
Agente Reativo Simples

Tipo mais simples.

Seleciona ações com base na percepção atual,
ignorando o restante do histórico de percepções.

Exemplo: Agente aspirador de pó, porque sua
decisão se baseia apenas na posição atual e no fato
de essa posição conter ou não sujeira.
8
DSC/CCT/UFCG
Agente Reativo Simples

Vantagens e desvantagens

Regras condição-ação: representação inteligível,
modular e eficiente



ex. Se velocidade > 60 então multar
Não pode armazenar uma seqüência de percepções,
pouca autonomia
Ambientes:


Reflexo imprescindível em ambientes dinâmicos
Acessível, episódico, pequeno
9
DSC/CCT/UFCG
Agente Reativo Simples

Funcionará somente se a decisão correta puder ser
tomada com base apenas na percepção atual


Ambiente completamente observável
Exemplos de alguns problemas:

Talvez somente uma imagem não é suficiente para
determinar se o carro da frente esta dando sinal de
mudança de direção, alerta ou freio
10
DSC/CCT/UFCG
Agente Reativo Baseado
em Modelos
Agente
sensores
ambiente
estado: como o mundo era antes
Qual é a aparência atual
mundo?
como o mundo evolui
impacto de minhas ações
Que ação devo executar
agora?
Regras
“condição-ação”
atuadores
11
DSC/CCT/UFCG
Agente Reativo Baseado
em Modelos

Agente controla a parte do mundo que ele não pode
ver agora (agente mantém estado interno que
depende do histórico de percepções).

Exemplo: agente taxista vai trocar de pista e pode
não ver momentaneamente alguns carros à sua volta
12
DSC/CCT/UFCG
Agente Reativo Baseado
em Modelos

O agente deve manter um estado interno que
dependa do histórico de percepções e reflita os
aspectos não observados no estado atual

Dois tipos de conhecimento são necessários para
atualizar o estado interno do agente (modelo do
mundo):

Como o ambiente evolui independente do agente


Um carro que está ultrapassando, em geral estará mais perto
do que estava um instante anterior
Como as ações do próprio agente afetam o mundo

Se o agente virar o volante à direita, o carro irá virar p/ a direita
13
DSC/CCT/UFCG
Agente Reativo Baseado
em Modelos

Um agente que utiliza o modelo de mundo

Desvantagem: pouca autonomia


não tem objetivo, não encadeia regras
Ambientes: determinístico e pequeno
14
DSC/CCT/UFCG
Agente Baseado em Objetivo
ambiente
sensores
Agente
estado: como o mundo era antes
Qual a aparência atual do
mundo?
como o mundo evolui
Qual será a aparência se for
executada a ação A?
impacto de minhas ações
Que ação devo executar
agora?
Objetivos
atuadores
15
DSC/CCT/UFCG
Agente Baseado em Objetivo

Agente combina seu objetivo com as informações
sobre os resultados de ações possíveis a fim de
escolher ações que alcancem os seus objetivos

Exemplo: Táxi em um entroncamento de estradas:
virar à esquerda, à direita ou ir em frente?

Necessidade de busca e planejamento: áreas da IA
dedicadas a encontrar seqüências de ações que
alcançam os objetivos do agente.
16
DSC/CCT/UFCG
Agente Baseado em Objetivo

O agente precisa de algum tipo de informação sobre
o seu objetivo


Combinando informações sobre:


O objetivo do agente
Os resultados de suas ações

O agente pode escolher ações que alcancem o
objetivo

A seleção da ação baseada em objetivo pode ser:


DSC/CCT/UFCG
Objetivos descrevem situações desejáveis. Ex: estar no destino
Direta: quando o resultado de uma única ação atinge o objetivo
Mais complexa: quando será necessário longas seqüências de
ações para atingir o objetivo
17
Agente Baseado em Objetivo

Para encontrar seqüências de ações que alcançam
os objetivos


Algoritmos de Busca e Planejamento
A tomada de decisão envolve a consideração do
futuro -> distinta das regras de condição-ação


“O que acontecerá se eu fizer isso ou aquilo?”
“O quanto isso me ajudará a atingir o objetivo?”

Agentes reativos: reação -> frear quando carro da frente frear

Agentes baseado em objetivo: raciocínio -> carro da frente freia
-> carro da frente diminui velocidade -> objetivo: não atingir
outros carros -> ação para atingir objetivo: frear
18
DSC/CCT/UFCG
Agente Baseado em Objetivo

Vantagens e desvantagens:
 Mais complicado e “ineficiente”, porém mais
flexível, autônomo
 Não trata objetivos conflitantes

Ambientes: determinístico
19
DSC/CCT/UFCG
Agente Baseado em Utilidade
Agente
sensores
ambiente
Qual a aparência atual do
mundo?
Qual será a aparência se for
executada a ação A?
Este novo mundo é melhor?
estado: como o mundo era antes
como o mundo evolui
qual é o impacto de
minhas ações
Que ação devo executar agora?
atuadores
Função de Utilidade
20
DSC/CCT/UFCG
Agente Baseado em Utilidade

Existem muitas seqüências de ações que levam o
agente ao seu objetivo. Algumas mais rápidas, mais
seguras, mais econômicas, etc.

Agentes baseados em utilidade utilizam uma medida
de desempenho (função de utilidade) que permite
uma comparação entre diferentes estados do
mundo, permitindo selecionar a seqüência de ações
21
DSC/CCT/UFCG
Agente Baseado em Utilidade

Se um estado do mundo é mais desejável que outro,
então ele terá maior utilidade para o agente


Utilidade é uma função que mapeia um estado para um
número real que representa o grau de satisfação com este
estado
Especificação completa da função de utilidade –
decisões racionais em dois tipos de casos:


Quando existem objetivos conflitantes (velocidade x
segurança) a função de utilidade especifica o compromisso
apropriado
Quando existem vários objetivos que se deseja alcançar e
nenhum deles pode ser atingido com certeza – ponderar a
importância dos objetivos
22
DSC/CCT/UFCG
Agente Baseado em Utilidade

Ambiente: sem restrição

Desvantagem: não tem adaptabilidade
23
DSC/CCT/UFCG
Agente com Aprendizagem
Agente
sensores
t+1
avaliação
t
ambiente
crítico
trocas
elemento de
desempenho (agente)
t
atuadores
conhecimento
elemento de
aprendizagem
objetivos de
aprendizagem
Gerador de
problemas
24
DSC/CCT/UFCG
Agente com Aprendizagem

Um elemento de aprendizado utiliza realimentação
sobre como um agente está funcionando e
determina de que maneira o elemento de
desempenho deve ser modificado para funcionar
melhor no futuro.
25
DSC/CCT/UFCG
Agente com Aprendizagem

Em agentes sem aprendizagem tudo o que o
agente sabe foi colocado nele pelo projetista

Turing propõe construir máquinas com
aprendizagem e depois ensiná-las

Aprendizagem também permite ao agente atuar em
ambientes totalmente desconhecidos e se tornar
mais competente do que o seu conhecimento inicial
poderia permitir
26
DSC/CCT/UFCG
Agente com Aprendizagem

Ambiente: sem restrição

Vantagem: tem adaptabilidade (aprende)
27
DSC/CCT/UFCG
Download

Agentes - Computação UFCG - Universidade Federal de Campina