Universidade Federal de Campina Grande Departamento de Sistemas e Computação Curso de Bacharelado em Ciência da Computação Fonte: José Francisco Salm Junior (Diretor de Engenharia de Sistemas Instituto Stela) Inteligência Artificial I Introdução a Agentes (Adicional II) Prof.a Joseana Macêdo Fechine [email protected] Carga Horária: 60 horas DSC/CCT/UFCG Agentes Tópico Caracterização dos Agentes 2 DSC/CCT/UFCG Agentes Propriedades de um ambiente acessível (completamente observável) x inacessível (parcialmente observável) estático x dinâmico determinístico x não-determinístico discreto x contínuo episódico x não-episódico (seqüencial) 3 DSC/CCT/UFCG Ambientes: propriedades Acessível: quando os sensores do agente conseguem perceber o estado completo do ambiente. Determinístico: o próximo estado do ambiente pode ser completamente determinado pelo estado atual e as ações selecionadas pelo agente. Episódico: a experiência do agente é dividida em episódios. Cada episódio consiste em o agente perceber e então agir. Cada episódio não depende das ações que ocorreram em episódios prévios. 4 DSC/CCT/UFCG Ambientes: propriedades Estático: o ambiente não muda enquanto o agente está escolhendo a ação a realizar. Semi-dinâmico: o ambiente não muda enquanto o agente delibera, mas o "score" do agente muda. Discreto: quando existe um número distinto e claramente definido de percepções e ações em cada turno. Contínuo: percepções e ações mudam em um espectro contínuo de valores. 5 DSC/CCT/UFCG Agentes - Estrutura Agentes reativos simples Agentes reativos baseados em modelo Agentes baseados em objetivos Agentes baseados na utilidade Agentes com aprendizagem 6 DSC/CCT/UFCG ambiente Agente Reativo Simples sensores Agente Qual a aparência atual do mundo? Que ação devo executar agora? Regras “condição-ação” atuadores 7 DSC/CCT/UFCG Agente Reativo Simples Tipo mais simples. Seleciona ações com base na percepção atual, ignorando o restante do histórico de percepções. Exemplo: Agente aspirador de pó, porque sua decisão se baseia apenas na posição atual e no fato de essa posição conter ou não sujeira. 8 DSC/CCT/UFCG Agente Reativo Simples Vantagens e desvantagens Regras condição-ação: representação inteligível, modular e eficiente ex. Se velocidade > 60 então multar Não pode armazenar uma seqüência de percepções, pouca autonomia Ambientes: Reflexo imprescindível em ambientes dinâmicos Acessível, episódico, pequeno 9 DSC/CCT/UFCG Agente Reativo Simples Funcionará somente se a decisão correta puder ser tomada com base apenas na percepção atual Ambiente completamente observável Exemplos de alguns problemas: Talvez somente uma imagem não é suficiente para determinar se o carro da frente esta dando sinal de mudança de direção, alerta ou freio 10 DSC/CCT/UFCG Agente Reativo Baseado em Modelos Agente sensores ambiente estado: como o mundo era antes Qual é a aparência atual mundo? como o mundo evolui impacto de minhas ações Que ação devo executar agora? Regras “condição-ação” atuadores 11 DSC/CCT/UFCG Agente Reativo Baseado em Modelos Agente controla a parte do mundo que ele não pode ver agora (agente mantém estado interno que depende do histórico de percepções). Exemplo: agente taxista vai trocar de pista e pode não ver momentaneamente alguns carros à sua volta 12 DSC/CCT/UFCG Agente Reativo Baseado em Modelos O agente deve manter um estado interno que dependa do histórico de percepções e reflita os aspectos não observados no estado atual Dois tipos de conhecimento são necessários para atualizar o estado interno do agente (modelo do mundo): Como o ambiente evolui independente do agente Um carro que está ultrapassando, em geral estará mais perto do que estava um instante anterior Como as ações do próprio agente afetam o mundo Se o agente virar o volante à direita, o carro irá virar p/ a direita 13 DSC/CCT/UFCG Agente Reativo Baseado em Modelos Um agente que utiliza o modelo de mundo Desvantagem: pouca autonomia não tem objetivo, não encadeia regras Ambientes: determinístico e pequeno 14 DSC/CCT/UFCG Agente Baseado em Objetivo ambiente sensores Agente estado: como o mundo era antes Qual a aparência atual do mundo? como o mundo evolui Qual será a aparência se for executada a ação A? impacto de minhas ações Que ação devo executar agora? Objetivos atuadores 15 DSC/CCT/UFCG Agente Baseado em Objetivo Agente combina seu objetivo com as informações sobre os resultados de ações possíveis a fim de escolher ações que alcancem os seus objetivos Exemplo: Táxi em um entroncamento de estradas: virar à esquerda, à direita ou ir em frente? Necessidade de busca e planejamento: áreas da IA dedicadas a encontrar seqüências de ações que alcançam os objetivos do agente. 16 DSC/CCT/UFCG Agente Baseado em Objetivo O agente precisa de algum tipo de informação sobre o seu objetivo Combinando informações sobre: O objetivo do agente Os resultados de suas ações O agente pode escolher ações que alcancem o objetivo A seleção da ação baseada em objetivo pode ser: DSC/CCT/UFCG Objetivos descrevem situações desejáveis. Ex: estar no destino Direta: quando o resultado de uma única ação atinge o objetivo Mais complexa: quando será necessário longas seqüências de ações para atingir o objetivo 17 Agente Baseado em Objetivo Para encontrar seqüências de ações que alcançam os objetivos Algoritmos de Busca e Planejamento A tomada de decisão envolve a consideração do futuro -> distinta das regras de condição-ação “O que acontecerá se eu fizer isso ou aquilo?” “O quanto isso me ajudará a atingir o objetivo?” Agentes reativos: reação -> frear quando carro da frente frear Agentes baseado em objetivo: raciocínio -> carro da frente freia -> carro da frente diminui velocidade -> objetivo: não atingir outros carros -> ação para atingir objetivo: frear 18 DSC/CCT/UFCG Agente Baseado em Objetivo Vantagens e desvantagens: Mais complicado e “ineficiente”, porém mais flexível, autônomo Não trata objetivos conflitantes Ambientes: determinístico 19 DSC/CCT/UFCG Agente Baseado em Utilidade Agente sensores ambiente Qual a aparência atual do mundo? Qual será a aparência se for executada a ação A? Este novo mundo é melhor? estado: como o mundo era antes como o mundo evolui qual é o impacto de minhas ações Que ação devo executar agora? atuadores Função de Utilidade 20 DSC/CCT/UFCG Agente Baseado em Utilidade Existem muitas seqüências de ações que levam o agente ao seu objetivo. Algumas mais rápidas, mais seguras, mais econômicas, etc. Agentes baseados em utilidade utilizam uma medida de desempenho (função de utilidade) que permite uma comparação entre diferentes estados do mundo, permitindo selecionar a seqüência de ações 21 DSC/CCT/UFCG Agente Baseado em Utilidade Se um estado do mundo é mais desejável que outro, então ele terá maior utilidade para o agente Utilidade é uma função que mapeia um estado para um número real que representa o grau de satisfação com este estado Especificação completa da função de utilidade – decisões racionais em dois tipos de casos: Quando existem objetivos conflitantes (velocidade x segurança) a função de utilidade especifica o compromisso apropriado Quando existem vários objetivos que se deseja alcançar e nenhum deles pode ser atingido com certeza – ponderar a importância dos objetivos 22 DSC/CCT/UFCG Agente Baseado em Utilidade Ambiente: sem restrição Desvantagem: não tem adaptabilidade 23 DSC/CCT/UFCG Agente com Aprendizagem Agente sensores t+1 avaliação t ambiente crítico trocas elemento de desempenho (agente) t atuadores conhecimento elemento de aprendizagem objetivos de aprendizagem Gerador de problemas 24 DSC/CCT/UFCG Agente com Aprendizagem Um elemento de aprendizado utiliza realimentação sobre como um agente está funcionando e determina de que maneira o elemento de desempenho deve ser modificado para funcionar melhor no futuro. 25 DSC/CCT/UFCG Agente com Aprendizagem Em agentes sem aprendizagem tudo o que o agente sabe foi colocado nele pelo projetista Turing propõe construir máquinas com aprendizagem e depois ensiná-las Aprendizagem também permite ao agente atuar em ambientes totalmente desconhecidos e se tornar mais competente do que o seu conhecimento inicial poderia permitir 26 DSC/CCT/UFCG Agente com Aprendizagem Ambiente: sem restrição Vantagem: tem adaptabilidade (aprende) 27 DSC/CCT/UFCG