Introdução aos Agentes Inteligentes Aula: Agentes Inteligentes Flávia Barros 1 Agentes Inteligentes Plano da aula O que é um Agente Racional (inteligente)? Ambientes e arquiteturas IA distribuída Metodologia de desenvolvimento Conclusão 2 O que é um Agente? Qualquer entidade (humana ou artificial) que: está imersa ou situada em um ambiente físico, virtual/simulado percebe seu ambiente através de sensores ex. câmeras, microfone, teclado, ... age sobre o ambiente através de atuadores ex. vídeo, autofalante, impressora, braços, ... possui objetivos próprios explícitos ou implícitos escolhe suas ações em função das suas percepções para atingir seus objetivos 3 Agentes Inteligentes x Sistemas de IA Clássica Sistema Inteligente Agente Interpretação das percepções Sensores IA Ambiente Dados de Entrada Raciocínio Objetivos Atuadores Objetivos Raciocínio = escolha das ações IA Dados de Saída IA Agente Racional (Inteligente) Agente Racional faz a melhor coisa possível segue o princípio da racionalidade: dada uma seqüência perceptiva, o agente escolhe, segundo seus conhecimentos, as ações que melhor satisfazem seu objetivo Racionalidade Onisciência Limitações de: sensores atuadores “raciocinador" (conhecimento, tempo, etc.) 5 Agente Racional Medida de Desempenho Então como vamos medir o “sucesso” do agente? Usando uma “medida de desempenho” Quando o agente é colocado em um ambiente, ele gera uma seqüência de ações com base nas suas percepções. Essa seqüência de ações leva o ambiente a modificar-se passando por uma seqüência de estados. Se essa seqüência de estados é “desejável”, então o agente teve um bom desempenho! Contudo... Não existe uma medida de sucesso fixa para todos os agentes Assim sendo, vamos optar por uma medida de performance objetiva, que seja determinada pelo projetista o agente! 6 Cuidado... na computação, nem todo agente é inteligente (racional)! Inteligência Artificial Engenharia de Software Agentes Sistemas Distribuídos 7 Outras propriedades associadas aos Agentes Autonomia (IA) raciocínio, comportamento guiado por objetivos reatividade Adaptabilidade & aprendizagem (IA) Comunicação & Cooperação (IA) Personalidade (IA) Continuidade temporal Mobilidade 8 Outras propriedades associadas aos Agentes Autonomia de raciocínio (IA): Requer máquina de inferência e base de conhecimento Essencial em sistemas especialistas, controle, robótica, jogos, agentes na internet ... Adaptabilidade (IA): Capacidade de adaptação a situações novas, para as quais não foi fornecido todo o conhecimento necessário com antecedência Duas implementações aprendizagem e/ou programação declarativa Essencial em agentes na internet, interfaces amigáveis ... 9 Outras propriedades associadas aos Agentes Comunicação & Cooperação (Sociabilidade) (IA): IA + técnicas avançadas de sistemas distribuídos: Protocolos padrões de comunicação, cooperação, negociação Raciocínio autônomo sobre crenças e confiabilidade Arquiteturas de interação social entre agentes Essencial em sistemas multi-agente, comércio eletrônico, ... Personalidade (IA): IA + modelagem de atitudes e emoções Essencial em entretenimento digital, realidade virtual, interfaces amigáveis ... 10 Outras propriedades associadas aos Agentes Continuidade temporal e persistência: Requer interface com sistema operacional e banco de dados Essencial em filtragem, monitoramento, controle, ... Mobilidade: Requer: Interface com rede Protocolos de segurança Suporte a código móvel Essencial em agentes de exploração da internet, ... 11 Como descrever um Agente Racional? Pode ser descrito em termos de seu PEAS P – performance E – (environment) ambiente A – atuadores S – sensores e outros agentes – nos sistemas multiagentes 12 Exemplo: Agente de Polícia Raciocínio Agente Conhecimento: - leis - comportamento dos indivíduos,... percepção Ambiente Objetivo: - fazer com que as leis sejam respeitadas execução Ações: - multar - apitar - parar, ... Exemplos de Agentes e seus PEAS Agente Performance E (Ambiente) Agente de Diagnóstico médico Paciente saudável, minimizar custos,... Paciente, hospital, funcionários... Agente de Análise de imagens de satélite Agente Tutorial de inglês categorizar corretamente as imagens Imagens de satélite Melhorar o desempenho do estudante Conjunto de estudantes, escola... Agente robô de linha de montagem Percentual de peças corretamente montadas Segurança, rapidez, economia, conforto,... Agente Motorista de taxi Esteira com peças... Ruas, pedestres, outros carros, passageiros... Atuadores Sensores Auto-falantes Câmera, leitora de (para falar com o exames paciente), display (scanner?), para mostra textos microfone, ao paciente... teclado,... Display para Equipamento para mostrar o capturar as resultado a imagens análise Impressora, Câmera, para display com capturar imagens exercícios, do aluno; sugestões e Microfone, correções,... teclado,... Braço e mão Câmera, sensores mecânicos de ângluos Acelerador, freios, espelhos, buzina, etc... Câmera, velocímetro, GPS,... Ambientes 15 Ambientes Classes de ambientes Ambiente físico: agentes robôs Ambiente de Software: agentes softbots Ambiente de Realidade virtual (simulação do ambiente físico): agentes softbots e avatares Propriedades de um ambiente totalmente observável x parcialmente observável determinista x estocástico episódico x seqüencial estático x dinâmico discreto x contínuo um agente x multiagentes complexidade: número de percepções, ações, objetivos,... 16 Ambientes: propriedades Totalmente observável quando os sensores do agente conseguem perceber o estado completo do ambiente. Determinista o próximo estado do ambiente pode ser completamente determinado pelo estado atual e as ações selecionadas pelo agente. Episódico A experiência do agente é dividida em episódios. Cada episódio consiste em o agente perceber e então agir. Cada episódio não depende das ações que ocorreram em episódios prévios. 17 Ambientes: propriedades Estático o ambiente não muda enquanto o agente está escolhendo a ação a realizar. Semi-estático: o ambiente não muda enquanto o agente delibera, mas o "score" do agente muda. Discreto quando existe um número distinto e claramente definido de percepções e ações em cada turno. Contínuo percepções e ações mudam em um espectro contínuo de valores. 18 Exemplos de Ambientes Agente xadrez sem relógio observável determinista episódico Sim Sim Não estático Sim discreto Sim xadrez com relógio Sim Sim Não Semi sim gamão sim não não sim sim motorista de taxi Não Não Não Não Não médico Não Não Não Não Não tutor Não Não Não Não Sim Analisador de imagem Sim Sim Sim Semi Não Busca na web Não Não Sim Não Sim Filtrador de mail Sim Não Sim Não Sim > A complexidade do ambiente é dada por: número de percepções, ações e objetivos possíveis Agentes Algoritmo Básico e Arquiteturas 20 Agentes: Algoritmo básico função agenteSimples (percepção) retorna ação memória := atualizaMemória (memória, percepção) ação := escolheMelhorAção(memória,objetivos) memória := atualizaMemória (memória, ação) retorna ação 21 Agentes: Arquiteturas Agente reativo Agente reativo com estado interno Agente cognitivo (baseado em objetivos) Agente otimizador Agente adaptativo autonomia complexidade 22 Agentes: Arquiteturas De forma bem simplificada, um agente pode ser visto como um mapeamento: seqüência perceptiva => ação ambiente sensores Raciocinador Agente modelo do ambiente atuadores 23 ambiente Agente Tabela? Não é um agente racional... sensores Agente Tabela Percepções ações . . . . atuadores Limitações Mesmo problemas simples requerem tabelas muito grandes ex. xadrez 30^100 Nem sempre é possível, por ignorância ou questão de tempo, construir a tabela Não tem autonomia nem flexibilidade Ambiente Totalmente observável, determinista, episódico, estático, discreto e minúsculo! ambiente Agente Reativo Simples Agente sensores Como está o mundo agora? Que ação devo escolher agora? Regras “condição-ação” atuadores Vantagens e desvantagens Regras condição-ação - representação inteligível, modular e eficiente ex. Se velocidade > 60 então multar Não pode armazenar uma seqüência perceptiva, tem pouca autonomia Ambiente Totalmente observável, episódico, pequeno Reflexo é imprescindível em ambientes dinâmicos Agente Reativo baseado em Modelo do Mundo Agente sensores estado: como o mundo era antes ambiente Como está o mundo agora? como o mundo evolui impacto de minhas ações Que devo fazer agora? atuadores Desvantagem: pouca autonomia não tem objetivo, não encadeia regras Ambiente: determinista e pequeno Ex. Tamagotchi Regras “condição-ação” Agente cognitivo - Baseado em Objetivo Agente ambiente sensores estado: como o mundo era antes Como está o mundo agora? como o mundo evolui Como ele ficará se faço isto? impacto de minhas ações Que devo fazer agora? Objetivos atuadores Vantagens e desvantagens Mais complicado e ineficiente, porém mais flexível, autônomo Não trata objetivos conflitantes Ambiente: determinista Ex. de objetivo: xeque-mate no xadrez Agente otimizador - baseado em utilidade Agente sensores estado: como o mundo era antes Como está o mundo agora? Como ele ficará se faço isto? ambiente Este novo mundo é melhor? Que ação devo escolher agora? atuadores Ambiente: sem restrição Desvantagem: não tem adaptabilidade Ex. motorista de táxi Segurança e velocidade – conflito! como o mundo evolui qual é o impacto de minhas ações Função de Utilidade Agente que aprende Agente sensores t+1 avaliação ambiente t elemento de execução (agente) crítico trocas elemento de conhecimento aprendizagem t atuadores objetivos de aprendizagem Gerador de problemas Ambiente: sem restrição Vantagem: tem adaptabilidade (aprende) Contudo, não necessariamente trata dois objetivos conflitantes Ex. motorista sem o mapa da cidade Inteligência Coletiva IA Distribuída 30 Inteligência Coletiva Por que pensar a inteligência/racionalidade como propriedade de um único indivíduo? Não existe inteligência ... Em um time de futebol? Em um formigueiro? Em uma empresa (ex. correios)? Na sociedade? Solução: IA Distribuída 31 IA Distribuída Agentes simples que juntos resolvem problemas complexos tendo ou não consciência do objetivo global O próprio ambiente pode ser modelado como um agente Dois tipos de sistemas: Resolução distribuída de problemas Sistemas Multiagentes 32 Resolução distribuída de problemas Cada agente tem consciência do objetivo global Existe uma divisão clara de tarefas Exemplos: Robótica clássica, Busca na Web, Gerência de sistemas distribuídos, ... 33 Sistemas Multiagentes Não existe consciência do objetivo global Não existe divisão clara de tarefas Exemplos: n-puzzle (jogo dos 8-números), futebol de robôs, balanceamento de carga, robótica, ... 3 7 4 3 5 7 8 1 4 2 6 5 8 2 1 1 2 3 6 4 5 6 7 8 34 Agentes em IA Metodologia para projeto de sistemas e dicas de implementação 35 Projeto Metodologia de desenvolvimento Decompõe o problema em: PEAS dos agentes (Performance, Environment (ambiente), Atuadores e Sensores); & Objetivos (ou função utilidade, se for o caso) dos agentes; Decompõe o conhecimento do agente em: Quais são as propriedades relevantes do mundo? Como identificar os estados desejáveis do mundo? Como interpretar as suas percepções? Quais as conseqüências das suas ações no mundo? Como medir o sucesso de suas ações? Como avaliar seus próprios conhecimentos? São suficientes para resolver o problema? 36 Projeto Metodologia de desenvolvimento O resultado dessa decomposição indica: Arquitetura de agente adequada ao ambiente e ao problema a ser tratado O método de resolução de problema (raciocínio) 37 Como desenvolver um software inteligente? Projeto: Modelar o problema em termos de PEAS e Objetivos (ou função utilidade) dos agentes Identificar o tipo de ambiente Identificar a arquitetura do(s) agente(s) Implementação: Componentes do agente O simulador de ambientes Testar o desempenho com diferentes instâncias do ambiente 38 Implementação Simulação do Ambiente Às vezes, é mais conveniente simular o ambiente mais simples permite testes prévios evita riscos, etc... O ambiente (pedaço de código...) recebe os agentes como entrada fornece repetidamente a cada um deles as percepções corretas e recebe as ações escolhidas atualiza os dados do ambiente em função dessas ações e de outros processos (ex. dia-noite) é definido por um estado inicial e uma função de atualização deve refletir a realidade 39 Simulação de Ambientes função simulaAmbiente (estado, funçãoAtualização, agentes,final) repita para cada agente em agentes faça Percept[agente] := pegaPercepção(agente,estado) para cada agente em agentes faça Action[agente] := Programa[agente] (Percept[agente]) estado := funçãoAtualização(ações, agentes, estado) scores := avaliaDesempenho(scores,agente,estado) //opcional até final Cuidado para não cair em tentação e “roubar” do ambiente a descrição do que aconteceu. Use a memória do agente! 40 Por que usar a “metáfora” de agentes? 1. Fornece uma visão unificadora das várias sub-áreas da IA 2. Fornece metodologias de desenvolvimento de sistemas inteligentes estendendo as de engenharia de software 3. Ajuda a embutir a IA em sistemas computacionais tradicionais 4. Permite tratar melhor a interação com o ambiente 5. Permite tratamento natural da IA distribuída 41 Próxima Aula Agentes baseados em conhecimento 42