Lista de Exercícios – Agentes Cognitivos adaptativos – IN1100 Data limite de entrega: 07/06/2014 23:59:59 GMT-3 QUESTÃO 11. Um comprador de carros usados pode decidir realizar vários testes com diversos custos associados (por exemplo, chutar os pneus, levar o carro a um mecânico qualificado) e depois, dependendo do resultado dos testes, decidir que carro comprar. Vamos supor que o comprador esteja decidindo comprar o carro c1, que exista tempo para executar no máximo um teste e que t1 é o teste que pode ser efetuado em c1, pelo valor de $50. Um carro pode estar em bom estado (qualidade q+) ou e mau estado (qualidade q-) e os testes podem ajudar a indicar em que estado o carro se encontra. O carro c1 custa $1.500 e seu valor de mercado é $2.000, se estiver em bom estado; caso contrário serão necessários $700 em reparos para colocá-lo em boas condições. A estimativa do comprador é que c1 tem uma chance de 70% de estar em bom estado. a) Desenhe a rede de decisão (diagrama de influência) que representa este problema. b) Calcule o ganho líquido esperado da compra de c1 sem a realização de qualquer teste. c) Os testes podem ser descritos pela probabilidade de o carro ser aprovado (passar) ou ser reprovado (não passar) no teste, dado que o carro está em bom estado ou mau estado. Temos as seguintes informações: P(passar(c1, t1)|q+(c1)) = 0,8 P(passar(c1, t1)|q-(c1)) = 0,35 Use o teorema de Bayes para calcular a probabilidade de o carro passar (ou ser reprovado) em seu teste e, consequentemente, a probabilidade de que ele esteja bom (ou mau) estado, dado cada resultado de teste possível. d) Calcule as decisões ótimas dada uma aprovação ou reprovação no teste e suas utilidades esperadas. e) Calcule o valor da informação do teste e derive um plano condicional ótimo para o comprador. QUESTÃO 22. Considere o mundo 3 x 3 mostrado na figura abaixo. O modelo de transição é o mesmo do visto em aula para o mundo 4 x 3: em 80% do tempo o agente vai à direção que seleciona, o resto do tempo ele se move em ângulo reto em relação à direção pretendida. r -1 +10 -1 -1 -1 -1 -1 -1 Figura 1. Mundo da questão 2. A recompensa para cada estado está indicada. O quadrado superior direito é um estado terminal. Implemente a iteração valor para esse mundo para cada valor de r a seguir (você deve fazer um programa para computá-los). Use recompensas descontadas com um fator de desconto de 0,99. Mostre os valores de utilidade obtidos (use três casas decimais) e a política em cada caso. Explique intuitivamente por que o valor de r conduz a cada política. a) r = 100 b) r = -3 c) r = 0 d) r = +3 QUESTÃO 3. Utilizamos o Weka através da interface “Weka Explorer”, que permite a experimentação com os algoritmos disponíveis no Weka. Também é possível utilizar o Weka como uma biblioteca, chamada dentro de um programa, conferindo grande flexibilidade ao utilizador. 1 2 Exercício 16.17 do AIMA, 3a Ed. Exercício 17.8 do AIMA, 3a Ed. Neste exercício, você deve utilizar o Weka como uma biblioteca, desenvolvendo uma aplicação (preferencialmente em Java) que atenda os seguintes requisitos: Requisito 1: Leitura de arquivo de instâncias - O sistema deve conter uma rotina para leitura de instâncias de treinamento previamente armazenadas em arquivo ARFF. Requisito 2: Treinamento do algoritmo de aprendizado – A partir das instâncias lidas do arquivo, o sistema deverá realizar o treinamento de um classificador do WEKA. A escolha do classificador e dos parâmetros de treinamento é livre. Requisito 3: Armazenar classificador gerado – O sistema deverá salvar em arquivo o classificador treinado, para posterior uso em novas instâncias. Requisito 4: Uso do classificador para novas instâncias – O sistema deverá fazer a leitura do classificador treinado e ser usado em novas instâncias não vistas no treinamento. As novas instâncias poderão ser fornecidas manualmente pelo usuário em uma interface ou lidas de um arquivo ARFF. Links úteis: Weka 3: Data Mining Software in Java - http://www.cs.waikato.ac.nz/ml/weka/ UCI Machine Learning Repository - http://archive.ics.uci.edu/ml/ Fonte: Lista de exercícios do Prof. Ricardo Prudêncio