Lista de Exercícios – Agentes Cognitivos adaptativos – IN1100
Data limite de entrega: 07/06/2014 23:59:59 GMT-3
QUESTÃO 11. Um comprador de carros usados pode decidir realizar vários testes com diversos
custos associados (por exemplo, chutar os pneus, levar o carro a um mecânico qualificado) e depois,
dependendo do resultado dos testes, decidir que carro comprar. Vamos supor que o comprador esteja
decidindo comprar o carro c1, que exista tempo para executar no máximo um teste e que t1 é o teste
que pode ser efetuado em c1, pelo valor de $50. Um carro pode estar em bom estado (qualidade q+)
ou e mau estado (qualidade q-) e os testes podem ajudar a indicar em que estado o carro se encontra.
O carro c1 custa $1.500 e seu valor de mercado é $2.000, se estiver em bom estado; caso contrário
serão necessários $700 em reparos para colocá-lo em boas condições. A estimativa do comprador é
que c1 tem uma chance de 70% de estar em bom estado.
a) Desenhe a rede de decisão (diagrama de influência) que representa este problema.
b) Calcule o ganho líquido esperado da compra de c1 sem a realização de qualquer teste.
c) Os testes podem ser descritos pela probabilidade de o carro ser aprovado (passar) ou ser
reprovado (não passar) no teste, dado que o carro está em bom estado ou mau estado. Temos as
seguintes informações:
P(passar(c1, t1)|q+(c1)) = 0,8
P(passar(c1, t1)|q-(c1)) = 0,35
Use o teorema de Bayes para calcular a probabilidade de o carro passar (ou ser reprovado)
em seu teste e, consequentemente, a probabilidade de que ele esteja bom (ou mau) estado, dado
cada resultado de teste possível.
d) Calcule as decisões ótimas dada uma aprovação ou reprovação no teste e suas utilidades
esperadas.
e) Calcule o valor da informação do teste e derive um plano condicional ótimo para o comprador.
QUESTÃO 22. Considere o mundo 3 x 3 mostrado na figura abaixo. O modelo de transição é o
mesmo do visto em aula para o mundo 4 x 3: em 80% do tempo o agente vai à direção que
seleciona, o resto do tempo ele se move em ângulo reto em relação à direção pretendida.
r -1 +10
-1 -1 -1
-1 -1 -1
Figura 1. Mundo da questão 2. A recompensa para cada estado está indicada. O quadrado superior
direito é um estado terminal.
Implemente a iteração valor para esse mundo para cada valor de r a seguir (você deve fazer um
programa para computá-los). Use recompensas descontadas com um fator de desconto de 0,99.
Mostre os valores de utilidade obtidos (use três casas decimais) e a política em cada caso. Explique
intuitivamente por que o valor de r conduz a cada política.
a) r = 100
b) r = -3
c) r = 0
d) r = +3
QUESTÃO 3. Utilizamos o Weka através da interface “Weka Explorer”, que permite a
experimentação com os algoritmos disponíveis no Weka. Também é possível utilizar o Weka como
uma biblioteca, chamada dentro de um programa, conferindo grande flexibilidade ao utilizador.
1
2
Exercício 16.17 do AIMA, 3a Ed.
Exercício 17.8 do AIMA, 3a Ed.
Neste exercício, você deve utilizar o Weka como uma biblioteca, desenvolvendo uma aplicação
(preferencialmente em Java) que atenda os seguintes requisitos:
Requisito 1: Leitura de arquivo de instâncias - O sistema deve conter uma rotina para leitura de
instâncias de treinamento previamente armazenadas em arquivo ARFF.
Requisito 2: Treinamento do algoritmo de aprendizado – A partir das instâncias lidas do arquivo, o
sistema deverá realizar o treinamento de um classificador do WEKA. A escolha do classificador e
dos parâmetros de treinamento é livre.
Requisito 3: Armazenar classificador gerado – O sistema deverá salvar em arquivo o classificador
treinado, para posterior uso em novas instâncias.
Requisito 4: Uso do classificador para novas instâncias – O sistema deverá fazer a leitura do
classificador treinado e ser usado em novas instâncias não vistas no treinamento. As novas
instâncias poderão ser fornecidas manualmente pelo usuário em uma interface ou lidas de um
arquivo ARFF.
Links úteis:
Weka 3: Data Mining Software in Java - http://www.cs.waikato.ac.nz/ml/weka/
UCI Machine Learning Repository - http://archive.ics.uci.edu/ml/
Fonte: Lista de exercícios do Prof. Ricardo Prudêncio
Download

IN1100 Data limite de entrega: 07/06/2014 23:59:59 GMT