011010 101010 100100 010101 110100 101100 100101 001001 010011 010101 100111 001101 011010 101010 100100 010101 110100 101100 Aprendizado de Máquina Uma Visão Geral Profa. Dra. Maria Carolina Monard LABIC - ICMC - USP São Carlos LABIC - ICMC - USP São Carlos ISISTAN-2001 ‹# 011010 101010 100100 010101 110100 • Inteligência e Aprendizado 101100 100101 • Engenharia de Conhecimento e SBC 001001 010011 • Dado, Informação e Conhecimento 010101 • Aprendizado de Máquina 100111 001101 • AM usando Árvores de Decisão 011010 • KDD e Data Mining 101010 100100 010101 110100 101100 Tópicos LABIC - ICMC - USP São Carlos ISISTAN-2001 ‹# 011010 101010 100100 010101 110100 101100 “Uma área de pesquisa que investiga 100101 formas de habilitar o computador a 001001 010011 realizar tarefas nas quais, até o 010101 momento, o ser humano tem um 100111 001101 melhor desempenho”. 011010 Elaine Rich 101010 100100 010101 110100 101100 O que é IA? LABIC - ICMC - USP São Carlos ISISTAN-2001 ‹# 011010 101010 100100 010101 110100 101100“Tão logo algum problema de IA é 100101 resolvido ele não é mais considerado 001001 um problema da área de IA...” 010011 010101 100111 Chuck Thorpe 001101 011010 CMU, Robotics Institute, 2000 101010 100100 010101 110100 101100 Inteligência Artificial LABIC - ICMC - USP São Carlos ISISTAN-2001 ‹# 011010 101010 100100 010101 110100 • Conjunto de técnicas para a construção de 101100 máquinas “inteligentes”, capazes de 100101 001001 resolver problemas que requerem 010011 inteligência humana. (Nilsson) 010101 • Ramo da Ciência da Computação dedicado 100111 à automação de comportamento 001101 011010 inteligente. (Luger e Stubble) 101010 • Tecnologia de processamento de 100100 informação que envolve processos de 010101 raciocínio, aprendizado e percepção. 110100 (Winston) 101100 Definições Adicionais LABIC - ICMC - USP São Carlos ISISTAN-2001 ‹# 011010 101010 100100 010101 110100 101100 100101 Sistemas que 001001 010011 pensam como os 010101 humanos 100111 Sistemas que 001101 011010atuam como 101010 100100 humanos 010101 110100 101100 As 4 categorias das definições de Inteligência Artificial LABIC - ICMC - USP São Carlos Sistemas que pensam racionalmente Sistemas que atuam racionalmente ISISTAN-2001 ‹# 011010 101010 100100 010101 110100 • Agindo como humanos: 101100 A abordagem do Teste de Turing 100101 001001 • Pensando como humanos: 010011 A abordagem do modelamento cognitivo 010101 100111 001101 • Pensando racionalmente: 011010 A abordagem das leis do pensamento 101010 100100 • Agindo racionalmente: 010101 A abordagem de agentes racionais 110100 101100 As 4 categorias das definições de Inteligência Artificial LABIC - ICMC - USP São Carlos ISISTAN-2001 ‹# 011010 101010 100100 010101 110100 • A partir dos anos 80 foi percebido que, 101100 geralmente, o modelo de raciocínio utilizado 100101 001001 em IA era diferente do usado pelos seres 010011 humanos. 010101 • Mas essas diferenças não invalidam o uso 100111 de modelos não-humanos. Um bom 001101 011010 exemplo é o avião, que opera de uma 101010 forma muito diferente da dos pássaros, 100100 mas também voa..... 010101 110100 101100 Uma Nova Visão LABIC - ICMC - USP São Carlos ISISTAN-2001 ‹# 011010 101010 100100 010101 110100 • Em outras palavras, para que alguém 101100 100101 quer construir uma cópia da mente 001001 humana? Não é suficiente a original? 010011 Não é a mente humana a mais difícil 010101 100111 de se auto-examinar? 001101 • A única solução aparentemente lógica 011010 101010 é separar a inteligência humana da 100100 inteligência artificial para construir 010101 algo completamente novo. 110100 101100 Uma Nova Visão LABIC - ICMC - USP São Carlos ISISTAN-2001 ‹# 011010 101010 100100 010101 110100 101100 Entre as controvérsias que ainda 100101 persistem na área encontra-se a 001001 relacionada com o papel 010011 010101 desempenhado em IA pela lógica. 100111 001101 011010 A inteligência deriva primariamente do 101010 raciocínio lógico ou do conhecimento? 100100 010101 110100 101100 IA e Lógica LABIC - ICMC - USP São Carlos ISISTAN-2001 ‹# 011010 101010 100100 010101 110100 O 101100 100101 001001 010011 010101 100111 001101 011010 101010 100100 010101 110100 101100 IA e Lógica problema está em considerar que esse ou é um ou exclusivo! LABIC - ICMC - USP São Carlos ISISTAN-2001 ‹# 011010 101010 100100 010101 110100 • São diversas as lógicas 101100 100101 IA, tais como: 001001 – Lógica Fuzzy 010011 010101 – Lógica Paraconsistente 100111 – Lógica Temporal 001101 – e várias outras 011010 101010 100100 010101 110100 101100 IA e Lógica LABIC - ICMC - USP São Carlos ISISTAN-2001 utilizadas em ‹# 011010 101010 100100 010101 110100 • Ainda que forçados a utilizar muitas 101100 100101 variedades de lógica, alguns pesquisa001001 dores consideram que tanto a lingua010011 gem quanto a “máquina de inferência” 010101 100111 lógica é fundamental para IA. 001101 • O ideal seria conseguir integrar essa 011010 101010 grande variedade de mecanismos 100100 lógicos especializados dentro de um 010101 sistema único, poderoso e versátil, 110100 101100 porém uniforme. IA e Lógica LABIC - ICMC - USP São Carlos ISISTAN-2001 ‹# 011010 101010 100100 010101 110100 101100 100101 001001 010011 010101 100111 001101 011010 101010 100100 010101 110100 101100 Paradigmas da Inteligência O que é inteligência? Muito difícil!!! LABIC - ICMC - USP São Carlos ISISTAN-2001 ‹# 011010 101010 100100 010101 110100 • Aprende por experiência 101100 • Usa conhecimento adquirido por experiência 100101 • Soluciona problemas na ausência de alguma 001001 informação 010011 010101 • Reage rapidamente perante uma nova situação 100111 • Determina o que é importante 001101 • Raciocina e pensa 011010 101010 • Entende imagens visuais 100100 • Processa e manipula símbolos 010101 • É criativo e imaginativo 110100 • Usa heurísticas 101100 Procedimento Inteligente LABIC - ICMC - USP São Carlos ISISTAN-2001 ‹# 011010 101010 100100 010101 110100 • Aprendizado é a chave da 101100 100101 superioridade da Inteligência Humana 001001 – Aprendizado é a essência da Inteligência 010011 010101 • Para que uma máquina tenha 100111 Comportamento Inteligente, deve001101 se aumentar sua Capacidade de 011010 101010 Aprendizado 100100 010101 110100 101100 Inteligência x Aprendizado LABIC - ICMC - USP São Carlos ISISTAN-2001 ‹# 011010 101010 100100 010101 110100 • O ser humano está pré-programado para o 101100 aprendizado. Aprende ampliando o alcance 100101 001001 do conhecimento que já possui, através de 010011 reordenações sucessivas 010101 • O computador não possui o programa inicial 100111 para procurar por informações e realizar 001101 011010 aprendizado em geral 101010 • Paradigmas e técnicas de AM possuem um 100100 alvo bem mais limitado do que o 010101 aprendizado humano 110100 101100 Inteligência x Aprendizado LABIC - ICMC - USP São Carlos ISISTAN-2001 ‹# O Teste de Turing LABIC - ICMC - USP São Carlos Sistema Computacional Barreira Física 011010 101010 100100 010101 110100 101100 100101 001001 010011 010101 100111 001101 011010 101010 100100 Interrogador 010101 110100 101100 Interface Humano ISISTAN-2001 ‹# 011010 101010 100100 010101 110100 • Inteligência e Aprendizado 101100 100101 • Engenharia de Conhecimento e SBC 001001 • Dado, Informação e Conhecimento 010011 010101 • Aprendizado de Máquina 100111 001101 • AM usando Árvores de Decisão 011010 • KDD e Data Mining 101010 100100 010101 110100 101100 Tópicos LABIC - ICMC - USP São Carlos ISISTAN-2001 ‹# 011010 101010 100100 010101 110100 101100 100101 001001 Conceitos e técnicas de IA 010011 010101 100111 001101 011010 101010 Sistemas de IA 100100 010101 110100 101100 Sistemas de IA LABIC - ICMC - USP São Carlos Processo de Aprendizado Aquisição Conhecimento Representação Manipulação ISISTAN-2001 ‹# 011010 101010 100100 010101 110100 • A seleção de um domínio apropriado 101100 100101 crucial para o êxito no 001001 desenvolvimento de um sistema 010011 inteligente. 010101 100111 • Os limites da tarefa devem ser 001101 claramente delineados. 011010 101010 100100 010101 110100 101100 Seleção do Domínio LABIC - ICMC - USP São Carlos ISISTAN-2001 é ‹# 011010 101010 100100 010101 110100 101100 Especialista(s) 100101 001001 010011 Aquisição do 010101 Conhecimento 100111 001101 011010 101010 Engenheiro do 100100 Conhecimento 010101 110100 101100 LABIC - ICMC - USP São Carlos CONSTRUÇÃO DE BASES DE CONHECIMENTO Conhecimento Adquirido Representação do Conhecimento Base de Conhecimento c/ Fatos e Relações ISISTAN-2001 ‹# 011010 101010 100100 010101 110100 Estuda o processo de transferência de 101100 100101 conhecimento do especialista para o 001001 computador. 010011 010101 100111 001101 Transfor011010 mação 101010 100100 010101 110100 101100 Engenharia de Conhecimento LABIC - ICMC - USP São Carlos ISISTAN-2001 ‹# 011010 101010 100100 010101 110100 • É o profissional que extrai o conhecimento 101100 do(s) especialista(s) --- ou de outra fonte 100101 001001 --- o interpreta e representa em tipos e 010011 estruturas de conhecimento na Base de 010101 Conhecimento. 100111 001101 011010 101010 100100 010101 110100 101100 Engenheiro de Conhecimento LABIC - ICMC - USP São Carlos ISISTAN-2001 ‹# 011010 101010 100100 010101 110100 • Especialista com dificuldades 101100 100101 para verbalizar conhecimento 001001 • Especialista pode não estar 010011 ciente de como usa o 010101 100111 conhecimento 001101 • Conhecimento Incompleto 011010 101010 • Conhecimento Incorreto 100100 010101 • Conhecimento Inconsistente 110100 101100 Problemas com AC . LABIC - ICMC - USP São Carlos ISISTAN-2001 ‹# 011010 101010 100100 010101 110100 “Programas de computador que usam 101100 100101 conhecimento representado 001001 explicitamente para resolver 010011 problemas” 010101 100111 001101 011010 101010 100100 010101 110100 101100 Sistemas Baseados em Conhecimento (SBC) LABIC - ICMC - USP São Carlos ISISTAN-2001 ‹# 011010 101010 100100 010101 110100 101100 100101 001001 010011 010101 100111 001101 011010 101010 100100 010101 110100 101100 SBC e Sistemas Especialistas LABIC - ICMC - USP São Carlos ISISTAN-2001 ‹# 011010 101010 100100 010101 110100 101100 SBCs são desenvolvidos para serem 100101 001001 usados em problemas que requerem 010011 uma quantidade considerável de 010101 conhecimento humano e de “esperteza” 100111 001101 para serem resolvidos 011010 101010 100100 010101 110100 101100 SBC LABIC - ICMC - USP São Carlos ISISTAN-2001 ‹# 011010 101010 100100 010101 110100 101100 “SEs são sistemas que são capazes de 100101 001001 oferecer soluções para problemas 010011 específicos num dado domínio ou que 010101 consigam aconselhar (dar conselhos), de 100111 uma maneira ou num nível comparável 001101 011010 ao de especialistas naquela área.” 101010 100100 010101 Lucas and van der Gaag 110100 Princípios de Sistemas Especialistas 101100 Sistemas Especialistas (SE) LABIC - ICMC - USP São Carlos ISISTAN-2001 ‹# 011010 101010 100100 010101 110100 101100 “Um Sistema Especialista, ainda que 100101 projetado e implementado de forma 001001 010011 brilhante, se é incapaz de aprender a 010101 não repetir erros, então ele não é mais 100111 001101 inteligente que uma minhoca.” 011010 101010 100100 O.G. Selfridge 010101 “The Garnen of Learning” 110100 AI Magazine 14(2), 1993 101100 Sistemas Especialistas LABIC - ICMC - USP São Carlos ISISTAN-2001 ‹# 011010 101010 100100 010101 110100 101100 100101 001001 010011 • Inteligência e Aprendizado 010101 • Engenharia de Conhecimento e SBC 100111 001101 • Dado, Informação e Conhecimento 011010 • Aprendizado de Máquina 101010 100100 • AM usando Árvores de Decisão 010101 110100 • KDD e Data Mining 101100 Tópicos LABIC - ICMC - USP São Carlos ISISTAN-2001 ‹# 011010 101010 100100 010101 110100 101100 100101 Conhecimento 001001 010011 010101 Informação 100111 001101 011010 101010 Dados 100100 010101 110100 101100 Estrutura LABIC - ICMC - USP São Carlos ISISTAN-2001 ‹# 011010 101010 100100 010101 110100 • Dado é a estrutura fundamental sobre 101100 100101 a qual um sistema de informação é 001001 construído. 010011 010101 100111 001101 011010 101010 100100 010101 110100 101100 O que é DADO? LABIC - ICMC - USP São Carlos ISISTAN-2001 ‹# 011010 101010 100100 010101 110100 • A transformação de dados em 101100 100101 informação é freqüentemente 001001 realizada através da apresentação dos 010011 dados em uma forma compreensível 010101 100111 ao usuário. 001101 011010 101010 100100 010101 110100 101100 O que é INFORMAÇÃO? LABIC - ICMC - USP São Carlos ISISTAN-2001 ‹# 011010 101010 100100 010101 110100 • Fornece a capacidade de resolver 101100 100101 problemas, inovar e aprender baseado 001001 em experiências prévias 010011 010101 • Uma combinação de instintos, idéias, 100111 regras e procedimentos que guiam as 001101 ações e decisões. 011010 101010 100100 010101 110100 101100 O que é CONHECIMENTO? LABIC - ICMC - USP São Carlos ISISTAN-2001 ‹# 011010 101010 100100 010101 110100 • Dado não é Informação 101100 100101 001001 • Informação não é Conhecimento 010011 010101 100111 • Conhecimento não é Inteligência 001101 011010 101010 • Inteligência não é Sabedoria 100100 010101 110100 101100 Importante observar .... LABIC - ICMC - USP São Carlos ISISTAN-2001 ‹# 011010 101010 100100 010101 110100 101100 100101 001001 010011 • Inteligência e Aprendizado 010101 • Engenharia de Conhecimento e SBC 100111 001101 • Dado, Informação e Conhecimento 011010 • Aprendizado de Máquina 101010 100100 • AM usando Árvores de Decisão 010101 110100 • KDD e Data Mining 101100 Tópicos LABIC - ICMC - USP São Carlos ISISTAN-2001 ‹# 011010 101010 100100 010101 110100 101100 100101 001001 Conceitos e técnicas de IA 010011 010101 100111 001101 011010 101010 Sistemas de IA 100100 010101 110100 101100 Sistemas de IA LABIC - ICMC - USP São Carlos Aprendizado de Máquina Aquisição Conhecimento Representação Manipulação ISISTAN-2001 ‹# 011010 101010 100100 010101 110100 Pode ser utilizado como meio para 101100 100101 vencer um dos maiores problemas de 001001 Sistemas de IA - o gargalo da aquisição 010011 de conhecimento 010101 100111 001101 011010 101010 100100 010101 110100 101100 Aprendizado de Máquina LABIC - ICMC - USP São Carlos ISISTAN-2001 ‹# 011010 101010 100100 010101 110100 101100 100101 Sub-área da Inteligência Artificial 001001 que pesquisa métodos computacionais 010011 010101 relacionados à aquisição de novos 100111 conhecimentos, novas habilidades e 001101 novas formas de organizar o 011010 101010 conhecimento já existente. 100100 010101 110100 101100 Aprendizado de Máquina LABIC - ICMC - USP São Carlos ISISTAN-2001 ‹# 011010 101010 100100 010101 110100 • um melhor entendimento dos 101100 100101 mecanismos de aprendizado humano 001001 010011 010101 • automação da aquisição do 100111 conhecimento 001101 011010 101010 100100 010101 110100 101100 Objetivos de AM LABIC - ICMC - USP São Carlos ISISTAN-2001 ‹# 011010 101010 100100 010101 110100 101100 100101 001001 010011 010101 100111 001101 011010 101010 100100 010101 110100 101100 AM incorpora várias técnicas de outras disciplinas Ciência da Computação Ciências Cognitivas Reconhecimento de Padrões LABIC - ICMC - USP São Carlos Aprendizado de Máquina Estatística ISISTAN-2001 ‹# 011010 101010 100100 010101 110100 101100 100101 Modo de 001001 Aprendizado - Supervisionado 010011 - Não 010101 Supervisionado 100111 001101 011010 101010 100100 010101 110100 101100 Sistemas de Aprendizado de Máquina Paradigmas de Aprendizado - Simbólico - Estatístico - Instance-Based - Conexionista - Genético LABIC - ICMC - USP São Carlos Linguagens de Descrição - Instâncias ou Exemplos - Conceitos Aprendidos ou Hipóteses - Teoria de Domínio ou Conhecimento de Fundo ISISTAN-2001 Formas de Aprendizado - Incremental - Não Incremental ‹# 011010 101010 100100 010101 110100 Qualquer que seja o tipo de 101100 100101 aprendizado, é necessário uma 001001 linguagem para descrever objetos (ou 010011 possíveis eventos) e uma linguagem 010101 100111 para descrever conceitos. Em geral, é 001101 011010 possível distinguir dois tipos de descrições para objetos: 101010 100100 010101 110100 101100 Características do Aprendizado Indutivo LABIC - ICMC - USP São Carlos ISISTAN-2001 ‹# 011010 101010 1.Descrições estruturais: um objeto é descrito 100100 em termos de seus componentes e a relação 010101 entre eles 110100 101100 100101 001001 010011 010101 100111 001101 011010 101010 100100 010101 110100 101100 LABIC - ICMC - USP São Carlos ISISTAN-2001 ‹# 011010 1010102.Descrições de atributos: um objeto é descrito 100100 em termos de suas características globais como um vetor de valores de atributos 010101 110100 101100 100101 Cubo 001001 Número de faces Polígono da face 010011 6 quadrado 010101 100111 001101 Pirâmide 011010 Número de faces Polígono da face 101010 5 triângulo 100100 010101 110100 101100 LABIC - ICMC - USP São Carlos ISISTAN-2001 ‹# 011010 101010 100100 010101 110100 • regras se-então (if-then) para 101100 100101 representar conceitos 001001 010011 010101 100111 Se Nublado ou Chovendo 001101 011010 então Levar_Guarda-Chuva 101010 100100 010101 110100 101100 Formalismos usados em AM para descrever conceitos LABIC - ICMC - USP São Carlos ISISTAN-2001 ‹# 011010 101010 100100 010101 110100 • árvores de decisão para representar 101100 100101 conceitos 001001 010011 inimigo 010101 sorri amigo 100111 segura 001101 inimigo 011010 101010 • lógica de predicados 100100 010101 filha(X, Y) <-- mulher(X), pais(X,Y). 110100 101100 Formalismos usados em AM para descrever conceitos LABIC - ICMC - USP São Carlos ISISTAN-2001 ‹# 011010 101010 100100 010101 110100 101100 1. Aprendizado Não Supervisionado: 100101 aprendizado por observação e 001001 descoberta. 010011 010101 100111 001101 011010 101010 2. Aprendizado Supervisionado: 100100 aprendizado por exemplos 010101 110100 101100 Aprendizado por Indução ?? ? ? LABIC - ICMC - USP São Carlos ISISTAN-2001 ‹# 011010 101010 100100 010101 110100 Cada exemplo é expresso por 101100 um conjunto de features 100101 001001 010011 Exemplos 010101 100111 001101 011010 101010 Caso a ser classificado: padrão 100100 de dados 010101 110100 101100 Aprendizado Supervisionado LABIC - ICMC - USP São Carlos Sistema de Aprendizado Classificador ou Preditor Classificador Decisão da Classe Associada ao Caso ISISTAN-2001 ‹# 011010 101010 100100 010101 110100 101100 100101 001001 010011 010101 100111 001101 011010 101010 100100 010101 110100 101100 Aprendizado Supervisionado Sistema de Aprendizado Exemplos Classificador ou Preditor objetiva moldar a estrutura de classificação para um problema específico, encontrando uma forma genérica de relatar um conceito. LABIC - ICMC - USP São Carlos ISISTAN-2001 ‹# 011010 101010 100100 010101 110100 •• hh vista vista como como classificador classificador 101100 100101 001001 010011 010101 100111 001101 • h vista como conjunto de regras 011010 101010 regra R 1 regra R 100100 regra R 2 1 regra ... R 2 010101 ... regra R i regra R i 110100 101100 Conhecimento Adquirido (Hipótese h) h LABIC - ICMC - USP São Carlos ISISTAN-2001 ‹# Aprendizado Indutivo de Conceitos - AIC 011010 101010 100100 010101 110100 Dados 101100 100101 + - conjunto de exemplos de = 001001 treinamento de um conceito C 010011 010101 encontrar uma hipótese H, expressa em uma 100111 linguagem de descrição L tal que: 001101 011010 101010 • cada exemplo e + é coberto por H 100100 •nenhum exemplo negativo e - é coberto 010101 por H 110100 101100 LABIC - ICMC - USP São Carlos ISISTAN-2001 ‹# 011010 101010 100100 010101 110100 101100 100101 + | cobre(H,e) = true} cobre(H, ) = {e 001001 010011 (instância positiva) 010101 100111 001101 cobre(H,) = {e - | cobre(H,e) = false} 011010 (instância negativa) 101010 100100 010101 110100 101100 Aprendizado Indutivo de Conceitos - AIC (Cont) LABIC - ICMC - USP São Carlos ISISTAN-2001 ‹# 011010 101010 100100 010101 h consistente e completa. 110100 h consistente e incompleta. 101100 h inconsistente e completa. 100101 001001 h inconsistente e incompleta. 010011 010101 + 100111 + 001101 011010 + + + 101010 100100 + + + 010101 110100 101100 Consistência e Completeza de h - - LABIC - ICMC - USP São Carlos ISISTAN-2001 - ‹# 011010 101010 100100 010101 110100 101100 100101 001001 010011 • Inteligência e Aprendizado 010101 • Engenharia de Conhecimento e SBC 100111 001101 • Dado, Informação e Conhecimento 011010 • Aprendizado de Máquina 101010 100100 • AM usando Árvores de Decisão 010101 110100 • KDD e Data Mining 101100 Tópicos LABIC - ICMC - USP São Carlos ISISTAN-2001 ‹# 011010 101010 100100 010101 110100 101100 100101 001001 010011 010101 100111 001101 011010 101010 100100 010101 110100 101100 Dados sobre Crédito Bancário Idade 20 30 60 40 ... LABIC - ICMC - USP São Carlos Renda 2000 5100 5000 6000 ... ISISTAN-2001 Classe Ruim Bom Ruim Bom ... ‹# 011010 101010 100100 010101 110100 101100 100101 001001 010011 010101 100111 001101 011010 101010 100100 010101 110100 101100 Árvore de Decisão LABIC - ICMC - USP São Carlos Renda Idade Ruim Bom ISISTAN-2001 ‹# 011010 101010 100100 010101 110100 101100 Idade < 25 100101 Sim Não 001001 010011 010101 100111 001101 011010 101010 100100 010101 110100 101100 Árvore de Decisão LABIC - ICMC - USP São Carlos Renda Idade Ruim Bom ISISTAN-2001 ‹# 011010 101010 100100 010101 110100 101100 Idade < 25 100101 Sim Não 001001 14 - Ruim 010011 0 - Bom 010101 100111 001101 011010 101010 100100 010101 110100 101100 Árvore de Decisão LABIC - ICMC - USP São Carlos Renda Idade Ruim Bom ISISTAN-2001 ‹# 011010 101010 100100 010101 110100 101100 Idade < 25 100101 Sim Não 001001 010011Ruim 010101 100111 001101 011010 101010 100100 010101 110100 101100 Árvore de Decisão LABIC - ICMC - USP São Carlos Renda Idade Ruim Bom ISISTAN-2001 ‹# 011010 101010 100100 010101 Renda 110100 101100 Idade < 25 100101 Sim Não 001001 29 - Ruim 010011Ruim 19 - Bom 010101 100111 001101 011010 101010 100100 010101 110100 101100 Árvore de Decisão LABIC - ICMC - USP São Carlos ISISTAN-2001 Idade Ruim Bom ‹# 011010 101010 100100 010101 Renda 110100 101100 Idade < 25 100101 Sim Não 001001 010011Ruim Renda > 1k 010101 Não Sim 100111 8 - Ruim 001101 0 - Bom 011010 101010 100100 010101 110100 101100 Árvore de Decisão LABIC - ICMC - USP São Carlos ISISTAN-2001 Idade Ruim Bom ‹# 011010 101010 100100 010101 Renda 110100 101100 Idade < 25 100101 Sim Não 001001 010011Ruim Renda > 1k 010101 Não Sim 100111 001101 Ruim 011010 101010 100100 010101 110100 101100 Árvore de Decisão LABIC - ICMC - USP São Carlos ISISTAN-2001 Idade Ruim Bom ‹# 011010 101010 100100 010101 Renda 110100 101100 Idade < 25 100101 Sim Não 001001 010011Ruim Renda > 1k 010101 Não Sim 100111 001101 Ruim Idade > 45 011010 101010 Sim Não 100100 010101 110100 101100 Árvore de Decisão LABIC - ICMC - USP São Carlos ISISTAN-2001 Idade Ruim Bom ‹# 011010 101010 100100 010101 Renda 110100 101100 Idade < 25 100101 Sim Não 001001 010011Ruim Renda > 1k 010101 Não Sim 100111 001101 Ruim Idade > 45 011010 101010 Sim Não 10010015 - Ruim 010101 0 - Bom 110100 101100 Árvore de Decisão LABIC - ICMC - USP São Carlos ISISTAN-2001 Idade Ruim Bom ‹# 011010 101010 100100 010101 Renda 110100 101100 Idade < 25 100101 Sim Não 001001 010011Ruim Renda > 1k 010101 Não Sim 100111 001101 Ruim Idade > 45 011010 101010 Sim Não 100100 Ruim 010101 110100 101100 Árvore de Decisão LABIC - ICMC - USP São Carlos ISISTAN-2001 Idade Ruim Bom ‹# 011010 101010 100100 010101 Renda 110100 101100 Idade < 25 100101 Sim Não 001001 010011Ruim Renda > 1k 010101 Não Sim 100111 001101 Ruim Idade > 45 011010 101010 Sim Não 100100 Ruim Renda > 5k 010101 Sim Não 110100 101100 Árvore de Decisão LABIC - ICMC - USP São Carlos ISISTAN-2001 Idade Ruim Bom ‹# 011010 101010 100100 010101 Renda 110100 101100 Idade < 25 100101 Sim Não 001001 010011Ruim Renda > 1k 010101 Não Sim 100111 001101 Ruim Idade > 45 011010 101010 Sim Não 100100 Ruim Renda > 5k 010101 Sim Não 110100 5 - Ruim 101100 Árvore de Decisão 0 - Bom LABIC - ICMC - USP São Carlos ISISTAN-2001 Idade Ruim Bom ‹# 011010 101010 100100 010101 Renda 110100 101100 Idade < 25 100101 Sim Não 001001 010011Ruim Renda > 1k 010101 Não Sim 100111 001101 Ruim Idade > 45 011010 101010 Sim Não 100100 Ruim Renda > 5k 010101 Sim Não 110100 101100 Ruim Árvore de Decisão LABIC - ICMC - USP São Carlos ISISTAN-2001 Idade Ruim Bom ‹# 011010 101010 100100 010101 Renda 110100 101100 Idade < 25 100101 Sim Não 001001 010011Ruim Renda > 1k 010101 Não Sim 100111 001101 Ruim Idade > 45 011010 101010 Sim Não 100100 Ruim Renda > 5k 010101 Sim Não 110100 1 - Ruim 101100 Ruim Árvore de Decisão LABIC - ICMC - USP São Carlos 19ISISTAN-2001 - Bom Idade Ruim Bom ‹# 011010 101010 100100 010101 Renda 110100 101100 Idade < 25 100101 Sim Não 001001 010011Ruim Renda > 1k 010101 Não Sim 100111 001101 Ruim Idade > 45 011010 101010 Sim Não 100100 Ruim Renda > 5k 010101 Sim Não 110100 101100 Ruim Árvore de Decisão LABIC - ICMC - USP São Carlos Bom ISISTAN-2001 Idade Ruim Bom ‹# 011010 101010 100100 010101 110100 101100 100101 001001 010011 010101 100111 001101 011010 101010 100100 010101 110100 101100 LABIC - ICMC - USP São Carlos Erro ISISTAN-2001 ‹# 011010 101010 100100 010101 110100 101100 100101 001001 010011 010101 100111 001101 011010 101010 100100 010101 110100 101100 LABIC - ICMC - USP São Carlos Erro ISISTAN-2001 ‹# 011010 101010 100100 010101 110100 • Principais fatores: 101100 100101 – Informação dos atributos 001001 – Adaptação do algoritmo de aprendizado 010011 010101 aos dados 100111 – Distribuição dos casos futuros 001101 – Quantidade de dados 011010 101010 100100 010101 110100 101100 Erro LABIC - ICMC - USP São Carlos ISISTAN-2001 ‹# 011010 101010 100100 010101 110100 101100 100101 001001 010011 010101 100111 001101 011010 101010 100100 010101 110100 101100 Árvore de Decisão (H1) Renda LABIC - ICMC - USP São Carlos Idade ISISTAN-2001 ‹# 011010 101010 100100 010101 110100 101100 100101 001001 010011 010101 100111 001101 011010 101010 100100 010101 110100 101100 ...Outra Possível H2 Renda LABIC - ICMC - USP São Carlos Idade ISISTAN-2001 ‹# 011010 101010 100100 010101 110100 101100 100101 001001 010011 010101 100111 001101 011010 101010 100100 010101 110100 101100 ...Outra Possível H3 Renda LABIC - ICMC - USP São Carlos Idade ISISTAN-2001 ‹# 011010 101010 100100 010101 110100 101100 100101 001001 010011 010101 100111 001101 011010 101010 100100 010101 110100 101100 ...Outra Possível H4 Renda LABIC - ICMC - USP São Carlos Idade ISISTAN-2001 ‹# 011010 101010 100100 010101 110100 101100 100101 001001 010011 010101 100111 001101 011010 101010 100100 010101 110100 101100 Qual a Melhor H? Não Esquecer o Erro... LABIC - ICMC - USP São Carlos ISISTAN-2001 ‹# 011010 101010 100100 010101 110100 101100 100101 001001 010011 010101 100111 001101 011010 101010 100100 010101 110100 101100 H4... Renda LABIC - ICMC - USP São Carlos Idade ISISTAN-2001 ‹# 011010 101010 100100 010101 110100 101100 100101 001001 010011 010101 100111 001101 011010 101010 100100 010101 110100 101100 Erro de H4 Conjunto de Teste Renda LABIC - ICMC - USP São Carlos Idade ISISTAN-2001 ‹# 011010 101010 100100 010101 110100 101100 100101 001001 010011 010101 100111 001101 011010 101010 100100 010101 110100 101100 Erro de H1 Conjunto de Teste Renda LABIC - ICMC - USP São Carlos Idade ISISTAN-2001 ‹# 011010 101010 100100 010101 110100 • Todo algoritmo indutivo tem um bias 101100 100101 001001 • Desempenho de um algoritmo varia 010011 010101 com o domínio 100111 001101 011010 • Análise Experimental é Fundamental 101010 100100 010101 110100 101100 IMPORTANTE LABIC - ICMC - USP São Carlos ISISTAN-2001 ‹# 011010 101010 100100 010101 110100 101100 100101 001001 010011 • Inteligência e Aprendizado 010101 • Engenharia de Conhecimento e SBC 100111 001101 • Dado, Informação e Conhecimento 011010 • Aprendizado de Máquina 101010 100100 • AM usando Árvores de Decisão 010101 110100 • KDD e Data Mining 101100 Tópicos LABIC - ICMC - USP São Carlos ISISTAN-2001 ‹# 011010 101010 100100 010101 110100 • Avanço da tecnologia permitiu o 101100 100101 armazenamento deExtração coleções enormes de Conhecimento 001001 de Bases de Dados de dados 010011 010101 100111 001101 011010 101010 100100 010101 110100 101100 Data Mining LABIC - ICMC - USP São Carlos ISISTAN-2001 ‹# 011010 101010 100100 010101 110100 INTERPRETAÇÃO & AVALIAÇÃO 101100 100101 DATA MINING 001001 010011 PADRÕES TRANSFORMAÇÃO 010101 100111 PRÉ-PROCESSAMENTO DADO 001101 TRANSFORMADO 011010 SELEÇÃO DADO PROCESSADO 101010 DADO 100100 DADO ANALISADO 010101 110100 101100 Processo de KDD LABIC - ICMC - USP São Carlos ISISTAN-2001 C CONHECIMENTO ‹# 011010 101010 100100 010101 110100 101100 100101 001001 010011 010101 100111 Muitos 001101 Exemplos 011010 101010 100100 010101 110100 101100 DM x AM Data Mining Aprendizado de Máquina Poucos Exemplos Poucos Atributos Muitos Atributos AM geralmente (mas não sempre) trabalha com pequena quantidade de dados, mas relevantes LABIC - ICMC - USP São Carlos ISISTAN-2001 ‹# 011010 101010 100100 010101 110100 101100 100101 001001 010011 010101 100111 Muitos 001101 Exemplos 011010 101010 100100 010101 110100 101100 DM x AM Data Mining Aprendizado de Máquina DM trabalha com grandes Poucos Poucos bases de dados reais, sendo a Exemplos Atributos eficiência muito importante LABIC - ICMC - USP São Carlos ISISTAN-2001 Muitos Atributos ‹# 011010 101010 100100 010101 110100 • Pessoas diferentes vêem IA de uma 101100 100101 maneira diferente. Duas importantes 001001 questões são: 010011 010101 – Você está interessado em pensamento ou 100111 comportamento? 001101 – Você deseja modelar seres humanos ou 011010 101010 trabalhar a partir de um padrão ideal? 100100 010101 110100 101100 Considerações Finais LABIC - ICMC - USP São Carlos ISISTAN-2001 ‹# 011010 101010 100100 010101 110100 101100 “Se o cérebro [humano] fosse tão 100101 simples que pudéssemos 001001 010011 compreendê-lo, nós seríamos tão 010101simples que não o conseguiríamos.” 100111 001101 011010 101010 100100 010101 110100 101100 LABIC - ICMC - USP São Carlos ISISTAN-2001 ‹# 011010 101010 100100 010101 110100 Este material encontra-se 101100 disponível no site do LABIC: 100101 001001 http://labic.icmc.sc.usp.br/portugues/courses.htm 010011 010101 100111 Profa. Dra. Maria Carolina Monard [email protected] 001101 011010 Design e Programação Visual: 101010 Marcos Roberto Geromini 100100 [email protected] 010101 110100 LABIC - ICMC - USP São Carlos 101100 LABIC - ICMC - USP São Carlos ISISTAN-2001 ‹#