Sistemas de Apoio à Decisão (SAD) Decision Support Systems Andreas Wichert LEIC Tagus (Página da cadeira: Fenix) Objectivo Geral Acumular informação para produzir indicadores de negócio que permitam tomar decisões Extracção de conhecimento interessante (regras, padrões, restrições) dos dados existentes em grandes BDs Corpo docente Andreas Wichert - Teóricas [email protected] Helena Galhardas José Barateiro - Laboratórios Organização das aulas Teóricas: Matéria (slides baseados no livro e artigos) Apresentação de pessoas externas Práticas/Laboratório: Exercícios Utilização do SW SAS v. 9 Ínicio: 6/3 Avaliação Projecto DW (PDW): grupos de 3 pessoas – 40% Projecto DM (PDM): mesmos grupos de 3 pessoas – 30% Nota mínima: 9,5v Inscrições na página da cadeira no Fenix (agrupamentos) Entrega do enunciado: 13 Março Entrega do projecto: 31 Março Discussões: 3 a 7 Abril Nota mínima: 9,5v Entrega do enunciado: 24 Abril Entrega do projecto: 2 Junho Discussões: 12 -16 Junho Exame (DM): individual – 30% Nota mínima: 9,5v 1º Exame: 20/6, 17H 2º Exame: 15/7, 11H Data Mining: Concepts and Techniques Reconhecimento Zur Anzeige wird der Qui ckTime™ Dekompres sor „TIFF (Unkomprimiert)“ benöti gt. Prof. Jiawei Han [email protected] University of Illinois at Urbana-Champaign http://www-sal.cs.uiuc.edu/~hanj/ Slides: http://www-sal.cs.uiuc.edu/~hanj/bk2/ Bibliografia - DW Data Mining: Concepts and Techniques, J. Han & M. Kamber, Morgan Kaufmann, 2001 The Data Warehouse Toolkit, 2nd ed, Ralph Kimball, Margy Ross, 2002 Bibliografia - DM Artificial ,Intelligence - A Modern Approach, Second Edition, S. Russel and P. Norvig, Prentice Hall, 2003 Machine Learning, T. Mitchell, 1997 Artificial Intelligence - Structures and Strategies for Complex Problem Solving, Second Edition, G. L. Luger and W. A. Stubblefield, Benjamin/Cummings Publishing, 1993 Programa Datawarehouse (DW) e Sistemas de Apoio à Decisão Modelo multidimensional vs modelo relacional, Teoria da normalização do modelo relacional Operações OLAP (Online Analytical Processing) Desenho de DW Arquitectura de DW Implementação de DW Programa Pré-processamento, transformação e limpeza de dados Exploração de dados (data mining) Descrição de conceitos e generalização de dados Árvores de decisão Redes neuronais Redes bayesianas Regras de associação Análise de clusters Classificação baseada em instâncias Informação necessária para apoio à decisão Características requeridas para a informação utilizada para a tomada de decisão: precisa fiável actualizada relevante orientada à acção Sistemas operacionais Contabilidade, compras, reservas, telecomunicações, etc Muitas fontes de dados dispersas (ficheiros excel, BD Access) de suporte a aplicações do tipo: SAP, ERPs, etc Alguns problemas: acesso aos dados díficil, qualidade de dados duvidosa, dados estruturados à aplicação (ex: códigos específicos), suporte a interrogações simples Conceito de um DW Conjunto centralizado de dados: temáticos históricos datados integrados que oferece um nível de qualidade adequado às aplicações de decisão Arquitectura geral SAD Metadata OLAP Server other sources Extract Transform Load Refresh Operational DBs Data Sources Data Warehouse Serve Analysis Query Reports Data mining Data Marts Data Storage OLAP Engine Front-End Tools What is Data Mining ? http://www-sal.cs.uiuc.edu/~hanj/ Chapter 1, Slides: http://www-sal.cs.uiuc.edu/~hanj/bk2/