KDD – KNOWLEDGE DISCOVERY IN DATABASES (DESCOBERTA DE CONHECIMENTO EM BASES DE DADOS) Elaine Tonon dos Santos Luciana de Souza Patrícia Silveira Vanessa Nayara Leandro Cardoso Orientador: Prof. Ricardo Mattos KDD refere-se a uma técnica no qual do processo é extraído conhecimento através de informações contidas numa base de dados, essas informações possuem interesse por assunto e validade. Esse processo surgiu para amenizar o volume de bases de dados que evoluiu rapidamente, com ele foi possível automatizar a exploração das bases de dado e reconhecimento de modelagem de informação. As extrações desse processo possuem etapas não comuns, sendo elas: Interativo e Iterativo, onde cada uma produz um conjunto de conhecimentos, de informação em métodos de leitura e análise. O interativo refere-se ao controle humano sobre o processo, no sentido de analisar e interpretar os dados padrões. No iterativo há possibilidade de repetições integrais ou parciais do processo em busca de alcançar resultados satisfatórios. São informações essenciais para uma tomada de decisão. É de suma importância uma adequada seleção de dados e definição de determinado assunto, restringindo-se assim somente informações úteis e válidas. A extração do conhecimento detecta a informação mais profunda entre os bancos de dados, como data mining (mineração de dados). O KDD segue etapas planejadas em sequencia e repetidas, se necessária, em busca de informações importantes para tomada de decisão sobre um projeto ou ação. Ele possui em seus bancos de dados depósitos de conhecimento potencial, onde encontramos tudo sobre determinado assunto. As principais fases do processo de KDD são: Definição do problema; seleção, limpeza, pré-processamento, transformação, mineração e interpretação dos dados. Onde, se define o problema a ser resolvido, analisa os dados existentes e seleciona aqueles que serão utilizados na geração de um novo conhecimento, sendo esses válidos, são aplicadas técnicas de redução de dimensionalidade e projeção dos dados, busca-se padrões através de equações matemáticas e técnicas específicas, por fim, analisa os resultados das técnicas da mineração e gera o conhecimento utilizando-se dos resultados em pró do negócio. As tarefas de KDD são: Regras de associação, classificação e clustering. Cada uma depende da ação e interesse do usuário, pois cada uma refere-se a uma informação especifica. As principais tecnologias são: Data Warehousing (organização de dados), distribuição de banco de dados, sistemas especialistas, redes neurais e interfaces. Entre o KDD e os Sistemas de Informação há uma importante relação. O sistema de informação compõe-se de um conjunto de dados armazenados em memoria permanente. A extração do KDD seleciona e processa cada dado visando encontrar padrões novos, sua necessidade e modelá-los. Portanto, KDD busca um novo conhecimento útil para aumentar os ganhos e reduzir os custos, melhorando assim o desempenho do negócio, através da procura e seleção de dados armazenados. A técnica de KDD é considerada essencial para análise de comportamentos podendo ser aplicada em várias situações. Resumo aprovado e apresentado no dia 28 de Novembro de 2012, conforme normas da X Mostra Científica do Centro de Ensino Superior de Catalão - CESUC