KDD – KNOWLEDGE DISCOVERY IN DATABASES (DESCOBERTA DE
CONHECIMENTO EM BASES DE DADOS)
Elaine Tonon dos Santos
Luciana de Souza
Patrícia Silveira
Vanessa Nayara Leandro Cardoso
Orientador: Prof. Ricardo Mattos
KDD refere-se a uma técnica no qual do processo é extraído conhecimento através de
informações contidas numa base de dados, essas informações possuem interesse por
assunto e validade. Esse processo surgiu para amenizar o volume de bases de dados que
evoluiu rapidamente, com ele foi possível automatizar a exploração das bases de dado e
reconhecimento de modelagem de informação. As extrações desse processo possuem
etapas não comuns, sendo elas: Interativo e Iterativo, onde cada uma produz um
conjunto de conhecimentos, de informação em métodos de leitura e análise. O interativo
refere-se ao controle humano sobre o processo, no sentido de analisar e interpretar os
dados padrões. No iterativo há possibilidade de repetições integrais ou parciais do
processo em busca de alcançar resultados satisfatórios. São informações essenciais para
uma tomada de decisão. É de suma importância uma adequada seleção de dados e
definição de determinado assunto, restringindo-se assim somente informações úteis e
válidas. A extração do conhecimento detecta a informação mais profunda entre os
bancos de dados, como data mining (mineração de dados). O KDD segue etapas
planejadas em sequencia e repetidas, se necessária, em busca de informações
importantes para tomada de decisão sobre um projeto ou ação. Ele possui em seus
bancos de dados depósitos de conhecimento potencial, onde encontramos tudo sobre
determinado assunto. As principais fases do processo de KDD são: Definição do
problema; seleção, limpeza, pré-processamento, transformação, mineração e
interpretação dos dados. Onde, se define o problema a ser resolvido, analisa os dados
existentes e seleciona aqueles que serão utilizados na geração de um novo
conhecimento, sendo esses válidos, são aplicadas técnicas de redução de
dimensionalidade e projeção dos dados, busca-se padrões através de equações
matemáticas e técnicas específicas, por fim, analisa os resultados das técnicas da
mineração e gera o conhecimento utilizando-se dos resultados em pró do negócio. As
tarefas de KDD são: Regras de associação, classificação e clustering. Cada uma
depende da ação e interesse do usuário, pois cada uma refere-se a uma informação
especifica. As principais tecnologias são: Data Warehousing (organização de dados),
distribuição de banco de dados, sistemas especialistas, redes neurais e interfaces. Entre
o KDD e os Sistemas de Informação há uma importante relação. O sistema de
informação compõe-se de um conjunto de dados armazenados em memoria permanente.
A extração do KDD seleciona e processa cada dado visando encontrar padrões novos,
sua necessidade e modelá-los. Portanto, KDD busca um novo conhecimento útil para
aumentar os ganhos e reduzir os custos, melhorando assim o desempenho do negócio,
através da procura e seleção de dados armazenados. A técnica de KDD é considerada
essencial para análise de comportamentos podendo ser aplicada em várias situações.
Resumo aprovado e apresentado no dia 28 de Novembro de 2012, conforme normas da X Mostra
Científica do Centro de Ensino Superior de Catalão - CESUC
Download

Clique aqui para abrir o artigo