Universidade Federal de São Carlos - UFSCar
Departamento de Computação - DC
Programa de Pós-Graduação em Ciência da Computação - PPGCC
Taxonomias Difusas em Tarefas de
Mineração
(Status do Projeto)
Aluno: Mauricio Jacó Cerri
Orientadora: Dra. Marilde Terezinha Prado Santos
Co- Orientadora: Dra. Marcela Xavier Ribeiro
Colaboração: Grupo de Banco de Dados UFSCar
Área: Banco de Dados
Roteiro

Introdução



Resumo do Projeto
Atividades Realizadas
Próximas Atividades e Cronograma
16/11/2009
Status Projeto- Mauricio J. Cerri
2/21
Roteiro

Introdução



Resumo do Projeto
Atividades Realizadas
Próximas Atividades e Cronograma
16/11/2009
Status Projeto- Mauricio J. Cerri
3/21
Resumo do Projeto - Contextualização

Mineração de Dados

Tarefa de mineração de dados:



Regra de Associação (AGRAWAL; IMIIELINSKI; SWAMI, 1993)
Obtenção de Padrão Sequencial (AGRAWAL; SRIKANT, 1995)
Melhorias na busca de informações relevantes

Busca cada vez
(Semanticamente)
maior
por
informações
NARFO (Non-redundant and generalized
Association Rule based on Fuzzy Ontologies)
16/11/2009
Status Projeto- Mauricio J. Cerri
relevantes
(MIANI et al., 2009)
4/21
Resumo do Projeto - Contextualização

Mineração de Dados utilizando Ontologias
Difusas

Ontologias


conhecimento de apoio na mineração de dados
Taxonomias

16/11/2009
grau difuso de especialização entre classes na Ontologia
Status Projeto- Mauricio J. Cerri
Fonte: Miani et al. (2009)
5/21
Resumo do Projeto - Objetivos

Baseado no algoritmo NARFO

Explorar grau de especialização classes na taxonomia
difusa

Utilizar a análise do grau de especialização para obter
padrões sequenciais
16/11/2009
Status Projeto- Mauricio J. Cerri
6/21
Roteiro



Introdução
Atividades Realizadas
Próximas Atividades e Cronograma
16/11/2009
Status Projeto- Mauricio J. Cerri
7/21
Atividades Realizadas





Estudo sobre grau de especialização entre
Classes da Ontologia;
Estudo do código fonte do algoritmo
NARFO;
Inicio dos testes e adaptações sobre grau de
especialização entre classes;
Criação e adaptação de Ontologias para
testes;
Busca de algoritmos sobre padrão
sequencial e estudo de adaptações.
16/11/2009
Status Projeto- Mauricio J. Cerri
8/21
Atividades Realizadas


Projeto para aplicação de padrão sequencial
em base médica;
Estudo contínuo.
16/11/2009
Status Projeto- Mauricio J. Cerri
9/21
Atividades Realizadas
Grau
similaridade
poderá contexto
também
Grau dede
especialização
considerando
considerar contexto
Formato
Sabor
0.8
0.9 0.6
0.9
16/11/2009
0.7
0.1
Status Projeto- Mauricio J. Cerri
10/21
Aplicação para Padrão Sequencial
16/11/2009
Status Projeto- Mauricio J. Cerri
11/21
Aplicação para Padrão Sequencial
16/11/2009
Status Projeto- Mauricio J. Cerri
12/21
Aplicação para Padrão Sequencial
16/11/2009
Status Projeto- Mauricio J. Cerri
13/21
Roteiro



Introdução
Atividades Realizadas
Próximas Atividades e Cronograma
16/11/2009
Status Projeto- Mauricio J. Cerri
14/21
Próximas Atividades e Cronograma







Conclusão da adaptação da busca pelo grau de
especialização;
Finalização dos testes e busca por contexto;
Escrita de artigo;
Melhorarias contínuas no código fonte;
Término das adaptações do Padrão Sequencial;
Inicio testes;
Escrita de Artigos.
16/11/2009
Status Projeto- Mauricio J. Cerri
15/21
Cronograma de Atividades
Preparação e Defesa da Qualificação
Levantamento bibliográfico contínuo sobre os
Melhoramento
doà proposta
NARFO apresentada
para explorar
temas pertinentes
Refinamento
e iníciona
dos
testes do
NARFO
regras
de pertinência
taxonomia
difusa
Escrita de artigo
explorar
adaptações
estendido
para para
regras
deas associação,
feitas
Adaptação grau
do de
NARFO
para padrões
considerando
pertinência
sequenciais
Refinamento
e início dos testes das
adaptações
para padrões
sequenciais
Escrita de artigo
para explorar
as adaptações
feitas referente
padrões
sequenciais
Refinamento
e ateste
do NARFO
estendido e
adaptado para padrões sequenciais
Início dos testes comparativos com outros algoritmos e análise de
Escrita de
para
as adaptações
impacto
naartigo
busca
de explorar
padrão sequencial,
mantendo os itemsets
feitas
não
frequentes
Redação
da dissertação de mestrado
Preparação para a defesa da dissertação de mestrado
16/11/2009
Qualificação - Mauricio J. Cerri
17/21
Universidade Federal de São Carlos - UFSCar
Departamento de Computação - DC
Programa de Pós-Graduação em Ciência da Computação - PPGCC
Taxonomias Difusas em Tarefas de
Mineração
(Status do Projeto)
Aluno: Mauricio Jacó Cerri
Orientadora: Dra. Marilde Terezinha Prado Santos
Co- Orientadora: Dra. Marcela Xavier Ribeiro
Colaboração: Grupo de Banco de Dados UFSCar
Área: Banco de Dados
Referências





AGRAWAL, R.; IMIELINSKI, T.; SWAMI, A. Mining association rules
between sets of items in large databases. In: ACM SIGMOD
INTERNATIONAL CONFERENCE ON MANAGEMENT OF DATA, 1993,
Washington, D.C. Proceedings... ACM, 1993. p. 207-216.
AGRAWAL, R.; SRIKANT, R. Fast Algorithms for Mining Association Rules
in Large Databases. In: INTERNATIONAL CONFERENCE ON VERY
LARGE DATA BASES, 20th, 1994, Proceedings... Morgan Kaufmann
Publishers Inc., 1994.
DUBOIS, D.; HULLERMEIER, E.; PRADE, H. A systematic approach to the
assessment of fuzzy association rules. Data Min. Knowl. Discov., v. 13, n.
2, p. 167-192, 2006.
ELMASRI, R.; NAVATHE, S. B. Sistemas de Banco de Dados. 4 ed.
Pearson Addison Wesley, 2005. 624-642 p.
FAYYAD, U. M.; PIATETSKY-SHAPIRO, G.; SMYTH, P. From data mining
to knowledge discovery: an overview. In: (Ed.). Advances in knowledge
discovery and data mining. American Association for Artificial Intelligence,
1996. p. 1-34.
16/11/2009
Status Projeto- Mauricio J. Cerri
19/21
Referências (cont. 1)






HAN, J.; KAMBER, M. Data Mining: Concepts and Techniques. 2nd ed.
San Francisco: 2006. 770 p.
HAN, J. et al. Mining Frequent Patterns without Candidate Generation: A
Frequent-Pattern Tree Approach. Data Min. Knowl. Discov., v. 8, n. 1, p.
53-87, 2004.
HULLERMEIER, E.; YI, Y. In Defense of Fuzzy Association Analysis. IEEE
Transactions on Systems, Man, and Cybernetics Part B, v. 37, n. 4, p.
1039-1043, Aug,2007, 2007.
MIANI, R. G. et al. NARFO Algorithm: Mining Non-redundant and
Generalized Association Rules Based on Fuzzy Ontologies. In:
INTERNATIONAL
CONFERENCE
ENTERPRISE
INFORMATION
SYSTEMS (ICEIS), 11th, 2009, Milan, Italy. Proceedings... 2009.
PASQUIER, N. et al. Efficient mining of association rules using closed
itemset lattices. Inf. Syst., v. 24, n. 1, p. 25-46, 1999.
PEI, J. et al. PrefixSpan: Mining Sequential Patterns Efficiently by PrefixProjected Pattern Growth. In: INTERNATIONAL CONFERENCE ON DATA
ENGINEERING, 17th, 2001, Proceedings... IEEE Computer Society, 2001.
p.
16/11/2009
Status Projeto- Mauricio J. Cerri
20/21
Referências (cont. 2)


SRIKANT, R.; AGRAWAL, R. Mining Generalized Association Rules. In:
INTERNATIONAL CONFERENCE ON VERY LARGE DATA BASES, 21th,
1995, Proceedings... Morgan Kaufmann Publishers Inc., 1995. p. 407-419.
ZAKI, M. J. SPADE: An Efficient Algorithm for Mining Frequent Sequences.
Mach. Learn., v. 42, n. 1-2, p. 31-60, 2001.
16/11/2009
Qualificação - Mauricio J. Cerri
21/21
Assunto Extra



Prontuário Eletrônico do Paciente, evolução para RES (Registro Eletrônico
de Saúde) – Palestra Beatriz Faria Leão
Software Inglês feito em .NET, será adaptado para JAVA (Brasil);
Utilização de Data Mining no projeto RES (Brasil).
16/11/2009
Qualificação - Mauricio J. Cerri
22/21
Assunto Extra
16/11/2009
Qualificação - Mauricio J. Cerri
23/21
Assunto Extra
16/11/2009
Qualificação - Mauricio J. Cerri
24/21
Download

Status - UFSCar Database Group (GBD)