Tópicos de projetos da disciplina
de mineração de dados 2001.1
Jacques Robin e Francisco Carvalho
CIn-UFPE
Lista de tópicos

Desenvolvimento de ferramentas:
• Implementar algoritmo de mineração de exceções em cuboides OLAP
• Implementar processador de consultas DMQL usando o Weka
• Estender uma API para consulta de data warehouses multidimensionais a
partir de bancos de dados dedutivos orientado a objetos
• Estender engenho de busca na Web com agrupamento de páginas baseado
em similaridade tanto do conteúdo das páginas como dos links entre elas

Mineração de flat file:
• Minerar warehouse do ProDoc

Mineração de data warehouse
• Minerar warehouse de estatísticas de futebol de robôs com
MS OLAP Server ou Weka ou Progol
• Minerar warehouse da Covest com SQL Server e Weka
• Minerar warehouse de dados epidemiológicos do DataSus
com SQL Server e Weka
Lista de tópicos

Mineração da Web:
• Minerar páginas Web contendo estatísticas esportivas (ex, www.nba.com,
sports.espn.go.com) com Java, XSB e SQL Server, e possivelmente
também Weka e Progol
• Minerar arquivo de log do servidor Web do CIn-UFPE ou do Radix.com
com SQL Server e Weka
Implementação de algoritmo de mineração
de exceções em hipercubos OLAP
Examples: Discovery-Driven Data Cubes
Exemplo detalhado: preparação de dados
Ferramenta de
modelagem E-R
Log do
Soccer
Server
Data Mart
ROLAP
Serviços de
transformação
de dados
Microsoft
SQL Server
Log do
Soccer
Server
SGBD
relacional
Hipercubo
OLAP
derivados
Hipercubo
OLAP
primitivo
Servidor
OLAP
JODI: API
OLE DB for OLAP / Java
API
XSB-SQL
InterProlog
API Java / XDB
Sistema dedutivo
XSB
DOODI: API
OLE DB for OLAP / XSB
Exemplo detalhado: mineração dos dados
Hipercubo
OLAP
derivados
Data Mart
ROLAP
Servidor
OLAP
Microsoft
SQL Server
Caracterização Multi-dimensional
dos resultados das partidas em função
das estatísticas de fases de jogo e
da taxa de sucesso de cada tipo de jogada
SGBD
relacional
JDBC
Weka
Previsão do sucesso de uma jogada
em função do seu contexto no jogo
Previsão da melhor jogada a tentar
para cada contexto de jogo
Clusters de jogadas
Download

KDDprojects