I Workshop GERINDO Grupo de Bancos de Dados DCC/UFMG Hotel Floresta Mágica Abril de 2003 Equipe Professores Alberto Laender Berthier Ribeiro-Neto Wagner Meira Jr. Alunos de Doutorado Guilherme Tavares (*) Joyce Carvalho Karla Borges Manoel Moreira Pável Calado - LATIN Alunos de Mestrado Daniel de Moura (*) Davi Reis David Viscarra (*) Evandrino Barros (*) Jean de Oliveira (*) Juliano Lage Lena Veiga e Silva (*) Olga de Oliveira Robson Braga Tiago Delboni Alunos de Graduação Monique Vieira Pablo Roberto Linhas de Pesquisa Categorização Automática de Documentos Extração e Integração de Dados da Web Geração de extratores resilientes e adaptáveis Integração de dados por similaridade Extração de dados para aplicações georreferenciadas Gerência de Documentos XML Geração de vocabulários utilizando técnicas de mineração de dados Representação relacional de dados XML Consulta a documentos XML comprimidos Bibliotecas Digitais BDBComp - Biblioteca Digital Brasileira de Computação BDBComp Biblioteca Digital Brasileira de Computação Coleta preliminar de dados concluída (>50 sites) Próximas etapas: Consolidação do repositório de metadados de acordo com o padrão open archives Geração da biblioteca (indexação) Implementação dos serviços básicos (browsing e searching) Versão alfa disponível para demonstração no SBBD em Manaus (outubro) Outros serviços: Integração com outras BDs (ex., DBLP, Lattes) Submissão de coleções (ex., anais de eventos) Disponibilização de textos completos (artigos, teses, dissertações, etc.) BDBComp Coleta Preliminar de Dados S1 S BB D/SB E S 2002 S2 S BRC 2002 W1 W2 X1 X2 C1 C2 RF .... Sn J BCS Wn Xn Cn