PROPOSTA DE UM ARCABOUÇO PARA A INDEXAÇÃO DE PESSOAS APLICADOS AO ACERVO FOTOGRÁFICO DA CASA CIVIL DO ESTADO DE MINAS GERAIS. Camillo Jorge Santos Oliveira*, David Lunardi Flam*, Arnaldo de Albuquerque Araújo* e Pedro Brito Soares† (*) Departamento de Ciência da Computação – DCC/UFMG, (†) Arquivo Público Mineiro – APM Introdução Com a melhoria dos recursos computacionais para a aquisição, o armazenamento e a transmissão de imagens digitais, tem-se um aumento na quantidade das bases de imagens digitais e a velocidade na geração destas bases de informações digitais é muito maior que velocidade utilizada para catalogar e organizar estas bases. A forma mais comum de promover a indexação de uma base de imagens fotográficas seria por intermédio de anotações feitas das imagens. Um bom exemplo é o acervo de fotografias da Casa Civil do Estado de Minas Gerais pertencente ao Arquivo Público Mineiro (APM). São coleções, muitas vezes completas, da vida pública de personalidades. Depois da digitalização das coleções, um árduo trabalho de anotações, fotografia por fotografia, é realizado por especialistas em história. O trabalho consiste em identificar os vários personagens existentes nas diversas fotografias da base. Este trabalho propõe um arcabouço capaz de auxiliar na identificação, identificação e recuperação de faces de personalidades da base digital de fotografias do acervo da Casa Civil do Estado de Minas Gerais, utilizando informações visuais de baixo nível das fotografias (cor, forma e textura). O arcabouço realiza a identificação de faces nas fotografias, extração e indexação assistida por intermédio de um especialista. Materiais e Métodos Baseando-se no acervo fotográfico da Casa Civil do Estado de Minas Gerais, pertencente ao APM, que atualmente possui 60.000 fotografias. O arcabouço proposto, Figura 1, possui quatro bases: a base de imagens, base de faces, a base de assinaturas e a base de textos. Possui um módulo detector responsável pela detecção de faces nas fotografias; o módulo extrator responsável pela extração da face e inclusão da mesma na base de faces; o módulo extrator de assinaturas, trata-se da representação matemática para cada face; o módulo identificador responsável pela identificação das faces (esta identificação é assistida por um especialista); e o módulo indexador responsável pela geração de índices. O módulo indexador realiza a indexação de todas as informações das bases, ou seja, mapeia as faces extraídas, informando nas quais imagens aparecem, associando também com a base de textos anotados das imagens. O arcabouço possui uma interface para três tipos de usuários: o usuário operador responsável pela inclusão de imagens; o usuário comum responsável por realizar dois tipos de consultas, por texto e por face; e o usuário especialista (historiador) responsável pela identificação das faces e submissão para indexação. A detecção de uma face em uma imagem utiliza informações de baixo nível de bordas e escalas de cinzas n (1). Fig. 1 Esboço do arcabouço proposto. Resultados O arcabouço proposto utiliza informações de baixo nível das imagens, tais como: cor e escala de cinza. Detectada as faces nas imagens com 85% de acerto. Empregou-se uma busca exaustiva movendo-se uma janela de avaliação com vários tamanhos sobre toda a imagem com o histograma dos níveis de cinza equalizados, para minimizar os problemas com a luminosidade e remover variações no brilho e no contraste. Obteve-se 81,4% de acertos. Os resultados iniciais foram classificados utilizando a técnica de Support Vector Machine (SVM) (2). Trata-se de uma técnica de classificação que encontra o hiperplano ótimo capaz de separar duas classes em questão, neste caso faces x não faces, encontrou face x não encontrou fac. Conclusões Conclui-se que ainda tem muito a explorar na detecção e recuperação de faces neste arcabouço. Para o futuro deve-se implementar outros métodos que se encaixem melhor ao problema da detecção e busca de faces, visando aumentar a porcentagem de acertos. Referências (1) Hjelmas, E.; Low, B. K.; Face Detection: a Survey, 2001, Computer Vison and Image Understanding, Vol. 83, pag. 236-274. (2) Burges, C. J. C.; A Tutorial on Support Vector Machines for Pattern Recognition, 1998, Kluwer Academic Publishers, Boston. Manufactured in The Netherlands, pág. 1-43. E-Mails dos Autores {camillo, david, arnaldo}@dcc.ufmg.br [email protected] ARC • Revista Brasileira de Arqueometria Restauração Conservação • Edição Especial • Nº 1 • MARÇO 2006 • AERPA Editora Resumos do III Simpósio de Técnicas Avançadas em Conservação de Bens Culturais - Olinda 2006 59