Avaliação Automática de Migração em Redes Distribuídas de Conversores Miguel Ferreira [email protected] 2005-10-28 Ana Alice Baptista [email protected] José Carlos Ramalho [email protected] Conteúdo • Introdução de conceitos • Problema de investigação • Sistema proposto • Metodologia de investigação • Conclusões Introdução de conceitos • Preservação digital – Conjunto de actividades responsáveis por garantir o acesso continuado à informação existente em formatos digitais • Objecto digital – Todo o objecto de informação que possa ser representado por uma sequência de dígitos binários (bit stream) – Documentos de texto, fotografias digitais, gráficos vectoriais, bases de dados, páginas Web, software Estratégias de preservação digital • Emulação – Software capaz de reproduzir o comportamento de uma plataforma de hardware e/ou software • Encapsulamento – Conservação junto do objecto digital de toda a informação necessária à sua interpretação – Conversores, visualizadores ou emuladores • Migração – Transferência periódica de material digital de uma configuração de hardware/software para uma outra • Outras – Museus de computadores, visualizadores, Computador Virtual Universal (UVC) Migração • Vantagens – Disseminação em formatos actualizados • Desvantagens – Diligência contínua – Perda de informação • Variantes – Migração-a-pedido – Normalização – Migração distribuída Migração distribuída • Rede distribuída de serviços de conversão • Vantagens – – – – – Independente da plataforma Redundância Múltiplos caminhos de migração Redução de custos Compatível com as restantes variantes de migração • Desvantagens – Largura de banda – Lento Conversion A-E • Exemplos Format C Conversion A-C n Co nv B- ers C io Co n io rs ve o n C -D nv e A- rsio B n Format B Format E Conversion C-E C – PANIC – MyMorph (NLMed) – TOM Format A Conversion B-C n si o er nv E Co D - Format D Qual a melhor estratégia de preservação? • Muitas alternativas existentes • Falta de aceitação universal • Depende dos requisitos individuais de cada organização – Satisfação da comunidade de interesse – Características da colecção – Orçamento disponível • Framework de avaliação de estratégias – Análise de utilidade Avaliação de estratégias de preservação 1. 2. Definição da árvore-objectivo Atribuição de unidades de medida 3. Identificação de alternativas de preservação Execução das alternativas e avaliação dos resultados Pesagem da árvore-objectivo Cálculo de valores parciais e totais Ranking das alternativas 4. 5. 6. 7. (e.g. millimetro, Mb, Euro) Árvore-objectivo [exemplo] Problemas em aberto • Automatização dos processos de preservação • Autenticidade • Gestão de custos • Avaliação de alternativas de preservação Questões de investigação • Será exequível desenhar um sistema capaz de automaticamente: – Determinar a quantidade de informação perdida numa migração e gerar relatórios de qualidade para inclusão na metainformação de preservação? – Produzir sugestões sobre quais os formatos destino ou caminhos de migração que melhor poderão satisfazer as necessidades de cada utilizador/organização? Sistema proposto Evaluate migration [Original object] [Migrated object] [Process metrics] Request Migration [Source object] [Migration report] [Migrated Object] [Migration Report] Migration Evaluator Meta Converter Request Advice [Migration Advice] Invoke Migration [Source object] [Migration advice] port] [Par [Criteria] User tion re KB ry M Que ameters] Request advice [Criteria] Store [Migra Migration Advisor [Migrated object] Migration Network [Mig ratio n da ta] Migration Knowledge Base (MKB) Sistema proposto Evaluate migration [Original object] [Migrated object] [Process metrics] Request Migration [Source object] [Migration report] [Migrated Object] [Migration Report] Migration Evaluator Meta Converter Request Advice [Migration Advice] Invoke Migration [Source object] [Migration advice] port] [Par [Criteria] User tion re KB ry M Que ameters] Request advice [Criteria] Store [Migra Migration Advisor [Migrated object] Migration Network [Mig ratio n da ta] Migration Knowledge Base (MKB) Sistema proposto Evaluate migration [Original object] [Migrated object] [Process metrics] Request Migration [Source object] [Migration report] [Migrated Object] [Migration Report] Migration Evaluator Meta Converter Request Advice [Migration Advice] Invoke Migration [Source object] [Migration advice] port] [Par [Criteria] User tion re KB ry M Que ameters] Request advice [Criteria] Store [Migra Migration Advisor [Migrated object] Migration Network [Mig ratio n da ta] Migration Knowledge Base (MKB) Sistema proposto Evaluate migration [Original object] [Migrated object] [Process metrics] Request Migration [Source object] [Migration report] [Migrated Object] [Migration Report] Migration Evaluator Meta Converter Request Advice [Migration Advice] Invoke Migration [Source object] [Migration advice] port] [Par [Criteria] User tion re KB ry M Que ameters] Request advice [Criteria] Store [Migra Migration Advisor [Migrated object] Migration Network [Mig ratio n da ta] Migration Knowledge Base (MKB) Sistema proposto Evaluate migration [Original object] [Migrated object] [Process metrics] Request Migration [Source object] [Migration report] [Migrated Object] [Migration Report] Migration Evaluator Meta Converter Request Advice [Migration Advice] Invoke Migration [Source object] [Migration advice] port] [Par [Criteria] User tion re KB ry M Que ameters] Request advice [Criteria] Store [Migra Migration Advisor [Migrated object] Migration Network [Mig ratio n da ta] Migration Knowledge Base (MKB) Sistema proposto Evaluate migration [Original object] [Migrated object] [Process metrics] Request Migration [Source object] [Migration report] [Migrated Object] [Migration Report] Migration Evaluator Meta Converter Request Advice [Migration Advice] Invoke Migration [Source object] [Migration advice] port] [Par [Criteria] User tion re KB ry M Que ameters] Request advice [Criteria] Store [Migra Migration Advisor [Migrated object] Migration Network [Mig ratio n da ta] Migration Knowledge Base (MKB) Prova de conceito [metodologia] • Quantificação automática de perda de informação – Evaluator vs Avaliação humana • Recomendação de estratégias de migração – Advisor - cross-validation Contributos esperados • Para indivíduos, arquivos e bibliotecas digitais: – Outsourcing e automatização da preservação digital – Geração de metainformação de preservação (autenticidade) – Ranking de alternativas de migração • Para programadores de conversores: – Possibilidade de publicar os seus serviços de conversão – Benchmarking de conversores • Para criadores e utilizadores de metainformação: – Estimular a adopção de normas recém criadas (e.g. PREMIS) – Acelerar a criação de representações XML Conclusões • Arquitectura orientada ao serviço (SOA) • Quantificação automática de perda de informação • Recomendação de formatos destino e caminhos de migração • Simplifica a criação de metainformação de preservação