Banco de Dados Multimídia Capítulo 2: Metadados UFPB/CCT/COPIN Cláudio Baptista Metadados Introdução Motivação Principais questões sobre metadados Armazenamento e captura Metadados em diferentes mídias Exemplo de metadados: Modelo ViMod Padrões de Metadados Estudo de Caso: o modelo STepLib Introdução Metadata = ‘dados sobre dados’ É metadata: um esquema conceitual num BD? um diagrama funcional num projeto de software? uma descrição de uma imagem? o próprio dado? Motivação Em dados multimídia, metadados assumem um papel especial devido a: impossibilidade de se ter consultas exatas em vários casos impossibilidade de se fazer Content-based Retrieval (CBR) em alguns casos para melhorar a qualidade das consultas CBR, pois a semântica é mais precisa por razões de performance, CBR nem sempre é recomendável em toda consulta Questões acerca de metadados Quais as características dos tipos de dados MM? Quais são exemplos típicos de metadados ? Qual o conteúdo de metadados (ontologia)? Como extrair metadados? Como metadados podem ser estruturados e armazenados? Como metadados facilitam o processo de descoberta da informação? Metadados Porquê metadata? - data discovery - data transfer - data management - data use (interpretation) como classifcar metadata? • Sistema: vocabulário, formatos, protocolos • Controle de qualidade: lineage, who, when, where, how data was collected • Semântico: data attributes, content-based attributes Hierarquia de Metadados Application Domain Dependent Higher Level of Abstraction Ontologies Lower level of Abstraction Media Dependent System Quality Control MM data Semantic Armazenamento e Captura Onde armazenar metadata? boa solução: integrar dados e metadata no modelo de dados uso da mesma API para recuperar e indexar dados e metadados. Como capturrar metadata? manualmente automaticamente semi-automaticamente Exemplos de MM metadata Imagem: resolução (dpi), formato, compressão, histogramas, mapas de gradiente and contorno,cor mais usada em background e foreground, localização, composição, data de captura. Vídeo: duração, num de frames/seg, compressão, formato, cor, textura, classificação do video, sumário, keyframes. Texto: índices sobre word tokens, author name, date, publication, abstract. Áudio: num. de samples/seg, num de canais, the coding in which it has been recorded, and a speaker, identificação da fala, duração, língua. Exemplos de MM metadata VÍDEO Subject: Campina Grande IMAGEM Compression: MPEG-2 subject: Pirâmide duration: 3’23’’ resolution: 600X800 description: festa, parque do povo. format: jpeg Class: turismo bit rate: 120 Metadados autor: Cláudio Baptista data: 24/06/2001 histograma: []bytes TEXTO Subject: Maior São João do Mundo Autor: João Ninguém data: 10/09/1997 lingua: Português palavras-chave: forró, festa, folclore, turismo tamanho: 5000 palavras Formato: PDF ÁUDIO Subject: Forró Coding: ADCPM locução: Flávio José data: 12/06/1999 duração: 3’’ Exemplo de Geo-spatial metadata General Identification: title, description, publisher, producer, progress, fees, constraints, copyright, accessibility, size Spatial Identification: bouding coordinates (west, east, north, south), scale, resolution, spatial data structure(raster/vector), spatial reference Temporal Identification: valid time, transaction time, temporal reference Exemplo: Modelo ViMod Video Features (I) Content dependent: (II) Temporal extent: frame (image) X motion (video) (III) Labeling (futebol: drible, passe, gol) Exemplo: Modelo ViMod Feature T Content dependent Data Feature Temporally extended T Video Feature T Qualitatively Labelled Video Q-feature F Meta Feature F Image Feature F T Video R-Feature Image Q-feature Qualitatively labelled F Image R-Feature ViMod: Video Q-Features (I, II, III) Feature Valor típico Shot distance Long, Medium, Close up Shot Angle Low, eye level, high Shot Motion Tracking, Dolly, Pan Audio labels Dialogue, music, Object properties People, trees Video class News, sports ViMod: Video R-Features (I, II, Raw data) Feature Valor típico Object track Set of image positions Camera pan In degrees Camera height In metres Audio levels dB levels Lighting levels Average lux ViMod: Image Q-Features (I, Frame, III) Feature Valor típico Image Brightness Indoor, outdoor, cloudy Audio properties Pitch, loudness, timbre Object name Car, tree Object color Red, blue Object location Left, center, right Object structure Shape and size ViMod: Image R-Features (I, Frame, Raw data) Feature Valor típico Histograms Arrays Edge maps Image Feature maps Image Audio FFT Maps Arrays ViMod: Meta Features (content independent) Feature Valor típico Produtor Nome Data Date Tamanho Num. Frames Tipo de Fita VHS, 8mm, VHS-C Padrões de Metadados FGDC/CSDGM Para dados espaciais Proposto pelo governo americano, porém depois influenciou o padrão ISO TC/TC11 CD 19115 ISO TC/TC11 possui dois levels • level 0: 53 elementos • level 1: mais de 400 elementos Padrões de Metadados Dublin Core Inicialmente proposto para recursos Web Possui apenas 15 elementos: Title, Creator, Subject, Description, Publisher, Contributor, Date, Type, Format, Identifier, Source, Language, Relation, Coverage, Rights. Estudo de Caso: o Modelo STepLib STepLib = SpatioTEmPoral digital LIBrary motivação: enorme volume de dados dispníveis (terabytes/day) a ubiqüidade da WWW áreas involvidas: spatiotemporal data multimedia data metadata STepLib: Spatiotemporal requirements Space Spatial data vector vs. raster Spatial operators topological, directional, metric, network, set oriented Time Temporal data Temporal operators STepLib: requisitos MM Storage, indexing, retrieving, presentation, composition, modeling Data types: text, image, video and audio Query exact match vs. partial match content-based retrieval similarity() and rank() STepLib: hierarquia de metdados Application Domain Dependent Collections Ontologies Gazetteer High level of abstraction Semantic Metadata Quality Metadata Data Dependent System Metadata Raw Data Low level of abstraction STepLib: tipos de metadados Spatiotemporal metadata bounding coordinates (W,E,N,S), theme keywords, attribute accuracy, cloud cover, date/time range, contact information MM metadata image: resolution, format, compression, … video: duration, frames/sec, keyframes, ... text: author, date, format, keywords, ... audio: samples/sec., duration, language, … STepLib: modelo de metadados Gazetteer MetaImage Image Collection Ontology MetaGeoObject FullMetadata MetaVideo MetaAudio MetaText Video Audio Text Point MetaMap Arc Polygon STepLib: coleções Collection title: Text description: Text boundingBox: Polygon period: TInterval librarian: Person creator: Person creationDate: TimeStamp datatype: DataType STepLib: MetaGeoObject MetaGeoObject title: Text theme: {Text} boundingBox: Polygon spatialReference: Text period: TInterval creator: Person creationDate: TimeStamp datatype: DataType publisher: Person annotation: Text dataQuality: Text STepLib: MetaImage MetaImage format: ImgFormat size: Integer thumbnail: Image numX: Integer numY: Integer numZ: Integer STepLib: MetaVideo MetaVideo format: VideoFormat standard:VideoStd compression: VidComp size: Real duration: Time bitRate: Real frameRate: Real STepLib: MetaAudio MetaAudio compression: AudComp size: Real sampleRate: Real bitRate: Real channel: Integer duration: Time STepLib: MetaText MetaText language: Text format: TextFormat size: Real wordCount: Integer STepLib: MetaMap MetaMap scale: Real STepLib: MetaMap Point latitude: Real longitude: Real altitude: AltRange time:Time theme: Text feature: Text STepLib: MetaMap LineString points: List altitude: AltRange time:Time theme: Text feature: Text STepLib: MetaMap Polygon points: List altitude: AltRange time:Time theme: Text feature: Text