Banco de Dados Multimídia
Capítulo 2: Metadados
UFPB/CCT/COPIN
Cláudio Baptista
Metadados
Introdução
Motivação
Principais questões sobre metadados
Armazenamento e captura
Metadados em diferentes mídias
Exemplo de metadados: Modelo ViMod
Padrões de Metadados
Estudo de Caso: o modelo STepLib
Introdução
Metadata = ‘dados sobre dados’
É metadata:
 um esquema conceitual num BD?
um diagrama funcional num projeto de
software?
uma descrição de uma imagem?
o próprio dado?
Motivação
Em dados multimídia, metadados
assumem um papel especial devido a:
impossibilidade de se ter consultas exatas
em vários casos
impossibilidade de se fazer Content-based
Retrieval (CBR) em alguns casos
para melhorar a qualidade das consultas
CBR, pois a semântica é mais precisa
por razões de performance, CBR nem sempre
é recomendável em toda consulta
Questões acerca de metadados
 Quais as características dos tipos de dados MM?
 Quais são exemplos típicos de metadados ?
 Qual o conteúdo de metadados (ontologia)?
 Como extrair metadados?
 Como metadados podem ser estruturados e
armazenados?
 Como metadados facilitam o processo de descoberta da
informação?
Metadados
 Porquê metadata?
- data discovery
- data transfer
- data management
- data use (interpretation)
 como classifcar metadata?
• Sistema:
vocabulário, formatos, protocolos
• Controle de qualidade:
lineage, who, when, where, how data was collected
• Semântico:
data attributes, content-based attributes
Hierarquia de Metadados
Application Domain
Dependent
Higher Level of
Abstraction
Ontologies
Lower level of
Abstraction
Media
Dependent
System
Quality
Control
MM data
Semantic
Armazenamento e Captura
 Onde armazenar metadata?
boa solução: integrar dados e metadata no modelo de
dados
 uso da mesma API para recuperar e indexar dados e
metadados.
 Como capturrar metadata?
 manualmente
 automaticamente
 semi-automaticamente
Exemplos de MM metadata
Imagem: resolução (dpi), formato, compressão,
histogramas, mapas de gradiente and contorno,cor
mais usada em background e foreground,
localização, composição, data de captura.
Vídeo: duração, num de frames/seg, compressão, formato,
cor, textura, classificação do video, sumário,
keyframes.
Texto: índices sobre word tokens, author name, date,
publication, abstract.
Áudio: num. de samples/seg, num de canais,
the coding in which it has been recorded, and a
speaker, identificação da fala, duração, língua.
Exemplos de MM metadata
VÍDEO
Subject: Campina Grande
IMAGEM
Compression: MPEG-2
subject: Pirâmide
duration: 3’23’’
resolution: 600X800
description: festa, parque do povo.
format: jpeg
Class: turismo
bit rate: 120
Metadados
autor: Cláudio Baptista
data: 24/06/2001
histograma: []bytes
TEXTO
Subject: Maior São João do Mundo
Autor: João Ninguém
data: 10/09/1997
lingua: Português
palavras-chave: forró, festa, folclore, turismo
tamanho: 5000 palavras
Formato: PDF
ÁUDIO
Subject: Forró
Coding: ADCPM
locução: Flávio José
data: 12/06/1999
duração: 3’’
Exemplo de Geo-spatial
metadata
General Identification: title, description,
publisher, producer, progress, fees,
constraints, copyright, accessibility, size
Spatial Identification: bouding coordinates
(west, east, north, south), scale,
resolution, spatial data
structure(raster/vector), spatial reference
Temporal Identification: valid time,
transaction time, temporal reference
Exemplo: Modelo ViMod
Video Features
 (I) Content dependent:
 (II) Temporal extent: frame (image) X
motion (video)
(III) Labeling (futebol: drible, passe, gol)
Exemplo: Modelo ViMod
Feature
T
Content
dependent
Data Feature
Temporally
extended
T
Video Feature
T
Qualitatively
Labelled
Video
Q-feature
F
Meta Feature
F
Image Feature
F
T
Video
R-Feature
Image
Q-feature
Qualitatively
labelled
F
Image
R-Feature
ViMod: Video Q-Features
(I, II, III)
Feature
Valor típico
Shot distance
Long, Medium, Close up
Shot Angle
Low, eye level, high
Shot Motion
Tracking, Dolly, Pan
Audio labels
Dialogue, music,
Object properties
People, trees
Video class
News, sports
ViMod: Video R-Features
(I, II, Raw data)
Feature
Valor típico
Object track
Set of image positions
Camera pan
In degrees
Camera height
In metres
Audio levels
dB levels
Lighting levels
Average lux
ViMod: Image Q-Features
(I, Frame, III)
Feature
Valor típico
Image Brightness
Indoor, outdoor, cloudy
Audio properties
Pitch, loudness, timbre
Object name
Car, tree
Object color
Red, blue
Object location
Left, center, right
Object structure
Shape and size
ViMod: Image R-Features
(I, Frame, Raw data)
Feature
Valor típico
Histograms
Arrays
Edge maps
Image
Feature maps
Image
Audio FFT Maps
Arrays
ViMod: Meta Features
(content independent)
Feature
Valor típico
Produtor
Nome
Data
Date
Tamanho
Num. Frames
Tipo de Fita
VHS, 8mm, VHS-C
Padrões de Metadados
FGDC/CSDGM
Para dados espaciais
Proposto pelo governo americano, porém
depois influenciou o padrão ISO TC/TC11 CD
19115
ISO TC/TC11 possui dois levels
• level 0: 53 elementos
• level 1: mais de 400 elementos
Padrões de Metadados
Dublin Core
Inicialmente proposto para recursos Web
Possui apenas 15 elementos: Title, Creator,
Subject, Description, Publisher, Contributor,
Date, Type, Format, Identifier, Source,
Language, Relation, Coverage, Rights.
Estudo de Caso: o Modelo
STepLib
STepLib = SpatioTEmPoral digital LIBrary
motivação:
enorme volume de dados dispníveis
(terabytes/day)
a ubiqüidade da WWW
áreas involvidas:
spatiotemporal data
multimedia data
metadata
STepLib: Spatiotemporal
requirements
Space
Spatial data
vector vs. raster
 Spatial operators
 topological, directional, metric, network, set
oriented
Time
Temporal data
Temporal operators
STepLib: requisitos MM
Storage, indexing, retrieving,
presentation, composition, modeling
 Data types: text, image, video and audio
Query
exact match vs. partial match
content-based retrieval
similarity() and rank()
STepLib: hierarquia de
metdados
Application
Domain
Dependent
Collections
Ontologies
Gazetteer
High level of
abstraction
Semantic Metadata
Quality Metadata
Data
Dependent
System Metadata
Raw Data
Low level of
abstraction
STepLib: tipos de
metadados
Spatiotemporal metadata
bounding coordinates (W,E,N,S), theme
keywords, attribute accuracy, cloud cover,
date/time range, contact information
MM metadata
image: resolution, format, compression, …
video: duration, frames/sec, keyframes, ...
text: author, date, format, keywords, ...
audio: samples/sec., duration, language, …
STepLib: modelo de
metadados
Gazetteer
MetaImage
Image
Collection
Ontology
MetaGeoObject
FullMetadata
MetaVideo
MetaAudio
MetaText
Video
Audio
Text
Point
MetaMap
Arc
Polygon
STepLib: coleções
Collection
title: Text
description: Text
boundingBox: Polygon
period: TInterval
librarian: Person
creator: Person
creationDate: TimeStamp
datatype: DataType
STepLib: MetaGeoObject
MetaGeoObject
title: Text
theme: {Text}
boundingBox: Polygon
spatialReference: Text
period: TInterval
creator: Person
creationDate: TimeStamp
datatype: DataType
publisher: Person
annotation: Text
dataQuality: Text
STepLib: MetaImage
MetaImage
format: ImgFormat
size: Integer
thumbnail: Image
numX: Integer
numY: Integer
numZ: Integer
STepLib: MetaVideo
MetaVideo
format: VideoFormat
standard:VideoStd
compression: VidComp
size: Real
duration: Time
bitRate: Real
frameRate: Real
STepLib: MetaAudio
MetaAudio
compression: AudComp
size: Real
sampleRate: Real
bitRate: Real
channel: Integer
duration: Time
STepLib: MetaText
MetaText
language: Text
format: TextFormat
size: Real
wordCount: Integer
STepLib: MetaMap
MetaMap
scale: Real
STepLib: MetaMap
Point
latitude: Real
longitude: Real
altitude: AltRange
time:Time
theme: Text
feature: Text
STepLib: MetaMap
LineString
points: List
altitude: AltRange
time:Time
theme: Text
feature: Text
STepLib: MetaMap
Polygon
points: List
altitude: AltRange
time:Time
theme: Text
feature: Text
Download

Banco de Dados Multimídia