Utilização de Ontologias para Integração de Heterogeneidade
Semântica
Leandro Alves da Silva
email : [email protected]
Internet
Recursos
página
email
Redes
imagem
vídeo
Inter-Relacionadas
som
arquivos de dados
bancos de dados
Semântica
Estudo do significado da palavra, que nos explica a
origem e as variações da significação vocabular
Monossemia : Representa apenas um conceito. O termo nesta
condição é chamado monosema. Esta é a relação ideal entre
conceitos, pois reduz a ambigüidade
Semântica
Homonímia : Termos idênticos na forma fonética (homófonos) e
ou, na forma gráfica (termos homógrafos) e ou em ambas.
Seção (corte) , Sessão (reunião)
Manga (fruta) , Manga (paletó)
Termos homófonos
Termos homófonos e
homógrafos
Sinonímia : Termos diferentes (sinônimos), que representam o
mesmo conceito
Carro , Automóvel
Como ontologias podem ajudar a resolver problemas de
heterogeneidade semântica ?
Disponibilizar aos usuários da Internet padrões de criação de
recursos.
Disseminar o conhecimento sobre : Metadados, Ontologias e
Tesauro
Mudar de HTML para XML, RDF e RDFS
Metadados
Metadados, também conhecidos como “dados sobre dados”,
são utilizados para descrever as características de recursos e
seus relacionamentos
Padrões de Metadados
O padrão Dublin Core (W3C)
Descrição
Title
Creator
Contribuitor
Publisher
Date
Source
Relation
Description
Subject
Type
Format
Identifier
Language
Caverage
Rights
Título do recurso
Pessoa ou organização responsável pela criação do conteúdo intelectual do
recurso
Pessoa ou Organização que contribui intelectualmente na criação do recurso
(ex.: editor, ilustrador, tradutor, etc)
Identifica a entidade responsável por tornar o recurso disponível.
Data da criação ou publicação do recurso
Informação sobre os recursos que contribuíram para a elaboração do recurso
corrente
Recursos que possuem relacionamentos com o recurso corrente
Descrição do conteúdo
Tema do recurso
Forma como o conteúdo é expresso (relatório técnico, dissertação, etc).
Formato em que o recurso é materializado (postScript, HTML, DOC, PDF,
etc).
Possui um identificador único do recurso
Idioma
Características Espaciais ou temporais
Informações sobre os direitos autorais do recurso
Ontologia
O termo ontologia tem sua origem na Filosofia, onde é
definida como “a especificação explícita de uma
conceitualização”, isto é, tem como pressuposto a
existência de algo.
Ontologia é a descrição explícita e precisa de conceitos e
relações que existem em um domínio particular, tal como
uma dada organização, um domínio de estudo, uma área
de aplicação.
Ontologia
A principal propriedade de uma ontologia é o
compartilhamento e filtragem.
Compartilhamento significa que um acordo deve existir
entre diferentes agentes, estes baseados no acordo de
ontologias comuns, isto é, devem ter o mesmo entendimento
sobre um dado conceito.
Ontologia
OIL (Ontology Inference Layer)
ontology-container
title “Meios de Transporte”
creator “Leandro Alves da Silva”
subject “carro, trem, transportes em geral”
description“exemplo de especificação de ontologia descrevendo meios de
transporte no Rio de Janeiro”
...
language “OIL”
language “Português”
Ontologia
OIL (Ontology Inference Layer)
ontology-definitions
class-def transporte
class-def carro
subclass-of transporte
class-def avião
subclass-of transporte
class-def ônibus
subclass-of transporte
class-def trem
subclass-of transporte
/*define hierarquia entre classes */
Ontologia
OIL (Ontology Inference Layer)
class-def terrestre
subclass-of transporte
slot-constraint tem_pneus /* define relacionamento entre classes */
value-type carro, ônibus /* enumeração de valores */
slot-constraint total
has-value (min 4) /* estabelece cardinalidade mínima = 4 */
class-def aéreo
subclass-of transporte
slot-constraint tem_asas
value-type avião
Tesauro
Um Tesauro é um índice controlado utilizado tanto na
indexação, quanto na recuperação de documentos. A hierarquia
dos termos contidos em um Tesauro e seus conceitos, são
percebidos na forma como os mesmos são classificados (área do
conhecimento).
Um Tesauro é um exemplo prático da aplicação da Ontologia.
Pode-se descrevê-lo como uma lista de termos, usados para a
representação de conceitos.
Tesauro
Sua maior vantagem é unificar os termos de busca, normalmente
diferenciados na linguagem natural.
Geralmente, é desenvolvido por uma equipe, composta por
especialistas da informação em conjunto com especialistas da
área do conhecimento que se quer abranger.
Segue uma classificação baseada em Taxonomia (i.e., uma
classificação de elementos dentro de um domínio. Distribui e
estabelece relacionamentos entre os elementos que podem ser
objetos ou conceitos)
XML (extensible markup language)
HTML (Hiper Text Markup Language)
A XML supre as deficiências da HTML, permitindo a criação
de marcações definidas pelo próprio usuário e, desta forma,
proporcionar uma maior descrição dos recursos em termos de
metadados.
XML (extensible markup language)
<pessoa>
<nome>Leandro</nome>
<idade>26</idade>
<e-mail>[email protected]</email>
</pessoa>
<livro>
<titulo idioma=”Ingles”>Data on the web</titulo>
<preço moeda=”Dolar”>40.25</preço>
<editora pais=”Brasil”>McGrawHill</editora>
</livro>
RDF (Resource Description FrameWork)
O RDF pode especificar o relacionamento entre
entidades e prover interoperabilidade estrutural
RDF (Resource Description FrameWork)
Mod:título
Metadados
http://www.ipt.br/leandro/paper.htm
Mod:Agente Criador
Mod:Nome
Leandro
Mod:e-mail
[email protected]
RDF (Resource Description FrameWork)
<?xml version=”1.0”?>
<rdf:RDF
xmlns:rdf=
xmlns:mod=”http://www.ipt.br/sgdc_w/moddec/definition”>
<rdf: Description about = ”>
<mod:titulo> Metadados </mod:titulo>
<mod:Agente_Criador>
<mod:nome>Leandro</mod:nome>
<mod:e-mail>[email protected]</mod:e-mail>
</mod:Agente_Criador>
</rdf:Description>
</rdf:RDF>
RDFS (Resource Description Framework Schemas)
Fornece mecanismos para declaração de propriedades e
definição de relacionamento entre tais propriedades e
outros recursos.
O esquema RDF é especificado como um conjunto de classes,
propriedades e restrições entre seus relacionamentos, e pode ser
usado em conjunto com outros vocabulários específicos.
RDFS (Resource Description Framework Schemas)
<rdf:RDF
xmlns: rdf=”http://www.w3c.org/1999/02/22-rdf-syntax-ns#”
xmlns: rdfs=””>
<rdf:Description ID=”Animal”>
<rdf:type resource=”Class”/>
<rdf:subClassOf resource=”Resource”/>
</rdf:description ID=”Animal”>
<rdf:Description ID=”Mamífero”>
<rdf:type resource=”Class”/>
<rdf:subClassOf resource=”#Animal”/>
</rdf:description>
<rdf:Description ID=”Ave”>
<rdf:type resource=”Class”/>
<rdf:subClassOf resource=”#Animal”/>
</rdf:description>
RDFS (Resource Description Framework Schemas)
<rdfs:Property rdf:ID=”cor”>
<rdfs:comment>Cor da penugem</rdfs:comment>
<rdfs:domain rdf:resource=”#Ave”
<rdfs:range rdf:resource=””>
</rdfs:Property>
<rdfs:Property rdf:ID=”habitat>
<rdfs:comment>Local onde é encontrado</rdfs:comment>
<rdfs:domain rdf:resource=”#Mamífero”
<rdfs:range rdf:resource=””>
</rdfs:Property>
</rdf:RDF>
Aplicação de ontologias na resolução de problemas de heterogeneidade
semântica
Coleção de
Recursos P
Ontologia p
DB p1
Esquema p1
DB p2
Esquema p2
Coleção de
Recursos Q
Ontologia q
DB q1
Esquema q1
Integração Baseada
em Ontologia
Sistema baseado em IA
para integração de
de Ontologia
Resultado da Integração
Baseado em Similaridade
Esquema de Integração Global
Integrador de Esquema
Baseado em Ontologia
Utilização de Ontologias para Integração de Heterogeneidade Semântica - Exemplo 1
Resultado da Integração de Parte das Ontologias por Conceitos iguais
Ontologia p
Inquilino
Cidadão
pago por
Salário
Estrangeiro
Ontologia q
Pessoa
ganha
Ordenado
pessoal
Administrador
de Pessoal
Técnico de
Pessoal
Conferencista
Faculdade
Professor
Utilização de Ontologias para Integração de Heterogeneidade Semântica - Exemplo 1
Resultado da Integração de Parte das Ontologias por Conceitos iguais
Inquilino
e Pessoa
Cidadão
pago por e
ganha
Estrangeiro
Administrador
de Pessoal
Salário@p e
Salário@q
pessoal
Técnico de
Pessoal
Conferencista
Faculdade
Professor
Utilização de Ontologias para Integração de Heterogeneidade Semântica - Exemplo 1
Criando uma Classe Pessoa em um Esquema Global
Esquema p1
Cidadão
Ordenado
Esquema q1
Estrangeiro
Ordenado
Conferencista
Salário
Professor
Salário
Conferencista
Professor
Pessoa
Esquema Global
Salário
Cidadão
Estrangeiro
Utilização de Ontologias para Integração de Heterogeneidade Semântica - Exemplo 2
Estabelecimento de Relações de Similaridade, Criando um Novo Conceito
Ontologia q
Estudante
Ontologia p
Pessoa
Estudante não
Graduado
Estudante
Graduado
Administrador
de Pessoal
pessoal
Técnico de
Pessoal
Conferencista
Faculdade
Professor
Utilização de Ontologias para Integração de Heterogeneidade Semântica - Exemplo 2
Estabelecimento de Relações de Similaridade, Criando um Novo Conceito
Pessoa
Estudante
pessoal
Estudante não
Graduado
Administrador
de Pessoal
Estudante
Graduado
Técnico de
Pessoal
Conferencista
Professor Assistente
Faculdade
Professor
Utilização de Ontologias para Integração de Heterogeneidade Semântica - Exemplo 2
Criando uma nova Classe Global em um Esquema Baseado em Ontologia
Esquema p2
Esquema q1
Estudante de Graduação
Conferencista
Estudante de Graduação
Conferencista
Esquema Global
Professor Assistente
Perguntas
Leandro Alves da Silva
email : [email protected]
Download

Transparências() - IME-USP