Utilização de Ontologias para Integração de Heterogeneidade Semântica Leandro Alves da Silva email : [email protected] Internet Recursos página email Redes imagem vídeo Inter-Relacionadas som arquivos de dados bancos de dados Semântica Estudo do significado da palavra, que nos explica a origem e as variações da significação vocabular Monossemia : Representa apenas um conceito. O termo nesta condição é chamado monosema. Esta é a relação ideal entre conceitos, pois reduz a ambigüidade Semântica Homonímia : Termos idênticos na forma fonética (homófonos) e ou, na forma gráfica (termos homógrafos) e ou em ambas. Seção (corte) , Sessão (reunião) Manga (fruta) , Manga (paletó) Termos homófonos Termos homófonos e homógrafos Sinonímia : Termos diferentes (sinônimos), que representam o mesmo conceito Carro , Automóvel Como ontologias podem ajudar a resolver problemas de heterogeneidade semântica ? Disponibilizar aos usuários da Internet padrões de criação de recursos. Disseminar o conhecimento sobre : Metadados, Ontologias e Tesauro Mudar de HTML para XML, RDF e RDFS Metadados Metadados, também conhecidos como “dados sobre dados”, são utilizados para descrever as características de recursos e seus relacionamentos Padrões de Metadados O padrão Dublin Core (W3C) Descrição Title Creator Contribuitor Publisher Date Source Relation Description Subject Type Format Identifier Language Caverage Rights Título do recurso Pessoa ou organização responsável pela criação do conteúdo intelectual do recurso Pessoa ou Organização que contribui intelectualmente na criação do recurso (ex.: editor, ilustrador, tradutor, etc) Identifica a entidade responsável por tornar o recurso disponível. Data da criação ou publicação do recurso Informação sobre os recursos que contribuíram para a elaboração do recurso corrente Recursos que possuem relacionamentos com o recurso corrente Descrição do conteúdo Tema do recurso Forma como o conteúdo é expresso (relatório técnico, dissertação, etc). Formato em que o recurso é materializado (postScript, HTML, DOC, PDF, etc). Possui um identificador único do recurso Idioma Características Espaciais ou temporais Informações sobre os direitos autorais do recurso Ontologia O termo ontologia tem sua origem na Filosofia, onde é definida como “a especificação explícita de uma conceitualização”, isto é, tem como pressuposto a existência de algo. Ontologia é a descrição explícita e precisa de conceitos e relações que existem em um domínio particular, tal como uma dada organização, um domínio de estudo, uma área de aplicação. Ontologia A principal propriedade de uma ontologia é o compartilhamento e filtragem. Compartilhamento significa que um acordo deve existir entre diferentes agentes, estes baseados no acordo de ontologias comuns, isto é, devem ter o mesmo entendimento sobre um dado conceito. Ontologia OIL (Ontology Inference Layer) ontology-container title “Meios de Transporte” creator “Leandro Alves da Silva” subject “carro, trem, transportes em geral” description“exemplo de especificação de ontologia descrevendo meios de transporte no Rio de Janeiro” ... language “OIL” language “Português” Ontologia OIL (Ontology Inference Layer) ontology-definitions class-def transporte class-def carro subclass-of transporte class-def avião subclass-of transporte class-def ônibus subclass-of transporte class-def trem subclass-of transporte /*define hierarquia entre classes */ Ontologia OIL (Ontology Inference Layer) class-def terrestre subclass-of transporte slot-constraint tem_pneus /* define relacionamento entre classes */ value-type carro, ônibus /* enumeração de valores */ slot-constraint total has-value (min 4) /* estabelece cardinalidade mínima = 4 */ class-def aéreo subclass-of transporte slot-constraint tem_asas value-type avião Tesauro Um Tesauro é um índice controlado utilizado tanto na indexação, quanto na recuperação de documentos. A hierarquia dos termos contidos em um Tesauro e seus conceitos, são percebidos na forma como os mesmos são classificados (área do conhecimento). Um Tesauro é um exemplo prático da aplicação da Ontologia. Pode-se descrevê-lo como uma lista de termos, usados para a representação de conceitos. Tesauro Sua maior vantagem é unificar os termos de busca, normalmente diferenciados na linguagem natural. Geralmente, é desenvolvido por uma equipe, composta por especialistas da informação em conjunto com especialistas da área do conhecimento que se quer abranger. Segue uma classificação baseada em Taxonomia (i.e., uma classificação de elementos dentro de um domínio. Distribui e estabelece relacionamentos entre os elementos que podem ser objetos ou conceitos) XML (extensible markup language) HTML (Hiper Text Markup Language) A XML supre as deficiências da HTML, permitindo a criação de marcações definidas pelo próprio usuário e, desta forma, proporcionar uma maior descrição dos recursos em termos de metadados. XML (extensible markup language) <pessoa> <nome>Leandro</nome> <idade>26</idade> <e-mail>[email protected]</email> </pessoa> <livro> <titulo idioma=”Ingles”>Data on the web</titulo> <preço moeda=”Dolar”>40.25</preço> <editora pais=”Brasil”>McGrawHill</editora> </livro> RDF (Resource Description FrameWork) O RDF pode especificar o relacionamento entre entidades e prover interoperabilidade estrutural RDF (Resource Description FrameWork) Mod:título Metadados http://www.ipt.br/leandro/paper.htm Mod:Agente Criador Mod:Nome Leandro Mod:e-mail [email protected] RDF (Resource Description FrameWork) <?xml version=”1.0”?> <rdf:RDF xmlns:rdf= xmlns:mod=”http://www.ipt.br/sgdc_w/moddec/definition”> <rdf: Description about = ”> <mod:titulo> Metadados </mod:titulo> <mod:Agente_Criador> <mod:nome>Leandro</mod:nome> <mod:e-mail>[email protected]</mod:e-mail> </mod:Agente_Criador> </rdf:Description> </rdf:RDF> RDFS (Resource Description Framework Schemas) Fornece mecanismos para declaração de propriedades e definição de relacionamento entre tais propriedades e outros recursos. O esquema RDF é especificado como um conjunto de classes, propriedades e restrições entre seus relacionamentos, e pode ser usado em conjunto com outros vocabulários específicos. RDFS (Resource Description Framework Schemas) <rdf:RDF xmlns: rdf=”http://www.w3c.org/1999/02/22-rdf-syntax-ns#” xmlns: rdfs=””> <rdf:Description ID=”Animal”> <rdf:type resource=”Class”/> <rdf:subClassOf resource=”Resource”/> </rdf:description ID=”Animal”> <rdf:Description ID=”Mamífero”> <rdf:type resource=”Class”/> <rdf:subClassOf resource=”#Animal”/> </rdf:description> <rdf:Description ID=”Ave”> <rdf:type resource=”Class”/> <rdf:subClassOf resource=”#Animal”/> </rdf:description> RDFS (Resource Description Framework Schemas) <rdfs:Property rdf:ID=”cor”> <rdfs:comment>Cor da penugem</rdfs:comment> <rdfs:domain rdf:resource=”#Ave” <rdfs:range rdf:resource=””> </rdfs:Property> <rdfs:Property rdf:ID=”habitat> <rdfs:comment>Local onde é encontrado</rdfs:comment> <rdfs:domain rdf:resource=”#Mamífero” <rdfs:range rdf:resource=””> </rdfs:Property> </rdf:RDF> Aplicação de ontologias na resolução de problemas de heterogeneidade semântica Coleção de Recursos P Ontologia p DB p1 Esquema p1 DB p2 Esquema p2 Coleção de Recursos Q Ontologia q DB q1 Esquema q1 Integração Baseada em Ontologia Sistema baseado em IA para integração de de Ontologia Resultado da Integração Baseado em Similaridade Esquema de Integração Global Integrador de Esquema Baseado em Ontologia Utilização de Ontologias para Integração de Heterogeneidade Semântica - Exemplo 1 Resultado da Integração de Parte das Ontologias por Conceitos iguais Ontologia p Inquilino Cidadão pago por Salário Estrangeiro Ontologia q Pessoa ganha Ordenado pessoal Administrador de Pessoal Técnico de Pessoal Conferencista Faculdade Professor Utilização de Ontologias para Integração de Heterogeneidade Semântica - Exemplo 1 Resultado da Integração de Parte das Ontologias por Conceitos iguais Inquilino e Pessoa Cidadão pago por e ganha Estrangeiro Administrador de Pessoal Salário@p e Salário@q pessoal Técnico de Pessoal Conferencista Faculdade Professor Utilização de Ontologias para Integração de Heterogeneidade Semântica - Exemplo 1 Criando uma Classe Pessoa em um Esquema Global Esquema p1 Cidadão Ordenado Esquema q1 Estrangeiro Ordenado Conferencista Salário Professor Salário Conferencista Professor Pessoa Esquema Global Salário Cidadão Estrangeiro Utilização de Ontologias para Integração de Heterogeneidade Semântica - Exemplo 2 Estabelecimento de Relações de Similaridade, Criando um Novo Conceito Ontologia q Estudante Ontologia p Pessoa Estudante não Graduado Estudante Graduado Administrador de Pessoal pessoal Técnico de Pessoal Conferencista Faculdade Professor Utilização de Ontologias para Integração de Heterogeneidade Semântica - Exemplo 2 Estabelecimento de Relações de Similaridade, Criando um Novo Conceito Pessoa Estudante pessoal Estudante não Graduado Administrador de Pessoal Estudante Graduado Técnico de Pessoal Conferencista Professor Assistente Faculdade Professor Utilização de Ontologias para Integração de Heterogeneidade Semântica - Exemplo 2 Criando uma nova Classe Global em um Esquema Baseado em Ontologia Esquema p2 Esquema q1 Estudante de Graduação Conferencista Estudante de Graduação Conferencista Esquema Global Professor Assistente Perguntas Leandro Alves da Silva email : [email protected]