CE-262 Ontologia e Web Semântica
Prof. José M Parente de Oliveira
Sala 120 – Prédio da Computação
Instituto Tecnológico de Aeronáutica - ITA
[email protected]
+55 12 3947-6941
Introdução à Web Semântica e
Ontologias
Sumário de Conteúdo do Tópico
Motivação
Web Semântica: o que é?
Arquitetura da Web Semântica (W3C)
Desafios da Web Semântica
Perspectivas da Web Semântica
Noção de Ontologia
Material de Referência
Projeto e Construção de Ontologias
Prof. Luiz A M Palazzo - Universidade Católica de Pelotas
Ontology Engineering for the Semantic Web and Beyond
Prof. Natalya F. Noy - Stanford University
The Semantic Web
Dr. V. Richard Benjamins
iSOCO
Jena Tutorial
Anna V. Zhdanova
DERI AT
Material de Referência
Ontologias, modelos e busca em JAVA
Adriana da Silva Jacinto
Ian Horrocks and Alan Rector
University of Manchester
Manchester, UK
Motivação
Motivação
Motivação
Motivação
Motivação
Motivação
Motivação
Motivação
É necessário navegar muito pela Web antes de se encontrar o
conteúdo de interesse
Problema: a tecnologia atual de busca não entende o que se está
procurando:
• Procura apenas por palavras-chave
• = string de caracteres
• Retorno de informação em vez de resposta a uma questão!
Motivação
Web Sintática
[Hendler & Miller 02]
Motivação: Web Sintática
A place where computers do the presentation (easy) and people
do the linking and interpreting (hard).
– A hypermedia, a digital library
• A library of documents called (web pages)
interconnected by a hypermedia of links
– A database, an application platform
• A common portal to applications accessible through web
pages, and presenting their results as web pages
– A platform for multimedia
• BBC Radio 4 anywhere in the world! Terminator 3
trailers!
– A naming scheme
• Unique identity for those documents
[Hendler & Miller 02]
Motivação: Web Sintática
Why not get computers to
do more of the hard work?
[Hendler & Miller 02]
Web Semântica: o que é?
“A Web Semântica é uma extensão da Web atual em que cada
informação é dada por um significado bem definido, fazendo com
que computadores e pessoas trabalhem melhor em cooperação”
Tim Berners-Lee, James Hendler, Ora Lassila
Scientific American, May 2001
Web Semântica: o que é?
Web Semântica: o que é?
“O poder real da Web Semântica será percebido quando as pessoas
criarem programas que coletem conteúdo de diversas fontes,
processem a informação e troquem os resultados com outros
programas. A eficácia de tais agentes de software aumentará
exponencialmente assim como mais máquinas leitoras do conteúdo
Web e serviços automatizados (incluindo outros agentes) tornaremse disponíveis.”
Tim Berners-Lee, James Hendler, Ora Lassila
Scientific American, May 2001
Web Semântica: o que é?
Web Semântica é a idéia de se ter dados na Web definida e
interconectada por um caminho que pode ser usado para mais
descobertas eficazes, automação, integração e reutilização
através de várias aplicações.
A Web pode encontrar todo o seu potencial se tornar-se um local
onde dados podem ser tão bem processados por ferramentas
automatizadas como o são por pessoas.
W3C
Web Semântica: o que é?
Iniciativa do W3C com o objetivo de adicionar significado à Web
Baseada na tecnologia xml/rdf, fazendo evoluir a html da Web
Sintática
WWW Consortium - http://www.w3.org
Arquitetura da Web Semântica
Arquitetura da Web Semântica
Mecanismo
de Busca
…
E-commerce
Web Semântica
Camada
Lógica
Camada
de
Ontologia
Esquema
Camada de
Estrutura
Regras de Inferência
Ontologia
Dados
Ontologia
Arquitetura da Web Semântica
Camada de Estrutura
Responsável por estruturar os dados e definir seu significado:
XML, Namespaces
URI, Unicode
Arquitetura da Web Semântica
Camada de Esquema
Responsável por definir relações entre os dados
Uso de ontologias em páginas Web torna mais simples a resolução
de indefinição ou conflito de terminologia
RDF Schema, RDF M&S
Arquitetura da Web Semântica
Camada Lógica
Responsável por definir mecanismos para fazer inferência sobre os
dados
Composta por um conjunto de regras de inferência
Regras de inferência fornecem aos agentes computacionais o
poder de raciocinar sobre as estruturas de dados
Desafios da Web Semântica
Carência de profissionais especializados
Evolução de culturas (html – xml/rdf)
Padrões digitais de mídia instáveis
Crescimento simultâneo e continuado da Web Sintática
Falta de investimento adequado
Falta de visibilidade da área
Perspectivas
Base para a computação móvel e pervasiva
Grande disseminação prevista a médio prazo
Novo patamar para as interações humano-computador
Novos produtos e oportunidades de pesquisa
Aplicação em grande escala em educação e gestão de
conhecimento
e-Science
Noção de Ontologia
Corpo de conhecimento declarativo sobre um dado domínio,
assunto ou área de conhecimento
Na prática, hierarquias de conceitos (classes) com suas relações,
restrições, axiomas e terminologia associada
Termo às vezes mal-empregado. Ontologias não são:
•
Simples hierarquias
•
Conjuntos de conceitos associados a palavras-chave
•
Esquemas de bancos de dados
Noção de Ontologia
Definição de Ontologia:
Especificação formal e explícita de uma conceitualização
compartilhada (Gruber, 1993)
Conceitualização: modelo das entidades, relações, axiomas e
regras de algum domínio
Formal:
• Processável por máquina
• Permitindo raciocínio automático
• Com semântica lógica formal
Compartilhada: por uma comunidade, permitindo
entendimento
Noção de Ontologia
Uma ontologia é uma descrição explícita de um domínio:
• Conceitos
• Propriedades - atributos de conceitos
• Restrições em propriedades e atributos
• Indivíduos (às vezes, mas não sempre)
Noção de Ontologia: Estrutura
Ontologies typically have two distinct components:
• Names for important concepts in the domain
– Elephant is a concept whose members are a kind of animal
– Herbivore is a concept whose members are exactly those
animals who eat only plants or parts of plants
– Adult_Elephant is a concept whose members are exactly
those elephants whose age is greater than 20 years
• Background knowledge/constraints on the domain
– Adult_Elephants weigh at least 2,000 kg
– All Elephants are either African_Elephants or
Indian_Elephants
– No individual can be both a Herbivore and a Carnivore
Noção de Ontologia: Conceitualização
Noção de Ontologia: Conceitualização
There can be two conceptualizations of this tiny world where the
task is to make a plan of stack three blocks as the goal
configuration using a robot hand
One is with conceptualization of the table and the other is
without the table. In the latter, the table is imbedded in the
relation onTable(X)
You can easily see the incompatibility between two plans based
on each of the two conceptualizations. They are NOT
interoperable each other when they come to a situation where
they have to talk about the table. So, it is necessary to have an
explicit representation of such a conceptualization.
Noção de Ontologia: Conceitualização
Noção de Ontologia: Conceitualização
We can design ontology of this block world corresponding to each
of the two conceptualizations like this
It is roughly a hierarchy of things with axioms. Definitions of each
concept and relation is omitted here
An example of an axiom is above(X,Z):-on(X,Y), on(Y,Z). There
are many more axioms to represent constraints among the
concepts and relations
Ontologia em Computação
O que pode ser representado por um computador
Uma ontologia pode ter várias formas, mas ela incluirá
necessariamente um vocabulário de termos e alguma
especificação de seu significado
Uschold 1998, Jaspers & Uschold 1999
Um corpo de conhecimento descrevendo algum domínio de senso
comum (Cyc e OpenCyc)
Exemplos de Aplicação de Ontologia
Taxonomias na Web
• Yahoo! Categorias
Catálogo para compras on-line
• Amazon.com catálogo de produtos
Domínio: especificação de terminologia padrão
• Unified Medical Language System (UMLS)
• UNSPSC - terminologia para produtos e serviços
Exemplos de Aplicação de Ontologia
Que tipo de
vinho eu
devo servir
com
frutos
do mar
hoje?
Vinhos franceses
e região de vinhos
Uma ontologia
compartilhada
de vinho e comida
Vinhos da
Califórnia
e região de vinhos
Pode Haver Diferentes Ontologias para um Domínio
infection
meningitis
infection
pneumonia
viral
pneumonia
acute viral
pneumonia
meningitis
bacterial
pneumonia
chronic viral
pneumonia
pneumonia
acute
pneumonia
acute viral
pneumonia
chronic
pneumonia
acute bacterial
pneumonia
Por Que Criar Ontologias?
Para construir declarações explícitas sobre o domínio:
• Mais fácil mudar declarações do domínio (considerar, por
exemplo, uma base de conhecimento de genética)
• Mais fácil entender e atualizar a legalidade dos dados
Para separar conhecimento do domínio do conhecimento
operacional:
• Reuso do domínio e do conhecimento operacional
separadamente
Ferramentas
• We need to provide tools and services to help users to:
– Design and maintain high quality ontologies, e.g.:
• Meaningful — all named classes can have instances
• Correct — captured intuitions of domain experts
• Minimally redundant — no unintended synonyms
• Richly axiomatised — (sufficiently) detailed descriptions
– Store (large numbers) of instances of ontology classes, e.g.:
• Annotations from web pages
– Answer queries over ontology classes and instances, e.g.:
• Find more general/specific classes
• Retrieve annotations/pages matching a given description
– Integrate and align multiple ontologies
Por Que é Difícil Criar Ontologias?
• Ontology languages are tricky
– “All tractable languages are useless;
all useful languages are intractable”
• Ontologies are tricky
– People do it too easily;
People are not logicians
• Intuitions hard to formalise
• The evidence
– The problem has been about for 3000 years
• But now it matters!
– The semantic web means knowledge representation
matters
Alguns Tópicos de Pesquisa
• Web semântica
– Padrões, princípios, linguagens, limitações
• Concepção de ontologias
– Engenharia de ontologias
– Paradoxo: tensão entre aplicação e extensibilidade
– Aspectos a serem abordados
• funcional, intencional, social, físico, etc
– Relações parte-todo
Alguns Tópicos de Pesquisa
• Aprendizado e ontologias
– Construção de ontologias a partir de texto (Text-to-Onto)
– Anotação semi-automática de páginas baseadas em ontologias
– Extração, agrupamento [Hotho et al 2001] e classificação de
informação (mineração de textos)
• Integração inteligente de informação
– Diversidade de visões de ontologias sobre um mesmo domínio,
que o abordam sobre perspectivas distintas
– Soluções: mapeamento e integração semântica através de
contextos comuns [Wache & Stuckenschmidt 2001]
Download

Introdução à Web Semântica