CE-262 Ontologia e Web Semântica Prof. José M Parente de Oliveira Sala 120 – Prédio da Computação Instituto Tecnológico de Aeronáutica - ITA [email protected] +55 12 3947-6941 Introdução à Web Semântica e Ontologias Sumário de Conteúdo do Tópico Motivação Web Semântica: o que é? Arquitetura da Web Semântica (W3C) Desafios da Web Semântica Perspectivas da Web Semântica Noção de Ontologia Material de Referência Projeto e Construção de Ontologias Prof. Luiz A M Palazzo - Universidade Católica de Pelotas Ontology Engineering for the Semantic Web and Beyond Prof. Natalya F. Noy - Stanford University The Semantic Web Dr. V. Richard Benjamins iSOCO Jena Tutorial Anna V. Zhdanova DERI AT Material de Referência Ontologias, modelos e busca em JAVA Adriana da Silva Jacinto Ian Horrocks and Alan Rector University of Manchester Manchester, UK Motivação Motivação Motivação Motivação Motivação Motivação Motivação Motivação É necessário navegar muito pela Web antes de se encontrar o conteúdo de interesse Problema: a tecnologia atual de busca não entende o que se está procurando: • Procura apenas por palavras-chave • = string de caracteres • Retorno de informação em vez de resposta a uma questão! Motivação Web Sintática [Hendler & Miller 02] Motivação: Web Sintática A place where computers do the presentation (easy) and people do the linking and interpreting (hard). – A hypermedia, a digital library • A library of documents called (web pages) interconnected by a hypermedia of links – A database, an application platform • A common portal to applications accessible through web pages, and presenting their results as web pages – A platform for multimedia • BBC Radio 4 anywhere in the world! Terminator 3 trailers! – A naming scheme • Unique identity for those documents [Hendler & Miller 02] Motivação: Web Sintática Why not get computers to do more of the hard work? [Hendler & Miller 02] Web Semântica: o que é? “A Web Semântica é uma extensão da Web atual em que cada informação é dada por um significado bem definido, fazendo com que computadores e pessoas trabalhem melhor em cooperação” Tim Berners-Lee, James Hendler, Ora Lassila Scientific American, May 2001 Web Semântica: o que é? Web Semântica: o que é? “O poder real da Web Semântica será percebido quando as pessoas criarem programas que coletem conteúdo de diversas fontes, processem a informação e troquem os resultados com outros programas. A eficácia de tais agentes de software aumentará exponencialmente assim como mais máquinas leitoras do conteúdo Web e serviços automatizados (incluindo outros agentes) tornaremse disponíveis.” Tim Berners-Lee, James Hendler, Ora Lassila Scientific American, May 2001 Web Semântica: o que é? Web Semântica é a idéia de se ter dados na Web definida e interconectada por um caminho que pode ser usado para mais descobertas eficazes, automação, integração e reutilização através de várias aplicações. A Web pode encontrar todo o seu potencial se tornar-se um local onde dados podem ser tão bem processados por ferramentas automatizadas como o são por pessoas. W3C Web Semântica: o que é? Iniciativa do W3C com o objetivo de adicionar significado à Web Baseada na tecnologia xml/rdf, fazendo evoluir a html da Web Sintática WWW Consortium - http://www.w3.org Arquitetura da Web Semântica Arquitetura da Web Semântica Mecanismo de Busca … E-commerce Web Semântica Camada Lógica Camada de Ontologia Esquema Camada de Estrutura Regras de Inferência Ontologia Dados Ontologia Arquitetura da Web Semântica Camada de Estrutura Responsável por estruturar os dados e definir seu significado: XML, Namespaces URI, Unicode Arquitetura da Web Semântica Camada de Esquema Responsável por definir relações entre os dados Uso de ontologias em páginas Web torna mais simples a resolução de indefinição ou conflito de terminologia RDF Schema, RDF M&S Arquitetura da Web Semântica Camada Lógica Responsável por definir mecanismos para fazer inferência sobre os dados Composta por um conjunto de regras de inferência Regras de inferência fornecem aos agentes computacionais o poder de raciocinar sobre as estruturas de dados Desafios da Web Semântica Carência de profissionais especializados Evolução de culturas (html – xml/rdf) Padrões digitais de mídia instáveis Crescimento simultâneo e continuado da Web Sintática Falta de investimento adequado Falta de visibilidade da área Perspectivas Base para a computação móvel e pervasiva Grande disseminação prevista a médio prazo Novo patamar para as interações humano-computador Novos produtos e oportunidades de pesquisa Aplicação em grande escala em educação e gestão de conhecimento e-Science Noção de Ontologia Corpo de conhecimento declarativo sobre um dado domínio, assunto ou área de conhecimento Na prática, hierarquias de conceitos (classes) com suas relações, restrições, axiomas e terminologia associada Termo às vezes mal-empregado. Ontologias não são: • Simples hierarquias • Conjuntos de conceitos associados a palavras-chave • Esquemas de bancos de dados Noção de Ontologia Definição de Ontologia: Especificação formal e explícita de uma conceitualização compartilhada (Gruber, 1993) Conceitualização: modelo das entidades, relações, axiomas e regras de algum domínio Formal: • Processável por máquina • Permitindo raciocínio automático • Com semântica lógica formal Compartilhada: por uma comunidade, permitindo entendimento Noção de Ontologia Uma ontologia é uma descrição explícita de um domínio: • Conceitos • Propriedades - atributos de conceitos • Restrições em propriedades e atributos • Indivíduos (às vezes, mas não sempre) Noção de Ontologia: Estrutura Ontologies typically have two distinct components: • Names for important concepts in the domain – Elephant is a concept whose members are a kind of animal – Herbivore is a concept whose members are exactly those animals who eat only plants or parts of plants – Adult_Elephant is a concept whose members are exactly those elephants whose age is greater than 20 years • Background knowledge/constraints on the domain – Adult_Elephants weigh at least 2,000 kg – All Elephants are either African_Elephants or Indian_Elephants – No individual can be both a Herbivore and a Carnivore Noção de Ontologia: Conceitualização Noção de Ontologia: Conceitualização There can be two conceptualizations of this tiny world where the task is to make a plan of stack three blocks as the goal configuration using a robot hand One is with conceptualization of the table and the other is without the table. In the latter, the table is imbedded in the relation onTable(X) You can easily see the incompatibility between two plans based on each of the two conceptualizations. They are NOT interoperable each other when they come to a situation where they have to talk about the table. So, it is necessary to have an explicit representation of such a conceptualization. Noção de Ontologia: Conceitualização Noção de Ontologia: Conceitualização We can design ontology of this block world corresponding to each of the two conceptualizations like this It is roughly a hierarchy of things with axioms. Definitions of each concept and relation is omitted here An example of an axiom is above(X,Z):-on(X,Y), on(Y,Z). There are many more axioms to represent constraints among the concepts and relations Ontologia em Computação O que pode ser representado por um computador Uma ontologia pode ter várias formas, mas ela incluirá necessariamente um vocabulário de termos e alguma especificação de seu significado Uschold 1998, Jaspers & Uschold 1999 Um corpo de conhecimento descrevendo algum domínio de senso comum (Cyc e OpenCyc) Exemplos de Aplicação de Ontologia Taxonomias na Web • Yahoo! Categorias Catálogo para compras on-line • Amazon.com catálogo de produtos Domínio: especificação de terminologia padrão • Unified Medical Language System (UMLS) • UNSPSC - terminologia para produtos e serviços Exemplos de Aplicação de Ontologia Que tipo de vinho eu devo servir com frutos do mar hoje? Vinhos franceses e região de vinhos Uma ontologia compartilhada de vinho e comida Vinhos da Califórnia e região de vinhos Pode Haver Diferentes Ontologias para um Domínio infection meningitis infection pneumonia viral pneumonia acute viral pneumonia meningitis bacterial pneumonia chronic viral pneumonia pneumonia acute pneumonia acute viral pneumonia chronic pneumonia acute bacterial pneumonia Por Que Criar Ontologias? Para construir declarações explícitas sobre o domínio: • Mais fácil mudar declarações do domínio (considerar, por exemplo, uma base de conhecimento de genética) • Mais fácil entender e atualizar a legalidade dos dados Para separar conhecimento do domínio do conhecimento operacional: • Reuso do domínio e do conhecimento operacional separadamente Ferramentas • We need to provide tools and services to help users to: – Design and maintain high quality ontologies, e.g.: • Meaningful — all named classes can have instances • Correct — captured intuitions of domain experts • Minimally redundant — no unintended synonyms • Richly axiomatised — (sufficiently) detailed descriptions – Store (large numbers) of instances of ontology classes, e.g.: • Annotations from web pages – Answer queries over ontology classes and instances, e.g.: • Find more general/specific classes • Retrieve annotations/pages matching a given description – Integrate and align multiple ontologies Por Que é Difícil Criar Ontologias? • Ontology languages are tricky – “All tractable languages are useless; all useful languages are intractable” • Ontologies are tricky – People do it too easily; People are not logicians • Intuitions hard to formalise • The evidence – The problem has been about for 3000 years • But now it matters! – The semantic web means knowledge representation matters Alguns Tópicos de Pesquisa • Web semântica – Padrões, princípios, linguagens, limitações • Concepção de ontologias – Engenharia de ontologias – Paradoxo: tensão entre aplicação e extensibilidade – Aspectos a serem abordados • funcional, intencional, social, físico, etc – Relações parte-todo Alguns Tópicos de Pesquisa • Aprendizado e ontologias – Construção de ontologias a partir de texto (Text-to-Onto) – Anotação semi-automática de páginas baseadas em ontologias – Extração, agrupamento [Hotho et al 2001] e classificação de informação (mineração de textos) • Integração inteligente de informação – Diversidade de visões de ontologias sobre um mesmo domínio, que o abordam sobre perspectivas distintas – Soluções: mapeamento e integração semântica através de contextos comuns [Wache & Stuckenschmidt 2001]