05. Representação e Raciocínio Aplicações na Web Semântica Luiz A M Palazzo Universidade Católica de Pelotas Centro Politécnico Abril de 2010 Na Linha do Tempo 1970 - ARPANET 1980 - BITNET NSFNET INTERNET 1990 - World Wide Web 2000 - Web 2.0 - Web Social 2010 - Web 3.0 - Web Semântica 2020 - Web 4.0 - Web Ubíqua Fontes: Hobbes Internet Timeline - http://www.zakon.org/robert/internet/timeline/ Radar Networks - http://www.radarnetworks.com/ 05 - Representação e Raciocínio 2 A Evolução Tecnológica 05 - Representação e Raciocínio 3 Outra Visão a Longo Prazo 05 - Representação e Raciocínio 4 A Web Hoje O tamanho da Web Indexada é estimado em mais de 57 bilhões de páginas (WorldWideWebSize.com, abril de 2010) A maior parte é dirigida ao consumo humano: Mesmo o conteúdo gerado automaticamente a partir de bases de dados é usualmente apresentado sem a estrutura original da base de dados. Alguns usos típicos da Web hoje: Pesquisar e utilizar informação, Buscar e entrar em contato com outras pessoas, Pesquisar recursos, produtos e lojas on-line, Adquirir produtos e serviços. 05 - Representação e Raciocínio 5 A Web 2.0 Uma Web social • Participativa • Exemplos: • • • • • Google Apps Wikipedia Blogging Second Life Tags (folksonomias) 05 - Representação e Raciocínio 6 A Web Semântica Uma Web de dados (descritos por metadados) Capaz de ser entendida por humanos e máquinas simultaneamente Gradualmente incorporada à Web Sintática Permitindo a realização de inferências sobre o seu conteúdo Oferecendo suporte a aplicações inteligentes e inovadoras 05 - Representação e Raciocínio 7 Uma Web de Dados! 05 - Representação e Raciocínio 8 A Proposta Original Scientific American Magazine, maio de 2001 05 - Representação e Raciocínio 9 Uma Web em Camadas 05 - Representação e Raciocínio 10 Onde estamos agora? Ainda... em construção Novos modelos estão gradualmente sendo propostos, testados e aceitos Baseia-se em conceitos fundamentais sobre o relacionamento semântico entre as linguagens de cada camada As camadas mais baixas estão mais consolidadas As últimas camadas (Lógica, Prova, Confiança) estão ainda em fase de pesquisa 05 - Representação e Raciocínio 11 O Nível Léxico: UNICODE Padrão de codificação de caracteres Em substituição ao ASCII (8 bits – 256 caracteres) 16 bits (65.536 caracteres) Símbolos de linguagens internacionais Símbolos matemáticos Símbolos financeiros Outros símbolos especiais Cerca de 49.000 símbolos usados 16.000 combinações livres para uso customizado 05 - Representação e Raciocínio 12 URI / IRI URI: Uniform Resource Identifier IRI: Internationalized URI Superconjunto de: URL (Uniform Resource Location) URN (Uniform Resource Name) URC (Uniform Resource Classification) Elemento básico da estrutura a partir do qual os demais componentes são construídos 05 - Representação e Raciocínio 13 XML: eXtensible Markup Language É uma linguagem de marcação, como HTML Ambas são baseadas em tags <titulo> Minha Página </titulo> Mas, HTML é voltada para a formatação, enquanto que XML tenta capturar a estrutura da informação XML também permite a criação de novas tags para atender aplicações específicas 05 - Representação e Raciocínio 14 Comparando HTML e XML HTML XML <h2>Context-Dependent Reasoning</h2> <i>por <b>V. Marek</b> e <b>M. Truszczynski</b></i><br> Springer 1993<br> ISBN 0387976892 <livro> <título>Context-Dependent Reasoning</título> <autor>V. Marek</autor> <autor>M. Truszczynski</autor> <editora>Springer</editora> <ano>1993</ano> <ISBN>0387976892</ISBN> </livro> 05 - Representação e Raciocínio 15 Vocabulários XML Aplicações para a Web devem concordar em um vocabulário comum (nomes de tags) para se comunicar e colaborar. As comunidades e setores empresariais estão definindo seus vocabulários especializados: Matemática (MathML) Bioinformática (BSML) Recursos Humanos (HRML) Recursos na Web (Dublin Core) Pessoas (FOAF) … 05 - Representação e Raciocínio 16 Namespaces Identificadores podem ter mais de um significado Os namespaces contextualizam identificadores Os identificadores são únicos dentro de um namespace <h:mesa xmlns:h="http://www.w3.org/TR/html4/"> <h:tr> <h:td>Maçãs</h:td> <h:td>Bananas</h:td> </h:tr> </h:mesa> <f:mesa xmlns:f="http://www. ... /mobilia"> <f:nome>Mesa de Jantar</f:nome> <f:largura>160</f:largura> <f:comprimento>240</f: comprimento> </f:mesa> 05 - Representação e Raciocínio 17 RDF: Resource Description Framework Representação de metadados Acessível por máquinas Significado codificado em triplas Recurso (1) tem propriedade (2) que tem valor (3) Recurso: qualquer objeto do mundo real descrito de forma única por um URI Propriedade: aspectos específicos que caracterizam e descrevem um recurso Declarações: associações entre um recurso específico, uma propriedade qualquer e o valor dessa propriedade, para esse recurso. 05 - Representação e Raciocínio 18 RDF: Com a Sintaxe do XML <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:mydomain="http://www.mydomain.org/my-rdf-ns"> <rdf:Description rdf:about="http://www.cit.gu.edu.au/~db"> <mydomain:site-owner> Homer Simpson </mydomain:site-owner> </rdf:Description> </rdf:RDF> 05 - Representação e Raciocínio 19 RDF Schema RDF Schema (RDFS) é um modelo de tipos de dados simples que permite a criação de classes e propriedades. Principais conceitos: Recurso (rdfs:Resource) Classe (rdfs:Class) Propriedade (rdf:Property) 05 - Representação e Raciocínio 20 RDF Schema (RDFS) O RDFS não fornece ainda todos os detalhes necessários para descrever recursos: Não possui restrições de domínio ou escopos específicos. Não possui restrições de existência ou cardinalidade. Não possui propriedades transitivas, inversas ou simétricas. Mesmo assim: Tornou-se um padrão de fato para a Web Semântica Possui suficiente potencial de expressividade Permite obter estruturas de informação sem ambiguidades. 05 - Representação e Raciocínio 21 Ontologias São especificações formais compartilhadas dos conceitos de um determinado domínio Vem da filosofia (estudo do ser) e foram incorporadas pela Ciência da Computação, especialmente nas áreas de Inteligência Artificial e Representação do Conhecimento Constituem o núcleo da Web Semântica, que não pode ser construída sem elas. 05 - Representação e Raciocínio 22 OWL: Web Ontology Language Padrão desenvolvido pelo W3C para a representação de ontologias para a Web Semântica Baseia-se no modelo da orientação a objetos com elevada expressividade semântica herdando a mesma sintaxe de XML/RDF Apresenta-se em três versões, voltadas para diferentes aplicações: Lite DL (Description Logics) Full 05 - Representação e Raciocínio 23 OWL: Web Ontology Language 05 - Representação e Raciocínio 24 SPARQL É uma linguagem de consulta para os padrões de grafos RDF/RDFS Está para a Web Semântica assim como SQL está para as bases de dados relacionais Formada por: Padrões de consulta Protocolo para uso com HTTP Formato XML para saída dos resultados É um padrão W3C desde janeiro de 2008 05 - Representação e Raciocínio 25 SPARQL 05 - Representação e Raciocínio 26 RIF: Rule Interchange Format GIF, KIF... RIF Proposta de um formato padronizado para o compartilhamento de regras entre diferentes comunidades: empresariais, acadêmicas etc. Tecnologia em desenvolvimento por um grupo de trabalho no W3C http://www.w3.org/2005/rules/wiki/RIF_Working_Group 05 - Representação e Raciocínio 27 Lógica Unificadora Representação unificada de expressões SPARQL, RIF e ontologias (descritas em OWL) O objetivo é oferecer um framework único para possibilitar a combinação dos elementos das camadas inferiores Abordagens ainda em estudo incluem lógica modal para a caracterização de ações, lógicas auto-epistêmicas, lógicas de descrição, entre outras 05 - Representação e Raciocínio 28 Prova Mecanismos de inferência devem ser especificados para o uso das regras previamente definidas Validação de informações com uso de agentes: Software executado sem controle humano direto ou supervisáo constante para cumprir objetivos definidos por um usuário Coletam, filtram e processam informações na Web, eventualmente com o auxílio de outros agentes 05 - Representação e Raciocínio 29 Criptografia Transversalmente às diversas camadas da Web Semântica, muitas vezes é necessário garantir a segurança e privacidade das informações. Com esta finalidade, mecanismos de criptografia são integrados às camadas, especialmente em aplicações mais sensíveis. Por exemplo, com o emprego de dupla chave (pública/privada). 05 - Representação e Raciocínio 30 Confiança Após a informação desejada ser obtida, é necessário determinar a sua autenticidade Entidades confiáveis podem ser definidas (p.ex: bibliotecas virtuais, agências de autentificação, etc.) Declarações de confiabilidade podem ser verificadas se houver confirmação de outra entidade (também confiável) Por exemplo, pode-se acreditar que alguém é funcionário de uma loja se a loja também afirma que a pessoa é um funcionário e a loja pertence a uma lista de entidades confiáveis 05 - Representação e Raciocínio 31 Interface do Usuário Uma das metas da Web Semântica é a personalização da interface do usuário em suas aplicações. Para isso é necessário modelar as preferências, necessidades e interesses de cada usuário Contribuem para essa meta o desenvolvimento (semi-)automatizado de ontologias pessoais com o uso de vocabulários controlados como o Dublin Core e o FOAF 05 - Representação e Raciocínio 32 Aplicações Gerenciamento de Conteúdo Business Intelligence Interfaces Colaborativos Comunicação entre Comunidades Virtuais Gerenciamento de Dados Multi e Hipermídia Educação formal e continuada etc. 05 - Representação e Raciocínio 33 Em resumo... A Web Semântica é hoje uma realidade Grande progresso realizado desde a proposta original de 2001 Muitas aplicações já estão disponíveis e o número continua aumentando Crescente suporte oferecido pela iniciativa privada e o setor governamental O desenvolvimento continua É fácil participar: muitas ferramentas livres estão disponíveis Novas linguagens e técnicas começam a atingir uma massa crítica Os próximos passos são instigantes: O “efeito rede”: conexão dos recursos da WS com os demais As oportunidades de pesquisa e desenvolvimento continuam em alta 05 - Representação e Raciocínio 34