05. Representação e Raciocínio
Aplicações na Web Semântica
Luiz A M Palazzo
Universidade Católica de Pelotas
Centro Politécnico
Abril de 2010
Na Linha do Tempo
 1970 - ARPANET
 1980 - BITNET  NSFNET  INTERNET
 1990 - World Wide Web
 2000 - Web 2.0 - Web Social
 2010 - Web 3.0 - Web Semântica
 2020 - Web 4.0 - Web Ubíqua
Fontes: Hobbes Internet Timeline - http://www.zakon.org/robert/internet/timeline/
Radar Networks - http://www.radarnetworks.com/
05 - Representação e Raciocínio
2
A Evolução Tecnológica
05 - Representação e Raciocínio
3
Outra Visão a Longo Prazo
05 - Representação e Raciocínio
4
A Web Hoje
 O tamanho da Web Indexada é estimado em mais de 57 bilhões
de páginas (WorldWideWebSize.com, abril de 2010)
 A maior parte é dirigida ao consumo humano:
 Mesmo o conteúdo gerado automaticamente a partir de bases de
dados é usualmente apresentado sem a estrutura original da base
de dados.
 Alguns usos típicos da Web hoje:
 Pesquisar e utilizar informação,
 Buscar e entrar em contato com outras pessoas,
 Pesquisar recursos, produtos e lojas on-line,
 Adquirir produtos e serviços.
05 - Representação e Raciocínio
5
A Web 2.0
 Uma Web social
• Participativa
• Exemplos:
•
•
•
•
•
Google Apps
Wikipedia
Blogging
Second Life
Tags (folksonomias)
05 - Representação e Raciocínio
6
A Web Semântica
 Uma Web de dados (descritos por metadados)
 Capaz de ser entendida por humanos e máquinas
simultaneamente
 Gradualmente incorporada à Web Sintática
 Permitindo a realização de inferências sobre o seu
conteúdo
 Oferecendo suporte a aplicações inteligentes e
inovadoras
05 - Representação e Raciocínio
7
Uma Web de Dados!
05 - Representação e Raciocínio
8
A Proposta Original
Scientific American Magazine, maio de 2001
05 - Representação e Raciocínio
9
Uma Web em Camadas
05 - Representação e Raciocínio
10
Onde estamos agora?
 Ainda... em construção
 Novos modelos estão gradualmente
sendo propostos, testados e aceitos
 Baseia-se em conceitos fundamentais
sobre o relacionamento semântico
entre as linguagens de cada camada
 As camadas mais baixas estão mais
consolidadas
 As últimas camadas (Lógica, Prova,
Confiança) estão ainda em fase de
pesquisa
05 - Representação e Raciocínio
11
O Nível Léxico: UNICODE
 Padrão de codificação de caracteres
 Em substituição ao ASCII (8 bits – 256 caracteres)
 16 bits (65.536 caracteres)
 Símbolos de linguagens internacionais
 Símbolos matemáticos
 Símbolos financeiros
 Outros símbolos especiais
 Cerca de 49.000 símbolos usados
 16.000 combinações livres para uso customizado
05 - Representação e Raciocínio
12
URI / IRI
 URI: Uniform Resource Identifier
 IRI: Internationalized URI
 Superconjunto de:
 URL (Uniform Resource Location)
 URN (Uniform Resource Name)
 URC (Uniform Resource Classification)
 Elemento básico da estrutura a partir
do qual os demais componentes são
construídos
05 - Representação e Raciocínio
13
XML: eXtensible Markup Language
 É uma linguagem de marcação,
como HTML
 Ambas são baseadas em tags
 <titulo> Minha Página </titulo>
 Mas, HTML é voltada para a
formatação, enquanto que XML
tenta capturar a estrutura da
informação
 XML também permite a criação de
novas tags para atender aplicações
específicas
05 - Representação e Raciocínio
14
Comparando HTML e XML
HTML
XML
<h2>Context-Dependent
Reasoning</h2>
<i>por <b>V. Marek</b> e
<b>M. Truszczynski</b></i><br>
Springer 1993<br>
ISBN 0387976892
<livro>
<título>Context-Dependent Reasoning</título>
<autor>V. Marek</autor>
<autor>M. Truszczynski</autor>
<editora>Springer</editora>
<ano>1993</ano>
<ISBN>0387976892</ISBN>
</livro>
05 - Representação e Raciocínio
15
Vocabulários XML
 Aplicações para a Web devem concordar em um vocabulário
comum (nomes de tags) para se comunicar e colaborar.
 As comunidades e setores empresariais estão definindo seus
vocabulários especializados:






Matemática (MathML)
Bioinformática (BSML)
Recursos Humanos (HRML)
Recursos na Web (Dublin Core)
Pessoas (FOAF)
…
05 - Representação e Raciocínio
16
Namespaces
 Identificadores podem ter mais de um significado
 Os namespaces contextualizam identificadores
 Os identificadores são únicos dentro de um namespace

<h:mesa xmlns:h="http://www.w3.org/TR/html4/">
<h:tr>
<h:td>Maçãs</h:td>
<h:td>Bananas</h:td>
</h:tr>
</h:mesa>

<f:mesa xmlns:f="http://www. ... /mobilia">
<f:nome>Mesa de Jantar</f:nome>
<f:largura>160</f:largura>
<f:comprimento>240</f: comprimento>
</f:mesa>
05 - Representação e Raciocínio
17
RDF: Resource Description Framework

Representação de metadados

Acessível por máquinas

Significado codificado em triplas

Recurso (1) tem propriedade (2)
que tem valor (3)

Recurso: qualquer objeto do mundo
real descrito de forma única por um URI

Propriedade: aspectos específicos que
caracterizam e descrevem um recurso

Declarações: associações entre um recurso
específico, uma propriedade qualquer e o
valor dessa propriedade, para esse recurso.
05 - Representação e Raciocínio
18
RDF: Com a Sintaxe do XML
<rdf:RDF
xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:mydomain="http://www.mydomain.org/my-rdf-ns">
<rdf:Description
rdf:about="http://www.cit.gu.edu.au/~db">
<mydomain:site-owner>
Homer Simpson
</mydomain:site-owner>
</rdf:Description>
</rdf:RDF>
05 - Representação e Raciocínio
19
RDF Schema
 RDF Schema (RDFS) é um modelo
de tipos de dados simples que
permite a criação de classes e
propriedades.
 Principais conceitos:
 Recurso (rdfs:Resource)
 Classe (rdfs:Class)
 Propriedade (rdf:Property)
05 - Representação e Raciocínio
20
RDF Schema (RDFS)
 O RDFS não fornece ainda todos os detalhes necessários para
descrever recursos:
 Não possui restrições de domínio ou escopos específicos.
 Não possui restrições de existência ou cardinalidade.
 Não possui propriedades transitivas, inversas ou simétricas.
 Mesmo assim:
 Tornou-se um padrão de fato para a Web Semântica
 Possui suficiente potencial de expressividade
 Permite obter estruturas de informação sem ambiguidades.
05 - Representação e Raciocínio
21
Ontologias
 São especificações formais
compartilhadas dos conceitos de um
determinado domínio
 Vem da filosofia (estudo do ser) e
foram incorporadas pela Ciência da
Computação, especialmente nas
áreas de Inteligência Artificial e
Representação do Conhecimento
 Constituem o núcleo da Web
Semântica, que não pode ser
construída sem elas.
05 - Representação e Raciocínio
22
OWL: Web Ontology Language
 Padrão desenvolvido pelo W3C para
a representação de ontologias para a
Web Semântica
 Baseia-se no modelo da orientação a
objetos com elevada expressividade
semântica herdando a mesma sintaxe
de XML/RDF
 Apresenta-se em três versões,
voltadas para diferentes aplicações:
 Lite
 DL (Description Logics)
 Full
05 - Representação e Raciocínio
23
OWL: Web Ontology Language
05 - Representação e Raciocínio
24
SPARQL
 É uma linguagem de consulta para
os padrões de grafos RDF/RDFS
 Está para a Web Semântica assim
como SQL está para as bases de
dados relacionais
 Formada por:

Padrões de consulta

Protocolo para uso com HTTP

Formato XML para saída dos resultados
 É um padrão W3C desde janeiro de 2008
05 - Representação e Raciocínio
25
SPARQL
05 - Representação e Raciocínio
26
RIF: Rule Interchange Format
 GIF, KIF... RIF
 Proposta de um formato padronizado
para o compartilhamento de regras
entre diferentes comunidades:
empresariais, acadêmicas etc.
 Tecnologia em desenvolvimento
por um grupo de trabalho no W3C
 http://www.w3.org/2005/rules/wiki/RIF_Working_Group
05 - Representação e Raciocínio
27
Lógica Unificadora
 Representação unificada de
expressões SPARQL, RIF e
ontologias (descritas em OWL)
 O objetivo é oferecer um framework
único para possibilitar a combinação
dos elementos das camadas
inferiores
 Abordagens ainda em estudo
incluem lógica modal para a
caracterização de ações, lógicas
auto-epistêmicas, lógicas de
descrição, entre outras
05 - Representação e Raciocínio
28
Prova
 Mecanismos de inferência devem ser
especificados para o uso das regras
previamente definidas
 Validação de informações com uso de
agentes:
 Software executado sem controle
humano direto ou supervisáo
constante para cumprir objetivos
definidos por um usuário
 Coletam, filtram e processam informações na Web,
eventualmente com o auxílio de outros agentes
05 - Representação e Raciocínio
29
Criptografia
 Transversalmente às diversas
camadas da Web Semântica,
muitas vezes é necessário garantir
a segurança e privacidade das
informações.
 Com esta finalidade, mecanismos
de criptografia são integrados às
camadas, especialmente em
aplicações mais sensíveis.
 Por exemplo, com o emprego de
dupla chave (pública/privada).
05 - Representação e Raciocínio
30
Confiança

Após a informação desejada ser obtida,
é necessário determinar a sua
autenticidade

Entidades confiáveis podem ser
definidas (p.ex: bibliotecas virtuais,
agências de autentificação, etc.)

Declarações de confiabilidade podem
ser verificadas se houver confirmação
de outra entidade (também confiável)

Por exemplo, pode-se acreditar que alguém é funcionário
de uma loja se a loja também afirma que a pessoa é um
funcionário e a loja pertence a uma lista de entidades
confiáveis
05 - Representação e Raciocínio
31
Interface do Usuário
 Uma das metas da Web Semântica
é a personalização da interface do
usuário em suas aplicações.
 Para isso é necessário modelar as
preferências, necessidades e
interesses de cada usuário
 Contribuem para essa meta o
desenvolvimento (semi-)automatizado de
ontologias pessoais com o uso de vocabulários
controlados como o Dublin Core e o FOAF
05 - Representação e Raciocínio
32
Aplicações
 Gerenciamento de Conteúdo
 Business Intelligence
 Interfaces Colaborativos
 Comunicação entre Comunidades
Virtuais
 Gerenciamento de Dados Multi e Hipermídia
 Educação formal e continuada
 etc.
05 - Representação e Raciocínio
33
Em resumo...

A Web Semântica é hoje uma realidade
 Grande progresso realizado desde a proposta original de 2001
 Muitas aplicações já estão disponíveis e o número continua aumentando
 Crescente suporte oferecido pela iniciativa privada e o setor governamental

O desenvolvimento continua
 É fácil participar: muitas ferramentas livres estão disponíveis
 Novas linguagens e técnicas começam a atingir uma massa crítica

Os próximos passos são instigantes:
 O “efeito rede”: conexão dos recursos da WS com os demais

As oportunidades de pesquisa e desenvolvimento continuam em alta
05 - Representação e Raciocínio
34
Download

Apresentação PowerPoint