Web Semântica
Mineração na Web – if796
Subtitle
Equipe
• João Victor Leite
• Lucas Harada
• Maria Fernanda Castro
• Ricardo Souza
Roteiro
• Cenário atual da Web
• O que é Web Semântica?
• Como funciona?
– Tecnologias
– Arquitetura
• Impacto para a RI
• Algumas aplicações
• Futuro da Web Semântica
• Conclusão
Cenário atual da Web
Hoje, é possível que uma pessoa receba
mais informação nova em um dia do
que um camponês da Idade Média
durante toda a sua vida.
Cenário atual da Web
• A Web está cada dia mais presente
em nossa vida:
– Vida social (redes sociais)
– Comércio (compras online, anúncios)
– Finanças (movimentação bancária online)
– Educação (cursos à distância)
Cenário atual da Web
• Grande volume de informações,
gerado em grande velocidade
• Nenhum controle sobre a produção
de conteúdo
Cenário atual da Web
• Problema:
– Como “entender” o sentido de um conteúdo, para tratar
e manipular os dados que se encontram na Web de
maneira eficiente?
O que é Web Semântica?
• Tim Berners-Lee – criador da World Wide Web e
idealizador da Web Semântica
“É uma extensão da Web atual que visa dar
significado semântico ao conteúdo das
páginas Web, criando um ambiente onde
agentes de software e usuários possam
trabalhar de forma cooperativa”
O que é Web Semântica?
A
Baseada em 3 “pilares”
• A: Integração
• B: Semântica
B
C
• C: Interoperabilidade
O que é Web Semântica?
• Representar informação de maneira a tornar o processamento mais
simples
• Trazer a abordagem de dados além de puramente conteúdo
• Inferir e racionalizar as informações
• Exemplo:
– Consulta: “Palestra SBPC”
– Resultado: Convidados, palestrantes, datas, eventos relacionados
Como funciona?
• A Web Semântica faz uso de diversas tecnologias, sendo
os principais tipos:
– Metadados
– Ontologias
– Agentes
• Que são usadas para criar uma arquitetura em camadas
Tecnologias - Metadados
• Metadata: “dados sobre dados”, informações de contexto
e significado
• Uso de tags, labels e descrições herárquicas
• Surgimento do RDF e do HTML 5
Tecnologias - Metadados
• RDF – Resource Description Framework
– Recomendado a partir de 1999 pela W3C
– Originalmente descrevia páginas web
– Cria uma estrutura de grafos para os dados, estruturando a
informação
– Sintaxe baseada no XML
– Vocabulário baseado em URI
Tecnologias - Metadados
Tecnologias - Metadados
• SPARQL
– Single Protocol and RDF Query Language
– Linguagem de consulta para metadados
descritos em RDF
– Só permite consultas
Tecnologias - Metadados
@prefix foaf: <http://xmlns.com/foaf/0.1/>
_:a foaf:name “Johnny Lee Outlaw”
_:a foaf:mbox <mailto:[email protected]>
_:b foaf:name “Peter Goodguy”
_:b foaf:mbox <mailto:[email protected]>
_:c foaf:mbox <mailto:[email protected]>
PREFIX foaf: <http://xmlns.com/foaf/0.1/>
SELECT ?name ?mbox
WHERE
{ ?x foaf:name ?name
?x foaf:mbox ?mbox }
Dados
Resultado
Consulta SPARQL
name
mbox
“Johnny Lee Outlaw”
<mailto:[email protected]>
“Peter Goodguy”
<mailto:[email protected]
>
Tecnologias - Metadados
• HTML 5
– Hypertext Markup Language 5
– Linguagem para estruturação de conteúdo
– Surgiu em 2008 como uma evolução do HTML,
trazendo a abordagem semântica
– Em 2011, 34 dos 100 melhores sites utilizavam
HTML 5
Tecnologias - Ontologias
• Especificação e contextualização de um domínio
• Termos e relacionamentos, propriedades, disjunção,
operações lógicas
• RDF Schema e OWL
Tecnologias - Ontologias
• RDF Schema
– Conjunto de classes que visa prover elementos básicos para
descrição de recursos estruturados em RDF
– “Vocabulário” RDF
– Possui relacionamentos e propriedades entre classes
Tecnologias - Ontologias
Tecnologias - Ontologias
• OWL
– Web Ontology Language
– Surgiu com a necessidade de uma ontologia mais expressiva
– Tornou-se a linguagem padrão de representãção de
conhecimento na Web Semântica
– Possui muitos dos elementos do RDF Schema
Tecnologias - Ontologias
Tecnologias - Agentes
• Componentes que agem de maneira autônoma e proativa
• Podem atuar em:
– Metadados : extraindo e catalogando informação da Web
– Ontologias: interpretando e classificando contextos
– Inferência: deduzindo a partir de regras aplicadas ao conteúdo
– Atividades diversas: comunicação entre agentes, manutenção de
modelos de usuário
Tecnologias - Outros
• URI
– Universal Resource Identifier
– Representação única e padronizada de recursos, visando
interoperabilidade
• RIF
– Rule Interchange Format
– Formato padronizado para compartilhamento de regras entre os
sistemas
Arquitetura
• Arquitetura em camadas para
facilitar interoperabilidade entre
as tecnologias e adesão de
novos componentes
Arquitetura
• Trust + Crypto
• Proof
• Unifying Logic
Arquitetura – Trust + Crypto
• Verificar autenticidade das fontes = confiabilidade
• Previne inconsistências
• Garante a segurança, privacidade e integridade
das informações = assinatura digital
Arquitetura – Proof
• Mecanismos de inferência sobre as regras
• Verificar consistência tanto das regras quanto das
conclusões obtidas
Arquitetura – Unifying Logic
• Trazer uma interface lógica única para as
aplicações = união das tecnologias
• Padronizar a especificação do conteúdo
• Alguns detalhes ainda estão indefinidos
Impacto para a RI
• Área com maior expressividade no uso da Web Semântica até o
momento.
• Usar a inferência a partir de um contexto torna os resultados mais
eficientes
– Busca pelo contexto, e não pela sintaxe
– Permite analisar outros tipos de conteúdo, criados por outras aplicações
• Utilização da RI + Web Semântica na área de Saúde
Algumas Aplicações
• A Web Semântica ainda é um grande desafio
• Aplicações utilizam apenas algumas das tecnologias
• No entanto, estão conquistando mercado e obtendo lucro
Algumas Aplicações
Algumas Aplicações
• Em 2006, a Spock levantou 7 milhões de dólares em capital de
ventura
• Em 2008, o faturamento da empresa foi de 10 milhões.
• A empresa foi comprada pela Intelius, especializada em informações
sociais, em 2009
Algumas Aplicações
Algumas Aplicações
Futuro da Web Semântica
• Transição gradual entre a Web que conhecemos e a Semântica
• Grandes marcas estarão envolvidas
– Google adquire a empresa MetaWeb
– Governo inglês investe 30 milhões de libras em pesquisa
• Para participar do projeto: http://www.w3.org/participate/
– Fóruns
– Eventos
– Disponibilização de código
Conclusão
• Web Semântica tenta trazer “significado” ao conteúdo existente
• A Web Semântica transformará a Web que conhecemos hoje numa
Web de Dados, onde tudo poderá ser interligado
• As tecnologias usadas tornarão os serviços Web mais eficientes
Dúvidas
Download

Web semântica