DADOS ABERTOS INTERLIGADOS
CIN/UFPE
José Luiz Correia Neto
WEB ATUAL
 Internet Contemporânea: constante
processo de evolução
 Hipertexto
 Documentos de diversas áreas do
conhecimento
 Objetivos de apresentação
http://www.w3c.br/cursos/dados-abertos/curso/Parte-1-Modulo-4-Linked%20Data.pdf
WEB ATUAL
A Web atual pode ser classificada como sintática
e o processo de interpretação dos conteúdos disponibilizados
fica geralmente a cargo dos usuários.
(CUNHA, LÓSCIO, & SOUZA)
PROBLEMA E SOLUÇÃO
 Dados na Web lidos ou compreendidos por humanos e não por
agentes de software
 Processar a semântica
 Atribuição de significado:
Elementos
Dados
Expressões
PROBLEMA E SOLUÇÃO
 Relação de significância entre os
conteúdos publicados
 Perceptível pelos usuários e
agentes de software
 Nova visão da Web: Web
Semântica
WEB SEMÂNTICA
 Web Semântica: extensão da
Web
 Facilita a interpretação e
integração dos dados
LINKED DATA
 Linked Data: conjunto de boas práticas
 “Web de Dados”
 HTTP e URI
 A Web de Dados cria inúmeras
oportunidades para a integração
semântica
PADRÕES
URIs
 Usadas para identificar objetos e
conceitos
 O dereferenciamento resulta uma
descrição RDF
PADRÕES
HTTP
 Protocolo responsável pelo
tratamento de pedidos e respostas
entre cliente e servidor na Web
PADRÕES
RDF
 Linguagem para representar
informação na Internet.
 Componentes:
Sujeito
Predicado
Objeto
PADRÕES
SPARQL
 Linguagem de consulta padrão
para recuperação de informações
contidas em grafos RDF
 Estrutura:
Select-From-Where
WEB DE DOCUMENTOS
VS. WEB DE DADOS
WEB DE DOCUMENTOS
WEB DE DADOS
Navegadores HTML
Navegadores RDF
Hiperlinks
Links RDF
WEB DE DOCUMENTOS
VS. WEB DE DADOS
WEB DE DOCUMENTOS
 Mecanismo de identificação global
único (URIs)
WEB DE DADOS
 Mecanismo de identificação global
único (URIs)
 Mecanismo de acesso universal (HTTP)
 Mecanismo de acesso universal (HTTP)
 Formato de representação de conteúdo
 Modelo padrão para representação de
(HTML)
dados (RDF)
 Linguagem de consulta (SPARQL)
PRINCÍPIOS LINKED DATA
Princípios básicos:
1. Usar URIs como nome para recursos
2. Usar URIs HTTP para que as pessoas possam encontrar
esses nomes
3. Quando alguém procurar por uma URI, garantir que
informações úteis possam ser obtidas por meio dessa URI
4. Incluir links para outras URIs para que outros recursos
possam ser descobertos
Tim Berners-Lee
LOD
 Fundado em 2007
 Apoiado pelo W3C Semantic Web
Education and Outreach Group
 Objetivo: identificar conjuntos de
dados sob licenças abertas e
convertê-lo para RDF
LOD
 Fase inicial: pesquisadores e
desenvolvedores de laboratórios
universitários e empresas de
pequeno porte
 Requisitos: conjunto de dados de
acordo com os princípios do Linked
Data e interligação aos conjuntos
de dados existentes
 Mais de 500 milhões
de triplas RDF
 Cerca de 120 mil links
RDF entre fontes de
dados
Maio de 2007
Visão geral de conjuntos de dados publicados e seus relacionamentos no contexto do projeto Linking Open Data
Outubro de 2007
Novembro de 2007
Novembro de 2007
Fevereiro de 2008
Março de 2008
Setembro de 2008
Março de 2009
Março de 2009
Julho de 2009
Setembro de 2010
Setembro de 2011
Agosto de 2014
5 ESTRELAS DOS DADOS ABERTOS
 Segundo Berners-Lee, “Dados Abertos Interligados são
Dados Linkados publicados por meio de licenças
abertas”
 Dados Interligados não são necessariamente abertos
 Dado Aberto Interligado só é assim considerado se for
aberto
5 ESTRELAS DOS DADOS ABERTOS
Disponível na Internet (em qualquer formato. Por exemplo: PDF), desde que com
licença aberta, para que seja considerado Dado Aberto
Disponível na Internet de maneira estruturada (em um arquivo Excel com
extensão XLS)
Disponível na Internet, de maneira estruturada e em formato não proprietário
(CSV em vez de Excel)
Seguindo todas as regras acima, mas dentro dos padrões estabelecidos pelo
W3C (RDF e SPARQL): usar URL para identificar coisas e propriedades, de
forma que as pessoas possam direcionar para suas publicações
Todas as regras acima, mais: vincular seus dados aos de outras pessoas, de
forma a fornecer um contexto.
CONSUMO DE DADOS INTERLIGADOS
 Aumento de dados disponíveis de acordo com os princípios Linked Data.
 Aplicações:
Browsers
Motores de Busca
Aplicações para domínios específicos
CONSUMO DE DADOS INTERLIGADOS
Browser Linked Data - Lodlive
 Permite alimentá-lo com uma URI e
de forma interativa, seguir os links
associados. URIs podem vir de
DBedia, Freebase, entre outras.
 Browser Lodlive
CONSUMO DE DADOS INTERLIGADOS
Motores de Busca - Sindice
 Coleta de dados na web de muitas
maneiras e oferece busca e consulta
através dos dados.
CONSUMO DE DADOS INTERLIGADOS
Aplicações para domínios específicos DBPedia
 Provê a visualização de um mapa com
informações oriundas das entidades
DBpedia e informações de outras
bases de conhecimento
DESAFIOS
 Criar meios eficientes que viabilizem o uso do grande volume de dados
 Informação útil, específica e relevante
 Linked Data é a chave para a transformação da Web
 Os princípios do Linked Data devem ser ainda mais discutidos
REFERÊNCIAS

CUNHA, D. R. B.; SOUZA, D. Y. ; LOSCIO, B. F. (2011) Linked Data: da Web de Documentos para a Web de
Dados. V Escola Regional de Informática Ceará, Maranhão, Piauí: Livro texto dos minicursos, 07 e 08 de
novembro de 2011. [livro eletrônico]

Linked Data (http://www.w3.org/DesignIssues/LinkedData.html)

Publicação de Dados Governamentais no Padrão Linked Data (http://www.w3c.br/cursos/dadosabertos/curso/Parte-1-Modulo-4-Linked%20Data.pdf)

LiAM: Linked Archival Metadata: Semantic Web browsers.
(http://sites.tufts.edu/liam/2014/03/22/browsers/)
REFERÊNCIAS

Lodlive (http://en.lodlive.it/)

Sindice (http://sindice.com/)

DBPedia Applications (http://wiki.dbpedia.org/Applications)

As 5 Estrelas dos Dados Abertos (platform.od4d.org/articles/filter/about/CSV?locale=pt)
Download

web de dados