DADOS ABERTOS INTERLIGADOS CIN/UFPE José Luiz Correia Neto WEB ATUAL Internet Contemporânea: constante processo de evolução Hipertexto Documentos de diversas áreas do conhecimento Objetivos de apresentação http://www.w3c.br/cursos/dados-abertos/curso/Parte-1-Modulo-4-Linked%20Data.pdf WEB ATUAL A Web atual pode ser classificada como sintática e o processo de interpretação dos conteúdos disponibilizados fica geralmente a cargo dos usuários. (CUNHA, LÓSCIO, & SOUZA) PROBLEMA E SOLUÇÃO Dados na Web lidos ou compreendidos por humanos e não por agentes de software Processar a semântica Atribuição de significado: Elementos Dados Expressões PROBLEMA E SOLUÇÃO Relação de significância entre os conteúdos publicados Perceptível pelos usuários e agentes de software Nova visão da Web: Web Semântica WEB SEMÂNTICA Web Semântica: extensão da Web Facilita a interpretação e integração dos dados LINKED DATA Linked Data: conjunto de boas práticas “Web de Dados” HTTP e URI A Web de Dados cria inúmeras oportunidades para a integração semântica PADRÕES URIs Usadas para identificar objetos e conceitos O dereferenciamento resulta uma descrição RDF PADRÕES HTTP Protocolo responsável pelo tratamento de pedidos e respostas entre cliente e servidor na Web PADRÕES RDF Linguagem para representar informação na Internet. Componentes: Sujeito Predicado Objeto PADRÕES SPARQL Linguagem de consulta padrão para recuperação de informações contidas em grafos RDF Estrutura: Select-From-Where WEB DE DOCUMENTOS VS. WEB DE DADOS WEB DE DOCUMENTOS WEB DE DADOS Navegadores HTML Navegadores RDF Hiperlinks Links RDF WEB DE DOCUMENTOS VS. WEB DE DADOS WEB DE DOCUMENTOS Mecanismo de identificação global único (URIs) WEB DE DADOS Mecanismo de identificação global único (URIs) Mecanismo de acesso universal (HTTP) Mecanismo de acesso universal (HTTP) Formato de representação de conteúdo Modelo padrão para representação de (HTML) dados (RDF) Linguagem de consulta (SPARQL) PRINCÍPIOS LINKED DATA Princípios básicos: 1. Usar URIs como nome para recursos 2. Usar URIs HTTP para que as pessoas possam encontrar esses nomes 3. Quando alguém procurar por uma URI, garantir que informações úteis possam ser obtidas por meio dessa URI 4. Incluir links para outras URIs para que outros recursos possam ser descobertos Tim Berners-Lee LOD Fundado em 2007 Apoiado pelo W3C Semantic Web Education and Outreach Group Objetivo: identificar conjuntos de dados sob licenças abertas e convertê-lo para RDF LOD Fase inicial: pesquisadores e desenvolvedores de laboratórios universitários e empresas de pequeno porte Requisitos: conjunto de dados de acordo com os princípios do Linked Data e interligação aos conjuntos de dados existentes Mais de 500 milhões de triplas RDF Cerca de 120 mil links RDF entre fontes de dados Maio de 2007 Visão geral de conjuntos de dados publicados e seus relacionamentos no contexto do projeto Linking Open Data Outubro de 2007 Novembro de 2007 Novembro de 2007 Fevereiro de 2008 Março de 2008 Setembro de 2008 Março de 2009 Março de 2009 Julho de 2009 Setembro de 2010 Setembro de 2011 Agosto de 2014 5 ESTRELAS DOS DADOS ABERTOS Segundo Berners-Lee, “Dados Abertos Interligados são Dados Linkados publicados por meio de licenças abertas” Dados Interligados não são necessariamente abertos Dado Aberto Interligado só é assim considerado se for aberto 5 ESTRELAS DOS DADOS ABERTOS Disponível na Internet (em qualquer formato. Por exemplo: PDF), desde que com licença aberta, para que seja considerado Dado Aberto Disponível na Internet de maneira estruturada (em um arquivo Excel com extensão XLS) Disponível na Internet, de maneira estruturada e em formato não proprietário (CSV em vez de Excel) Seguindo todas as regras acima, mas dentro dos padrões estabelecidos pelo W3C (RDF e SPARQL): usar URL para identificar coisas e propriedades, de forma que as pessoas possam direcionar para suas publicações Todas as regras acima, mais: vincular seus dados aos de outras pessoas, de forma a fornecer um contexto. CONSUMO DE DADOS INTERLIGADOS Aumento de dados disponíveis de acordo com os princípios Linked Data. Aplicações: Browsers Motores de Busca Aplicações para domínios específicos CONSUMO DE DADOS INTERLIGADOS Browser Linked Data - Lodlive Permite alimentá-lo com uma URI e de forma interativa, seguir os links associados. URIs podem vir de DBedia, Freebase, entre outras. Browser Lodlive CONSUMO DE DADOS INTERLIGADOS Motores de Busca - Sindice Coleta de dados na web de muitas maneiras e oferece busca e consulta através dos dados. CONSUMO DE DADOS INTERLIGADOS Aplicações para domínios específicos DBPedia Provê a visualização de um mapa com informações oriundas das entidades DBpedia e informações de outras bases de conhecimento DESAFIOS Criar meios eficientes que viabilizem o uso do grande volume de dados Informação útil, específica e relevante Linked Data é a chave para a transformação da Web Os princípios do Linked Data devem ser ainda mais discutidos REFERÊNCIAS CUNHA, D. R. B.; SOUZA, D. Y. ; LOSCIO, B. F. (2011) Linked Data: da Web de Documentos para a Web de Dados. V Escola Regional de Informática Ceará, Maranhão, Piauí: Livro texto dos minicursos, 07 e 08 de novembro de 2011. [livro eletrônico] Linked Data (http://www.w3.org/DesignIssues/LinkedData.html) Publicação de Dados Governamentais no Padrão Linked Data (http://www.w3c.br/cursos/dadosabertos/curso/Parte-1-Modulo-4-Linked%20Data.pdf) LiAM: Linked Archival Metadata: Semantic Web browsers. (http://sites.tufts.edu/liam/2014/03/22/browsers/) REFERÊNCIAS Lodlive (http://en.lodlive.it/) Sindice (http://sindice.com/) DBPedia Applications (http://wiki.dbpedia.org/Applications) As 5 Estrelas dos Dados Abertos (platform.od4d.org/articles/filter/about/CSV?locale=pt)