Publicação de Dados Governamentais no Padrão Linked Data 1.3 – Web Semântica Karin Breitman José Viterbo Edgard Marx Percy Salas LA C Laboratory for Advanced Collaboration Objetivos 1.Apresentar os conceitos relacionados à Web Semântica; 2 Sumário 1.Introdução 2.Motivação 3.Definição 4.Web sintática X Web semântica 5.Processo de Desenvolvimento 6.Arquitetura 3 Introdução Interoperabilidade na era da informação Nova Demandas: • Gerenciamento de grandes conjuntos de dados • Maior poder de computação e resolução tempo espacial • Resposta rapida • Interdisciplinaridade 4 4 Introdução Nosso alunos/filhos são nativos digitais. . . • A experiência do consumidor guia expectativas – Desktop Mobile computing – Web sites Experiências Web – Games Cast member/participante/grupos – Conteudo estático Interação em tempo real & colaboração – Telefones informação móvel e integrada, dispositivos de recreação e redes sociais – Email video, voz e mensagens em texto • Os melhores indicadores das tendências em TI passaram a ser as feiras de eletro/eletrônicos e não mais as de informática (SUCESU, Comdex, Fenasoft….) 5 Introdução Nativos Digitais esperam que os serviços acomodem suas preferências • • • • • • Informação online, não “in line” Informação sob demanda, livre de local ou hora Experiência real e virtual mesclada (sala de aula..) Conteúdo relevante Conteúdo de múltiplas fontes, em vários formatos Habilidade de contribuir (YouTube) e consumir conteúdos • Conteúdos interativos 6 Introdução Web 2.0 • Aplicações e tecnologias avançadas na Internet, incluindo blogs, wikis, RSS, bookmarking social, etc. • Maior colaboração entre usuários da Internet, provedores de conteúdo e empreendedores • Participação do usuário na natureza e escopo do conteúdo da Web, incluindo controle sobre ele em tempo real • Habilidade de mesclar (“mash up”) informação de diferentes fontes para criar o contexto desejado para a informação • Palavras-chave: dinâmica, interativa, colaborativa • Lados bons e ruins – YouTube e blogs como armas. 7 Infra-estrutura de TI • Redes crescerão 500% em capacidade nos próximos 5 anos. • Metade dos computadores serão portáteis. • 60% de todas as universidades terão cobertura de rede sem-fio em todo o campus. • Redes de pesquisa crescerão de capacidade de 622 megabits a 80 gigabits. • Video On-demand de alta definição irá consumir uma grande parte da capacidade da rede. 8 Tendências e Tecnologias Emergentes • Reconhecimento de voz de melhor qualidade • Baterias com maior tempo de duração • Mais serviços baseados em localização, utilizando GPS • Lei de Moore (aumento da densidade dos chips) • Maior largura de banda (100 terabyte com fibra simples) • Mais poder computacional • Maior capacidade de armazenamento de dados 9 Tendências e Tecnologias Emergentes • Mecanismos de busca continuarão a aumentar o acesso a livros, web sites, gravações, filmes, peças educativas, palestras e o próprio desktop • Aumento da renda com publicidade online. • Busca está se transformando em “navegação” • Google já lucra mais em publicidade que as redes ABC, CBS e NBC combinadas • Messagens instantâneas vão superar o e-mail em volume de comunicação dentro de 5 anos 10 Evolução da Ciência • Mil anos atrás: ciência era empirírica descrevendo fenômenos naturais • Últimas séculos: uma vertente teórica usando modelos, generalizações • Últimas décadas: uma vertente computacional simulando fenômenos complexos • Hoje: exploração de dados sintetizando teoria, experimentação e computação com gerenciamento avançado de dados e estatísticas novos algoritmos! 11 2 . 4π Gρ c2 a a = 3 − Κ a 2 Crescimento dos Dados Vivemos em um mundo Exponencial • Massa de dados científicos dobra todo ano – Causado pelas sucessias gerações de sensores de baixo custo + computação exponencialmente mais rápida • Mudanças na natureza da computação científica • Interdisciplinaridade (eScience) • Vem se tornando cada vez mais difícil extrair conhecimento • 20% dos servidores do mndo estão entre enormes data centers dos “5 Grandes” – Google, Microsoft, Yahoo, Amazon, eBay • Não se trata apenas de dados científicos 12 Coleta de Dados • Distribuição muito extensa de dados: dados em todas as escalas! • A maioria dos conjuntos de dados é pequena, e mantida manualmente ( planilhas do Excel) • Quantidade total de dados dominada pelo outro lado (grandes instalações com arquivos multi-TB) • A maioria dos bytes são coletados via sensores elêtronicos 13 Web Semântica Motivação Mas.... ......a maior parte dos recursos primários estão em linguagem natural, compreensíveis para humanos (apenas). 14 Web Semântica Definição • “A Web Semântica é uma EXTENSÃO da web atual na qual é dado a informação um SIGNIFICADO bem definido, permitindo com que computadores e pessoas trabalhem em cooperação.” Berners-Lee, Hendler e Lassila • "The Semantic Web is an extension of the current web in which information is given well-defined meaning, better enabling computers and people to work in cooperation." 15 Web Semântica Como humanos enxergam esta página 16 Web Semântica Como o computador enxerga esta página 17 A Web de Hoje • 8 bilhões de páginas – Mecanismos de busca: Yahoo, Google, AltaVista... – Nenhum mecanismo para “interpretar” o resultado das buscas. 18 Busca Sintática Busca pela palavra “morango” Did you mean: morongo 19 • :: M o ra ng o :: - "As fotos aqui veiculadas, bem como os textos, frames, sinais distintivos, logotipo e marca são de propriedade do site M ora ng o.com.br. ... • :: M o ra n g o -... Divirta-se! "As fotos aqui veiculadas, bem como os textos, frames, sinais distintivos, logotipo e marca são de propriedade do site M o ra n g o .com.br. ... • deviantART: m o ra n g o ~m o ra n g o . Joana Vieira. is an Antagonist; is Female; is a deviant since Aug 8, 2002, 2:02 PM; has 9,972 pageviews; is located in Portugal; ... 500kv k'pow! • STRABERRY M o ra n g o M O R A N G O - fruto produzido por erva rasteira, Fragancia vesca, originária da Europa, possui inúmeras variedades naturais e híbridas. ... • California Casino M o ra n g o California Casino M o ra n g o ( Casino ). Casino Shop for Casino from 600+ merchants with one cart. Hundreds of trusted merchants. Thousands of popular brands. ... • vof M o ra n g o - smakelijke aardbeien, vers, vertrouwd en ... vers. aardbeien zijn het lekkerst als ze vers zijn. van eind april tot in november plukken wij ze dagelijks voor u. vertrouwd. van aardbeien ... • Batida M o ra n g o re c ip e A delicious recipe for Batida M o ra n g o , with cachaca, strawberries, granulated sugar and crushed ice. Also lists similar drink recipes. ... Batida M o ra n g o recipe. ... Web Sintática • Biblioteca Digital – Uma biblioteca de documentos chamados páginas (web pages) interconectados por links • Base de Dados, plataforma para aplicações – Portal comum para aplicações acessíveis através de páginas web e que apresentam resultados utilizando estas mesmas páginas. • Plataforma multimídia – Internet Radio, Trailers de filmes, … • Um esquema de nomeação – Identidade única para documentos RESUMO: Um lugar onde os computadores são responsáveis pela APRESENTAÇÃO (o fácil) e as pessoas fazem a INTERPRETAÇÃO (o difícil) Por que não fazer com que os computadores fiquem com a parte mais pesada do trabalho? 20 Ref: Goble Web Semântica • Metadados • Combinar recursos primários com recursos de metadados • Metadados em formato padronizado podem ser entendidos por software e pessoas 21 Objetivos “enriquecer a informação disponível com semântica que pode ser entendida por máquinas “ “fornecer acesso inteligente a informação heterogênea e distribuída, permitindo que produtos de software possam fazer uma intermediação entre as necessidades do usuário e as fontes de informação disponíveis. “ ontologia 22 Web Semântica 23 23 Processo de Desenvolvimento Prototipação Mundo aberto: rápida Evolui, Itera, Reprojeta, Reaplica Levantar de Infra-estrutura Tecnológica Adota Abordagem Tecnológica Revisão de Especialista & Iteração Evaluation Uso de ferramentas Equipe pequena, habilidades diversas Caso de uso Análise 24 Desenvolve modelo/ ontologia Arquitetura da Web Semântica OWL RDF + rdfschema XML + URI + XMLNS + xmlschema XML 25 XML, RDF & OWL • XML: sintaxe universal • XML Schema: define a estrutura dos documentos XML • RDF: modelo de dados para objetos de recurso • RDF Schema: vocabulário básico para definição de RDFs classes & propriedades e suas relações hierárquicas • 26 OWL: estende o vocabulário para definição de classes e propriedades, incluindo: – cardinalidade (ex. minCardinality 1) – igualdade (ex. equivalentClass) – relacionamentos entre classes (ex. disjointWith) – características de propriedades (ex. FunctionalProperty) Principais Referências K. Breitman. Web Semântica: a Internet do Futuro. Editora LTC, 2005; H. Halpin, S. Hawke, I. Herman, E. Prud’hommeaux, D. Raggett and R. Swick. W3C Semantic Web Activity, W3C. Disponível em http://www.w3.org/2001/sw/; I. Herman (mantenedor). W3C Semantic Web Frequently Asked Questions, W3C. Disponível em http://www.w3.org/2001/sw/SW-FAQ. 27