Web Semântica Mineração na Web – if796 Subtitle Equipe • João Victor Leite • Lucas Harada • Maria Fernanda Castro • Ricardo Souza Roteiro • Cenário atual da Web • O que é Web Semântica? • Como funciona? – Tecnologias – Arquitetura • Impacto para a RI • Algumas aplicações • Futuro da Web Semântica • Conclusão Cenário atual da Web Hoje, é possível que uma pessoa receba mais informação nova em um dia do que um camponês da Idade Média durante toda a sua vida. Cenário atual da Web • A Web está cada dia mais presente em nossa vida: – Vida social (redes sociais) – Comércio (compras online, anúncios) – Finanças (movimentação bancária online) – Educação (cursos à distância) Cenário atual da Web • Grande volume de informações, gerado em grande velocidade • Nenhum controle sobre a produção de conteúdo Cenário atual da Web • Problema: – Como “entender” o sentido de um conteúdo, para tratar e manipular os dados que se encontram na Web de maneira eficiente? O que é Web Semântica? • Tim Berners-Lee – criador da World Wide Web e idealizador da Web Semântica “É uma extensão da Web atual que visa dar significado semântico ao conteúdo das páginas Web, criando um ambiente onde agentes de software e usuários possam trabalhar de forma cooperativa” O que é Web Semântica? A Baseada em 3 “pilares” • A: Integração • B: Semântica B C • C: Interoperabilidade O que é Web Semântica? • Representar informação de maneira a tornar o processamento mais simples • Trazer a abordagem de dados além de puramente conteúdo • Inferir e racionalizar as informações • Exemplo: – Consulta: “Palestra SBPC” – Resultado: Convidados, palestrantes, datas, eventos relacionados Como funciona? • A Web Semântica faz uso de diversas tecnologias, sendo os principais tipos: – Metadados – Ontologias – Agentes • Que são usadas para criar uma arquitetura em camadas Tecnologias - Metadados • Metadata: “dados sobre dados”, informações de contexto e significado • Uso de tags, labels e descrições herárquicas • Surgimento do RDF e do HTML 5 Tecnologias - Metadados • RDF – Resource Description Framework – Recomendado a partir de 1999 pela W3C – Originalmente descrevia páginas web – Cria uma estrutura de grafos para os dados, estruturando a informação – Sintaxe baseada no XML – Vocabulário baseado em URI Tecnologias - Metadados Tecnologias - Metadados • SPARQL – Single Protocol and RDF Query Language – Linguagem de consulta para metadados descritos em RDF – Só permite consultas Tecnologias - Metadados @prefix foaf: <http://xmlns.com/foaf/0.1/> _:a foaf:name “Johnny Lee Outlaw” _:a foaf:mbox <mailto:[email protected]> _:b foaf:name “Peter Goodguy” _:b foaf:mbox <mailto:[email protected]> _:c foaf:mbox <mailto:[email protected]> PREFIX foaf: <http://xmlns.com/foaf/0.1/> SELECT ?name ?mbox WHERE { ?x foaf:name ?name ?x foaf:mbox ?mbox } Dados Resultado Consulta SPARQL name mbox “Johnny Lee Outlaw” <mailto:[email protected]> “Peter Goodguy” <mailto:[email protected] > Tecnologias - Metadados • HTML 5 – Hypertext Markup Language 5 – Linguagem para estruturação de conteúdo – Surgiu em 2008 como uma evolução do HTML, trazendo a abordagem semântica – Em 2011, 34 dos 100 melhores sites utilizavam HTML 5 Tecnologias - Ontologias • Especificação e contextualização de um domínio • Termos e relacionamentos, propriedades, disjunção, operações lógicas • RDF Schema e OWL Tecnologias - Ontologias • RDF Schema – Conjunto de classes que visa prover elementos básicos para descrição de recursos estruturados em RDF – “Vocabulário” RDF – Possui relacionamentos e propriedades entre classes Tecnologias - Ontologias Tecnologias - Ontologias • OWL – Web Ontology Language – Surgiu com a necessidade de uma ontologia mais expressiva – Tornou-se a linguagem padrão de representãção de conhecimento na Web Semântica – Possui muitos dos elementos do RDF Schema Tecnologias - Ontologias Tecnologias - Agentes • Componentes que agem de maneira autônoma e proativa • Podem atuar em: – Metadados : extraindo e catalogando informação da Web – Ontologias: interpretando e classificando contextos – Inferência: deduzindo a partir de regras aplicadas ao conteúdo – Atividades diversas: comunicação entre agentes, manutenção de modelos de usuário Tecnologias - Outros • URI – Universal Resource Identifier – Representação única e padronizada de recursos, visando interoperabilidade • RIF – Rule Interchange Format – Formato padronizado para compartilhamento de regras entre os sistemas Arquitetura • Arquitetura em camadas para facilitar interoperabilidade entre as tecnologias e adesão de novos componentes Arquitetura • Trust + Crypto • Proof • Unifying Logic Arquitetura – Trust + Crypto • Verificar autenticidade das fontes = confiabilidade • Previne inconsistências • Garante a segurança, privacidade e integridade das informações = assinatura digital Arquitetura – Proof • Mecanismos de inferência sobre as regras • Verificar consistência tanto das regras quanto das conclusões obtidas Arquitetura – Unifying Logic • Trazer uma interface lógica única para as aplicações = união das tecnologias • Padronizar a especificação do conteúdo • Alguns detalhes ainda estão indefinidos Impacto para a RI • Área com maior expressividade no uso da Web Semântica até o momento. • Usar a inferência a partir de um contexto torna os resultados mais eficientes – Busca pelo contexto, e não pela sintaxe – Permite analisar outros tipos de conteúdo, criados por outras aplicações • Utilização da RI + Web Semântica na área de Saúde Algumas Aplicações • A Web Semântica ainda é um grande desafio • Aplicações utilizam apenas algumas das tecnologias • No entanto, estão conquistando mercado e obtendo lucro Algumas Aplicações Algumas Aplicações • Em 2006, a Spock levantou 7 milhões de dólares em capital de ventura • Em 2008, o faturamento da empresa foi de 10 milhões. • A empresa foi comprada pela Intelius, especializada em informações sociais, em 2009 Algumas Aplicações Algumas Aplicações Futuro da Web Semântica • Transição gradual entre a Web que conhecemos e a Semântica • Grandes marcas estarão envolvidas – Google adquire a empresa MetaWeb – Governo inglês investe 30 milhões de libras em pesquisa • Para participar do projeto: http://www.w3.org/participate/ – Fóruns – Eventos – Disponibilização de código Conclusão • Web Semântica tenta trazer “significado” ao conteúdo existente • A Web Semântica transformará a Web que conhecemos hoje numa Web de Dados, onde tudo poderá ser interligado • As tecnologias usadas tornarão os serviços Web mais eficientes Dúvidas