UNICODE e URI Como fazer ? Escrever termos, Usar termos em frases, Fazer afirmações usando os termos, Montar classificações dos termos, Criar regras de geração de novas afirmações, provar a veracidade de novas afirmações, Saber quem afirmou, classificou,fez regras e provou ter confiança nas afirmações. Escrever termos, usar termos em frases, Fazer afirmações usando os termos, Montar classificações dos termos, Criar regras de geração de novas afirmações, provar a veracidade de novas afirmações, Saber quem afirmou, classificou,fez regras e provou ter confiança nas afirmações Escrever Termos Escrever Como escrever na web Semântica? Usando linguagem escrita Que línguas? Todas. Inglês: I'm an engineer. Português: Eu gosto de samba canção Espanhol: El coche esta lleno de agua. Russo: Росси́йская Федера́ция (Federação russa) Chines: 中國 (China) صفح ٔه اصلی Koreano(?):中华人民共和国 Vienamita(?): Trono Quốc הרפובליקה העממית של סין 中华人民共和国 Problemas Como representar cada caractere no computador que basicamente só armazena e processa números? R: Atribuindo um número a cada caractere. Qual o número que representa o caractere “M” ou “民”? R:Depende da existência de um padrão Unicode O padrão Unicode fornece um número único para todo caractere não importando a plataforma, a língua ou o programa. Antes de ser criado o Unicode existiam centenas de sistemas de codificação para os caracteres. O padrão foi adotado por empresas como: Apple, HP, IBM, JustSystem, Microsoft, Oracle, SAP, Sun, Sybase, etc. (http://www.unicode.org). O Padrão Unicode, Versão 5.0 fornece codigos para 99.089 caracteres do alfabetos mundiais, dos conjuntos de ideogramas e as coleções de símbolos O que é unicode? Arábico ما هي الشفرة الموحدة "يونِكود" ؟ Hindu: यूनिकोड क्या है ? Japonês: ユニコードとは何か? Escrever termos, usar termos em frases, Fazer afirmações usando os termos, Montar classificações dos termos, Criar regras de geração de novas afirmações, provar a veracidade de novas afirmações, Saber quem afirmou, classificou,fez regras e provou ter confiança nas afirmações Escrever Termos Termos Termos representam as “coisas” sobre as quais vamos escrever na web semântica Termos representam também o que vamos escrever sobre essas “coisas” Os termos são chamados de RECURSOS no contexto da web. Os termos ou RECURSOS precisam ter uma forma de serem IDENTIFICADOS URI - Uniform Resource Identifier Identificadores de recursos uniformes ou Uniforms Resource Identifiers (URI) fornecem um meio simples e extensível de IDENTIFICAR RECURSOS. Uma URI é um identificador consistindo numa seqüência de caracteres que seguem uma rega de sintaxe . Recurso A especificação de URI não define ou limita o que é um recurso Qualquer coisa identificável por uma URI pode ser um recurso Pode-se atribuir uma URI a qualquer coisa Qualquer coisa que tem uma URI “esta na web”. Exemplo de recursos Documento eletrônico Uma imagem Uma fonte de informação Um serviço Uma coleção de recursos Exemplo de recursos O prof. Fernando Gauthier O presidente Lula A UFSC O avião do Lula O cachorro Rex Exemplo de recursos A Teoria da Relatividade O Mito da Caverna de Platão A Entropia da Informação A UML A intersecção de dois conjuntos difusos Exemplo de recursos A Amizade O Namoro O sexo tântrico A raiz quadrada de (-1) Identificador Engloba a informação necessária para distinguir o que esta sendo identificado de todas as outra coisas no contexto da identificação. Identificar se refere ao propósito de distinguir um recurso dos demais não importando como isso é conseguido (pelo nome, pelo endereço, pelo contexto) Para efeitos de exemplos vamos considerar uma URI qualquer seqüência de caracteres latinos The generic URI syntax consists of a hierarchical sequence of components referred to as the scheme, authority, path, query, and fragment. URI = scheme ":" hier-part [ "?" query ] [ "#" fragment ] hier-part = "//" authority path-abempty / path-absolute / path-rootless / path-empty Exemplos de URI ftp://ftp.is.co.za/rfc/rfc1808.txt http://www.ietf.org/rfc/rfc2396.txt ldap://[2001:db8::7]/c=GB?objectClass?one mailto:[email protected] news:comp.infosystems.www.servers.unix tel:+1-816-555-1212 telnet://192.0.2.16:80/ urn:oasis:names:specification:docbook:dtd:xml:4. 1.2 Sobre identificador Não se deve assumir que o identificador define ou engloba a identidade do que é referenciado Ex: “A mensagem de fax número 25” não foi completada satisfatoriamente. Sobre identificador Tampouco deve ser assumido que um sistema usando URI vai acessar o recurso identificado. Ex:O professor Gauthier tem “conta corrente no BB número 123456-7” Sobre identificador O recurso identificado pode não ser de natureza única Ex: “O responsável pela torre de controle” deve autorizar a decolagem. (vária no decorrer do dia) Ex: “O relator do processo” deve apresentar seu parecer antes de iniciar a discussão do item de pauta. (existe um conjunto limitado de relatores) Uniforme (AURELIO) 1.Que só tem uma forma. 2.Que não varia. 3.Semelhante, análogo, idêntico. Fato de ser uniforme significa que não varia ou que só tem uma forma de identificar recursos Uniformidade permite: Diferentes tipos de identificadores de recursos serem utilizados no mesmo contexto, ainda que a forma de acessar os recursos seja diferentes ftp://ftp.is.co.za/rfc/rfc1808.txt http://www.ietf.org/rfc/rfc2396.txt Forma análoga de interpretar semanticamente a convenção sintática comum dos diferentes tipos de identificadores de recursos ftp://ftp.is.co.za/rfc/rfc1808.txt Protocolo ftp http://www.ietf.org/rfc/rfc2396.txt Protocolo http Uniformidade permite: Introduzir novos tipos de identificadores de recursos sem interferir na forma em que os identificadores existentes são usados ftp://ftp.is.co.za/rfc/rfc1808.txt gauthier://www.ietf.org/rfc/rfc2396.txt Reusar os identificadores em muitos contextos diferentes e, assim, que novas aplicações controlem ou reusem os identificadores pré-existentes URL Um tipo de URI muito comum é a URL (Uniform Resource Locator ) ou Localizador de Recurso Uniforme Este tipo de URI não só identifica mas localiza o recurso permitindo que o computador o encontre http://www.inf.ufsc.br/~gauthier). Outro tipo de URIs, porem, somente identificam o recurso, exemplo: “mid:” identifica uma mensagem eletrônica não é possível localiza-la a partir deste identificador. URIs são descentralizadas Ninguém controla sua criação a forma em que são usadas enquanto alguns esquema de URIs dependem de controle centralizado e outros são completamente descentralizados. Não é necessária permissão de alguém para criar uma URI podendo-se inclusive criar URIs para itens dos quais não se é proprietário. Uma prática comum para criar URIs é começar com descrevendo o objeto a ser identificado numa página web e utilizar a URL como identificação do objeto. http://www.inf.ufsc.br/~gauthier/PlanodeNegocios/ identifica a disciplina Plano de Negócios ministrada pelo Prof. Gauthier. A Internet Engineering Task Force (http://www.ietf.org) controla a sintaxe das URIs