UNICODE e URI
Como fazer ?
Escrever termos,
Usar termos em frases,
Fazer afirmações usando os termos,
Montar classificações dos termos,
Criar regras de geração de novas
afirmações,
provar a veracidade de novas afirmações,
Saber quem afirmou, classificou,fez
regras e provou
ter confiança nas afirmações.
Escrever termos,
usar termos em frases,
Fazer afirmações usando os termos,
Montar classificações dos termos,
Criar regras de geração de novas
afirmações,
provar a veracidade de novas
afirmações,
Saber quem afirmou, classificou,fez
regras e provou
ter confiança nas afirmações
Escrever
Termos
Escrever
Como escrever na web Semântica?
Usando linguagem escrita
Que línguas? Todas.
Inglês: I'm an engineer.
Português: Eu gosto de samba canção
Espanhol: El coche esta lleno de agua.
Russo: Росси́йская Федера́ция
(Federação russa)
Chines: 中國 (China)
‫صفح ٔه اصلی‬
Koreano(?):中华人民共和国
Vienamita(?): Trono Quốc
‫הרפובליקה העממית של סין‬
中华人民共和国
Problemas
Como representar cada caractere no
computador que basicamente só
armazena e processa números?
R: Atribuindo um número a cada
caractere.
Qual o número que representa o
caractere “M” ou “民”?
R:Depende da existência de um
padrão
Unicode
O padrão Unicode fornece um número
único para todo caractere não
importando a plataforma, a língua ou o
programa.
Antes de ser criado o Unicode
existiam centenas de sistemas de
codificação para os caracteres.
O padrão foi adotado por empresas
como: Apple, HP, IBM, JustSystem,
Microsoft, Oracle, SAP, Sun, Sybase,
etc. (http://www.unicode.org).
O Padrão Unicode, Versão 5.0 fornece
codigos para 99.089 caracteres do
alfabetos mundiais, dos conjuntos de
ideogramas e as coleções de símbolos
O que é unicode?
Arábico
‫ما هي الشفرة الموحدة "يونِكود" ؟‬
Hindu:
यूनिकोड क्या है ?
Japonês:
ユニコードとは何か?
Escrever termos,
usar termos em frases,
Fazer afirmações usando os termos,
Montar classificações dos termos,
Criar regras de geração de novas
afirmações,
provar a veracidade de novas
afirmações,
Saber quem afirmou, classificou,fez
regras e provou
ter confiança nas afirmações
Escrever
Termos
Termos
Termos representam as “coisas” sobre
as quais vamos escrever na web
semântica
Termos representam também o que
vamos escrever sobre essas “coisas”
Os termos são chamados de RECURSOS
no contexto da web.
Os termos ou RECURSOS precisam ter
uma forma de serem IDENTIFICADOS
URI - Uniform Resource
Identifier
Identificadores de recursos uniformes
ou Uniforms Resource Identifiers (URI)
fornecem um meio simples e extensível
de IDENTIFICAR RECURSOS.
Uma URI é um identificador
consistindo numa seqüência de
caracteres que seguem uma rega de
sintaxe .
Recurso
A especificação de URI não define ou
limita o que é um recurso
Qualquer coisa identificável por uma
URI pode ser um recurso
Pode-se atribuir uma URI a qualquer
coisa
Qualquer coisa que tem uma URI
“esta na web”.
Exemplo de recursos
Documento eletrônico
Uma imagem
Uma fonte de informação
Um serviço
Uma coleção de recursos
Exemplo de recursos
O prof. Fernando Gauthier
O presidente Lula
A UFSC
O avião do Lula
O cachorro Rex
Exemplo de recursos
A Teoria da Relatividade
O Mito da Caverna de Platão
A Entropia da Informação
A UML
A intersecção de dois conjuntos
difusos
Exemplo de recursos
A Amizade
O Namoro
O sexo tântrico
A raiz quadrada de (-1)
Identificador
Engloba a informação necessária para
distinguir o que esta sendo
identificado de todas as outra coisas
no contexto da identificação.
Identificar se refere ao propósito de
distinguir um recurso dos demais não
importando como isso é conseguido
(pelo nome, pelo endereço, pelo
contexto)
Para efeitos de exemplos vamos
considerar uma URI qualquer
seqüência de caracteres latinos
The generic URI syntax consists of a
hierarchical sequence of components
referred to as the scheme, authority,
path, query, and fragment.
URI = scheme ":" hier-part [ "?" query ] [
"#" fragment ]
hier-part = "//" authority path-abempty
/ path-absolute
/ path-rootless
/ path-empty
Exemplos de URI
ftp://ftp.is.co.za/rfc/rfc1808.txt
http://www.ietf.org/rfc/rfc2396.txt
ldap://[2001:db8::7]/c=GB?objectClass?one
mailto:[email protected]
news:comp.infosystems.www.servers.unix
tel:+1-816-555-1212
telnet://192.0.2.16:80/
urn:oasis:names:specification:docbook:dtd:xml:4.
1.2
Sobre identificador
Não se deve assumir que o
identificador define ou engloba a
identidade do que é referenciado
Ex: “A mensagem de fax número 25”
não foi completada satisfatoriamente.
Sobre identificador
Tampouco deve ser assumido que um
sistema usando URI vai acessar o
recurso identificado.
Ex:O professor Gauthier tem “conta
corrente no BB número 123456-7”
Sobre identificador
O recurso identificado pode não ser
de natureza única
Ex: “O responsável pela torre de
controle” deve autorizar a decolagem.
(vária no decorrer do dia)
Ex: “O relator do processo” deve
apresentar seu parecer antes de iniciar a
discussão do item de pauta. (existe um
conjunto limitado de relatores)
Uniforme
(AURELIO)
1.Que só tem uma forma.
2.Que não varia.
3.Semelhante, análogo, idêntico.
Fato de ser uniforme significa que não
varia ou que só tem uma forma de
identificar recursos
Uniformidade permite:
Diferentes tipos de identificadores
de recursos serem utilizados no
mesmo contexto, ainda que a forma de
acessar os recursos seja diferentes
ftp://ftp.is.co.za/rfc/rfc1808.txt
http://www.ietf.org/rfc/rfc2396.txt
Forma análoga de interpretar
semanticamente a convenção sintática
comum dos diferentes tipos de
identificadores de recursos
ftp://ftp.is.co.za/rfc/rfc1808.txt
Protocolo ftp
http://www.ietf.org/rfc/rfc2396.txt
Protocolo http
Uniformidade permite:
Introduzir novos tipos de
identificadores de recursos sem
interferir na forma em que os
identificadores existentes são usados
ftp://ftp.is.co.za/rfc/rfc1808.txt
gauthier://www.ietf.org/rfc/rfc2396.txt
Reusar os identificadores em muitos
contextos diferentes e, assim, que
novas aplicações controlem ou reusem
os identificadores pré-existentes
URL
Um tipo de URI muito comum é a URL
(Uniform Resource Locator ) ou
Localizador de Recurso Uniforme
Este tipo de URI não só identifica
mas localiza o recurso permitindo que
o computador o encontre
http://www.inf.ufsc.br/~gauthier).
Outro tipo de URIs, porem, somente
identificam o recurso,
exemplo: “mid:”
identifica uma mensagem eletrônica
não é possível localiza-la a partir deste
identificador.
URIs são descentralizadas
Ninguém controla sua criação a forma em
que são usadas enquanto alguns esquema de
URIs dependem de controle centralizado e
outros são completamente
descentralizados.
Não é necessária permissão de alguém para
criar uma URI podendo-se inclusive criar
URIs para itens dos quais não se é
proprietário.
Uma prática comum para criar URIs é
começar com descrevendo o objeto a ser
identificado numa página web e utilizar a
URL como identificação do objeto.
http://www.inf.ufsc.br/~gauthier/PlanodeNegocios/
identifica a disciplina Plano de Negócios ministrada pelo
Prof. Gauthier.
A Internet Engineering Task Force
(http://www.ietf.org) controla a sintaxe
das URIs
Download

UNICODE e URI