Sistemas Hipermídia Introdução Definições Introdução A evolução do ser humano deve-se a mudanças fundamentais: Linguagem (troca de idéias) Escrita (armazenamento e preservação das idéias) Imprensa (massificação das idéias) Rádio e TV (informações em uma só direção) Informática (informações nas duas direções) Breve história da hipermídia Hipermídia é a reunião de várias mídias num suporte computacional, suportado por sistemas eletrônicos de comunicação. A história dos sistemas hipermídia pode ser traçada das idéias de Vannevar Bush (1945), publicou “As we may think” que descreveu um sistema conceitual para a associação de informações. (http://www.ps.uni-sb.de/~duchier/pub/vbush/vbush-all.shtml) Sua idéia era de que o esforço científico deveria ser concentrado em deixar o conhecimento humano mais acessível. Breve história da hipermídia Durante os anos 60, Ted Nelson (1967) iniciou um projeto em larga escala chamado "Xanadu", e em 1974, inventou os termos hipertexto e hipermídia. Doug Engelbart (1968) também conhecido como o inventor do mouse, apresentou o primeiro Sistema Hipertexto Operacional. Breve história da hipermídia Durante os anos 80, surgiram alguns produtos comercializados como o "Guide" para PCs e o HyperCard da Apple. A década de 90 traz vários sistemas que trabalham em multi-plataformas, servindo vários grupos de usuários. Companhias como a MacroMedia e Gain Technology tem produzido pacotes de produtos em diferentes direções, com ênfase mais recente em tecnologias de vídeo. Multimídia Multimídia Apresentação da informação, de forma linear, em vários tipos de mídia (texto, som, imagens, animações e vídeo). Mídia sincronizada, por exemplo, imagens animadas com som. A multimídia nasceu junto com as interfaces gráficas, uma vez que reúne o uso do texto, som etc. Hipertexto Segundo Ted Nelson (1965) O termo hipertexto foi proposto para falar de uma organização não linear de informação. O hipertexto permite situar assuntos distindos interrelacionados em diferentes níveis de aprofundamento. Proporcionando a personalização do processo ensino-aprendizagem. Permite ao usuário trabalhar em seu próprio ritmo, nível e estilo, adequando às suas características e interesses. Hipermídia Base de dados textuais, visuais, gráficos e sonoros, onde cada ilha de informação é denominada de nó ou quadro. O computador estabelece as ligações entre esses nós, podendo ainda criar um movimento rápido nesta massa de informação. Interface ou um modo de apresentação visual permitindo a interação do usuário com o sistema. Modelo hipermídia de Lèvy Pierre Lèvy (1993): Idealizou a Rede hipertextual de significados para definir conhecimento como decorrência de uma imensa teia interligando significados e que possui como característica a não linearidade. Nesta teia, cada conceito forma um nó que se liga a outros por associação. Funcionalmente, um hipertexto é um tipo de programa para a organização de conhecimentos ou dados, a aquisição de informações e a comunicação. Projetos fundamentais “time line” Memex (1945) Augment/NLS (1962-1976) Xanadu (1965) Hypertext Editing System (1967) and FRESS (1968) Aspen Movie Map (1978) KMS (1983) Hyperties (1983) NoteCards (1985) Symbolics Document Examiner (1985) Intermedia (1985) Guide (1986) HyperCard (1987) Hypertext Grows Up Para pesquisa 1. http://www.usabilidoido.com.br/do_hipertexto_a_hipermidia.html Do hipertexto à hipermídia Bom exemplo de hipermídia: http://www.usabilidoido.com.br/hipermidia_nao_precisa_ser_cloaca.html Hipermídia nao precisa ser cloaca. 2. Libertando-se da prisão da internet Por Theodor Holm Nelson http://p.php.uol.com.br/tropico/html/textos/2674,1.shl 3. http://p.php.uol.com.br/tropico/html/textos/2471,1.shl Depois do hiper Por Cícero Inácio da Silva 4. http://pphp.uol.com.br/tropico/html/textos/2596,1.shl Primeiros passos de uma nova arte Por Cícero Inácio da Silva 5. http://pt.wikipedia.org/wiki/Hipermidia Hipermídia - Wikipedia Exercício 1 Trabalho a ser realizado em grupo de no máximo 3 alunos: Pesquisar na internet o texto original de Vannevar Bush e o de Ted Nelson e: Identificar os links Comentar os resumos dos dois artigos. Fazer o exercício no computador e salvar em arquivo de texto. Modelos Hipermídia Introdução Tipos de Redes Modelos Pincípios da rede hipertextual Dinamicidade ou metamorfose, a rede está em constante construção e renegociação. Ela pode permanecer estável durante um certo tempo, mas esta estabilidade é em si mesma fruto de um trabalho. Heterogeneidade, entre dois temas ou objetos podem ser estabelecidas diversas conexões pois, os nós e conexões de uma rede hipertextual são heterogêneos. Fractalidade, a complexidade das partes não é inferior à do todo. Qualquer nó ou conexão pode revelar-se como sendo composto por toda uma rede, e assim por diante indefinidamente. Princípios da rede hipertextual 1. Exterioridade – A rede não possui unidade orgânica, nem motor interno. Seu crescimento e sua diminuição, sua composição e sua recomposição permanente dependem de um exterior indeterminado: adição de novos elementos, conexões com outras redes, excitação de elementos terminais (captadores) etc. 2. Topologia, a rede constitui-se por proximidade de significações no hipertexto. A rede não está no espaço: ela é o próprio espaço. Um espaço de representações se multiplicam as conexões biológicas que entretecem o conhecimento. 3. Automação, a rede é formada por uma diversidade de nós podendo cada um deles se constituir como centro, sem o controle deliberado ou voluntário do ser humano. Rede semântica de Quilliam Rede composta por nós e por arcos. Os nós são os conceitos e os arcos as relações entre os conceitos. No modelo de Collins e Quillian temos um só tipo de arco, os que correspondem à relação “é uma espécie de...”. Em propostas de rede semântica posteriores, vários tipos de relações foram estabelecidos. Exercício 2 Realizar, na internet, uma pesquisa sobre redes semânticas e escrever um resumo de uma página contendo texto e figura exemplificando uma rede semântica típica. Rede de frames de Minsk Minsky estendeu a idéia relativa a um conceito em uma rede semântica para uma estrutura organizada de dados que contém buracos (slots) os quais aceitam apenas certos tipos de valores e que freqüentemente, podem ser preenchidos por valores “padrão”. Um FRAME é uma estrutura de dados. Uma espécie de rede com nós e relações (redes semânticas possuem nós e arcos “relações entre nós”). Os níveis superiores são fixos e representam coisas verdadeiras para uma situação. Os níveis mais baixos apresentam slots, que devem ser preenchidos com instâncias específicas de dados. Nas redes semânticas, as propriedades que o conceito têm em comum com outros conceitos são alocadas em um nó superior da rede. Exercício 3 Realizar, na internet, uma pesquisa sobre redes de frames e escrever um resumo de uma página contendo texto e figura exemplificando uma rede semântica típica. Rede de scripts de Abelson É uma seqüência pré determinada e estereotipada de ações que definem uma situação bem conhecida. Permitem novas referências a objetos neles contidos como se esses objetos tivessem sido previamente mencionados. Exercício 4 Realizar, na internet, uma pesquisa sobre redes de scripts e escrever um resumo de uma página contendo texto e figura exemplificando uma rede semântica típica Rede de esquemas Esquemas são dispositivos de reconhecimento cujo processamento está voltado para o cálculo da função de melhor representação aos dados que estão sendo processados. Têm variáveis (instanciadas por dados) (Slots). Podem conter e ser contidos por esquemas (procedimentos e funções pré definidos). Exercício 5 Realizar, na internet, uma pesquisa sobre redes de esquemas e escrever um resumo de uma página contendo texto e figura exemplificando uma rede semântica típica Rede hipertextual x outras A Rede hipertextual de significados proposta por Lèvy transcende os demais conceitos por ser tridimensional, ilimitada e dinâmica. As outras propostas possuem hierarquia de construção e nós limitados por regras de construção e representação do conteúdo. Na teia Hipertextual, um nó pode ser uma rede inteira de representações e significados. Exercício 6 Realizar, na internet, uma pesquisa sobre redes hipertextual e escrever um resumo de uma página contendo texto e figura exemplificando uma rede hipertextual. Rede hipertextual x banco de dados Um banco de dados possui uma estrutura de informação regular em que todos os dados a seguem e na qual podem ter milhares de registros, todos com os mesmos campos. A informação nos sistemas hipertexto/hipermídia não tem nenhuma definição centralizada e não possuem uma estrutura regular, na qual todos os nós possuem o mesmo perfil, por exemplo: Um banco de dados e uma estrutura de hipertexto que armazenam as informações dos alunos: Banco de dados, todos os registros seguem a mesma estrutura. Hipertexto, podemos ter milhares de nós, cada qual com a descrição de um funcionário, uns com mais informação e outros com menos. Uns podem ter elos para outros nós de outros funcionários, outros não. Trabalho 1 - 50 pts. Desenvolver, utilizando a ferramenta MS PowerPoint, um tutorial para ensinar um usuário a limpar um mouse. Esse tutorial deverá ter, pelo menos, 10 slides, com os seguintes conteúdos: Slide 1. Nome da Universidade, do Curso, título do trabalho e nomes dos integrantes do grupo. Slide 2. Índice das principais etapas do tutorial (assuntos) com links para cada uma delas. Slides 3 a 7. Desenvolvimento do tutorial em si, com figuras, fotos, filmagens (ou animações), sons e botões de navegação (próximo, anterior, início, fim, índice). Slides 8 e 9. Exercícios de testes de conhecimentos. Slide 10. Avaliação dos exercícios e conclusões. Hipermídia, arquiteturas A arquitetura dos sistemas hipermídia clássicos visa descrever uma dada estrutura da informação hipermídia e construir mecanismos de gestão e manipulação dessa informação. Existem dois modelos importantes: 1. Modelo de Campbell e Goodman (Hypertext Abstract Machine - HAM) 2. Modelo de referência de Dexter (Dexter Hypertext Reference Model) HAM - Introdução O modelo HAM, foi desenvolvido nos laboratórios da Tectronix a partir das especificações de outro sistema de hipertexto também desenvolvido pela mesma empresa, denominado Neptune (Delisle e Mayer) para aplicações em CAD. Este modelo armazena toda informação que gerencia em termos de grafos, ou bases de dados, em um sistema de arquivos hospedeiro. Os grafos são armazenados em uma área centralizada e podem ser acessados em um ambiente distribuido, sem perder sua funcionalidade. Apresenta interface interativa com o usuário em forma de janelas. HAM – Principais abstrações As abstrações fundamentais do modelo HAM baseiam-se em cinco objetos: 1. Grafo, objeto de nível superior e contém um ou mais contextos. É onde fica toda a informação referente a um assunto (por exemplo, sobre um projeto de software). 2. Contexto, dividem os dados dentro do grafo, cada contexto tem um contexto Pai e zero ou mais contextos Filhos. Um contexto Filho não depende da informação do contexto Pai. Um contexto contem zero ou mais nós e links. 3. Nó, contém dados arbitrários. A atualização de um nó gera uma nova versão do documento. 4. Ligação, liga o nó de origem ao nó de destino, sendo bidirecional e podendo ligar para dentro ou entre contextos. 5. Atributo, são pares atributo/valor associados a um nó, contexto ou ligação; podendo ser inteiros, strings, floats ou tipos definidos pelo usuário. HAM – Nível da apresentação Este nível contem os objetos de interface com o usuário (janelas, campos de texto etc.) que apresentam, ao mesmo, a informação da camada HAM e que permitem controlar as suas tarefas na utilização da aplicação, por exemplo, definindo em conjunto com a HAM, a forma como os links serão perceptíveis ao usuário (cores diferentes, mudança da forma do cursor etc.) HAM – Nível da máquina abstrata Nível onde estão especificadas as características dos nós e ligações e onde são mantidas as relações entre eles. Neste nível o software é independente do hardware, o que permite a transferência de hiperbases para outros tipos diferentes de sistemas hipertexto. Para tanto é necessário que a máquina abstrata seja padronizada. Um problema na transferência de hiperbases, resultará em perda de informação das ligações. HAM – Nível do banco de dados Especifica o armazenamento da informação em dispositivos locais (discos) ou remotos. Este nível depende do hardware. Gestão de acessos multi-usuário, baseados em procedimentos de segurança. O software deste nível deve ter um conhecimento rigoroso sobre os objetos de dados (nós e ligações) do nível superior, de forma a gerenciar eficientemente o espaço de armazenamento e o tempo de resposta. HAM – Controle de versões O modelo HAM fornece um mecanismo automático de controle do histórico de versões. O histórico da versão para um objeto no modelo HAM é atualizado no momento em que o objeto é modificado, permitindo a visualização das versões prévias do objeto. O modelo HAM também fornece a opção de destruir versões indesejadas. HAM - Filtros O mecanismo de filtros do modelo HAM permite que subconjuntos dos seus objetos sejam extraídos de grafos maiores. Também permitem ao usuário a especificação de versões. O modelo HAM filtra os seguintes itens: 1. Contextos em um grafo. 2. Nós em um contexto. 3. Links em um contexto. 4. Instâncias de um nó em um dado contexto. 5. Instâncias de um link em um contexto específico. 6. Um conjunto de nós e links em contextos baseados em uma determinada ordem de links. HAM – Segurança de dados A segurança dos dados no modelo HAM é realizada a partir de um mecanismo de Lista de Controle de Acessos (ACL) que contém informações sobre: 1.Usuários, qualquer um que tenha acesso ao grafo. 2.Grupos, lista de usuários. 3.Permissões que podem ser de três tipos: 1.Acesso, que permitem ao usuário ou grupo acessar as informações associadas ao grafo. 2.Anotação, que permitem ao link ser anexado ao nó. 3.Atualização, permite ao usuário ou grupo atualizações não destrutivas ao objeto. 4.Destruição, permite destruir o objeto. HAM - Operações Fornecem uma interface simples e consistente e são agrupadas em 7 categorias: 1. Criar, criam novos objetos e retornam seu índice e versão. 2. Excluir, eliminam as marcações das operações, guardardo seu histórico. 3. Destruir, destroem as marcações das operações e liberam o espaço utilizado pelo objeto. 4. Modificar, modificam os dados associados a um objeto. 5. Recuperar, recuperam dados de objetos existentes. 6. Filtrar, retorna uma lista de objetos que satisfazem uma determinada qualidade. 7. Especiais, todas as operações que não pertencem as categorias anteriores (pesquisas por strings, comparações de contextos e gerenciamento de transações) HAM – Modelagem, aplicações O modelo HAM, por ser um modelo de desenvolvimento hipermídia de propósito geral, foi utilizado na modelagem de vários tipos de sistemas hipermídia, os mais representativos são: Guide Buttons, desenvolvido pela empresa OWL International para o Apple Macintosh. Intermedia Webs, desenvolvido pela Universidade de Brown. NoteCard FileBoxes, desenvolvido pela Xerox PARC. Guide Buttons Ferramenta para escrita e leitura de documentos eletrônicos, Guide utiliza botões para representar links em documentos entre a informação na tela e a sua relacionada. Um botão é uma área especial na tela do computador. Quando o botão é selecionado, pelo clique do mouse, Guide segue o link para mostrar a informação referente. O Document Browser contém o documento que está sendo examinado. O Note Browser contem a nota associada com o botão com link Pai. O Button Atribute Browser mostra os atributos relacionados com o link representado pelo botão Pai. Exercício 7 Pesquisar na internet as ferramentas Intermedia Webs Note Cards que implementam a arquitetura HAM. Fazer um resumo de uma página de cada. Dexter - Arquitetura As subdivisões existentes no modelo de Dexter, representam interfaces entre os 3 níveis: 1. Nível de execução, descreve os mecanismos que suportam as interações do usuário com o sistema hipermídia. 2. Nível de armazenamento, descreve a hierarquia de nós e ligações que formam a base do sistema hipermídia. 3. Nível intermediário, descreve os conteúdos e as estruturas dentro dos nós (componentes) hipermídia e permite outros modelos de dados. Dexter - Interfaces Especificação da apresentação: são mecanismos pelos quais a informação sobre como um componente/circuito a ser apresentado para o usuário, pode ser codificado dentro do hipertexto na camada do nível de armazenamento. A figura abaixo mostra a importância do mecanismo de especificação da apresentação. Visto que existe um componente de animação capturado de um hipertexto de um TBC. O componente de animação pode ser acessado a partir de dois links. Quando o link padrão (student link) é seguido a animação é simplesmente apresentada. Por outro lado quando o link de edição (teacher's link) é seguido a apresentação é trazida em modo de edição, pronta para ser alterada. Dexter - Interfaces A interface de Ancoragem fornece um mecanismo de endereçamento dos itens dentro do conteúdo e serve, por exemplo, para suportar a expansão dos links não somente entre documentos, mas também de caracteres de um documento para caracteres de outro. A figura a seguir mostra um aspecto da colocação das várias camadas do modelo Dexter em um típico sistema de hipertexto. Nela, um hipertexto com 4 componentes, onde no nível de armazenamento existem 4 entidades: os 4 componentes incluindo o link. O conteúdo dos componentes (texto figuras) estão localizados a direita nível de armazenamento, no nível intermediário. No nível de apresentação os componentes gráficos são apresentados ao usuário. O link que sai desse componente é marcado com uma seta situada na base da janela de componentes na tela do computador. do e Dexter - Características Apresenta um modelo formal e genérico para descrição e comparação de sistemas hipermídia. Destinado a definir princípios para a comparação entre os vários sistemas existentes. Inclui um suporte ao desenvolvimento de normas para interligação e interoperabilidade entre sistemas hipermídia. Utiliza os conceitos de nós, âncoras e links http://aetos.it.teithe.gr/~cs1msa/docs/dexter_hypermedia_model.htm Exercicio 9 Realizar uma pesquisa na internet sobre o modelo Dexter para desenvolvimento de ambientes hipermídia. Exercício 10 Realizar um estudo comparativo entre as principais características dos modelos HAM e Dexter, mostrando especialmente vantagens e desvantagens. Projeto Hipermídia Recuperação da informação Modelagem do usuário Navegação Projeto hipermídia Os modelos de arquitetura hipermídia, visam formalizar os processos de projeto e produção que, em resumo, contemplam três elementos principais: 1. Estrutura, dizendo como estruturar a informação para otimizar seu acesso e navegação. 2. Apresentação, mostrando como apresentar e visualizar os conceitos a partir do uso dos multimeios didáticos. 3. Conteúdo, viabilizado por novas formas de autoria e edição do conteúdo multimídia. Recuperação da Informação-RI Segundo Gerald Salton Um sistema de Recuperação da Informação - RI é um sistema utilizado para armazenar itens de informação que precisam ser processados, pesquisados, recuperados e disseminados a várias populações de usuários. Salton, G. Introduction to modern information retrieval. McGrw-Hill. 1983. NY. Teoricamente não existem limitações, no tipo e estrutura, como os itens de informação são armazenados em um sistema de recuperação de informação. Entretanto na maioria dos casos a informação é armazenada na forma textual. O advento das bibliotecas digitais, utilizando vários tipos de mídias, vem mudando o foco tanto na forma de armazenamento quanto na recuperação da informação, propondo novas formas de armazenamento e RI. Hipermídia x RI A idéia de combinar hipertextos e sistemas de recuperação da informação é antiga, como foi visto no trabalho de Vannevar Bush “Memex”. A combinação mais elementar de hipertextos e RI é o “link”. Quando o usuário segue o link ele, implicitamente, executa uma query para um sistema RI e obtem uma representação gráfica do conjunto de resultados. Vários modelos de pesquisa textual e não textual tem sido desenvolvidos nos últimos anos de modo a facilitar a recuperação de informação, os mais promissores são: 1. Análise n-gram 2. Indexação semântica latente 3. Geometric hashing Análise n-gram Método de comparação de documentos baseado na similaridade estatística da ocorrencia de n-grams (combinações de letras de comprimento “n” ) no texto, por exemplo: Um documento sobre karatê terá mais ocorrencias dos trigamas kar, ara, rat e ate do que em documentos sobre outros assuntos. A similaridade entre dois documentos pode ser descoberta verificando a quantidade de suas combinações de n-grams. Indexação semântica latente Ou Latent Semantics Indexing – LSI, neste caso a recuperação da informação usa a decomposição do valor singular (singular decomposition value – sdv) para reduzir a dimensão do espaço de termos do documento. A LSI analiza estatisticamente os padrões de uso de palavras atravez de todo o documento, colocando juntos os documentos com padrões de uso de palavra semelhantes, permitindo que documentos semanticamente parecidos permaneçam juntos, mesmo que não compartilhem termos. Esta indexação pode usar uma matriz de termos que descrevem sua ocorrencia no documento. Geometric hashing É uma técnica para gerar combinações candidatas entre termos em um banco de dados utilizando um conjunto de medidas apropriadas. Esse modelo realiza o reconhecimento de um conjunto de pontos, cada um podendo ter uma lista de atributos para acomodar as características do termo. Funciona em dois estágios: 1.Modelagem do banco de dados, onde é riada uma tabela dos conjuntos de objetos (termos) 2.Reconhecmento, onde a tabela é usada para realizar a identificação do termo segundo um conjunto de medidas. Exercício 11 Pesquisar na internet os modelos de pesquisa textual: 1.Análise n-gram; 2.Indexação semântica latente; 3.Geometric hashing. Preparar uma apresentação com, no mínimo 10 slides sobre cada um desses modelos, citando exemplos. Modelagem Sistemas hipermída devem possuir capacidade de adaptar seu comportamento de modo a modelar diferentes categorias de usuários, visando incrementar o processo de recuperação da informação. Devem ser tratados os usuários ingênuos, novatos, usuários com alguma experiência uso de ferramentas de pesquisa e usuários experientes, com o objetivo de: 1. Eliminar diferenças linguisticas entre os usuários e o sistema. 2. Ajuda aos usuários na análise de sua necessidade de informação, formulação de estratégia de pesquisa apropriada e avaliação de resultados. 3. Fornecimento de informações prévias do espaço de busca de modo a facilitar a escolha de queries mais úteis. Classificação dos modelos Os modelos de usuários podem ser divididos em duas categorias: 1. Modelo empírico quantitativo, baseiam-se em um formalismo geral e abstrato das classes de usuários. Contem somente informação superficial sobre o usuário e não realiza nenhum tipo de raciocínio. A maioria dos sistemas de ajuda seguem essa abordagem. 2. Modelo analítico cognitivo, tentam simular o processo cognitivo dos usuários a partir das diversas interações com o sistema. Incorporam uma base de conhecimento que armazenam informações sobre os modelos de usuários. O modelo analitico cognitivo Segundo Elaine Rich: (Users are individuals: Individualizing user models. Internat. Journal on Man-Machine Studies 18,1983) Os usuários podem ser divididos em três dimensões: 1. Modelo canonico e individual, no modelo canonico existe somente um tipo de indivíduo, já no modelo individual esta apto a adaptar seu comportamento a um grupo heterogeneo de usuários. 2. Modelo explicito e implicito, um modelo explicito é construido manualmente pelo usuário, já um modelo implicito é construído pelo sistema a partir do acompanhamento da interação do usuário com o sistema. 3. Modelo longo-prazo e curto-prazo, o modelo de curto-prazo tem foco na criação do modelo do usuário durante uma seção, no modelo de longo-prazo esta modelagem é realizada após várias seções. Exemplo Uma aplicação de modelagem de usuário foi codificada no Unix Consultant – UC, um sistema de ajuda para o sistema operacional UNIX em linguagem natural, desenvolvido na Universidade da California – UC. Nesse sistema os usuários podem perguntar sobre termos, sobre como realizar tarefas em UNIX e obter ajuda em problemas com comandos de depuração. O modelo de usuário do UC foi denominado KNOME (Knowledge Model of Expertize) um exemplo típico: Usuário 1 Usuário 2 Hi. Hi. How I can help you? How I can help you? #How I can delete a file? #How I can find out the inode of a file? For example, to delete the file Use ls -i named foo, type `rm foo`. #What does ruptime do? #What does ruptime do? Ruptime is used to list the uptime of ruptime is like uptime, except ruptime is all machines on the network, list the for all machines in the network number of all users on them, and list their load average Modelagem no UC No exemplo ficou óbvio que o usuário 2 era mais experiente que o usuário 1. Para realizar a ajuda, o sistema de modelagem do usuário no UC, define oque o usuário sabe e então representa a informação internamente. No caso de outros sistemas, para definir o nível de conhecimento do usuário, o sistema interroga exaustivamente ao usuário num processo que consome muito tempo. No caso do KNOME, o sistema tenta prever o nível de conhecimento do usuário com base em seu comportamento quando o utiliza. No KNOME, os usuários são agrupados em quatro categorias: novato, iniciante, intermediário e expecialista. Estas categorias são denominadas estereótipos. Os usuários são então representados como um membro de um destes estereótipos, herdando as propriedades do mesmo. Modelagem do usuário A modelagem do usuário auxilia no processo de recuperação da informação. O objetivo é expressar as necessidades informacionais de modo que o sistema proporcione informação suficiente de todos os documentos relevantes para o usuário. Um exemplo de raciocínio para usuário intermediário: Hi. How can I help you? #How can I find the inode of a file? KNOME: Asserting “USER” known INODE1 KNOME: Since INODE1 is a INODE, asserting “USER” knows INODE KNOME: INODE has difficulty COMPLEX, so deducting KNOME: ruling out “USER” = NOVICE KNOME: ruling out “USER” = BEGINNER KNOME: “USER” is SOMEWHAT-UNLIKELY to be INTERMEDIATE => likelihood (“USER” = INTERMEDIATE) = SOMEWHAT-UNLIKELY Modelagem do usuário Tabela de dedução sobre o que o usuário sabe: Usuário Nível de dificuldade do fato Estereótipo simples Novato somewhat false unlikely Iniciante somewhat somewhat false likely unlikely mundano complexo esoterico false false -- Intermediário likely somewhat somewhat -likely unlikely Expecialista likely likely somewhat -likely Exercício 12 Desenvolver um protótipo de aplicativo para ajuda ao usuário que deseja programar em linguagem C. Este aplicativo deverá identificar dois tipos de usuários: Expertos Iniciantes de forma a trata-los conforme seu conhecimento identificado pelo aplicativo. Os 7 conceitos para navegação no cíberespaço Introdução Definições Introdução Um grande problema no projeto de aplicações hipermídia é saber: 1. Como os documentos devem ser estruturados? 2. Quais mecanismos de navegação devem ser disponibilizados aos usuários de modo que eles não se percam no hiperespaço? Podemos identificar sete conceitos necessários de ser considerados quando no projeto hipermídia: 1. Ligações, estruturam que ligam os documentos (links). 2. Busca, mecanismos para pesquisa de texto nos documentos (busca). 3. Sequencialização, mecanismos para colocar em sequencia as locações visitadas no hiperdocumento (caminho seguido). 4. Hierarquia, tabela hierárquica de todo o conteúdo (organograma das páginas). 5. Similaridade, conexões entre todos os nós mesmo os ainda não seguidos (índice) 6. Mapaeamento, visualização gráfica do conteúdo do hiperdocumento (mapas) 7. Agentes, mecanismo que executa tarefas complexas em nome do usuário (agente de compras) Ligações A estrutura de ligações (ou links) é a mais característica dos hipertextos. Os links permitem o acesso direto a uma localização no espaço da informação a partir de marcadores embutidos no documento. Os links podem ser diferenciados em: Estáticos, e de contexto específico Dinâmicos, e automáticamente gerados Ligações - classificação Os projetistas de sistemas hipermídia devem sempre definir a estrutura principal das ligações do documento. Visando limitar a sobrecarga cognitiva, é sempre importante utilizar somente um pequeno subconjunto de tipos de links. Os links podem ser classificados de acordo com os primeiros quatro conceitos de navegação no ciberespaço: 1. Links de página – sequencialização, que reconstroem a ordem original da sequencia dos nós e reflete a ordem primária sequencial de leitura do documento. 2. Links hierárquicos, refletem a ordem lógica das seções do documento, devido ao fato de que a maioria dos documentos são estruturados hierárquicamente, os links hierárquicos são considerados de navegação mais amigávei. 3. Links de similaridade, conectam nós com conteúdos similares mas que não estão conectados por links de página ou hierárquicos. São frequentemente computados automaticamente com base em termos similares. 4. Links de busca, são gerados automaticamente em resposta a uma query. Ligações - classificação Além dessas quatro categorias de links que refletem a estrutura do documento e oferecem meios de estruturar a informação,pode-se identificar um outro tipo de link que incorpora referencias cruzadas entre os nós: 5. Link de referência, são links que são embutidos no texto original e referem-se a outros nós ou passagens dentro do texto original, por exemplo: “veja a seção 7”, ou [Knuth97] Os links de referência são considerados um caso especial de links de similaridade. Um requisito básico quanto a links é: “Se em um dado momento com um único link pode-se conectar o usuário à informação desejada, deve-se usar o link” ao invés de outros objetos de interação, tal com índice, mapa etc. Ligações – estático x dinâmico Pode-se definir links estáticos e dinâmicos da seguinte forma: Link estático, o tipo mais comum de links disponível em sistemas hipermídia. São definidos pelo autor do hiperdocumento e são disponibilizados depois para o leitor (<a href...> em html). As conexões e localizações dos links são fixadas no documento pelo autor. Não existe um meio fácil de ajustar os links em um documento modificado. Link dinâmico, implementados somente em algusntipos de hiperdocumentos. Os documentos ligados dinâmicamente não possuem âncoras ou postos fixos. Este tipo de link é computado de acordo com a necessidade do usuário. Os links dinâmicos oferecem duas vantagens sobre os estáticos: 1. Proporcionam um meio mais flexível de navegação em um hiperdocumento pelo fato de serem gerardos durante a navegação de acordo com a variação da necesidade do usuário. 2. Documentos linkados dinâmicamente são mais fáceis de serem alterados visto que novos nós ou nós deletados são ligados ou desligados automáticamente de e para os nós existentes. Qualquer um que já tenha adicionado ou removido links de hiperdocumentos conhece a difuculdade em evitar links pendentes. Busca Um outro meio para novos links dinamicamente é em resposta a uma query de busca, desde que exista uma máquina de de busca no hiperdocumento. O tipo de busca mais comum em sistemas hipermídia é a busca por um texto completo, apesar de existirem sistemas de busca em banco de dados apropriados. Algumas ferramentas de autoria, tal como Hypercard e ToolBook, possuem seus próprios mecanismos de busca. Sistemas hipermídia abertos, tais como a WWW, por outro lado, oferecem provedores de informação e grande flexibilidade aos projetistas na implementação de seus próprios mecanismos de busca. Busca - WAIS Wide Area Information Server – WAIS, protocolo desenvolvido pela empresa Thinking Machines Corporation para utilizar o potencial dos supercomputadores paralelos, para acesso a informação, exploração e filtragem em grandes bases de dados. Com a chegada da WWW nos anos 90 e com a falencia da Thinking Machines em 1995 seu modelo primitivo de interface deu lugar às novas maquinas de inferencia baseadas na Web. WAIS baseia-se em uma arquitetura de recuperação da informação de texto completo nos quais servidores e clientes comunicam-se a partir do protocolo de comunicação ANSI Z39.50 para pesquisar bases de dados em computadores remotos. Os computadores clientes realizam queries diretamente as bases de dados WAIS a partir do uso do protocolo Z39.50. As bases de dados mantém índices de todos os documentos armazenados e, então, “casam” o conteúdo da query com com o do índice, resultando numa lista de todos os documentos que possuem alguma das palavras-chave da query original. Os clientes mostram, em ordem numérica, os títulos dos documentos encontrados. Busca – Web http://en.wikipedia.org/wiki/Search_engine#Yahoo_Search O primeiro mecanismo de busca na internet foi o “Wandex”, um tipo de indexador (web crawler) desenvolvido em perl que já não existe mais, desenvolvido por Matthey Gray no MIT em 1993. Nesta mesma época apareceu o “Aliweb” outra ferramenta de busca e que ainda existe (http://www.aliweb.com). A primeira ferramenta de texto completo (full-text) foi o WebCrawler que começou em 1994, ao contrário de seus predecessores, pemitia a seus usuários a pesquisa de qualquer palavra em qualquer página, o que tornou-se padrão para todos os grandes sites de busca seguintes. Também foi o primeiro a ser largamente conhecido pelo público. Também começou em 1994 o Lycos (criado na Carnegie Mellon University) e tornou-se um grande empreendimento comercial. Logo depois apareceram Excite, Infossek, Inktomi, Norther Light e Altavista que competiram com diretórios mais populares como o Yahoo, mais tarde estes diretórios foram integrados de modo a aumentar sua funcionalidade. Em 2001 o Google tornou-se proeminente devido ao seu mecanismo de busca com conceito de popularidade do link e de rank de páginas (atribui pesos de relevancia aos links das páginas) Busca – web crawler Também conhecido como web spider ou ant, é um programa que realiza uma navegação sistemática na WWW. Web crawler foram primeiramente utilizados criar uma copia de todas as páginas relevantes visitadas para processamento posterior por uma máquina de busca, que posteriormente indexará estas páginas visitadas para fazer buscas mais rápidas. Um web crawler é um tipo de “bot” (agente de software). Em geral inicia com uma lista de URLs a visitar e a medida em que as visita, identifica os hiperlinks das páginas e os adiciona a uma lista de URLs a visitar, navegando a Web recursivamente de acordo com o seguinte conjunto de políticas: 1. Seleção, que seleciona quais páginas serão baixadas. 2. Re-visita, que define quando checar mudanças nas páginas. 3. Polidez, que define como evitar sobrecarga de web sites. 4. Paralelismo, quedefine como coordenar os web crawlers. Exercício 13 Preparar uma apresentação, no máximo 10 slides, sobre o algoritmo de busca utilizado por um dos serviços: Google Yahoo Cade Lycos Altavista etc. Sequencialização Muito útil, especialmente para usuários novatos ou sem experiência, a redução da complexidade n-dimensional dos links de um hiperdocumento para uma só dimensão facilita a assimilação do documento. Visitas Guiadas (guided tours) ou Caminhos (paths) oferecem um mecanismo simples e rápido para a visão geral do documento hipermídia. Essas ferramentas ocultam a complexidade do hiperdocumento apresentando ao usuário um caminho sequencial, como mostrado na figura ao lado. Segundo Vannevar Bush (o inventor da idéia do hiperdocumento) compara uma visita guiada a uma pista e a descreve como uma sequencia de “links atraves do Memex”. Hierarquia A estrutura hierárquica do documento é muito bem entendida pelos sêres humanos. A maioria dos livros impressos é estruturada hierárquicamente. Vários autores costumam empregar a estrutura hierárquica em novos hiperdocumentos, entretanto tambémexistem ferramentas como Superbook, que fornecem um mapa hierárquico de um documento. A estrutura hierárquica da informação é muito útil para o entendimento do assunto para os usuários e funciona como a principal ajuda na navegação. Similaridade O índice é a melhor forma de descobrir similaridades entre diferentes nós pois as páginas que possuem links em comum normalmente exibem alguma forma de similaridade. Algumas ferramentas mais complexas são baseadas na premissa de que o sistema possui conhecimento não somente sobre a estrutura do documento, mas também sobre o conteúdo de sua informação. Existem duas abordagens nesse caso: Sistemas baseados em recuperação da informação, computam similaridades baseadas em abordagens estatísticas. Sistemas baseados no conhecimento, procuram utilizar um conhecimento mais profundo da semântica do documento. Mapeamento Mapeamento é uma tecnologia para estruturar, visualizar, e gerenciar Webs de informação. São similares aos mapas reais, mapas gráficos mostram aos leitores onde eles estão e onde eles podem chegar a partir daqui e fornecem ao usuário uma visão geral sobre onde ele está e do contexto geral. O mapeamento é uma forma flexível, versátil e amigável para anavagação no ciberespaço. Mapeamento engloba os conceitos anteriores e podem ser usados para visualizar links, resultados de busca, caminhos sequenciais, hierarquias e similaridades. A figura ao lado apresenta uma forma de mapeamento utilizando a notação de árvore, apesar de ser o modo de mapeamento mais utilizado, sua compreensão diminui a medida em que o numero de nós aumenta. Agentes O conceito de guias e agentes são populares para a navegação em muitas outras áreas. A metáfora do agente é bem fácil de entender, pois os agentes simulam assistentes humanos ajudando-os em tarefas complexas de orientação. Sistemas nessa categoria incorporam técnicas baseadas em Inteligência Artificial. Os agentes são implementados de diversos modos variando de guias simples até agentes baseados em regras de produção em que possuem a habilidade de reagir com mais flexibilidade de acordo com as diferentes necessidades dos diferentes usuários. Agentes podem utilizar quaisquer dos outros seis conceitos para auxiliar os usuários na tarefa de navegação. Exercício 14 Escolher um dos seguintes temas e desenvolver uma apresentação, com teoria e exercícios: 1. HTML 2. JavaScript 3. XHTML 4. CSS 5. DHTML 6. XML 7. WML 8. Ajax 9. ASP 10.PHP