Recursos Informacionais II (noturno) CBD-0201 Prof. Dr. Ivan Siqueira 1. Buscadores; Bibliotecas Digitais; Open Archives; Wikipedia (08Abr) 2. Tecnologias e tendências de buscadores; Google PageRank (15Abr) Revisão Evolução dos buscadores Webcrawler, Altavista, Yahoo Google (1998) Modelos de buscadores, Open Archives Bibliotecas digitais Tecnologias e tendências de buscadores; Google PageRank Google PageRank “The PageRank citation Ranking: bringing order to the web”, 1998, p.1 “The PageRank Citation Ranking” p.4 PageRanking (algoritmo, score) 1. Indexação 2. Ranking 3. Associação de palavras-chave PageRanking (estrutura, SEO) 1. Análise heurística 2. Links 3. Quantidade de páginas 4. Posição dos links 5. Avaliação (1 a 10) 6. Escala de base 16 = 1; 2 (16x); 3 (256); 4 (4.096); 5 (65.536) 7. Atualização – 3 a 4 vezes por ano PageRanking (critérios de indexação) 1. title, head, meta tags, links 2. hash table, markov chains 3. pagerank (keywords, longevidade, sites linkados) Exemplo de ranking: http://bit.ly/129uf96 Tecnologias de busca Base Conceitual dos Sistemas de Recuperação de Informação – SRI: Lógica, estatística, teoria dos conjuntos 1. Modelo Booleano – operadores And, Or, Not Álgebra: A = 5, B = 2X5, C = B + 5, D = ? “Álgebra Booleana” – classe A {a, a1, a2, a3} e B {b, b1, b2} A + B significa “união das classes A e B” ou (A U B) A x B significa “interseção das classes A e B” ou (A ∩ B) 2. Full-Text – BIREME Documento – conjunto de todas as palavras: Interfaces Interfaces (...) Interfaces são meios... Documento A345 3. Modelo Vetorial (valor entre 0 e 1) t1 0,2 0,5 t2 4. Sistema Smart – System for the Manipulation and Retrieval of Text 4. Modelo Probabilístico – “contagem” 5. Modelo Fuzzy – “parcialidade”, “incerteza” 6. Modelos Especialistas – Redes Neurais Artificiais (algoritmo de aprendizagem) Gerações de web sites Mobiles Search & tendencias futuras o Contexto (serviços), localização (GPS) http://bit.ly/14o1fOr http://bit.ly/14o18SY http://bit.ly/134devS http://bit.ly/YVE1ej http://bit.ly/134fdAt REFERÊNCIAS Google. The PageRank Citation Ranking: Bringing Order to the Web. Jan, 29, 1998. Disponível em: http://ilpubs.stanford.edu:8090/422/. Acesso em: 02 abr. 2013. ROB, C. “Introduction to Google PageRank: Myths & Facts”. Disponível em: <http://tinyurl.com/6rtouc2>. Acesso em: 02 abr. 2013.