Recursos Informacionais II (noturno)
CBD-0201
Prof. Dr. Ivan Siqueira
1. Buscadores; Bibliotecas Digitais; Open Archives; Wikipedia (08Abr)
2. Tecnologias e tendências de buscadores; Google PageRank (15Abr)
Revisão
Evolução dos buscadores
Webcrawler, Altavista, Yahoo
Google (1998)
Modelos de buscadores, Open Archives
Bibliotecas digitais
Tecnologias e tendências de buscadores; Google PageRank
Google PageRank
“The PageRank citation Ranking: bringing order to the web”, 1998, p.1
“The PageRank Citation Ranking” p.4
PageRanking (algoritmo, score)
1. Indexação
2. Ranking
3. Associação de palavras-chave
PageRanking (estrutura, SEO)
1. Análise heurística
2. Links
3. Quantidade de páginas
4. Posição dos links
5. Avaliação (1 a 10)
6. Escala de base 16 = 1; 2 (16x); 3 (256); 4 (4.096); 5 (65.536)
7. Atualização – 3 a 4 vezes por ano
PageRanking (critérios de indexação)
1. title, head, meta tags, links
2. hash table, markov chains
3. pagerank (keywords, longevidade, sites linkados)
Exemplo de ranking: http://bit.ly/129uf96
Tecnologias de busca
Base Conceitual dos Sistemas de Recuperação de Informação – SRI:
Lógica, estatística, teoria dos conjuntos
1. Modelo Booleano – operadores And, Or, Not
Álgebra: A = 5, B = 2X5, C = B + 5, D = ?
“Álgebra Booleana” – classe A {a, a1, a2, a3} e B {b, b1, b2}
A + B significa “união das classes A e B” ou (A U B)
A x B significa “interseção das classes A e B” ou (A ∩ B)
2. Full-Text – BIREME
Documento – conjunto de todas as palavras:
Interfaces
Interfaces (...)
Interfaces
são meios...
Documento
A345
3. Modelo Vetorial (valor entre 0 e 1)
t1
0,2
0,5
t2
4. Sistema Smart – System for the Manipulation and Retrieval of Text
4. Modelo Probabilístico – “contagem”
5. Modelo Fuzzy – “parcialidade”, “incerteza”
6. Modelos Especialistas – Redes Neurais Artificiais
(algoritmo de aprendizagem)
Gerações de web sites
Mobiles Search & tendencias futuras
o Contexto (serviços), localização (GPS)





http://bit.ly/14o1fOr
http://bit.ly/14o18SY
http://bit.ly/134devS
http://bit.ly/YVE1ej
http://bit.ly/134fdAt
REFERÊNCIAS
Google. The PageRank Citation Ranking: Bringing Order to the Web. Jan, 29,
1998. Disponível em: http://ilpubs.stanford.edu:8090/422/. Acesso em: 02 abr. 2013.
ROB, C. “Introduction to Google PageRank: Myths & Facts”. Disponível em:
<http://tinyurl.com/6rtouc2>. Acesso em: 02 abr. 2013.
Download

Recursos Informacionais II (noturno) CBD-0201