Apresentação de Yuri de Lugt
sobre a Collexis
(tradução Arthur Treuherz - FIR/AFI/BIREME)
Estrutura da apresentação
•Definições de gestão do conhecimento
•Formas de conhecimento
•Infra-estrutura do conhecimento
•Antecedentes sobre a Collexis
•Exemplos de aplicação da Collexis
•Demonstrações (opcional)
Definições de Gestão do Conhecimento
Definições da Collexis para GC
• Dados
“Dados estruturados”
(dados, grupo armazenado de combinação de caracteres e símbolos que fazem
sentido)
• Informação
“Dados com valor AGREGADO para um receptor”
• Conhecimento
“Informação combinada e experiência na mente das pessoas”
“Saber como agir para recuperar valor agregado ideal”
• Competência
“Combinação de Conhecimento, habilidades e comportamento que leva a
uma contribuição essencial para alcançar os objetivos do negócio”
Definições da Collexis para GC
• Gestão do conhecimento
“Criação de um ambiente no qual o conhecimento irá recuperar valor
agregado máximo”
“Ações e Regras baseadas numa estratégia consistente as quais permitem
a uma organização e a seus empregados usar o conhecimento disponível
como um fator de produção estratégico para desempenho ideal”
Formas de Conhecimento
Para realizar a ‘Gestão do Conhecimento’ tem-se que
saber quais formas de conhecimento existem.
Definições da Collexis para GC
• Conhecimento explícito
– Conhecimento Armazenado, Transferível.
– Manuais, Sistemas de Informação, Procedimentos, etc.
– Informação
• Conhecimento Tácito (implícito)
– Na cabeça das pessoas
– Melhorado pela experiência
– Não armazenado, difícil de armazenar
Transformação do conhecimento
Para
Tácito
De
Tácito
Social
Externo
•Copia vendo
•Relatório
•Imita
•Visualiza
•Mestre-aluno
•Modelagem
Interno
Explícito
Explícito
•Aprende fazendo
Combina
•Funde
•Recombina &
sistemiza
Definições da Collexis para GC
Portanto:
•
Conhecimento não é gerenciável
•
Somente as circunstâncias nas quais o conhecimento pode melhor ser
explorado é que são gerenciáveis
•
Somente o conhecimento explícito pode ser armazenado
•
Conhecimento implícito pode tornar-se acessível
► A Collexis facilita as circunstâncias ideais para explorar e desenvolver
conhecimento.
A infra-estrutura do Conhecimento
Para descobrir onde a Collexis pode ser usado,
precisamos explorar a infra-estrutura do Conhecimento
A infra-estrutura do Conhecimento
Estrutura
TI
& processos
Fluxo do conhecimento
•Desenvolver
•Compartilhar
•Usar
•Avaliar
Cultura
Gestão
3 Grupos de Instrumentos
Estratégia
Processo e
Estrutura da
Gestão
Empregado
Tecnologia da Informação
© Human Connection 2000
Collexis & Gestão do conhecimento
• A Collexis facilita:
A recuperação da informação (portais, busca e recuperação)
A fusão de informação para apoiar processos de Conhecimento
(categorização dinâmica, mapas de calor (heat maps), gráficos de
conteúdo, etc.)
O acesso ao conhecimento ao identificar especialistas (buscador de
especialista)
A análise da informação para recuperar conhecimento (teia semântica)
Garimpo de informação (teia semântica, mapas de calor (heat maps),
gráficos de conteúdo)
►Como ?
Abordagem da Collexis
Funções da Collexis
Casos do Negócio
Ferramentas
Recursos de Conteúdo
Dúvida: casos do negócio ou
Particularidades do negócio (empresa)?
Abordagem da Collexis
Casos do Negócio
Funções da Collexis
Web
Documentos Bases de dados
content
XML
Ferramentas
Abordagem da Collexis
Mapas
de Conceitos
Agregação
Detecção de
homônimos
Determinação da
Impressão Digital
Dados
estruturados
XML
Web
Documentos Bases de dados
Casos do Negócio
Ferramentas
conteúdo
Gráficos
Associativos
de Conceitos
Abordagem da Collexis
Mapas
de Conceitos
Análise de Gaps
Análise de
Competidores
Redes
Semânticas
Agregação
Detecção de
homônimos
Busca
Especializada
Quem é Quem
Impressão Digital
Dados
estruturados
Portais
Dinâmicos
Busca no
Vocabulário,
Busca textual
XML
Web
Documentos Bases de dados
conteúdo
Gráficos
Associativos
de Conceitos
correspondência / busca de informação
Aplicações
Garimpo de informação
Abordagem da Collexis
níveis de gestão de informação
nível 1:
Mapas
de Conceitos
Análise de Gaps
Análise de
Competidores
Redes
Semânticas
Agregação
Detecção de
homônimos
Busca
Especializada
Quem é Quem
Impressão Digital
Dados
estruturados
Portais
Dinâmicos
Busca no
Vocabulário,
Busca textual
XML
Web
Documentos Bases de dados
Correspondência / busca de informação
Aplicações
nível 2:
Gráficos
Associativos
de Conceitos
conteúdo
nível 3:
Garimpo de informação
Abordagem da Collexis
níveis de gestão de informação
nível 2: uso de links explícitos,
hierarquia de tesauros,
informação contextual
Gráficos
Associativos
de Conceitos
Mapas
de Conceitos
Análise de Gaps*
Análise de
Competidores
Redes
Semânticas
Agregação
Detecção
de homônimos
Busca
Especializada
Quem é Quem
Dados
estruturados
Portais
Dinâmicos
Busca no
Vocabulário,
Busca textual
nível 1: uso de normalização,
independência de idioma,
sinônimos, correspondência, Impressão Digital
tesauro / vocabulário
Correspondência / busca de informação
Web
Documentos Bases de dados
conteúdo
XML
*A expressão gap também existe no Houaiss e está definida como (1) quebra de continuidade ou (2)
atraso relativo, descompasso ou disparidade entre duas coisas (exemplo: gap tecnológico)
Aplicações
Garimpo de informação
nível 3: uso de co-ocorrência,
agrupamento de conceitos,
ontologias
Que vamos mostrar?
níveis de gestão de informação
Mapas
de Conceitos
Análise de gaps
Análise de
competidores
Redes
semânticas
Agregação
Detecção de
homônimos
Busca
especializada
Quem é quem
Dados
estruturados
Portais dinâmicos
Busca no
vocabulário,
Busca textual
nível 1: uso de normalização,
independência de idioma,
sinônimos, correspondência, Impressão Digital
tesauro / vocabulário
Correspondência / busca de informação
XML
Web
Documentos
bases de dados
conteúdo
nível 2: uso de links explícitos,
hierarquia de tesauros,
informação contextual
Gráficos
associativos
de conceitos
Aplicações
Garimpo de informação
nível 3: uso de co-ocorrência,
agrupamento de conceitos,
ontologias
Collexis
Por que foi criado e como funciona
Síndrome do resultado de 1 milhão
• Bilhões de gigabytes de informação estão disponíveis
• Isto é boa ou má notícia?
• Como lidar/gerenciar?
– Indexação humana é muito cara
– Indexação automática normalmente não é suficientemente
avançada
– Busca por palavras de texto fornece muito pouco ou demais
Abundância de Informação
• Quantidades crescentes de informação digital em
organizações
• Armazenadas em diferentes formas e formatos
• Espalhadas em uma variedade de bases de dados e arquivos
• Internet acrescenta estonteantes volumes de informação
O Toque Humano
• Armazene Conhecimento Explícito em tesauros
(relationais)
• Use textos livres e relações de conteúdo
• Explore e use técnicas linguísticas
• Buscando por documentos ou conhecimento?
– Conhecimento está embutido em pessoas
– A Collexis se comporta como um especialista
(humano)
– A Collexis encontra informação, especialistas
e organizações
– A Collexis apoia exploração de conhecimento
O poder das Impressões Digitais
•
•
•
•
•
A Collexis é baseado no princípio de Impressões Digitais
Impressão Digital: um perfil de um pedaço de informação
Uma impressão digital contém uma lista de conceitos encontrados
classificados por frequência de aparição no texto
Conceitos são derivados de um Tesauro
Características da impressão digital: única e pequena
100% Malaria
35% Agencies
30% Enthusiastic
28% Collaboration
27% Funding
27% Africa
25% Science
15% Dedications
15% Applaud
15% agenda
14% Inaccurate
14% advocacy
13% hope
13% research funding
13% Fund Raising
O que é um tesauro?
Um tesauro é um vobulário especializado (“repositório de
conhecimento”) de um domínio particular, tal como medicina,
energia ou TI. Contém palavras selecionadas, termos e conceitos
com suas relações semânticas numa estrutura hierárquica e pode
também conter sinônimos.
Exemplo Simplificado de Tesauro
Meio
de transporte
Aeroplano
Veículo a
Motor
Trem
Automóvel
Carro
Avião
Truque
Caminhão
Collexis®, o conceito
indexação

Busca baseada
em palavras
O quê? Por quê?
Como? Quem?
Correspondência
de conceitos
indexação

A mágica das impressões digitais
Emails
Palavras RFP’s
Profissões
CV’s,
média
Habilidades
média
Artigos
livros
Impressões digitais
de conteúdos
Impressões
digitais de
pessoas
Impressões
digitais de
organizações
Multi conceito & texto livre
Impressões digitais de conceitos
Texto ou
documento
de
uma busca
+
Σ
Correspondência
Impressões digitais de texto livre
Lista resultante
Características da Collexis
• Preciso e sensível
As impressões digitais da Collexis são altamente sensíveis e
precisas, e podem ser manipuladas para otimizar os
resultados da pesquisa
– Precisão: somente documentos relevantes são mostrados
– Retorno: todos os documentos relevantes são mostrados, mesmo
quando afunilando a pesquisa
• Desempenho
mesmo em milhões de documentos, os resultados das buscas
devem ser fornecidos instantaneamente
• Enfoque humano
o resultado de uma busca pode ser não apenas documentos
mas também especialistas e organizações
Collexis characteristics
• Arquitetura aberta
Fácil integração pelo uso de um API
• Omnívoro
A Collexis processa informação estruturada e não estruturada;
isto é possível em uma única ação
• Adaptável
A Collexis respeita bases de dados existentes e não requer
grandes investimentos em hardware
• Rápido em qualquer idioma & independente de idioma
A Collexis funciona por entre idiomas.
Alguns mercados e aplicações da Collexis
• Publicações (portais)
• Organizações científicas (Buscador de Referenciados)
• Biotecnologia (Identificação de genes e proteínas)
• Farmacêuticos & Químicos (Pesquisa e desenvolvimento)
• Biblioteca (Pesquisa)
• Cuidados de Saúde (Intranet)
• Legislação & Jurisdição (Inteligência Jurídica)
• Universidades (Pesquisa e Portais)
• Autoridades Internationais (Garimpo de Informação)
Exemplos de Aplicações da Collexis
Busca e Recuperação
Encontra a correspondência para
todos os conceitos encontrados
(input pequeno)
Encontra a correspondência para
qualquer um dos conceitos
encontrados (texto copiado e
colado; linguagem natural)
Busca de conceitos no tesauro
Indexação
Resultado da busca
Especialistas retornados/encontrados
Refine uma busca
Use o tesauro
Use o tesauro
Compartilhamento de informação
Add2Collexis
Add2Collexis
• Encontre informação e especialistas;
• Auxílio à busca através dos chamados “conceitos propostos”
• Disponível para os domínios Ciências Biológicas, ITC,
alimentação e agricultura (outros domínios do conhecimento a
pedido);
• Formatos cobertos: MS-Word, RTF, .txt, HTML e .pdf;
• Totalmente disponível na web;
• Aplicativo baseado na tecnologia .Net da Microsoft®.
Add2Collexis
Pesquise usando a inteligência do
tesauro
e-Vamp
• Enriquece automaticamente páginas web existentes com
hyperlinks;
• Usa o tesauro para reconhecimento de conceitos;
• Permite ao usuário aplicar uma correspondência Collexis para
documentos relacionados, especialistas ou informações de
bases de dados externas;
• Lincagem externa a outros motores de busca;
• Configurado para domínios diferentes
Documento original
Documento e-Vampeado
Busca usando e-Vamp
ClipFinder(Buscador de Clips)
• Pequena aplicação do
cliente
• Fácil de usar
• textos completos como
inputs de queries
• Faz uso de clipboard
• rápido
Metanálise
Mapas do conhecimento
Redes/teias para Metanálise
Demonstrações (opcional)
Obrigado!
Choice of word and measured phrase above the reach
of ordinary men.
Choice of word and measured phrase above the reach
of ordinary men.
William
Wordsworth
Escolha de palavras
e frases
medidas está acima
do alcance do homem comum.
(William Wordsworth)
Download

Tradução da apresentação do Collexis