IMPACTOS NOS SISTEMAS DE INFORMAÇÃO E NAS BIBLIOTECAS CIENTÍFICAS
Luís Fernando Sayão
CNEN/CIN – PPGB/UNIRIO
Luana Farias Sales
CNEN/IEN À GUISA DE INTRODUÇÃO
IMPULSIONADO PELA TECNOLOGIA DIGITAL E REDES DE COMPUTADORES
TROCA DE SUPORTE
PERIÓDICO ELETRÔNICO
LIVRO ELETRÔNICO
ENTREGA: PDF (mimeógrafo virtual)
IMPULSIONADO PELO NOVO MODO DE FAZER CIÊNCIA
INOVAÇÃO: PESQUISADORES
ENTREGA: PRODUTOS DE PESQUISA VARIADOS E INTEGRADOS
O desenvolvimento dos novos sistemas de informação para a pesquisa será afetado pela necessidade de acessar, analisar, modelar, minerar e visualizar dados digitais. Isto coloca o desafio – para profissionais de várias áreas ‐ de como organizar, apresentar, armazenar e preservar esses recursos informacionais.
OS PARADIGMAS CIENTÍFICOS
1º PARADIGMA:
Ciência experimental ou empírica estuda a relação entre fenômenos por meio de experimentos
2º PARADIGMA:
Ciência teórica ou descritiva formula modelos para descrição e explicação dos fenômenos naturais
3º PARADIGMA:
Ciência baseada em simulação uso de software e grande geração de dados
O DILÚVIO DE DADOS
Uma nova geração de instrumentos científicos, sensores, satélites, software de simulação, colaboratórios produzem em ritmo exponencial quantidades imensas e diversificadas de dados brutos de pesquisa
O QUARTO PARADIGMA CIENTÍFICO
eScience
CIÊNCIA PRODUZIDA A PARTIR DO USO, ARMAZENAMENTO, PROCESSAMENTO, ANÁLISE E COMPARTILHAMENTO DE DADOS DE PESQUISA (GRAY, 2005).
[
[
O poder dos computadores modernos permite que relações altamente complexas e até então despercebidas possam ser identificadas e se tornem o motor do quarto paradigma
O QUARTO PARADIGMA CIENTÍFICO
eScience
O MODO DE FAZER CIÊNCIA MUDA....
A computação não é mais meramente um suporte para o padrão tradicional de se conduzir a investigação científica em determinadas disciplinas, mas pode mudar fundamentalmente o desenvolvimento dessas disciplinas.
FORMULAÇÃO
DE HIPÓTESES
Ao invés de hipóteses serem testadas e desenvolvidas a partir de dados coletados para este propósito, hipóteses são construídas após a identificação relações nos conjuntos de dados. Neste abordagem os dados vem primeiro, incorporados numa sequencia de captura de dados, curadoria e análises
O QUARTO PARADIGMA CIENTÍFICO
eScience
ACELERAR A PESQUISA CIENTÍFICA E GERAR CONHECIMENTO COM BASE NA EXPLORAÇÃO DESSE ACÚMULO DE DADOS
Ferramentas avançadas de software e de mineração de dados ajudam a interpretar e transformar os dados brutos em configurações ilimitadas de informação e conhecimento. Perguntas instigantes e recursivas colocadas perante os vários segmentos científicos podem agora ser endereçadas, pela combinação de múltiplas fontes de dados provenientes de domínios diferentes, através da aplicação de modelos complexos e de métodos inéditos de análise.
O QUARTO PARADIGMA CIENTÍFICO
eScience
Ciência aberta
Quando há
compartilhamento O compartilhamento e o
intercâmbio permitem descobrir
conexões no que estava antes
desconectado
de ideias e abertura do
conhecimento a ciência avança mais rapidamente
Reprodutibilidade dos experimentos científicos é um dos fundamentos da ciência.
Códigos fontes para reproduzir dos dados; Uso de software livres e formatos abertos; Ferramentas de pesquisa abertas; Dados de entrada e metadados Cadernos de pesquisa abertos
CIÊ
NC
Os dados científicos devem estar disponíveis para qualquer pessoa sem restrições de copyright, patentes ou outros mecanismos de controle. Dados abertos incentivam o reuso em outras áreas diferentes da original, o que pode levar a descobertas surpreendentes.
IA
A
T
ER
B
A
Os pesquisadores devem divulgar suas descobertas de forma que elas estejam acessíveis para todos os usuários potenciais sem qualquer barreira.
Colaboração crescente entre cientistas efetivada por meio das mídias sociais e da internet. Um número crescente de cientistas estão encontrando novas estratégias para comunicar seus trabalhos usando wikis, blogs, twitter
A avaliação pelas instituições de pesquisa, bem como a aprovação de financiamento pelas agências deve levar em conta a preparação dos dados para disponibilidade na mesma escala em que considera artigos de periódicos e outras publicações, ou seja o nível de transparência.
AGENDA
IS A ?
U
Q
S
PE
E
D
S
ADO
D
É
É
E
QU
O
,
L
AFINA
MICAS
Ê
D
A
C
A
S
E
Õ
AÇ
PUBLICAÇ
UISA
Q
E
S
P
D
E
DADOS D
E
O
T
Ã
GES
CICLOS DE COMUNICA
ÇÃO CIENTÍFICA
CICLOS DE COMUNICAÇÃO CIENTÍFICA
SISTEMAS DE INFORM
AÇÃO PARA A PESQUISA
INFRAE
STRUT
URA D
E PESQ
UISA P
ARA O
PAÍS
VIRTUAL SIMULATION OF A NUCLEAR POWER PLANT'S CONTROL ROOM AS A TOOL FOR ERGONOMIC EVALUATION. EXEMPLO
DE
RESULTAD
O DE
PESQUISA
NA ÁREA
NUCLEAR
(CNEN/IEN)
Leandro Barbosa S. Gatto a, Antônio Carlos A. Mól a,b,c,
Isaac J.A. Luquetti dos Santos a,
Carlos Alexandre F. Jorge a,*, Ana Paula Legey c
INSTITUTO DE ENGENHARIA NUCLEAR - CNEN/IEN
DADOS DE PESQUISA SÃO MUITO SUSCETÍVEIS A PERDAS
BIBLIOTECA
CONVENCIONAL
BIBLIOTECA DE TESES
E DISSERTAÇÕES
REPOSITÓRIOS
PUBLICAÇÃO
PESQUISA
TESE
DADOS
DIGITAIS
?
VISÍVEL INVISÍVEL
O TEXTO ACADÊMICO
APRESENTA APENAS OS
DADOS DE PESQUISA DE
FORMA CONDENSADA
MINHA TESE
UMA VISÃO DOS DADOS
[revisão por pares]
[validação da pesquisa]
!!!
REUSO
SQUISA
E
P
E
D
S
O
D
A
D
DOS
Padronizados
Reformatados
Preservados
Valor adicionado
Arquivados
Intercambiáveis
Acessíveis
ANALISADOS
EM NOVOS E
DIFERENTES
CONTEXTOS
Os pesquisadores começaram a creditar toda a confiança nos conteúdos digitais
criados por outros pesquisadores para dar prosseguimento aos seus
empreendimentos
A ciência como um todo avança com maior qualidade, menor custo e mais eficiência quando abre a possibilidade para que o maior número possível de pesquisadores disponha de vias de acesso aos dados acumulados por seus antecessores e contemporâneos. Isso evita, objetivamente, o custo da duplicação de esforços e permite novas interpretações em diferentes contextos científicos para esses dados e, além do mais, permite que eles sejam integrados e retrabalhados de forma mais criativa, descortinando horizontes para novas pesquisas. REUSO DE DADOS DE
PESQUISA
Os dados que coletamos hoje podem ser usados no futuro de forma que ainda não conseguimos imaginar. Os exploradores de antigamente que coletavam espécimes de plantas e animais não sabiam nada sobre DNA e hoje as amostras são submetidas a esse tipo de investigação. Quando você coleta os seus dados, reúne informações que, no futuro, poderão ser analisadas de formas muito diferentes. São coisas que terão um valor enorme para cientistas que nem nasceram (POLIAKOFF, 2013).
INCENTIVA A PESQUISA CIENTÍFICA E O DEBATE RSOS SQUISAS SÃO RECU
PE
E D
IR
RT
A
P
A
S O
DADOS CRIAD
DEM SER USADOS E PO
E U
Q
R
PO
Q
S E S SO
VALIO
ÓSITOS CIENTÍFICO
P
O
PR
S RO
TU
FU
A REUTILIZADOS PAR
MENTO DE DADOS A
H
IL
T
R
A
P
M
O
C
O
. EDUCACIONAIS
NTÍFICAS, EVITA A IE
C
ES
ÇÕ
A
IG
ST
VE
FACILITA NOVAS IN
O DE DADOS E ÇÃ
A
ER
G
A
N
S ÇO
R
FO
IDA DUPLICAÇÃO DE ES
, PROVENIENTE DA V
O
IC
R
O
RS
U
EC
R
M
OFERECE U
. ÇÃO E TREINAMENTO
CA
U
D
E
A
A R
A
P
L,
A
RE
PROMOVE A INOVAÇÃO E POTENCIALIZA NOVOS USOS PARA OS DADOS LEVA A NOVAS FORMAS DE COLABORAÇÃO ENTRE USUÁRIOS DE DADOS E CRIADORES DE DADOS MAXIMIZA A TRANSPARÊNCIA E PRESTAÇÃO DE CONTAS PERMITE O CONTROLE DOS RESULTADOS DA PESQUISA CIENTÍFICA
MELHORIA E VALIDAÇÃO DA PESQUISA E A REVISÃO POR PARES
REDUZ O CUSTO DE DUPLICAÇÃO DE GERAÇÃO DE COLEÇÕES DE DADOS AUMENTA A VISIBILIDADE E O IMPACTO DA PESQUISA
PROMOVE A PESQUISA QUE CRIOU OS DADOS E OS SEUS RESULTADOS CREDITA AO PESQUISADOR AUTORIA PELOS DADOS ENQUANTO PRODUTO DA SUA PESQUISA
OFERECE RECURSOS IMPORTANTES PARA A EDUCAÇÃO E TREINAMENTO
AGÊNCIAS FINANCIADORAS DE PESQUISA
PLANOS DE COMPARTILHAMENTO DE DADOS POLÍTICAS MANDATÓRIAS
Isso garante que os pesquisadores se comprometem a cuidar dos dados durante e após a pesquisa no sentido de otimizar o compartilhamento de dados. DADOS
PERIÓDICO CIENTÍFICO
Os periódicos exigem cada vez mais que os dados que sustentam a pesquisa publicada depositado dentro em uma base de dados ou repositório de acessível . ÓRGÃOS DE PESQUISA (CONSELHOS,
GESTORES DE C&T, ETC)
Financiam infraestruturas para gestão e serviços de dados para facilitar o compartilhamento dentro de domínios específicos.
REPOSITÓRIOS DE DADOS
PESQUISADORES
Iniciativas como o DataCite ‐ que atribui identificador persistente (DOI) aos dados de pesquisa ‐ ajudam o cientista a tornar seus dados citáveis, rastreáveis e acessíveis de modo que os dados de pesquisa, bem como as publicações baseadas nesses dados, façamparte da produção científica desse pesquisador.
ility.html
b
a
il
a
v
a
/
s
ie
c
hors/poli
t
u
a
/
m
o
.c
e
r
.natu
http://www
nd build to replicate a
le
b
a
e
b
ld
u
o
thers sh
blication u
p
ation is that o
f lic
b
o
u
n
p
f io
o
it
le
d
p
n
ci
rin
, a co
An inherent p
Therefore
s.
im
la
c
d
e
sh
li
to make d
e
' pub
ir
rs
u
o
q
th
e
u
a
r
e
e
h
r
t
n
a
upo
at authors
ilable to ptly ava
urnal is th
m
o
o
j
r
p
re
ls
tu
o
a
c
N
to
o
a
in
bility associated pr
d
n
ns on the availa
io
a
ct
ta
ri
a
st
e
d
r
, y
n
ls
A
tions.
materia
a
c
f submission. fi
o
li
e
a
u
im
t
q
e
e
th
u
t d
a
ut un
editors
readers witho tion must be disclosed to the d manuscript, including details tributed
ubmitte
r informa
s are to be dis
closed in the s
of materials o
al
is
ri
d
e
e
at
b
o
m
f ls
. I
a
n
st
ns mu
formatio
Any restrictio
aterials and in
m
in
ta
b
o
an
c
d in the paper.
te
ta
s
e
b
st
of how readers
u
m
company, this
by a for‐profit ?
AFINAL, O QUE É DADOS DE PESQUISA
FATOS, NÚMEROS, CARACTERES, SÍMBOLOS QUE DESCREVEM UM
OBJETO, UMA CONDIÇÃO, UMA SITUAÇÃO OU OUTRO FATOR (NSF, 1999)
ENTREVISTAS
REGISTRO DE
FATOS
USADOS COMO
FONTES
PRIMÁRIAS NA
INVESTIGAÇÃO
CIENTÍFICA E
QUE
GERALMENTE
SÃO ACEITOS
NA
COMUNIDADE
CIENTÍFICA
COMO
NECESSÁRIOS
PARA A
VALIDAÇÃO
ANOTAÇÕES
s rvações diretas, tai
se
b
o
e
d
os
id
bt
o
CIONAIS são ífica, a atitude dos eleitores ou A
V
R
E
S
B
O
S
O
D
A
D
pec
e lcão numa data es
u
v
um
e istros históricos qu
d
eg
o
r
çã
m
p
fi
u
n
e
em
u
como er
it
st
on
supernova – que c
rtanto, devem ser
o
p
e,
fotografia de uma z ve
a nd
gu
coletados uma se
não podem ser empre
arquivados para s
DADOS EXPERIMENTAIS
são provenientes de situações controladas em bancadas de laboratórios. Em tese, dados experimentais provenientes de experimentos que podem ser precisamente reproduzidos e não precisam ser armazenados indefinidamente; entretanto, nem sempre é possível reproduzir precisamente todas as condições experimentais.
de modelos sultados da execução re
–
IS
A
N
IO
C
TA
U
DADOS COMP
idos a uma ões; devem ser submet
simulaç
computacionais ou de
ento de um grande m
va
ui
rq
a
o
õe
up
ss
re
p
o de abordagem distinta que
or um conjunto robust
p
os
ss
re
xp
e
s,
õe
aç
rm
número de info
ftware e dados de so
e,
ar
dw
ar
h
de
o içã
m descr
metadados, que inclue
entrada
PACOTE DE INFORMAÇÃO DE DADOS DE PESQUISA
DADOS BRUTOS
ou
DADOS PRIMÁRIOS
Dados provenientes diretamente do instrumento científico
OBJETOS SUPLEMENTARES
Instrução de codificação
Guia de entrevistas
Fluxograma de coleta de dados
Questionário
Informações sobre os métodos usados e técnicas de pesquisa usadas
Dicionário de dados
Caderno de pesquisa
.PROCESSAMENTO
. CALIBRAÇÃO
.VALIDAÇÃO
.COMBINAÇÃO COM OUTROS DADOS
REALIDADE VIRTUAL
Texto e
números não
contam toda
história
OS OBJETIVOS E OS MÉTODOS USADOS PARA PRODUZI‐LOS VARIAM ENORMEMENTE DE ACORDO COM OS CAMPOS CIENTÍFICOS, ASSIM COMO OS CRITÉRIOS PARA COMPARTILHÁ‐LOS, SIMULAÇÕES
MODELOS EM 3D
NÍVEIS DE ABSTRAÇÃO
DADOS DE PESQUISA SÃO OBJETOS COMPLEXOS,
DIVERSIFICADOS E HETEROGÊNEOS. GAMES
dispositivos de
imersão e
interativas
apresentações
sensoriais
ESTRUTURAS QUÍMICAS
SOFTWARE
imagem em
movimento
WEBSITE/MULTIMÍDIA
VIDEOS
imagens
FOTOS
GRÁFICOS
sons
ESPECIFICAÇÕES
ENTREVISTAS
documentos
FORMÚLAS
TABELAS
letras
ANOTAÇÕES
símbolos
DADOS NUMÉRICOS
números
DADOS DE PESQUISA
A heterogeneidade intrínseca aos dados de
pesquisa implica que é necessário formular
políticas de amplo espectro, que não
só identifiquem, mas efetivamente
sustentem os vários tipos de dados e a sua
natureza díspar. O reconhecimento dessa
idiossincrasia torna-se crucial quando se
estabelecem as opções tecnológicas
e gerenciais para a gestão desses
dados.
001100011100011010100010110001011101001011001010011111010100100010100001110001001010001000101
Tabela periódica
001100011100011010100010110001011101001011001010011111010100100010100001110001001010001000101
Tabela periódica
TRANSMITIR CONHECIMENTO
(DADOS INTELIGENTEMENTE ABERTOS)
TRANSMITIR CONHECIMENTO
ACESSÍVEL
Localizado e acessado
2
3
INTELIGÍVEL
Deve se apresentar de forma inteligível para aqueles que desejam entendê‐lo ou analisá‐lo.
Deve ser diferente para diferentes audiências, mesmo para o cidadão comum.
AVALIÁVEL
Natureza, evidências, confiabilidade, fonte competente, financiador, objetivos
UTILIZÁVEL
Deve ser capaz de ser reusado em diferentes contextos e, minimamente, por outros cientistas.
METADADOS QUE DOCUMENTAM OS ELEMENTOS SEMÂNTICOS, AS PARTES DOS OBJETOS E SUAS RELAÇÕES, AS DEPENDÊNCIAS TÉCNICAS, A PROVENIÊNCIA, A IDENTIFICAÇÃO PERSISTENTE, AS RESTRIÇÕES E DIREITOS ASSOCIADOS AOS DADOS, AS POSSÍVEIS INTERVENÇÕES SOFRIDAS E SEUS EFEITOS. OU SEJA, OS METADADOS DEVEM REGISTRAR IDEALMENTE TUDO QUE DEVE SER DE INTERESSE DO PESQUISADOR, INCLUINDO MODELOS DE DADOS, EQUIPAMENTOS ESPECIAIS, ESPECIFICAÇÃO DA INSTRUMENTAÇÃO, LINHAGEM DOS DADOS E MUITO MAIS.
E Q U I PA
MENTO
S ES P EC
I AI S
LINHAGEM
ÕES)
Ç
A
A
L
R
S RE
UTU
ESTR ES E SUA
T
(PAR
INTERVENÇÕES
GE
CALIBRA
IDENTIFI
CA
PERSISTE ÇÃO NTE
M
PRECISÃO
DE
SCR
LOCALIZAÇÃO
GEOGRÁFICA
IÇÃ
O
DEPENDÊNCIAS TÉCNICAS
MODELO DE DADOS
VERSÃO
PROVENIÊNCIA
AUTORIA
DATA
DIREITOS ASSOCIADOS
Os metadados têm um forte impacto na capacidade dos dados de pesquisa de transmitir conhecimentos e poder ser interpretados e reusados agora e no futuro
/H O R
A
O
AÇÃ
T
N
E
RUM
T
S
IN
DESCRITIVOS: DC, MARC21, MARCXML, MODS, ONIX, DDI, EAD, TEI...
ADMINISTRATIVOS
PREMIS (preservação)
direitos, acesso, informação de representação, técnicos
ESTRUTURAIS:
OAI‐ORE, MPEG 21, METS, RDF
ESPECÍFICOS
1
2
3
INTERESSE COMERCIAL
VALORIZAÇÃO COMERCIAL DOS DADOS
PROTEGER A INOVAÇÃO
PATENTES
PERÍODO DE EMBARGO
PRIVACIDADE
INFORMAÇÕES PESSOAIS: CRÍTICO PARA A PESQUISA NAS ÁREAS DE SAÚDE E CIÊNCIAS SOCIAIS;
GOVERNANÇA X PROTEÇÃO DA CONFIDENCIALIDADE
ANONIMIZAÇÃO NÃO GARANTE
AMEAÇA A SEGURANÇA
SEGURANÇA E SAUDE PÚBLICA
PROTEÇÃO CONTRA INCIDENTES NÃO INTENCIONAIS
PROTEÇÃO CONTRA ATAQUES DELIBERADOS
“SÓ METADE DOS DADOS QUE DEVEM SER PROTEGIDOS ESTÁ PROTEGIDO” (IDC, 2011)
[
A mesma tecnologia que muda a pesquisa científica coloca os dados gerados em risco e nos impõe o desafio estratégico, gerencial e político de criar, arquivar, preservar e tornar disponível esses dados
TRADICIONALMENTE CURADORIA NÃO ESTÁ PREOCUPADA APENAS COM A PRESERVAÇÃO POR LONGO PRAZO DE LIVROS RAROS, PINTURAS E OUTROS ARTEFATOS. SEU FOCO PRINCIPAL É MANTER A INTEGRIDADE E POSSIBILITAR E PROMOVER SUA DISPONIBILIDADE PARA AUDIÊNCIAS APROPRIADAS. ISTO TAMBÉM É VERDADEIRO PARA DADOS DE PESQUISA. PARA QUE ELES PERMANEÇAM ÚTEIS PODE SER NECESSÁRIO MANUTENÇÃO E MELHORIAS. ISTO SOMADO A PROMOÇÃO DOS DADOS PARA OS CONSUMIDORES POTENCIAIS SÃO OS DOIS PAPÉIS PRINCIPAIS DA CURADORIA DE DADOS.
CURADORIA DIGITAL
DE DADOS DE PESQUISA
Manutenção, preservação e agregação
de valor a dados de pesquisa durante
o seu ciclo de vida. (DCC, 2003)
Todas as atividades envolvidas na
gestão de dados, desde o
planejamento de sua criação –
quando os sistemas são
projetados- passando pelas boas
práticas de digitalização, na
seleção dos formatos e da
documentação, e na garantia de
estarem sempre adequados para
serem descobertos e
reusados agora e no
f t
A ATIVIDADE DE GESTÃO E DE PROMOÇÃO DE USO DO DADO DE PESQUISA DESDE A CRIAÇÃO/SELEÇÃO, ASSEGURANDO A SUA ADEQUAÇÃO PARA PROPÓSITOS ATUAIS E FUTUROS E TORNANDO‐O DISPONÍVEL PARA GESTÃO DINÂMICA
DESCOBERTA E REUSO;
AVALIAÇÃO
MANUTENÇÃO E ENRIQUECIMENTO
INTERAÇÃO ENTRE CRIADOR E USUÁRIO
REFORMATAÇÃO LINKS COM OUTROS RECURSOS
ANOTAÇÃO
ATIVIDADE DE CURADORIA QUE ASSEGURA QUE O DADO ESTÁ
SELECIONADO, ARMAZENADO E PODE SER ACESSADO E QUE A SUA INTEGRIDADE FÍSICA E LÓGICA ESTÁ
MANTIDA
ATIVIDADE INCLUÍDA NA CURADORIA ATRAVÉS DA QUAL ITENS ESPECÍFICOS DE DADOS SÃO MANTIDOS AO LONGO DO TEMPO DE FORMA QUE ELES POSSAM SER ACESSADOS E COMPREENDIDOS NO FUTURO A DESPEITO DAS MUDANÇAS TECNOLÓGICAS.
REUSO DE DADOS PARA NOVAS PESQUISAS, INCLUINDO PESQUISAS BASEADAS EM COLEÇÕES DE DADOS
RETENÇÃO DOS DADOS OBSERVACIONAIS QUE SÃO ÚNICOS E IMPOSSÍVEIS DE SE RECRIAR
RETENÇÃO DOS DADOS GERADOS A CUSTO MUITO ALTO E QUE SÃO MAIS BARATOS MANTER DO QUE REGERAR.
ADICIONAR VALOR AOS DADOS DISPONÍVEIS PARA PROJETOS
VALIDAR RESULTADOS DE PESQUISAS PUBLICADAS
TORNAR A AVALIÇÃO POR PARES MAIS CONFIÁVEL
USO NO ENSINO
PARA EXIGÊNCIAS LEGAIS
PUBLICAÇÕES
PERIÓDICOS
BIBLIOTECAS
REPOSITÓRIOS INSTITUCIONAIS
REPOSITRIOS TEMÁTICOS
DEPOSITANDO‐OS NUM REPOSITÓRIO DE DADOS DE CENTROS DE DADOS ESPECIALIZADOS
DADOS
SUBMETÊ‐LOS A UM PERIÓDICO PARA APOIAR UMA PUBLICAÇÃO DEPOSITANDO‐OS EM UM REPOSITÓRIO INSTITUCIONAL TORNANDO‐OS DISPONÍVEIS ON‐LINE ATRAVÉS DE UM PROJETO OU SITE INSTITUCIONAL TORNANDO‐OS DISPONÍVEIS INFORMALMENTE ENTRE PESQUISADORES DE PESSOA PARA PESSO
REPOSITÓRIOS DE DADOS DE PESQUISA
BANCOS DE DADOS CIENTÍFICOS DIGITAIS QUE GARANTEM O ACESSO A RESULTADOS DE PESQUISA AGORA E NO FUTURO, TENDO COMO PERSPECTIVA PRIMORDIAL O ACESSO ABERTO AO QUE É CONSIDERADO TAMBÉM UM PATRIMÔNIO DIGITAL DA HUMANIDADE (SURF FOUNDATION, 2013)
Databib
PIRÂMIDE DE REPOSITÓRIOS DE DADOS
HIERAQUIA DE VALOR & PERMANÊNCIA
INFRAESTRUTURA
PADRÕES, SUSTENTABILIDADE
PROVENIÊNCIA
REAPONSABILIDADE
DEMANDA POR ACESSO
VALOR SOCIAL
CONFIABILIDADE
ESTABILIDADE
WORDWILDE PROTEIN DATABANK
LARGE HADRON COLLIDER
EUROPEN BIOINFORMATICS INSTITUTE
RECURSOS INTERNACIONAIS RELEVANTES
NATIONAL BIODIVERSITY
NETWORK
REFERÊNCIAS NACIOANAIS E INTERNACIONAIS IMPORTANTES
COLEÇÕES DE DADOS INSUBISTITUÍVEIS
CENTROS DE DADOS NACIONAIS
CARPE DIEN
REPOSITÓRIOS INSTITUCIONAIS
COLEÇÕES DE COMUNIDADES ESPECÍFICAS
RISCO DE PERDA
USABILIDADE
COMPARTILHAMENTO
REUSO
COLEÇÕES INDIVIDUAIS
COLEÇÕES DE UM GRUPO DE
PESQUISADORES
Baseado em THE ROYAL SOCIETY (June 2012)
GARANTIA DE QUE OS DADOS ESTÃO DE ACORDO COM PADRÕES DE QUALIDADE
PRESERVAÇÃO DE LONGO PRAZO
ARMAZENAMENTO SEGURO COM CAPACIDADE DE CONTROLAR O DADOS
ACESSO, SEMPRE QUE NECESSÁRIO BACK‐UPS DE DADOS REGULARES DESCOBERTA DE RECURSOS ON‐LINE ATRAVÉS DE CATÁLOGOS DADOS ACESSO AOS DADOS EM FORMATOS POPULARES ACORDOS DE LICENCIAMENTO PARA RECONHECER OS DIREITOS ASSOCIADOS AOS DADOS
MECANISMO DE CITAÇÃO PADRONIZADA
REPOSITÓRIOS DE DADOS
VISIBILIDADE DOS DADOS PARA MUITOS USUÁRIOS • MONITORAMENTO DO USO SECUNDÁRIOS DOS DADOS
[
OS CENTROS DE DADOS, COMO QUALQUER ARQUIVO TRADICIONAL, GERALMENTE SE APLICAM ALGUNS CRITÉRIOS PARA AVALIAR E SELECIONAR DADOS PARA PRESERVAÇÃO.
S
E
R
O
D
A
S
I
U
Q
S
E
EMBORA OS P
S
O
M
O
C
,
E
S
E
T
M
E
,
CONCORDEM
O
D
S
I
A
I
C
N
E
T
O
P
S
O
I
BENEFÍC
S
O
D
A
D
E
D
O
T
N
E
M
A
COMPARTILH
A
,
O
C
I
F
Í
T
N
E
I
C
O
S
PARA O PROGRES
S
A
V
R
E
S
E
R
M
E
T
A
MAIORIA AIND
O
A
T
N
E
M
E
L
P
M
I
E
QUANDO S
A
C
I
T
Á
R
P
A
N
O
T
N
E
COMPARTILHAM
A
WEB não tem
MEMÓRIA
PERSISTENTE,
portanto é preciso
CONSTRUI-LA
INTENCIONALMENTE
E ACREDITE
NOS
REPOSITÓRIOS
DIGITAIS
CONFIÁVEIS
DOCUMENTOS ESSENCIAIS
REFERENCE MODEL FOR AN OPEN ARCHIVAL INFORMATION SYSTEM
CCSDS – ISO - 2001
TRUSTED DIGITAL REPOSITORIES:
ATTRIBUTES AND RESPONSABILITIES
RLG-OCLC - 2002
TRUSTWORTHY REPOSITORIES AUDIT
& CERTIFICATION: CRITERIA AND
CHECKLIST
RLG/NARA - 2007
AUDIT & CERTIFICATION OF
TRUSTWORTHY DIGITAL
REPOSITORIES – MAGENTA
BOOK
CCSDS – ISO – SEP. 2011
REQUIREMENTS FOR BODIES
PROVIDING AUDIT AND
CERTIFICATION OF
CANDIDATE TRUSTWORTHY
DIGITAL REPOSITORIES –
MAGENTA BOOK
CCSDS – ISO - NOV. 2011
NOVOS CONCEITOS DE
PUBLICAÇÃO CIENTÍFICA
PUBLICAÇÕES AMPLIADAS
Interoperabilidade de publicações e dados
PUBLICAÇÕES AMPLIADAS
relações semânticas entre
publicações e dados
VALORES SEMÂNTICOS PARA AS RELAÇÕES
ONTOLOGIAS
VOCABULÁRIOS
CIENTÍFICOS
PUBLICAÇÕES AMPLIADAS:
ESTRUTURA
As publicações
ampliadas
constituem-se de:
E‐prints
Dados
Metadados
Conjuntos de dados
Outras publicações NEW CELL USER INTERFACE
The new Cell user interface. Outstanding features are the explicit layering and internal integration of the information displayed. In addition to the textual summary a graphical abstract is included, together with a video on which the authors introduce their findings. The tabs on top correspond with the regular division of a scientific article, while sections like 'Results' and 'Data' provide ample room for charts. Figures in the 'Data' section are linked to the body of text so that each chart can be viewed in sync with its own context. The 'Comments' tab opens a blog‐like web page for reactions ABSTRACT GRÁFICO
VIDEO EM QUE OS AUTORES INTRODUZEM SEUS ACHADOS
RESULTADOS
DADOS – FIGURAS COM LINKS PARA O TEXTO
COMENTÁRIOS ‐ BLOG
http://www.cell.com/abstract/S0092‐8674%2809%2901439‐
1
NEW CELL USER INTERFACE
The new Cell user interface. Outstanding features are the explicit layering and internal integration of the information displayed. In addition to the textual summary a graphical abstract is included, together with a video on which the authors introduce their findings. The tabs on top correspond with the regular division of a scientific article, while sections like 'Results' and 'Data' provide ample room for charts. Figures in the 'Data' section are linked to the body of text so that each chart can be viewed in sync with its own context. The 'Comments' tab opens a blog‐like web page for reactions ABSTRACT GRÁFICO
VIDEO EM QUE OS AUTORES INTRODUZEM SEUS ACHADOS
RESULTADOS
DADOS – FIGURAS COM LINKS PARA O TEXTO
COMENTÁRIOS ‐ BLOG
http://www.cell.com/abstract/S0092‐8674%2809%2901439‐
1
NEW CELL USER INTERFACE
The new Cell user interface. Outstanding features are the explicit layering and internal integration of the information displayed. In addition to the textual summary a graphical abstract is included, together with a video on which the authors introduce their findings. The tabs on top correspond with the regular division of a scientific article, while sections like 'Results' and 'Data' provide ample room for charts. Figures in the 'Data' section are linked to the body of text so that each chart can be viewed in sync with its own context. The 'Comments' tab opens a blog‐like web page for reactions ABSTRACT GRÁFICO
VIDEO EM QUE OS AUTORES INTRODUZEM SEUS ACHADOS
RESULTADOS
DADOS – FIGURAS COM LINKS PARA O TEXTO
COMENTÁRIOS ‐ BLOG
http://www.cell.com/abstract/S0092‐8674%2809%2901439‐
1
PUBLICAÇÕES AMPLIADAS E
WEB SEMÂNTICA
Publicações ampliadas consistem de dados e informações heterogêneas
A Web semântica é focada nas relações entre dados distribuídos
A integração de dados heterogêneos requer o uso de padrões.
Os padrões do W3C devem ser considerados na construção da publicação ampliada.
URI, XML, XML Schema, RDF, OWL, são exemplos de recomendações do W3C que devem ser aplicadas à
publicação ampliada.
PUBLICAÇÃO AMPLIADA FAZ UMA PONTE QUE ATRAVESSA O TEMPO E O ESPAÇO ENTRE OS SISTEMAS ORIENTADOS POR DOCUMENTOS, COMO OS BIBLIOGRÁFICOS, E OS SISTEMAS ORIENTADOS POR DADOS, COMO OS EXIGIDOS PELA CIÊNCIA CONTEMPORÂNEA.
ÕES
Ç
A
C
I
L
PUB
S
DADO
Org. Pesquisa
D
diretor
Pessoa
Agência de
B
Fomento
coordenador
Projeto
C
autor
Artigo
I
gera
tem autoria de
faz inferência sobre
financiado por
Artigo A
é base para
Patente
J
discute
é comentado por
é parte de
Org. Fomento
E
Conjunto
de Dados
F
Publicação
G
Blog
H
E‐PRINT
descreve
PESSOA
DADO
PROJETO
ORGANIZAÇÃO
Org. Pesquisa
D
diretor
Pessoa
Agência de
B
Fomento
coordenador
Projeto
C
autor
Artigo
I
gera
tem autoria de
faz inferência sobre
financiado por
Artigo A
é base para
Patente
J
discute
é comentado por
é parte de
Org. Fomento
E
Conjunto
de Dados
F
Publicação
G
Blog
H
E‐PRINT
descreve
PESSOA
DADO
PROJETO
ORGANIZAÇÃO
CRIS
CURRENT
RESEARCH
INFORMATION
SYSTEM
A CRESCENTE COMPLEXIDADE DAS ATIVIDADES DE PESQUISA, A IMENSA GERAÇÃO DE DADOS E INFORMAÇÕES E A NECESSIDADE DE GERENCIAR PROCESSOS PROPICIOU O SURGIMENTO DE INFRAESTRUTURAS TECNOLÓGICAS COM VISTAS AO TRATAMENTO E À RECUPERAÇÃO DESSAS INFORMAÇÕES
Common European Research Information Format
SIGNIFICA
ATUALIZAÇÃO
DINAMISMO
RELACIONAM
ENTOS E M TRANSFORMA
ÇÃO
INFORMAÇÕES SOBRE
PESSOAS
ORGANIZAÇÕES
PROJETOS
FINANCIAMENTO
RESULTADOS DE PESQUISA
EQUIPAMENTOS
...
IMPULSIONADO POR
UM CONCEITO
UM MODELO
... INCORPORADO COMO UMA IMPLEMENTAÇÃO (ICT)
ICA
SEMÂNT
A
D
A
M
A
C
METADADOS
ENTIDADES H
ETEROGÊNEA
S
INTEGRAÇÃO
VISÃO INTEGRADA NA GESTÃO DE INFORMAÇÃO PARA A PESQUISA
MODELO CERIF
Common European Research Information Format
Programa de
Financiamento
Pessoa
Person
Projeto
Project
Organização
Organisation
Serviço
Expertise
Publicação
Equipamento
CV
Patente
Produto
Evento
Classificação
Classification
Semantics )
( Semântica
s
do
a
d
Fi n
AÇ
ÃO
NA
LI
Z
ÕE
IN
S
TI
TU
S
CI
O
DR
PA
an Polít
Ca ciam icas
pa en
to
c
Pe itaçã
o
s
Bo Copy quisa
as prá right
Pa tica
rce
s
ria
s te
n
s
e
o
d
ist ia
s
o
de
t
r
r
s
a
a
e
o
o
p
s
d
d
rm
ilid
Fo tada ação /cura omia erab
c
Me ntifi ação axon erop
Ide serv ias/t e int
Pre tolog los d
On toco ça
Pro uran
g
Se
TECNOLOGIAS
Redes de computadores
Banco de dados
Ferramentas de software
Sistemas
Repositórios
CIBERINFRAESTRUTURA
PARA DADOS DE PESQUISA
CONSISTE DE SISTEMAS DE COMPUTAÇÃO, SISTEMAS DE ARMAZENAMENTO, INSTRUMENTOS AVANÇADOS E REPOSITÓRIOS DE DADOS, AMBIENTES DE VISUALIZAÇÃO E PESSOAS, TUDO LINKADO POR REDES DE ALTO DESEMPENHO QUE TORNA POSSÍVEL INOVAÇÃO CIENTÍFICA E DESCOBERTAS QUE DE OUTRA MANEIRA NÃO SERIA POSSÍVEL
SERVIÇOS
FONTES DE DADOS
VISUALIZAÇÃO
ANÁLISE
MODELAGEM
MINERAÇÃO
PORTAIS/PUBLICAÇÃO
CURADORIA/PRESERVAÇÃ
O
SELEÇÃO/RECUPERAÇÃO
FERRAMENTAS ESPECÍFICAS
PESSOAS
INSTRUMENTOS
SENSORES
LABORATÓRIOS
APLICAÇÕES
GESTÃO DE DADOS
COMPUTADORES
OUTRAS FONTES
CURADORIA
PRESERVAÇÃO
ARMAZENAMENTO
ACESSO
FACILIDADES P / O USO
DIREITOS
REUSO
INOVAÇÃO
INDICADORES
DIVULGAÇÃO CIENTÍFICA
QUALIDADE DA PESQUISA
VALIDAÇÃO DE RESULTADOS
REPRODUTIBILIDADE
A BIBLIOTECA DE PESQUISA PRECISA CONSIDERAR O SEU PAPEL EM
FACE AOS NOVOS AMBIENTES DE PESQUISA ESTABELECIDOS PELA
eSCIENCE PELA CIÊNCIA ABERTA
Crise da bibliotecas científicas
Desintermediação
Dados são diferentes de livros e periódicos
É necessário um modelo gerencial e institucional voltados para gestão de
dados.
A BIBLIOTECA DEVE IR ALÉM DA HOSPEDAGEM DOS DADOS.
Necessita de pesquisa e desenvolvimento
BIBLIOTECONOMIA
VOLTADA PARA PESQUISA
BIBLIOTECONOMIA
TI PARA DE BIBLIOTECONOMIA
DADOS
SERVIÇO DE CIÊNCIA BASEADA EM DADOS
Baseado em QUIN (Oct. 2013)
DE DADOS
INFRAESTRUTURA
DE DADOS
GESTÃO DA TECNOLOGIA DA INFORMAÇÃO
BIBLIOTECA COMO PROVEDORA DE SERVIÇOS DE DADOS
Planejamento e gestão do repositório de dados
Curadoria/preservação/arquivamento/disseminação
Apoio a recuperação e ao depósito de dados.
Guia de preservação e compartilhamento de dados
BIBLIOTECA COMO PARCEIRA
Desenvolvimento de aplicações, ontologias, taxonomias
Cursos de gestão de dados
Pesquisa na área de gestão de dados
Publicação em parceria com pesquisadores da área
Projetos de pesquisa
TECNOLOGIA NÃO RESOLVE TUDO
!
Apesar da tecnologia ser determinante para a pesquisa contemporânea, o
progresso científico não depende unicamente da tecnologia. Políticas voltadas
para a pesquisa, fóruns apropriados, legislação específica, fundos para
financiamento, valores culturais, ou seja, um espectro multidimensional de
fatores afeta profundamente a natureza das novas descobertas, a velocidade
com que elas são desenvolvidas e a sua capacidade de se tornarem acessíveis e
utilizadas efetivamente (OCDE, 2007)
ASPECTO
SOCIAL, ÉTICO E LEGAL
FINANCIA
PROTEÇÃO Á PROPRIEDADE INTELECTUAL
CONFIDENCIALIDADE E PRIVACIDADE
MECANISMOS DE RECOMPENSA
CITAÇÃO DE DADOS
SUSTENTABILIDADE
ECONÔMICA
FLUXO CONTINUO DE RECURSOS
PARCERIA E COLABORAÇÃO
MODELOS DE CUSTOS
DEFINE POLÍTICAS
ESTABELECE LINHAS DE FINANCIAMENTO
PESQUISA
POLÍTICA DE FOMENTO
POLÍTICA
GOVERNANÇA
LIVRE ACESSO
TRANSPARÊNCIA
FÓRUNS DE DISCUSSÃO
DIRETRIZES E RECOMENDAÇÕES
LINHAS DE FINANCIAMENTO
POLÍTICAS MANDATÓRIAS
FINANCIA
FINANCIA
DEFINE CONFIGURAÇÃO
CONSIDERA
AGENDA DE PESQUISA
INTEGRAÇÃO DAS EXPERIÊNCIAS
MATERIAIS DE REFERÊNCIA
INSERÇÃO NA PÓS‐GRADUAÇÃO
CRIA CONHECIMENTO PARA
DEFINE POLÍTICAS
RECURSOS HUMANOS
FORMAÇÃO DE PROFISSIONAIS DE TI e CI
ESPECIALISTAS EM ASSUNTO
CIENTISTAS DE DADOS
CURSOS
DEFINE POLÍTICAS
DESENVOLVIMENTO DE
COLEÇÕES DE DADOS
DEFINIÇÃO DE PRIORIDADES/SELEÇÃO
POTENCIAL DE REUSO
METADADOS QUE GARANTAM A INTERPRETAÇÃO
CRIA CONHECIMENTO PARA
EXECUTA/GERENCIA
OPERA
APOIA A O DESENVOLVIMENTO
APLICA
SERVIÇOS
SERVIÇOS INOVADORES
APLICAÇÕES COMPUTACIONAIS
REUSO EM OUTROS CONTEXTOS
INTEROPERABILIDAE
DISPONIBILIZA
APLICA
COORDENA
CONFIGURAÇÃO
ORGANIZACIONAL
DISTRIBUIÇÃO DOS REPOSITÓRIOS
APOIO À PESQUISA INTERDISCIPLINAR
AÇÕES COLABORATIVAS
POOL DE ESPECIALISTAS
CONSIDERA
TECNOLOGIAS & PADRÕES
DEFINIÇÃO DO ELENCO DE PADRÕES PARA: TRATAMENTO, ACESSO, ARMAZENAMENTO, INTEROPERABILIDADE E PRESERVAÇÃO
DESENCOLVIMENTO DE
CIBERINFRAESTRUTURA DE PESQUISA
BIBLIOGRAFIA
SALES, Luana Farias. Integração semântica de publicações científicas e dados de pesquisa: proposta de modelo de publicação ampliada para a área nuclear. IBICT/UFRJ, 2014
SAYAO, Luis Fernando ; SALES, Luana Farias . Dados abertos de pesquisa: ampliando o conceito de acesso livre. RECIIS. Revista Eletrônica de Comunicação, Informação & Inovação em Saúde (Edição em Português. Online), v. 8, p. 76‐92, 2014. SAYAO, L. F. ; SALES, Luana Farias . Dados de pesquisa: contribuição para o estabelecimento de um modelo de curadoria digital para o país. Tendências da Pesquisa Brasileira em Ciência da Informação, v. 6, p. 7, 2013. SALES, Luana Farias ; SAYAO, L. F. ; SOUZA, R. F. . Publicações ampliadas: um novo modelo de publicação acadêmica para o ambiente de e‐science. In: XIV ENANCIB ‐ Encontro Nacional de Pesquisa em Ciência da Informação, 2013, Florianópolis ‐ SC. SALES, Luana Farias ; SAYAO, L. F. . O impacto da curadoria digital dos dados de pesquisa na Comunicação Científica. Encontros Bibli, v. 17, p. 118‐135, 2012.
SAYAO, L. F. ; SALES, Luana Farias . Curadoria digital: um novo patamar para a preservação de dados digitais de pesquisa. Informação & Sociedade, v. 22, p. 1, 2012
Download

dados