Computação Semântica
em E-Science
Sérgio Serra
PPGMMC/UFRRJ & PET-SI /UFRRJ
[email protected]
Agenda
•
•
•
•
•
Motivação
Proveniência
Ciclo de Vida x Semântica
Ontologias de Proveniência
E-Science no Agronegócio
Motivação
22. Dados são
pré-analisados
com o programa X
em cluster do lab I
Recursos
Científicos (DADOS)
+
Proveniência
11. Experimento em larga escala
realizado pelos cientistas A e B
no lab. 1
33. Grande quantidade
de dados gerada...
55. Os resultado são analisados
Pelo programa Z pelo cientista C
no lab. II
66 A pesquisa
é publicada
adaptado de (MATTOSO, CRUZ et al., 2008, CRUZ 2011), Tutorial SBBD.
4 ...precisa ser
4.
processada por
programas K, L e M
numa nuvem3 de
computadores
Proveniência
• Comum a várias áreas;
• Gerência da proveniência
suscita muitas pesquisas em eCiência e BD;
• Várias definições (SIMMHAN et
al., 2005, SRIVASTAVA, VELEGRAKIS,
2007, FREIRE et al., 2008, CHENEY et
al., 2009, CRUZ et al,
2009,CHAPMAN, JAGADISH, 2010);
Proveniência são metadados
sistematicamente coletados e
armazenados; auxiliam na
determinação da história de um
artefato através da evolução de
processos, desde sua origem até seu
destino final (BUNEMAN, 2001)
4
Proveniência na E-Ciência
• Reprodutibilidade e interpretação de
resultados
• Verificar se um experimento obedece aos
protocolos
• Rastreamento, Transparência, Auditoria
• Assegurar a qualidade dos dados e processos
Provenance is as (or more) importante as the results
(FREIRE & DAVIDSON, SIGMOD, 2008)
5
Visão integrada
do ciclo de vida
centrado em
proveniência
5
1
CAPTURA
2
OBJETO
5
ACESSO
e REUSO
Dimensões
4
APOIO
SEMÂNTICO
3
ARMAZENAMENTO
6
Taxonomia de Proveniência
Eager
Lazy
Ah-hoc
Manual
Automatica
Workflow
Atividade
S.O.
Tracing
Externa
Interna
Nível
Inversão
Mecanismo
Relacional
Semântica
XML
Anotação
QBE
Técnica
Captura
API
Consulta
Acesso
Ontologia
Apoio
Semântico
Proveniência
Domínio
Tarefa
Aplicação
Taxonomia
Vocabulário
Objeto
Orientação
Armazenamento
Granulosidade
Fina
Grossa
Processo
Dado
Etapa
Composição (Prospectiva)
Execution (Retrospectiva)
Análise (Analítica)
Escalabilidade
Acoplamento
Arquivamento
Seqs de Delta
Centralizado
Distribuído
Heterogêneo
Homogêneo
Adaptado de CRUZ et al. (2011, 2012)
Time-Stamp
Nenhum
Baixo
Alto
Persistência
Relacional
XML
OWL
Semiestruturado
7
Proveniência e Web Semântica
Fonte: http://www.w3.org/TR/prov-o/ (2013)
8
PROV-O
agent
activity
entity
Fonte: http://www.w3.org/TR/prov-o/ (2013)
Estratégia
Ontologia OvO
• Open Provenance Ontology (OvO) é ontologia de domínio:
1.
2.
3.
4.
5.
6.
Bem fundamentada, ancorada na UFO e PROV
Modular e flexível adaptar às exigências específicas dos
diferentes domínios de aplicação.
Contempla granulosidades da proveniência distintas;
Submetida ao processo de engenharia ontológica;
Modelada através de uma linguagem ontológica (OLED) ;
Voltada para a proveniência da área de e-Ciência,
•
Não incorpora conceitos específicos sobre os domínios dos
experimentos;
Benefícios...
– Adota Padrão aberto; fácil de ser manipulado e compreendido por
profissionais de perfis variados;
– Clareza, coerência, extensibilidade,
– Semântica formal bem definida.
– Extensível por outras ontologias específicas do domínio do experimento.
10
Fonte: UFO (Guizzrdi, 2005..2015)
Ontologia OvO
• A OvO foi dividida em três sub-ontologias, a
saber:
1. Sub-ontologia de experimentos científicos em
larga escala;
2. Sub-ontologia de proveniência prospectiva;
3. Sub-ontologia de proveniência retrospectiva;
OvO foi originalmente concebida sobre o Fragmento UFO-A, no momento
está sendo reestruturada (UFO-B, UFO-C, ...)
Adaptado de CRUZ et al. (2011, 2012)
11
Sub-Ontologia de Experimentos
Científicos em Larga Escala
Conceitos de maior
granulosidade não
contemplados nas demais
ontologias de proveniência
(ex. experimentos científicos,
hipótese, modelos, projeto,
agentes, fases)
Legenda
Prospectivo
Adaptado de CRUZ et al. (2011, 2012)
12
Retrospectivo
Sub-Ontologia de Proveniência
Prospectiva
Conceitos de
granulosidade grossa
correlacionando o
workflow e
atividades.
Também representa
os papéis e relações
desempenhados
pelos agentes na
etapa de composição
do experimento;
13
Adaptado de CRUZ et al. (2011, 2012)
Sub-Ontologia de Proveniência
granulosidade
Retrospectiva
Conceitos de menor
associados à etapa de
execução do
experimento.
Adaptado de CRUZ et al. (2011, 2012)
14
Cenário de E-Science no Agronegócio
15
adaptado de LEMOS FILHO et al. (2012, 2013, 2014), E-Science BARBOSA et al. (2014) IPAW
Caso 1: Agronegócio (Clima)
Dezenas de estações (região Sul Fluminense).
Longas séries (>= 20 anos de dados)
Erros e falhas nas séries
1
16
17
adaptado de REICHE, CRUZ, CAMPOS . (2014) ISBBD
adaptado de VIANNA e CRUZ (SBIAGRO e BRACIS 2013) NUNES et al. (2014) IPAW e NUNES et al (ERSI 2104)
Caso 2: Agronegócio (lavoura)
Computação Semântica em EScience
Agradecimentos
Profa. Maria Luiza Machado Campos
Profa. Maria Claudia Cavalcanti (Yoko)
Profa. Marta Mattoso
Profa. Gizele Vianna
Profa. Margarida Goréte do Carmo
Profa. Ana Claúdia Vieira
Prof. Giancarlo Guizzardi
Prof. Antônio Carlos de S. Abboud
Prof. Alberto Dávila
Prof. Ednaldo Oliveira
Prof. Gustavo Lyra
Msc. Marden Marques
Msc. Fabio Cardozo
Msc. José Antonio Nascimento
Tec. Agric. Pedro Vieira Cruz
Agric. Campo Experimental UFRRJ
Alunos do PET-SI e do PPGMMC/UFRRJ
Sérgio Serra
OBRIGADO PELA ATENÇÃO
[email protected]
PROPAGANDA
• 9º BRESCI (Brazilian e-Science Workshop) da XXXV CSBC
• Deadline: 16 de Abril  Enviem seus trabalhos!
http://csbc2015.cin.ufpe.br/
19
Jogo dos 7 erros da proveniência
20
Download

Computação Semântica em E-Science