Computação Semântica em E-Science Sérgio Serra PPGMMC/UFRRJ & PET-SI /UFRRJ [email protected] Agenda • • • • • Motivação Proveniência Ciclo de Vida x Semântica Ontologias de Proveniência E-Science no Agronegócio Motivação 22. Dados são pré-analisados com o programa X em cluster do lab I Recursos Científicos (DADOS) + Proveniência 11. Experimento em larga escala realizado pelos cientistas A e B no lab. 1 33. Grande quantidade de dados gerada... 55. Os resultado são analisados Pelo programa Z pelo cientista C no lab. II 66 A pesquisa é publicada adaptado de (MATTOSO, CRUZ et al., 2008, CRUZ 2011), Tutorial SBBD. 4 ...precisa ser 4. processada por programas K, L e M numa nuvem3 de computadores Proveniência • Comum a várias áreas; • Gerência da proveniência suscita muitas pesquisas em eCiência e BD; • Várias definições (SIMMHAN et al., 2005, SRIVASTAVA, VELEGRAKIS, 2007, FREIRE et al., 2008, CHENEY et al., 2009, CRUZ et al, 2009,CHAPMAN, JAGADISH, 2010); Proveniência são metadados sistematicamente coletados e armazenados; auxiliam na determinação da história de um artefato através da evolução de processos, desde sua origem até seu destino final (BUNEMAN, 2001) 4 Proveniência na E-Ciência • Reprodutibilidade e interpretação de resultados • Verificar se um experimento obedece aos protocolos • Rastreamento, Transparência, Auditoria • Assegurar a qualidade dos dados e processos Provenance is as (or more) importante as the results (FREIRE & DAVIDSON, SIGMOD, 2008) 5 Visão integrada do ciclo de vida centrado em proveniência 5 1 CAPTURA 2 OBJETO 5 ACESSO e REUSO Dimensões 4 APOIO SEMÂNTICO 3 ARMAZENAMENTO 6 Taxonomia de Proveniência Eager Lazy Ah-hoc Manual Automatica Workflow Atividade S.O. Tracing Externa Interna Nível Inversão Mecanismo Relacional Semântica XML Anotação QBE Técnica Captura API Consulta Acesso Ontologia Apoio Semântico Proveniência Domínio Tarefa Aplicação Taxonomia Vocabulário Objeto Orientação Armazenamento Granulosidade Fina Grossa Processo Dado Etapa Composição (Prospectiva) Execution (Retrospectiva) Análise (Analítica) Escalabilidade Acoplamento Arquivamento Seqs de Delta Centralizado Distribuído Heterogêneo Homogêneo Adaptado de CRUZ et al. (2011, 2012) Time-Stamp Nenhum Baixo Alto Persistência Relacional XML OWL Semiestruturado 7 Proveniência e Web Semântica Fonte: http://www.w3.org/TR/prov-o/ (2013) 8 PROV-O agent activity entity Fonte: http://www.w3.org/TR/prov-o/ (2013) Estratégia Ontologia OvO • Open Provenance Ontology (OvO) é ontologia de domínio: 1. 2. 3. 4. 5. 6. Bem fundamentada, ancorada na UFO e PROV Modular e flexível adaptar às exigências específicas dos diferentes domínios de aplicação. Contempla granulosidades da proveniência distintas; Submetida ao processo de engenharia ontológica; Modelada através de uma linguagem ontológica (OLED) ; Voltada para a proveniência da área de e-Ciência, • Não incorpora conceitos específicos sobre os domínios dos experimentos; Benefícios... – Adota Padrão aberto; fácil de ser manipulado e compreendido por profissionais de perfis variados; – Clareza, coerência, extensibilidade, – Semântica formal bem definida. – Extensível por outras ontologias específicas do domínio do experimento. 10 Fonte: UFO (Guizzrdi, 2005..2015) Ontologia OvO • A OvO foi dividida em três sub-ontologias, a saber: 1. Sub-ontologia de experimentos científicos em larga escala; 2. Sub-ontologia de proveniência prospectiva; 3. Sub-ontologia de proveniência retrospectiva; OvO foi originalmente concebida sobre o Fragmento UFO-A, no momento está sendo reestruturada (UFO-B, UFO-C, ...) Adaptado de CRUZ et al. (2011, 2012) 11 Sub-Ontologia de Experimentos Científicos em Larga Escala Conceitos de maior granulosidade não contemplados nas demais ontologias de proveniência (ex. experimentos científicos, hipótese, modelos, projeto, agentes, fases) Legenda Prospectivo Adaptado de CRUZ et al. (2011, 2012) 12 Retrospectivo Sub-Ontologia de Proveniência Prospectiva Conceitos de granulosidade grossa correlacionando o workflow e atividades. Também representa os papéis e relações desempenhados pelos agentes na etapa de composição do experimento; 13 Adaptado de CRUZ et al. (2011, 2012) Sub-Ontologia de Proveniência granulosidade Retrospectiva Conceitos de menor associados à etapa de execução do experimento. Adaptado de CRUZ et al. (2011, 2012) 14 Cenário de E-Science no Agronegócio 15 adaptado de LEMOS FILHO et al. (2012, 2013, 2014), E-Science BARBOSA et al. (2014) IPAW Caso 1: Agronegócio (Clima) Dezenas de estações (região Sul Fluminense). Longas séries (>= 20 anos de dados) Erros e falhas nas séries 1 16 17 adaptado de REICHE, CRUZ, CAMPOS . (2014) ISBBD adaptado de VIANNA e CRUZ (SBIAGRO e BRACIS 2013) NUNES et al. (2014) IPAW e NUNES et al (ERSI 2104) Caso 2: Agronegócio (lavoura) Computação Semântica em EScience Agradecimentos Profa. Maria Luiza Machado Campos Profa. Maria Claudia Cavalcanti (Yoko) Profa. Marta Mattoso Profa. Gizele Vianna Profa. Margarida Goréte do Carmo Profa. Ana Claúdia Vieira Prof. Giancarlo Guizzardi Prof. Antônio Carlos de S. Abboud Prof. Alberto Dávila Prof. Ednaldo Oliveira Prof. Gustavo Lyra Msc. Marden Marques Msc. Fabio Cardozo Msc. José Antonio Nascimento Tec. Agric. Pedro Vieira Cruz Agric. Campo Experimental UFRRJ Alunos do PET-SI e do PPGMMC/UFRRJ Sérgio Serra OBRIGADO PELA ATENÇÃO [email protected] PROPAGANDA • 9º BRESCI (Brazilian e-Science Workshop) da XXXV CSBC • Deadline: 16 de Abril Enviem seus trabalhos! http://csbc2015.cin.ufpe.br/ 19 Jogo dos 7 erros da proveniência 20