Uma proposta para OLAP ontológica Adriana Ribeiro Roteiro OLAP Problema Solução Uso de ontologia Resultados esperados Aplicação OLAP On-Line Analytical Processing (OLAP) é uma categoria de software específica para realizar consultas multidimensionais sobre dados previamente agregados e materializados que são extraídos do DW [CCS93]. Análise multidimensional Representa os dados como dimensões em vez de tabelas. A melhor maneira de visualizar essa estrutura é através de uma representação utilizando um cubo. Função do OLAP Apoiar o usuário na análise dos dados. Componentes do Cubo OLAP Fatos; Dimensões; Medidas; Membro; Hierarquia; Fatos Representa uma coleção de dados relacionados, consistindo de medidas e dados de contexto. Cada fato tipicamente representa o registro de um item de negócio, de uma transação comercial ou de um evento que pode ser usado para se analisar o negócio [Ner06] Ex: produção, vendas, compras. Dimensões Determina o contexto dos fatos e contém as informações descritivas sobre as quais se deseja realizar análises. Em uma base de dados contendo informações sobre as vendas de produtos Ex: Tempo, Localização, Cliente, Vendedor. Dimensões no Cubo adaptado de [Fid03] Medidas Corresponde a um atributo numérico de um fato, representando o desempenho ou comportamento do fato em relação a um determinado conjunto de dimensões. Ex: vendas em termos monetários (faturamento), o volume de vendas, o custo de venda e o valor de uma transação. Membro Corresponde a um elemento usado para determinar um dado de uma dimensão. Ex: o mês de janeiro, o 1º trimestre de 2007 e o ano de 2007 são exemplos de membros da dimensão tempo. Hierarquia Organiza os membros de uma dimensão em vários níveis hierárquicos. Os níveis de uma hierarquia definem uma granularidade ao fato em análise. Brasil Membros Ex: País Nordeste Região Bahia Estado Níveis Ilhéus Município Eixos Exemplo 2005 P.A P.B 2006 P.C P.A P.B P.C PB 100 50 10 500 70 20 PE 20 50 5 30 20 50 BA 300 50 1 100 100 30 Célula(onde existem medidas) Operadores OLAP Roll-up; Drill-down; Slice & dice. Roll up O usuário aumenta o nível de granularidade, diminuindo o nível de detalhamento. 1999 PE PB Trim1 Trim2 Trim3 Trim4 78 90 67 67 20 10 15 30 Roll up na Dimensão Tempo PE PB Janeiro 30 28 Trimestre 1 Fevereiro Março 26 22 30 30 Drill Down O usuário aumenta o nível de detalhe da informação, diminuindo o nível de granularidade. PE PB Telefone Celular 2001 2002 2000 5000 3000 1000 Computadores 2001 2002 800 5000 600 6000 Drill Down na dimensão localização geográfica Recife João Pessoa Telefone Celular Computadores 2001 2002 2001 2002 2000 5000 800 5000 3000 1000 600 6000 Slice and Dice O foco do usuário é transferido para uma camada de dados particular ou subcubo de dados, respectivamente, pela secção do cubo em fatias ou pela extração de um subconjunto de dados agregados, fixandose valores de dimensão. Slice and Dice Telefone Celular 2001 2002 2003 2004 Recife 2000 5000 800 5000 João Pessoa 3000 1000 600 6000 Definição do Problema Uma ferramenta OLAP, possibilita a análise multidimensional de dados, para auxiliar a tomada de decisão, mas não extrai conhecimento. Solução Extrair informação em ferramentas OLAP com o auxílio de ontologias. Onde aplicar ontologias? ? [Fid03] Resultados Esperados Integração de ontologia em OLAP para extração de informações relevantes para a tomada de decisão. Aplicação Describing Data Sources Semantically for Facilitating Efficient Creation of OLAP Cubes. Describing Data Sources Semantically for Facilitating Efficient Creation of OLAP Cubes Objetivo: Integrar várias bases de dados utilizando ontologia para que uma ferramenta OLAP possa acessá-las. Describing Data Sources Semantically for Facilitating Efficient Creation of OLAP Cubes O sistema localiza as fontes de dados O sistema sugere como os O dados ser manipulados Ousuário usuário pode baseadas emdevem descrições RDFou conforme inicia aaceitar análise definindo É então construído o cubo OLAP antes de armazenagem para o cubo OLAP. Istonecessários. inclui, por modificar opelo design sugerido a área solicitada usuário e constrói quais dados serão exemplo, por causa das medida ummodificações esquema lógico para diferente o Cubo OLAP, unidades ou moedas.sugerindo o design para o usuário. [TN04] Referências [CCS93] E.F. Codd, S.B. Codd, C.T. Salley, Providing OLAP (online analytical processing) to user-analysts: an IT mandate, Technical Report, In E. F. Codd & Associates,1993. [Fid00]R. Fidalgo, JDCI: Uma API Java para Disponibilização e integração de serviços OLAP. [CWM03] OMG: Common Warehouse Metamodel (CWM) Specification 1.1, 2003. [Ner06] F. Nery, Tecnologia e Projeto de Data Warehouse, pag.79-95, 2006. [TN04] S. Toivonen, T. Niemi, Describing Data Sources Semantically for Facilitating Efficient Creation of OLAP Cubes, 3rd International Semantic Web Conference (ISWC2004), 2004.