Desenvolvimento de Sistemas OLAP Cláudia Tomaz Modelagem Multidimensional É uma técnica de concepção e visualização de um modelo de dados de um conjunto de medidas que descrevem aspectos comuns de negócios. Formado por três elementos básicos ◦ Fatos ◦ Dimensões ◦ Medidas Modelagem Multidimensional Fatos ◦ É uma coleção de itens de dados , composta de dados de medidas e de contexto. ◦ Cada fato representa um item, uma transação ou um evento de negócio e é utilizado para analisar o processo de negócio de uma empresa. ◦ Tudo aquilo que reflete a evolução dos negócios do dia a dia de uma organização. ◦ A característica básica de um fato é que ele é representado por valores numéricos. Modelagem Multidimensional Dimensões ◦ Conceitualmente são os elementos que participam de um fato, assuntos de negócio. ◦ São as possíveis formas de visualizar os dados, ou seja, são os “por” dos dados: “por mês”, “por país”, “por produto”, “por região”, etc. ◦ As dimensões determinam o contexto de um assunto de negócios, por exemplo, um banco de dados que, que analise vendas de produtos... Modelagem Multidimensional Dimensões ◦ As dimensões deste banco comumente serão: Tempo, Localização Clientes, Vendedores Cenários (realizado, projetado) ◦ Dimensões normalmente não possuem atributos numéricos, pois são somente descritivas e classificatórias dos elementos que participam de um fato. Modelagem Multidimensional Membros de uma dimensão ◦ Uma dimensão pode conter muitos membros. ◦ Um membro de dimensão é um nome diferente utilizado para determinar a posição de um item de dado. ◦ Por exemplo, todas as ocorrências de ano, trimestre e mês fazem a dimensão tempo e todas as cidades, estados e regiões fazem a dimensão geográfica. Modelagem Multidimensional Membros de uma dimensão ◦ Hierarquia de uma dimensão é uma classificação de dados dentro de uma dimensão. Nós arranjamos os membros de uma dimensão em uma ou mais hierarquias. Hierarquia 1 Hierarquia 2 Ano Trimestre Mês Dia Semestre Bimestre Modelagem Multidimensional Medidas ◦ Medidas são os atributos numéricos que representam um fato, a performance de um indicador de negócios relativo às dimensões que participam deste fato. ◦ Os números atuais são denominados de variáveis. Por exemplo, medidas são o valor em reais das vendas, o número de unidades de produtos vendidas, a quantidade em estoque, o custo de venda, etc. ◦ Uma medida é determinada pela combinação das dimensões que participam de um fato, e estão localizadas como atributos de um fato. Modelagem Multidimensional Pontos de Decisão – segundo Kimball – nove pontos fundamentais no projeto da estrutura de um Datawarehouse: ◦ ◦ ◦ ◦ ◦ ◦ ◦ Os processos e, por consequência, a identidade das tabelas de fatos; A granularidade das tabelas de fatos; As dimensões de cada tabela de fatos; Os fatos, incluindo fatos pré-calculados; Os atributos das dimensões; Como acompanhar mudanças graduais em dimensões; As agregações, dimensões heterogêneas, minidimensões e outra decisões de projeto físico; ◦ Duração histórica do banco de dados do Datawarehouse; ◦ A frequência com que se dão a extração e carga para do Datawarehouse. Kimball recomenda que estas definições se façam na ordem citada. (Metodologia Top Down) Modelagem Multidimensional O caminho mais popular para visualização de um modelo multidimensional é o desenho de um cubo. Modelagem Multidimensional Modelagem Multidimensional Modelo Star ou Estrela ◦ É a estrutura básica de um modelo de dados multidimensional ◦ Sua composição típica possui uma grande entidade central denominada fato (fact table) e um conjunto de entidades menores denominadas dimensões (dimension tables), arranjadas ao redor dessa entidade central, formando uma estrela, como mostra a figura a seguir. Modelagem Multidimensional Dimensão Tempo Dimensão Dimensão Cliente Região Fatos de Vendas Dimensão Vendedor Dimensão Produto Modelagem Multidimensional FATOS: Na figura, o centro da estrela é o fato Vendas, e ao seu redor dispostas estão as dimensões que participam deste fato: vendedor, cliente, produto, região e tempo. O que são fatos? É tudo aquilo que pode ser representado por um valor aditivo, ou melhor, por meio de valores numéricos. Este conjunto de valores numéricos é denominado de métricas ou medidas. Outra característica importante, é que os fatos são evolutivos. Mudam suas medidas com o tempo, podendo ser sempre questionado sobre essa evolução ao longo de um espaço de tempo. ◦ “ O consumo de bebidas alcoólicas aumentou no Brasil de 1998 a 1999” ◦ “Os índices de criminalidade aumentaram no ano atual de 50% sobre os últimos anos”. ◦ ◦ ◦ ◦ Participação Performance Evolução Índice de Modelagem Multidimensional DIMENSÕES: O que são Dimensões? São os elementos, as entidades que participam de algum fato, o “por” dos dados. Vamos apresentar algumas situações envolvendo a aplicação dos quatro pontos cardeais de um fato. Quando? Onde? Compra Quem? O que? Modelagem Multidimensional DIMENSÕES: ◦ Toda ocorrência de uma compra envolve no mínimo quatro elementos participantes: Quando a compra foi realizada; Onde foi realizada a compra; Quem realizou a compra; O que foi comprado. ◦ Logo, temos quatro dimensões envolvidas neste fato. Modelagem Multidimensional DIMENSÕES: ◦ Exemplos: Quanto comprou em setembro de 1999 nas lojas Tamancão de Ouro, o comprador Felipe, em produtos de calçados? Temos neste caso uma análise de quatro dimensões: Onde: Tamancão de Ouro Quando: Setembro de 1999 Quem: Felipe O que: Calçados Modelagem Multidimensional DIMENSÕES: ◦ A Dimensão Tempo Possui importância acentuada em todo modelo de dados de um Data Mart. É a única dimensão presente em qualquer tipo de Data Mart. A dimensão tempo estabelece os limites das chamadas janelas de tempo de existência de dados. É uma hierarquia de espaços de tempo. Por exemplo Ano, trimestre, mês, semana, dia. Modelagem Multidimensional Modelagem Multidimensional