Desenvolvimento de
Sistemas OLAP
Cláudia Tomaz
Modelagem Multidimensional
É uma técnica de concepção e
visualização de um modelo de dados de
um conjunto de medidas que descrevem
aspectos comuns de negócios.
 Formado por três elementos básicos

◦ Fatos
◦ Dimensões
◦ Medidas
Modelagem Multidimensional

Fatos
◦ É uma coleção de itens de dados , composta de
dados de medidas e de contexto.
◦ Cada fato representa um item, uma transação ou
um evento de negócio e é utilizado para analisar
o processo de negócio de uma empresa.
◦ Tudo aquilo que reflete a evolução dos negócios
do dia a dia de uma organização.
◦ A característica básica de um fato é que ele é
representado por valores numéricos.
Modelagem Multidimensional

Dimensões
◦ Conceitualmente são os elementos que
participam de um fato, assuntos de negócio.
◦ São as possíveis formas de visualizar os dados, ou
seja, são os “por” dos dados: “por mês”, “por
país”, “por produto”, “por região”, etc.
◦ As dimensões determinam o contexto de um
assunto de negócios, por exemplo, um banco de
dados que, que analise vendas de produtos...
Modelagem Multidimensional

Dimensões
◦ As dimensões deste banco comumente serão:





Tempo,
Localização
Clientes,
Vendedores
Cenários (realizado, projetado)
◦ Dimensões normalmente não possuem atributos
numéricos, pois são somente descritivas e
classificatórias dos elementos que participam de
um fato.
Modelagem Multidimensional

Membros de uma dimensão
◦ Uma dimensão pode conter muitos membros.
◦ Um membro de dimensão é um nome
diferente utilizado para determinar a posição
de um item de dado.
◦ Por exemplo, todas as ocorrências de ano,
trimestre e mês fazem a dimensão tempo e
todas as cidades, estados e regiões fazem a
dimensão geográfica.
Modelagem Multidimensional

Membros de uma dimensão
◦ Hierarquia de uma dimensão é uma classificação de
dados dentro de uma dimensão. Nós arranjamos os
membros de uma dimensão em uma ou mais
hierarquias.
Hierarquia 1
Hierarquia 2
Ano
Trimestre
Mês
Dia
Semestre
Bimestre
Modelagem Multidimensional

Medidas
◦ Medidas são os atributos numéricos que
representam um fato, a performance de um
indicador de negócios relativo às dimensões que
participam deste fato.
◦ Os números atuais são denominados de variáveis.
Por exemplo, medidas são o valor em reais das
vendas, o número de unidades de produtos
vendidas, a quantidade em estoque, o custo de
venda, etc.
◦ Uma medida é determinada pela combinação das
dimensões que participam de um fato, e estão
localizadas como atributos de um fato.
Modelagem Multidimensional

Pontos de Decisão – segundo Kimball – nove pontos fundamentais
no projeto da estrutura de um Datawarehouse:
◦
◦
◦
◦
◦
◦
◦
Os processos e, por consequência, a identidade das tabelas de fatos;
A granularidade das tabelas de fatos;
As dimensões de cada tabela de fatos;
Os fatos, incluindo fatos pré-calculados;
Os atributos das dimensões;
Como acompanhar mudanças graduais em dimensões;
As agregações, dimensões heterogêneas, minidimensões e outra
decisões de projeto físico;
◦ Duração histórica do banco de dados do Datawarehouse;
◦ A frequência com que se dão a extração e carga para do
Datawarehouse.

Kimball recomenda que estas definições se façam na ordem citada.
(Metodologia Top Down)
Modelagem Multidimensional

O caminho mais popular para visualização
de um modelo multidimensional é o
desenho de um cubo.
Modelagem Multidimensional
Modelagem Multidimensional

Modelo Star ou Estrela
◦ É a estrutura básica de um modelo de dados
multidimensional
◦ Sua composição típica possui uma grande
entidade central denominada fato (fact table)
e um conjunto de entidades menores
denominadas dimensões (dimension tables),
arranjadas ao redor dessa entidade central,
formando uma estrela, como mostra a figura a
seguir.
Modelagem Multidimensional
Dimensão
Tempo
Dimensão
Dimensão
Cliente
Região
Fatos de
Vendas
Dimensão
Vendedor
Dimensão
Produto
Modelagem Multidimensional

FATOS:
Na figura, o centro da estrela é o fato Vendas, e ao seu redor dispostas
estão as dimensões que participam deste fato: vendedor, cliente, produto,
região e tempo.
 O que são fatos?
 É tudo aquilo que pode ser representado por um valor aditivo, ou melhor,
por meio de valores numéricos. Este conjunto de valores numéricos é
denominado de métricas ou medidas.
 Outra característica importante, é que os fatos são evolutivos. Mudam suas
medidas com o tempo, podendo ser sempre questionado sobre essa
evolução ao longo de um espaço de tempo.

◦ “ O consumo de bebidas alcoólicas aumentou no Brasil de 1998 a 1999”
◦ “Os índices de criminalidade aumentaram no ano atual de 50% sobre os últimos anos”.
◦
◦
◦
◦
Participação
Performance
Evolução
Índice de
Modelagem Multidimensional
DIMENSÕES:
 O que são Dimensões?
 São os elementos, as entidades que participam de algum
fato, o “por” dos dados.
 Vamos apresentar algumas situações envolvendo a
aplicação dos quatro pontos cardeais de um fato.

Quando?
Onde?
Compra
Quem?
O que?
Modelagem Multidimensional

DIMENSÕES:
◦ Toda ocorrência de uma compra envolve no
mínimo quatro elementos participantes:




Quando a compra foi realizada;
Onde foi realizada a compra;
Quem realizou a compra;
O que foi comprado.
◦ Logo, temos quatro dimensões envolvidas
neste fato.
Modelagem Multidimensional

DIMENSÕES:
◦ Exemplos:
 Quanto comprou em setembro de 1999 nas lojas
Tamancão de Ouro, o comprador Felipe, em
produtos de calçados?
 Temos neste caso uma análise de quatro dimensões:




Onde: Tamancão de Ouro
Quando: Setembro de 1999
Quem: Felipe
O que: Calçados
Modelagem Multidimensional

DIMENSÕES:
◦ A Dimensão Tempo
 Possui importância acentuada em todo modelo de
dados de um Data Mart.
 É a única dimensão presente em qualquer tipo de
Data Mart.
 A dimensão tempo estabelece os limites das
chamadas janelas de tempo de existência de dados.
 É uma hierarquia de espaços de tempo. Por
exemplo
 Ano, trimestre, mês, semana, dia.
Modelagem Multidimensional
Modelagem Multidimensional
Download

Aula 4