Data Warehouse
Debora Marrach
Renata Miwa Tsuruda
Data Warehouse
Gerência de Mudança
Agenda
 Matriz de barramento
 Controles em data staging area
 Manutenção em dimensões
 Novas dimensões
 Novos atributos
 Atributos já existentes
 Dimensões que mudam lentamente
 Dimensões que mudam rapidamente
Data Warehouse
Gerência de Mudança
Agenda
Novos fatos medidos
 Alteração no grão dos fatos
 Adição de uma nova fonte de dados

Data Warehouse
Gerência de Mudança
Agenda
 Matriz de barramento
 Controles em data staging area
 Manutenção em dimensões
 Novas dimensões
 Novos atributos
 Atributos já existentes
 Dimensões que mudam lentamente
 Dimensões que mudam rapidamente
Data Warehouse
Gerência de Mudança
Matriz de barramento
Verificar a matriz de barramento
a fim de verificar
o impacto da mudança no DW
caso as alterações afetem
dimensões em conformidade.
Data Warehouse
Gerência de Mudança
Matriz de barramento
Data Warehouse
Gerência de Mudança
Matriz de barramento
(dimensões em conformidade)
A autoridade de dimensão tem a responsabilidade de
definir, manter e publicar uma dimensão específica
ou seus subconjuntos para todos os clientes dos
data marts que precisarem dela.
Data Warehouse
Gerência de Mudança
Matriz de barramento
(dimensões em conformidade)
A autoridade de dimensão tem a responsabilidade
pelo processo de ETL da
dimensão padrão mais importante.
Data Warehouse
Gerência de Mudança
Agenda
 Matriz de barramento
 Controles em data staging area
 Manutenção em dimensões
 Novas dimensões
 Novos atributos
 Atributos já existentes
 Dimensões que mudam lentamente
 Dimensões que mudam rapidamente
Data Warehouse
Gerência de Mudança
Controles da Data Staging Area
Verificar se a mudança afeta a
tabela de referência cruzada na data staging area
que controla a chave substituta
atribuída a uma chave operacional
em um determinado momento.
Data Warehouse
Gerência de Mudança
Controles da Data Staging Area
Caso a mudança afete a
a tabela de referência cruzada
rastrear o impacto desta mudança
nas tabelas de fatos e dimensões afetadas.
Data Warehouse
Gerência de Mudança
Agenda
 Matriz de barramento
 Controles em data staging area
 Manutenção em dimensões
 Novas dimensões
 Novos atributos
 Atributos já existentes
 Dimensões que mudam lentamente
 Dimensões que mudam rapidamente
Data Warehouse
Gerência de Mudança
Novas dimensões
Adicione a nova dimensão
incluindo a chave correspondente
á tabela de fatos existente.
Data Warehouse
Gerência de Mudança
Agenda
 Matriz de barramento
 Controles em data staging area
 Manutenção em dimensões
 Novas dimensões
 Novos atributos
 Atributos já existentes
 Dimensões que mudam lentamente
 Dimensões que mudam rapidamente
Data Warehouse
Gerência de Mudança
Novos atributos em dimensões
Adicionar os novos atributos
atualizando seus conteúdos para as
tuplas já existentes com um conteúdo default
indicando se a tupla foi gerada anteriormente á
inclusão do atributo.
Data Warehouse
Gerência de Mudança
Agenda
 Matriz de barramento
 Controles em data staging area
 Manutenção em dimensões
 Novas dimensões
 Novos atributos
 Atributos já existentes
 Dimensões que mudam lentamente
 Dimensões que mudam rapidamente
Data Warehouse
Gerência de Mudança
Manutenção em atributos já existentes
nas dimensões


Dimensões que mudam lentamente
Dimensões que mudam rapidamente
Data Warehouse
Gerência de Mudança
Manutenção em atributos das dimensões
que mudam lentamente
1. Substitua o valor
Simplesmente substitua em toda a tabela,
o valor antigo pelo novo.
Data Warehouse
Gerência de Mudança
Manutenção em atributos das dimensões
que mudam lentamente
1.
Substitua o valor
Chave do
Descrição do
produto
produto
Antes
12345
IntelliKids
Educação
ABC922-Z
Depois
12345
IntelliKids
Estratégia
ABC922-Z
Departamento
Número da SKU
(chave natual)
Observar que isso acarretará a perda de todo histórico
do atributo.
Data Warehouse
Gerência de Mudança
Manutenção em atributos das dimensões
que mudam lentamente
2.
Adicione uma linha na tabela de dimensão
Para a mesma chave natural,
criar outra chave substitua
contendo o novo conteúdo do atributo.
Data Warehouse
Gerência de Mudança
Manutenção em atributos das dimensões
que mudam lentamente
2.
Adicione uma linha na tabela de dimensão
Chave do
Descrição do
produto
produto
12345
IntelliKids
Educação
ABC922-Z
25984
IntelliKids
Estratégia
ABC922-Z
Departamento
Número da SKU
(chave natual)
Cada uma das chaves substitutas identifica um perfil de
atributo, o qual era verdadeiro por um período de tempo
Data Warehouse
Gerência de Mudança
Manutenção em atributos das dimensões
que mudam lentamente
Atributos de data efetiva e data de vencimento são
necessários na data staging area
Chave do
Descrição do
produto
produto
12345
IntelliKids
Educação
ABC922-Z
25984
IntelliKids
Estratégia
ABC922-Z
Departamento
Número da SKU
(chave natual)
Precisamos saber qual chave substituta é válida
quando estamos carregando registros de fatos históricos.
Data Warehouse
Gerência de Mudança
Manutenção em atributos das dimensões
que mudam lentamente
3. Adicione uma coluna de dimensão
Incluir uma coluna para o conteúdo anterior,
armazenando assim os
conteúdos anterior e atual.
Data Warehouse
Gerência de Mudança
Manutenção em atributos das dimensões
que mudam lentamente
3.
Adicione uma coluna de dimensão
Chave do
Descrição do Departamento Departamento Número da SKU
produto
produto
Atual
Anterior
(chave natual)
12345
IntelliKids
Estratégia
Educação
ABC922-Z
O tipo 3 é apropriado quando há uma forte necessidade de
utilizar dos modos de visão do mundo ao mesmo tempo.
Data Warehouse
Gerência de Mudança
Manutenção em atributos das dimensões
que mudam lentamente
Ainda se pode combinar as estratégias
de manutenção do atributo,
utilizando-se em conjunto das três já descritas
possibilitando manter
todo o histórico do conteúdo do atributo.
Data Warehouse
Gerência de Mudança
Manutenção em atributos das dimensões
que mudam lentamente
a) Na primeira necessidade de modificação,
utilize a técnica 3 adicionando uma coluna na tabela de
dimensão controlando assim os conteúdos anterior e
atual.
Chave do
Descrição do Departamento Departamento Número da SKU
produto
produto
Atual
Anterior
(chave natual)
12345
IntelliKids
Educação
Educação
ABC922-Z
Data Warehouse
Gerência de Mudança
Manutenção em atributos das dimensões
que mudam lentamente
b) Na segunda e subsequentes modificações, utilize a
técnica 2 adicionando uma linha na tabela de dimensão
registrando o valor atual
Chave do
Descrição do Departamento Departamento Número da SKU
produto
produto
Atual
Anterior
(chave natual)
12345
IntelliKids
Estratégia
Educação
ABC922-Z
25984
IntelliKids
Estratégia
Estratégia
ABC922-Z
Data Warehouse
Gerência de Mudança
Manutenção em atributos das dimensões
que mudam lentamente
c) Utilize a técnica 1 substituindo conteúdo de todas as
linhas para o valor atual.
Chave do
Descrição do
Departamento
Departamento
Número da SKU
produto
produto
Atual
Anterior
(chave natual)
12345
IntelliKids
Pensamento
Educação
ABC922-Z
Estratégia
ABC922-Z
Pensamento
Pensamento
ABC922-Z
crítico
crítico
crítico
25984
IntelliKids
Pensamento
crítico
31726
IntelliKids
Data Warehouse
Gerência de Mudança
Agenda
 Matriz de barramento
 Controles em data staging area
 Manutenção em dimensões
 Novas dimensões
 Novos atributos
 Atributos já existentes
 Dimensões que mudam lentamente
 Dimensões que mudam rapidamente
Data Warehouse
Gerência de Mudança
Manutenção em atributos das dimensões
que mudam rapidamente
Uma abordagem eficiente para tratar de
dimensões que mudam mais rapidamente é
separar esses atributos que mudam rapidamente
em uma ou mais dimensões.
Data Warehouse
Gerência de Mudança
Manutenção em atributos das dimensões
que mudam rapidamente
A solução é dividir em
uma dimensão separada ou em uma minidimensão
os atributos que estão sendo alterados
constantemente.
Data Warehouse
Gerência de Mudança
Manutenção em atributos das dimensões
que mudam rapidamente
Quando se cria a minidimensão,
atributos que variam com frequência devem ser
convertidos em faixas de associação assumindo
um número relativamente pequeno de valores
discretos.
Data Warehouse
Gerência de Mudança
Manutenção em atributos das dimensões
que mudam rapidamente
Minidimensão com faixa de valores
Chave de
dados
Idade
Sexo
Renda familiar
1
20-24
Masculino
< US$ 20.000
2
20-24
Masculino
US$ 20.000 -> 24.999
3
20-24
Masculino
US$ 25.000 -> 29.999
18
25-29
Masculino
US$ 20.000 -> 24.999
19
25-29
Masculino
US$ 25.000 -> 29.999
demográficos
Data Warehouse
Gerência de Mudança
Agenda
Novos fatos medidos
 Alteração no grão dos fatos
 Adição de uma nova fonte de dados

Data Warehouse
Gerência de Mudança
Novos fatos medidos
Quando os novos fatos possuem a
mesma granularidade dos já existentes,
simplesmente adicioná-los à tabela de fatos.
Data Warehouse
Gerência de Mudança
Novos fatos medidos
Quando a granularidade dos novos fatos
forem diferentes dos já existentes,
verificar a possibilidade de uma fórmula de alocação
dos novos valores para o grão existente.
Caso isso não seja possível, verifique modelá-los
em uma nova tabela de fatos.
Data Warehouse
Gerência de Mudança
Agenda
Novos fatos medidos
 Alteração no grão dos fatos
 Adição de uma nova fonte de dados

Data Warehouse
Gerência de Mudança
Alteração no grão dos fatos
A dimensão mais granular muitas vezes
implica uma tabela de fatos mais granular.
Pode não haver alternativa,
a não ser descartar a tabela de fatos e reconstruí-la.
Data Warehouse
Gerência de Mudança
Agenda
Novos fatos medidos
 Alteração no grão dos fatos
 Adição de uma nova fonte de dados

Data Warehouse
Gerência de Mudança
Adição de uma nova fonte de dados
Quase sempre,
uma nova fonte de dados possui sua
própria granularidade e dimensionalidade,
então criamos uma nova tabela de fatos.
Data Warehouse
Gerência de Mudança
Fim
Download

Data Warehouse Toolkit Contabilidade