13/03/2012
Faculdade
Pitágoras
Unidade 2.2
Curso Superior de Tecnologia:
Banco de Dados
Disciplina: Ferramentas para
Tomada de Decisão
2 DataWarehouse
2.2 Fases de um projeto de DataWarehouse e Data Marts
Prof.: Fernando Hadad Zaidan
ACOMPANHAMENTO
CONTACTO
ÁREAS
DE NEGÓCIOS
9
1
8
PROJETO
DW/DM
7
6
TESTE
PLANEJAMENTO/ LEVANTAMENTO
DIFICULDADES DE INFORMAÇÃO GERENCIAL->OBJETIVO
INDICADORES ESTRATÉGICOS-MÉTRICAS INICIAIS
RESTRIÇÕES DE INFORMAÇÕES-ESTRUTURA-TECNOLOGIA
INFORMAÇÕES JÁ EXISTENTES NO DW-METADADOS
REUNIÕES JAD-PARTICIPAÇÃO INTENSA USUÁRIOS
DEFINIÇÃO DE PATROCINADOR
DEFINIÇÃO DE EQUIPE DE PROJETO
2
IMPLEMENTAÇÃO
5
4
ETC
• DEFINIR AS NECESSIDADES DE INFORMAÇÃO
PARA O NEGÓCIO:
• INDICADORES,MÉTRICAS,COMPARATIVOS
• SEMPRE OBSERVAR “DIMENSÕES”/COMBINAÇÕES
– MODELO DE DADOS EXISTENTES:
– ENTIDADES-RELACIONAMENTOS-ATRIBUTOS-(KEYS-ORIGINAISDERIVADOS)-PROPORÇÕES
PROJETO-MODELAGEM
DIMENSIONAL
PROJETO FÍSICO DW/DM
PROJETO OLAP
MINING
DEFINIÇÃO DO ETCEXTRAÇAÕ-TRANSFORMAÇÃO-CARGA
LEVANTAMENTO DE NECESSIDADES
– DIFICULDADES-RESTRIÇÕES SUGEREM OBJETIVOS
REUNIÕES DE TRABALHO
DETALHAMENTO DE
NECESSIDADES
DIMENSÕES-FATOS
MÉTRICAS-GRANULARIDADE
3
CONSTRUÇÃO
Fonte: Carlos Barbieri
2
CUBOS
RELATÓRIOS
ANALÍTICOS
INFERENCIAIS
MODELAGEM DIMENSIONAL
• TABELAS FATOS
– MÉTRICAS E VALORES
• TABELAS DIMENSÃO
3
– ARQUIVOS, DADOS MANUAIS EXISTENTES
4
Fonte: Carlos Barbieri
GRANULARIDADE
HIERARQUIA DE DIMENSÕES
MODELO DIMENSIONAL
CONCEITOS
DIMENSÃO
PRODUTO
PAIS
CATEGORIA
REGIÃO
SUB
CATEGORIA
ESTADO
PRODUTO
ANO
– TEXTOS, CAMPOS DIVERSOS
TRIM
CIDADE
Fonte: Carlos Barbieri
TABELAS
DIMENSÃO
5
LOJA
VENDAS
DIMENSÃO
GEOGRAFIA
MÉTRICAS:
•QUANTIDADE
•VALOR
Fonte: Carlos Barbieri
MES
TABELA
FATO
DIA
6
DIMENSÃO
TEMPO
1
13/03/2012
MODELAGEM DIMENSIONAL
ESTRUTURAS
MODELAGEM DIMENSIONAL
ESTRUTURAS
• SCHEMA ESTRELA:
– DIMENSÕES DESNORMALIZADAS
– VOLTADO PARA ACESSOS C/ PERFORMANCE
– HIERARQUIAS ACHATADAS
• SCHEMA SNOWFLAKE (flocos de neve):
–
–
–
–
TRADICIONAL+ E/R(TABELAS EM CASCATA)
NORMALIZADO
HIERAQUIAS MANTIDAS
MUITAS TABELAS-->MUITAS JUNÇÕES-1:N
• SCHEMA STARFLAKE
– COMBINAÇÃO DAS DUAS
– DIMENSÕES COM M X N COM OUTRAS TABELAS
SCHEMA ESTRELA
7
Fonte: Carlos Barbieri
MODELAGEM DIMENSIONAL
ESTRUTURAS
8
SCHEMA STARFLAKE
GALAXY – vários FATOS
SCHEMA SNOWFLAKE
SNOWFLAKE-TABELAS
NORMALIZADAS,
INDEPENDENTES, COM
JOIN
JOIN
PAIS
REGIÃO
9
10
MODELO DIMENSIONAL
CONCEITO STARFLAKE
MODELO DIMENSIONAL
CONCEITOS-II
DIMENSÃO
PRODUTO
CATEGORIA
SUB
PRODUTO
CATEGORIA
CATEGORIA
PAIS
CATEGORIA
REGIÃO
SUB
CATEGORIA
ESTADO
PRODUTO
DIMENSÃO
PRODUTO
ANO
CATEGORIA SUB
TRIM
ESTADO
PRODUTO
STAR SCHEMA-DADOS CONSOLIDADOS
NUMA MESMA TABELA
NÃO NORMALIZADA
EVITA JOIN
CIDADE
VENDAS
LOJA
LOJA
VENDAS
DIMENSÃO
GEOGRAFIA
MÉTRICAS:
•QUANTIDADE
•VALOR
Fonte: Carlos Barbieri
MÉTRICAS:
•QUANTIDADE
•VALOR
CIDADE
DIA
MXN
DIMENSÃO
GEOGRAFIA
11
MES
CLIENTE
DIMENSÃO
CLIENTE
Fonte: Carlos Barbieri
C/C
CARACTERISTICAS
DIMENSÃO
TEMPO
12
2
13/03/2012
GRANULARIDADE DE FATOS E
DADOS
MODELAGEM DIMENSIONAL
• TABELAS FATOS:
– NÍVEL ATÔMICO DE DADOS NA(S) ENTIDADE(S)/TABELA(S)
FATO/DIMENSÃO
– POSSIBILIDADES:
• CONTÉM VALORES(MÉTRICAS)
• PODEM TER VÁRIAS NO SCHEMA/DMART
– ESQUEMA MULTIFATO->N CUBOS
– CONCEITO DE CONFORMIDADE DE DIMENSÕES
• NÍVEL DE TRANSAÇÕES(DOCUMENTO-NF)
• NÍVEL DE ÍTEM DE UM DOCUMENTO (NF,OC, OEXPEDIÇÃO,
APÓLICE)
• TEMPO:
• PK=CONCATENAÇÃO DE FK DAS DIMENSÕES
• TABELAS DIMENSÕES
– NÍVEL DIÁRIO
– NÍVEL SEMANAL
– NÍVEL MENSAL, ETC
• PONTOS DE ENTRADA
• HIERARQUIAS-NÍVEIS DE QUEBRA
• GRANULARIDADE COERENTE COM FATO
• CONSIDERAÇÕES:
– VOLUMES DE DADOS
– NECESSIDADE DE INFORMAÇÕES P/ NEGÓCIO
– DISPONIBILIDADE DO DADO FONTE
13
Fonte: Carlos Barbieri
MODELO DIMENSIONAL
GRANULARIDADE
DIMENSÃO
GEOGRAFIA
PAIS
CATEGORIA
REGIÃO
SUB
CATEGORIA
DIMENSÕES
DIMENSÃO
PRODUTO
– PONTOS DE ENTRADAS DA ESTRUTURA
– DIMENSÕES E SEUS ATRIBUTOS SERVEM TAMBÉM COMO FILTROS E COMO
HEADER DOS RELATÓRIOS
– DIMENSÕES TÍPICAS:
•
•
•
•
•
ANO
PRODUTO
ESTADO
TRIM
MÉTRICAS:
•QUANTIDADE
•VALOR
CIDADE
X
LOJA
ITEM
NF
DIA
• MENOS=FALTOU OBSERVAÇÃO(TEMPO-ESPAÇO-TIPO)
• MAIS=DIMENSÕES SUPÉRFLUAS
– SÃO OS DESCRITORES DAS TFATOS
– CONCEITO DE SK (surrogate Key – chave sequencial) -INDEPENDÊNCIA
DIMENSÃO
TEMPO
GRANULARIDADE
MENOR
15
PRODUTO/SERVIÇO-O QUE VENDO
CLIENTE-QUEM COMPRA
TEMPO-QUANDO FOI FEITO A COMPRA
LOCAL(ARMAZÉM,LOJA,ETC)-ONDE
STATUS, PROMOÇÕES-CONDIÇÕES DA COMPRA
– DESCREVER TODOS OS ATRIBUTOS DAS DIMENSÕES
– DEVEM SER ATRIBUTOS DESCRITIVOS SEM CAMPOS NULOS
– NORMALMENTE UM DM TEM ENTRE 4-15 DIMENSÕES
MES
VENDAS
Fonte: Carlos Barbieri
DIMENSÕES
EM HIERARQUIAS
•
DIMENSÕES NORMALMENTE TEM HIERARQUIAS
HIERARQUIAS TEM NÍVEIS
NÍVEIS TEM MEMBROS(MEMBERS)
TIPOS DE HIERARQUIA-RELACIONAMENTOS 1:N
•
DIMENSÕES ESPECIAIS PODEM TER MÚLTIPLAS HIERARQUIAS. EXEMPLO:
TEMPO
TEMPO CALENDÁRIO NORMAL
– ANO->TRIMESTRE->MÊS->DIA
– COMEÇA EM JANEIRO
– BALANCEADA: N DIFERENTE DE ZERO EM TODOS OS NIVEIS-
•
– DESBALANCEADA: N PODE SER ZERO
•
• EX:ÓRGÃO->DIVISÃO(PODE TER ÓRGÃO SEM DIVISÃO)
• EX: PAIS-ESTADO-CIDADE-EM ISRAEL NÃO TEM ESTADO. EXISTE SOMENTE
CIDADE E PAIS
•
17
OS SERVIDORES OLAP TRATAM A DIMENSÃO TEMPO COMO ESPECIAL
– PODEM SER OBTIDAS DIRETAMENTE DE UMA FONTE SIMPLES-CAMPO DATA DE
UMA TABELA
– PODEM SER OBTIDAS DE UMA TABELA FONTE-DIMENSÃO TEMPO BEM
PROJETADA-COM DIA, FERIADOS,TAGS DE FIM DE SEMANA, ETC
– RAGGED: UM DO NÍVEIS PODE NÃO TER MEMBROS
– ESTADO: ASSUME CHAVE DO PAIS OU BRANCO
TEMPO CALENDÁRIO FISCAL
– ANO->TRIMESTRE->MÊS->DIA
– COMEÇA EM ABRIL
• EX: ANO->MÊS->DIA
Fonte: Carlos Barbieri
16
Fonte: Carlos Barbieri
DIMENSÕES
EM HIERARQUIAS
•
•
•
•
14
Fonte: Carlos Barbieri
NORMALMENTE DEFINE-SE TEMPO COMO UMA DIMENSÃO A SER
COMPARTILHADA COM OS CUBOS DO DMART
Fonte: Carlos Barbieri
18
3
13/03/2012
HIERARQUIAS
DIMENSÕES COMPARTILHADAS
PAÍS
2 HIERARQUIAS
•
SHIP TO
•
BILL TO
ESTADO
DIMENSÕES
CLIENTE
DIMENSÃO
TEMPO
CIDADE
ANO
VENDAS
TRIM
MES
CLIENTE
•
•
A DIMENSÃO É COMPARTILHADA ENTRE VÁRIOS PROJETOS DE DM/DW
A DIMENSÃO SIGNIFICA A MESMA COISA COM TODA AS TFATOS COM AS QUAIS SE
JUNTA(JOIN)-CONFORMIDADE
OS PROJETISTAS DO DW/DM DEVEM MANTER CATALOGADAS E DIFUNDIDAS ESSAS
DEFINIÇÕES
FUNDAMENTAL PARA A INTEGRAÇÃO ENTRE OS VÁRIOS “DMARTS”
AS DIMENSÕES -CONFORMES- NORMALMENTE SÃO DESENVOLVIDAS EM SUA
MAIOR GRANULARIDADE
•
•
•
–
–
–
DIA
ZONA
VENDA
PRODUTO
•
CALENDÁRIO NORMAL
CALENDÁRIO FISCAL
REGIÃO
VENDA
MARCA
TERRIT.
VENDAS
Fonte: Carlos Barbieri
19
DIMENSÃO TEMPO
•
•
(QUASE) SEMPRE PRESENTE NOS MODELOS DIMENSIONAIS
TABELA DIMENSÃO TEMPO PADRÃO:
– CHAVE DE DATA(PK)
– DATA-COMPLETA(01-01-2010)
– DIA-SEMANA(6A FEIRA)
– NÚMERO-DIA-MÊS(01)
– NÚMERO-DIA-GERAL(CORRIDO NO ANO)(01 a 365)
– NÚMERO-SEMANA-ANO(01 a 52)
– NÚMERO-SEMANA-GERAL(CORRIDO)
– MÊS
– NÚMERO-MÊS-GERAL(CORRIDO)
– TRIMESTRE
– PERÍODO-FISCAL
– TAG-DIA-SEMANA
– TAG-ÚLTIMO-DIA-MÊS
Fonte: Carlos Barbieri
NORMALMENTE CRIADA A PARTIR DE UM AMBIENTE ESPECIAL-EDITOR DE
DIMENSÕES-VALERÁ PARA TODOS OS CUBOS
AS DIMENSÕES PODEM SER COMPARTILHADAS EM HIERARQUIAS PARCIAIS. POR EX:
CATEGORIA->SUBCATEGORIA->PRODUTO. SOMENTE VOU COMPARTILHAR NO MEU
CUBO CATEGORIA, OU CATEGORIA->SUBCATEGORIA. DESABILITO O NIVEL
INDESEJÁVEL(AUTOMATICAMENTE DESABILITAM OS NIVEIS MENORES)
•
CLASSE
DIMENSÕES
PRODUTO
21
TEMPO=> ANO-SEMESTRE-TRIMESTRE-MÊS-DIA
CLIENTE=> TIPO-CLIENTE
GEOGRAFIA==>PAIS-REGIÃO-ESTADO-CIDADE-LOJA
DIMENSÃO CLIENTE
•
•
MAIOR DETALHAMENTO POSSÍVEL, COM MODELAGEM DOS ATRIBUTOS COM ALTA INDEPENDÊNCIA ENTRE ELES
TABELA DIMENSÃO CLIENTE PADRÃO:
–
CHAVE DE DATA(PK)
–
–
–
–
–
–
–
–
–
–
–
–
–
–
–
–
–
–
–
–
–
–
–
–
–
–
–
–
–
–
SAUDAÇÃO
ESTILO DE SAUDAÇÃO
PRENOME E MEIO-NOME
SOBRENOME
SUFIXO
ETNIA DO NOME
GÊNERO
TÍTULO
RELACIONAMENTO
ORGANIZAÇÃO
SUB-ORGANIZAÇÃO
SEGUNDO NÍVEL DA ORGAN.
NÚMERO DO ENDEREÇO
NOME DA RUA
TIPO DA RUA
DIREÇÃO
CAIXA POSTAL
CONJUNTO/ALA(SUITE)
CIDADE
DISTRITO
ESTADO
PAÍS
CONTINENTE
CODIGO POSTAL PRIMÁRIO
CÓDIGO-POSTAL-SECUNDÁRIO
TELEFONE-CÓDIGO-PAIS
CÓDIGO-ÁREA
TELEFONE
FAX-CÓDIGO-PAIS
…E-MAIL, WEB-SITE,
RECOMENDAÇÃO - USAR SURROGATE KEY(SK)
SK=CHAVE SEQUENCIAL, SEM SENTIDO EMBUTIDO
CRIA MAIOR ESTABILIDADE
EVITA CONFLITO DE MUDANÇAS DE CHAVES E DE SUAS
SEMÂNTICAS
• EVITAR/CUIDADO COM O USO DE SMART KEY(CHAVES COM
SEMÂNTICA EMBUTIDA)
• 4 BYTES: 2 BILHÕES DE OCORRÊNCIAS DE SK
Fonte: Carlos Barbieri
23
EX:MR
EX:PROFISSIONAL
EX:R. JAMES
EX: WOOD
EX:JR
EX:INGLÊS
EX:MASCULINO
EX:ADVOGADO
EX:REPRESENTANTE DE JOHN DOE
EX:ABC GENERIC POWER
EX:DEPARTAMENTO JURÍDICO
EX:DSEÇÃO DE ANÁLISES DE LITÍGIOS
EX:1200
EX:AVENIDA BARBACENA
EX:AVENIDA
EX:NOROESTE
EX;2348
EX:B2
EX:BELO HORIZONTE
EX:SANTO AGOSTINHO
EX:MAINS GERAIS
EX:BRASIL
EX:AMÉRICA DO SUL
EX:
EX031
EX;55
EX:31
EX:525-8798
22
Fonte: Carlos Barbieri
CHAVES DE DIMENSÕES
E DE FATOS
•
•
•
•
20
Fonte: Carlos Barbieri
CHAVES SURROGATE
TFATO
DIMENSÃO
K1
K1
S
MÉTRICAS
PS
CHAVE SURROGATE:
NÚMERICA, NEUTRA
GERADA, SEQUENCIAL
TIPO IDENTITY
NORMALMENTE 4 BYTES
24
4
13/03/2012
FATOS E DADOS
FATOS E DADOS
– ESCOLHER PARA CADA TFATO OS ATRIBUTOS NUMÉRICOS E
ADITIVOS
– TÍPICOS:
• QUANTIDADE VENDIDA
• VALOR VENDIDO
• CUSTO DO PRODUTO (VENDIDO)
• LUCRO
• CONSUMO
– MANTER CONFORMIDADE/COERÊNCIA TAMBÉM ENTRE FATOS E AS
MEDIDAS/VALORES , COM O MESMO SENTIDO, FÓRMULAS DE
CÁLCULOS, ETC
– GRANULARIDADE DA TFATO ESTA DIRETAMENTE RELACIONADA COM A
DAS TDIM
•
•
•
ESCOLHER COM CUIDADO OS CAMPOS, DEVIDO AO TAMANHO EXPONENCIAL DAS
TFATOS
ETERNO COMPROMISSO ENTRE PERFORMANCE E ARMAZENAMENTO
CAMPOS CANDIDATOS A REMOÇÃO:
–
–
CAMPOS USADOS POR POUCOS USUÁRIOS
CAMPOS POTENCIALMENTE DERIVADOS
–
–
CAMPOS QUE NÃO TENHAM VALOR DE NEGÓCIO
CAMPOS DE DIMENSÕES DEGENERADAS, COMO NÚMERO DE ORDEM/PEDIDOS, CASO A
GRANULARIDADE SEJA O ITEM DESSAS ENTIDADES
•
•
•
EX: VALOR UNITÁRIO E QUANTIDADE DO ITEM
ARMAZENO O VALOR TOTAL DA VENDA DO ÍTEM????(V.UNITÁRIO*QUANTIDADE)
ANALISAR O TAMANHO DE CADA CAMPO
–
USE CHAVES SURROGATE QUANDO POSSÍVEL(CHAVE DEFINIDA PELO PROJETO, SEM SIGNIFICADO
INTRÍNSECO)
– LEMBRE-SE PORÉM: AS TFATOS SÃO GIGANTESCAS(ALTO VOLUME) E ISSO
REQUER COMPROMISSOS NA ESCOLHA DE SEUS CAMPOS
25
Fonte: Carlos Barbieri
26
Fonte: Carlos Barbieri
FATOS SEM DADOS
FATOS SEM DADOS
ALUNO
•
•
•
•
TABELAS FATOS SEM PRESENÇA DE DADOS
PODEM ACONTECER MAS NÃO SÃO COMUNS
CONTÉM SOMENTE AS CHAVES DAS DIMENSÕES
SERVEM PARA CONTROLE DE EVENTOS E SUAS
OCORRÊNCIAS, SEM NECESSIDADE DE REGISTRO DE
DADOS ADITIVOS
• EX:
DISCIPLINA
CHAVE-ALUNO
CHAVE-DIA
CHAVE-DISCIPLINA
MÉTRICA(???)
– CONTROLE DIÁRIO DE PRESENÇA DE ESTUDANTES
• DIA, ESTUDANTE,CURSO(0).
– NÃO CABERIA NOTA(NORMALMENTE POR MÊS, OU SEMESTRE),
NEM FREQUÊNCIA
27
Fonte: Carlos Barbieri
DIA
28
Fonte: Carlos Barbieri
FATOS E DADOS
HETEROGENEIDADE
CONTA
CORRENTE
CLASSIFICADOS EM
• PRODUTOS HETEROGÊNEOS
• INDÚSTRIA FINANCEIRA
• CONTA CORRENTE, SEGURO,EMPRÉSTIMO,
POUPANÇA,HABITAÇÃO, ETC
• DIFERENTES FATOS E DADOS PARA CADA LINHA DE NEGÓCIO
• DIMENSÕES COMUNS(CLIENTES, AGÊNCIAS)
• ESTRATÉGIA:
– MÚLTIPLAS TABELAS FATO E DADOS ESPECÍFICOS
– DIMENSÕES ÚNICAS E CONFORMES
BANCO
PRODUTOS
CONTA
POUPANÇA
É FORMADO DE
PERTENCEM A
POSSUEM
ASSOCIADOS A
EMPRÉSTIMO
SFH
AGÊNCIAS
ASSOCIADOS A
INVESTIMENTO
TRABALHAM COM
ASSOCIADOS A
CLIENTE
RELATIVAS A
CONTAS
EMPRÉSTIMO
PESSOAL
POSSUEM
ASSOCIADOS A
CARTÃO
CRÉDITO
DOMICÍLIO
Fonte: Carlos Barbieri
29
Fonte: Carlos Barbieri
30
5
13/03/2012
FATOS MULTI-DADOS
AGÊNCIA
CONTA
TEMPO
DIMENSÕES
COMPARTILHADAS
AGÊNCIA
FATOS
SALDO
CHAVE-CONTA
CHAVE-AGÊNCIA
CHAVE-PRODUTO
CHAVE-TEMPO
CONTA
PRODUTO
FATOS
FATOS
FATOS
FATOS
FATOS
CHAVE-CONTA
CHAVE-PRODUTOC.CORRENTE
CHAVE-TEMPO
CHAVE-AGÊNCIA
CHAVE-CONTA
CHAVE-PRODUTOPOUPANÇA
CHAVE-TEMPO
CHAVE-AGÊNCIA
CHAVE-CONTA
CHAVE-PRODUTOSFH
CHAVE-TEMPO
CHAVE-AGÊNCIA
CHAVE-CONTA
CHAVE-PRODUTOINVESTIMENTO
CHAVE-TEMPO
CHAVE-AGÊNCIA
CHAVE-CONTA
CHAVE-PRODUTOEMP.PESSOAL
CHAVE-TEMPO
CHAVE-AGÊNCIA
CHAVE-CONTA
CHAVE-PRODUTOC.CRÉDITO
CHAVE-TEMPO
CHAVE-AGÊNCIA
MÉTRICAS
C.CORRENTE
MÉTRICAS
C.POUPANÇA
MÉTRICAS
SFH
MÉTRICAS
INVESTIMENTO
MÉTRICAS
EMP.PESSOAL
MÉTRICAS
C.CRÉDITO
PRODUTO
PRODUTO
PRODUTO
SFH
PRODUTO
PRODUTO
EMP.
PESSOAL
MÉTRICA
C.CORRENTE
POUPANÇA
TEMPO
•
•
•
DADOS E FATOS
ALGUMAS FERRAMENTAS CONSIDERAM A TFATO COMO MAIS UMA
DIMENSÃO
FACILITA O USO DE EXPRESSÕES
OS VALORES DA TFATO ESTÃO SEMPRE ASSOCIADOS A ELEMENTOS
FOLHA DAS DIMENSÕES
LEMBRAR QUE AS FATOS PODERÃO SER PROCESSADAS POR VÁRIOS
TIPOS DE ELABORAÇÃO:
– SOMA ( MAIS COMUM)
– VALOR MÁXIMO, MÍNIMO, CONTADOR, CONTADOR(DISTINTO)
•
C.CRÉDITO
32
Fonte: Carlos Barbieri
DADOS E FATOS
•
PRODUTO
DIMENSÕES ESPECIALIZADAS
31
Fonte: Carlos Barbieri
INVESTIMENTO
AS CÉLULAS DA TFATO PODEM SER CALCULADAS EM FUNÇÃO DE
VALORES DE OUTRAS CÉLULAS DA MESMA TFATO-SÃO OS MEMBROS
CALCULADOS
• CONCEITO DE ELEMENTO VIRTUAL
– ELEMENTO DEFINIDO NA TFATO, COMO MEDIDA
– CALCULADO EM FUNÇÃO DE OUTRO ELEMENTO DA MESMA
DIMENSÃO
– POR EXEMPLO: DEFINO UM CAMPO VIRTUAL EM TFATO
CHAMADO MEDIDA DOBRADA
– FAÇO MEDIDA DOBRADA= 2 * VALOR DO PRODUTO
– FUNCIONA COMO SE TIVESSE DEFINIDO UM NOVO MEMBRO DE
PRODUTO, CUJOS VALORES NA TFATO SÃO SEMPRE O DOBRO DO
PRODUTO
– EX: MÉDIA=TOTAL VENDAS/TOTAL UNIDADES VENDIDAS
Fonte: Carlos Barbieri
33
Passos da Modelagem
Dimensional
Definição da área de negócios;
Definição da granularidade
- Menor – mais espaço;
- Maior – menos espaço;
Definição das tabelas dimensão;
Normalização das tabelas dimensao;
- Star Schema - ÑN
- Snow Flakes
Relacionamento dos atributos da tabela dimensão
- Podem possuir ou não relacionamento
Definição dos atributos da tabela fato
- Definição das chaves
- Definição das Métricas
Fonte: Carlos Barbieri
34
Erros Comuns a Evitar em
Modelagem Dimensional
• Colocar atributos de texto usados para restrições e
agrupamento numa tabela de fatos.
• Limitar atributos em dimensões para economizar espaço.
• Ignorar a necessidade de cuidar de mudanças em atributos
de dimensões.
• Resolver todos os problemas de desempenho de consultas
adicionando mais hardware.
• Usar chaves operacionais ou “inteligentes” para junções de
tabelas de dimensão com tabela de fatos.
• Projetar o modelo dimensional baseado em um
relatório específico.
Fonte: Marcos André Gonçalves
36
6
13/03/2012
Erros Comuns a Evitar em
Projetos de Data Warehouse
• Aceitar a premissa de que os responsáveis pelos sistemas operacionais
fontes mais relevantes da organização são muito importantes e ocupados
para gastar tempo com a equipe de DW.
• Assegurar para o pessoal de suporte do DW escritórios agradáveis no
prédio da TI, que fica próximo dos usuários de negócio, e providenciar
um número de telefone de suporte de DW com várias opções de menu.
• Treinar cada usuário em cada característica da ferramenta de acesso a
dados na primeira aula de treinamento, adiar o treinamento sobre
conteúdo de dados porque a aula usa dados falsos (os dados reais não
estarão prontos nos próximos dois meses) e declarar sucesso ao término
da primeira aula de treinamento já que o DW foi disponibilizado para os
usuários de negócio.
Fonte: Marcos André Gonçalves
37
Erros Comuns a Evitar em
Modelagem Dimensional
• Assumir que os usuários de negócio vão naturalmente
gravitar em direção a dados robustos e desenvolver
suas próprias “killer applications” analíticas.
• Evitar a ilusão sedutora de desenvolvimento iterativo,
que é somente uma desculpa para não fazer certo da
primeira vez. Antes de implementar o DW, fazer uma
análise completa descrevendo todos os possíveis ativos
de dados da empresa e todos os usos desejados de
informação, e
Fonte: Marcos André Gonçalves
38
Erros Comuns a Evitar em
Modelagem Dimensional
• Não encorajar os usuários de negócio a lhe dar feedback
contínuo ao longo do ciclo de desenvolvimento sobre novas
fontes de dados e métricas chaves de desempenho que eles
gostariam de acessar, e não assegurar a inclusão desses
requisitos na release em desenvolvimento.
Bons Estudos!
Prof. Zaidan – www.fernandozaidan.com.br
• Não concordar em entregar um data mart centrado em cliente
de alto perfil, idealmente lucratividade de cliente ou satisfação
de cliente, como seu primeiro produto.
• Não conversar com os usuários de negócio; ao invés disso,
confiar em consultores ou especialistas internos para lhe dar
interpretação dos requisitos de usuários do DW.
“O sucesso vem para aqueles que fazem com que ele aconteça,
e não para aqueles que deixam que ele aconteça.”
Anônimo
Fonte: Marcos André Gonçalves
39
7
Download

Faculdade Pitágoras