OLAP
Abmar Barros
Agenda
•
•
•
•
•
•
OLAP x OLTP
Análise multidimensional
Cubo OLAP
Como funciona a mágica?
View-selection
Ferramentas
OLAP x OLTP
• OLTP
– Online Transactional Processing
– Trabalha com registros individuais ou em pequeno
número
– Operações de leitura e escrita
• OLAP
– Online Analytical Processing
– Trabalha com dados em massa
– Operações são geralmente read-only
OLAP x OLTP
• Porque online?
– Apesar de lidar com uma enorme quantidade de
dados, o sistema deve responder rápido o
suficiente para permitir uma exploração interativa
dos dados.
Análise multidimensional
Year
2000
2001
Growth
Product
Dollar
sales
Unit
sales
Dollar
sales
Unit
sales
Dollar
sales
Unit
sales
Total
$7,073
2,693
$7,636
3,008
8%
12%
— Books
$2,753
824
$3,331
966
21%
17%
—— Fiction
$1,341
424
$1,202
380
-10%
-10%
—— Non-fiction
$1,412
400
$2,129
586
51%
47%
— Magazines
$2,753
824
$2,426
766
-12%
-7%
— Greetings cards
$1,567
1,045
$1,879
1,276
20%
22%
Análise multidimensional
• Dimensões (Dimensions)
– Formam as colunas e linhas
– Ex.: Year e Product
– Hierarquia de dimensões (Ex.: Books, Magazines)
• Medidas (Measures)
– Formam os valores
– Ex.: Dollar sales e Unit sales
Cubo OLAP
Como funciona a mágica?
• Para consultas complexas, cubos OLAP
conseguem responder em 0,1% do tempo da
mesma consulta em OLTP.
• O mais importante mecanismo em OLAP é a
agregação.
Como funciona a mágica?
• Agregações são construídas a partir das
tabelas de fatos:
– As granularidades de dimensões específicas são
alteradas.
– Os valores são agregados sobre essas dimensões.
• A combinação de todas as possíveis
agregações contém as respostas pra qualquer
consulta, diretamente dos dados.
Como funciona a mágica?
• Assim, um número muito grande de
agregações deve ser computado, o que é
computacionalmente inviável.
• Normalmente uma parte das agregações são
pré-calculadas, outras são calculadas por
demanda.
• O problema de decidir quais agregações précalcular é conhecido como view-selection.
View-selection
• O objetivo do view-selection é minimizar o
tempo médio de resposta das consultas.
• View-selection é NP-completo.
• Abordagens já exploradas:
– Algoritmos gulosos
– Busca aleatória (Randomized search)
– Algoritmos genéticos
– Busca A*
Ferramentas
• Comerciais
– Microsoft Analysis Services
– Oracle Essbase
– IBM Cognos TM1
• Open-Source
– Mondrian OLAP Server
– Jedox Palo
Download

OLAP