OLAP Abmar Barros Agenda • • • • • • OLAP x OLTP Análise multidimensional Cubo OLAP Como funciona a mágica? View-selection Ferramentas OLAP x OLTP • OLTP – Online Transactional Processing – Trabalha com registros individuais ou em pequeno número – Operações de leitura e escrita • OLAP – Online Analytical Processing – Trabalha com dados em massa – Operações são geralmente read-only OLAP x OLTP • Porque online? – Apesar de lidar com uma enorme quantidade de dados, o sistema deve responder rápido o suficiente para permitir uma exploração interativa dos dados. Análise multidimensional Year 2000 2001 Growth Product Dollar sales Unit sales Dollar sales Unit sales Dollar sales Unit sales Total $7,073 2,693 $7,636 3,008 8% 12% — Books $2,753 824 $3,331 966 21% 17% —— Fiction $1,341 424 $1,202 380 -10% -10% —— Non-fiction $1,412 400 $2,129 586 51% 47% — Magazines $2,753 824 $2,426 766 -12% -7% — Greetings cards $1,567 1,045 $1,879 1,276 20% 22% Análise multidimensional • Dimensões (Dimensions) – Formam as colunas e linhas – Ex.: Year e Product – Hierarquia de dimensões (Ex.: Books, Magazines) • Medidas (Measures) – Formam os valores – Ex.: Dollar sales e Unit sales Cubo OLAP Como funciona a mágica? • Para consultas complexas, cubos OLAP conseguem responder em 0,1% do tempo da mesma consulta em OLTP. • O mais importante mecanismo em OLAP é a agregação. Como funciona a mágica? • Agregações são construídas a partir das tabelas de fatos: – As granularidades de dimensões específicas são alteradas. – Os valores são agregados sobre essas dimensões. • A combinação de todas as possíveis agregações contém as respostas pra qualquer consulta, diretamente dos dados. Como funciona a mágica? • Assim, um número muito grande de agregações deve ser computado, o que é computacionalmente inviável. • Normalmente uma parte das agregações são pré-calculadas, outras são calculadas por demanda. • O problema de decidir quais agregações précalcular é conhecido como view-selection. View-selection • O objetivo do view-selection é minimizar o tempo médio de resposta das consultas. • View-selection é NP-completo. • Abordagens já exploradas: – Algoritmos gulosos – Busca aleatória (Randomized search) – Algoritmos genéticos – Busca A* Ferramentas • Comerciais – Microsoft Analysis Services – Oracle Essbase – IBM Cognos TM1 • Open-Source – Mondrian OLAP Server – Jedox Palo