IETEC – INSTITUTO DE EDUCAÇÃO TECNÓLOGICA
PÓS-GRADUAÇÃO LATO SENSU
GESTÃO E TECNOLOGIA DA INFORMAÇÃO
Business Inteligence: O Papel do Data Warehouse no Processo de
Suporte a Tomada de Decisão
Alexandre Antônio de Vasconcelos,
André Caribé Pinheiro,
Ivani Aparecida Alves,
Rafael Tardelli Pacheco dos Santos,
Wantuil Silva
Belo Horizonte, Setembro de 2010
2
Informações sobre os autores:
Nome: Alexandre Antônio de Vasconcelos.
Titulação Acadêmica: Tecnólogo em Análise de Redes.
Empresa/Instituição: Grupo NC.
E-mail: [email protected]
Nome: André Caribé Pinheiro.
Titulação Acadêmica: Engenheiro Eletricista.
Empresa/Instituição: FIDENS Engenharia SA
E-mail: [email protected] ou [email protected]
Nome: Ivani Aparecida Alves.
Titulação Acadêmica: Administradora de Empresas.
Empresa/Instituição: Maxis Informática Ltda.
E-mail: [email protected]
Nome: Rafael Tardelli Pacheco dos Santos.
Titulação Acadêmica: Bacharel em Ciência da Computação
Empresa/Instituição: Teradata
E-mail: [email protected]
Nome: Wantuil Silva.
Titulação Acadêmica: Tecnólogo em Redes.
Empresa/Instituição: Consite Tecnologia.
E-mail: [email protected]
3
Lista de Figuras
Figura 1: Estrutura do BI ............................................................................................. 8
Figura 2: Exemplo esquema estrela .......................................................................... 13
Figura 3: Exemplo esquema floco de neve ............................................................... 14
Figura 4: Exemplos de tabelas padronizadas e não padronizadas ........................... 15
Figura 5: Valor pontual .............................................................................................. 17
Figura 6: Plano .......................................................................................................... 17
Figura 7: Cubo........................................................................................................... 18
Figura 8: Representação dos principais conjuntos dimensionais – Modelo
dimensional hierarquizado. ....................................................................................... 19
Figura 9: Representação dos principais conjuntos dimensionais – drill-down, drill-up,
drill-across e drill-through .......................................................................................... 20
Figura 10: Estágios de um Active Data Warehousing ............................................... 21
Figura 11: Janelas ..................................................................................................... 28
Figura 12: Sistemas fonte. ........................................................................................ 29
Figura 13: Sistemas fonte. ........................................................................................ 31
Figura 14: Quadro de evolução do ambiente. ........................................................... 32
4
Sumário
1.
Resumo ................................................................................................................ 6
2.
Introdução ............................................................................................................ 7
3.
Referencial Teórico .............................................................................................. 8
3.1.
Business Intelligence (BI) ............................................................................... 8
3.2.
Sistema Transacional (OLTP – On-line Transaction Processing) .................. 9
3.3.
ETL – Extração, Transformação e Carga (Load) de Dados ......................... 10
3.4.
Data Warehouse (DW) ................................................................................. 11
3.5.
Data Marts (DM) ........................................................................................... 11
3.6.
Modelagem Dimensional de Dados ............................................................. 12
3.7.
Sistema OLAP (OLAP – On-line Analytical Processing) .............................. 15
3.8.
Operadores Dimensionais ............................................................................ 16
3.8.1. Valor Pontual (Ponto) ............................................................................ 16
3.8.2. Plano (Slicing)........................................................................................ 17
3.8.3. Cubo (Dicing) ......................................................................................... 18
3.8.4. Pivoteamento (Rotação) ........................................................................ 18
3.8.5. Drill-Down e Drill-Up (Roll-up)................................................................ 19
3.8.6. Drill-Across ............................................................................................ 19
3.8.7. Drill-Through .......................................................................................... 20
3.9.
Evolução dos Data Warehouses .................................................................. 20
3.9.1. Estágio 1: Reportando ........................................................................... 21
3.9.2. Estágio 2: Analizando ............................................................................ 22
3.9.3. Estágio 3: Predizendo............................................................................ 22
3.9.4. Estágio 4: Operacionalizando ................................................................ 22
5
3.9.5. Estágio 5: Active Data Warehousing (ADW).......................................... 23
4.
Pesquisa ............................................................................................................ 25
4.1.
Entendendo a natureza dos negócios .......................................................... 25
4.2.
Motivações para o projeto Inicial .................................................................. 26
4.3.
Implementação ............................................................................................. 27
4.4.
Active Data Warehousing ............................................................................. 30
4.5.
Retorno sobre Investimento ......................................................................... 32
5.
Conclusões ........................................................................................................ 34
6.
Referências Bibliográficas .................................................................................. 35
6
1. RESUMO
Com a globalização atual do mercado e a aplicação de metódos cada vez mais
agressivos para redução de custos, como terceirização e procura de fornecedores
externos, as empresas vêm encontrando uma concorrência cada vez mais acirrada,
e neste cenário não é possível ficar imóvel as mudanças, é preciso sempre inovar, e
para isto o conhecimento e a análise da informação se transformaram em
ferramentas chave. Utilizada cada dia mais pelas empresas para auxiliar a este fim
está a tecnologia de Business Inteligenge ou Inteligência de Negócios, que se
baseia no processo analítico de informações históricas oriundas de diversas fontes
que são armazenadas em um Data Warehouse (DW). Este, podendo ser
considerado o coração da tecnologia, precisa ter seus conceitos bem entendidos
para que seus processos sejam bem desenvolvidos e implementados. Um projeto de
DW bem realizado é a chave para o sucesso do processo de suporte a tomada de
decisão. Para mostrar o valor do DW neste processo serão apresentados seus
conceitos chave e um estudo de caso bem sucedido, em que a qualidade alcançada
na execução dos processos da empresa e o retorno sobre o investimento puderam
ser mensurados e apresentados.
Palavras chave: Análise da Informação, Tomada de Decisão, Business Inteligence,
Data Warehouse.
7
2. INTRODUÇÃO
A utilização de processos de Business Inteligence, cujo conceito segundo Barbieri
(2001) “é a utilização de várias fontes de informação para se definir estratégias de
competitividade nos negócios da empresa”, vem se tornando cada vez mais comum.
Fazendo uma analogia simples pode-se considerar o Data Warehouse (DW), ou
Armazém de Dados, que é um sistema gerenciador de banco de dados (SGBD)
destinado a sistemas de apoio a decisão, como o coração deste processo. E nele
onde serão armazenadas os dados oriundos de fontes heterogêneas em estruturas
lógicas dimensionais, o que possibilita o seu processamento analítico por
ferramentas especiais (BARBIERI, 2001). É a análise destes dados que agregará
valor a informação e guiará os negócios, portanto o cuidado no tratamento dos
dados, o objetivo que se pretende alcançar com isto e a própria análise em si devem
ser rápidas e bem realizadas.
Para isto é preciso contar com um sistema que exerça a função de suportar a
tomada de decisões. Que forneça uma resposta rápida, com informação precisa
para que a empresa aproveite as oportunidades estando no lugar correto, no
momento oportuno e com a informação correta. Para alcançar este patamar não
pode-se contar apenas com a tecnologia, mas também com técnicas de modelagem
bem realizadas, juntamente com um projeto e objetivos bem estruturados.
Como objetivos deste trabalho serão apresentadas os conceitos da tecnologia de
Data Warehousing, como modelo dimensional, processamento transacional e
analítico, operadores dimensionais e a evolução da tecnologia de DW, ou seja, todos
os elementos que devem ser estudados, projetados e bem implementados para que
seja possível alcançar o sucesso de um projeto de Busines Inteligence. Também
será apresentado um estudo de caso de uma empresa real que mostra como uma
implementação bem realizada de um Data Warehouse pode melhorar os processos
de tomada de decisão e também o retorno sobre o investimento realizado.
8
3. REFERENCIAL TEÓRICO
3.1. BUSINESS INTELLIGENCE (BI)
A história do Business Intelligence que conhecemos hoje, começa na década de 70,
quando alguns produtos de BI foram disponibilizados para os analistas de negócio.
“O grande problema era que esses produtos exigiam intensa e exaustiva
programação, não disponibilizavam informação em tempo hábil nem de forma
flexível, e além de tudo tinham alto custo de implantação” (SERAIN, 2010). Com o
surgimento dos bancos de dados relacionais, dos PC's e das interfaces gráficas
como o Windows, aliados ao aumento da complexidade dos negócios, começaram a
surgir os primeiros produtos realmente direcionados aos analistas de negócios, que
possibilitavam rapidez e uma maior flexibilidade de análise.
- Planejamento
- Estratégia Corporativa
- Scorecards
- Relatórios
- Análise e Datamining
- Data Warehouse
- Data Marts
- Cubos
- Integração de Dados
- ETL
- Dados Transacionais
- Outras Fontes de Dados
Figura 1: Estrutura do BI
Fonte: do autor
9
Business Intelligence, cujo conceito de forma geral “é a utilização de varias fontes de
informação para se definir estratégias de competitividade nos negócios da empresa”
(BARBIERI, 2001). Atualmente várias empresas possuem muitos dados, mas
poucas informações. Devido ao volume sempre crescente desses dados e da forma
que eles se encontram distribuídos na empresa, a dificuldade de se extrair
informações gerenciais para a tomada de decisões é muito grande. Para Microsoft
Business Intelligence “é uma disciplina que, junto com suas ferramentas
correspondentes, são o centro da análise da informação para a correta tomada de
decisões, permitindo que a empresa atinja seus objetivos de negócio” (MICROSOFT,
2010).
3.2. SISTEMA TRANSACIONAL (OLTP – ON-LINE TRANSACTION
PROCESSING)
A Microsoft define os sistemas OLTP como “os sistemas que capturam as
transações de um negócio e as mantêm em estruturas relacionais chamadas Banco
de Dados” (MICROSOFT, 2010). As principais características desses sistemas são
de realizar transações em tempo real, serem responsáveis pela manutenção dos
dados (acrescentando, atualizando e excluindo), serem otimizados de forma a
validar a entrada dos dados rejeitando-os caso não atendam às regras de negócio e
possuem capacidade limitada na busca de informações para tomada de decisões.
Normalmente, para o desenho de um sistema OLTP é definido um modelo de
Diagrama de Relação de Entidades (DRE). Um DRE é uma representação da
realidade através de um esquema gráfico que contém os seguintes elementos:
• Entidades: Uma Entidade é um tipo de objeto que pode ser identificado de
forma única por algum meio. Este objeto é traduzido para a estrutura física de
um banco de dados como uma tabela;
• Atributos: As características particulares que diferenciam as Entidades são
denominadas Atributos;
10
• Relações (ou Relacionamentos): vínculos existentes entre as tabelas que
servem para garantir a integridade referencial;
Para conseguir esquematizar um DRE, deve ser realizado um processo de
normalização baseado nas Formas Normais, que também garante uma otimização
do espaço utilizado no disco.
3.3. ETL – EXTRAÇÃO, TRANSFORMAÇÃO E CARGA (LOAD) DE
DADOS
Os dados que alimentam um Data Warehouse são resultantes de diferentes fontes;
estas fontes são diferentes sistemas OLTP que a empresa possui, geralmente não
homogêneos e não concordando necessariamente com o que é necessário, sendo
necessário realizar todas as adaptações pertinentes (MICROSOFT, 2010).
Ao reunir dados dos diferentes sistemas deve ser definida uma norma única para o
Data Warehouse e realizar as transformações necessárias em cada caso.
Basicamente devem ser realizadas as tarefas de estabelecer as regras que serão
utilizadas para realizar a transformação, detectar as inconsistências que podem
ocorrer ao extrair dados de diferentes fontes e planejar cuidadosamente e com
detalhes a transformação dos dados, que ofereçam como resultado final conjuntos
de dados consistentes. Nas transformações devem-se criar convenções únicas para
codificações (exemplo: sexo M/F ou 0/1 ou “masculino”/”feminino”), unidade de
medida dos atributos (exemplo: litros ou metros cúbicos ou decilitros) e formatos
(exemplo: datas nos formatos “dd/mm/aaaa” ou “mm/dd/aaaa” ou “aaaa/mm/dd”).
Pode ser necessário também armazenar o conteúdo de várias colunas de uma
tabela em uma única coluna (Exemplo: endereço ou nome e sobrenome) ou
armazenar o conteúdo de uma coluna em varias outras colunas (Exemplo: sistemas
mais antigos costumavam colocar o tipo e número de documento no mesmo campo
da tabela).
11
3.4. DATA WAREHOUSE (DW)
Carlos Barbieri define o Data Warehouse (DW) “como um banco de dados,
destinados a sistemas de apoio à decisão e cujos dados foram armazenados em
estrutura lógica dimensionais, possibilitando o seu processamento analítico por
ferramentas especiais (OLAP e Mining)” (BARBIERI, 2001). O Data Warehouse
possibilita a análise de grandes volumes de dados, coletados dos sistemas
transacionais. Por definição, os dados em um Data Warehouse não são voláteis, ou
seja, eles não mudam, exceto quando é necessário fazer correções de dados
previamente carregados. Os dados então são somente para leitura e não podem ser
alterados. As informações são armazenadas em estruturas multidimensionais,
calculando previamente todas as combinações de todos os níveis de todas as
aberturas de análise. É de forma simples, um produto cartesiano que armazena
todas as combinações.
3.5. DATA MARTS (DM)
O termo Data Mart significa “depósitos de dados que atende a certas áreas
específicas da empresa e voltados (também) para o processo decisório gerencial.
Ambos podem ser definidos como espécies do mesmo tipo, ficando a diferença entre
os dois centrada no escopo do projeto e nos limites de suas abrangências”
(BARBIERI, 2001).
A Microsoft define Data Mart como “armazéns de dados com informações de
interesse particular para um determinado setor da empresa” e Data Warehouse
como “o conjunto de armazéns de dados particulares (Data Mart) com informação de
interesse para a empresa em geral” (MICROSOFT, 2010).
12
Data Marts podem ser lógicos, quando represntam visões dentro de uma fonte única
de dados, ou físicos, quando são independentes de outros Data Marts da
corporação.
3.6. MODELAGEM DIMENSIONAL DE DADOS
O alvo das técnicas de Business Intelligence está exatamente na definição de regras
e técnicas para determinar os aspectos adequados destes pacotes de dados,
objetivando agrupá-los em depósitos estruturados de informações. A modelagem de
dados foi um artefato de verdadeira importância no desenvolvimento de estruturas
capazes de serem implantadas e entendidas pelos gerenciadores de bancos de
dados. Mas com a necessidade que surge do aspecto competitivo e busca de
diferenciais de negócio fez com que este método se tornasse inadequado. As suas
características de campos por tabelas normalizadas se mostram imperfeitas para os
processamentos das visões dimensionais.
A estrutura dimensional modifica a ordem da distribuição de campos das tabelas,
possibilitando uma estrutura voltada para os diversos pontos de entradas as
chamadas dimensões. Com isso os dados estarão em uma forma quase estrelar,
onde varias dimensões estão relacionadas com algumas poucas tabelas, criando
uma notação mais objetiva. O produto da modelagem Dimensional é um modelo
conceitual dimensional, formado por tabelas Fato e tabelas Dimensão.
“As tabelas Fato servem para armazenar medidas numéricas associadas a eventos
de negócio. Uma tabela Fato contém vários fatos, correspondentes a cada uma de
suas linhas. Cada fato pode armazenar um ou mais medidas numéricas, que
constituem os valores objetos da análise dimensional. Possuem como chaveprimária, normalmente um campo multi-key, formado pelas chaves-primárias das
dimensões que com ela se relacionam. Normalmente armazenam muito mais linhas
que as tabelas Dimensão, e merecem cuidado especial em função ao seu alto
volume. Contém dados normalmente aditivos (manipulados por soma, média, etc.) e
relativamente estáticos. As tabelas Dimensão representam entidades de negócios e
constituem as estruturas de entradas que servem para armazenar informações como
13
tempo, geografia, produto, cliente, etc. As tabelas Dimensão têm uma relação 1:N
com a tabela Fato, e possuem um número significativamente menor de linhas do que
as tabelas Fato. Possuem múltiplas colunas de informação, algumas das quais
representam sua hierarquia. Apresentam sempre uma chave primária, que lhes
confere unicidade, chave essa que participa das tabelas Fato, como parte da sua
chave múltipla. Devem ser entendidas como as tabelas que realizam os filtros de
valores aplicados na manipulação dos fatos e por onde as consultas entram no
ambiente do DW/DM.” (BARBIERI, 2001).
Para facilitar a análise, o DW/DM tem seus dados organizados em uma estrutura
chamada estrutura estrela. Essa estrutura é formada por uma tabela central (tabela
de Fatos) e um conjunto de tabelas organizadas ao seu redor (tabelas de
Dimensões). São características desse esquema:
• O centro da estrela é a tabela de Fatos;
• As pontas da estrela são as tabelas de Dimensões;
• Cada esquema está formado por apenas uma tabela de Fatos;
• Geralmente é um esquema totalmente não normalizado e pode estar
parcialmente normalizado nas tabelas de Dimensões.
Na Figura 2 é apresentada uma estrutura estrela considerando a necessidade de
analisar como evolui a Admissão de Pacientes (Fato) por serviço, pacientes e região
geográfica (Dimensões) ao longo do tempo.
Figura 2: Exemplo esquema estrela
Fonte: do autor
14
A estrutura floco de neve é uma variação da estrutura estrela onde alguma ponta da
estrela explode em mais tabelas. Nesta estrutura, as tabelas de Dimensão floco de
neve estão normalizadas para eliminar redundância de dados.
Diferente da estrutura estrela, nesta estrutura os dados das dimensões são
distribuídos em múltiplas tabelas. Como vantagem destaca-se a economia de
espaço no armazenamento em disco, porém com um aumento na quantidade de
tabelas.
As características a seguir são parte de uma estrutura floco de neve:
• A Dimensão é normalizada;
• Os diferentes níveis estão armazenados em tabelas separadas;
• Verifica-se economia de espaço.
Na Figura 3Figura 2 é apresentado um exemplo onde a dimensão “Região
Geográfica” apresenta uma estrutura floco de neve.
Figura 3: Exemplo esquema floco de neve
Fonte: do autor
15
Na Figura 4 é apresentado um exemplo de tabela normalizada e tabela não
normalizada. Na tabela normalizada os dados “nome do país” e “nome do estado”
aparecerão apenas uma vez nas tabelas “País” e “Estado”, respectivamente,
enquanto na tabela não normalizada, ocorrerão redundâncias de informações, pois
os dados de País e Estado serão repetidos para cada Cidade.
Tabela Padronizada
Tabela não Padronizada
Cidade
Cidade1
ID_Cidade
ID_Estado
Cidade
ID_Pais
Pais
ID_Estado
Estado
ID_Cidade
Cidade
Estado
ID_Estado
Estado
ID_Pais
Estado1
ID_Pais
Pais
Figura 4: Exemplos de tabelas padronizadas e não padronizadas
Fonte: do autor
3.7. SISTEMA
OLAP
(OLAP
–
ON-LINE
ANALYTICAL
PROCESSING)
Os sistemas OLAP (On-Line Analytical Processing, ou Processamento Analítico Online) oferecem uma alternativa aos sistemas transacionais, proporcionando uma
visão dos dados orientada à análise, além de uma navegação rápida e flexível
(MICROSOFT, 2010).
As principais características da tecnologia OLAP são:
16
• Bancos de dados com um esquema otimizado para que os resultados das
consultas sejam entregues rapidamente;
• Os cubos OLAP armazenam vários níveis de dados formados por estruturas
altamente otimizadas que atendem às expectativas de negócio da empresa;
• Um sistema OLAP está preparado para realizar relatórios complexos de uma
forma simples;
• O OLAP proporciona uma visão multidimensional dos dados. Os cubos
oferecem uma visão multidimensional dos dados que vai além da análise de
duas dimensões, oferecida por uma simples planilha de cálculo utilizada como
tal;
• Os usuários podem modificar facilmente as filas, as colunas e as páginas nos
relatórios do OLAP, sendo possível visualizar a informação da forma que seja
mais conveniente para análise;
3.8. OPERADORES DIMENSIONAIS
Após ter apresentado as técnicas de modelagem dimensional e o conceito inicial de
OLAP, é importante realizar uma pequena introdução ao conceito de Operadores
Dimensionais, que são técnicas de manuseio dos dados dimensionais que serão
usualmente utilizadas em consultas OLAP.
3.8.1. VALOR PONTUAL (PONTO)
Este valor apresenta a interseção de valores da tabela fato em relação aos três
eixos, ou dimensões.
17
Figura 5: Valor pontual
Fonte: do autor
3.8.2. PLANO (SLICING)
O plano representa uma fatia do Cubo, em que duas dimensões variam com uma
outra dimensão fixa.
Figura 6: Plano
18
Fonte: do autor
3.8.3. CUBO (DICING)
O conceito de Dicing apresenta os valores com todas as dimensões variando.
Figura 7: Cubo
Fonte: do autor
3.8.4. PIVOTEAMENTO (ROTAÇÃO)
No pivoteamento, ou rotação, ocorre a mudança dos eixos das dimensões para fins
de visualização. Deve-se lembrar que para fins de representação só foram
mostradas trê dimensões, mas um modelo real pode possuir n dimensões.
19
3.8.5. DRILL-DOWN E DRILL-UP (ROLL-UP).
O conceito de Drill-Down está relacionado com a ação de sair do topo de uma
hierarquia em direção ao dado mais detalhado, como por exemplo mudar a consulta
do total de vendas de determinado produto por mês para o total de vendas por dia.
Drill-Up representa o caminho inverso (Figura 8).
Figura 8: Representação dos principais conjuntos dimensionais – Modelo
dimensional hierarquizado.
Fonte: Barbieri, 2001, p. 42.
3.8.6. DRILL-ACROSS
Trata da iteração entre diferentes tabelas fato. Isso só será possível se ambos
possuírem alguma dimensão em comum.
20
Figura 9: Representação dos principais conjuntos dimensionais – drill-down,
drill-up, drill-across e drill-through
Fonte: Barbieri, 2001, p. 43, 44.
3.8.7. DRILL-THROUGH
Referente à necessidade de obter informações em um nível de detalhes menor do
que o expressado na tabela fato. Normalmente obtido com consultas diretas nas
tabelas do modelo relacional, quando estas também são carregadas do DW (Figura
9).
3.9. EVOLUÇÃO DOS DATA WAREHOUSES
Atualmente está acontecendo uma evolução da informação nos ambientes de DW.
Mudanças nos requerimentos de negócios demandam que as tecnologias de DW
realizem terefas mais rapidamente. Data Warehouses estão passando de sistemas
que processam consultas analíticas para sistemas que realizam processos
operacionais críticos para os negócios, suportando CRMs, operações de marketing e
decisões em tempo real. A Teratada (2008), líder no mercado de DW, define um
21
Active Data Warehouse como um “conjunto integrado e logicamente consistente de
dados atualizados detalhados disponibilizados para o suporte a decisão estratégico,
tático e guiado por eventos.” Também define estas decisões tomadas no
gerenciamento do dia-a-dia como Suporte a Decisão Tática, e apresenta os estágios
que devem ser alcançados para se atingir o nível de um Active Data Warehouse, ou
seja, um DW que suporta a tomada de decisão em tempo real (Figura 10).
Figura 10: Estágios de um Active Data Warehousing
Fonte: Adaptação de TERADATA (2008)
3.9.1. ESTÁGIO 1: REPORTANDO
O estágio inicial tipicamente foca em relatórios de uma única fonte para guiar o
suporte à decisão através das fronteiras funcionais ou de produtos/serviços.
Questões normalmente são conhecidas antecipadamente, como por exemplo um
relatório de vendas semanal.
22
3.9.2. ESTÁGIO 2: ANALIZANDO
O foco está no porque algo aconteceu, como por exemplo, na resposta do por que
as vendas foram baixas ou no descobrimento de padrões dos hábitos de compra dos
clientes. Usuários realizam análises Ad Hoc, Slicing e Dicing em dados detalhados.
Questões não são conhecidas antecipadamente como a soma das vendas de
determinada semana por exemplo.
3.9.3. ESTÁGIO 3: PREDIZENDO
Análises pesadas e sofisticadas são realizadas no ambiente para trazer informações
preditivas sobre o que acontecerá em seguida nos negócios. Este tipo de informação
irá auxiliar o gerenciamento pró-ativo da estratégia da organização. Este estágio
requer ferramentas de Data Mining e a construção de modelos preditivos usando
informações históricas detalhadas. Como exemplo os analistas podem criar um
modelo da geografia dos clientes para realizar marketing estratégico.
3.9.4. ESTÁGIO 4: OPERACIONALIZANDO
Este estágio provê acesso imediato à informação para os tomadores de decisão da
empresa. Estágios de 1 a 3 focam em decisões estratégicas dentro da organização.
O estágio 4 foca no suporte a decisão tático. Suporte a decisão tática não é focada
no desenvolvimento da estratégia corporativa, mas sim no suporte as pessoas nos
campos que a executam. Exemplo:
• Gerenciamento de inventório com substituições just-in-time;
• Agendamento e roteamento de entrega de pacotes;
• Alteração de campanhas com base em resultados correntes.
23
3.9.5. ESTÁGIO 5: ACTIVE DATA WAREHOUSING (ADW)
Quanto maior o papel do ADW nos aspectos operacionais de suporte a decisão,
maior é o incentivo dos negócios para a automação de processos decisórios. Podese automatizar a tomada de decisão quando um cliente interage com um site web.
CRM interativo em um site disponibilizado para o cliente ou iterações com um caixa
eletrônico podem disparar decisões para otimizar o relacionamento com o cliente
através de oferta de produtos, preços especiais, entrega de envio de informações
específicas e assim por diante. Com o desenvolvimento da tecnologia, mais e mais
decisões são tomadas pelo acionamento de gatilhos (triggers) baseados em
eventos, como por exemplo, determinar a melhor oferta para um cliente específico
baseada num evento em tempo real, como um depósito significante em um caixa
eletrônico.
Para suportar este novo tipo de decisão dos negócios de hoje em dia, é preciso mais
do que apenas uma abordagem estratégica na implementação de um Data
Warehouse. É necessário um uso mais efetivo da informação para decisões que
podem ser tomadas centenas de vezes durante o dia
O
conceito
de
Active
Data
Warehouse
surgiu
com
a
necessidade
do
armazenamaneto e disponibilização em tempo quase real de dados detalhados para
análise do negócio e tomada de decisião (TERADATA, 2008). Estes processos são
suplementares as funcionalidades típicas de um DW. Por exemplo, o mix típico de
trabalho processado em um ambiente de DW continua contendo consultas analíticas
(OLAP), mas é expandido para processar consultas táticas curtas, carga de dados
em segundo-plano (background) e possivelmente atualizações baseadas em
eventos, tudo ao mesmo tempo. O volume de dados e a concorrência de usuários no
ambiente pode com isto crescer muito acima das expectativas. Isto faz com que o
SGBD tenha que possuir recursos tecnológicos para realizar uma administração
eficiente dos processos em execução já que consultas curtas em dados detalhados,
apesar de não serem importantes em uma análise analítica agora podem ser muito
importantes, pois podem disparar um evento de compra de ações na bolsa de
24
valores por exemplo. Com isto os SGBDs utilizados para processos de Data
Warehouse no mercado têm que estar cada vez mais preparados para lidar com os
seguintes itens:
• Cargas de trabalho mistas (consultas táticas e estratégicas) para aplicativos
de missão crítica;
• Grandes volumes de dados detalhados;
• Grande número de usuários concorrentes.
25
4. PESQUISA
Para mostrar o valor que um projeto de BI pode agregar aos negócios pelo seu
poder de suporte a decisão, será apresentado um estudo de caso real de
implementação de um Data Warehouse em uma compania aérea de grande porte, e
o retorno obtido com este projeto (TERADATA, 2010).
A compania em questão é a Continental Airlines. A quinta maior compania aérea
americana e uma das maiores do mundo, que no ano de 2010 anunciou fusão com
outra grande compania aérea americada, a United Airlines. A continental opera vôos
para localidades nas Américas, Europa, Ásia e Oceania, transportando mais de 50
milhões de passageiros por ano.
4.1. ENTENDENDO A NATUREZA DOS NEGÓCIOS
A Continental, hoje uma empresa conceituada com mais de 49.000 empregados,
passou por sérias dificuldades nos anos 80, o que levou a uma completa
reformulação de suas estratégias de negócios. Como ponto chave desta nova
estratégia, criou um plano divido em 4 partes interrelacionadas que lidam com
produtos, finanças, mercado, pessoas e que guiam a empresa até os dias de hoje:
• Voar para vencer.
• Entender quais produtos os clientes desejam e quanto desejam pagar por
eles.
• Financiar o Futuro
• Gerenciar custos e caixa para que a compania continue a operar
• Fazer da rentabilidade uma realidade
• Levar os clientes em seus destinos com segurança, no tempo esperado e
com sua bagagem.
• Trabalhar Juntos
26
• Criar uma cultura em que pessoas tenham satisfação com o trabalho.
Em meados dos anos 90 a empresa já estava num patamar muito diferente do
passado, mas para continuar se transformando e se adaptando as mudanças de
mercado, assim como outras empresas, o suporte da área de TI se tornou
fundamental.
Em 1995 a empresa possuia apenas um relatório de performance diário, fornecido
por empresa terceirizada, sem detalhes financeiros e com dados detalhados
históricos inacessíveis. Cada área possuia seu próprio gerenciamento dos dados, o
que os tornava inconcistentes, e não existia estrutura corporativa que permitisse a
usuários importantes, acesso rápido as informações chave dos negócios da
empresa. Com a visão de que a compania deveria disponibilizar acesso rápido a
toda a informação de que os funcionários necessitavam, e acreditando que com a
informação certa, as pessoas não apenas tomariam melhores decisões mas também
descobririam novas oportunidades, a direção da empresa decidiu investir num Data
Warehouse corporativo (EDW – Enterprise Data Warehouse), construído e
administrado internamente.
4.2. MOTIVAÇÕES PARA O PROJETO INICIAL
A etapa incial da implementação, partiu da área de Gestão da Receita (Revenue
Assurance). A Análise da receita de um vôo era restrita a demanda de apenas um
trecho, os seja, a empresa não conseguia rastrear um itenerário da origem ao
destino se houvesse mais de uma escala. Isto ocorria por não haver acesso à
informação integrada detalhada como agendamento, reservas, dados do cliente,
inventório, tabelas de valor de mercado, etc. Os dados históricos eram inferiores a
um ano, portanto análises de tendências eram ineficazes. Devido a estas
particularidades esta área foi implementada no DW como o primeiro Data Mart da
companhia.
Um item importante na continuidade da expansão do Data Warehouse, foi a criação
de uma equipe de Marketing de Relacionamento com os Clientes (Customer
Relationship Marketing). Até a implementação do DW, não era possível determinar
27
quão valiosos os clientes eram e como predizer ou influenciar seu comportamento.
Quando um cliente entrava em contato com o setor de vendas de passagens, não
havia como os atendentes saberem se era um cliente ocasional ou um cliente
especial, nem mesmo informações sobre agendamentos ou histórico da bagagem. A
informação era limitada e muitas vezes incorreta.
A implementação da gestão da receita juntamente com o relacionamento do cliente
começaram a mostrar o valor do EDW, valores que dependendo do planejamento e
implementação do projeto podem ser difíceis de serem percebidos, portanto como
era de se esperar o projeto começou a crescer
4.3. IMPLEMENTAÇÃO
Para suportar o ambiente do Data Warehouse foi escolhido o SGBD Teradata, líder
de mercado neste segmento. Um ambiente inical de 8TB, suportando 1292 usuários
que acessam 42 áreas e 29 aplicações.
O primeiro Data Mart implementado, como visto anteriormente, foi o de gestão da
receita. Para este trabalho, após um grande esforço de melhoria na qualidade dos
dados, como o tratamento da entrada de informações nos aplicativos, as principais
tabelas dos sistemas fonte foram mapeadas e carregadas no DW em sua forma
normalizada. O modelo dimensional era criado e mantido carregado para algumas
consultas frequentes, para fins de desempenho, ou apenas criado e carregado
dinamicamente por meio de tabelas temporárias para análises Ad Hoc. Este tipo de
recurso economiza tempo devido aos dados normalizados estarem carregados no
DW.
Após a implementação do primeiro Data Mart e dos ganhos percebidos, o ambiente
começou a evoluir.
Dados de 25 sistemas operacionais internos e de duas fontes externas passaram a
ser carregados no ambiente. Para utilizar estes dados um grande projeto de ETL
teve de ser realizado. Mais uma vez os dados foram avaliados a fim de garantir sua
qualidade ao serem carregados do DW.
28
Algumas fontes disponibilizavam os dados para serem carregados quase em tempo
real, funcionalidade permitida pelo software Tpump do Teradata, que permite que se
estipule uma letência no carregamento, colocando assim o mínimo de travas
necessários nas tabelas alvo, a fim de permitirem que análises possam rodar sem
impactos durante as cargas. Já alguns sistemas disponibilizavam os dados para
serem carregados no modo Batch. Estas abordagens foram baseadas nas
capacidades dos sistema fonte para disponibilização dos dados e nos requerimentos
dos negócios para atendimentos de metas de tempo. Para separar os dados Batch
das consultas de usuários, foram criadas duas janelas, a de consulta (User Window)
e de carga (Batch Window). O SGBD utilizado pode gerênciar os pesos e restrições
a serem aplicados de acordo com a janela.
Janela
Usuário
Batch
(User)
(Carga)
08:00
- 20:01
Período 20:00
07:59
Figura 11: Janelas
Fonte: dados da pesquisa
-
29
Alguns dos principais sistemas fonte podem ser vistos na figura a seguir.
Sistemas fonte
Schedules
Inventory
Reservations
Airline tickets
Airline revenue flown information
SOCC(Systems
Operation
Coordination Center)
One Pass (frequent flyer program)
Customer profiles and demographics
Aircraft maintenance
Alliance data
Employee and crew payroll
Customer care
Figura 12: Sistemas fonte.
Fonte : dados da pesquisa
Com a inclusão de mais Data Marts, mais aplicações foram desenvolvidas, entre
elas:
• Gerenciamento de Receita: Provê projeções de receita em tempo real para
qualquer vôo baseado em dados detalhados. Com isto decisões de preço e
agendamento podem ser tomadas e a associação entre rotas e aeronaves
pode ser otimizada.
30
• Customer Relationship Management: Provê uma visão única e integrada de
cada cliente, apresentando com isto uma visualização apurada e atualizada
da importância de cada cliente.
• Flight Management Dashboard: Rastreamento de cada vôo e mapeamento
dos vôos atrasados, informação base para decisões que influenciam
diretamente na satisfação dos clientes e no rendimento da compania.
• Detecção de Fraude: Identifica reservas não tarifadas e comprimento de
contratos, assim como reservas suspeitas e transações de bilhetes.
4.4. ACTIVE DATA WAREHOUSING
Disponibilizar a informação em tempo real foi uma peça chave na estratégia dos
negócios da empresa. Esta decisão veio do fato de que a Continental percebeu que
se os dados operacionais tivessem mesmo que um dia de “idade”, situações críticas
não poderiam ser analizadas e encaminhadas para as áreas responsáveis no
decorrer do dia. Clientes especiais não poderiam ser identificados e tratados como
deveriam para que continuassem leais a compania e aos negócios. Respostas a
atrasos e novas reservas de vôos de conexão não poderiam ser feitas rápido o
suficiente. Aviões com muitos lugares vagos poderiam decolar enquando
passageiros poderiam ser impedidos de embarcar devido à overbooking. Com
informações atualizadas (quase) em tempo real, muitos destes problemas logísticos
e operacionais poderiam ser resolvidos a tempo.
Graças a esta visão a arquitetura de demanda do ambiente de DW foi planejada
desde as primeiras fases de design na introdução do ambiente. Processos de ETL
foram planejados, automatizados e monitorados por uma equipe de 15 pessoas
especialistas em TI.
Em meados de 2001 os dados em tempo real foram finalmente disponibilizados ao
DW para todas as aplicações vistas anteriormente. Enquanto isto consultas
estratégicas utilizando dados históricos também eram utilizadas. Na Figura 13 podese observar uma visão macro do ambiente de DW.
31
Figura 13: Sistemas fonte.
Fonte: dados da pesquisa
Devido à importância que o DW passou a ter para a empresa foi decidido que o
ambiente passasse a operar na escala 24x7 (24 horas, 7 dias da semana) com
recursos de alta disponibilidade como redundância de servidores para evitar
paradas. Na Figura 14 pode-se visualizar a evolução do ambiente.
32
Ano
1998
2001
2010
Usuários
45
968
1292
Tabelas
754
5851
16226
Marts)
11
33
42
Aplicações
0
12
29
Equipe DW
9
15
15
Áreas
(Data
Figura 14: Quadro de evolução do ambiente.
Fonte: dados da pesquisa
4.5. RETORNO SOBRE INVESTIMENTO
Uma das terafas mais complicadas em projetos de TI é a parte de avaliação do
Retorno sobre o Investimento realizado (ROI – Return Over Investment). Muitas
vezes
é
possível
obter
uma
percepção
de
melhoria
com
determinada
implementação, seja ela na velocidade com que os processos são executados ou na
própria organização dos mesmos, mas dependendo de sua natureza, a tarefa de
mensurar esta percepção em valores exatos é árdua e muitas vezes até impossível.
Isto se deve ao fato de normalmente não possuirmos um cenário bem controlado
antes da implementação ou até mesmo devido ao fato da própria empresa não
realizar este levantamentamento após a implementação.
Esta dificuldade torna-se um pouco menos árdua, ou pelo menos um pouco mais
precisa quanto a implementação do projeto de BI na emresa desta pesquisa, devido
ao fato das informações táticas ou estratégicas, afetarem em tempo real os
processos da empresa, como por exemplo, na distribuição de passageiros entre as
aeronaves.
33
Devido a esta característica, e também ao esforço realizado para isto, foi possível
mapear e estipular na Continental Airlines, o retorno sobre o investimento realizado
no projeto de BI, com destaque especial para os itens apresentados a seguir:
• Economia de U$ 20 milhões em capital e de U$ 15 milhões em utilização de
Data Centers.
• Economia anual de U$ 31 milhões em operações do negócio como resultado
direto da utilização do EDW.
• Aumento de receita estimado em U$ 40 milhões em 2002 devido as novas
aplicações de Gerenciamento de Receita, Detecção de Fraude, Folha de
pagamento da tripulação e CRM.
• U$ 5 milhões de incremento de receita com o mapeamento e previsão de
demanda conforme origem e destino.
• Economia anual de U$ 10 milhões como resultado do aperfeiçoamento da
habilidade de medir o impacto da venda de tarifas.
• Economia de U$ 20 milhões devido a mellhoria do suporte a decisão e
sistemas de agendamento baseados em demanda e overbooking.
• U$ 30 milhões economizados em 3 anos devido a prevenção de fraudes e 7
milhões reembolsados.
• De U$ 15 a U$ 18 milhões economizados e de aumento de receita como
resultado de promoções melhor planejadas.
Nos primeiros cinco anos de operação, conforme informado pela empresa, o EDW
alcançou um ROI de mais de 1000% em relação aos U$ 25 milhões investidos
inicialmente. A empresa não só obteve um substâncial retorno quantitativo direto
sobre seu investimento como também obteve reconhecimento do mercado por meio
de prémios e ótimas avaliações.
Estes foram alguns valores possíveis de se mensurar e que mostram diretamento o
benefício de um projeto bem realizado de Busines Inteligence. É necessário manter
em mente que também são agregados valores qualitativos difíceis de mensurar mas
34
muito importantes para os negócios, como melhoria na qualidade do atendimento,
aumento da satisfação dos clientes e dos próprios funcionários entre outros.
5. CONCLUSÕES
Este trabalho apresentou os conceitos de BI e de Data Warehouse, coração desta
tecnologia. Foi mostrado a importância de um bom planejamento, do correto
entendimento dos negócios da empresa juntamente com um estudo de caso bem
sucedido no qual foi possível mensurar o retorno sobre o investimento da
implementação. Devido ao tempo necessário para o projeto, implementação e
avaliação dos resultados obtidos com um DW, não foi possível apresentar na parte
de pesquisa deste trabalho um estudo de caso de implementação realizado pelos
autores, tendo os mesmos que optar pela apresentação de um estudo de caso de
uma grande empresa do ramo de Data Warehouse.
Para que implementações de BI sejam bem sucedidas como a apresentada, é
importante que todos os fatores vistos sejam bem avaliados e planejados, assim
como o objetivo que se pretende alcançar com a implementação em si.
Valores agregados com a implementação, como satisfação e qualidade são por
vezes difíceis de mensurar e isso torna difícil a afirmação de que a implementação
foi bem sucedida quando estes são os únicos valores adquiridos.
A integração da tecnologia de BI com outros sistemas, como o CRM, é vista como
muito benéfica e é cada vez mais adotada pelas empresas que querem melhorar
seus processos de tomada de decisão.
Um projeto de BI demanda recursos financeiros e de mão de obra qualificada e
também tempo razoável entre o estágio de levantamento de requisitos até o estágio
de elaboração de relatórios gerenciais e de um Active Data Warehouse, tornando o
apoio da alta direção um dos fatores fundamentais para o sucesso.
35
6. REFERÊNCIAS BIBLIOGRÁFICAS
BARBIERI, Carlos. BI – Business Intelligence: Modelagem & Tecnologia. Rio de
Janeiro: Editora Axcel Books, 2001.
Microsoft. Academia Microsoft Technet - Business Intelligence. Disponível em:
<http://www.technetbrasil.com.br/academia2007/bi/Secure/Mod1.aspx>. Acesso em:
14 de julho de 2010.
SERAIN, João Sidemar. Por que Business Intelligence? Disponível em:
<http://imasters.uol.com.br/artigo/5415/bi/por_que_business_intelligence>.
Acesso
em: 14 de julho de 2010.
TERADATA.
Introduction
to
the
Teradata
Database.
Disponível
em:
<http://www.teradatau.courses.teradata.com/learning/BLADE%5FMS/legacy/18109%
5FIntrotoTeradata/wbt-printmod00.htm>. Acesso (restrito) em: 10 de março de 2008.
TERADATA. Case Study > Data Warehousing: Continental Airlines. Disponível em:
<http://www.teradata.com/t/case-studies/Continental-Airlines-Case-Studyeb4349/?type=CS>. Acesso em: 01 de setembro de 2010.
36
Autorização de Divulgação de Trabalho Técnico
AUTORIZAÇÃO DE PUBLICAÇÃO
AUTORIZAMOS A PUBLICAÇÃO DE NOSSO TRABALHO NA
INTERNET, JORNAIS E REVISTAS TÉCNICAS DO IETEC.
NÃO AUTORIZAMOS A PUBLICAÇÃO OU DIVULGAÇÃO DO
NOSSO TRABALHO.
BELO HORIZONTE, 16/09/2010
CURSO: GESTÃO E TECNOLOGIA DA INFORMAÇÃO
SEMESTRE/ANO: 1º DE 2010
TURMA: 15
TÍTULO DO TRABALHO: BUSINESS INTELIGENCE: O PAPEL DO
DATA WAREHOUSE NO PROCESSO DE SUPORTE A TOMADA DE
DECISÃO
NOME DOS PARTICIPANTES
Alexandre Antônio de Vasconcelos
André Caribé Pinheiro
Ivani Aparecida Alves
Rafael Tardelli Pacheco dos Santos
Wantuil Silva
ASSINATURA
Download

IETEC – INSTITUTO DE EDUCAÇÃO TECNÓLOGICA