FACULDADE DE BALSAS CURSO DE SISTEMAS DE INFORMAÇÃO CRIAÇÃO DE UM AMBIENTE DE EXPLORAÇÃO OLAP PARA ANALISAR DADOS DAS VENDAS DO GRUPO DE POSTOS DE COMBUSTÍVEIS PIONEIRO CAIRO DA SILVA BORGES BALSAS (MA) 2010 FACULDADE DE BALSAS CURSO DE SISTEMAS DE INFORMAÇÃO CRIAÇÃO DE UM AMBIENTE DE EXPLORAÇÃO OLAP PARA ANALISAR DADOS DAS VENDAS DO GRUPO DE POSTOS DE COMBUSTÍVEIS PIONEIRO POR: CAIRO DA SILVA BORGES Trabalho de Conclusão de Curso apresentado como exigência parcial para obtenção do título de Bacharel em Sistemas de Informação à Faculdade de Balsas, sob a orientação do Professor Junior Bandeira. BALSAS (MA) 2010 FACULDADE DE BALSAS CURSO DE SISTEMAS DE INFORMAÇÃO A Comissão Examinadora, abaixo assinada, aprova o Trabalho de Conclusão de Curso (TCC). CRIAÇÃO DE UM AMBIENTE DE EXPLORAÇÃO OLAP PARA ANALISAR DADOS DAS VENDAS DO GRUPO DE POSTOS DE COMBUSTÍVEIS PIONEIRO Elaborada por CAIRO DA SILVA BORGES como requisito parcial para obtenção de Bacharel em Sistemas de Informação BANCA EXAMINADORA __________________________________ Prof (a). Junior Bandeira Prof. Orientador __________________________________ Prof (a). José Sinotti Membro da Banca Examinadora __________________________________ Prof (a). Cassiana Fagundes Membro da Banca Examinadora DEDICATÓRIO Dedico este trabalho de conclusão de curso a Deus por me ter oferecido a oportunidade de viver, evoluir a cada dia, a todos os meus familiares que me ajudaram a alcançar mais um objetivo na minha vida, aos meus pais em especial pelo apoio e carinho recebido durante esta etapa, a minha namorada que não mediu esforços para me ajudar a continuar nesta trajetória. AGRADECIMENTOS Ao Profº. Junior Bandeira, meu orientador, pelo apoio, paciência, credibilidade e compreensão que me proporcionou. Ao Profº Gustavo Borges, meu co-orientador, pela ajuda prestada e atenção dedicada a este trabalho. Ao Coordenador do curso de Sistemas de Informação, Profº Marlon Possani, pela amizade e apoio dedicado durante todo o período acadêmico. Aos meus companheiros de curso. A todos que contribuíram direta e indiretamente na realização deste trabalho. RESUMO Na busca de um diferencial competitivo as empresas atuam dinamicamente. Nesta busca, uma das técnicas é transformar dados armazenados com o tempo em informações que auxiliem a tomada de decisão com o objetivo de descobrir fatos e atuar com ações. Este tipo de solução é a Business Intelligence (BI), que utiliza ferramentas que possibilitam a exploração dos dados, transformando em informações visuais e de fácil entendimento para os gestores. No mercado existem inúmeras ferramentas de BI, o presente trabalho utilizou o software livre, PENTAHO na versão 3.5. Aplicou-se a solução de BI ao Grupo de Postos de Combustíveis Pioneiro na qual se constitui por empresas localizadas nas cidades de Balsas e Açailândia no Maranhão. A solução resume-se na construção de um cubo OLAP, onde o mesmo explora uma grande massa de dados precisos e rápidos, referente às vendas ocorridas entre os períodos de 2009 e 2010. Construiu-se ainda um Data Mart de vendas para armazenar e centralizar os dados históricos, além de um framework em linguagem de programação PHP que realizou a importação dos dados dos Data Warehouses para o Data Mart central. Dessa forma a solução proveu uma comparação dos dados explorados com os feriados e fatores socioeconômicos de cada uma das cidades utilizando a técnica de estatística Anova, com objetivo de agregar conhecimento para analisar fatos ocorridos nos períodos, ou ainda, usando a solução como vantagem competitiva. Palavras - chaves: Business Intelligence (BI). Postos Pioneiro. OLAP. Banco de Dados. SUMÁRIO 1. INTRODUÇÃO ........................................................................................................ 9 1.1 Delimitação do tema .......................................................................................... 9 1.2 Problemática ...................................................................................................... 9 1.3 Objetivos ............................................................................................................ 9 1.3.1 Geral ........................................................................................................... 9 1.3.2 Específico.................................................................................................... 9 1.4 Justificativa ...................................................................................................... 10 1.5 Metodologia ..................................................................................................... 10 2. REFERENCIAL TEÓRICO .................................................................................... 12 2.1 Armazenamento de Banco de Dados .............................................................. 12 2.2 Business Intelligence ....................................................................................... 12 2.2.1 Fontes de dados........................................................................................ 13 2.2.2 ETL (Extraction, Transformation and Loading).......................................... 14 2.2.3 Modelagens ............................................................................................... 14 2.2.4 Data Warehouse e Data Marts .................................................................. 17 2.2.5 Exploração dos dados ............................................................................... 18 2.2.6 Cubos de dados OLAP.............................................................................. 20 2.2.7 Linguagens................................................................................................ 27 2.2.8 Ferramentas OLAP ................................................................................... 28 2.3 PENTAHO uma ferramenta Open Source de BI .............................................. 28 2.3.1 A Plataforma ............................................................................................. 28 2.3.2 Características .......................................................................................... 30 2.3.3 Ferramentas .............................................................................................. 30 2.4 SPSS (Statistical Package for the Social Sciences) ........................................ 34 2.4.1 Análise de variância (Anova) ..................................................................... 35 3. ESTUDO DE CASO .............................................................................................. 37 3.1 A Empresa ....................................................................................................... 37 3.2 As vendas ........................................................................................................ 39 3.3 A solução ......................................................................................................... 40 3.4 Relações entre vendas com feriados e fatores socioeconômicos ................... 51 4. CONCLUSÃO........................................................................................................ 57 5. REFERÊNCIAS BIBLIOGRÁFICAS ...................................................................... 58 9 1. INTRODUÇÃO Neste capítulo serão apresentados os objetivos definidos no trabalho, justificativas e metodologias utilizadas assim como a delimitação do tema proposto. 1.1 Delimitação do tema O trabalho busca apresentar a criação de um ambiente de exploração dos dados através da técnica OLAP com a montagem de um cubo para analisar os dados das vendas nos períodos de 2009 e 2010 do Grupo de Postos de Combustíveis Pioneiro, fazendo uma comparação entre os feriados e fatores socioeconômicos com as vendas neste período e exemplificando como eles podem ser utilizados na tomada de decisões. 1.2 Problemática A problemática do sistema atual está em não proporcionar ao gestor uma visão completa do andamento das vendas, podendo analisar os dados em apenas duas dimensões (tempo e vendas), o que dificulta uma tomada de decisões mais rápida e precisa, além da demora no processamento dos dados pré-existentes. 1.3 Objetivos 1.3.1 Geral Tornar a gestão do Grupo de Postos de Combustíveis Pioneiro mais dinâmica, com base na análise de relatórios multidimensionais oriundos do Cubo OLAP. 1.3.2 Específico • Fazer comparativo de vendas e lucratividade entre períodos semelhantes; • Analisar se existem relações entre os feriados e fatores socioeconômicos com as vendas nos períodos de 2009 e 2010; • Criar um Data Mart central para importação dos dados das vendas; • Definir a estrutura do Cubo; • Estudar e implementar a ferramenta PENTAHO; • Proporcionar uma visão completa do andamento das vendas de todos os produtos; 10 • Tornar a tomada de decisões mais precisa, tendo como referencial os dados extraídos do Cubo OLAP; 1.4 Justificativa Através de relatos informais fornecidos pelo gestor do Grupo de Postos de Combustíveis Pioneiro, pode-se analisar a dificuldade em realizar comparativos de vendas com a ferramenta de gestão atual, de acordo com a problemática supracitada. O sistema atual possibilita também a realização de comparações entre períodos, porém não oferece o dinamismo que o Cubo OLAP proporciona. A ferramenta proposta gera relatórios interligados enquanto que o sistema atual gera relatórios em separado, o que dificulta a visualização do conjunto de dados. Com a criação do ambiente de exploração OLAP através da montagem do Cubo, cada face pode ser analisada para posterior agrupamento dos dados das outras faces. A implantação do Cubo OLAP traz consigo a possibilidade de uma gestão facilitada, ampliando as potencialidades do empreendimento com os benefícios agregados pelo mesmo. 1.5 Metodologia O levantamento dos dados foi realizado através das informações reais de vendas, repassadas pelo gestor do Grupo de Postos de Combustíveis Pioneiro, como também pelos relatos informais do mesmo. A metodologia utilizada para o desenvolvimento deste trabalho é constituída por quatro fases: Primeira: análise quantitativa (juntamente com o gestor da empresa) para extração de informações pertinentes às vendas do grupo; Segunda: realização de estudo sobre a técnica OLAP; Terceira: Implementação da técnica do Cubo OLAP com referência aos dados extraídos na primeira fase, analisando-se especificamente os resultados obtidos com a ação. 11 Quarta: Utilização da técnica de Anova (análise de variância) para realizar uma comparação entre os feriados e fatores socioeconômicos com as vendas nos períodos de 2009 e 2010. O trabalho que segue, está dividido da seguinte forma: capítulo 2; todo o referencial teórico com as definições das técnicas utilizadas; no capítulo 3 o estudo de caso, com a definição da necessidade do gestor do Grupo de Postos de Combustíveis Pioneiro além da contextualização do ambiente explorado, a definição do modelo e ferramentas utilizadas bem como os resultados obtidos, finalizando com a análise entre as vendas e os feriados e fatores socioeconômicos. Por fim, no capítulo 4 as considerações finais do trabalho desenvolvido. 12 2. REFERENCIAL TEÓRICO Neste tópico será abordado todo o referencial teórico utilizado no trabalho, bem como as definições das técnicas e ferramentas que foram utilizadas. 2.1 Armazenamento de Banco de Dados De acordo com o livro escrito por Ferrari (2007) banco de dados pode ser definido como um local no qual é possível armazenar informações, para consultas ou utilização quando necessário. Já Ramakrishnan (2008) define Sistemas Gerenciadores de Banco de Dados (SGBD) um software projetado para auxiliar a manutenção e utilização de vastos conjuntos de dados. Com o passar do tempo os dados armazenados se tornaram grandes e volumosos sendo capaz de gerar uma lentidão em consultas e processamento, para solucionar este problema surgiu então os Sistemas de Banco de Dados Relacionais (SGBDR), cuja principal característica é gerenciar seus dados usando apenas as capacidades relacionais. Segundo Rosa (2004) hoje o grande problema dos SGBDs, tornou-se a manipulação das informações, nunca se precisou extrair informações inteligentes como agora, o principal motivo disso está em que as empresas crescem constantemente com dados e informações. 2.2 Business Intelligence Nos últimos tempos, os sistemas empresariais avançaram consideravelmente, por conseguinte, os dados também evoluíram, em função desse crescimento, a utilização do processo de Inteligência de Negócios (BI) em uma organização cresceu fortalecendo a obtenção de informações gerenciais de maneira rápida e flexível de tal forma que os gestores da empresa possam tomar decisões gerenciais. A implantação do BI em uma empresa deve-se relacionar diretamente com o gestor da empresa, definindo o objetivo geral, através de entrevistas, estabelecer os objetivos específicos em base com os dados analisados. A partir das informações coletadas, pode-se realizar uma análise das ferramentas necessárias. Para Felber (2005) BI é a utilização de uma série de ferramentas para coletar, analisar e extrair informações, que serão utilizadas no auxílio ao processo de tomada de decisões. 13 A figura 1 exibe todo o framework de implantação de BI em uma empresa, dando-se inicio a extração, carregamento e transformação dos dados contidos no Data Warehouse que por sua vez pode ser organizado por Data Marts. O Data Warehouse como o Data Mart serve de fonte de dados para exploração OLAP e Data Mining, com resultado final exibido em interface intuitiva os dados explorados. Figura 1: Processo de BI (Business Intelligence) Fonte: Miranda (2010) Um dos principais problemas encontrados durante o processo de extração dos dados de outras fontes é a forma de que estes dados estão modelados, dificultando todo o processo de BI, para isto o processo de Extraction, Transformation and Loading (ETL) cuida do tratamento. 2.2.1 Fontes de dados As fontes de dados são necessariamente os softwares instalados na empresa, por exemplo: (aplicativos comerciais, sistema de estoque, base de dados, etc.), dados externos (internet, documentações), planilhas eletrônicas. Toda a fonte de dados possui seu repositório de dados independente com o objetivo de realizar as atividades e armazenar seus dados. 14 2.2.2 ETL (Extraction, Transformation and Loading) ETL basicamente, esse processo indica que as informações devem ser extraídas das bases transacionais, transformadas para se adequar ao modelo multidimensional definido, e carregadas no Data Warehouse. Existem diversas ferramentas que visam apoiar a execução desse processo. Durante o processo a parte mais difícil se encontra na transformação, pois, indica as regras que devem ser aplicadas sobre os dados para evitar redundâncias e inconsistências garantindo uma visão única e integrada dos dados. O processo de ETL possibilita extrair os dados de diversas fontes criando uma visão única e consistente dos dados, a seguir a figura 2, ilustra o processo de ETL. Figura 2: Processo de ETL Fonte: Withee (2010, Pag. 78) O processo de ETL deve ser realizado de forma dinâmica sem deixar de lado a regra de negócio que a empresa definir, deixando os dados de todo o processo de forma simples para compreensão. 2.2.3 Modelagens O SGBD possibilita que os usuários definam os dados que serão armazenados em forma de modelo de dados, as modelagens podem ser definidas como: • Modelagem Relacional: A modelagem relacional foi criada para facilitar os acessos aos dados possibilitando que os usuários utilizassem uma grande variedade de abordagens no tratamento das informações, conforme Rodriguez (2000) este modelo está baseado 15 no modelo matemático de relacionamento de conjuntos, a estrutura de dados é flexível tornando a visão dos dados simplificada. Seu principal conceito é a Entidade Relacionamento (ER), que descreve todo sistema e o relacionamento entre os dados em um modelo gráfico. A modelagem relacional é a mais utilizada para modelagem de dados, pela sua forma estruturada de relacionar os dados. • Modelagem Orientada a Objetos: Os conceitos de orientação a objetos também pode ser representada em banco de dados assim como na programação, Rodriguez (2000) representa uma estrutura, onde os dados são tratados como objeto e através disso é possível relacionar com atributos. De acordo com Figueiredo e Soares (2005) em seu artigo define a comparação entre modelagem relacional e modelagem orientada a objetos, enquanto a modelagem estruturada relacional baseia-se em conceitos de entidades e atributos, tais como relacionamentos, normalização, chaves para evitar a redundância e inconsistência à modelagem orientada a objetos se define basicamente em conceitos, estruturas e modelos baseados no mundo real. • Modelagem Multidimensional: Apresenta características de utilizar uma estrutura de dados em dimensões, através de uma tabela centralizadora (tabela fato), e de tabelas que se relacionam com a mesma, chamada de tabela dimensões, enquanto a tabela fato armazena as medidas e variáveis, as tabelas dimensões caracterizam por apresentar visões sobre as medições e formas de visualizar os dados. Através de uma estrutura multidimensional se torna mais fácil a análise dos dados de forma detalhada sendo mais efetiva para o ambiente empresarial. A implementação se torna mais complexa necessitando de uma linguagem para o modelo, como a “MDX”, sendo muito parecida com o SQL, porém suporta realizar consultas de n dimensões, enquanto o SQL suporta apenas duas dimensões, das vendas por tempo como mostra a figura 3. 16 Figura 3: Visão SQL e Multidimensional Fonte: Autor Próprio (2010) Surgiu então o conceito de cubo, pois o mesmo apresenta uma melhor visão dos dados explorados, a figura 4 mostra um modelo de cubo, o assunto será mais detalhado no item 2.2.6. Segundo Maganha (2006), a modelagem multidimensional permite que o usuário final observe seu banco de dados em formato de cubo com n dimensões, o número de dimensões é definido pelo projetista baseado em aspectos comuns de negócio da empresa. Figura 4: Cubo de dados sob visão Multidimensional Fonte: Oracle (2010) A modelagem multidimensional é a forma mais indicada para realizar a visualização de dados estruturados em várias dimensões realizando uma exploração mais efetiva dos dados. 17 2.2.4 Data Warehouse e Data Marts Segundo Ramakrishnan (2008) o Data Warehouse contém dados de diferentes fontes de dados, cobrindo um longo período de tempo. Data Warehouse quer dizer (armazém de dados), os dados deste ambiente são utilizados de forma analítica para o processo de tomada de decisão dos negócios. Para visualizar e realizar as análises sobre os dados armazenados no Data Warehouse podem ser utilizadas, basicamente, duas abordagens: ferramentas OLAP e mineração de dados. Conforme Araújo (2007) a tecnologia OLAP possibilita às organizações um método de acesso, visualização, e análise de dados corporativos com alta flexibilidade e desempenho, por meio de relatórios e análises a cubos de dados. De acordo com Alves (2009) Data Mart são na verdade um subconjunto de informações existentes no Data Warehouse, cujo desenho é elaborado de tal forma a atender a um segmento ou unidade de uma organização. Como mostra na figura 5, a melhor estrutura de uma Data Warehouse é quando ele é composto por Data Marts, se não houver esta organização a complexidade de exploração e organizações dos dados serão imensas, além de gerar uma manutenção mais árdua e complexa. Data Mart é um subconjunto de uma Data Warehouse, cujo objetivo é facilitar a exploração de dados por áreas. Figura 5: Visão Data Warehouse e Data Marts Fonte: Autor Próprio (2010) 18 Conforme Barbieri (2001) o Data Warehouse é um banco de dados orientado por assunto, não volátil, integrado e variante ao tempo. O alto nível de complexidade para o desenvolvimento de certos Data Warehouse, faz com que seja necessário iniciar o desenvolvimento através de Data Marts departamentais, que ao final, serão integrados ao Data Warehouse. 2.2.5 Exploração dos dados A exploração de dados é a área que se dedica a busca do conhecimento através de grande quantidade de dados históricos. É notório que toda empresa necessita de conhecimento, porém é assegurado que existem passos anteriores como a obtenção de dados e consolidação destes em informação. Segundo Bispo (1998) as decisões são tomadas baseando-se em comparações e em tendências; é necessário realizar-se análises em diversas perspectivas (dimensões) do negócio com o passar do tempo. O Data Warehouse é a fonte para a exploração dos dados, Data Mining e OLAP são as técnicas mais utilizadas. Enquanto as técnicas de OLAP objetivam trabalhar os dados existentes, buscando consolidações em vários níveis, trabalhando fatos em dimensões variadas, a técnica de Data Mining busca algo mais que a interpretação de dados existentes. Visa fundamentalmente realizar inferências, tentando como que “adivinhar” possíveis fatos e correlações não explicitadas nas montanhas de dados de uma Data Warehouse / Data Marts (BARBIERI, 2001. Pag. 424). Com a exploração dos dados pode-se utilizar as técnicas de Data Mining e OLAP, a fim de proporcionar uma melhor análise dos dados. 2.2.5.1 Data Mining (Mineração de dados) Segundo Bispo (1998), Mineração de dados (Data Mining) faz uso de técnicas de inteligência artificial, lógica fuzzy, redes neurais e outras, que buscam nos históricos, de uma empresa, padrões e tendências nos dados. Com o uso de ferramentas de mineração é possível efetuar analises em grandes massas de dados e como resultado descobrir relacionamentos, padrões nas vendas gerando condições para a empresa realizar uma boa tomada de decisão. 19 A tecnologia utilizada no Data Mining procura em grandes quantidades de dados armazenados extrair padrões e relacionamentos que podem ser fundamentais para os negócios da empresa. Para exemplificar, pode-se descobrir que clientes estão comprando determinado produto, porque está comprando, a faixa etária dos clientes, qual horário que mais vende o local de venda de determinado produto, entre outros, enfim, dados que antes eram obscuros aos olhos de um analista, com o Data Mining são visíveis. 2.2.5.2 OLAP (Online Analytical Processing) OLAP é uma ferramenta de Business Intelligence utilizada para apoiar as empresas na análise de suas informações, visando obter novos conhecimentos que são empregados na tomada de decisão. Segundo Fonseca (2007) OLAP é parte da tecnologia de Data Warehouse que habilita usuários a explorar interativamente. Bispo (1998) caracteriza a visão multidimensional dos dados é um conceito que pode parecer algo completamente abstrato; porém, é mais natural, mais fácil e intuitiva, permitindo a visão dos negócios da empresa em diferentes perspectivas e, assim, transformando os usuários em exploradores de informações. O termo OLAP refere-se com objetivo final de transformar dados em informações capazes de suportar as decisões gerenciais de forma amigável e flexível ao usuário e em tempo hábil. OLAP trouxe uma grande capacidade de efetuar cálculos complexos como previsões, percentuais de crescimento e médias diversas considerando-se a variável tempo. A tecnologia OLAP possibilita às organizações um método de acesso, visualização, e análise de dados corporativos com alta flexibilidade e desempenho Araújo (2007), por meio de relatórios e análises a cubos de dados. Um cubo de dados é uma representação intuitiva do fato a ser analisado. Partindo dos primórdios da informática, quando um sistema que gerava relatórios era a principal fonte de dados residentes na empresa, toda vez que uma análise necessitasse ser feita, eram produzidos novos relatórios. Estes relatórios 20 eram produzidos pela área de informática, precisavam de muito tempo para ficar prontos e também, apresentavam os seguintes problemas: estáticos e com acúmulo de diferentes tipos de relatórios num sistema gerava um problema de manutenção. Os sistemas OLAP possibilitam efetuar diferentes tipos de consultas, eles efetuam a exploração dos dados no Data Warehouse. Neste tipo de análise denominada multidimensional os dados são representados como dimensões em vez de tabelas. O OLAP é uma solução de ambiente, integração e modelagem de dados. A maioria dos dados de uma aplicação OLAP, é originária de outros sistemas e fontes de dados. Para formular a topologia e o projeto de uma solução OLAP multidimensional as seguintes perguntas devem ser feitas: Quando?, O quê?, Onde? e Quem?. Essas perguntas formam a base de todos os campos multidimensionais. A obtenção dos dados originários das respostas são destinados ao Data Warehouse e, possivelmente para um ou vários Data Marts. As ferramentas OLAP são conhecidas pela sua flexibilidade, tem como principal características a visão multidimensional dos dados, sendo capaz de mostrar os dados de uma empresa através de várias perspectivas, ou seja, onde antes havia uma consulta simples em uma tabela relacional, agora se pode ter em mãos uma consulta onde várias tabelas relacionadas ou não podem ser vistas, manipuladas, comparadas e exploradas, a fim de identificar tendências e conduzir os negócios com precisão milimétrica nas decisões. Outra característica do OLAP, que o diferencia da mineração, é o fato de que a relação entre os dados não é apresentada diretamente, mas sim fornecendo uma interface intuitiva para consultas do usuário, onde o mesmo interage com as dimensões, faz consultas, verifica informações em profundidade e compara as informações. 2.2.6 Cubos de dados OLAP O conceito de cubo foi associado devido à semelhança entre as técnicas de modelagem e a apresentação visual de um cubo. A diferença entre o cubo de 6 lados para o cubo OLAP, é que o segundo não apresenta limite de dimensões 21 (lados) e medidas (tabela fato), sendo assim o primeiro serve apenas para conceito de multidimensão. O cubo possui dimensões e medidas associadas, e os dados são armazenados na forma de células. Um cubo de dados é um tipo de matriz multidimensional que permite que os usuários explorem a analisem uma coleção de dados de muitas perspectivas diferentes, geralmente considerando três fatores (dimensões) de cada vez (KAY, 2010). A Figura 6 apresenta os dados em forma de “cubo de 6 lados”, com três dimensões “produto”, “local” e “tempo”, ou seja, a quantidade vendida, pode ser visualizada quanto pela data, como por produto vendido e local de venda, neste caso podemos realizar consultas com “n” dimensões, usando a linguagem MDX, que será discutida nos próximos tópicos, e não se limitando a consultas simples como no uso da linguagem SQL. Figura 6: Cubo de dados Disponível in: Oracle (2010). Quanto à forma de visualização dos dados no cubo, tem que ser explorado para que todos os lados sejam visíveis, visualizando assim as vendas de forma dinâmica e intuitiva, a figura 7 exibe a explosão do cubo de dados já a figura 8 mostra a sua forma de organização. 22 Figura 7: Explosão do Cubo Fonte: Autor próprio (2010) Figura 8: Organização da medida e dimensões. Fonte: Autor próprio (2010) O Data Warehouse irá servir como base para construção dos cubos multidimensionais. As consultas OLAP são consultas de agregação. Os analistas querem respostas rápidas para estas consultas sobre conjunto de dados muito grande é natural considerar a computação prévia de visões (RAMAKRISHNAN, 2008. Pag. 706). Um cubo de dados é constituído por tabelas fatos e dimensões. As tabelas de fatos representam o tema central do cubo e contêm atributos que são medidas numéricas, pelas quais se quer analisar as relações existentes entre as dimensões. 2.2.6.1 Tabela fato No modelo multidimensional um fato é representado por uma tabela fato. Uma tabela fato é constituída de valores quantitativos e numéricos que representam um assunto especifico no Data Warehouse. 23 Um conceito de tabela fato é citado conforme Imhoff e Geiger (2003) uma tabela fato é a tabela dentro de um modelo dimensional que contém as medidas e métricas de interesse. Segundo Inmon (1997) a tabela fato é altamente indexada, ou seja, possui muitos índices. Em alguns casos todas as colunas da tabela fato são indexadas. O resultado que se obtém indexando todos os dados é uma tabela fato muito acessível. Como regra, a tabela fato não é atualizada. Cada dado carregado é armazenado em um novo registro. Conforme mostra a figura 9 a tabela vendas é caracterizada como a tabela fato. Figura 9: Tabelas dimensões e Tabela fato Fonte: Devmedia (2010). 2.2.6.2 Tabela dimensão Uma dimensão se constitui de elementos que permitem caracterizar um determinado fato, a figura 10 representa as dimensões mês, cliente, produto e região. Assim formando as dimensões da tabela fato vendas. Figura 10: Tabela Dimensões Fonte: Devmedia (2010) 24 Conforme Martins (2007), as informações são do tipo, tempo, geografia, produto, cliente entre outros. Sendo assim compostas por atributos e uma única chave primária, que interliga a tabela dimensão com a tabela fatos. Uma tabela dimensão é um conjunto de tabelas de referências que provêem a base para restringir a agrupar consultas para informação em uma tabela fato dentro de um modelo dimensional. A chave da tabela dimensão tipicamente é uma parte da chave concatenada da tabela fato, e tabela dimensão contém informação descritiva e hierárquica (IMHOFF, GALEMMO E GEIGER, 2003, p.400). Um modelo dimensional deve responder a algumas perguntas sobre o fato, onde aconteceu, quando aconteceu, o que aconteceu, e com quem aconteceu, a Figura 11 ilustra este modelo. Figura 11: Representando as dimensões do fato. Fonte: Machado (2004, pág. 115). Na visão de usuário, a tabela dimensão pode ser descrita como uma visão ou perspectiva do modelo analisado, pode-se dizer então que seria a pergunta de um determinado modelo de negócio, onde a resposta seria apresentada na tabela fato. 2.2.6.3 Técnicas de Modelagem Segundo Felber (2005), existem várias técnicas de modelagem multidimensional e relacional, dentre elas, as mais utilizadas são: Star Schema (esquema estrela) e Snowflake (esquema flocos de neve). 25 • Star Schema (esquema estrela) A tabela de fatos conecta-se as demais por múltiplas junções, e as tabelas de dimensões se conectam com a tabela de fatos com apenas uma junção, como mostra a Figura 12. Figura 12: Representa a disposição das dimensões no modelo estrela Fonte: Machado (2004, pág. 93) De acordo com Colaço (2004) como o próprio nome já diz, ele tem semelhança com uma estrela, sendo que é composta por uma grande entidade, ou melhor, uma tabela central dominante, chamada de tabela fato. No conjunto de entidades, ou tabelas menores, que são arranjadas ao redor da tabela de fato, são denominadas tabelas de dimensão. • Snowflake (esquema de floco de neve) O modelo Floco reduz o espaço de armazenamento dos dados dimensionais, mas acrescenta várias tabelas ao modelo, conforme mostra a figura 13. “O modelo floco de neve é o resultado da decomposição de uma ou mais dimensões, que possui hierarquia entre seus membros, pode se definir relacionamentos muitos para um entre os membros de uma dimensão, formando, por meio desses relacionamentos entre entidades de dimensão, uma hierarquia é o resultado da aplicação da terceira forma normal sobre as entidades de dimensão” (MACHADO, 2000, p. 74). 26 Figura 13: Representa a disposição no modelo Flocos de Neve Fonte: Machado (2004, pág. 94) O Modelo deixa mais complexa a exploração dos dados, tornando mais difícil a navegação pelos softwares que utilizarão o banco de dados. 2.2.6.4 Operações em cubo OLAP As características presentes nas ferramentas OLAP é a forma de operar os dados, como por exemplo, as operações de tipo, segundo Araújo (2007): • Slice and Dice É uma das principais características de uma ferramenta OLAP. Modifica a posição de uma informação dentro do cubo através da troca de linhas e colunas. • Drill Down Aumenta o nível de detalhe da informação consultada. • Drill Up Diminui o nível de detalhe da informação. • Drill Across Passa de um nível para outro na dimensão pulando algum nível intermediário. 27 • Drill Through Passa de uma informação contida numa dimensão para outra. Outras operações que podem ser encontradas no OLAP, mas com objetivos mais específicos são Drill Out, Drill Within, Sort, Ranking, Pivoting, Paging, Filtering, Tiling, Alerts, Break. 2.2.7 Linguagens Nos cubos OLAP, destaca-se as linguagens, MDX Para realizar consultas multidimensionais, e para padronização dos códigos de busca o XML. 2.2.7.1 XML (Extensible Markup Language) O Extensible Markup Language (XML) surgiu com o principal intuito de padronização do código e segundo Benedito (2010), suas principais características são buscas mais eficientes, desenvolvimento de aplicações flexíveis para web, integração de dados de fontes diferentes, computação e manipulações locais, múltiplas formas de visualizar os dados, atualização granulares dos documentos, fácil distribuição da WEB, escalabilidade e flexibilidade, separação do conteúdo da formatação, possibilidade de criação de tags sem limitação, interligação de banco de dados distintos, legibilidade do código. Extensible Markup Language (XML) é linguagem de marcação de dados (meta-markup language) que provê um formato para descrever dados estruturados. Isso facilita declarações mais precisas do conteúdo e resultados mais significativos de busca através de múltiplas plataformas. O XML também vai permitir o surgimento de uma nova geração de aplicações de manipulação e visualização de dados via internet (BENEDITO, 2010). 2.2.7.2 MDX A Linguagem MDX é semelhante à linguagem SQL, porém possibilita consultas multidimensionais, diferente da SQL onde é possível efetuar consultas com no máximo duas dimensões. Linguagem de consulta à base de dados multidimensionais criada pela Microsoft® em 1998, semelhante à linguagem SQL, parte de um padrão industrial, o OLE DB for OLAP. Permite a especificação de até 128 eixos de consultas, sendo, porém incomum a utilização de mais de 3 eixos (TENORIO, 2010). A linguagem MDX se torna uma fundamental característica das consultas em cubos OLAP, pela sua dinâmica multidimensional. 28 2.2.8 Ferramentas OLAP No mercado de BI (Business Intelligence) existem inúmeras ferramentas de soluções para OLAP, que proporcionam as empresas condições e características próprias para realizarem apoio à tomada de decisão, como soluções SQL SERVER, ORACLE, IBM, etc. Estas ferramentas proprietárias fornecem soluções somente para seus SGBDS, forçando as empresas utilizar estes recursos. Surge então às ferramentas gratuitas como o PENTAHO, uma ferramenta sob licença livre capaz de operar com a maioria dos SGBDS existentes no mercado. 2.3 PENTAHO uma ferramenta Open Source de BI O Pentaho Open Source Business Intelligence de acordo com Pentaho (2010) é uma plataforma completa de Business Intelligence (BI), desenvolvida, distribuída e implantada como código aberto, que inclui recursos de geração de relatórios, integração e armazém de dados (Data Warehouse), análise de informações em tempo real, painéis de controle gerencial, mineração de dados (Data Mining) e modelos estatísticos. Essa solução, atualmente, é a mais popular dentre as soluções de BI em código aberto do mundo. Ela é distribuída em duas versões: a versão Community (livre, gratuita) e a versão Enterprise (paga). A plataforma Pentaho é composta por vários componentes que podem ser usados integrados, como um pacote de soluções, ou isoladamente, para atender necessidades específicas. 2.3.1 A Plataforma A solução Pentaho define-se a si mesma como uma plataforma de BI orientada para a solução e centrada em processos. Ou seja, não só apresenta os resultados de uma forma única e dando uma visão geral do estado da empresa, como implementa os próprios processos (workflow) para a resolução de problemas detectados e apresentados. Segundo Pentaho (2010) a Pentaho Inc. integrou e promoveu o desenvolvimento de ferramentas open source que fornecem os recursos para criação de soluções de BI. O conjunto é conhecido por Pentaho Open BI Suíte (ou Suíte Pentaho), incluem as suítes Reporting (Relatórios), Analysis (Exploração dos dados), Data Integration (Extração dos dados), Dashboards (Relatórios personalizados) e Data Mining (Mineração de dados). Devido à sua estrutura em componentes, a Suíte pode ser utilizada para atender demandas que vão além do 29 escopo das Soluções de BI mais tradicionais. A figura 14 ilustra o processo da plataforma do Pentaho Open BI Suíte, o presente trabalho utilizou-se da versão 3.5. Figura 14: Plataforma Pentaho Open BI Suíte Fonte: Miranda (2010) As principais funcionalidades disponíveis, segundo Felber (2005) são: • Relatórios (Reporting): Fornece desde simples relatórios em uma página WEB, relatórios de alta qualidade tais como relatórios de indicações financeiras e relatórios ricos em conteúdos como tabelas, gráficos entre outros. • Análises (Analysis): Permite consultas de exploração interativa com operações slice-and-dice, drill-down e pivoting. Para exploração dos cubos OLAP. • Painéis (Dashboards): Reúnem relatórios, análises e outras exposições em um único local para simplificar o acesso, podendo ser customizado por usuário, role ou assunto. • Data Mining: Descobre relacionamentos ocultos nos dados, que podem ser utilizados para otimizar os processos de negócio e prever resultados futuros. 30 Permite que os resultados sejam exibidos em um formato de fácil entendimento ao usuário. • Workflow: Liga diretamente as medidas de desempenho de negócio aos processos, promovendo um ciclo contínuo de melhorias. 2.3.2 Características Conforme Pentaho (2010) O Pentaho reuniu inúmeras características que o faz ser o software livre de BI (Business Intelligence), mais utilizado no mercado, entre as principais estão: • Preço: O Projeto Pentaho considerado Open source, ou seja, o programa é distribuído gratuitamente com seu código-fonte aberto. • Usabilidade: A plataforma BI tem componentes de fácil integração com sistemas externos, e oferece interfaces de fácil customização. • Orientação a ferramentas: A plataforma de BI é centrada em processos e soluções. Ela não é projetada para ser um conjunto de ferramentas isoladas, é um sistema completamente integrado. • Extensão: O código fonte é fornecido. A infra-estrutura, componentes, mecanismos e interfaces podem ser facilmente modificados. • Foco em relatórios: A plataforma pode ser facilmente integrada aos processos de negócios e tem facilidades para a geração de relatórios. Regras de negócios são usadas para identificar problemas e exceções. 2.3.3 Ferramentas A plataforma Pentaho é composta por vários componentes que podem ser usados integrados, como um pacote de soluções, ou isoladamente, para atender necessidades específicas que são segundo Pentaho (2010): Mondrian – Servidor OLAP Jpivot – Visualização de cubos multidimensionais. Weka – Mineração de dados Kettle – Integração de dados JFreeReport – Gerador de relatórios 31 Schema Workbench – Criação dos cubos • Mondrian De acordo com Neto (2008) o Mondrian é um servidor OLAP, escrito em Java, e que foi incorporado como ferramenta ao pacote Pentaho. Ele executa consultas escritas na linguagem MDX e converte para SQL, lendo dados de bases relacionais e apresentando os dados no formato multidimensional, através de uma API Java. • JPivot Um das principais ferramentas que realizam a comunicação entre Mondrian e usuário é o Jpivot, uma interface gráfica desenvolvida em Java com código aberto, para visualização de cubos multidimensionais. É através dele que são feitas as consultas no cubo e também onde o cubo é visualizado, a figura 15 apresenta-se algumas funcionalidades do Jpivot. Figura 15: Barra de ferramentas JPivot Fonte: Autor Próprio (2010) 1: Esta opção permite colocar as dimensões em linhas, colunas ou passar por filtros. Os filtros, também conhecidos como Slicer (fatiar) permitem filtrar os dados contidos em uma dimensão membro, colocá-los em diferentes posições para melhor análise. 2: Esta opção permite a visualização e / ou editar a MDX para a atual consulta. 3: Permite organizar os valores dos campos em ordem crescente ou decrescente, mostrar ou ocultar membros. 4: Mostra os membro (s) pai de uma consulta em uma linha. 5: Impede a exibição de cabeçalhos repetidos ou que retornem valor zero, do tipo “All produto”, fazendo com que assim múltiplos campos da próxima dimensão sejam relacionadas com apenas um campo. 6: Inverte colunas/linhas ou linhas/colunas 32 7-8-9: Botões de Drill up e Drill down, que controlam o comportamento de uma query de diferentes modos de detalhamento. 10: O Drill Through adiciona uma seta indicativa nas medidas que possibilitem uma visualização mais especifica. 11: Mostra o gráfico referente a consulta atual. 12: Configura o gráfico, deixando personalizado da forma que o usuário desejar. 13: Configuração de impressão. 14: Exporta para PDF. 15: Exportar para o Excel. O Jpivot permite realizar toda a exploração através das tabelas do cubo e a analise das mesmas, a figura 16 ilustra a visualização de um cubo de dados no Jpivot: Figura 16: Visualização dos dados com o JPivot Fonte: Autor Próprio (2010) • Weka O Weka é um ambiente gráfico para Data Mining. Segundo Pentaho (2010) Permite ao usuário criar e testar hipóteses contra as bases de dados. Existem grandes potencialidades na utilização de Data Mining para apoiar o processo de tomada de decisão. 33 • Kettle Faz parte da suíte do Data Integration, e utiliza as técnicas de ETL, para a obtenção dos dados que virão das várias fontes de dados, e que obrigatoriamente teremos de cruzá-las em algum momento dentro do ciclo de ETL. Conforme Pentaho (2010) o Kettle é capaz de ler e escrever em vários formatos de SGBD, como Oracle, PostgreSQL, SQLServer, MySql, entre outros, e importar arquivos texto (csv ou fixo), planilhas Excel e bases de dados ODBC (apenas em Windows). Ele é um ambiente gráfico no qual conexões com fontes de dados são estabelecidas e seqüências de passos executam a extração de dados, sua modificação e a carga desses em um destino. O Kettle pode integrar dados entre empresas e sistemas, substituindo a criação de camadas de programas para integração por operações visuais. • JFreeReport Uma das principais funcionalidades é a geração de indicadores, como gráficos e painéis (Dashboards), os dois podem ser conectados a uma base de dados em uso, e apresentar os dados em tempo real. Os gráficos podem ser criados com modelos pré-definidos ou via Wizard com o sistema Report design, que se deu origem através do JFreeReport, tudo com uma interface fácil e intuitiva. • Schema Workbench O Schema Workbench cria os cubos no formato XML que serão processados e exibidos pelo Pentaho. Ele tem uma interface visual para navegar entre as definições do cubo, permitindo criar, além de métricas, dimensões e hierarquias, muitas das estruturas que agregam valor na exploração de um cubo OLAP, como métricas derivadas, cubos virtuais (combinações de tabelas fato) e atributos de dimensões, a figura 17 exibe a tela do Schema Workbench, cujo foi desenvolvido em java. 34 Figura 17: Criação do cubo no Schema Workbench Fonte: Autor próprio (2010) No próximo tópico será apresentada a ferramenta de estatística SPSS, que realiza a análise dos dados estatisticamente para apoiar a tomada de decisão, além disso, será abordada a técnica de Análise de variância (Anova) utilizada para comparar medidas e variáveis. 2.4 SPSS (Statistical Package for the Social Sciences) O software SPSS (Statistical Package for the Social Sciences) permite realizar cálculos estatísticos complexos, visualizar resultados de forma rápida permitindo assim aos seus usuários uma apresentação e uma interpretação sucinta dos resultados obtidos através de técnicas estatísticas, conforme Martinez e Ferreira (2007) com o SPSS é possível criar, definir e modificar variáveis, conhecer o número de casos e calcular percentuais para cada uma das variáveis existentes, calcular medidas simples e múltiplas, realizar cruzamentos de variáveis, gerar os mais diversos tipos de gráficos, verificar a existência de associações e/ou correlações entre variáveis, executar análises de variância, e muito mais, a imagem 18 exibe a tela inicial do SPSS, cuja apresenta semelhanças com o Microsoft Excel. 35 Figura 18: SPSS ela Inicial Fonte: Gerado pelo SPSS (2010) O SPSS pode ser utilizado nas mais diversas áreas do conhecimento e aplicações, tais como, marketing, psicologia, administração, educação, ciências sociais, serviço social, economia, finanças, saúde pública, pesquisa de mercado, pesquisa social, pesquisa eleitoral, pesquisa de opinião, pesquisa de mídia, entre vários. O software é proprietário da empresa IBM, sua licença é paga, a ultima versão atual do software é a 18.0, o sistema trabalha somente na plataforma Windows, as análises realizadas no sistema utilizarão somente menus e caixas de diálogos como mostra a figura 18, uma das principais técnicas utilizadas no software é a Anova (Análise de variância). 2.4.1 Análise de variância (Anova) É uma técnica estatística cujo objetivo é decidir se existem ou não diferenças significativas entre as médias de várias amostras de uma variável numérica, definidas por diferentes tratamentos. De acordo com Naresh (2004) na forma mais simples pode ter somente uma variável dependente (sofre efeitos do tratamento), que seja métrica. Deve haver também uma ou mais variáveis independentes (é a causa ou tratamento numa interrelação). 36 A saída final do teste de Anova é exibida através de uma tabela, onde consta a significância encontrada para tal teste, isto significa que é a probabilidade máxima de rejeitar acidentalmente uma hipótese nula ou verdadeira, como mostra a figura 19: Figura 19: tabela Anova Fonte: Gerado pelo SPSS (2010) Conforme Aaker e George (2007) a tabela Anova é uma forma convencional de apresentar um teste de hipótese que trate das diferenças entre diversas medias, se a significância for acima de 0,05 isto expressa que não tem relação entre as variáveis (resultado nulo), caso o valor for abaixo, mostra-se então que possui relação entre as mesmas (resultado verdadeiro). 37 3. ESTUDO DE CASO O Estudo de caso aplicou-se a solução de BI ao Grupo de Postos de Combustíveis Pioneiro. A solução resume-se na construção de um cubo OLAP, onde o mesmo explora uma grande massa de dados precisos e rápidos, referente às vendas ocorridas entre os anos de 2009 e 2010 e a comparando com os feriados e eventos socioeconômicos, A análise de vendas tem o propósito de servir como subsidio para uma melhor tomada de decisão de gerentes e gestores. 3.1 A Empresa O Grupo de postos de Combustíveis Pioneiro é uma empresa revendedora dos produtos da empresa AleSat Combustíveis S.A. (Grupo ALE) a quarta maior distribuidora de combustíveis do Brasil. O Grupo Pioneiro é uma empresa de médio porte com um total de 13 colaboradores, atuando desde 2003 no estado do Maranhão nas cidades de Balsas e Açailândia. Para fins de gerenciamento como mostra a figura 20 o grupo utiliza um sistema web desenvolvido em PHP que utiliza banco de dados MYSQL, ao todo são 33 tabelas que realizam o armazenamento dos dados diários de controle de estoque, vendas e financeiro, o sistema não utiliza o conceito de BI (Business Intelligence) deixando o gestor limitado à exploração de dados, dificultando os cenários que possam vir a acontecer com o decorrer das vendas. Figura 20: Sistema Web Fonte: Autor Próprio (2010) 38 Diversos relatórios são gerados por dia com pouco poder de estabelecer uma análise dinâmica e intuitiva, quando se espera uma análise de todas as vendas do ano o fluxo de informações a serem processadas pelo sistema. Se torna-se lento e demorado ocasionando o travamento, a arquitetura do ambiente do sistema é representada pela figura 21. Uma das principais características da aplicação utilizada na empresa é a mobilidade, pode-se ser utilizada em qualquer lugar que esteja, caso tenha acesso a internet, com isso facilita a consulta dos dados atuais. Figura 21: Arquitetura da aplicação Adaptação de: Linha de código (2010). A figura 22 mostra que os relatórios atuais não disponibilizam uma consulta multidimensional (produto, filial, tempo, vendas), somente consultas SQL’S de duas dimensões. Não agregam em um único relatório todos os dados das empresas do grupo. 39 Figura 22: Relatório de vendas Fonte: Autor Próprio (2010) Para solucionar o problema de análise da empresa, foi proposto a criação de um ambiente de exploração OLAP para analisar os dados das vendas realizadas no período de 2009 e 2010. 3.2 As vendas A realização das vendas do grupo apresenta índices de variâncias com decorrer de cada mês, sem uma análise mais detalhada, os dados somente apresentavam condições aos gestores realizarem pequenas tomadas de decisões sem favorecer o seu produto e até mesmo o seu cliente, neste cenário os feriados e eventos socioeconômicos que por ventura poderiam ou não contribuir para o aumento das mesmas, não eram mensurados e nem tão pouco acompanhados como fatores chaves de sucesso. Os produtos vendidos se constituem de gasolina comum, gasolina aditivada e diesel na filial da cidade de Balsas – MA (Posto Modelo) e na matriz em Açailândia – MA (Posto Pioneiro) gasolina comum e diesel, o cenário de vendas em cada uma das cidades são bastante diferentes por questões sociais e econômicas. Balsas – MA agricultura se prevalece e movimenta a região, já em Açailândia – MA o setor de indústria e siderúrgicas fortalecem a economia local. As vendas em ambas as cidades são divididas em dois turnos, matutino que reflete ao horário de 05h00min da manhã até ás 13h00min da tarde, e vespertino que inicia às 13h00min até 22h:00min, o público alvo no grupo está relacionado a veículos automotores de pequeno porte como motocicletas, carros e caminhonetes. 40 O processo de registro de vendas no sistema se estabelece em fechamentos de turnos, ou seja, no final de cada turno o responsável passa para a área administrativa o valor final de litros de cada bomba, após a conferência os dados são lançados no sistema. A cada dia se estabelece o fechamento dos turnos. 3.3 A solução Procurando uma solução para o problema encontrado, buscou-se a construção de um cubo OLAP, referenciando às vendas do Grupo Pioneiro, que permitisse uma análise intuitiva dos dados armazenados no período de 2009 e 2010, bem como análise comparativa com os fatores socioeconômicos das cidades de Balsas-MA e Acailândia-MA. Foi necessário realizar um processo dividindo em oito fases, desde o detalhamento dos dados a serem explorados, bem como a descrição de cada campo do relatório ofertado, além da identificação dos dados do negócio, extração e transformação e carga dos dados (ETL), armazenamento e análise com os aspectos socioeconômicos de cada cidade, fornecendo assim um cenário mais probabilístico para uma boa tomada de decisão. Para iniciar o projeto a primeira etapa foi realizada uma entrevista com o gestor para definir quais as reais necessidades do grupo, neste processo foi identificada a necessidade de explorar as vendas de ambas as empresas, pois os relatórios atuais que o sistema da empresa apresentava, não geravam condições satisfatórias para uma análise fácil e intuitiva de ambas filiais do Grupo ao mesmo tempo, dificultando a tomada de decisão, a figura 23 mostra o relatório de vendas da filial de Açailândia-MA no sistema atual. Figura 23: Relatório de Vendas Fonte: Autor Próprio (2010) 41 As dimensões a serem exploradas serão tempo, filial, produto, turno, definindo-se o modelo de exploração dos dados das vendas, o tempo será dividido em ano, mês e dia, facilitando a análise dos dados. A solução permitirá a análise dos dados como, quantidade vendida por filial, por data, produto e turno, assim como as suas tendências em determinados turnos e períodos de tempo. Com a delimitação do problema, iniciou-se então a formalização das dimensões que formarão o cubo, para confirma o modelo de negócio a ser explorada, a figura 24 exibe a modelagem multidimensional proposta. Figura 24: Dimensões do Cubo Fonte: Autor Próprio A segunda etapa se iniciou com um estudo no Data Warehouse que o grupo possuía, para validar se a modelagem atual se adequava para as soluções multidimensionais, a figura 25 exibe as tabelas exploradas no cenário de vendas, no total foram identificadas 6 tabelas (gasolina_aditivada, gasolina, diesel, caixa, valores e turno) nas 33 existentes. Foram utilizadas as tabelas (gasolina_aditivada, gasolina, diesel, caixa, valores e turno) devido a sua prevalência no processo de negócio do grupo, cujo necessita das informações correspondentes as tabelas para finalizar o faturamento das vendas ocorridas durante o dia. 42 Figura 25: Tabelas do Data Warehouse vendas Fonte: Autor Próprio(2010) Com as tabelas extraídas foi identificado que na forma de modelagem que o contexto de vendas estava não era propícia para uma exploração multidimensional do cubo OLAP, pois a modelagem de cubo OLAP necessita de uma Tabela Fato e tabelas dimensões, com isso se se tornou necessário a criação de um Data Mart de vendas, na qual irá armazenar os dados dos dois Data Warehouses do grupo, centralizando as informações, facilitando assim a exploração dos dados de forma mais simples e objetiva. A terceira etapa do processo se iniciou com a criação de um Data Mart, foi criado para centralizar as informações de vendas em uma única base de dados, com base na modelagem do tipo Star Schema, foi desenvolvido neste modelo devido a facilidade de criação de um ambiente de exploração de um cubo OLAP no mesmo, o modelo de relacionamento no Data Warehouse do grupo foi quebrado e dando origem a um novo modelo de relacionamento no Data Mart, como mostra a figura 25, ele apresenta a tabela fato (vendas) juntamente com as tabelas dimensões (tempo, turno, produto, filial). 43 Figura 26: Data Mart Vendas Fonte: Autor Próprio(2010) Com o Data Mart construído e as dimensões definidas, iniciou a quarta etapa, que se define como a transformação dos dados armazenados nos Data Warehouses para o Data Mart central, este processo de ETL é considerada uma das principais etapas, pois os dados serão extraídos e transformados para as consultas, para realizar este processo de forma intuitiva e automática foi desenvolvido um framework em PHP, que constitui em uma página web capaz de extrair os dados dos Data Warehouses para um Data Mart dinamicamente, a figura 27 mostra o framework construído, ao todo foram mais de 10.000 registros explorados e transformados. 44 Figura 27: Framework em PHP para importação de dados Fonte: Autor Próprio (2010) No momento que o botão Deploy e acionado, os dados começarão a ser processados conforme o processo de ETL citado no item 2.2.2, nesta etapa de filtragem, dados nulos, com campos incorretos ou duplicados, foram identificados e descartados, o filtro é executado pelo framework, cada botão referencia um tipo de produto vendido para cada filial, após os dados são armazenados no Data Mart de vendas. O modelo do banco dimensional não é suficiente para o Pentaho identificar os cubos e dimensões. É necessário criar um arquivo XML descrevendo quais são os cubos e dimensões e suas respectivas tabelas associadas, para isto a quinta fase se inicia, com a configuração do Data Mart no Schema Workbench, a figura 28 exibe a configuração utilizada no trabalho. Figura 28: Configuração para conexão com banco de dados Fonte: Gerado pelo Schema Workbench (2010) 45 A configuração deve ter como parâmetro o driver de conexão Java, além da URL de conexão, assim como o usuário e password da base de dados. O Schema Workbench é um software de criação de cubos OLAP que faz parte do pacote de suíte do Pentaho, a sua escolha foi devido a sua interface amigável tornando o desenvolvimento mais intuitivo, a figura 29 exibe a visualização da montagem do cubo. Figura 29: Criação do cubo Fonte: Gerado pelo Schema Workbench (2010) Todas as tabelas utilizadas para a montagem do cubo são do Data Mart de vendas criado, as dimensões a serem exploradas foram definidas como filial, produto, tempo e turno, como medidas foram consideradas o total de litros e total em reais, assim foi atribuído o agregador ‘sum’, para realizar a somatória dos dados explorados conforme o cenário analisado, a figura 30 exibe mais detalhado o esquema montado para o cubo OLAP. 46 Figura 30: Criação do cubo OLAP com as dimensões Fonte: Gerado pelo Schema Workbench (2010) O Schema Workbench por fim, publicará este esquema montado do cubo através de um arquivo XML para o servidor Mondrian, que será o responsável pela interpretação do Schema no Pentaho e interpretar as consultas Multidimensionais. Para o Pentaho realizar o acesso ao Data Mart é necessário realizar a configuração de acesso a base, a figura 31 ilustra a configuração da base de dados com o Pentaho, uma das principais características é que pode-se realizar a conexão com vários tipos de banco de dados como Firebird, Mysql, Oracle, SqlServer etc. 47 Figura 31: Configuração com o Data Mart Fonte: Gerado pelo Pentaho (2010) Após a publicação do arquivo XML do Schema do cubo, começa a sexta fase que realiza a interpretação do cubo montado com os dados do Data Mart de vendas, conforme a figura 32 . Figura 32: New Analysis View para visualização do Cubo Olap Fonte: Gerado pelo Pentaho (2010) 48 O Analysis View utiliza como cliente o JPivot e a engine do Mondrian. Exibe a Interface final do usuário, o software provê os recursos necessários para o gerenciamento de dados do Data Mart de forma fácil e dinâmica facilitando a análise do cubo, o Mondrian é configurado através de esquemas montados no Workbench, é o principal responsável interpretação das consultas MDX no cubo de dados, as consultas MDX são realizadas online, sendo exibida no próprio JPivot, a figura 33 exibe um exemplo de consulta MDX no Data Mart de vendas . Figura 33: Consulta MDX Fonte: Gerado pelo Pentaho (2010) Se iniciou o processo de visualização do cubo de dados (sétima fase) através do Analysis View criado, o JPivot possibilita o carregamento das definições do cubo, assim como a toolbar, que manipula as informações, afim de permitir segmentar a informação por eixos de análise, permitindo a análise da informação com base em várias perspectivas. Com isso é possível a compreensão das informações de uma forma mais intuitiva, uma vez que a solução permite decompor os valores nas diferentes perspectivas de análise, a figura 34 representa o cubo com os dados do Data Mart. Figura 34: Visualização do Cubo OLAP Fonte: Gerado pelo Pentaho (2010) 49 O cubo foi fatiado exibindo as dimensões criadas como filial, produto, tempo e turno assim como as mensurações de total em litros vendidos e total em reais. Como resultado, pode-se observar quanto uma determinada venda por filial (Balsas-MA e Açailândia-MA), representaram em relação ao total de vendas em litros vendidos e em reais, assim como por produto (gasolina comum, gasolina aditivada e diesel), tempo (dia, mês e ano), e turno (matutino e vespertino), a forma de visualização dos dados se torna fácil, melhorando o entendimento do contexto de vendas do grupo ao gestor da empresa, dessa forma podendo realizar comparações de vendas entre as filiais distintas para uma perspectiva de análise de tomada de decisão baseado nos dados armazenados no Data Mart Central. Este cubo tem o principal intuito de servir como fonte de informações sobre as vendas ocorridas em 2009 e 2010, para tanto, a figura 35 apresenta o cubo que demonstra o resultado desta operação com as informações armazenadas no Data Mart de vendas. Figura 35: Exploração do cubo OLAP com o Pentaho Fonte: Gerado pelo Pentaho (2010) 50 Observar-se então, que nas dimensões filial, produto, tempo e turno, quando se apresenta o sinal de “+” podemos navegar para dentro do cubo, realizando uma técnica de drill down, visualizando dados mais detalhados, como no caso acima demonstrado, onde foi selecionado o tempo do produto diesel da filial de AçailândiaMA, que por sua vez, pode-se especializá-los ainda mais, mostrando os meses e dias que houve vendas no ano. O mesmo caso ocorre na dimensão produto, onde quando selecionado um produto disponível, pode expandir os dados, de forma que se apresentam as filiais onde ocorreram vendas naquele produto selecionado. Conforme mostra a figura 36 os dados e gráficos, tem-se a possibilidade de analisar eventos ocorridos durante as vendas, verificando o impacto ocorrido na empresa, assim como questionamentos do tipo: Figura 36: Visualização dos dados das vendas Fonte: Gerado pelo Pentaho (2010). 51 • Qual filial vendeu mais durante o ano de 2009 e 2010? • Qual produto teve menos vendas e em qual filial? • Em que período, verifica-se fortemente os efeitos dos feriados e eventos socioeconômicos e quando a empresa apresentou sinais de melhoria nas vendas? • Quais filiais o grupo deve concentrar suas vendas? Com esta solução, podem-se responder estas perguntas, e tantas outras, agregando, assim, conhecimento sobre as vendas do Grupo de Postos de Combustíveis Pioneiro bem como tomar melhores decisões. 3.4 Relações entre vendas com feriados e fatores socioeconômicos Além de realizar todo o processo de montagem do cubo bem como a extração dos dados, finalizou-se com a oitava fase que é relacionar os dados das vendas entre o período de abril de 2009, pois foi quando se iniciou a utilização do sistema de gerenciamento do grupo, até outubro de 2010 que foi o período final dos dados explorados, esta relação trás dois parâmetros que são os feriados e fatores socioeconômicos, estes foram divididos por cada cidade correspondente a filial do Grupo, com isso pode-se responder certas perguntas que ficavam a mercê do gestor, como por exemplo, será que no período do carnaval as minhas vendas serão boas, devido a este evento? Para isto foram listados e classificados todos os feriados e fatores socioeconômicos que podem ter relação com as vendas em um determinado período por região. Os feriados e fatores socioeconômicos nos períodos de 2009 e 2010, sempre ocorreram nos mesmos meses, para definir melhor como avaliar este cenário, foi realizado a classificação dos mesmos e associando determinados pesos para cada um. Os feriados foram associados o peso no valor de 1 ponto, devido a pouca movimentação de pessoas durante este período na cidade em relação a outros fatores, já os socioeconômicos associou-se o peso no valor de 2 pontos, isto se da pela relação de quantidade de pessoas que circulam na cidade durante este período, como exemplo pode-se citar o carnaval fora de época, Agrobalsas, festejo da cidade, entre outros, a tabela 1 abaixo mostra toda a classificação da cidade de Balsas-MA. 52 Tabela 1: Listagem dos feriados e Fatores socioeconômicos de Balsas-MA FERIADOS 1 Confraternização Universal (Virada de ano) Carnaval Paixão de Cristo Páscoa Tiradentes Dia do trabalhador Corpus Christi Independência do Brasil Dia das crianças Finados Proclamação da República Natal Dia dos namorados FATORES 2 Pré-Carnaval Aniversário de Balsas Raly dos Sertões Festejo da cidade de Balsas Férias Agrobalsas Fonte: Autor Próprio (2010) Foi distribuída a categorização dos feriados e fatores nos meses de janeiro a dezembro totalizando o peso de cada mês, conforme mostra a tabela 2: Tabela 2: Distribuição dos feriados e fatores para cidade de Balsas-MA BALSAS-MA Eventos Jan Fev Mar Abr Mai Jun Jul Ago Set Out Nov Dez Confraternização Universal (Virada de ano) 1 Pré-Carnaval 2 Carnaval 1 Paixão de Cristo 1 Páscoa 1 Tiradentes 1 Dia do trabalhador 1 Corpus Christi 1 Independência do Brasil 1 Dia das crianças 1 Finados 1 Proclamação da República 1 Natal 1 Aniversário de Balsas 2 Raly dos sertões 2 Festejo da cidade de Balsas 2 Férias 2 Agrobalsas 2 Dia dos namorados 1 Total 3 1 2 3 3 6 2 0 1 1 2 1 Fonte: Autor Próprio (2010) 53 Com a categorização dos feriados e fatores socioeconômicos da cidade de Balsas-MA e com a distribuição nos períodos de janeiro a dezembro, foi demonstrado que o período que tem o maior peso é o mês de junho que acumulou o total de 6 pontos, desta maneira pode ser que durante este período os feriados e fatores podem influenciar no aumento das vendas, ao contrário do mês de agosto que totalizou a peso de 0 pontos, possivelmente neste período as vendas não irão ter o mesmo movimento. O mesmo processo de categorização dos feriados e fatores socioeconômicos foi realizado para a cidade de Açailândia – MA, divido com a mesma pontuação de Balsas-MA, conforme mostra a tabela 3: Tabela 3: Listagem dos feriados e Fatores socioeconômicos de Açailândia-MA FERIADOS FATORES 1 Confraternização Universal (Virada de ano) Paixão de Cristo Páscoa Tiradentes Dia do trabalhador Dia das Mães Corpus Christi Dia dos namorados Dia dos Pais Independência do Brasil Dia das crianças Finados Proclamação da República Natal 2 Açaifolia (Carnaval fora de época) Aniversário de Açailândia Expo Açai (Exposição) Férias Festejo da cidade de Açailândia-MA Fonte: Autor próprio (2010) A cidade de Açailândia – MA já apresenta fatores diferenciados da cidade de Balsas – MA como o carnaval fora de época (Açaifolia), exposição (Expo Açai), entre outros, estes fatores podem diferenciar o aumento de vendas devido à grande circulação de pessoas nestes períodos na cidade, a distribuição foi realizada no período de janeiro a dezembro conforme mostra a tabela 4, sendo que no final de cada mês foi realizada a totalização dos mesmos. 54 O período que apresentou o maior peso em relação aos feriados e os fatores socioeconômicos foi o mês de junho com o total de 6 pontos com isso neste período pode ser que as vendas aumentem significadamente ao contrário dos meses de fevereiro e março que apresentaram 0 pontos, desta forma fica mais fácil verificar as tendências de vendas nestes períodos, podendo realizar estratégias de marketing que venham atrair o cliente para realizar a compra dos produtos ofertados durante os períodos de menor fluxo de vendas. Tabela 4: Distribuição dos feriados e fatores para cidade de Açailândia-MA. AÇAILÂNDIA – MA Jan Fev Mar Abr Mai Jun Jul Ago Set Out Nov Dez Confraternização Universal (Virada de ano) 1 Paixão de Cristo 1 Páscoa Tiradentes 1 1 Dia do trabalhador 1 Dia das Mães 1 Corpus Christi 1 Açaifolia 2 Aniversário de Açailândia 2 Dia dos namorados 1 Expo Açai 2 Férias 2 Dia dos Pais 1 Independência do Brasil 1 Dia das crianças 1 Festejo da cidade de Açailândia 2 Finados 1 Proclamação da República 1 Natal 1 Total 1 0 0 3 2 6 4 1 1 3 2 1 Fonte: Autor Próprio (2010) Após realizar todo este processo de classificação, distribuição e totalização dos pontos para cada cidade das filiais, foi utilizado o software SPSS juntamente com a técnica estatística de Anova (Análise de variância) para verificar se existem relações entre as vendas nos períodos de 2009 e 2010 com os feriados e fatores socioeconômicos no âmbito geral, o processo foi realizado com a exportação dos dados do cubo OLAP destes períodos de cada uma das filiais como mostra a tabela 5 que fornece os dados da filial de Balsas-MA, a coluna período demonstra o 55 período das vendas já a coluna total de vendas em litros exibe o total de litros vendidos de todos os produtos e a coluna peso dos feriados e fatores que fornece o peso de cada mês com relação aos fatores e feriados. Tabela 5: Listagem dos períodos com total de vendas e pesos de feriados e fatores da filial de Balsas-MA. POSTO MODELO - BALSAS-MA Período Abr-09 Mai-09 Jun-09 Jul-09 Ago-09 Set-09 Out-09 Nov-09 Dez-09 Jan-10 Fev-10 Mar-10 Abr-10 Mai-10 Jun-10 Jul-10 Ago-10 Set-10 Out-10 Total de vendas em Litros 163155 181804 192744 219248 201737 217449 214604 195305 214068 186791 200465 215813 254433 228356 225848 231388 252469 244896 254514 Peso dos feriados e fatores 3 3 6 2 0 1 1 2 1 3 1 2 3 3 6 2 0 1 1 Fonte: Autor Próprio (2010) O mesmo processo foi realizado para a filial de Açailândia – MA, como exibe a tabela 6: Tabela 6: Listagem dos períodos com total de vendas e pesos de feriados e fatores da filial de Açailândia-MA. Período Abr-10 Mai-10 Jun-10 Jul-10 Ago-10 Set-10 Out-10 Nov-10 Dez-10 Jan-11 MINI POSTO PIONEIRO – AÇAILÂNDIA – MA Total de vendas em Litros Peso dos feriados e fatores 120617 3 122744 2 123754 6 132161 4 139321 1 129592 1 134095 3 117081 2 122585 1 112110 1 56 Fev-11 Mar-11 Abr-11 Mai-11 Jun-11 Jul-11 Ago-11 Set-11 Out-11 108966 127582 119593 117365 121280 133279 151423 163573 136937 0 0 3 2 6 4 1 1 3 Fonte: Autor Próprio (2010) Com os dados organizados iniciou-se o processo de teste da técnica de Anova (Análise de variância) no software SPSS, após a importação dos dados, o teste foi realizado para ambas filiais, tendo como resultado final a tabela de Anova conforme mostra a figura 37 para a filial de Açailândia – MA (Mine Posto Pioneiro) e a figura 38 para a filial de Balsas – MA (Posto Modelo). Figura 37: Teste de Anova para Açailândia-MA. Fonte: Saída do SPSS (2010). Pelo fato da significância (Sig.) ser acima de 0,05 (0,399) conforme a ilustração na figura, verifica-se que não existe relação entre feriados de forma geral (variável dependente) e venda de combustíveis (variável independente) na cidade de Açailândia - MA. Figura 38: Teste de Anova para Balsas-MA. Fonte: saída do SPSS (2010). 57 Pelo fato da significância (Sig.) ser acima de 0,05 (0,703), conforme ilustra na figura 38 verifica-se que não existe relação entre feriados de forma geral (variável dependente) e venda de combustíveis (variável independente) na cidade de Balsas MA. Cabe ressaltar que os resultados encontrados para a filial de Balsas, apresentam uma distinção ainda maior entre as variáveis. 4. CONCLUSÃO O presente trabalho ajudou a realizar um novo cenário de tomada de decisões (BI) no Grupo de Postos de Combustíveis Pioneiro, devido à aplicação da ferramenta OLAP bem como a exploração dos dados que por ventura estavam ocultos na visão do gestor e que o sistema atual não proporcionava. Com a montagem do cubo OLAP a facilidade de manipulação dos dados ficou de forma intuitiva e fácil, a análise das vendas nos períodos de 2009 e 2010 condicionou uma comparação com os feriados e fatores socioeconômicos gerando o acompanhamento do comportamento da empresa durante estes períodos. A aplicação da ferramenta de BI PENTAHO juntamente com a técnica de estatística Anova agregou de tal forma mais auxílio à tomada de decisão e mostrou estatisticamente que os feriados e fatores socioeconômicos em geral não influenciam nas vendas durante o período analisado, além disso o trabalho foi de grande importância para o gestor do Grupo de Postos de Combustíveis Pioneiro, devido a forma de visualização dinâmica que o cubo OLAP proporcionou aos dados da sua empresa. Levando em consideração a fundamentação teórica deste trabalho e a solução desenvolvida, podem-se indicar as seguintes propostas para trabalhos futuros: • Criação de um Data Mart para analisar o perfil de cada cliente; • Criar um Data Mart de feriados e fatores socioeconômicos para posteriormente aplicar a técnica de Data Mining; • Criar um modelo de simulação para o cubo montado. Com o desenvolvimento das tecnologias citadas acima formará um projeto de BI completo e moderno, fortalecendo a probabilidade de aumentar os resultados significativos para o Grupo de Postos de Combustíveis Pioneiro. 58 5. REFERÊNCIAS BIBLIOGRÁFICAS ALVES, William Pereira. Banco de dados: teoria e desenvolvimento. 1ª edição. São Paulo: Érica, 2009. AAKER, David A; KUMMAR, V; DAY, George S; Tradutor Reynaldo Cavalheiro Marcondes. Pesquisa de Marketing. 2 ed. 3 reimpressão. São Paulo: Atlas, 2007. ARAÚJO, E. M. T. ; BATISTA, M. L. S. ; MAGALHAES, T. M. . OLAP: Características, Arquitetura e Ferramentas. Jornal Eletrônico Cursos Tecnológicos do Instituo Vianna Júnior,Jornal Eletrônico Cursos Tecno, 26 out. 2007. BARBIERI, Carlos. Bi-Business Intelligence modelagem & tecnologia, Rio de Janeiro: Axcel Books, 2001. BENEDITO, Miguel Furtado Junior, XML (Extensible Markup Language), Universidade Federal do Rio de Janeiro, curso de Redes de computadores. Disponível em <http://www.gta.ufrj.br/grad/00_1/miguel/> acesso em: 15 de novembro de 2010. BISPO, Alberto Ferreira, Uma análise da nova geração de sistemas de apoio a decisão, Universidade de São Carlos, dissertação de mestrado em Engenharia da Produção. 1998. COLAÇO JUNIOR, Methanias. Projetando sistemas de apoio à decisão baseados em data Warehouse. Rio de janeiro: Axcel Books, 2004 DEVMEDIA. Disponível em:.< http://www.devmedia.com.br/articles/post-5730Introducao-ao-Analysis-Services-2005-Parte-2.html>. novembro de 2010. Acesso em: 12 de 59 FELBER Edmilson J, W. Proposta de uma ferramenta olap em um data mart comercial: uma aplicação prática na industria calçadista, Trabalho de conclusão do curso de Ciências da Computação, Centro Universitário Feevale. Novo Hamburgo, novembro de 2005. FERRARI, Fabrício Augusto. Crie banco de dados em MySQL. São Paulo: Digerati Books, 2007. FIGUEIREDO, Marcos Leandro; SOARES, Hélio Rubens. Comparação entre a modelagem orientada a objeto e a modelagem estruturada relacional, Uberlândia, ano 2005, Centro Universitário do Triângulo – UNITRI, Curso de especialização em banco de dados. FONSECA, Marcelo Porto Alegre. Classificação Bayesiana de grandes massas de dados em ambientes ROLAP. Tese apresentada como requisito necessário para obtenção do grau de doutor em Ciências em engenharia civil. COPPE/URFJ.Rio de Janeiro, julho de 2007. IMHOFF, Claudia; GALEMMO, Nicholas; GEIGER, J.G. Mastering data Warehouse Design: Relational and Dimensional techniques. Indianapolis: Wiley Publishing, INC., 2003. INMON, W.H. – Como Construir o Data Warehouse. Rio de Janeiro: Campus 1997. KAY, Russell. Data Cubes. Computerworld Inc., 2005. Disponível em: <http://www.computerworld.com/datasetopics/data/story/0,10801,91640,00.htm >. Acesso em 14 de novembro de 2010. LINHA DE CODIGO, Disponível em:.< http://www.linhadecodigo.com.br/artigo/ 2002/Web-%E2%80%93-Uma-introdu%C3%A7%C3%A3o-ao-Desenvolvimentopar a-a-Internet-com-Java-%E2%80%93-Parte-01-%E2%80%93-Preparando-o- Ambient e-para-o-Desenvolvimento aspx>. Acesso em: 13 de novembro de 2010. 60 MACHADO, Felipe Nery Rodrigues. Protótipo de Data Warehouse: Uma visão Multidimensional. São Paulo: Érica, 2000. MACHADO, Felipe Nery Rodrigues. Tecnologia e Projeto de Data Warehouse.São Paulo, 2004. MIRANDA, Alvira. Disponível em:.< http://www.alvimiranda.com/2010/04/pentahoo-que-e.html>. Acesso em: 12 de novembro de 2010. MARTINS, Daniela Siqueira, Proposta de desenvolvimento de um datamart na área de gestão de pessoas e aplicação de uma ferramenta olap, Trabalho de conclusão do curso de Ciências da Computação, Centro Universitário Feevale, Novo Hamburgo, novembro 2007. MARTINEZ, Luís F; FERREIRA, Aristides I. Análise de dados com SPSS – Primeiros passos.Lisboa: Escolar Editora, 2007. MAGANHA, Fernando. Implementação de um data warehouse na secretaria de trânsito de Guaíba para análise multidimensional de informações. Guaíba: ULBRA - Sistemas de Informação, 2006. NARESH, Malhotra. Pesquisa de marketing: uma orientaçao aplicada. 4ª ed. Porto Alegre: Pearson Education, 2004. NETO, Cl_audio Manoel da Silva e Sousa, Lilian Lucélia da Silva, Marcus Andre dos Santos Semblano, Peterson Sampaio - Apresentação sobre a Ferramenta Pentaho. Tutorial Mondrian e JPivot, Universidade federal de Minas Gerais – UFMG- Ciências da Computação- apresentado em 14 de maio de 2008. ORACLE. Disponível em:.< http://download.oracle.com/docs/ html/B13915_04/ i_ol ap_chapter.htm#sthref85>. Acesso em: 13 de novembro de 2010. PENTAHO. Disponível novembro de 2010. em:. <http://www.pentaho.org>.Acesso em: 01 de 61 RAMAKRISHNAN, Raghu. Sistemas de banco de dados. Tradutores: Acauan Pereira Fernandes, Celia Taniwaki, João Tortello, 3ª edição, São Paulo: McGrawHill, 2008. ROSA, Kátia Liane, Análise de ferramentas Olap Open Source e freeware com acesso à banco de dados multidimensionais e relacionais, Centro Universitário Feevale, Trabalho de conclusão do curso de Ciências da computação, Novo Hamburgo, 2004. RODRIGUEZ, Martíus V; FERRANTE, Agustin J. Tecnologia de informação e Gestão Empresarial. Tradução: Washigton Luiz Salles e Louise Anne N. Bonitz. Rio de Janeiro: E-Papers, 2000. THOMSEN, E. Construindo Sistemas de Informações Multidimensionais. 2ª ed. São Paulo: Campus, 2002. TENORIO. Disponível em:. <www.cin.ufpe.br/~if696/seminarios/MDX.ppt>. Acesso em 10 de novembro de 2010. WITHEE, Ken. Microsoft Business Intelligence for Dummies. Hoboken: Wiley Publishing, Inc. ,2010.