Seminário II Business Intelligence: um sistema de apoio a decisões gerenciais Aduílio Ana Cláudia Danilo Dhullyene Enivaldo Introdução Sistema computadorizado de suporte aos gestores; Solução de BI centrada em Data Warehouse (DW) “Fábrica de informações” Implementar uma solução de BI KeyPerformance Indicator – KPI Ferramentas de processamento analítico. Business Intelligence BI é fazer uso de informações já disponíveis nas organizações para ajudar os responsáveis pelas tomadas de decisões a adotar as melhores opções e de forma mais rápida. Business Intelligence Objetivos: • Permitir acesso interativo aos dados. • Proporcionar a manipulação desses dados. • Fornecer aos gestores a capacidade de realizar a análise adequada. • Fornecer informações precisas quando necessário. Business Intelligence Principais benefícios: • Economia de tempo • Melhores estratégias e planos • Melhores decisões táticas • Processos mais eficientes • Economia de custos Data Warehouse Data Warehouse (DW) é um conjunto de dados produzido para oferecer suporte à tomada de decisões. É um repositório de dados atuais e históricos de possível interesse aos gestores de Toda a organização. Data Warehouse Características: • Os dados, normalmente, são estruturados de modo a estarem disponíveis em um formato pronto para atividades de processamento analítico. • Coleção de dados orientada por assunto, integrada, variável no tempo e não volátil. • Grande variedade de dados. Arquitetura As principais arquiteturas utilizadas são: Arquitetura de Data Warehouse Empresarial (Enterprise Data Warehouse – EDW): é considerada a que suporta toda ou maior parte dos requisitos ou necessidades. Ela possui grande grau de acesso e a utilização das informações é para todos os departamentos de uma empresa. Arquitetura • Arquitetura de Data Mart Independente: é um DW projetado para uma unidade estratégica de negócios ou um departamento. Eles são fáceis de construir, porém envolvem altos custos, redundância de dados e não permitem uma visão global da empresa. Arquitetura • Arquitetura de Data Mart Dependente (Integrados): é um subconjunto criado a partir do EDW. Ele tem a vantagem de usar um modelo de dados consistente e apresentar dados de qualidade. Modelagem - Modelagem multidimensional que compreende um sistema baseado em recuperação que suporta acessos com alto volume de consultas - Dados organizados de acordo com a preferência do usuário. - Representação dos dados tem a estrutura de um cubo transmitindo a ideia de múltiplas dimensões. Modelagem – Modelo de um cubo Modelagem – Tipos de Estrutura Fatos: tabela central do modelo e contém os valores (numéricos) que se deseja analisar, geralmente, contendo um grande volume de dados. Dimensões: representam um aspecto do negócio que está sendo analisado. Medidas: : são atributos numéricos armazenados na tabela de fatos, que representam o desempenho de um indicador em relação às dimensões que participam desse fato. Modelagem – Tipos de Modelo Esquema estrela: Modelagem – Tipos de Modelo Esquema floco de neve: Integração e Processos ETL A integração de dados compreende três grandes processos que, quando implementados corretamente, permitem que eles sejam disponibilizados a um conjunto de ferramentas de Extração, Transformação e Carga (ETL), análise e ao ambiente de data warehousing. Já os processos compreendem: acesso aos dados (a capacidade de acessar e extrair dados de qualquer fonte), federação de dados (a integração das visualizações de negócios em diversos data stores) e captura de alterações (com base na identificação, captura e entrega das alterações feitas nas fontes de dados da empresa). Integração e Processos ETL Três etapas do processo ETL: • Extração: coleta de dados dos sistemas de origem extraindo-os e transferindo-os para o ambiente de DW. • Limpeza, Ajustes e Consolidação: é nesta etapa que realiza-se os devidos ajustes, podendo melhorar a qualidade dos dados e consolidar dados de duas ou mais fontes. • Entrega ou carga dos dados: consiste em fisicamente estruturar e carregar os dados para dentro da camada de apresentação. OLAP • Conjunto de ferramentas e técnicas que permite realizar a exploração dos dados de um DW, utilizando os recursos de modelagem, análise e visualização de grandes conjuntos de dados. O OLAP ajuda a analisar de forma mais eficiente a quantidade de dados crescente armazenados pelas organizações transformando-os em informação. • O OLAP possibilita que o usuário produza facilmente seus próprios relatórios e analise tendências e desempenho diariamente. Os sistemas OLAP oferecem uma alternativa aos sistemas transacionais, produzindo uma visão dos dados orientados à análise, além de uma navegação rápida e flexível. Planejamento Na etapa de planejamento o escopo do projeto deve ser definido, sempre mantendo o foco no negócio. Deve ser escolhido o mecanismo de processamento de consultas (multidimensional, relacional ou ambos), considerando o desempenho desejado e o conjunto de funções de análise oferecidas Posteriormente, deve ser realizada uma análise da visão macro, para verificar como os projetos futuros serão integrados ao projeto inicial. Levantamento A etapa de levantamento de necessidades é uma das mais importantes, pois nesta fase é possível identificar e priorizar as necessidades de informação que a organização necessita. É importante o envolvimento de analistas de sistemas, usuários, equipe de tecnologia da informação e DBAs durante esta fase, outra fonte que pode auxiliar o levantamento de dados são os relatórios gerenciais. Modelagem A etapa de modelagem é considerada uma das mais importantes e é um dos fatores críticos de sucesso em um projeto de DW. Ela possibilita que o usuário obtenha as informações em uma forma muito próxima do seu entendimento, com várias perspectivas possíveis. Projeto Físico e de banco de Dados Definição das estruturas lógicas do modelo dimensional Os seus relacionamentos Os índices Os atributos As regras de tabelas ETL – Extract Transform Load Extração: Responsável pela coleta de dados do sistema e transferência destes dados para o ambiente Data Warehouse. Transformação: Responsável em realizar os devidos ajustes, podendo melhorar a qualidade dos dados e consolidar dados de duas ou mais fontes. Carga: Responsável por estruturar e carregar os dados para dentro da camada de apresentação. Desenvolvimento Após adquirir dados e informações de diversas fontes e organizá-los em um data warehouse, inicia-se o desenvolvimento da solução de análise de negócios. Teste e Homologação Ambiente alpha Teste diferentes de outras aplicações comerciais; Sensação de investigação; Detectadas algumas “anomalias” nos dados de produção; Ambiente de homologação (processo de validação); Simulações de volume e de processamento para avaliar o impacto da solução na produção. Treinamento Workshop sobre a solução com diretor, o gerente e colaboradores da trabalham no setor onde será o foco do projeto. Possibilita alguns ajustes antes de entrar em produção. Implantação Servidor ; Backup; Sistemas de monitoramento; Capacidade do sistema; Processos ETL acessarão bancos de dados de produção (base transacional). Obrigado.