SERVIÇO GEOLÓGICO DO BRASIL X Simpósio de Recursos Hídricos do Nordeste Enriquecimento de Dados Aplicado à Recursos Hídricos 16 a 19 de novembro de 2010 Fortaleza – Ceará Frederico C. Peixinho Flávio Luis de Mello SERVIÇO GEOLÓGICO DO BRASIL SUMÁRIO 1. INTRODUÇÃO 2. SISTEMA DE APOIO A DECISÃO – Business Intelligence 3. KDD – DESCOBERTA DO CONHECIMENTO EM BASE DE DADOS 4. FUNCIONALIDADES EM MINERAÇÃO DE DADOS 5. MINERAÇÃO DE DADOS NO CONTEXTO DOS RECURSOS HÍDRICOS 6. CONCLUSÃO SERVIÇO GEOLÓGICO DO BRASIL INTRODUÇÃO Ambiente de Negócio Decisões e suporte Reações da organização Fatores do ambiente de negócios Globalização, demanda do consumidor, regulamentações governamentais, mercados e competição, etc Pressões Oportunidade Estratégia, colaboração dos parceiros, reação em tempo real, agilidade, maior produtividade, novos fornecedores, novos modelos de negócios Fonte: Business Intelligence,(Efraim Turban, et. al) Modelo de pressões – reações – suporte de negócios Análise, decisões, previsões Suporte computadorIzado à decisão integrado BI Business Intelligence SERVIÇO GEOLÓGICO DO BRASIL SISTEMA DE APOIO A DECISÃO BI – Business Intelligence BI é um conjunto de conceitos e metodologias que, fazendo uso do conhecimento (fatos) e sistemas baseados nos mesmos apoia a tomada de decisão do negócio Característica de um sistema de BI • Database Marketing • CRM (Customer Relationship Management) • Data Warehousing • Data Warehouse • Data Mart • Olap (On-line Analytical Processing) • Data Mining • Business Performance Management (Balanced Scorecard) SERVIÇO GEOLÓGICO DO BRASIL SISTEMA DE APOIO A DECISÃO Arquitetura do BI – Business Intelligence Ambiente de análise de negócio Ambiente de data warehouse Fonte de dados Equipe técnica Constrói o data warehouse Organização,resu mo padronização, etc Usuários de negócios Acessa Data Warehouse Manipulação, resultados Interface de usuário Componentes futuro, sistemas inteligentes Navegador, portal, dashboard Fonte: Business Intelligence, (Efraim Turban, et. al) Desempenho e estratégia Gerentes/executivos, Estratégias de business performance management (BPM) SERVIÇO GEOLÓGICO DO BRASIL CONSTRUÇÃO DO CONHECIMENTO DIGITAL Sabedoria Visualização Interpretação Decisão Conhecimento Data Mining Informação Dado Data Warehouses, Data Marts Papel, Arquivos, WWW, BD, etc. SERVIÇO GEOLÓGICO DO BRASIL KDD – DESCOBERTA DO CONHECIMENTO EM BASE DE DADOS Conhecimento Coração do processo Data Mining Avaliação de Padrões Processo KDD Data Mining Seleção e Transformação Data Warehouse Fase I – Diagnóstico da Base Limpeza dos Dados Fase II – Data Warehouse Fase III – Tecnologia OLAP Fase IV – Data Mining Base de Dados Fase V - Sistema de Apoio a Decisão SERVIÇO GEOLÓGICO DO BRASIL FUNCIONALIDADES EM MINERAÇÃO DE DADOS SERVIÇO GEOLÓGICO DO BRASIL FUNCIONALIDADES EM MINERAÇÃO DE DADOS SERVIÇO GEOLÓGICO DO BRASIL MINERAÇÃO DE DADOS NO CONTEXTO DO RECURSO HÍDRICO Ciclo Hidrológico - Visão Sistêmica Hidrologia – ciência estocástica que trata da circulação da água na natureza CHUVA DE G EL O INFILTRAÇÃO Coleta de Dados • Consistência de Dados • Armazenamento de Dados • Recuperação e Difusão de Dados CHUVA EVAPORAÇÃO NEVE • ESC OA ME NTO RAIOS SOLARES TRANSPIRAÇÃO EVAPORAÇÃO Lago NÍVEL DA ÁGUA SUBTERRÂNEA Rio Oceano ÁGUA SUBTERRÂNEA ÁGUA SUBTERRÂNEA O CICLO HIDROLÓGICO SERVIÇO GEOLÓGICO DO BRASIL MINERAÇÃO DE DADOS NO CONTEXTO DO RECURSO HÍDRICO Sistema de Informação e Base de Dados QC Banco de Dados Central Origem do Problema? Coleta e Integração de Dados Fonte: Schlumberger • Inconsistências e falhas • Falta de padronização • Falta de Integração Sistema de Apoio a Decisão Ineficaz SERVIÇO GEOLÓGICO DO BRASIL MINERAÇÃO DE DADOS NO CONTEXTO DO RECURSO HÍDRICO Cadastro de Poços - Estado da Arte Sistema de Informações de Águas Subterrâneas Sistema de Apoio a Decisão Abandonado 9% Sem Informação 0,5 % Paralisado 14% Não Instalado 18% Cadastro de Fontes de Abastecimentos de Águas Subterrâneas Situação dos Poços Profundos no Nordeste Em Operação 58,5% Estudos, Gestão e Aproveitamento da Água Subterrânea POSTE COM ENERGIA ELÉTRICA CASA DE BOMBA / QUADRO ELÉTRICO Caixa d'Água 8.000 litros CHAFARIZ SERVIÇO GEOLÓGICO DO BRASIL MINERAÇÃO DE DADOS NO CONTEXTO DO RECURSO HÍDRICO Sistema de Informação de Águas Subterrâneas - SIAGAS O Sistema de Informações de Águas Subterrâneas – SIAGAS •Histórico – 1996 a 2010 •Base de Dados – 200.000 poços •Aplicações: Estudo e Gestão Sistema de Apoio a Decisão – SAD •Pré-Processamento de Dados •Data Warehouse; •OLAP •Data Mining SERVIÇO GEOLÓGICO DO BRASIL MINERAÇÃO DE DADOS NO CONTEXTO DE RECURSOS HÍDRICOS SIAGAS - Diagnóstico da Base de Dados SIAGAS - REGISTRO CADASTRADO 16% 6% 4% NORTE REGIÃO CENTRO OESTE REGIÃO NORDESTE 18% REGIÃO SUDESTE REGIÃO SUL 56% SERVIÇO GEOLÓGICO DO BRASIL MINERAÇÃO DE DADOS NO CONTEXTO DE RECURSOS HÍDRICOS SIAGAS - Diagnóstico da Base de Dados SIAGAS - No. REGISTRO POR ATRIBUTO - GRUPO I 100% 80% 60% ENT. CADAST. 40% PROPRIETÁRIO 20% USO ÁGUA 0% NORTE REGIÃO CENTRO OESTE REGIÃO NORDESTE REGIÃO SUDESTE REGIÃO SUL SIAGAS - No. REGISTRO POR ATRIBUTO - GRUPO II 80% 60% FORMAÇÃO 40% LITOLOGIA 20% SITUAÇÃO 0% NORTE REGIÃO CENTRO OESTE REGIÃO NORDESTE REGIÃO SUDESTE REGIÃO SUL SERVIÇO GEOLÓGICO DO BRASIL MINERAÇÃO DE DADOS NO CONTEXTO DE RECURSOS HÍDRICOS SIAGAS - Diagnóstico da Base de Dados SIAGAS - No. REGISTRO POR ATRIBUTO - GRUPO III 70% 60% 50% 40% 30% 20% 10% 0% NIVEL EST. NÍVEL DINÂMICO VAZÃO NORTE REGIÃO CENTRO OESTE REGIÃO NORDESTE REGIÃO SUDESTE REGIÃO SUL SERVIÇO GEOLÓGICO DO BRASIL MINERAÇÃO DE DADOS NO CONTEXTO DE RECURSOS HÍDRICOS SIAGAS - Diagnóstico da Base de Dados SIAGAS - No. REGISTRO POR ATRIBUTO - GRUPO IV 35% 30% 25% 20% 15% 10% 5% 0% Ph COND. ELÉTRICA FERRO TOTAL NORTE REGIÃO CENTRO OESTE REGIÃO NORDESTE REGIÃO REGIÃO SUL SUDESTE SIAGAS - No. REGISTRO POR ATRIBUTO - GRUPO V 8% 6% 4% CLORETOS 2% SOLIDOS TOTAIS COL. FECAIS 0% NORTE REGIÃO CENTRO OESTE REGIÃO NORDESTE REGIÃO REGIÃO SUL SUDESTE SERVIÇO GEOLÓGICO DO BRASIL MINERAÇÃO DE DADOS NO CONTEXTO DOS RECURSOS HIDRICOS Sistema de Informações de Águas Subterrâneas O que fazer? Difusão do Conhecimento Planejar, controlar e gerenciar a base de dados de águas subterrâneas, em ambiente Data Warehouse, promovendo melhorias no processo de apoio à decisão, baseado na descoberta de conhecimento. Estudos Interpretativos Por que fazer? Administração de Base de Dados Levantamento Básico •Elevar a eficácia no processos decisórios em recursos hídricos subterrâneos; •Reduzir as incertezas no processo de implantação e recuperação de poços profundos; •Descobrir padrões e novos conhecimentos na base de dados que orientem as políticas públicas em recursos hídricos SERVIÇO GEOLÓGICO DO BRASIL MINERAÇÃO DE DADOS NO CONTEXTO DE RECURSOS HÍDRICOS Sistema de Informações de Águas Subterrâneas - SIAGAS Objetivo Geral Sistema de Apoio a Decisão Data Minning Data Warehouse Base de Dados Referencial •Organizar a base de dados em Data Warehouse; •Realizar a Mineração de Dados numa área de estudo •Instituir um Sistema de Apoio a Decisão – SAD em recursos hídricos Objetivo Especifico •Implantar uma Base de Dados Referencial; •Organizar os dados em um Data Warehouse • Aplicar Data Mining em um Estudo de Caso SERVIÇO GEOLÓGICO DO BRASIL CONCLUSÃO Elevar o nível de sucesso na perfuração dos poços que promova a redução dos custos do programa de aproveitamento de águas subterrâneas. Fomentar a utilização da Mineração de Dados para extrair informações que apoiem as decisões nas políticas de recursos hídricos e ambiental Estimular a utilização do SAD e SIAGAS como ferramentas a serem utilizadas,com padrão nacional, nos instrumentos da Política Nacional de Recursos Hidricos SERVIÇO GEOLÓGICO DO BRASIL MUITO OBRIGADO! Frederico Cláudio Peixinho [email protected] www.cprm.gov.br