MINISTÉRIO DA EDUCAÇÃO E DO DESPORTO Universidade Federal de Ouro Preto – UFOP Instituto de Ciências Exatas e Biológicas – ICEB Programa de Pós-Graduação Graduação em Ciência da Computação PPGCC/UFOP João Tácio Corrêa da Silva SIGHabitar - Uma abordagem baseada em Inteligência de Negócios para o desenvolvimento de Sistemas de Informação Territorial: O Cadastro Técnico Multifinalitário do Município de Ouro Preto, MG Ouro Preto 2012 João Tácio Corrêa da Silva SIGHabitar - Uma abordagem baseada em Inteligência de Negócios para o desenvolvimento de Sistemas de Informação Territorial: O Cadastro Técnico Multifinalitário do Município de Ouro Preto, MG Dissertação apresentada ao Programa de Pós-Graduação em Ciência da Computação da Universidade Federal de Ouro Preto como requisito para a obtenção do título de mestre em Ciência da Computação. Orientador: Tiago Garcia de Senna Carneiro Co-orientador: Joubert de Castro Lima Ouro Preto Instituto de Ciências Exatas e Biológicas da UFOP 2012 S586s Silva, João Tácio Corrêa da. SIGHabitar – Uma abordagem baseada em inteligência de negócios para o desenvolvimento de sistemas de informação territorial [manuscrito] : o cadastro técnico multifinalitário do município de Ouro Preto, MG / João Tácio Corrêa da Silva – 2012. 70 f.: il. color.; tabs.; mapas. Orientador: Prof. Dr. Tiago Garcia de Senna Carneiro. Co-orientador: Prof. Dr. Joubert de Castro Lima. Dissertação (Mestrado) - Universidade Federal de Ouro Preto. Instituto de Ciências Exatas e Biológicas. Departamento de Computação. Programa de Pós-graduação em Ciência da Computação. Área de concentração: Sistemas de computação 1. Sistemas de informação geográfica - Teses. 2. Cadastro técnico multifinalitário Teses. 3. Data Warehouse - Teses. 4. Banco de dados - Teses. 5. Processo decisório Processamento de dados - Teses. I. Universidade Federal de Ouro Preto. II. Título. CDU: 004.65 Catalogação: [email protected] Dedico este trabalho a todos aqueles que contribuíram para que ele fosse consolidado. Agradecimentos À Universidade Federal de Ouro Preto (UFOP) por esta oportunidade. Aos professores do PPGCC que contribuíram em minha formação.. À Prefeitura Municipal de Ouro Preto, patrocinadora do projeto SIGHabitar. Ao laboratório TerraLAB, pelo acolhimento, suporte e infra-estrutura. Em especial à equipe de colaboradores do projeto SIGHabitar, José Francisco, Erika, Augusto e Luiz pelo empenho e dedicação. Aos meus orientadores prof. Dr. Tiago Garcia de Senna Carneiro e prof. Dr. Joubert de Castro Lima, pela orientação, confiança e paciência ao longo desse trabalho. À minha namorada Luciene, pelo carinho, dedicação e companheirismo. Aos meus pais e irmãs, fonte de inspiração e confiança. A Deus, que concedeu-me força, persistência e condições para realizar esse trabalho. Resumo As técnicas para o desenvolvimento de sistemas de informação para a gestão dos territórios municipais têm evoluído rapidamente. A crescente demanda por análises completas e atualizadas para apoiar a tomada de decisão e o planejamento municipal levou à especialização do cadastro imobiliário, cujos fatos relacionam-se com questões imobiliárias, jurídicas e fiscais, em um Cadastro Técnico Multifinalitário (CTM). O CTM busca representar vários outros aspectos do município, como saúde, segurança, educação e meio ambiente. Os Sistemas de Informação Territoriais (SIT) passaram a incorporar métodos e tecnologias de Sistema de Informação Geográfica (GIS) para representar a forma e localização geográficas dos fatos. O armazenamento e análise de um grande volume de dados espaciais e temporais levou a pesquisas por ferramentas que pudessem realizá-los com segurança e eficiência. No entanto, são raras as experiências relatadas na literatura que exploram o uso de técnicas de Inteligência de Negócios (Business Intelligence - BI) para a construção de SITs. Apesar de há anos existirem tecnologias livres para construir SITs, em todo o mundo, pouquíssimos municípios dispõe de um. Este fato justifica-se pela falta de pessoas especializadas para construí-los e mantê-los, de exemplos bem documentados para ser copiado e da garantia de retorno do investimento no sistema. Diante deste cenário, este trabalho procura desenvolver, avaliar e documentar uma abordagem que permita o desenvolvimento de um SIT que seja flexível o suficiente para absorver mudanças no território e nas questões a serem analisadas, sem que elas demandem grandes alterações nos esquemas dos bancos de dados e nas ferramentas para integração e análise. Para isso, métodos e ferramentas de BI foram emprega para implementar o CTM de um município de médio porte como um armazém de dados espaço-temporal (Spatio-Temporal Data Warehouse - STDW). Ferramentas ETL (Extract Transform and Load) foram utilizadas para a integração dos dados e ferramentas OLAP (On Line Analytical Processing) foram utilizadas para análise. Os resultados mostraram que, em dois meses, 92,5% dos 3.037 imóveis registrados na área de estudo foram corretamente georreferenciados e associados a informações de sistemas legados. Estima-se que a maior parte dos investimentos no SIT seja recuperada após o primeiro ano de uso para cobranças de taxas por serviços e de impostos imobiliários. Sumário 1. INTRODUÇÃO ..............................................................................................................................................10 1.1. OBJETIVO GERAL ......................................................................................................................................13 1.2. OBJETIVOS ESPECÍFICOS ...........................................................................................................................13 1.3. JUSTIFICATIVA ..........................................................................................................................................14 2. FUNDAMENTAÇÃO TEÓRICA .......................................................................................................................15 2.1. CONCEITOS BÁSICOS ................................................................................................................................15 2.1.1. Cadastro Imobiliário ........................................................................................................................... 15 2.1.2. Cadastro Técnico Multifinalitário ....................................................................................................... 16 2.1.3. Sistemas de Informação Territorial .................................................................................................... 17 2.1.4. Modelo de dados transacionais e modelos multidimensionais.......................................................... 18 2.1.5. Inteligência de Negócio ...................................................................................................................... 21 2.1.6. Data Warehouse ................................................................................................................................ 21 2.1.7. Consultas OLAP .................................................................................................................................. 24 3. UMA ABORDAGEM PARA O DESENVOLVIMENTO E A MANUTENÇÃO DE SITS ............................................31 3.1. PRINCÍPIOS BÁSICOS DESTA ABORDAGEM ...............................................................................................31 3.2. METODOLOGIA DE DESENVOLVIMENTO EVOLUTIVA ...............................................................................32 3.3. ARQUITETURA DE SISTEMA DE INFORMAÇÃO TERRITORIAL ....................................................................33 3.4. MODELO DE DADOS .................................................................................................................................34 3.5. PROCESSO DE DESENVOLVIMENTO DO CTM ESPAÇO TEMPORAL ............................................................37 3.6 CADASTRO E INTEGRAÇÃO DE INFORMAÇÕES ..........................................................................................41 3.7. PROCESSOS E FERRAMENTAS PARA O DESENVOLVIMENTO E MANUTENÇÃO DO CTM ............................43 3.8. FERRAMENTAS PARA COLETA, ATUALIZAÇÃO E CONTROLE DE QUALIDADE DE DADOS ...........................44 3.9 ARMAZENAMENTO DE INFORMAÇÕES ESPAÇO-TEMPORAL .....................................................................48 3.10 CONSULTAS AGREGADAS ........................................................................................................................49 4. UM ESTUDO DE CASO – O MUNICÍPIO DE OURO PRETO, MG ......................................................................51 4.1. ÁREA DE ESTUDO .....................................................................................................................................51 4.2. O SISTEMA DE INFORMAÇÃO TERRITORIAL SIGHABITAR .........................................................................52 4.3. O CADASTRO TÉCNICO MULTIFINALITÁRIO DE OURO PRETO ...................................................................53 4.4. EXPERIMENTOS PARA AVALIAÇÃO DA ABORDAGEM PROPOSTA .............................................................53 5. CONCLUSÕES E TRABALHOS FUTUROS ........................................................................................................56 REFERÊNCIAS ..................................................................................................................................................59 ANEXO A – FORMULÁRIO BCI .........................................................................................................................64 ANEXO B – CARNE DE PAGAMENTO DE ITPU ..................................................................................................65 ANEXO C – MODELO CCDM PARTE 1 ...............................................................................................................66 ANEXO D – MODELO CCDM PARTE 2...............................................................................................................67 ANEXO E – MODELO DE DADOS CONCEITUAL PARA CTM ...............................................................................68 Lista de Figuras FIGURA 1. FICHA DO ARQUIVO FÍSICO DO CADASTRO UTILIZADA EM 1982. FONTE: PMOP ..................................................16 FIGURA 2. CADASTRO TÉCNICO MULTIFINALITÁRIO .....................................................................................................17 FIGURA 3. EVOLUÇÃO DO CADASTRO IMOBILIÁRIO PARA O SIT ......................................................................................17 FIGURA 4. EVOLUÇÃO DE OBJETOS. FONTE: ADAPTADA DE [GÓMEZ, ET AL., 2011] ...........................................................22 FIGURA 5. ESQUEMA FLOCO DE NEVE E ESTRELA. FONTE: ADAPTADA DE [INMON, 1996] ....................................................23 FIGURA 6. ESTRATÉGIA BOTTOM-UP PARA CONSTRUÇÃO DE DW....................................................................................23 FIGURA 7. FLUXO DE ANÁLISE OLAP NO DW. ...........................................................................................................24 FIGURA 8. CICLO DE EVOLUÇÃO DO CADASTRO. ..........................................................................................................26 FIGURA 9. NÚCLEO DO CCDM. FONTE: VAN OOSTEROM ET AL. , 2006FIGURA ................................................................28 FIGURA 10. ARQUITETURA REGIONAL DO DW. FONTE: [SIMONOVA E KOMARKOVA, 2004]. ...............................................29 FIGURA 11. COMPARATIVO ENTRE TRABALHOS CORRELATOS. ........................................................................................30 FIGURA 12. ARQUITETURA DE SOFTWARE DE UM SIT ESTRUTURADO COMO UM BI.............................................................34 FIGURA 13. MODELO DE BANCO DE DADOS RELACIONAL DE UM CADASTRO IMOBILIÁRIO. ....................................................35 FIGURA 14. MODELO CONCEITUAL ORIENTADO POR OBJETOS DO CTM. ...........................................................................35 FIGURA 15. MODELOS ENTIDADE-RELACIONAMENTO DO CTM ORGANIZADO COMO UM STDW. ..........................................37 FIGURA 16. MODELO DE DADOS GEOGRÁFICOS (OMT-G) DO CTM ESPAÇO TEMPORAL ......................................................38 FIGURA 17. REGISTRO DE IMAGEM DE SENSOR REMOTO . .............................................................................................38 FIGURA 18. MODELO DIGITAL DE ELEVAÇÃO. .............................................................................................................39 FIGURA 19. IMAGEM DE WEIHEIM, ALEMANHA: A) ANTES DA CORREÇÃO E B) APÓS A CORREÇÃO RADIOMÉTRICA. FONTE: [ROSA E FERNANDES, 2011] ....................................................................................................................................40 FIGURA 20. COMPARATIVO ENTRE GOOGLE EARTH, GPS E DGPS. FONTE: [ LIMA ET. AL, 2009] ..........................................41 FIGURA 21. ERROS CADASTRAIS ..............................................................................................................................42 FIGURA 22. CATÁLOGO DE ERROS DO ETL .................................................................................................................42 FIGURA 23. LAYER DE UNIDADES HABITACIONAIS. .......................................................................................................43 FIGURA 24. ESTRUTURA DE UM SCRIPT NO GEOKETTLE ................................................................................................44 FIGURA 25. INFORMAÇÕES COLETADAS EM CAMPO .....................................................................................................45 FIGURA 26. DISTORÇÃO ENTRE IMAGENS. .................................................................................................................45 FIGURA 27. MAPA RESULTANTE DO PLUGIN QUALITYCONTROL ......................................................................................46 FIGURA 28. PLUGIN ADDRESSLOCATOR ....................................................................................................................47 FIGURA 29. PLUGIN REPORTMAKER ........................................................................................................................48 FIGURA 30. ARMAZENAMENTO DE DADOS NO DW .....................................................................................................49 FIGURA 31. FLUXO DE ACESSO AOS DADOS ................................................................................................................50 FIGURA 32. EVOLUÇÃO DE 300% NO CADASTRO IMOBILIÁRIO NO BAIRRO LAGOA ..............................................................50 FIGURA 33. ÁREA DE ESTUDO NO MUNICÍPIO DE OURO PRETO, MINAS GERAIS, BRASIL. .....................................................51 FIGURA 34. CADASTROS INCORRETOS ......................................................................................................................54 FIGURA 35. EVOLUÇÃO DA DISTRIBUIÇÃO ESPACIAL DO VALOR DO IPTU NOS ANOS DE 2009, 2010 E 2011. ...........................55 Lista de Siglas e Abreviaturas BI – Business Intelligence BCI – Boletim de Cadastro Imobiliário CCDM – Core Cadastral Domain Model CTM – Cadastro Técnico Multifinalitário DM – Data Mining DW – Data Warehouse ETL – Extract, Transform and Load FCI – Ficha de Cadastro Imobiliário IPTU – Imposto Predial Territorial Urbano PMOP – Prefeitura Municipal de Ouro Preto RUP – Rational Unified Process SDW – Spatial Data Warehouse SIG – Sistema de Informação Geográfica SIT – Sistema de Informação Territorial SOLAP – Spatial Online Analytical Processing STDW – Spatial-Temporal Data Warehouse TDW – Temporal Data Warehouse 1. Introdução Tecnologias gratuitas para o desenvolvimento de sistemas de informação destinados à administração territorial de municípios existem há vários anos [Câmara e Fonseca, 2008]. No entanto, um estudo realizado pela Fundação Getúlio Vargas em 2007 apontou que, no Brasil somente 95 (2,82%) dos 3.359 municípios avaliados puderam ser considerados eficientes na gestão tributária. Em 2009 o Ministério das Cidades criou a portaria 511, com diretrizes para criar, instituir e atualizar o Cadastro Técnico Multifinalitário (CTM) nos municípios brasileiros. Esse cadastro, além de armazenar o inventário do município, atende às necessidades sociais, ambientais, econômicas, da administração pública e de segurança jurídica da sociedade. Porém, os investimentos em tecnologia são bastante restritos na maioria dos municípios de pequeno e médio porte [Pereira, 2002]. A ausência de uma metodologia padronizada e reconhecida para a construção e manutenção de um Sistema de Informação Territorial é uma limitação que desencoraja muitos municípios a investir recursos na reforma do cadastro imobiliário, pelo fato de não terem garantia de sucesso. No Brasil, essa situação é agravada porque o número de profissionais capacitados nessa área é insuficiente para um país com dimensões continentais [Loch, 2007]. Sistemas de Informação Territorial (SIT), de um modo geral, são sistemas de informação transacionais, baseados em Sistemas de Informação Geográfica (SIG), que visam armazenar e consultar informações descritivas e espaciais do território, para promover o crescimento ordenado de um município e a distribuição eficaz e justa de seus recursos [Fourie e Nino-Fluck, 2000] [Wyatt e Ralphs, 2003] [Loch e Erba, 2007]. Apesar do desenvolvimento de SITs ser um tema muito pesquisado nas últimas décadas, são poucas as iniciativas relatadas na literatura que exploram os métodos, técnicas e ferramentas de Inteligência de Negócios (Business Intelligence BI) neste nicho [Ting and Williamson 2000] [Abdel-Rahman et. al 2001] [Ahmed, et. al 2004]. Os primeiros trabalhos buscaram responder a questões sobre os requisitos e o projeto do modelo de dados relacional de um repositório unificado de dados heterogêneos, com informações descritivas sobre diversos assuntos relacionados ao território, o chamado Cadastro Técnico Multifinalitário (CTM) [Kaufmann e Steudler 1998] [Williamson 2000]. No entanto, esses trabalhos são indicados para uso em sistemas transacionais e não suportam armazenar e explorar analiticamente dados 10 sobre a localização e as mudanças de objetos armazenados em fontes de dados independentes [Bédard, 2001]. Para permitir análises completas e atualizadas capazes de apoiar o processo de tomada de decisão, o CTM pode ser entendido e modelado como um repositório de dados multidimensional constituído por informações espaciais e temporais. Devido à complexidade do dinamismo urbano, na qual mudanças são comuns, a atualização e evolução desse repositório são os principais desafios. Por outro lado, pesquisas em BI levaram ao desenvolvimento de métodos e ferramentas para coletar, armazenar, integrar, explorar e servir um grande volume de dados que ajudam os municípios, a tomarem decisões a partir de informações completas e atualizadas [Turban e Aronson 1998] [Shmueli et al. 2007]. Sistemas de BI apóiam decisões nos níveis tático (um técnico que monitora a disponibilidade de recursos), operacional (um gerente rastreando resultados para planejar ações futuras) e estratégico (um executivo analisando indicadores de desempenho) das organizações. Armazéns de Dados Espaço-Temporais (Spatial Temporal Data Warehouse – STDW) organizam hierarquicamente uma quantidade massiva de dados referente à localização espacial e variações no tempo de objetos [Gómez et al., 2011]. O uso de ferramentas de extração, transformação e carga (Extract, Tranform and Load - ETL) permitem a eficiente atualização do STDW a partir de fontes de dados heterogêneas e dispersas por diferentes sistemas de informação. Mudanças nestas fontes ou no modelo de dados do próprio STDW podem ser absorvidas por pequenas mudanças em fluxos ETL, conferindo flexibilidade ao sistema. A utilização de ferramentas de mineração de dados (Data Mining – DM e Online Analytical Processing - OLAP) resulta na eficaz personalização de relatórios [Kimball e Caserta, 2004]. Diante deste cenário, este trabalho avalia o uso de métodos, técnicas e ferramentas de BI como uma abordagem viável para a construção e manutenção eficiente de CTMs no contexto de um Sistema de Informação Territorial (SIT). Para isso, o CTM do município Ouro Preto, que pertence ao estado de Minas Gerais (MG), foi construído na forma de um STDW e tecnologias de BI foram utilizadas na construção de um SIT focado em aspectos geográficos, imobiliários e tributários. Ao 11 longo de dois anos, esse SIT foi maturado em ciclos de desenvolvimento incrementais. A cada ciclo, versões melhoradas do STDW, dos fluxos ETL e dos relatórios foram produzidas para atender necessidades de análise que evoluíram no tempo. Atividades de levantamento de requisitos orientadas por objetos subsidiaram o projeto do modelo de dados do STDW. Fluxos ETL foram desenvolvidos para integrar dados de diversos bancos de dados geográficos com dados provenientes do cadastro de imóveis do município. Coletas de dados em campo e ferramentas de controle de qualidade de dados subsidiaram a contínua melhoria do STDW e dos fluxos ETL. Foram desenvolvidas ferramentas integradas a Sistemas de Informação Geográfica (SIG) para geração de relatórios na forma de mapas dinâmicos e interativos. Além disso, a região do município que apresenta a maior dinâmica de ocupação do solo foi escolhida para a condução de experimentos que permitissem avaliar a capacidade da abordagem proposta em evoluir e manter atualizado o CTM construído. O uso de BI para o desenvolvimento de um SIT mostrou-se uma abordagem eficaz e também uma solução eficiente para a contínua atualização e evolução de um CTM. A integração do cadastro imobiliário pré-existente com o SIT resultou na padronização das informações comuns entre os sistemas, como nomenclatura de vias, bairros e informação complementar dos imóveis. Os experimentos de avaliação mostraram que, em um período de seis meses, 92,5% dos 3.037 imóveis registrados a área de estudo foram corretamente georreferenciados e associados a informações oriundas de outros sistemas. Além disso, outros 1.195 novos imóveis foram identificados em campo e cadastrados no SIT. Ao longo de todo o projeto, uma equipe formada basicamente por quatro estudantes conseguiu manter o sistema em funcionamento e atualizado, absorvendo com rapidez diversas mudanças sofridas pelas fontes de dados, pelo modelo de dados do CTM e pelas necessidades de análise demandadas pelos técnicos administrativos do município. Estima-se que devido à ampliação da base imobiliária cadastrada e de uma tributação mais justa e efetiva, cinquenta por cento do investimento no projeto seja recuperado no primeiro ano em que ele for utilizado pela Secretaria da Fazenda, para cobranças de taxas e impostos. As demais secretarias, como saúde, educação e meio ambiente, deverão ser integradas com o avanço da implantação do CTM. 12 O restante deste texto está organizado como segue: O Capítulo 2 apresenta os conceitos fundamentais e compara o trabalho realizado com trabalhos relevantes encontrados na literatura. O Capítulo 3 apresenta a abordagem desenvolvida neste trabalho, na qual um SIT é arquitetado na forma de uma plataforma BI. Ele também descreve o modelo de dados do STDW e as ferramentas de atualização, manutenção e análise desenvolvidas neste trabalho. No Capítulo 4, o estudo de caso que permitiu avaliação desta abordagem é descrito. As principais lições aprendidas no decorrer deste trabalho e propostas de trabalhos futuros são discutidos no Capítulo 5. 1.1. Objetivo Geral Este trabalho tem como objetivo desenvolver pesquisas acerca de uma abordagem para a implementação de SITs em municípios de pequeno e médio porte. Esta abordagem visa superar deficiências das abordagens tradicionais, inclui o desenvolvimento e a manutenção de um CTM arquitetado na forma de um STDW. Acredita-se que essa abordagem permitirá a tomada de decisão e o planejamento territorial mais completo e mais acurado, levando a um melhor e maior conhecimento do território e de seus fenômenos sociais, econômicos e ambientais. 1.2. Objetivos Específicos Como objetivos específicos são pretendidos alcançar os seguintes: • Investigar o estado da arte das abordagens para desenvolvimento de SIT; • Investigar o estado da arte do CTM no Brasil e no mundo; • Comparar os resultados dos trabalhos mais relevantes; • Verificar as limitações dos métodos e ferramentas existentes, de maneira a identificar melhorias para o desenvolvimento e manutenção de CTMs; • Desenvolver e documentar um conjunto de métodos e ferramentas que apoiem o desenvolvimento e manutenção de SITs para municípios de pequeno e médio porte sobre tecnologias livres; 13 • Avaliar estas ferramentas e métodos em um estudo de caso real no qual o SIT para um município de médio porte é desenvolvido . 1.3. Justificativa O cadastro imobiliário é mundialmente utilizado há mais de um século. No decorrer desse tempo, evoluções no método cadastral, inserção de novas funcionalidades, aumento do número de usuários e avanço tecnológico, tornou-o em um CTM. Comumente pesquisas nacionais e internacionais sobre CTM estruturam-no sobre sistemas transacionais, tecnologia SIG e modelo de dados relacional. No entanto, essa estrutura é relativamente limitada para ser utilizada como ferramenta de suporte a tomada de decisão e planejamento urbano sobre um grande volume de dados. Além disso, no Brasil não existe um conjunto consolidado e reconhecido de métodos e tecnologias para implantar e manter o CTM. Essas limitações desencorajam a maioria dos municípios brasileiros iniciarem projetos nesse nicho, porque não há garantia de sucesso. Em 2007 uma pesquisa desenvolvida pela Fundação Getúlio Vargas, apontou que dentre 3359 municípios brasileiros avaliados, somente 2,87% foram considerados eficientes na gestão urbana de tributos. 14 2. Fundamentação Teórica 2.1. Conceitos Básicos Essa seção descreve conceitos básicos abordados neste trabalho. Inicialmente eles são relacionados ao cadastro de características urbanas que impactam na cobrança de tributos e distribuição de recursos. Em seguida são descritas tecnologias e ferramentas capazes de armazenar, explorar e integrar essas características a diversas bases de dados independentes e heterogêneas, para garantir a tomada de decisão mais precisa. 2.1.1. Cadastro Imobiliário O cadastro do território brasileiro existe desde 1530 por meio do sistema sesmarial1. Porém, a preocupação com o registro público de terras foi a partir de 1850, com a criação da lei 601, também conhecida como lei das terras, que foi o marco inicial do cadastro estruturado em parcelas. O Ministério das Cidades define que parcela é a menor unidade cadastral do cadastro imobiliário. Ela é uma parte contígua da superfície terrestre com regime jurídico único. É considerada parcela cadastral toda e qualquer porção da superfície no município a ser cadastrada [Ministério das Cidades, 2009]. O cadastro imobiliário é um inventário público com informações estruturadas baseadas em levantamentos de campo, sobre características físicas, legais e jurídicas das parcelas de um território, situadas em uma região (país, estado, município, etc.), [Williamson, 1983] [Dale, 1989]. 1 Sesmarial é um sistema para normalizar a distribuição do território criado pelo Instituto Jurídico Sesmaria Português. 15 Figura 1. Ficha do arquivo físico do cadastro utilizada em 1982. Fonte: PMOP A Figura 1 apresenta uma das fichas que compunha o arquivo físico da prefeitura de Ouro Preto, utilizada para o cadastro de imóveis, denominada Ficha de Cadastro Imobiliário (FCI). Ao longo dos anos, as fichas se tornaram obsoletas e originaram um novo formulário nomeado Boletim de Cadastro Imobiliário (BCI). Ao BCI foram adicionadas características para descrever com maior nível de detalhes informações sobre o imóvel (estado de conservação, tipo de revestimento interno e externo e vagas de garagem); serviços disponíveis (água, esgoto e coleta de lixo); pavimento da via (calçamento, asfalto e terra) e geologia do terreno (rochoso, plano, inclinado). Além dessas, inúmeras outras características constituem o BCI e são utilizadas para calcular o valor dos tributos imobiliários, por meio de carnês enviados aos contribuintes. Os formulários BCI e carnê de cobrança utilizados no município de Ouro Preto, são ilustrados respectivamente nos anexos A e B. 2.1.2. Cadastro Técnico Multifinalitário O Cadastro Técnico Multifinalitário (CTM) é um cadastro capaz de manter dados alfanuméricos das parcelas e de diversos fatos que elas se relacionam. Além de contemplar aspectos do tradicional cadastro imobiliário concernentes às parcelas, é possível relacioná-las com informações de bancos de dados heterogêneas e até mesmo desconectadas sobre uma diversidade de assuntos, como: fatores sociais (trabalho, lazer, saúde, educação e segurança); econômicos (produção e comercialização de bens e serviços) e urbanos (sistemas de abastecimento de água e coleta de esgoto, transporte e rede de comunicação). Isso permite conhecer detalhadamente qualquer porção do território, promover a distribuição justa de 16 recursos e tornar o planejamento urbano mais mais acurado. [Loch e Erba, 2007] [Kaufmann e Steudler ler 1998] [Williamson 2000]. A Figura 2 ilustra o CTM. Figura 2. Cadastro Técnico Multifinalitário 2.1.3. Sistemas de Informação Informaç Territorial Com o avanço da tecnologia da informação e novos métodos cadastrais, o cadastro imobiliário assume um novo papel. Além de armazenar informações sobre as parcelas, ele passa a ser utilizado para apoiar a tomada de decisão, promover o desenvolvimento urbano e ambiental, permitir identificar padrões de uso e ocupação do solo, monitorar intervenções urbanas e fomentar políticas sociais [Loch, 2003]. Figura 3.. Evolução do cadastro imobiliário para o SIT 17 O CTM, quando estruturado sobre uma ferramenta de Sistema de Informação Geográfica (SIG), é chamado de Sistema de Informação Territorial (SIT), conforme ilustra a Figura 3. SIG é capaz de armazenar, consultar, transformar e operar sobre informações espaciais e alfanuméricas de objetos geográficos do mundo real. Esses objetos devem ser georreferenciados numa projeção cartográfica. Além disso, eles geralmente são agrupados por assunto e forma geométrica, dispostos em camadas. [Smith et al., 1987] [Burrough et al., 1986] [Aronoff et al., 1989]. O SIT permite visualizar com maior nível de detalhes informações sobre direito, restrições e responsabilidades das parcelas. Ele é capaz de tratar relações espaciais entre objetos geográficos e criar mapas temáticos, que facilitam o entendimento do comportamento desses objetos. Além disso, é possível integrar dados espaciais, censitários, imagens, modelo numérico de terrenos, etc. SIT potencializa a implantação de políticas de uso do território e tem sido utilizado em vários países em desenvolvimento para desenvolver políticas fundiárias [Loch, 2007] [UN-FIG, 1999] [UNECE, 1996]. 2.1.4. Modelo de dados transacionais e modelos multidimensionais Modelos de dados transacionais são projetados para atender demandas operacionais (cadastrais) dos sistemas de informação. Modelos de dados multidimensionais são projetados para obterem alto desempenho na realização de consultas em que medidas resumem dados agregados por dimensões hierarquicamente organizadas. 18 Quadro 1 Sistema Transacional vs Multidimensional Característica Sistemas Transacionais Sistemas Multidimensionais Objetivo Operacional Informativo Processamento Transacional Multidimensional Tipo de operação Incluir, alterar e remover Carga e consulta Número de usuários Milhares Centenas Tipo de usuários Operadores Tomador de decisão Interação do usuário Pré-definida Pré-definida e ad-hoc Condições dos dados Dados operacionais Dados analíticos Capacidade armazenamento Megabytes-Gigabytes Gigabytes-Terabytes Histórico de informação 60 a 90 dias 5 a 10 anos Granularidade Detalhada Detalhada e resumida Estrutura Estática Variável Recuperação de registros Dezenas Milhares Atualização Em tempo real Periódica Integridade Transação A cada atualização Número de índices Simples e poucos Complexos e muitos Intenção dos índices Localizar um registro Aperfeiçoar consultas Terminologia Linhas e colunas Dimensões, fatos e medidas Consistência Microscópica Global Fonte: adaptado de [Kimball, 2002], [Inmon, 1996] Um sistema OLTP (on-line transaction processing) tem a finalidade de registrar transações corriqueiras de uma organização, como: cadastrar produto, consultar contribuinte, registrar venda, etc. Esse sistema necessita suportar acesso de milhares de usuários, garantir a integridade do banco a cada alteração, validar informação antes de armazená-la e gerar relatórios rápidos. Os dados transacionais gerados pelo OLTP são usados diariamente em processos que envolvem gravação e leitura. Esses dados são armazenados em tabelas normalizadas, com o mínimo de redundância, o que agrega complexidade para formular consultas pelo usuário final. Modelos multidimensionais são modelados para a tomada de decisão. Eles exploram analiticamente e com eficiência um grande volume de informações 19 oriundas de diversas fontes de dados. Por isso, essa solução é aplicável ao CTM. A comparação apresentada no quadro 1 evidencia que um CTM estruturado sobre uma ferramenta de base de dados multidimensionais é uma solução que agregaria ao cadastro importantes valores, como: armazenamento de séries históricas, otimização de consultas analíticas, visualização de dados com diversas granularidades, etc. O modelo multidimensional armazena os dados usando o operador relacional cubo de dados. Tal operador é a generalização do operador relacional group-by sobre todas as possíveis combinações de dimensões com variadas granularidades. Uma dimensão é uma perspectiva do processo decisório. Podemos citar a dimensão tempo como uma dimensão fundamental ao processo decisório. O espaço normalmente é outra perspectiva que comumente usamos ao tomar decisões. Como normalmente consideramos várias perspectivas no processo decisório, daí o nome cubo multidimensional de dados [Inmon, 1996]. O modelo multidimensional de dados é organizado em torno de um tema central, tal como notas de alunos. O tema central é representado por fatos. Um fato é a quantidade mínima de informação a ser analisada, isto é, a quantidade mínima da qual se quer analisar os relacionamentos entre as dimensões. Consideremos o cubo de dados IPTU usando apenas duas dimensões: tempo e bairro. Na representação 2D, os valores de IPTU são apresentadas em uma tabela, onde uma coluna indica o tempo e outra indica os bairros. O fato ou medida mostrada é a média de IPTU pago, conforme podemos ver na Tabela 1 [Kimball, 2002]. Tabela 1 Cubo de dados com 2 dimensões IPTU Tempo Lagoa N. Sra. Carmo N. Sra. Rosário Barra 2009 14.000 20.000 18.000 8.000 2010 18.000 22.000 21.000 9.800 2011 25.000 23.500 23.000 10.500 20 2.1.5. Inteligência de Negócio Um Sistema de Inteligência de Negócios é definido como um sistema de informação, que envolve ferramentas, métodos e softwares que subsidiam a tomada de decisão para o planejamento estratégico e tático na organização. Ele permite extrair, armazenar, explorar e transformar um grande volume de dados, de maneira rápida e simples para o usuário final. Elementos fundamentais são: data warehouse, ETL, ferramentas OLAP e data mining. Geralmente organizações armazenam suas informações em fontes de dados independentes pelos departamentos. Com isso, recuperar a analisar informações em tempo hábil torna-se difícil [Luhn HP, 1958], [Watson e Wixom, 2007]. 2.1.6. Data Warehouse A tecnologia de data warehouse (DW) é definida como um armazém de dados, orientado por assunto, integrado, variante no tempo e não volátil, que tem por objetivo dar apoio ao processo de tomada de decisão [Inmon, 1996] [Poe, et al., 1998]. Existem diferentes estratégias para implantar DW, que variam conforme o assunto dos dados e esquema do modelo dimensional de armazenamento. Temporal Data Warehouse (TDW) armazena dimensões sobre a trajetória de objetos. Spatial Data Warehouse (SDW) armazena dimensões espaciais sobre objetos. A união desses dois cria o Spatial-temporal Data Warehouse (STDW), que mantém integrado dimensões espaciais e temporais, para explorar dados sobre a evolução e também a localização geográfica de objetos do mundo real, como: veículos, migração de animais, furacões, tsunamis e ocupação do território. [Marchand, 2003],[Miquel et al., 2004] [Papadias et al., 2002] [Malinowski e Zimányi, 2008] [Gómez et al., 2011]. A Figura 4 ilustra como as evoluções dos objetos são inseridas no STDW. Inicialmente as informações sobre a evolução de um objeto são capturados pelo gestor de fluxo de evolução, que adiciona um identificador para cada evolução. Esses dados são inseridos no banco de dados MOD (moving object database) por meio de fluxos ETL. Finalmente as informações do MOD e espaciais são integradas ao TDW, formando o STDW. 21 Figura 4. Evolução de objetos. Fonte: Adaptada de [Gómez, et al., 2011] A disposição do DW no esquema estrela é caracterizada pela existência da tabela de fatos ao centro, conectada às dimensões por meio de chaves estrangeiras. As vantagens dessa abordagem são: desenho simétrico, poucas tabelas e relacionamentos, bom desempenho, consultas simples e boa manutenibilidade. Como desvantagens, não aplicáveis em modelos transacionais, informações redundantes e dimensões não normalizadas. Já o modelo flocos de neve estrutura o DW num modelo relacional, por meio da normalização das dimensões. Embora esse modelo diminua o espaço de armazenamento dos dados, ele acarreta diversas desvantagens, porque insere mais tabelas no modelo, aumenta o número de relações entre elas, o que torna as consultas mais complexas e lentas [Kimball, 2002]. A Figura 5 ilustra os esquemas estrela e flocos de neve. 22 Figura 5. Esquema floco de neve e estrela. Fonte: Adaptada de [Inmon, 1996] A construção de um DW pode ocorrer por meio de uma estratégia denominada bottom-up, que é ilustrada na Figura 6. Ela consiste na criação de data marts departamentais que, quando integrados, consolidam o DW. Conforme [Inmon, 1996], data mart é um subconjunto dos dados de um data warehouse. Ele é destinado para atender as demandas de um grupo específico de pessoas, referente a um determinado assunto, em um período de tempo qualquer. Fontes de dados Figura 6. Estratégia bottom-up para construção de DW Ferramentas ETL (Extract Transform and Load), permitem a criação de scripts utilizados no processo que extrai, transforma e carrega dados de fontes de dados heterogêneas e dispersas geograficamente, para um DW. Na extração ocorre a leitura de informações provenientes de diversas fontes de dados (planilha eletrônica, arquivo texto, banco de dados, etc.); o tratamento dessas informações, tais como: alteração de tipo, quantidade de casas decimais, remoção de caracteres especiais, entre outras, realizam-se na transformação. Na etapa de carga, as informações são 23 armazenadas no DW. A construção dos scripts ETL é uma tarefa muito complexa, sendo responsável por consumir a maior parte de recursos durante a construção do DW [Kimball e Caserta, 2004]. 2.1.7. Consultas OLAP A partir das informações armazenadas no DW, são necessárias ferramentas fe analíticas capazes de operar sobre um grande volume de dados, dispostos em um modelo multidimensional de dados, para gerar agregações sumarizadas, em diversos níveis de granularidade. Na Figura 7, ao centro do cubo contém os fatos, representados pela tabela (Zona_Geográfica_Fact). (Zona_ . Em cada uma das células centrais estão as medidas. As dimensões estão dispostas aos lados do cubo (Imóveis e Tempo). Figura 7. Fluxo de análise OLAP no DW. Ferramenta OLAP deve trabalhar conforme a maneira que os dados estão armazenados, no cubo, para isso algumas estratégias são: relacional OLAP (ROLAP), multidimensional OLAP (MOLAP) e híbrido OLAP (HOLAP). ROLAP trabalha sobre o modelo relacional, onde são realizadas otimizações no SGBD para implementar agregação lógica. MOLAP é utilizado quando o banco de dados e o SGBD são multidimensionais, isso permite bom desempenho e análises simples e rápidas. HOLAP é a combinação entre ROLAP e MOLAP. Geralmente os dados são armazenados em estruturas estruturas relacionais (ROLAP) e as agregações são armazenadas em estruturas multidimensionais (MOLAP) [Bédard [ et al., 2007]. ]. O acoplamento de DW a diferentes tecnologias da informação impulsionou o aparecimento de 24 ferramentas analíticas especializadas tais como, SOLAP e ST-OLAP. A Figura 7 apresenta o fluxo de analise de uma ferramenta OLAP sobre o DW. SOLAP é uma variação das ferramentas OLAP para tratar dimensões espaciais. Já ST-OLAP explora um cubo com dimensões espaciais e temporais, por meio de operadores especializados. Em geral os operadores são: drill-down, roll-up, drillacross, swap, pivot, slice e dice. O quadro 2 apresenta esses operadores com mais detalhes. Essas operações estão disponíveis para diferentes tipos de visualização (temático, temporal e espacial), e devem ser utilizados conforme o tipo de dimensão manipulada. Visualização Temática permite manipular dimensões descritivas para conhecer dimensões temporais e espaciais. Temporal manipula dimensões temporais para conhecer dimensões temáticas e espaciais. Espacial manuseia dimensões espaciais para conhecer níveis das dimensões temáticas e temporais. [Bédard et al., 2007]. Quadro 2 Operadores OLAP Operação Drill Drown Roll-Up Drill-Across Swap Pivot Slice e Dice Descrição Aumentar o nível de detalhe da informação em consequência da diminuição do nível de granularidade. Diminuir o nível de detalhe e aumento do nível de granularidade Exemplo Alterar a análise do total pago de IPTU no município para o total pago em uma quadra. A consulta realizada em uma dimensão pode alterar de um nível para outro sem passar por níveis intermediários. Uma dimensão tempo composta por dia, mês e ano, possibilita alterar o nível de análise de dia para ano dentro da mesma dimensão. Ordenar a informação independente do tipo (texto ou número) Ordenar clientes por nome Alterar linha e colunas. Recalcular valores totalizados. Arrastar a dimensão Divida_Ativa para dentro de uma coluna de tempo, que constitui as tuplas de uma tabela. Seleciona-se um período, por exemplo ano 2008. A alteração da análise passa de ano e região (linha e coluna) para ano e região (coluna e linha). Rotacionar em qualquer sentido os lados do cubo de dados em análise, para combinar dimensões a fim de obter informações necessárias. Alterar a análise de IPTU pago por uma quadra para o bairro ao qual ela pertence. 25 Fonte: adaptado de [Inmon, 1996] 2.2. Trabalhos Correlatos Essa seção relaciona os principais trabalhos relacionados ao SIT encontrados na literatura. Inicialmente os sistemas de cadastro imobiliário foram desenvolvidos para manter apenas informações físicas, jurídicas e fiscais das parcelas territoriais. A Figura 8 ilustra um ciclo de evolução contínua deste cadastro. Os novos métodos cadastrais, juntamente com a necessidade de integrar novos assuntos, impulsionaram a demanda por armazenamento de dados mais eficiente e aumento de funcionalidades. Com isso, o cadastro se torna uma ferramenta que atende a demandas de diversos setores e consequentemente um maior número de usuários. Todas essas mudanças são estruturadas sobre diversas tecnologias da informação que, quando integradas, transforma o tradicional cadastro imobiliário em uma ferramenta completa de gestão territorial, capaz de subsidiar a tomada de decisão e o planejamento sustentável de uma região administrativa. Figura 8. Ciclo de evolução do cadastro. Os primeiros avanços em SITs buscaram identificar os requisitos e projetar o modelo de dados de um repositório unificado, denominado CTM, para o armazenamento, consulta e análise de dados espaciais e alfanuméricos acerca do território. No ano de 1998, a Federação Internacional de Agrimensores (FIG) publicou o documento 26 Cadastre 2014, constituído de requisitos e tendências para um sistema cadastral imobiliário mais abrangente, para os 20 anos após 1994 [Kaufmann e Steudler 1998]. Este documento destaca a necessidade de melhoria da precisão das informações espaciais; de mudança de foco das análises a partir das parcelas territoriais para os objetos territoriais (propriedades); do uso de informações tridimensionais (3D) e temporais (4D) para lidar com a dinâmica e a verticalização dos municípios; e de serviços para atualização e consulta de informação cadastral em tempo-real. O artigo de [Williamson, 2000] apresenta uma revisão entre os anos de 1996 e 1999 de estratégias criadas para realizar uma reforma cadastral e inúmeros fatores que afetam o desenvolvimento do território. Existem dois componentes chaves para desenvolver uma estratégia eficaz. Primeiramente, a reforma cadastral deve possuir objetivos bem definidos, para promover sustentabilidade, segurança e estabilidade social. O segundo é desenvovler uma visão para o futuro do sistema cadastral baseado nas necessidades e infraestrutura disponível em cada lugar. Essas estratégias aliada à boa governança deverão apoiar a tomada de decisão, para agregar qualidade ao planejamento das decisões sociais, políticas, econômicas de desenvolvimento sustentável. Além disso, o autor reúne as melhores práticas utilizadas em vários países e destaca que cada país deve desenvolver SITs específicos, devido a influências de fatores sociais, legais, culturais, econômicos, institucionais e infra-estrutura disponível. O modelo de dados entidade relacionamento criado por [Van Oosterom et al., 2006] é denominado Core Cadastral Domain Model (CCDM), capaz de atender às necessidades comuns de diversos países na administração territorial. Esse modelo é fruto de um conjunto de várias versões, ajustadas em workshops e pela troca de experiências de estudos de casos aplicados em diversos países (Holanda, El Salvador, Bolívia, Dinamarca, Suíça, Portugal, Grécia, Australia, Nepal, Egito, Islândia, além de vários países africanos e árabes). A Figura 9 ilustra o cerne do CCDM, sendo ele comum a todos os países e baseado em três classes, RegisterObject (imóveis e outros objetos urbanos), RRR (direito, restrição e responsabilidades) e Person (pessoa física, jurídica ou grupo de pessoas). Além 27 disso, o CCDM permite armazenar aspectos temporais, documentos cadastrais, objetos de diversos tipos geométricos geométricos (ponto, linha e polígono), fotos de satélite, topografia de terreno e até topologias baseada em 2 ou 3 dimensões. dimensões Esse modelo é detalhado nos apêndices C (aspectos legais e propriedade) e D (imóveis e aspectos diversos relacionados às parcelas). Figura 9.. Núcleo do CCDM. Fonte: Van Oosterom et al. , 2006Figura 2006 O artigo de [Bennett et al., 2010] apresenta uma revisão do cadastro territorial no decorrer de 30 anos em vários países. Novas visões, funcionalidades e modelos alteraram teraram radicalmente o entendimento e potencial do cadastro. Essas alterações foram impulsionadas principalmente pela evolução das tecnologias da informação e teoria de sustentabilidade. As novas tendências seguem para cadastro de 4 dimensões, também chamado chama de cadastro em tempo real (redes de sensores e equipamentos de GPS fornecem informações em tempo real); cadastro orientado por objetos (representar a estrutura urbana em geral); cadastro orgânico (interesses ambientais) e global (interligação de redes regionais regionais e globais de cadastro). No Brasil, os trabalhos de [Loch e Erba, 2007] [Gonçalves, 2008] identificam os requisitos e diretrizes de um o modelo conceitual de banco de dados geográfico, para solucionar deficiências concernentes às limitações e deficiências deficiências cadastrais nos municípios brasileiros, em especial de pequeno e médio porte. Esse modelo além de contemplar informações espaciais e descritivas das parcelas, se integra a diferentes 28 áreas de conhecimento, tais como, saúde, educação, transporte, meio ambiente e outros. O Anexo E ilustra o diagrama de classes deste modelo de dados conceitual. Conforme o estudo de caso de [Simonova e Komarkova, 2004], o uso de DW em uma região de República Checa, tornou a administração pública e o planejamento urbano mais completo e acurado, a partir da integração de dados provenientes de diversos setores administrativos em um repositório unificado. Em geral, os municípios da República Checa possuem sistemas desconectados, que tonam o processo de tomada de decisão lento e muito complexo. A Figura 10 descreve a arquitetura de um DW regional. Fluxos ETL (Extract, Transform and Load) utilizam como fontes de dados sistemas legados, para criar Data Marts que são acessados por meio de uma rede de computadores. Algumas limitações deste trabalho são a inexistência suporte para dados espaço-temporais e a escassez de ferramentas e métodos para consolidar um DW. Figura 10. Arquitetura regional do DW. Fonte: [Simonova e Komarkova, 2004]. Apesar dos esforços nacionais e internacionais, a dificuldade técnica envolvida para implantar o CTM tem impedido que se tornem uma realidade na maioria dos municípios brasileiros. A situação se agrava devido à inexistência de uma metodologia padronizada que garanta retorno do capital investido. Além disso, muitos trabalhos em âmbito mundial relatam a importância do CTM entendido como 29 uma ferramenta de tomada de decisão, capaz de analisar e integrar diversas fontes de dados alfanuméricos, espaciais e temporais. Porém, em geral esses trabalhos limitam-se a propor um modelo de dados relacional para sistemas puramente transacionais. A Figura 11 descreve um comparativo entre os trabalhos correlatos relacionados no decorrer desta seção. Figura 11. Comparativo entre trabalhos correlatos. 30 3. Uma abordagem para o desenvolvimento e a manutenção de SITs Esta seção detalha uma abordagem para o desenvolvimento de um SIT estruturado como um sistema de inteligência de negócios (BI – Business Intelligence). Ela apresenta os princípios básicos desta abordagem e descreve a metodologia de desenvolvimento, a arquitetura de software do SIT, o modelo de dados multidimensional e o processo para construção, atualização e evolução contínua do CTM, implantado na Prefeitura do município Ouro Preto. 3.1. Princípios básicos desta abordagem A despeito de todos os domínios de problemas administrados por meio de um SIT, entre eles, os relacionados às questões econômicas, jurídicas e sociais, um SIT deve principalmente ser capaz de lidar com a dinâmica de uma cidade. Deve estar preparado para mudanças e evoluir com elas. Além de ser capaz de atualizar frequentemente um volume massivo de dados espaciais e temporais. Por isso, flexibilidade para absorver mudanças com pouco esforço e retrabalho mínimo é uma característica indispensável. Desta forma, projetar um CTM que seja extensível é mais importante que projetar um que seja preciso em abranger cada domínio de problema. Ferramentas que coletam, transformam e analisam os dados de um CTM não devem depender de seu modelo de dados. Para que resultem em decisões mais acuradas, estas ferramentas devem permitir análises completas e atualizadas sobre dados sumarizados em hierarquias espaciais, como país, cidade e imóvel, e hierarquias temporais, como ano, mês e dia. O desenvolvimento um de SIT é dispendioso. Entretanto, a sustentabilidade do sistema deve ser garantida. O desenvolvimento envolve a contratação e treinamento de uma equipe multidisciplinar e especializada, a realização contínua de coleta de dados em campo e a aquisição de dados espaciais onerosos como imagens de satélite de alta resolução, levantamentos topográficos, mapas de arruamento e de imóveis. A necessidade, quantidade e o nível de detalhe dos dados devem ser ponderados frente aos benefícios que resultarão de seu custo. É preciso desenvolver um SIT cujo custo de desenvolvimento seja pago nos primeiros anos após sua implantação através da ampliação do cadastro de imóveis registrados e da 31 cobrança mais eficaz de taxas e impostos imobiliários. Nos anos posteriores, os ganhos serão menores, mas deverão financiar a manutenção e evolução do sistema. No Brasil, para estarem em conformidade com as diretrizes nacionais para Governo Eletrônico, projetos de desenvolvimento de Sistemas de Informação públicos devem priorizar soluções, programas e serviços baseados em software livre, adotar padrões abertos no desenvolvimento de tecnologia de informação, garantir a auditabilidade plena e a segurança dos sistemas, restringir o crescimento do legado baseado em tecnologia proprietária, além de promover a capacitação de servidores públicos para utilização de software livre. Por estas razões, esta abordagem prioriza o uso de tecnologias livres e de código aberto cujo estágio de maturidade garantam a produtividade do projeto e sua continuidade à longo prazo [Governo Eletrônico, 2012]. No ano de 2009, o Ministério das Cidades publicou a portaria 511 contendo as diretrizes nacionais para criar, instituir e atualizar um CTM. Essas diretrizes serão adotadas neste trabalho. Elas definem os procedimentos que deverão ser seguidos pelos municípios brasileiros para evoluir o cadastro imobiliário em um CTM. Esta portaria relaciona questões referentes às informações espaciais que deverão estar contidas no cadastro, por exemplo, a maneira que devem ser modeladas e as projeções cartográficas que deverão ser utilizadas. A portaria também evidencia a necessidade de uma equipe de funcionários dedicada à manutenção do cadastro e a possibilidade do incremento de receita gerado pelo CTM financiar a reforma cadastral. Além disso, ela estabelece o período entre as avaliações imobiliárias, diversas práticas que visam o aperfeiçoamento da distribuição de recursos territoriais e o aprimoramento da avaliação de imóveis e da coleta de tributos [Ministério das Cidades, 2009]. 3.2. Metodologia de Desenvolvimento Evolutiva A metodologia de desenvolvimento adotada foi o Rational Unified Process (RUP)2, pelo fato de ser um processo iterativo e incremental, amplamente utilizado na 2 http://www-01.ibm.com/software/awdtools/rup/ 32 indústria de software, para aumentar a produtividade no processo de desenvolvimento As atividades de concepção, projeto, construção e avaliação foram realizadas para produzir versões melhoradas do SIT e do CTM. Além de assegurar a qualidade destes componentes, as avaliações buscaram maturar a abordagem proposta a cada iteração, tornando-a mais confiável e eficiente à medida que fosse evoluída. Foram necessários seis ciclos de desenvolvimento ao longo de 24 meses de projeto. Os três primeiros tiveram a duração de seis meses, devido ao volume de ferramentas de coleta, atualização e análise a serem produzidas. Nestes ciclos, somente amostra de dados foram coletadas em campo. Depois, três ciclos de dois meses tiveram como foco a construção do CTM, quando as atividades de campo e saneamento do cadastro imobiliário foram intensificadas. Essas atividades foram acompanhadas com periodicidade quinzenal, o que permitiu acompanhar e validar a evolução contínua do projeto conforme as métricas acordadas com a Prefeitura Municipal de Ouro Preto. A equipe utilizada durante estes ciclos foi composta por um estudante de mestrado e três de graduação. 3.3. Arquitetura de Sistema de Informação Territorial A Figura 12 ilustra a arquitetura de um SIT estruturado como um sistema de BI. O modelo lógico de dados do CTM é organizado como um STDW no qual ferramentas de atualização, implementadas como fluxos ETL, extraem dados de diversas fontes, tais como planilhas eletrônicas, arquivos texto, arquivos shape e bancos de dados relacionais transformando-os em informações de entradas para o CTM. Esses fluxos são executados periodicamente ou sob demanda. Ferramentas de coleta de dados são desenvolvidas como aplicações para dispositivos móveis que apóiam as pesquisas de campo. Fluxos ETL são scripts que extraem dados de fontes de dados heterogêneas, realizam transformações sobre esses dados e os inserem no CTM. Durante a etapa de transformação, os dados incorretos ou fora de padrão são saneados e em seguida realimentam os sistemas legados. A análise de dados espaço-temporais são baseadas em ferramentas que combinam técnicas de mineração de dados, OLAP e GIS. 33 Figura 12. Arquitetura de software de um SIT estruturado como um BI. 3.4. Modelo de dados O modelo do banco de dados relacional adotado no cadastro imobiliário serve de base para construir um modelo multidimensional. Essa evolução foi necessária porque o modelo multidimensional é mais eficiente para ambientes analíticos. Nesses ambientes, características não triviais, como trabalhar com um grande volume de dados obtidos de fontes de dados dispersas e recuperar informações por meio de agrupamentos, são cruciais para fornecer suporte à tomada de decisão, a partir de análises completas sobre bases de dados históricos. A Figura 13 demonstra o modelo do banco de dados relacional similar aos utilizados pelos cadastros imobiliários vigentes nas prefeituras. A tabela parcela caracteriza as unidades territoriais. Ela descreve informações sobre o endereço completo, declividade de terreno, pavimento da via, conservação do imóvel, valor predial, etc. Contribuinte é a tabela que possui informações sobre o proprietário do imóvel. Características concernentes à avaliação das unidades habitacionais estão na tabela Calculo_iptu. Taxas_iptu contém informações sobre as taxas que incidem sobre a cobrança do IPTU. Dívidas de imóveis referentes ao IPTU são armazenadas na tabela Dividas_iptu. A maneira de pagamento do IPTU assim como respectiva data de vencimento são inclusas na tabela Vencimento_iptu. Por fim, os serviços 34 disponíveis para cada unidade habitacional são catalogados na tabela Parcela_serviços. Figura 13.. Modelo de banco de dados relacional de um cadastro imobiliário. A Figura 14 apresenta o modelo conceitual do CTM. O uso do paradigma orientado por objetos, cujas abstrações são próximas aos domínios de aplicação, permite que decisões relativas ao projeto deste modelo sejam tomadas colaborativamente, pela equipe responsável pelo SIT SIT e por especialistas em cada domínio da administração municipal. Além disso, o mecanismo de herança permite sua fácil especialização para representar conceitos eitos de cada domínio [Lorenz e Kidd,1994]. Kidd,1994]. Figura 14. Modelo conceitual conceitual orientado por objetos do CTM. A estrutura do modelo conceitual determina que uma pessoa física ou jurídica possa envolver em diferentes relações temporais.. Cada relação recebe um rótulo que identifica seu período de validade. validade. Elas podem possuir um ou mais objetos de relação.. Objetos de relação podem ser recursos (hospital, escola, delegacia de 35 polícia, etc.) ou serviços (água, luz, esgoto, telefone, coleta de lixo, etc.). Eles podem estar associados a um único endereço de logradouro e podem ter uma ou mais geometrias associadas para determinar sua localização e forma. Sobre as relações econômicas, incidem impostos e taxas sobre qualquer movimentação relacionada a um imóvel, seja uma venda de um lote ou transferência de titularidade. Desta maneira, objetos utilizados na administração do território como parcelas e unidades habitacionais, podem ser modeladas como tipos de recursos. A cada recurso é atribuído o uso, por exemplo, residência, comércio, delegacia, etc.. Cada tipo de relação pode posteriormente ser implementado como um data mart. O Modelo multidimensional voltado para impostos e taxas que incidem nas relações econômicas é projetado para obter alto desempenho na realização de consultas em que medidas resumem dados agregados por dimensões hierarquicamente organizadas e relacionadas com os fatos. Na dimensão tempo, os fatos podem resumir dados referente ao IPTU pago em um período qualquer. No espaço, eles podem resumir dados por meio de operações espaciais, interseção, união e buffer. O fundamental no projeto deste modelo é garantir que mudanças possam ser realizadas nas dimensões de análise ou nas hierarquias em que elas são organizadas, sem que isso traga grandes impactos para os dados armazenados ou para as ferramentas de análise. Por estas razões, o modelo lógico da Figura 15 é concebido como um STDW extensível estruturado sobre o esquema flocos de neve, capaz de armazenar informações históricas sobre as relações econômicas que incidem nas parcelas, sejam elas informações alfanuméricas (alteração de titularidade, valor pago de IPTU, dívida, etc.) ou espaciais (desmembramento ou agregação de parcelas). Este esquema é bastante simétrico e de fácil compreensão, devido à baixa quantidade de tabelas e relacionamentos. Neste exemplo, relações econômicas são modeladas por uma tabela de fatos a partir da qual relações podem ser analisadas por medidas (count, sum, average, max) sobre os atributos ValorCobrado, ValorPago e Juros. Os atributos DataTermino, DataPagamento, EnderecoProprietario e EnderecoRecurso são úteis para a navegação sobre medidas hierarquizadas nas dimensões tempo e espaço. 36 entidade relacionamento do CTM organizado como um STDW. Figura 15.. Modelos entidade-relacionamento O modelo de dados ilustrado na Figura 15 facilita a construção de consultas e melhora o tempo de resposta, por causa do menor número de relações. Além disso, para inserir uma nova dimensão, dimensão basta relacioná-la com a tabela de fatos. Embora E seja um modelo simplificado, ele permite representar uma infinidade infinidad de relações sociais que envolva uma relação comercial, seja ela a compra de automóvel, a transferência de titularidade de um imóvel, imóvel etc. Os modeloss apresentados nos anexos C, D e E utilizam o paradigma de sistema transacional. Por isso, possuem mais tabelas, é difícil de ser estendido, estendido apresenta maior custo de manutenção e a desempenho de consulta é comprometida em detrimento do elevado número de relações. 3.5. Processo de desenvolvimento do CTM espaço temporal A cada ciclo de desenvolvimento o processo descrito na Figura 16 pode ser total ou parcialmente executado para a construção e atualização do CTM espaço temporal. As etapas para o tratamento da imagem de sensor remoto são coleta de pontos de controle, registro istro da imagem, elaboração do modelo triangular de terreno, criação do modelo digital de elevação, ortorretificação e correção radiométrica. As cinco primeiras conferem acuidade aos cálculos de distância e área realizados sobre as imagens. O restante do processo p refere-se se à incorporação de informações dos sistemas legados ao CTM. 37 Registro imagem (OMT do CTM espaço temporal Figura 16. Modelo de dados geográficos (OMT-G) Pontos de controle coletados por equipamentos GPS (Global ( Position System) System de alta precisão foram utilizados para registrar imagens de sensores remotos de alta resolução em um determinado sistema de referência geográfica. Esse registro consiste numa transformação geométrica capaz de converter coordenadas de uma imagem magem em coordenadas geográficas, representadas por latitude e longitude de um mapa. Isso permite corrigir distorções causadas durante a obtenção da imagem pelo sensor remoto [Brown, 1992]. A Figura 17 ilustra o registro de imagem. Figura 17. 17 Registro de imagem de sensor remoto . 38 Curvas de nível e linhas de drenagem foram utilizadas para gerar o modelo triangular do relevo (TIN – Triangular Irregular Network). Ele é formado a partir de um conjunto de triângulos adjacentes, que nunca se sobrepõe e são calculados por meio de pontos com coordenadas tridimensionais irregularmente distribuídos em uma superfície [Peucker et al., 1978]. Já o modelo digital de elevação (DEM - Digital Elevation Model), foi obtido após discretizar o modelo TIN em uma grade de células regulares. O DEM pode ser definido com a representação digital de uma área da superfície, numa matriz de pixels com coordenadas planimétricas (x,y) para cada pixel e um valor de intensidade, referente à sua elevação. [O'Callaghan e Mark, 1984]. A Figura 18 apresenta o processo que transforma curvas de nível no TIN e em seguida no DEM. Figura 18. Modelo digital de elevação. A Ortorretificação de imagem é o processo que elimina distorções introduzidas durante a sua obtenção. Essas distorções são ocasionadas pela variação da altitude e inclinação do sensor e também pela elevação do terreno. Por isso, é indispensável o MDE para realizar a ortorretificação e criar uma ortoimagem. A correção radiométrica tem o objetivo de eliminar interferências nas imagens ocasionadas pela calibração do sensor, iluminação e atmosfera [Schowengerdt, 1997]. O efeito dessa correção radiométrica é apresentado na Figura 19b. As imagens resultantes do processo radiométrico foram unidas para formar um único mosaico que recobre todo o município. Este mosaico é utilizado como pano de fundo sobre o qual foram criados layers constituídos por feições de diversos objetos geográficos desenhados manualmente, tais como, eixos de rua, quadras e unidades habitacionais, etc. As dimensões desses objetos buscaram respeitar medidas nas plantas registradas nos cartórios de registro, quando disponíveis. 39 antes da correção e b) após a Figura 19. Imagem de Weiheim, Alemanha: a) antes correção radiométrica. Fonte: [Rosa e Fernandes, 2011] O processo para extrair feições feiçõ espaciais do mosaico, embora seja simples e de custo relativamente baixo se comparado às medidas realizadas nos trabalhos de campo, não pode ser utilizado como única fonte de informação, devido à imprecisão inserida durante o desenho e até mesmo do registro da imagem. Um dos empecilhos mais comum na utilização de SIG é com relação à indisponibilidade de bases de dados consistentes consistentes e atualizadas. Essa realidade é agravada quando é necessário maior nível de detalhes, como é o caso de mapeamento urbano ou imobiliário. Embora muitas empresas estejam atuando massivamente nesses mapeamentos, o custo é muito elevado. Há alguns anos o Google Earth disponibiliza uma maneira fácil para obter coordenadas geográficas de objetos, mas a precisão dessas informações não é útil para todos os domínios de aplicação. Um experimento realizado na cidade de Itajubá em Minas Gerais comparou pontos coletados etados pelo Google Earth e por um aparelho de alta precisão, denominado Sistema Diferencial de Posicionamento Global (DGPS). A diferença encontrada foi de 21 metros, o que inviabiliza o uso do Google Earth como única fonte de informação, para delimitação de d parcelas. A Figura 20 ilustra a distorção do Google Earth e dispositivos GPS perante o DGPS [Lima et. al, 2009]. 2009] 40 Figura 20. Comparativo entre Google Earth, GPS e DGPS. Fonte: [ Lima et. al, 2009] 3.6 Cadastro e integração de informações O cadastro de informações em campo foi realizado por meio de tablets, com um aplicativo para coletar informações descritivas e geoespaciais. As descritivas são o nome da via, número, complemento e bairro. Os dados geoespaciais referem-se às coordenadas latitude/longitude e representação geométrica de cada imóvel. Ambas coletadas a partir do aplicativo Google Maps3. Devido à impresisão do Google Maps descrita na seção 3.5, será necessário um ajuste ponto a ponto sobre as coordenadas de cada objeto. A seção 3.8 detalha como será realizado este ajuste. O uso do tablet aumentou a produtividade da coleta de informações em campo e também a exportação dessas informações para o banco de dados do CTM, por meio de fluxos ETL, que foram customizados na ferramenta GeoKettle. Pela inexistência de uma chave primária, capaz de conectar os dados dos sistemas legados às informações coletadas em campo, a integração utilizou um identificador composto pelos atributos nome da via, número, complemento e bairro. No entanto, essa solução não integra tuplas que embora sejam sobre o mesmo objeto, estejam com as descrições incompatíveis, ocasionadas por erros de cadastro, conforme ilustra a imagem 22. 3 http://maps.google.com 41 Figura 21. Erros cadastrais Os fluxos ETL foram a etapa mais árdua do processo para acoplar os dados do CTM ao cadastro imobiliário da prefeitura. O motivo foi a falta de padrão e erros decorrentes do processo de digitação dos usuários que mantém o cadastro imobiliário. Portanto, foi inserido nos fluxos ETL um catálogo de anomalias e respectivas correções para cada erro identificado. Esse catálogo foi atualizado à medida que novos erros foram detectados. A Figura 22 ilustra uma pequena parte deste catálogo. Figura 22. Catálogo de erros do ETL O trabalho de campo utilizou o aplicativo Google Maps para identificar a localização das parcelas. Isso acarretou um desajuste significativo quando essas informações foram sobrepostas na imagem Quickbird comprada pela prefeitura. Essa imagem está muito bem registrada para Ouro Preto e foi utilizada como plano de fundo para o ajuste ponto a ponto. A Figura 23 ilustra uma pequena parte do layer de unidades habitacionais. Esse layer é constituído por pontos, pelo fato de serem facilmente desenhados, manipulados e consumir menos recursos de armazenamento. Cada ponto sobre uma parcela representa uma unidade habitacional, ou seja, um prédio com 20 apartamentos é representado por 20 pontos. Por meio de fluxos ETL essas unidades habitacionais foram integradas ao cadastro imobiliário. 42 Figura 23. Layer de unidades habitacionais. 3.7. Processos e Ferramentas para o Desenvolvimento e Manutenção do CTM Os Fluxos ETL viabilizaram o uso das feições para análises estatísticas (total de IPTU, somatória das áreas dos imóveis, somas de testadas, etc.) e até mesmo espaciais (imóveis localizados em uma quadra, bairro ou ao longo de uma via), isso foi possível porque as feições inseridas manualmente no trabalho de campo foram integradas às informações descritivas do cadastro imobiliário. A localização de uma unidade habitacional é, em geral, determinada por uma coordenada geográfica (latitude, longitude) e um endereço (nome da via, número, complemento e bairro). As unidades habitacionais que não estavam cadastradas da prefeitura fomentavam trabalho de campo para os fiscais e cadastradores. Finalmente, os fluxos ETL são utilizados para incorporar dados de sistemas de informação legados de diversas áreas, tais como educação, saúde, transporte, meio ambiente, etc. Desta forma, à medida que os fluxos ETL falham em associar dados de sistema legados a recursos cadastrados no CTM usando sua localização como chave única de associação, o problema é corrigido com eventuais idas ao campo. Após conhecer a localização dos recursos, as bases de dados envolvidas são saneadas e integradas de maneira incremental. A Figura 24 ilustra um dos fluxos ELT. UnidadeHabitacional é a tabela 43 de origem dos dados armazenados armazenad no cadastro imobiliário da prefeitura, UnidadesNaoNulas é um script para remover valores nulos, Transformer_UH contém o catálogo de informações incorretas e respectivas correções, correções JS_Clear_Addess remove espaços em branco e caracteres inválidos dos registros, registros, HierarquiaEspacial armazena as informações nas respectivas dimensões espaciais e UnHabitacional persiste as informações na tabela do layer que armazena as unidades habitacionais. Figura 24. Estrutura de um script no GeoKettle le 3.8.. Ferramentas para coleta, atualização e controle de qualidade de dados Os fluxos ETL responsáveis pela aquisição e atualização dos dados foram implementados através da ferramenta livre GeoKettle.. Eles são editados graficamente na forma de diagramas de fluxo de dados. Este fato facilita seu desenvolvimento e manutenção por pessoas com pouca experiência em programação. Um plugin nomeado OpenKettle, foi desenvolvido para iniciar o GeoKettle a partir do ambiente TerraView. Além do OpenKettle foram criados outros plugins, KMLMaker, QualityControl, AddressLocator, AddressMerge e ReportMaker. O KMLMaker foi desenvolvido na plataforma android e armazena as informações em arquivos no formato KML. KML Esse plugin gin é instalado nos tablets, que são utilizados nos trabalhos de campo. O usuário informa o endereço de cada unidade habitacional e em seguida coleta sua localização espacial, por meio de um ponto. A coordenada desse ponto é obtida pelo aplicativo apl Google Maps. A Figura 25 ilustra alguns pontos coletados pelo KMLMaker. KMLMaker 44 Figura 25. Informações coletadas em campo A diferença entre a precisão da imagem do Google Maps utilizada nos trabalhos de campo e a imagem Quickbird armazenada no banco de dados do SIT, requer um ajuste ponto a ponto de cada registro georreferenciado coletado pelo KMLMaker. Esse problema pode ser corrigido com uma infraestrutura mais sofisticada de hardware e consequentemente mais cara, capaz de acessar a imagem do SIT durante os trabalhos de campo via internet. A Figura 26 ilustra à esquerda os pontos coletados em campo sobre a imagem do aplicativo Google Maps; ao centro destacase a distorção entre as coordenadas de coleta sobrepostas sobre a imagem do SIT; à direita apresenta as coordenadas ajustadas. Figura 26. Distorção entre imagens. 45 O plugin QualityControl foi criado para analisar os dados após o povoamento do DW, ou seja, ao término de cada execução dos fluxos ETL. Ele foi desenvolvido em C++, sobre a biblioteca TerraLib. Seu funcionamento consiste em 3 passos: passos ler arquivo texto, agrupar registros por legenda e apresentar um mapa temático. O arquivo de entrada deverá conter as colunas nome de via, endereço, complemento com e bairro, para localizar cada unidade habitacional. A legenda é construída por 4 grupos, associado (objetos que existem no arquivo de entrada e no DW); sugerido (somente objetos existentes no arquivo de entrada); só destino (objetos que existem somente so no DW, provenientes dos levantamentos de campo) campo e duplicado (objetos com endereço duplicado). O mapa temático apresenta o layer com as unidades habitacionais coloridas conforme o agrupamento da legenda. Quando o plugin não localizar o endereço completo completo de um registro do arquivo texto, mas encontrar o nome da via e bairro, o objeto será inserido em um local sugerido nos limites da via. Além disso, todos os registros que não forem localizados serão persistidos em um arquivo de log. A Figura 27 ilustra o resultado do plugin Quality Control. 27. Mapa resultante do plugin QualityControl Figura 27. O plugin AddressLocator, AddressLocator exibido na Figura 28,, realiza o cadastro espacial e alfanumérico das unidades habitacionais coletadas durante os trabalhos de campo. Essa é uma alternativa para os municípios que não possuem recursos para comprar dispositivos móveis, tais como, tablets. O usuário realiza o trabalho trabalho de campo com a imagem impressa, marcando sobre ela a localização de cada imóvel. Em seguida ele cria uma planilha eletrônica com esses dados (nome da via, número, 46 complemento e bairro) e a transforma em um arquivo CSV. Esse arquivo servirá de entrada para o AddressLocator, que exibirá tais informações organizadas em linhas e colunas. O usuário insere as feições espaciais no mapa e em seguida seleciona a linha correspondente do arquivo de entrada, a fim de integrar as informações. Para que o plugin AddressLocator possa ser utilizado por múltiplos usuários, foi criado o plugin MergeAddress, que permite integrar dois ou mais layers. Ao unir os layers é criado um versionamento que identifica os objetos que foram persistidos no layer de destino. Figura 28. Plugin AddressLocator O plugin DW-ReportMaker permite confeccionar relatórios temáticos sobre as dimensões já existentes no modelo ou customizadas a partir da interface do próprio plugin. Uma dimensão customizada pode ser alfanumérica (formada por dimensões alfanuméricas); espacial (constituída dimensões espaciais) ou híbrida (quando é constituída pela combinação de dimensões alfanuméricas e espaciais). Após definir a origem dos dados de uma dimensão, o usuário escolhe um conjunto de atributos, criando assim sua hierarquia. Sobre a hierarquia é possível customizar filtros alfanuméricos, espaciais e também, cadastrar os fatos por diversos níveis de granularidade, por exemplo, total pago de IPTU por uma quadra, bairro ou cidade. O DW-ReportMaker armazena um script dos passos utilizados na confecção de cada relatório, o que simplifica a visualização das informações após atualizações no banco de dados. A interface desse plugin é apresentada na Figura 29. 47 Figura 29. Plugin ReportMaker espaço 3.9 Armazenamento de informações espaço-temporal O data mart armazena informações espaciais e temporais em relações/aspectos distintos do município.. Informações espaciais são tratadas pela extensão espacial do SGBD PostgreSQL, denominada PostGIS, capaz de suportar índices e consultas espaciais. A informação temporal é armazenada por meio do atributo data_evento, localizado na tabela RelacaoEconomica_fatos. RelacaoEconomica_ Devido à complexidade envolvida para armazenar e recuperar a evolução das informações espaciais e temporais das parcelas,, em geral, o histórico não é mantido no cadastro imobiliário, embora seja muito importante. Somente em casos específicos e bem justificados justificados existe uma série histórica detalhada. A Figura 30 ilustra como são armazenadas informações de uma parcela, que é modelada como um recurso. A data do evento é inserida no atributo data_evento,, sua descrição na dimensão recurso e a localização espacial nas dimensões layer e geometria. Sempre que ocorrer uma alteração qualquer em um determinado objeto, ocorrerá uma nova entrada nas dimensões a ele relacionadas e na tabela de fatos, que definirão o estado real do objeto. Com isso, por meio da tabela RelacaoEconomica_fatos, RelacaoEconomica_fatos, é possível recuperar a evolução de um objeto durante toda sua existência. 48 Data ID Logradouro Número Bairro Testada ValorVenal geometry 12/01/02 1002 TRES 600 LAGOA 11 80.000,00 238989.43 567397.45 Figura 30. Armazenamento de dados no DW 3.10 Consultas Agregadas A Figura 31 ilustra o processo para acesso aos dados. A partir do DW povoado com informações de diversas fontes de dados, os usuários poderão customizar instruções de consulta, para criar mapas temáticos a partir de vários módulos. Módulo de Instrução OLAP permite sumarizar por diversos níveis de granularidade as hierarquias de dimensões. O cadastro de metadados mantém o dicionário de dados de todo o modelo multidimensional. Ao adicionar uma dimensão no modelo os metadados são atualizados. Visualizadores de hierarquias e dimensões exibem respectivamente as hierarquias e dimensões cadastradas no registro de metadados. Customizar dimensões permite unir duas ou mais dimensões, para formar uma nova dimensão alfanumérica, espacial ou híbrida (combinação de alfanumérica e espacial). Construtor de consultas permite ao usuário adicionar hierarquias alfanuméricas ou espaciais, para realizar sumarizações por diversos níveis de granularidade. Finalmente, é criado um mapa temático com múltiplos layers fatiados no tempo (mês, ano, intervalo de datas, etc). 49 Figura 31. Fluxo de acesso aos dados O mapa temático possibilita ao tomador de decisão uma visão inédita das informações do cadastro imobiliário integrado a diversas características do espaço geográfico dispostos em camadas, com diferentes séries históricas. Com isso, é possível tornar mais eficiente ficiente o planejamento e as políticas sociais, que garantem a distribuição justa de recursos sobre qualquer porção do território. A Figura 32 ilustra a evolução entre os anos de 2009 a 2011 do bairro Da Lagoa,, localizado em Ouro Preto. Em 2009 havia aproximadamente 50 imóveis e no final de 2011 foram cadastrados mais de 150 imóveis construídos ou em fase terminal de construção. Figura 32.. Evolução de d 300% no cadastro imobiliário no bairro Lagoa entre os anos 2009 a 2011. 50 4. Um estudo de caso – o município de Ouro Preto, MG Nesta seção, a abordagem proposta é avaliada em um estudo de caso real. Para isso, o SIT do município de Ouro Preto foi desenvolvido como um sistema de BI e o CTM estruturado na forma de DW. Isso permitiu utilizar métodos de análise baseados em inteligência de negócios que são capazes de aperfeiçoar a tomada de deicisão, tornando-a mais completa. Conforme o [IBGE, 2010], 2010] Ouro Preto é um município famoso pela arquitetura colonial que pertence ao estado Minas Minas Gerais. Além da sede é formado por 13 distritos, possui uma área total de 1.245,114 Km2 e a população está estimada em 70.227 habitantes. Foi a primeira cidade brasileira ser reconhecida como patrimônio histórico e cultural da humanidade, no ano de 1980, 1980, pela Organização das Nações Unidas (ONU). 4.1. Área de estudo Figura 33.. Área de estudo no município de Ouro Preto, Minas Gerais, Brasil. A Figura 33 delimita a região de estudos utilizada neste trabalho. Essa região foi escolhida porque vive um intenso e mais recente processo de ocupação. O dinamismo urbano, impulsionado principalmente pela especulação imobiliária, imobiliária é um dos grandes desafios para a gestão gestão urbana e distribuição de recursos. 51 O STDW foi criado a partir de data marts departamentais, ou seja, utilizando a técnica bottom-up. O primeiro departamento a ser contemplado foi a Secretaria de Fazenda, responsável pela arrecadação de vários tributos, dentre eles o imobiliário. Sua escolha se justifica pela recomendação do Ministério das Cidades, na portaria 511, que aconselha utilizar parte do acréscimo de receita proveniente do aumento da arrecadação na evolução do CTM. A estratégia de criar vários data marts permite menor custo inicial e retorno rápido. O data mart da Secretaria da Fazenda de Ouro Preto foi criado a partir da integração do cadastro imobiliário vigente ao cadastro espacial, proveniente do trabalho de campo. As variações no tempo ocorridas nas unidades habitacionais durante sua existência também foram representadas no data mart. Elas podem ser alfanuméricas ou espaciais. No primeiro caso, quando ocorrem alterações nas informações descritivas das parcelas, por exemplo: titularidade, valor pago e dívidas. O segundo caso geralmente envolve alterações físicas. As mais comuns são a agregação ou desmembramento de parcelas. Essas informações acerca do histórico das parcelas foram obtidas por meio de backups do cadastro imobiliário ocorridos entre os anos de 2009 e 2011 e povoadas no DW através de fluxos ETL. 4.2. O sistema de informação territorial SIGHabitar O Ministério das Cidades recomenda o uso de ferramentas livres para o desenvolvimento de CTMs e fornece o aplicativo TerraSIG. Tanto o TerraSIG quanto o TerraView são SIGs desenvolvidos pelo uso da biblioteca C++ TerraLib, mantida pelo Instituto Nacional de Pesquisas Espaciais (INPE). Esta biblioteca permite o desenvolvimento de bancos de dados geográficos sobre diferentes SGBDs. Porém, o projeto TerraSIG não tem sido constantemente atualizado. Por outro lado, a importância do SIG TerraView em projetos de interesse nacional, como o monitoramento e modelagem do desflorestamento na Amazônia [DETER 4 e 5 TerraME ], é garantia de sua continuidade e evolução. Por isso, o TerraView é adotado como plataforma para a implementação do CTM e para o desenvolvimento 4 5 http://www.obt.inpe.br/deter http://www.terrame.org 52 de plugins que permitam a coleta, atualização, controle de qualidade e a análise dos dados. 4.3. O cadastro técnico multifinalitário de Ouro Preto O modelo lógico da Figura 3 foi implementado na forma de um banco de dados TerraLib sobre o SGBD PostgreSQL com extensão PostGIS. Imagens pancromáticas do satélite Quickbird cuja resolução é de 60 cm foram registradas usando 77 pontos de controle coletados no município. O relevo foi modelado a partir de curvas de nível equidistantes 5 metros, na sede do município, e 20 metros, nas demais regiões. As geometrias do arruamento, das quadras e dos lotes foram desenhadas sobre a imagem. Para isso, foram utilizadas plantas de quadras fornecidas em papel pela prefeitura e a realização de trabalhos de campo para levantamento da toponímia, da localização e da geometria de logradouros e imóveis. 4.4. Experimentos para avaliação da abordagem proposta Para que a abordagem proposta fosse avaliada, foram conduzidos três ciclos de desenvolvimento do CTM conforme o processo apresentado na Figura 4. Medidas de qualidade dos dados e de produtividade das equipes foram coletadas a cada ciclo. A equipe envolvida era composta de um programador, um desenvolvedor, um técnico de geoprocessamento e um técnico em edificações. O programador ficou responsável pela construção dos fluxos ETL na ferramenta GeoKettle, customização de relatórios para fomentar o saneamento do banco de dados da prefeitura que alimenta o DW e customização de relatórios. O desenvolvedor realizou a construção dos plugins. Tratamento de informações espaciais, acompanhamento da qualidade das informações e evolução integrada do CTM foram realizados pelo técnico em geoprocessamento. A coleta de informações em campo foi realizada pelo técnico em edificações. Todos os colaboradores ficaram dedicados vinte horas semanais. O maior esforço no decorrer desses ciclos foi para manter os fluxos ETL. No cadastro imobiliário da prefeitura havia centenas de erros provenientes dos usuários do sistema. Os mais comuns referem-se ao nome da via, bairro e principalmente na informação complementar dos imóveis. Foram detectados 8 variações para o nome 53 da via JUSCELINO KUBITSCHEK, 5 para a informação complementar AP 101 e 6 para identificar o bairro NOSSA SENHORA DO CARMO. Além desses, várias vias e bairros são armazenadas por apelidos, por exemplo, a via CONDE DE BOBADELA tem apelido RUA DIREITA e o bairro VILA ITACOLOMI tem o apelido BAUXITA. A Figura 34 ilustra alguns desses erros de cadastro. As informações saneadas pelos fluxos ETL, realimentam os sistemas legados. Figura 34. Cadastros incorretos Durantes os seis meses de experimentos, a equipe conseguiu construir o CTM a partir dos dados espaciais listados na seção 5.3.1. Além disso, conseguiu manter o CTM e fluxos ETL atualizados, absorvendo com rapidez diversas mudanças sofridas pelas fontes de dados, pelo modelo de dados do CTM e pelas demandas dos técnicos administrativos do município. Entre os 3.037 imóveis na área de estudo previamente registrados no cadastro imobiliário do município, 92% foram corretamente georreferenciados e associados a informações oriundas de sistemas legados. Diferentes causas justificam a falha na incorporação de 8% dos imóveis. As três principais são: (i) os cidadãos mudam a numeração dos endereços por vontade própria; (ii) os imóveis foram demolidos ou agregados; e (iii) os imóveis estão fechados, não há numeração afixada e as informações fornecidas por vizinhos não foram suficientes para determinar o endereço. No entanto, 1.195 novos imóveis foram identificados em campo, incorporados ao CTM e, posteriormente associados a informações de sistemas legados. A Figura 36 mostra a análise da evolução espaço temporal do valor do Imposto Predial e Territorial Urbano (IPTU) nos anos de 2009, 2010 e 2011. 54 Figura 35.. Evolução da distribuição espacial do valor do IPTU nos anos de 2009, 2010 e 2011. A Figura 35 ilustra em 2009 uma cor mais intensa na região próximo à Universidade Federal de Ouro Preto (UFOP). Nessa área concentram-se concentram os imóveis de maior valor e, portanto, é a região em que o cadastro é mais preciso e atualizado. atualizado Sendo estes fatores responsáveis por iniciar o trabalho de campo sobre essa região. As demais áreas com coloração mais fraca no ano 2009 indicam menor número de imóveis associados, entre o CTM e o cadastro imobiliário e trabalho de campo em andamento. No ano de 2010 os trabalhos foram concentrados nas demais regiões e em 2011 verifica-se se toda a área mapeada. As regiões que possuem coloração mais intensa representam maior concentração de imóveis e consequentemente cadastro imobiliário mais apurado, além de melhor infraestrutura e serviços disponíveis. 55 5. Conclusões e trabalhos futuros Durante a realização deste trabalho, as seguintes lições foram aprendidas: • Lição 1 - É preciso uma equipe multidisciplinar: Dispor de uma equipe multidisciplinar é o principal fator determinante para sucesso de um SIT. Além do conhecimento de especialistas na administração do município, é preciso mão de obra capacitada nas seguintes áreas: edificações e engenharia civil, computação e geoprocessamento. Durante os trabalhos de campo, especialistas em construção civil apresentaram maior facilidade no uso de mapas, em entender o processo de urbanização a partir de imagens defasadas da realidade e em registrar a geometria de imóveis e logradouros. O desenvolvimento de um banco de dados geográfico requer especialistas em geoprocessamento. É ideal que especialistas em computação se responsabilizem pela gestão do CTM e pela customização das ferramentas de coleta, atualização e análise de dados. • Lição 2 - É preciso envolvimento direto dos administradores municipais (stakeholders): O empenho de tomadores de decisão, técnicos administrativos e especialista nos sistemas legados é vital para a avaliação de versões de repositório de dados e ferramentas produzidas. Eles devem assegurar a evolução incremental do SIT. O conhecimento sobre o território do município e sua história é essencial para o saneamento dos dados. • Lição 3 - É possível desenvolver um sistema de BI espaço temporal com ferramentas livres. Contudo, a produtividade da equipe é afetada: Existem excelentes frameworks para o desenvolvimento de sistemas de BI que fornecem ferramentas ETL, DM e OLAP para dados espaciais integradas a SIGs GeoKettle e Talend6. No entanto, a deficiência ou inexistência de serviços de suporte técnico e treinamento, a escassez de documentação exemplificada e de casos de sucesso para serem copiados limitam a desempenho da equipe de desenvolvimento. 6 Talend - Data Integration Software and Data Management Tools - http://www.talend.com/index.php 56 • Lição 4 - É preciso contrabalancear a precisão temporal e a precisão espacial do CTM: O dinamismo da ocupação do solo torna dispendiosa e extenuante a tarefa de manter atualizado um CTM baseado em polígonos que representam as parcelas e as unidades habitacionais. No entanto, representar as parcelas e os respectivos objetos que as sobrepõe, por meio de pontos simplifica o processo de atualização, permite o mapeamento eficiente de construções verticais e permite que métodos de análises espaciais sejam aplicados a dados de sistemas legados: estimadores de kernel, krigagem, formação de grupamentos espaciais, etc. Por isso, os gestores do SIT devem considerar o esforço envolvido na atualização dos dados e retorno trazido pela representação espacial escolhida. É preciso balancear precisão espacial e precisão temporal. • Lição 5 - Ferramentas móveis para coleta de dados trazem enorme ganho de produtividade. Durante os trabalhos de campo, o uso de plataformas móveis com GPS e conexão de dados em banda larga permite a navegação assistida por mapas digitais e reduz erros introduzidos por processos manuais de coleta de dados. Resultados de mesma qualidade obtidos por processos manuais requerem, em geral, mais que o dobro do esforço. • Lição 6: É viável abordar um SIT como um sistema para inteligência de negócio: O uso de tecnologias de Inteligência de Negócios atendeu às expectativas da pesquisa. Elas permitem a análise de volumes massivos de dados. Foi possível atender as diretrizes nacionais para governo eletrônico, a portaria 511 do Ministério das Cidades e as diretivas do projeto Cadastre 2014. Os tomadores de decisão reportaram enorme vantagem em conhecer os valores de indicadores sumarizados por diferentes hierarquias temporais e espaciais. A continuidade do SIT é assegurada pela maturidade das ferramentas de BI e por serviços para customização de ferramentas através de diagramas e interfaces gráficas. O uso de fluxos ETL se mostrou uma estratégia flexível e eficiente na atualização do CTM. Estima-se que devido à 57 ampliação da base imobiliária cadastrada e de uma tributação mais efetiva, cinquenta por cento do investimento neste projeto seja recuperado no primeiro ano em que ele for utilizado para cobranças de taxas e impostos. Isto demonstra a sustentabilidade da abordagem proposta. No entanto, a partir de certo momento, o esforço de campo não resultará na evolução do CTM até que ocorra a reorganização do espaço geográfico (estabelecer limites, oficializar logradouros, normatizar numeração, etc.) e o recadastramento de imóveis. É necessário recobrir todo universo do cadastro, para que as políticas sociais sejam viáveis. • Lição 7: O SIGHabitar vs outras abordagens: Os trabalhos encontrados na literatura não apresentam uma metodologia consolidada, para criar e manter um SIT. A abordagem SIGHabitar consolidou em um estudo de caso real, um conjunto de métodos, softwares livres e modelo de banco de dados multidimensional, para instituir o SIT em municípios bresileiros de pequeno e médio porte. Esse conjunto permitiu georreferenciar informações em campo, integrá-las aos sistemas legados em um DW e criar fluxos automatizados para manter o DW atualizado. Com isso, é possível explorar com maior eficiência um grande volume de dados e gerar relatórios mais completos e atualizados. A utilização de softwares livres torna a solução mais barata, o que permite ser utilizada por municípios que possuem menos poder de investimento destinado às evoluções tecnológicas. Os trabalhos futuros visarão expandir o uso da abordagem proposta e avaliá-la em domínios da administração municipal que vão além da gestão do cadastro imobiliário e da tributação. O desenvolvimento do framework para a construção e atualização de STDW na tecnologia TerraLib será conintuado. Serão realizas pesquisas por métodos e ferramentas para computação de cubos muldimensionais e para mineração de dados espaço temporais. 58 Referências Abdel-Rahman, M. S., El Bahy, M. M., Malone, J. B., Thompson, R. A. e El Bahy, N. M. (2001). “Geographic information systems as a tool for control program management for schistosomiasis in Egypt”. Acta Tropica, 79, 49-57. Ahmed, I., Azhar, S., e Lukauskis, P. (2004). “Development of a decision support system using data warehousing to assist builders/developers in site selection”. Automation in Construction , 13 (4), 525-542. Aronoff S. (1989). “Geographical information system: a management perspective”. Ottawa, Canada: WDL. Bennett, R., Rajabifard, A., Kalantari, M., Wallace, J., Williamson I. (2010). “Cadastral Futures: Building a New Vision for the Nature and Role of Cadastres”, FIG Congress 2010: Facing the Challenges – Building the Capacity, Sydney, Australia. Burrough, P. A. (1986). “Principles of GIS for land resource assessment”. Monographs on Soil and Resources Survey No. 12. Oxford Science Publications, Clarendon Press, Oxford. Bédard Y., Merrett T. e Han J. (2001). “Fundaments of spatial data warehousing for geographic knowledge discovery”. In H. Miller and J. Han, editors,Geographic Data Mining and Knowledge Discovery, pages 45--59. Taylor e Francis. Bédard, Y., Rivest, S. e Proulx, M.J. (2007). “Spatial online analytical processing (SOLAP): concepts, architectures, and solutions from a geomatics engineering perspective”. Wrembel-Koncilia (Ed.), Data Warehouses and OLAP: Concepts, Architectures and Solutions, IRM Press (2007), pp. 298–319 Brown, L.G. (1992). "A Survey of Image Registration Techniques". ACM Computing Surveys, Vol. 24, No. 4, pp. 325-376. Câmara, G. e Fonseca, F. (2008). “Information policies and open source software in developing countries". Journal of the American Society for Information Science and Technology, 58(1), 121–131. Codd , E.F. (1993). “Providing olap (on-line analytical processing) to user-analysts: An it mandate”. Technical report, E.F. Codd and Associates. Dale, P. and McLaughlin, J. (1989). “Land Information Management: An Introduction with Special Reference to Cadastral Problems in Third World Countries”, Oxford University Press, Oxford. Gómez, L. I., Kuijpers, B. e Vaisman, A. A. (2011). “A State-of-the-Art in SpatioTemporal Data Warehousing, OLAP and Mining”. Integrations of Data Warehousing, Data Mining and Database Technologies: 200-236. 59 Inmon, W. H. (1996). “Building the Data Warehouse”, 2nd end. John Wiley e Sons. Fourie, C. e Nino-Fluck, O. (2000). “Cadastre and Land Information Systems for Decision Makers in the Developing World”. Geomatica, vol.54, no.3:335-342. Fundação Getúlio Vargas (2007). “Estudo Comprova Eficiência Fiscal dos Municípios do PNAFM”. Disponível em: http://www.ucp.fazenda.gov.br/PNAFM/, Acesso: Novembro de 2011. Gonçalves, R. (2008). “Modelagem Conceitual de Bancos de Dados Geográficos para Cadastro Técnico Multifinalitário”. Tese de Mestrado. Universidade Federal de Viçosa. Governo Eletrônico (2012). “Diretrizes”. Disponível em: http://www.governoeletronico. gov.br/o-gov.br/principios/, Acesso: Julho de 2012. IBGE (2010). “População por Município, CENSO http://www.ibge.gov.br. Acesso Março, 2012. 2010”. Disponível em: Kaufmann, J. e Steudler, D. (1998). “Cadastre 2014, A vision for a future cadastral system”, FIG, July 1998. Disponível em: http://www.swisstopo.ch/Wgwg71/cad2014.htm. Kimball, R. e Ross, M. (2002). “The Data Warehouse Toolkit: The Complete Guide to Dimensional Modeling”, 2nd edition, Wiley, New York. Kimball, R. e Caserta, J. (2004). “The Data Warehouse ETL Toolkit: Practical Techniques for Extracting, Cleaning, Conforming, and Delivering Data”. John Wiley e Sons, ISBN 0764567578, 528 p. Loch, C. (2007). “A realidade do Cadastro Técnico Multifinalitário no Brasil”. Anais do XIII Simpósio Brasileiro de Sensoriamento Remoto, Florianópolis, Abril. 2007, Instituto Nacional de Pesquisas Espaciais, pp. 1281-1288. Loch, C. and Erba, D. A. (2007). “Cadastro Técnico Multifinalitário - Rutal e Urbano”. Cambridge, MA: Lincoln Institute of Land Policy, 2007. 142p. Lorenz, M. e Kidd, J. (1994). “Object-Oriented Software Metrics”. Prentice Hall, Englewood Cliffs, New Jersey. Luhn H.P. “A business intelligence system”. IBM Journal of Research and Development. 1958; 2 (4): 314-319. Malinowski, E. e Zimányi, E. (2008). “Advanced Data Warehouse Design: from Conventional to Spatial and Temporal Applications”. Springer, 1st Ed. Marchand, P. (2003). “The Spatio-Temporal Topological Operator Dimension, a Hyperstructure for Multidimensional Spatio-temporal Explorations and Analysis”. PhD thesis, Universit´e Laval Sainte-Foy. 60 Miquel, M., Brisebois, A., Bèdard, Y. e Edwards, G. (2004). “Implementation and evaluation of hypercube-based method for spatio-temporal exploration and Analysis”. ISPRS Journal of Photogrammetry & Remote Sensing , 59(1–2):6– 20. Miquel, M., Bèdard, Y., Brisebois, A., Pouliot, J., Marchand, P. e Brodeur, J. (2002). “Modeling Multidimensional Spatio-temporal Data Warehouse in a Context of Evolving Specifications”, Joint International Symposium International Society for Photogrammetry and Remote Sensing (ISPRS) Commission IV SDH 2002 95th Annual CIG Conference, pp. 1-6. Ministério das Cidades (2009). “Portaria 511: Diretrizes para a Criação, Instituição e Atualização do Cadastro Territorial Multifinalitário (CTM) nos Municípios Brasileiros”. 2009. ISSN 1676-2339. Disponível em: http://www.cidades.gov.br. Acesso Agosto, 2011. O'Callaghan, J. F. e Mark, D. M. (1984). "The Extraction of Drainage Networks From Digital Elevation Data". Computer Vision, Graphics and Image Processing, 28: 328-344. Papadias,D., Tao, Y., Kalnis, P. e . Zhang. J. (2002). “Indexing Spatio-Temporal Data Warehouses”. In Proc. of the 18th International Conference on Data Engineering, pages 166-175. IEEE. Pereira N. E. C. (2002). “Repensando o valor do cadastro técnico urbano”. In: Congresso Brasileiro de Cadastro Técnico Multifinalitário, 5, Florianópolis. Anais. 2002. Poe, V., Klauber. P., e Brobst, S. (1998). “Building a Data Warehouse for Decision Support”. New Jersey: Prentice-Hall. Rosa, R. A. S. e Fernandes, D. (2011). “Correção Radiométrica de IMAGENS DE Radar de Abertura Simétrica Aerotransportado”. Anais XV Simpósio Brasileiro de Sensoriamento Remoto - SBSR, Curitiba, PR, Brasil, INPE p.8280 Lima, R. S., Lima, J. P., Pons, D. N. A. Dias. (2009). “Precisão aceitável? A utilização do Google Earth para obtenção de mapas viários urbanos para SIG”. revista Infogeo, v. 57, p. 34-36. Rigaux, P., Scholl, M., e Voisard, A. (2001). “Spatial databases: With application to GIS”. Morgan Kaufmann. Samet, H. (1990). "Applications of spatial Data structures: Computer Graphics, Image Processing, and GIS”. Addison-Wesley, Reading, MA. Schowengerdt, R.A., (1997). “Remote Sensing: Models and Methods for Image Processing”, Second ed, Academic Press, San Diego, 522 pp. 61 Shmueli, G., Patel, N. R. e Bruce, P. (2007). “Data Mining for Business Intelligence: Concepts, Techniques and Applications in Microsoft Office Ecel with XLMiner”. Wiley-Interscience. Šimonová S., Komárková J. (2004). “Data and Data Warehousing for Management of Small Region–from the Czech republic Point of View”. WSEAS Transactions on Information Science and Applications, Issue 1, Volume 1, s. 184-188, ISSN 1790-0832. Smith, T.R., Menon, S., Star, J.L e Estes, J.E. (1987). “Requirements and principles for the implementation and construction of large-scale geographical information systems”. Int. J. Geograph. Inform. Syst., pp. 13–31 Ting, L. e Williamson, I. P. (2000). “Spatial Data Infrastructures and Good Governance: Frameworks for Land Administration Reform to Support Sustainable Development”. Proceedings of the 4th Global Spatial Data Infrastructure Conference, Cape Town, South Africa 13-15. Turban, E. e Aronson, J.E. (1998). “Decision Support Systems and Intelligent Systems”. Upper Saddle River, Prentice Hall. Peucker, T. K., Fowler, R. J. e Little, J. J. (1978). “The triangulated irregular network”. Proceedings of the ASP Digital Terrain Models (DTMJ Symposium, 09-11 May, St. Louis, Missouri, pp. 516-540. UN-FIG. (1999). “The Bathurst Declaration on Land Administration for Sustainable Development”. Report from the UN-FIG Workshop on Land Tenure and Cadastral Infrastructures for Sustainable Development, Bathurst, NSW, Australia, pp 18–22. UNECE. (1996). “Land Administration Guidelines”. Meeting of Officials on Land Administration. UN Economic Commission for Europe. ECE/HBP/96 Sales no. E.96.II.E.7, ISBN 92-1-116644–6. Van Oosterom, P.J.M., Lemmen, C.H.J., Ingvarsson, T., Van der Molen, P., Ploeger, H., Quak, W., Stoter, J. and Zevenbergen, J. (2006). “The core cadastral domain model”, Computers, Environment and Urban Systems, Volume 30, 5. Watson, H., & Wixom, B. (2007). “The current state of Business Intelligence”. IEEE Computer Society , pp 96-99. Williamson, I. P. (1983). "A Modern cadastre for New South Wales", Unisurv Report S23, 250 p. ISBN 0-85839-038-8. Williamson, I. P. (2000). “Best Practices for Land Administration Systems in Developing Countries”. International Conference on Land Policy Reform, Jakarta. 62 Wyatt, P., e Ralphs, M. (2003). “GIS in Land and Property Management. Great Britain”: Spoon Press. 240 p. ISBN 0-415-24065-4. 63 Anexo A – Formulário BCI 64 Anexo B – Carne de pagamento de ITPU 65 Anexo C – Modelo CCDM parte 1 66 Anexo D – Modelo CCDM parte 2 67 Anexo E – Modelo de dados conceitual para CTM 68