! Henrique de Jesus Matemático Ricardo Sousa Engº do Território Rodrigo Oliveira Engº Civil, PhD Fernanda Nery Bióloga "# $&%(')+* O Sistema Nacional de Informação sobre Recursos Hídricos, SNIRH, inclui um conjunto enorme de temas geográficos com interesse para a gestão de recursos hídricos, que tem vindo a aumentar com os trabalhos de elaboração dos planos de bacia hidrográfica. Para gerir esta quantidade de dados, o INAG optou por uma solução apoiada numa base de dados recorrendo à tecnologia SDE sobre Oracle, e impôs que todos os dados geográficos armazenados sejam descritos por metadados. Esta solução permite uma gestão eficiente dos dados armazenados com um controlo rigoroso das permissões de carregamento, acesso e de alteração, e ainda a pesquisa dos dados por critérios temáticos, geográficos ou por metadados. Nesta comunicação descreve-se a arquitectura e funcionalidades da solução instalada no INAG chamando à atenção para as suas capacidades de pesquisa e de análise. ,.-0/1-3254 -6$8789 :(-32;#0* SNIRH, Dados Geográficos, SDE, Metadados, Recursos Hídricos 1 84 ) (% 6) O Sistema Nacional de Informação sobre Recursos Hídricos, SNIRH, inclui um conjunto enorme de temas geográficos com interesse para a gestão de recursos hídricos, que tem vindo a aumentar com os trabalhos de elaboração dos planos de bacia hidrográfica. Neste momento estão definidos cerca de 60 temas que podem surgir em diferentes resoluções ou escalas, provenientes de várias origens ou produtores ou referentes a períodos de tempo distintos. É, assim, provável que num futuro próximo o SNIRH tenha de gerir um número de ficheiros ou cartas da ordem da centena de milhar. A sua gestão através do do sistema operativo é, na prática, impossível! Para ultrapassar este problema, o INAG optou por uma solução apoiada numa base de dados recorrendo à tecnologia SDE sobre Oracle, e impôs que todos os dados geográficos armazenados sejam descritos por metadados. Esta solução permite uma gestão controlada dos dados armazenados através de uma interface amigável que apresenta os dados disponíveis à medida que se navega sobre uma árvore de classificação de temas. A pesquisa dos temas disponíveis pode também ser realizada por critérios geográficos ou através dos metadados que descrevem os temas armazenados. O controlo rigoroso das permissões de carregamento, acesso e de alteração que uma base de dados possibilita é também fundamental para uma gestão eficiente deste conjunto de dados geográficos que é acedido por um número elevado de utilizadores. Sem esse controlo, é sempre possível que alguém, intencionalmente ou não, apague um ficheiro, edite o seu conteúdo sem autorização ou altere a sua localização sem avisar um responsável. Por outro lado, muitos dos dados disponíveis no SNIRH estão sujeitos a direitos de autor, sendo portanto fundamental impedir a sua difusão não autorizada. Nesta comunicação apresenta-se se a arquitectura da solução instalada no INAG e descrevem-se as funcionalidades das aplicações desenvolvidas para interagir com a componente geográfica do SNIRH. -64 '- 3# (-6'# 8) (# (- ()6$ 6# ) 64 19 ) $ (- (-6$&# (# (- ()6$ 4 (% 8# 9 8%(4 "! # $ &% % ('*),+ & #- $ $ .0/ (1 + ( A solução escolhida para armazenar temas geográficos na base de dados ORACLE existente no INAG recorre ao software SDE (Spatial Data Engine) desenvolvido pela ESRI. Este software cria uma estrutura de tabelas onde é armazenada a informação topológica contida nos temas geográficos. As capacidades de gestão dos dados oferecidas pelo SDE 234 2 são, no entanto, muito limitadas sendo na prática necessário criar uma estrutura adicional de tabelas que envolvam a estrutura criada automaticamente com a instalação do SDE e ainda desenvolver aplicações que acedam a este conjunto de uma forma amigável. No caso do INAG foi ainda necessário associar este conjunto com a estrutura de dados do SNIRH, de modo que o novo conjunto constitua de facto a componente geográfica do SNIRH e não algo completamente independente. Finalmente, os metadados dos temas geográficos são também armazenados na base de dados e têm referências para os dados que descrevem. A Figura 1 ilustra como todas estas componentes se interligam. Aplicação ArcInfo Arcview Aplicação Modem Servidor web ORACLE Aplicação Metadados Dados geográficos Séries de tempo 6%(4 - +% 4 (% 8# 9 8%(4 - () &" / (1 + ( # A necessidade de um controlo rigoroso dos temas geográficos armazenados no SNIRH e a manutenção da consistência de todo o sistema exigiu a definição de um conjunto de conceitos que são explicados nos capítulos seguintes. # '- $ Um tema geográfico define realidades que se distribuem no espaço. O termo realidade é aqui utilizado de uma forma vaga para designar variáveis físicas como a altitude ou a precipitação, infra-estruturas, áreas administrativas ou naturais ou redes do mais variado tipo. Se o tema for vectorial, a definição dessas realidades é obtida através da localização no espaço de um conjunto de pontos, arcos ou polígonos, enquanto que se for raster a definição é obtida por uma quadrícula em que cada célula assume um valor numérico. No universo ArcInfo/ArcView desenvolvido pela ESRI, os temas vectoriais podem ser definidos por 230" ou por coberturas (4 ) e os temas 4 r por 4 . O conjunto dos temas geográficos necessários para uma gestão abrangente e integrada dos recursos hídricos é muito vasto. Para gerir de forma eficiente este número, o INAG 3 utiliza uma classificação temática com uma hierarquia com 3 níveis que foi incluída nas aplicações desenvolvidas. (- (# $ (# 4 # #4 (9 1- + & () + Cada tema geográfico tem, no contexto da solução instalada no INAG, associada uma 0 0 4 "4 . Esta unidade de referência tem um caracter geográfico e pode ser definida como o mosaico em que cada tema é subdividido para o seu armazenamento e gestão. São exemplos de unidades de referência o limite do país para os temas do Atlas do ambiente, a carta militar para os temas altimetria e hidrografia do IGeoE, a bacia hidrográfica para os temas produzidos no âmbito dos trabalhos de elaboração do plano de bacia, e o concelho para a localização de infra-estruturas de saneamento básico. A única exigência que é imposta a uma unidade de referência é que a sua associação a um dado tema faça sentido. Uma unidade de referência é válida para um dado tema se e só se qualquer entidade pertencente ao grupo de entidades do tema puder ser completamente inserida numa, e só numa, unidade de referência desse tema mantendo a sua validade e integridade lógica e topológica. A título de exemplo refira-se que a unidade de referência do tema rede hidrográfica não pode ser o concelho porque os rios não respeitam os limites de concelhos. A unidade de referência constitui a unidade básica de carregamento e de alteração do tema associado. Para editar uma entidade (e.g. ponto, arco, polígono) incluída no tema é necessário extrair da base de dados todas as entidades desse tema incluídas na unidade de referência, proceder à correcção da entidade que necessita de correcção e voltar a carregar toda a unidade de referência. Este processo de extracção, alteração e inserção das entidades de uma instância não é moroso se as unidades de referência do tema forem correctamente escolhidas. O conjunto de unidades de referência é um conjunto reduzido e relativamente estável. A criação de unidades de referência é realizada por comandos de baixo nível que só devem ser executados pelo administrador de sistema. Neste momento, o SNIRH tem criadas as seguintes unidades de referência: • Limite do País; • Limites dos planos de bacias hidrográfica; • Limites dos concelhos; • Limites das cartas 1:500 000; • Limites das cartas 1:250 000; • Limites das cartas 1:100 000; • Limites das cartas 1:25 000. 4 ($ (9 1-6$ + Cada tema geográfico pode existir na base de dados em várias instâncias ou versões. Uma instância de um dado tema distingue-se de outra instância por 2 propriedades: • Instituição produtora; • Período de validade ou data de produção. Um exemplo da aplicação deste conceito são as várias versões do tema rede viária das cartas militares, produzidas pelo IGeoE, de acordo com a data dos trabalhos de campo. Existem também várias versões do tema rede hidrográfica de que são exemplo a produzida pelo IGeoE com base em levantamentos de campo, a gerada pela Chiron a partir do modelo numérico do terreno, e ainda outra produzida pelo INAG, também a partir do modelo digital do terreno mas utilizando uma metodologia diferente. O conceito de instância é importante para garantir a consistência dos dados. A solução desenvolvida para o INAG não permite o armazenamento de duas instâncias idênticas na mesma unidade de referência, isto é o trio ( . 32&4 "4 234 0 00 tem de ser único. É assim impossível armazenar duas vezes a mesma versão de uma carta militar. +/ 19 - 6#$ / + A partir da arquitectura e dos conceitos descritos no ponto anterior foram desenvolvidas as aplicações que operam sobre os dados armazenados e que permitem inserir, exportar e visualizar os dados armazenados. Foram também desenvolvidas outras aplicações que lidam especificamente com os metadados dos temas geográficos. Este capítulo e o próximo descrevem essas aplicações. 8# ($ 6) .* - (- 6# 4 % A gestão de instâncias dos temas geográficos, bem como a inserção e extracção dos dados a elas associados é realizada através de uma extensão de ArcView. A extensão 4 foi desenvolvida para a versão 3.0 ou superior do ArcView e não recorre a nenhuma extensão de ArcView que não venha com o pacote básico. No caso da gestão de ficheiros de tipo 4 é necessário dispor da extensão 2 0"! 0 . Para proceder à instalação do 4 basta copiar um ficheiro para a directoria apropriada e seleccionar o #$ 4 da listagem das extensões a utilizar. Esta instalação instala o menu apresentado na Figura 2. 5 6%(4 - +% # (% (-# 8# ($ 6) (# 4 9 2 1# * # / + O 4 permite criar novas instâncias de temas geográficos bem como inserir naquelas instâncias quaisquer entidades (pontos, linhas ou polígonos) que estejam presentes em temas num projecto de ArcView. Permite ainda copiar da base de dados as entidades incluídas numa instância de um tema e transformá-las, por exemplo, numa 23 " . Associado a cada entidade pode ser transferido de ou para a base de dados um atributo numérico, um atributo alfanumérico e um código de metadados. O processo de inserção de entidades numa instância de um dado tema é dividido em 3 fases: • • • Registo do período de validade e da instituição produtora; Criação de uma instância do tema; Inserção das entidades na base de dados. O registo do período de validade e da instituição produtora é apenas necessário se estes ainda não se encontrarem registados, isto é basta registar apenas uma vez o IGeoE para posteriormente se poder inserir a altimetria, a rede hidrográfica e os limites administrativos definidos nas cartas militares 1:25 000. O período de validade de uma instância pode ser entendido como a data de produção daquela versão de um tema. A criação de uma instância de um tema consiste na associação de uma entidade produtora e de um período de validade a um dado tema. A selecção do tema é realizada através da árvore hierárquica que representa a classificação temática utilizada pelo INAG. A 6 Figura 3 mostra a criação de uma instância do tema "Curvas de Nível", à escala/resolução 1:25 000 que se encontra classificado tematicamente como "Topografia". O utilizador procede à associação de um dos períodos já registados e que ainda não foram associados ao tema seleccionado: neste exemplo o período 1/1/1980-31/12/1980 que pode ser considerado como a data do levantamento de campo. 6%(4 - +% 4 1- 6) (# %('- ($ (9 1(+ # #+ + Após ter criado a instância, é possível inserir na base de dados as entidades definidas no tema que tem de estar activo no ambiente ArcView. Essa tarefa é realizada a partir das janelas apresentadas na Figura 4 e 5. Na primeira janela (Figura 4), o utilizador activa o tema pretendido e selecciona uma instância desse tema que já tenha sido criada. A selecção da instância é realizada através da escolha da escala e da classificação temática. Após a selecção da instância o utilizador tem de seleccionar a unidade de referência onde serão inseridas as entidades; pode ainda seleccionar um campo numérico e um alfanumérico associados às entidades que serão armazenados na base de dados (Figura 5). Todas as entidades que não estejam dentro da unidade de referência escolhida não são introduzidas na base de dados. 7 6%(4 +% $&9 )6/1:(- () 8# '-# 4 # $ (# 9 2;- ($ (9 1-) (# $&# 4 6) 6%(-64 (- ()6$ )6$ (- ()6$ # ( + #+ + ( #% ( & 6%(4 - &$ 9 )6/1:(- (-% (- (# (# 4 # #4 (9 1-9 6) (# '# 8- (- ()6$ # 9 -6' ()6$ 9 )6' (- ()6$ - 84 - ($ #4 4 +% # + * $ () + +% # ( ) + 8 A cópia de entidades guardadas numa instância de um tema da base de dados pode iniciar-se pela definição da área geográfica onde será realizada a pesquisa (Figura 6). A selecção da opção 4 apresenta uma janela (Figura 7), onde é possível especificar a escala, o grupo temático e o período de validade da informação pretendida. No lado direito da janela surgem os temas e as instâncias dos temas que existem na base de dados. O resultado desta operação de extracção são todas as instâncias que satisfazem os critérios de localização, escala, classificação temática e período de validade que foram especificados. Estas instâncias são adicionadas aos temas disponíveis no projecto ArcView. 6%(4 - # 6) (- 64 # - (# (# $ (% 1$&- +% (),++ # #' # # 1 + 9 6%(4 - &$ 9 )6/1:(- () 8# '-# 4 # $ (# 9 2;- ($ (9 1- +% # ( + #+ + 6%(4 - " # $&%+/ 8- () (# %('- (# $ (% 1$&- +% # 1 + 10 4 ) $ A aplicação descrita anteriormente é uma extensão de ! 4 , o que significa que para recorrer às suas funcionalidades é necessária uma licença deste software e, eventualmente, outra de 2 0 ! 0 . A sua utilização por todos os técnicos de uma instituição como o INAG pode revelar-se onerosa devido ao número de licenças que é necessário adquirir. Por outro lado, o # 4 permite copiar temas do sistema de informação e distribuí-los livremente sob a forma de ficheiros. Dado que alguns dos temas existentes no SNIRH têm direitos de autor, o acesso generalizado ao # 4 pode colocar problemas de controle da informação disponível. A grande vantagem da extensão 4 resulta do facto que, após extrair os temas da base de dados para o ArcView, o utilizador tem à sua disposição todas as funcionalidades desta aplicação e adicionalmente outras fornecidas por extensões específicas, como por exemplo extensões que incluam funções de análise hidrológica. Mas uma análise das utilizações expectáveis numa instituição como o INAG revela que grande parte dos utilizadores apenas utiliza um conjunto restrito de operações. Justifica-se assim a existência de uma aplicação que possa ser distribuída a todos os técnicos do INAG a custos nulos por cada licença adicional, que faculte um conjunto básico de operações e que garanta a protecção dos temas armazenados no SNIRH. Foram estes os 4 & 4 , uma aplicação desenvolvida em objectivos que levaram ao aparecimento do Delphi recorrendo à biblioteca de objectos MapObjects da ESRI. 4 4 permite realizar: O • visualização dos temas armazenados no SNIRH; • visualização de 23 " • funções básicas de 2 e " ; A Figura 9 apresenta a janela principal do 4 &4 , enquanto que a Figura 10 apresenta o interface de pesquisa de temas na Base de Dados através do qual o utilizador pode seleccionar os temas a visualizar através da árvore temática e especificando uma escala e um período de validade. 11 6%(4 - - (# /1- (4 (9 (-6/ () +% 6%(4 - +% (+ + 8# 4 -69 # (# (# $ (% 1$&- () $ # 1 + 12 # 8- (- ()6$ ( Os metadados são dados que visam descrever de forma completa e rigorosa o conteúdo, qualidade, condição e outras características dos dados existentes numa instituição. O papel dos metadados é fundamental na gestão de grandes conjuntos de dados, pois só com uma descrição completa, rigorosa e padronizada é possível conhecer, gerir e, consequentemente, utilizar a informação existente. O perfil de metadados utilizado no SNIRH baseia-se na estrutura proposta pelo Federal Geographic Data Committee (FGDC), em conformidade com o qual foi estabelecido um perfil de utilização adaptado às necessidades do INAG. Este perfil inclui informação sobre a identificação do produtor, período de validade temporal, estado de manutenção, domínio espacial, palavras-chave associadas, qualidade dos dados (rigor dos atributos, consistência lógica, rigor posicional), referênciação espacial, organização topológica, entidades e atributos presentes, bem como informação sobre o distribuidor e formas de acesso aos dados. A associação da metainformação aos dados geográficos armazenados pode ser feita ao nível do: • Tema inserido numa dada unidade de referência; • Instância de um tema inserida numa dada unidade de referência; • Entidade inserida numa instância de um tema. No caso do SNIRH optou-se por associar a metainformação ao nível da entidade, i.e. cada entidade pode ter uma ficha de metadados única e distinta. Este detalhe permite, por exemplo, definir metadados para cada linha de nível de um tema de altimetria, o que pode ser importante se se pretender editar uma entidade de um tema e descrever as alterações introduzidas na ficha de metadados. O mais usual é, no entanto, que o conjunto de entidades inseridas numa instância de um tema numa dada unidade de referência partilhe os mesmos metadados. Tal como os dados geográficos, os metadados são armazenados no próprio SNIRH. Para inserir, gerir e consultar os metadados foram desenvolvidas duas aplicações. A primeira aplicação permite inserir, editar, pesquisar e consultar os metadados, enquanto que a segunda permite apenas consultar. O carregamento dos metadados pode ser realizado interactivamente ou através de ficheiros XML (Extended Markup Language) que seguem um ficheiro DTD (Data Type Definition) previamente estabelecido. O XML/DTD é um standard de descrição de dados que pode ser definido de forma sumária como uma extensão do HTML, prevendo-se para um futuro próximo a substituição do HTML pelo XML. As aplicações do XML/DTD vão, no entanto, muito para além da definição de páginas de hipertexto, do que é exemplo a sua utilização cada vez mais generalizada no domínio dos metadados. 13 Durante o carregamento ou edição dos metadados a aplicação de carregamento verifica se a estrutura dos metadados inseridos está conforme o perfil do SNIRH, se todos os campos obrigatórios estão preenchidos e se os valores inseridos estão dentro dos domínios de validade do atributo. Todos os metadados armazenados no SNIRH podem ser pesquisados por qualquer um dos campos do perfil. Por exemplo, o utilizador pode identificar os temas armazenados que têm um dado conjunto de palavras-chave, que foram produzidos por uma determinada instituição, que possuem uma dada escala, etc. 6%(4 - .#4 4 - '# 8- (# ($&# 4 6)# (# $ (% 1$&- ()6$ '# 8- (- ()6$ ) ($ (# 4 - 6# $ (- 1$ +% + # $+ ( # 1 + # ( ),+ + Esta comunicação pretendeu apresentar o trabalho desenvolvido no domínio do armazenamento, gestão, disponibilização e análise de dados geográficos no SNIRH e da sua integração com os dados alfanuméricos. Os resultados alcançados até à data promovem a utilização de dados espacialmente distribuídos no estudo e gestão dos recursos hídricos nacionais e abrem caminho à utilização mais frequente de metodologias de análise 14 abrangentes que incluam todas as vertentes que interessam para a gestão da água. Espera-se que este aumento da capacidade de análise, em profundidade e inclusão, contribua para um suporte mais fundamentado das decisões que é necessário tomar nesta área. 15