Mestrado em: Sistemas de Informação Geográfica e Ordenamento do Território Aquisição e Edição de Dados Geográficos 2014/2015 Construção de uma “Geodatabase” Descrição das opções metodológicas de todo o processo Docente: Professor Doutor António Costa [email protected] Discente: Duarte Manuel Campelo Ricardo (N.º 201401466) [email protected] Porto, dezembro de 2014 Construção de uma “Geodatabase”: Descrição das opções metodológicas de todo o processo Índice Índice de tabelas ........................................................................................................................... 1 1 - Introdução ................................................................................................................................ 2 2 - Objetivos .................................................................................................................................. 3 2.1 - Objetivos Gerais ................................................................................................................ 3 2.2 - Objetivos Específicos ......................................................................................................... 3 3 - Metodologia ............................................................................................................................. 3 4 - Descrição das opções metodológicas ...................................................................................... 4 4.1 - Escolha do sistema de projeção ........................................................................................ 4 4.2 - Aquisição e edição de informação válida .......................................................................... 4 4.3 - Conceção da Geodatabase................................................................................................ 5 4.3.1 - Feature Dataset - “Limites_Admin” ........................................................................... 5 4.3.2 - Feature Dataset - “Uso_do_Solo” .............................................................................. 6 4.3.3 - Feature Dataset - “Usos_CLC_COS” ........................................................................... 7 4.3.4 - Feature Dataset - “Outros_Dados” ............................................................................ 7 5 - Conclusões ............................................................................................................................... 8 6 - Bibliografia ............................................................................................................................... 9 Anexos ........................................................................................................................................... 9 Índice de tabelas Tabela 1 - Organização do conteúdo da Feature Dataset - "Limites_Admin" .............................. 5 Tabela 2 - Organização do conteúdo da Feature Dataset - "Uso_do_Solo " ................................ 6 Tabela 3 - Regras definas no Modelo Topológico ......................................................................... 7 Tabela 4 - Organização do conteúdo da Feature Dataset - "Usos_CLC_COS" .............................. 7 Tabela 5 - Organização do conteúdo da Feature Dataset - "Outros_Dados" ............................... 8 Duarte Ricardo (201401466) Página 1 Construção de uma “Geodatabase”: Descrição das opções metodológicas de todo o processo 1 - Introdução O presente trabalho ocorre no âmbito da unidade curricular de Aquisição e Edição de Dados Geográficos, lecionada no curso de Mestrado em Sistemas de Informação Geográfica e Ordenamento do Território, ministrado pela Faculdade de Letras da Universidade do Porto. Tem por base a proposta apresentada pelo Docente, a qual enuncia a construção de uma “Geodatabase”, com diferentes “Feature Dataset” e respetivas “Feature Class”. Para o efeito, foram facultados dados no formato “Matricial/Raster”, concretamente, um ortofotomapa com a área de estudo e ainda informação vetorial do tipo polígono, designadamente, uma “shapefile” denominada “Limites.shp”, que consubstancia a área de intervenção no que concerne à vetorização dos eixos de via e do uso/ocupação do solo. O processo de vetorização do ortofotomapa teve origem na aquisição de dados segundo o método primário - Fotointerpretação -, cuja obtenção da informação temática foi conseguida pela caraterização dos diferentes elementos dispostos na fotografia vertical área, através do reconhecimento dos diferentes elementos, isto é, no que concerne à sua forma, tamanho, tonalidade, textura, sombra, posição, padrão e associação, ou seja, interpretação das ocorrências em função da associação de várias evidências. Em cumprimento da proposta enunciada, procedeu-se à vetorização do uso do solo de acordo com a classificação do nível 1 da CORINE Land Cover (CLC)1. Sendo igualmente imperativo a integração de outros dados que figurem diferentes temáticas, procedeu-se ao incremento de informação intrínseca aos limites administrativos, obtidos através da manipulação da Carta Administrativa Oficial de Portugal (CAOP)2 e à junção dos limites do estado Espanhol. Adicionou-se ainda informação relativa ao uso/ocupação do solo inerente à CORINE Land Cover 2006 (CLC_06) e à Carta de Ocupação do Solo de 2007 (COS_07)3, bem como se acrescentou também outros dados, como marcos geodésicos, árvores notáveis e pontos de interesse. Assim, tomando como principio a eficiência na gestão de grandes quantidades de informação, procedeu-se à conceção de uma “Personal Geodatabase”, na medida em que viabiliza a organização da informação de forma estruturada e hierárquica. Na prossecução da vetorização manual dos eixos de via e do uso do solo, aproveitando as potencialidades da “Geodatabase”, criou-se um “Modelo Topológico” com vista à observância de determinadas regras e efetuou-se propositadamente a definição prévia de atributos (Domains) que integram as “Feature Class” “Eixos_de_Via” e “Vetorizacao” (uso do solo), e finalmente, preencheu-se os metadados de todos os dados. Nos pontos seguintes serão apontados os objetivos e descrita a metodologia, bem como as opções metodológicas seguidas na construção da “Geodatabase”, sendo por fim apontada uma breve conclusão. 1 CORINE significa “coordenação de informações sobre o meio ambiente”. É um projeto da iniciativa da União Europeia, que consiste na conceção de uma base de dados que geograficamente ilustra a cobertura de terra em 44 classes (classes de uso do solo), apresentado um produto cartográfico, à escala de 1: 100 000, encontrando-se disponível para a maioria das áreas da Europa. 2 A Carta Administrativa Oficial de Portugal (CAOP) regista o estado da delimitação e demarcação das circunscrições administrativas do País. 3 Informação cartográfica de uso e ocupação do solo em formato vetorial, com uma unidade mínima cartográfica de 1ha e uma nomenclatura com 193 classes ao nível mais detalhado. Duarte Ricardo (201401466) Página 2 Construção de uma “Geodatabase”: Descrição das opções metodológicas de todo o processo 2 - Objetivos 2.1 - Objetivos Gerais Construção de uma “Geodatabase” com o mínimo de três “Feature Dataset” e respetivas “Feature Class” Vetorização manual dos eixos de via e uso do solo na área de intervenção proposta A vetorização do uso do solo em conformidade com o nível 1 da CLC 2.2 - Objetivos Específicos Conceção de uma “Personal Geodatabase” Proceder à vetorização manual tendo presente a Fotointerpretação como método primário na origem da aquisição dos dados Proceder à prévia definição de atributos através do “domains” e “subtypes” Cria e aplicar um Modelo Topológico Representar outros dados que caraterizam a área em estudo Produzir os metadados intrínsecos à informação integrante da “Personal Geodatabase” Produzir “layout’s” que ilustrem o teor da informação representada por cada “Feature Dataset” 3 - Metodologia Foi seguida uma metodologia que se subdivide nas seguintes fases: 1. Estudo e análise da bibliografia facultada pelo Docente, tais como, documentos de apoio, apresentações (slides) e páginas web abordadas nas aulas; 2. Utilização do software ArcGis, sobretudo dos aplicativos ArcCatalog e ArcMap; 3. Avaliação dos dados fornecidos pelo Docente, quanto ao seu formato, conjunto de ficheiros, tipo de dados e sistema de projeção; 4. Proceder ao alinhamento dos dados com base no mesmo sistema de projeção; 5. Incrementar ao projeto outra informação necessária à prossecução dos objetivos definidos, não descorando dos devidos ajustes nos sistemas de coordenadas; 6. Proceder ao corte dos novos dados pelo limite da área de estudo definida; 7. Criar a “Personal Geodatabase”, definindo as “Feature Dataset” e proceder à criação das respetivas “Feature Class” ou ao “import” das shapefile’s então criadas; 8. Definição dos “domains” e “subtypes” para as “Feature Class” intrínsecas à vetorização do uso do solo e dos eixos de via; 9. Vetorização manual dos eixos de via e do uso do solo de acordo com o nível 1 da CLC_06; Duarte Ricardo (201401466) Página 3 Construção de uma “Geodatabase”: Descrição das opções metodológicas de todo o processo 10.Criar o Modelo Topológico para a vetorização e posteriormente (fim da vetorização) proceder à sua aplicação; 11.Preenchimento dos metadados da informação que integra a Personal Geodatabase; 12.Produção de layouts. 4 - Descrição das opções metodológicas 4.1 - Escolha do sistema de projeção Ainda antes de se avançar para o ArcGis, através do explorador do Windows, procedeu-se à análise da informação de base fornecida e constatou-se que o ortofotomapa não possuía sistema de coordenadas, ao contrário da shapefile “Limites.shp”, cujo sistema de projeção se encontrava definido como Hayford_Gauss_Lisboa_IGeoE (HGM). Por conseguinte, abriu-se um novo projeto no ArcMap, adicionou-se o ortofotomapa e apesar da falta do sistema de projeção, depreendeu-se pelas coordenadas “unknown units”, sempre positivas sobre a imagem e pela indicação do ponto (0,0) [x,y], que se tratava do sistema de coordenadas HGM, pelo que se procedeu à definição da projeção (ArcToolBox > Data Management Tools > Projections and Transformations > Define Projection). Tendo a informação de base o sistema de projeção HGM, optou-se por adotar este sistema de coordenadas ao projeto, que por sua vez consubstancia todo o trabalho. Esta opção viola as diretrizes definidas pela Diretiva INSPIRE4, cujo sistema de projeção de eleição apontava neste caso para ETRS_1989_TM06-Portugal. Contudo, a projeção do ortofotomapa num outro sistema de coordenadas faria com que perdesse qualidade substancial, podendo assim induzir em erro na altura de vetorizar. 4.2 - Aquisição e edição de informação válida Tendo o projeto e respetivas layers no mesmo sistema de coordenadas, ativou-se ainda a opção dos caminhos relativos e avançou-se em busca de informação válida e pertinente à prossecução dos objetivos previamente definidos. Do site da Direção Geral do Território extraíram-se os dados relativos aos limites administrativos (CAOP 2014), a cartografia de ocupação/uso do solo nos países na União Europeia (CLC 2006), a informação cartográfica de uso/ocupação do solo em conformidade com a COS 2007 e a Rede Geodésica Nacional. Da Agencia Portuguesa do Ambiente (Atlas do Ambiente) extraiu-se informação inerente às árvores notáveis e do site DIVA-GIS obteve-se os limites do estado Espanhol. Através do Google Earth retiram-se pontos de interesse localizados na área de intervenção (Limites.shp). Toda a informação cujo sistema de coordenadas se mostrasse diferente do definido para o projeto, foi projetada no sistema de projeção HGM, através de um conjunto de procedimentos, tais como: ArcToolbox > Data Management Tools > Projections and Transformations > Project. Procedeu-se também ao corte da informação adquira na web pelo limite da área de intervenção fornecida através da ferramenta CLIP (Geoprocessing > Clip). 4 Diretiva que estabelece a criação da Infraestrutura Europeia de Informação Geográfica. Duarte Ricardo (201401466) Página 4 Construção de uma “Geodatabase”: Descrição das opções metodológicas de todo o processo A informação relativa à Rede Geodésica Nacional foi adquira no formato KMZ (ficheiros nativos do Google Earth), tendo-se carregando o ficheiro no Google Earth, depois guardou-se a informação no formato KML, no intuito de a carregar no ArcMap através da ferramenta (Conversion Tools > From KML > KML To Layer). 4.3 - Conceção da Geodatabase Uniformizada a informação quanto ao seu sistema de projeção e representação espacial, procedeu-se então no ArcCatalog à construção da “Personal Geodatabase” (New > Personal Geodatabase), cuja capacidade máxima ascende aos 2GB, espaço mais do que suficiente para a prossecução do presente trabalho. Esta base de dados usa a extensão ‘*.mbd’, sendo por isso um ficheiro nativo do Microsoft Office, concretamente do aplicativo Access e pode armazenar informação gráfica (dados vetoriais [pontos, linhas e polígonos]) associados a dados não gráficos (tabelas) e ainda permitem importar imagens (dados matriciais/raster) alocando toda a informação de forma estruturada e hierárquica. Tendo em consideração a informação recolhida, procedeu-se à criação de quatro “Feature Dataset”, sendo elas: 4.3.1 - Feature Dataset - “Limites_Admin” Esta “Feature Dataset” contém toda a informação relativa aos limites administrativos obtidos pela manipulação da CAOP 2014, depois de um conjunto de geoprocessamentos realizados através de ferramentas como o “Dissolve” e o “Select By Atributes”. Esta Dataset tem como objetivo a localização da área em estudo a diferentes escalas, de forma a facilitar a análise espacial e dela fazem parte um conjunto de dados (Feature Class) que caraterizam geograficamente a área delimitada para a vetorização manual. Tabela 1 - Organização do conteúdo da Feature Dataset - "Limites_Admin" Feature Class Port_Ct Espanha_HGM Distritos_Pt_Ct Dist_Prt Mun_Dst_Prt Mun_Vila_Conde Freg_Vila _Conde Duarte Ricardo (201401466) Feature Dataset - “Limites_Admin” Descrição Informação vetorial do tipo polígono, obtida da CAOP_2014, que ilustra o limite do território continental português. Informação vetorial do tipo polígono, sobre os limites administrativos genéricos do estado espanhol. Informação vetorial do tipo polígono, obtida da CAOP_2014, que ilustra Portugal Continental dividido por distritos. Informação vetorial do tipo polígono, obtida da CAOP_2014, que ilustra o limite administrativo do distrito do Porto Informação vetorial do tipo polígono, obtida da CAOP_2014, que ilustra os limites administrativos de cada um dos Municípios do Distrito do Porto. Informação vetorial do tipo polígono, obtida da CAOP_2014, que ilustra o limite administrativo do Município de Vila do Conde. Informação vetorial do tipo polígono, obtida da CAOP_2014, que ilustra os limites administrativos das Freguesias do Município de Vila do Conde. Página 5 Construção de uma “Geodatabase”: Descrição das opções metodológicas de todo o processo 4.3.2 - Feature Dataset - “Uso_do_Solo” Uma vez efetuada a caraterização geográfica da área em estudo, prosseguiu-se com os trâmites necessários ao processo de vetorização dos eixos de via e do uso/ocupação do solo na área de intervenção definida pela shapefile ”Limites.shp”. A vetorização do uso do solo foi efetuada de acordo com a nomenclatura do nível 1 da CLC, a qual está dividida em 5 classes: Territórios artificializados, Áreas agrícolas e agroflorestais, Florestas e meios naturais e seminaturais, Zonas húmidas e Corpos de água. Estas 5 classes foram definidas na respetiva “Feature Class” como domínios de um campo da tabela de atributos denominado “USO”, de forma a evitar a multiplicidade de registos para o mesmo fim, fruto da introdução de espaçamentos a mais, da adição extra de caracteres, de erros ortográficos, etc., que podem acontecer no decorrer da vetorização manual do ortofotomapa. Na vetorização dos eixos de via foram também definidos domínios com o intuito de evitar os mesmos erros, tendo-se definido 5 classes: Autoestrada, Estradas Principais, Estradas Secundárias, Caminhos e Linha de Metro. A introdução destes domínios visam facilitar a vetorização manual no ArcMap, mas estão associados a um conjunto de passos precedidos no ArcCatalog, que de forma sucinta passo a elencar: Nas propriedades das “Feature Class” que consubstanciam a vetorização do uso do solo (Vetorizacao) e a vetorização dos eixos de via (Eixos_de_Via): Subtypes > Domains Na tabela Domain Name criar o campo que guardará as diferentes classes e no Description escrever algo que o caraterize; Na tabela Domain Properties alterou-se o Field Type para texto; Na tabela Coded Values inseriu-se no Code valores numéricos sequenciais atribuindo a cada um deles a descrição (Descripton) de cada uma das classes. Fields Selecionar na tabela Field Name o campo criado anteriormente no Domain Name; Na tabela Field Properties selecionar Domain e escolher da lista o campo que guarda os respetivos domínios. Tabela 2 - Organização do conteúdo da Feature Dataset - "Uso_do_Solo " Feature Class Area_Uso_do_Solo Eixos_de_Via Vetorização Uso_do_Solo_Topology Duarte Ricardo (201401466) Feature Dataset - “Uso_do_Solo” Descrição Informação vetorial do tipo polígono que consubstancia a área de intervenção consequentemente a vetorizar. Informação vetorial do tipo linha que contém informação sobre os tipos de vias existentes na área de intervenção. Informação vetorial do tipo polígono que contém informação sobre o uso/ocupação do solo em conformidade com o nível 1 da CLC. Modelo Topológico aplicado às shapefile “Eixos_de_Via” e “Vetorizacao”, para a normalização da vetorização, no sentido de assegurar a integridade e a qualidade da informação geográfica final. Página 6 Construção de uma “Geodatabase”: Descrição das opções metodológicas de todo o processo Para corrigir eventuais erros decorrentes não da edição dos atributos dos dados vetoriais, mas do processo de vetorização dos mesmos, procedeu-se também à criação de um Modelo Topológico com vista à normalização da vetorização. A criação de uma topologia permite através de um conjunto de regras previamente definidas, auxiliar o utilizador na correção de erros dissimulados como a sobreposição de polígonos ou de segmentos, buracos, polígonos incorretamente fechados, entre outros, garantido assim a integridade dos dados. Tabela 3 - Regras definas no Modelo Topológico Modelo Topológico - “Uso_do_Solo_Topology” Feature Class Regras Must Not Intersect Eixos_de_Via Must Not Overlap Must Not Have Gaps Vetorizacao Must Not Overlap 4.3.3 - Feature Dataset - “Usos_CLC_COS” De forma a poder inferir comentários e conclusões no que concerne ao uso/ocupação do solo, adicionou-se a esta “Feature Dataset” a CORINE Land Cover de 2006 que, partilhando da mesma nomenclatura serve de base de comparação com a vetorização manual preconizada na “Dataset” anterior. Adicionou-se também a Carta de Ocupação do Solo de 2007 que, apesar de usar uma metodologia e nomenclatura diferentes, dispõe de informação pertinente para uma análise mais completa. Tabela 4 - Organização do conteúdo da Feature Dataset - "Usos_CLC_COS" Feature Class CLC_Area_Int COS07N1_Area_Int Feature Dataset - “Usos_CLC_COS” Descrição Informação vetorial do tipo polígono representada no “Data View” com base num campo “Tipologia”, sobre o qual incidiu um processo de simbologia em conformidade com a nomenclatura do nível 1 da CLC. Informação vetorial do tipo polígono representada no “Data View” com base num campo “Tipologia” sobre o qual incidiu um processo de simbologia em conformidade com a nomenclatura da COS07. 4.3.4 - Feature Dataset - “Outros_Dados” Por fim, criou-se a última “Feature Dataset”, cujo conteúdo representa informação relevante para área de intervenção em estudo e na sua envolvência, tal como, árvores notáveis, rede geodésica nacional e ainda pontos de interesse. A informação inerente às árvores notáveis e à rede geodésica nacional foi representada geograficamente ao nível dos limites administrativos do Município de Vila do Conde. As informações relativas aos pontos de interesse consubstanciam dados (pontos) marcados no Google Earth, tendo por base o perímetro da shapefile “Limites.shp” transportada para o Google Earth. Esta informação foi depois convertida para o ArcMap, levando consigo a legendagem de cada um dos pontos marcados, como por exemplo, Estação do Metro, Juntas de Freguesia e Restaurantes. Duarte Ricardo (201401466) Página 7 Construção de uma “Geodatabase”: Descrição das opções metodológicas de todo o processo Tabela 5 - Organização do conteúdo da Feature Dataset - "Outros_Dados" Feature Dataset - “Outros_Dados” Feature Class Descrição Informação vetorial do tipo pontos com a localização das Anot_Mun_VC árvores notáveis existentes no Município de Vila do Conde. Informação vetorial do tipo pontos com a localização dos MarcosGeo_Mun_VC marcos geodésicos existentes no Município de Vila do Conde. Informação vetorial do tipo pontos com a localização de Pontos_Int_HGM pontos de interesse circunscritos à área de intervenção em estudo. Dada a impossibilidade de incorporar o ortofotomapa (dados matriciais/raster) numa “Feature Dataset” e sendo este parte integrante do presente trabalho, optou-se por adicionalo à Geodatabase através da ferramenta “Raster to Geodatabase”. Tal opção resultou na perda de qualidade visual do raster, contudo, o processo de vetorização no ArcMap foi realizado tendo por base o ficheiro original. Na conceção de “Personal Geodatabase” foi também tido em consideração o preenchimento de todos os metadados, tendo-se procedido à edição manual em todas as “Feature Class”. A edição dos metadados foi processada no ArcCatalog > Description > Edit e efetuada em conformidade com a Diretiva Europeia INSPIRE, encontrando-se assim toda a informação homogeneizada. 5 - Conclusões Neste trabalho foi possível experienciar como um Sistema de Informação Geográfica (SIG) permite e facilita a análise, a gestão e a representação espacial da realidade. A criação da “Personal Geodatabase” evidenciou vantagens e desvantagens. Como vantagens assinalam-se a gestão adequada para grandes quantidades de informação; a prévia definição de domínios no sentido de evitar erros de escrita e garantir a integridade da tabela de atributos, tornando assim mais célere o processo de vetorização; a criação e aplicação de um Modelo Topológico para a correção de erros derivados da vetorização manual; e a possibilidade de descrição do conteúdo da informação geográfica através do preenchimento dos metadados. Como desvantagens apontam-se a impossibilidade de adicionar à Geodatabase ficheiros do formato “lyr” e “mxd” e a redução substancial da resolução dos ficheiros do tipo raster/matricial quando importadas para a Geodatabase. A Fotointerpretação foi o método primário que esteve na origem da aquisição de dados no processo de vetorização manual do ortofotomapa circunscrito ao limite da shapefile “Limites.shp”, sendo a forma, a cor, a tonalidade, a textura, a associação e o padrão, os fatores de reconhecimento que mais contribuíram para a identificação dos elementos que permitiram a caraterização dos dados que qualificam o uso/ocupação do solo da área de intervenção. Tendo por base as áreas de uso/ocupação do solo à escala dos limites (Limites.shp) definidos para o estudo em apreço, que figuram quer na CLC_2006, quer na COS_2007, é Duarte Ricardo (201401466) Página 8 Construção de uma “Geodatabase”: Descrição das opções metodológicas de todo o processo possível concluir que a vetorização manual apresenta maior pormenor e rigor em relação à realidade. É certo que estes dados foram obtidos em datas diferentes, mas também a generalização cartográfica é definida por um conjunto de processos de simplificação da informação à escala do mapa, sendo o grau de generalização tanto maior quanto menor for a escala do mapa. Logo, o tipo de mapa, a finalidade e a escala são questões a ponderar na conceção de qualquer projeto geográfico. 6 - Bibliografia Direção Geral do Território - Carta Administrativa Oficial de Portugal (CAOP 2014), disponível em:http://www.dgterritorio.pt/cartografia_e_geodesia/cartografia/carta_administrativa_ofici al_de_portugal__caop_/caop__download_/ Direção Geral do Território - Carta de Uso e Ocupação do Solo de Portugal Continental para 2007 (COS 2007), disponível em: http://www.dgterritorio.pt/cartografia_e_geodesia/cartografia/cartografia_tematica/cos/cos_ _2007/ Direção Geral do Território - Rede Geodésica Nacional, disponível em: http://www.dgterritorio.pt/cartografia_e_geodesia/geodesia/redes_geodesicas/rede_geodesi ca_nacional/ DIVA-GIS – Divisão Administrativa Oficial de Espanha, disponível em: http://www.divagis.org/gdata ESRI ArcGis (Geodatabase Topology Rules), disponível http://webhelp.esri.com/arcgisdesktop/9.2/pdf/topology_rules_poster.pdf em: ESRI – Software ArcGIS. European Environment Agency - CORINE Land Cover, (metodologia e nomenclatura), disponível em: http://www.eea.europa.eu/publications/COR0-landcover Google – Software Google Earth Anexos Anexo I Layout de enquadramento do conteúdo da Dataset “Limites_admin” Anexo II Layout de enquadramento do conteúdo da Dataset “Uso_do_Solo” Anexo III Layout de enquadramento do conteúdo da Dataset “Usos_CLC_COS” Anexo IV Layout de enquadramento do conteúdo da Dataset “Outros_Dados” Duarte Ricardo (201401466) Página 9 Construção de uma “Geodatabase”: Descrição das opções metodológicas de todo o processo Anexo I Anexo II Duarte Ricardo (201401466) Página 10 Construção de uma “Geodatabase”: Descrição das opções metodológicas de todo o processo Anexo III Anexo IV Duarte Ricardo (201401466) Página 11