Captura e Estruturas de Dados Espaciais Capítulo 6 – Parte 02 Antonio P. Drumond Neto Doutorando PPGPV – UFES/CCA Avaliador: Prof. Dr. Alexandre Rosa dos Santos Novembro 2013 – Alegre, ES BANCO DE DADOS Banco de dados do SIG é composto por: • Dados Textuais • Dados Numéricos • Dados Vetoriais A, B, C, D ... 1, 2, 3, 4 ... • Dados matriciais (raster) ESTRUTURAS DE DADOS EM SIG O SIG possui a capacidade de armazenar atributos descritivos e formas geométricas dos diferentes tipos de dados geográficos. (CAMARA, 2005) ESTRUTURAS DE DADOS EM SIG A estrutura dos dados são formas padrões para armazenar dados no computador, sendo um intermediário entre o modelo da realidade e um formato de arquivo Dados espaciais - Dados relacionados a superfícies contínuas, contendo três coordenadas denominadas de amostra 3D Dados geográficos - necessários para definir onde as feições cartográficas ocorrem; Atributos - que registrem o que as feições cartográficas representam. Coordenadas X, Y e o atributo Z PRINCIPAIS ESTRUTURAS DE DADOS NO SIG Representação matricial: o espaço é representado como uma matriz composta de colunas e linhas. Cada célula possui um número de linha, um número de coluna e um valor correspondente ao atributo estudado. • Mundo Real Representação vetorial: o fenômeno pode ser abstraído em três elementos gráficos: • ponto (dimensão zero), • linha (uma dimensão), e • área ou polígono (duas dimensões). DADOS MATRICIAIS É à representação gráfica do mundo real por meio de pixel (picture element) ou células, com forma poligonal regular, geralmente quadradas, que são definidos pelas suas posições em relação às colunas e linhas de uma malha. Dependendo do que se quer representar a célula poderá ter um valor quantitativo ou qualitativo. Cada célula armazena um valor de atributo de um determinado tema. Cria-se uma cobertura (ou plano de informação) para cada tema (uso da terra, tipo de solo, cobertura vegetal, tipos de rocha, entre outros). TIPO DE ARQUIVOS RASTER 5 30 8 3 1 10 5 1 1 5 2,3 -3 5 5 4 9 -12,3 5 2,5 9 1,5 -3,4 3,8 5 a) Imagem codificada 2n b) Imagem contínua c) Imagem binária d) Imagem ternária ESTRUTURAS MATRICIAIS São estruturados em modelos simples e compacta. Principais Estruturas Raster: • CÓDIGO DE CADEIAS • RUN-LENGTH ENCODING (RLE) • VALUE POINT ENCODING (VPE) • MODELOS HIERÁRQUICOS, (QUADTREE e BLOCOS MÁXIMOS). DADO MATRICIAL DE 3 DIFERENTES TIPOS DE SOLO Exemplo 1 1 1 1 1 2 2 2 1 1 1 1 1 2 2 2 1 1 1 2 2 2 2 2 1 1 1 2 2 2 2 2 1 1 1 2 2 2 2 2 2 2 2 2 2 3 3 2 2 2 2 2 2 3 3 2 2 2 2 2 2 2 2 2 Códigos: 0= ESTE - 1= SUL - 2= OESTE - 3= NORTE Categoria 1= 15, 03, 35, 23. A partir linha 1 e coluna 1, no sentido anti-horário, os dados são organizados segundo determinada categoria. 1 1 1 1 1 2 2 2 1 1 1 1 1 2 2 2 1 1 1 2 2 2 2 2 1 1 1 2 2 2 2 2 1 1 1 2 2 2 2 2 2 2 2 2 2 3 3 2 2 2 2 2 2 3 3 2 2 2 2 2 2 2 2 2 A estruturação em código de cadeias reduziu o tamanho do arquivo em 8 unidades de bytes. CÓDIGO DE CADEIAS Códigos: 0= ESTE 1= SUL 2= OESTE 3= NORTE LINHA COLUNA 1 1 1 3 6 6 8 8 1 4 6 4 1 6 6 8 1 1 1 1 1 2 2 2 1 1 1 1 1 2 2 2 1 1 1 2 2 2 2 2 1 1 1 2 2 2 2 2 1 1 1 2 2 2 2 2 2 2 2 2 2 3 3 2 2 2 2 2 2 3 3 2 2 2 2 2 2 2 2 2 ATRIBUTO CODIFICAÇÃO 1 1 2 2 2 3 2 2 CÓDIGO DE CADEIAS 15, 03, 35, 23 11, 01, 31, 21 15, 03, 35, 23 16, 02, 36, 22 13, 03, 33, 23 11, 01, 31, 21 10, 02, 30, 20 13, 00, 30, 20 O principio consiste em pixels adjacentes tendo o mesmo atributo, combinados em faixa, representada por um par de números. Cada linha inicia uma nova faixa EXEMPLO: Para a nossa matriz temos: 1 1 1 1 1 2 2 2 1 1 1 1 1 2 2 2 • • • • • • • • 1 1 1 2 2 2 2 2 1 1 1 2 2 2 2 2 1 1 1 2 2 2 2 2 2 2 2 2 2 3 3 2 2 2 2 2 2 3 3 2 2 2 2 2 2 2 2 2 LINHA 1: (5,1), (3,2); LINHA 2: (5,1), (3,2); LINHA 3: (3,1), (5,2); LINHA 4: (3,1), (5,2); LINHA 5: (3,1), (5,2); LINHA 6: (5,2), (2,3), (1,2); LINHA 7: (5,2), (2,3), (1,2); LINHA 8: (8,2). RLE (Run-Length Encoding) A codificação dos dados é a partir da linha 1 e coluna 1, continuamente, associando o atributo ao número de pixels. A cada mudança de atributo tem-se um determinado número de pixels. Exemplo: 5(1); 2(8); 1(13); 2(16); 1(21); 2(24); 1(26); 2(32); 1(35); 2(45); 3(47); 2(53); 3(55); 2(64). VPE (Value Point Encoding) 1 1 1 1 1 2 2 2 1 1 1 1 1 2 2 2 1 1 1 2 2 2 2 2 1 1 1 2 2 2 2 2 1 1 1 2 2 2 2 2 2 2 2 2 2 3 3 2 2 2 2 2 2 3 3 2 2 2 2 2 2 2 2 2 1 9 17 2 10 18 3 11 19 4 12 21 5 13 22 6 14 7 15 8 16 •• O modelofundamental de Blocosé aMáximos umaraster variante O princípio divisão do édado a partirdo dequadtree, múltiplos polígonos regulares. cujo objetivo é eliminar possíveis redundâncias. •• O compreende toda contém 3 categorias. Este A primeiro matrizquadrado é subdividida em a matriz, polígonos regulares, não é dividido em sucessivos quadrados, até a unidade fundamental (pixel). necessariamente quadrados, e cada polígono contém um único atributo. 1 1 1 1 1 2 2 2 1 1 1 1 1 2 2 2 1 1 1 2 2 2 2 2 1 1 1 2 2 2 2 2 1 1 1 2 2 2 2 2 2 2 2 2 2 3 3 2 2 2 2 2 2 3 3 2 2 2 2 2 2 2 2 2 DADO RASTER EM ESTRUTURA QUADTREE MÉTODOS DE COMPRESSÃO RLE e VPE VANTAGENS DESVANTAGENS São voltados para pequenos computadores. Estrutura simples. Menos eficiente quando o limite entre os polígonos aumenta. Aumenta os tamanhos dos arquivos e o tempo de processamento quando o número de polígonos aumenta. Presença de redundância; os limites dos polígonos são armazenados duas vezes. Superposições são difíceis sem que se retorne à grade originais. CÓDIGO DE CADEIAS Estrutura simples. Dados compactados. BLOCOS MÁXIMOS Eficiente para formas simples e grades. Limitado para ser usado em arquivos com muita variedade espacial. QUADTREE Estrutura elegante. Dados compactados. Rápido processamento. Dificuldade para criação e atualização de arquivos. Uso do modelo matricial Variáveis físicas: como precipitação (quantidade de chuva) ou elevação (valor da elevação); Regiões administrativas: códigos para distritos urbanos; Uso da terra: definidas a partir de um sistema de classificação; Distância de um dado objeto a um alvo: cada célula do modelo tem um valor que representa a distância do objeto em estudo. DADOS VETORIAIS Neste modelo as coordenadas são consideradas matematicamente exatas. • O que existe de mais importante no modelo vetorial é a entidade ponto. • Engloba todas as entidades geográficas e gráficas que são posicionadas por um simples par de coordenadas (x,y) 7 5 3 1 4 7 DADOS VETORIAIS É à representação gráfica do mundo real por meio de coordenadas x, y para definir as feições de dados discretos representados por pontos, linhas e polígonos Na representação vetorial, o mundo é dividido em elementos com sua própria geometria de pontos, linhas e áreas permitindo que todas as posições sejam definidas exatamente. ESTRUTURAS VETORIAIS As entidades poligonais podem ser estruturadas em diferentes formatos: • MODELO TOTAL • DUAL INDEPEDENT MAP ENCODING – DIME • MODELO RELACIONAL E DIGITAL LINE GRAFHS - DGL Os mais usuais são: • MODELO TOPOLÓGICO • MODELO ESPAGUETE • Fácil entendimento e boa adequação para representação de mapas. • Apresenta dados redundantes, uma vez que as linhas comuns a dois polígonos são armazenadas duas vezes e a relações espaciais não são arquivadas. 1. Arcos ausente de contiguidade 2. Poligono aberto (ausente de area) 3. Arcos sem conectividade (cruzamento) 4. Poligonos adjacentes com sobreposição (buracos) O SIG IDRISI utiliza este modelo para arquivar e representar os PIs ESTRUTURA ESPAGUETE (DESUSADO) É um conjunto de regras e comportamentos que estipulam É definido comolinhas a relação feições vizinhas ou como pontos, e espacial polígonosentre partilham geometrias adjacentes coincidentes. TOPOLOGIA Constitui a estrutura mais comum para os dados vetoriais Apresenta uma estrutura compacta. • Garante a integridade e qualidade dos dados As relações matemáticas entre os objetos são mantidas • Permite a execução de algumas funções de análise espacial (por exemplo, a operação dissolução). TOPOLOGIA NO SIG TIPO MODELO TOTAL VANTAGENS DESVANTAGENS Estrutura compacta. Não há mecanismos explícitos para referenciar áreas adjacentes. As relações matemáticas entre objetos não são arquivadas. MODELO TOPOLÓGICO Estrutura compacta. As relações matemáticas entre objetos são arquivadas. Rápido processamento de dados. Estrutura complexas. Redundância de dados. MODELO ESPAGUETE Estrutura compacta e de fácil entendimento. Adequado para mapas. Lento processamento de dados. As relações espaciais não são arquivadas. As linhas comuns a dois polígonos são arquivadas duas vezes. As estruturas e os atributos são arquivados separadamente. Redundância de dados. Complexo gerenciamento de arquivos. São topologicamente estruturados. Custo baixo. Estrutura complexas. DIME DLG Vetorial x Raster Algum tempo atrás estes Os dois modelos eram são modelos passíveis de conversão incompatíveis. entre si. Os sistemas comerciais de A conversão do sentido SIG preferem implementar vetorial matricial é o modelo para vetorial. mais fácil A Sistemas atuais manipulam conversão no sentido ambos os para modelos de é matricial vetorial dados. complexa RASTER x VETORIAL Aspecto Matricial Vetorial Transformação de coordenadas Complexo Simples Estrutura de dados Simples Complexa Captação de dado Rápido Lento Área de armazenamento Grande Pequena Gráficos Médio Bom Precisão geométrica Baixa Alta Análise de rede Pobre Bom Análise de área Bom Médio Generalização Simples Complexa Geração de desenho Rápido Lento Modelagem Simples Complexo Operação pontual Simples Complexo VANTAGENS MODELO RASTER MODELO VETORIAL • Os dados possuem uma estrutura simples; • • • Operações de superposição são facilmente implementadas; • Altas variabilidades espaciais são eficientemente representadas; • Permite operações matemáticas com precisão; • Operações de modelagem e simulação são facilitadas; Possui uma estrutura de dados compacta; Permite uma codificação da topologia de forma eficaz, como resultado das análises de rede são facilmente implementadas; • É recomendado para gráficos que devam se aproximar dos desenhos feitos à mão; DESVANTAGENS MODELO RASTER MODELO VETORIAL • A estrutura dos dados toma muito espaço de memória; • • As relações topológicas são difíceis de serem representadas; • • • O produto final pode não ser esteticamente agradável; A estruturação dos dados é complexa; Operações de superposição são difíceis de serem implementadas; A representação de alta variabilidade espacial não é eficaz; GEOPROCESSAMENTO DAS ESTRUTURAS DE DADOS Tipos de Dados em Geoprocessamento IMAGENS Obtidas por: Satélites, Fotografias aéreas Scanners aerotransportados São armazenadas como matrizes e representam formas de captura da informação espacial. Cada elemento de imagem, denominado pixel, tem um valor proporcional à energia eletromagnética refletida ou emitida pela área da superfície terrestre correspondente. Tipos de Dados em Geoprocessamento MAPAS TEMÁTICOS Descrevem de forma qualitativa, a distribuição espacial de uma grandeza geográfica. . Mapa de reconhecimento dos solos da região de Inhamuns, Salgado (Assad & Sano, 1998) Tipos de Dados em Geoprocessamento MAPAS CADASTRAIS cada elemento é considerado como um objeto geográfico possui atributos e pode estar associado a várias representações gráficas. LIMITES CENSITÁRIOS DO DISTRITO DE ARACÊ, DOMINGOS MARTINS, ES Tipos de Dados em Geoprocessamento ESTADO DO ESPÍRITO SANTO 370000 Altitude 190000 7990000 7990000 370000 Atividade agrícola BAHIA 2862.5 m 280000 BAHIA 7990000 280000 7990000 190000 Apta Inapropriada MAPAS POLITEMÁTICOS 280000 0 7900000 7810000 50 RIO DE JANEIRO 190000 25 µ 0 7720000 OCEANO ATLÂNTICO 7900000 7810000 7720000 7900000 50 Km Sistema de Coordenadas DATUM SIRGAS 2000 - ZONA 24S 370000 MINAS GERAIS 50 Km Sistema de Coordenadas DATUM SIRGAS 2000 - ZONA 24S 280000 370000 7630000 190000 µ 7630000 RIO DE JANEIRO 25 7630000 7630000 50 7810000 Quando as informações, qualitativa e quantitativa estão presentes em um mesmo mapa 7720000 7810000 7720000 MINAS GERAIS OCEANO ATLÂNTICO 7900000 -3.69 m Tipos de Dados em Geoprocessamento REDES armazenam os elementos geográficos em modelo vetorial com topologia de rede (arco-nó), Os arcos armazenam atributos sobre o sentido dos fluxos e os nós sobre a capacidade Malha rodoviária do Estado do Paraná Tipos de Dados em Geoprocessamento MAPAS NUMÉRICOS DE TERRENO: O termo é utilizado para denotar a representação quantitativa de uma grandeza que varia continuamente no espaço. Resolução Espacial Resolução Espacial Célula pequena Célula grande Maior resolução Menor resolução Maior precisão da feição espacial Menor precisão na localização da feição espacial Apresentação mais rápida Processamento mais rápido Arquivo de armazenagem menor Apresentação mais lenta Processamento mais lento Arquivo de armazenagem maior SPOT 5 Colorida – resol. 10 m Pancrom. – resol. 2,5 m Qualidade de Dados e Erros 1. Época que os dados foram coletados. 2. Fonte dos dados 3. Formato original dos dados 4. Área coberta dos dados. 5. Escala dos mapas 6. Sistema de coordenadas (projeção, datum) 7. Densidade de observações do dado 8. Acurácia das feições (posição e atributos) 9. Consistência logica dos atributos 10. Como os dados foram testados? Qualidade de Dados e Erros Exatidão Valor verdadeiro Precisão Elementos e sub-elementos de qualidade de dados geográficos Acurácia posicional ou Geométrica o Qualidade externa ou absoluta – Proximidade dos valores em função dos dados ditos “reais”. o Qualidade relativa ou interna - Proximidade das posições relativas com respectivas posições aceitas como reais. o Qualidade da posição da grade de coordenadas – Proximidade da grade de coordenadas com a localização real. Metadados o Linhagem – Parâmetros e dados que construíram o conjunto de dados. Coeficientes de Concordância para a avaliação da acurácia total. Coeficientes de Concordância para avaliação da acurácia para classes individuais Elementos e sub-elementos de qualidade de dados geográficos Consistência Lógica o Consistência de formato – Nível de armazenamento em acordo com a estrutura física do conjunto de dados. o Consistência topológica - Características topológicas dos dados. o Consistência de domínio – Conformidade com os valores de domínio dos dados. Acurácia temporal o Exatidão das medidas do tempo – Correção na medida temporal. o Consistência temporal – Correção de eventos ordenados ou em sequencia, caso registrada. o Validade temporal – Validade dos dados em relação ao tempo (atualização). Elementos e sub-elementos de qualidade de dados geográficos Qualidade temática o Correção da classificação – Comparação da classe associada á feições ou seus atributos em relação a um conjunto de dados de controle. o Verificação dos atributos não qualitativos. o Exatidão dos atributos quantitativos. Completude o Comissão – Excesso de dados no conjunto, tanto para as feições como para seus atributos. o Omissão - Dados faltantes no conjunto. TABELA DE VALIDAÇÃO CRUZADA PARA CÁLCULO DE EC E EQ Mapa Real Variável (1) Mapa Interpretado Variável (1) Variável (2) Variável (3) Variável (4) Variável (2) Variável (3) Variável (4) TOTAL Erro de Comissão O menor ERRO DE OMISSÃO refere-se a VARIÁVEL(13- 9/13) 9 0 0 4 13 0,31 (0,11), ou seja, pixel encontrado no mapa real não Percebe-se quesomente o menor1 ERRO DE COMISSÃO (1 - 20/23) 4 20 0 2 26 0,13 correspondeu ao seu equivalente mapa refere-se a VARIAVEL 2 e 4, ouno seja, eminterpretado. cada 1 3 8 5 17 um deles, somente 1 pixel encontrado no mapa interpretado 0 0 não correspondeu 1 7 ao seu 8 (1 - 8/17) 0,53 (1 – 7/8) 0,13 equivalente no mapa real (no campo). TOTAL 14 23 9 18 64 - Erro de Omissão (1 - 9/14) 0,36 (1 - 20/23) 0,13 (1 - 8/9) 0,11 (1 - 7/18) 0,61 - (1 - 44/64) 0,31 Exemplo para verificar a completitude Aquantificação do erro operacional feita pelossegundo eixo das O RMS calculado pode ser écalculado ordenadas e abscissas onde o cálculo do RMS total será três perspectivas diferentes: representado graficamente como a hipotenusa de um triângulo • Escala do mapa; retângulo • Probabilidade de erro de um objetivo ser alcançado; • Produto final esperado. RMS (x): erro médio quadrático, eixo x Enquadramento Enquadramento original do mapa feito pela mesa N i 1 RMS(x) xi N 2 RMS (y): erro médio quadrático, eixo y N RMS(y) x1 i 1 y1 yi N 2 RMS (t): erro médio quadrático total RMS (t ) RMS( x) RMS( y) 2 2 ERRO MÉDIO QUADRÁTICO (ROOT MEAN SQUARE) RMS 1/50 polegadas para mapas com escalas 1:20.000 ou menores 1/60 polegadas para mapas com escalas maiores que 1:20.000. • A conversão para padrões de acurácia é feita baseada em estatística. • RMS permitido requer 90% de erros acidentais menores que 1,64% do RMS calculado. Ou seja, 1,64 desvios padrões assumindo uma distribuição normal dos erros. Se tivermos um mapa com escala de 1:15.000, o erro aceitável ou oSe RMS permitido serácom o erro aceitável multiplicado pela tivermos um mapa escala de 1:25.000: conversão da escala, multiplicado pela conversão da unidade, dividido por 1,64,ou seja: 11 pol **15 ..000 **00,,0254 m/pol pol 25 000 0254 m/pol 50 RMS 60 46,,64 m RMS permitido 45 m permitido 1,64 1,64