Captura e Estruturas de Dados
Espaciais
Capítulo 6 – Parte 02
Antonio P. Drumond Neto
Doutorando PPGPV – UFES/CCA
Avaliador: Prof. Dr. Alexandre Rosa dos
Santos
Novembro 2013 – Alegre, ES
BANCO DE DADOS
Banco de dados do SIG é composto por:
• Dados Textuais
• Dados Numéricos
• Dados Vetoriais
A, B, C, D ...
1, 2, 3, 4 ...
• Dados matriciais
(raster)
ESTRUTURAS DE DADOS EM SIG
O SIG possui a capacidade de armazenar atributos descritivos e
formas geométricas dos diferentes tipos de dados geográficos.
(CAMARA, 2005)
ESTRUTURAS DE DADOS EM SIG
A estrutura dos dados são formas padrões para armazenar dados no
computador, sendo um intermediário entre o modelo da realidade e
um formato de arquivo
Dados espaciais - Dados relacionados a
superfícies contínuas, contendo três
coordenadas denominadas de amostra 3D
Dados geográficos - necessários para
definir onde as feições cartográficas
ocorrem;
Atributos - que registrem o que as feições
cartográficas representam.
Coordenadas X, Y e o atributo Z
PRINCIPAIS ESTRUTURAS DE DADOS NO SIG
Representação matricial: o espaço é
representado como uma matriz composta de
colunas e linhas.
Cada célula possui um número de linha, um
número de coluna e um valor correspondente ao
atributo estudado.
• Mundo Real
Representação vetorial: o fenômeno pode ser
abstraído em três elementos gráficos:
• ponto (dimensão zero),
• linha (uma dimensão), e
• área ou polígono (duas dimensões).
DADOS MATRICIAIS
É à representação gráfica do mundo real por meio de pixel (picture element) ou
células, com forma poligonal regular, geralmente quadradas, que são definidos pelas
suas posições em relação às colunas e linhas de uma malha.
Dependendo do que se quer
representar a célula poderá ter um
valor quantitativo ou qualitativo.

Cada célula armazena um valor de atributo de um determinado tema. Cria-se uma
cobertura (ou plano de informação) para cada tema (uso da terra, tipo de solo,
cobertura vegetal, tipos de rocha, entre outros).
TIPO DE ARQUIVOS RASTER
5
30
8
3
1
10
5
1
1
5
2,3
-3
5
5
4
9
-12,3
5
2,5
9
1,5 -3,4 3,8
5
a) Imagem codificada 2n
b) Imagem contínua
c) Imagem binária
d) Imagem ternária
ESTRUTURAS MATRICIAIS
São estruturados em modelos simples e compacta.
Principais Estruturas Raster:
•
CÓDIGO DE CADEIAS
•
RUN-LENGTH ENCODING (RLE)
•
VALUE POINT ENCODING (VPE)
•
MODELOS HIERÁRQUICOS, (QUADTREE e BLOCOS MÁXIMOS).
DADO MATRICIAL DE 3
DIFERENTES TIPOS DE SOLO
Exemplo
1
1
1
1
1
2
2
2
1
1
1
1
1
2
2
2
1
1
1
2
2
2
2
2
1
1
1
2
2
2
2
2
1
1
1
2
2
2
2
2
2
2
2
2
2
3
3
2
2
2
2
2
2
3
3
2
2
2
2
2
2
2
2
2
Códigos:
0= ESTE - 1= SUL - 2= OESTE - 3= NORTE
Categoria 1= 15, 03, 35, 23.
A partir linha 1 e coluna 1, no sentido
anti-horário, os dados são organizados
segundo determinada categoria.
1
1
1
1
1
2
2
2
1
1
1
1
1
2
2
2
1
1
1
2
2
2
2
2
1
1
1
2
2
2
2
2
1
1
1
2
2
2
2
2
2
2
2
2
2
3
3
2
2
2
2
2
2
3
3
2
2
2
2
2
2
2
2
2
A estruturação em código de cadeias reduziu o tamanho do arquivo
em 8 unidades de bytes.
CÓDIGO DE CADEIAS
Códigos:
0= ESTE
1= SUL
2= OESTE
3= NORTE
LINHA
COLUNA
1
1
1
3
6
6
8
8
1
4
6
4
1
6
6
8
1
1
1
1
1
2
2
2
1
1
1
1
1
2
2
2
1
1
1
2
2
2
2
2
1
1
1
2
2
2
2
2
1
1
1
2
2
2
2
2
2
2
2
2
2
3
3
2
2
2
2
2
2
3
3
2
2
2
2
2
2
2
2
2
ATRIBUTO CODIFICAÇÃO
1
1
2
2
2
3
2
2
CÓDIGO DE CADEIAS
15, 03, 35, 23
11, 01, 31, 21
15, 03, 35, 23
16, 02, 36, 22
13, 03, 33, 23
11, 01, 31, 21
10, 02, 30, 20
13, 00, 30, 20
O principio consiste em pixels adjacentes tendo o mesmo
atributo, combinados em faixa, representada por um par
de números. Cada linha inicia uma nova faixa
EXEMPLO: Para a nossa
matriz temos:
1
1
1
1
1
2
2
2
1
1
1
1
1
2
2
2
•
•
•
•
•
•
•
•
1
1
1
2
2
2
2
2
1
1
1
2
2
2
2
2
1
1
1
2
2
2
2
2
2
2
2
2
2
3
3
2
2
2
2
2
2
3
3
2
2
2
2
2
2
2
2
2
LINHA 1: (5,1), (3,2);
LINHA 2: (5,1), (3,2);
LINHA 3: (3,1), (5,2);
LINHA 4: (3,1), (5,2);
LINHA 5: (3,1), (5,2);
LINHA 6: (5,2), (2,3), (1,2);
LINHA 7: (5,2), (2,3), (1,2);
LINHA 8: (8,2).
RLE (Run-Length Encoding)
A codificação dos dados é a partir da linha 1 e coluna
1, continuamente, associando o atributo ao número de
pixels. A cada mudança de atributo tem-se um
determinado número de pixels.
Exemplo:
5(1); 2(8); 1(13); 2(16); 1(21);
2(24); 1(26); 2(32); 1(35); 2(45);
3(47); 2(53); 3(55); 2(64).
VPE (Value Point Encoding)
1
1
1
1
1
2
2
2
1
1
1
1
1
2
2
2
1
1
1
2
2
2
2
2
1
1
1
2
2
2
2
2
1
1
1
2
2
2
2
2
2
2
2
2
2
3
3
2
2
2
2
2
2
3
3
2
2
2
2
2
2
2
2
2
1
9
17
2
10
18
3
11
19
4
12
21
5
13
22
6
14
7
15
8
16
•• O
modelofundamental
de Blocosé aMáximos
umaraster
variante
O princípio
divisão do édado
a partirdo
dequadtree,
múltiplos
polígonos
regulares.
cujo objetivo
é eliminar possíveis redundâncias.
•• O
compreende toda
contém 3
categorias. Este
A primeiro
matrizquadrado
é subdividida
em a matriz,
polígonos
regulares,
não
é dividido em sucessivos quadrados, até a unidade fundamental (pixel).
necessariamente quadrados, e cada polígono contém um único
atributo.
1
1
1
1
1
2
2
2
1
1
1
1
1
2
2
2
1
1
1
2
2
2
2
2
1
1
1
2
2
2
2
2
1
1
1
2
2
2
2
2
2
2
2
2
2
3
3
2
2
2
2
2
2
3
3
2
2
2
2
2
2
2
2
2
DADO RASTER EM ESTRUTURA QUADTREE
MÉTODOS DE
COMPRESSÃO
RLE e VPE
VANTAGENS
DESVANTAGENS
São voltados para pequenos
computadores. Estrutura
simples.
Menos eficiente quando o limite
entre os polígonos aumenta.
Aumenta os tamanhos dos
arquivos e o tempo de
processamento quando o
número de polígonos aumenta.
Presença de redundância; os
limites dos polígonos são
armazenados duas vezes.
Superposições são difíceis sem
que se retorne à grade
originais.
CÓDIGO DE
CADEIAS
Estrutura simples. Dados
compactados.
BLOCOS
MÁXIMOS
Eficiente para formas simples
e grades.
Limitado para ser usado em
arquivos com muita variedade
espacial.
QUADTREE
Estrutura elegante. Dados
compactados. Rápido
processamento.
Dificuldade para criação e
atualização de arquivos.
Uso do modelo matricial

Variáveis físicas: como precipitação (quantidade de
chuva) ou elevação (valor da elevação);

Regiões administrativas: códigos para distritos urbanos;

Uso da terra: definidas a partir de um sistema de
classificação;

Distância de um dado objeto a um alvo: cada célula do
modelo tem um valor que representa a distância do
objeto em estudo.
DADOS VETORIAIS
Neste modelo as coordenadas
são consideradas
matematicamente exatas.
• O que existe de mais
importante
no
modelo
vetorial é a entidade ponto.
• Engloba todas as entidades
geográficas e gráficas que são
posicionadas por um simples
par de coordenadas (x,y)
7
5
3
1 4
7
DADOS VETORIAIS

É à representação gráfica do mundo real por meio de coordenadas x, y para
definir as feições de dados discretos representados por pontos, linhas e polígonos

Na representação vetorial, o mundo é dividido em elementos com sua própria
geometria de pontos, linhas e áreas permitindo que todas as posições sejam
definidas exatamente.
ESTRUTURAS VETORIAIS
As entidades poligonais podem ser estruturadas em
diferentes formatos:
• MODELO TOTAL
• DUAL INDEPEDENT MAP ENCODING – DIME
• MODELO RELACIONAL E DIGITAL LINE GRAFHS - DGL
Os mais usuais são:
• MODELO TOPOLÓGICO
• MODELO ESPAGUETE
• Fácil entendimento e boa adequação para representação de mapas.
• Apresenta dados redundantes, uma vez que as linhas comuns a dois
polígonos são armazenadas duas vezes e a relações espaciais não são
arquivadas.
1.
Arcos ausente de contiguidade
2.
Poligono aberto (ausente de area)
3.
Arcos sem conectividade (cruzamento)
4.
Poligonos adjacentes com sobreposição
(buracos)
O SIG IDRISI utiliza este modelo para
arquivar e representar os PIs
ESTRUTURA ESPAGUETE (DESUSADO)
É um conjunto de regras e comportamentos que estipulam
É
definido
comolinhas
a relação
feições vizinhas
ou
como
pontos,
e espacial
polígonosentre
partilham
geometrias
adjacentes
coincidentes.
TOPOLOGIA
Constitui a estrutura mais comum para
os dados vetoriais
Apresenta uma estrutura compacta.
• Garante a integridade e qualidade dos dados
As relações matemáticas entre os objetos são mantidas
•
Permite a execução de algumas funções de análise espacial (por exemplo, a
operação dissolução).
TOPOLOGIA NO SIG
TIPO
MODELO TOTAL
VANTAGENS
DESVANTAGENS
Estrutura compacta.
Não há mecanismos explícitos para
referenciar áreas adjacentes. As
relações matemáticas entre objetos
não são arquivadas.
MODELO
TOPOLÓGICO
Estrutura compacta. As relações
matemáticas entre objetos são
arquivadas. Rápido processamento
de dados.
Estrutura complexas. Redundância de
dados.
MODELO
ESPAGUETE
Estrutura compacta e de fácil
entendimento. Adequado para
mapas.
Lento processamento de dados. As
relações espaciais não são
arquivadas. As linhas comuns a dois
polígonos são arquivadas duas
vezes.
As estruturas e os atributos são
arquivados separadamente.
Redundância de dados. Complexo
gerenciamento de arquivos.
São topologicamente estruturados.
Custo baixo.
Estrutura complexas.
DIME
DLG
Vetorial x Raster

Algum tempo atrás estes
 Os
dois modelos eram
são
modelos
passíveis
de conversão
incompatíveis.
entre si.
 Os sistemas comerciais de

A
conversão do sentido
SIG preferem implementar
vetorial
matricial é
o modelo para
vetorial.
mais fácil
 A
Sistemas
atuais manipulam

conversão
no sentido
ambos os para
modelos
de é
matricial
vetorial
dados.
complexa
RASTER x VETORIAL
Aspecto
Matricial
Vetorial
Transformação de
coordenadas
Complexo
Simples
Estrutura de dados
Simples
Complexa
Captação de dado
Rápido
Lento
Área de
armazenamento
Grande
Pequena
Gráficos
Médio
Bom
Precisão geométrica
Baixa
Alta
Análise de rede
Pobre
Bom
Análise de área
Bom
Médio
Generalização
Simples
Complexa
Geração de desenho
Rápido
Lento
Modelagem
Simples
Complexo
Operação pontual
Simples
Complexo
VANTAGENS
MODELO RASTER
MODELO VETORIAL
•
Os dados possuem uma estrutura
simples;
•
•
•
Operações de superposição são
facilmente implementadas;
•
Altas variabilidades espaciais são
eficientemente representadas;
•
Permite operações matemáticas
com precisão;
•
Operações de modelagem e
simulação são facilitadas;
Possui uma estrutura de dados
compacta;
Permite uma codificação da
topologia de forma eficaz, como
resultado das análises de rede são
facilmente implementadas;
•
É recomendado para gráficos que
devam se aproximar dos desenhos
feitos à mão;
DESVANTAGENS
MODELO RASTER
MODELO VETORIAL
•
A estrutura dos dados toma muito
espaço de memória;
•
•
As relações topológicas são
difíceis de serem representadas;
•
•
•
O produto final pode não ser
esteticamente agradável;
A estruturação dos dados é
complexa;
Operações de superposição são
difíceis de serem implementadas;
A representação de alta
variabilidade espacial não é eficaz;
GEOPROCESSAMENTO DAS
ESTRUTURAS DE DADOS
Tipos de Dados em Geoprocessamento
IMAGENS
Obtidas por:

Satélites,

Fotografias aéreas

Scanners aerotransportados

São armazenadas como matrizes
e representam formas de captura
da informação espacial.
Cada elemento de imagem, denominado pixel, tem um valor
proporcional à energia eletromagnética refletida ou emitida pela
área da superfície terrestre correspondente.
Tipos de Dados em Geoprocessamento
MAPAS TEMÁTICOS

Descrevem
de
forma
qualitativa, a distribuição
espacial de uma grandeza
geográfica.
.
Mapa de reconhecimento dos solos da
região de Inhamuns, Salgado
(Assad & Sano, 1998)
Tipos de Dados em Geoprocessamento
MAPAS CADASTRAIS

cada elemento é considerado
como um objeto geográfico

possui atributos e pode estar
associado
a
várias
representações gráficas.
LIMITES CENSITÁRIOS DO
DISTRITO DE ARACÊ, DOMINGOS
MARTINS, ES
Tipos de Dados em Geoprocessamento
ESTADO DO ESPÍRITO SANTO
370000
Altitude
190000
7990000
7990000
370000
Atividade agrícola
BAHIA
2862.5 m
280000
BAHIA
7990000
280000
7990000
190000
Apta
Inapropriada
MAPAS
POLITEMÁTICOS
280000
0
7900000
7810000
50
RIO DE JANEIRO
190000
25
µ
0
7720000
OCEANO ATLÂNTICO
7900000
7810000
7720000
7900000
50 Km
Sistema de Coordenadas
DATUM SIRGAS 2000 - ZONA 24S
370000
MINAS GERAIS
50 Km
Sistema de Coordenadas
DATUM SIRGAS 2000 - ZONA 24S
280000
370000
7630000
190000
µ
7630000
RIO DE JANEIRO
25
7630000
7630000
50
7810000
Quando as informações, qualitativa
e quantitativa estão presentes em
um mesmo mapa
7720000
7810000

7720000
MINAS GERAIS
OCEANO ATLÂNTICO
7900000
-3.69 m
Tipos de Dados em Geoprocessamento
REDES
armazenam
os
elementos
geográficos em modelo vetorial
com topologia de rede (arco-nó),
Os arcos armazenam atributos
sobre o sentido dos fluxos e os
nós sobre a capacidade
Malha rodoviária do Estado do Paraná
Tipos de Dados em Geoprocessamento
MAPAS NUMÉRICOS DE TERRENO:
O termo é utilizado para denotar a representação
quantitativa de uma grandeza que varia
continuamente no espaço.
Resolução Espacial
Resolução Espacial
Célula pequena
Célula grande

Maior resolução

Menor resolução

Maior precisão da feição espacial

Menor precisão na localização da
feição espacial

Apresentação mais rápida

Processamento mais rápido

Arquivo de armazenagem menor

Apresentação mais lenta

Processamento mais lento

Arquivo de armazenagem maior
SPOT 5
Colorida – resol. 10 m
Pancrom. – resol. 2,5 m
Qualidade de Dados e Erros
1.
Época que os dados foram coletados.
2.
Fonte dos dados
3.
Formato original dos dados
4.
Área coberta dos dados.
5.
Escala dos mapas
6.
Sistema de coordenadas (projeção, datum)
7.
Densidade de observações do dado
8.
Acurácia das feições (posição e atributos)
9.
Consistência logica dos atributos
10.
Como os dados foram testados?
Qualidade de Dados e Erros
Exatidão
Valor verdadeiro
Precisão
Elementos e sub-elementos de
qualidade de dados geográficos
Acurácia posicional ou Geométrica
o
Qualidade externa ou absoluta – Proximidade dos valores em função
dos dados ditos “reais”.
o
Qualidade relativa ou interna - Proximidade das posições relativas
com respectivas posições aceitas como reais.
o
Qualidade da posição da grade de coordenadas – Proximidade da
grade de coordenadas com a localização real.
Metadados
o
Linhagem – Parâmetros e dados que construíram o conjunto de dados.
Coeficientes de Concordância para a
avaliação da acurácia total.
Coeficientes de Concordância para avaliação
da acurácia para classes individuais
Elementos e sub-elementos de
qualidade de dados geográficos
Consistência Lógica
o
Consistência de formato – Nível de armazenamento em acordo com a
estrutura física do conjunto de dados.
o
Consistência topológica - Características topológicas dos dados.
o
Consistência de domínio – Conformidade com os valores de domínio
dos dados.
Acurácia temporal
o
Exatidão das medidas do tempo – Correção na medida temporal.
o
Consistência temporal – Correção de eventos ordenados ou em
sequencia, caso registrada.
o
Validade temporal – Validade dos dados em relação ao tempo
(atualização).
Elementos e sub-elementos de
qualidade de dados geográficos
Qualidade temática
o
Correção da classificação – Comparação da classe associada á feições
ou seus atributos em relação a um conjunto de dados de controle.
o
Verificação dos atributos não qualitativos.
o
Exatidão dos atributos quantitativos.
Completude
o
Comissão – Excesso de dados no conjunto, tanto para as feições como
para seus atributos.
o
Omissão - Dados faltantes no conjunto.
TABELA DE VALIDAÇÃO CRUZADA PARA CÁLCULO DE EC E EQ
Mapa Real
Variável
(1)
Mapa Interpretado
Variável
(1)
Variável
(2)
Variável
(3)
Variável
(4)
Variável
(2)
Variável
(3)
Variável
(4)
TOTAL
Erro de
Comissão
O menor ERRO DE OMISSÃO refere-se a VARIÁVEL(13- 9/13)
9
0
0
4
13
0,31
(0,11), ou seja,
pixel encontrado
no mapa real não
Percebe-se
quesomente
o menor1 ERRO
DE COMISSÃO
(1 - 20/23)
4
20
0
2
26
0,13
correspondeu
ao seu equivalente
mapa
refere-se
a VARIAVEL
2 e 4, ouno
seja,
eminterpretado.
cada
1
3
8
5
17
um deles, somente 1 pixel encontrado no mapa
interpretado
0
0
não
correspondeu
1
7
ao
seu
8
(1 - 8/17)
0,53
(1 – 7/8)
0,13
equivalente no mapa real (no campo).
TOTAL
14
23
9
18
64
-
Erro de
Omissão
(1 - 9/14)
0,36
(1 - 20/23)
0,13
(1 - 8/9)
0,11
(1 - 7/18)
0,61
-
(1 - 44/64)
0,31
Exemplo para verificar a completitude
Aquantificação
do erro operacional
feita pelossegundo
eixo das
O RMS calculado
pode ser écalculado
ordenadas e abscissas onde o cálculo do RMS total será
três perspectivas diferentes:
representado graficamente como a hipotenusa de um triângulo
• Escala do mapa;
retângulo
• Probabilidade de erro de um objetivo ser alcançado;
• Produto final esperado.
RMS (x): erro médio quadrático, eixo x
Enquadramento
Enquadramento
original do mapa
feito pela mesa
N

i 1
RMS(x)
 xi
N
2
RMS (y): erro médio quadrático, eixo y
N

RMS(y)
 x1
i 1
 y1 
yi
N
2
RMS (t): erro médio quadrático total
RMS (t ) 
RMS( x)  RMS( y) 
2
2
ERRO MÉDIO QUADRÁTICO (ROOT MEAN SQUARE) RMS
1/50 polegadas para mapas com escalas 1:20.000 ou menores
1/60 polegadas para mapas com escalas maiores que 1:20.000.
•
A conversão para padrões de acurácia é feita baseada em
estatística.
• RMS permitido requer 90% de erros acidentais menores que
1,64% do RMS calculado. Ou seja, 1,64 desvios padrões
assumindo uma distribuição normal dos erros.
Se tivermos um mapa com escala de 1:15.000, o erro aceitável
ou oSe
RMS
permitido
serácom
o erro
aceitável
multiplicado pela
tivermos
um mapa
escala
de 1:25.000:
conversão da escala, multiplicado pela conversão da unidade,
dividido por 1,64,ou seja:
11
pol
**15
..000
**00,,0254
m/pol
pol
25
000
0254
m/pol
50
RMS
 60
 46,,64
m
RMS permitido
45
m
permitido
1,64
1,64
Download

2 3