CLASSIFICAÇÃO DE IMAGENS SIG Profa. Dra. Maria Isabel Castreghini de Freitas [email protected] Profa. Dra. Andréia Medinilha Pancher [email protected] O que é classificação? • É o processo de extração de informações em imagens para reconhecer padrões e objetos homogêneos que são utilizados para mapear áreas da superfície terrestre as quais correspondam aos temas de interesse. • Associa cada pixel da imagem a um “rótulo” descrevendo um objeto real. Dessa forma, obteremos um mapa temático, o qual mostrará a distribuição geográfica de um tema, por exemplo a vegetação e uso da terra. Classificação de Imagens Apesar da técnica de interpretação visual ser muito utilizada, há uma tendência de utilização da classificação computacional, devido a rapidez e facilidade em obter resultados (CROSTA, 1992). No processo de classificação de dados digitais, os elementos presentes na superfície terrestre são conhecidos por classes temáticas. Quando uma imagem é classificada, os pixels são rotulados de acordo com a ocupação do solo. Para o propósito, utilizam-se os classificadores. A rotulação dos valores dos níveis de cinza é efetuada utilizando-se algoritmos estatísticos (programas computacionais) de reconhecimento de padrões espectrais. A classificação subdivide-se em supervisionada e não-supervisionada, dependendo do algoritmo que será aplicado. Ambos os casos demandam duas fases: a do treinamento e a da classificação. (MOREIRA, 2003) Classificação de imagens Procedimentos prévios para a realização da classificação: Levantamento de campo, a fim de coletar amostras para o treinamento dos classificadores. Interpretação das imagens em tela do computador, selecionando-se uma parte da área de estudo, a fim de se conhecer as características físicas e antrópicas de uma área piloto, servindo de padrão de comparação (verdade terrestre) para a posterior classificação supervisionada dos alvos urbanos. Resultado da Classificação Digital • É apresentado por classes espectrais (áreas que possuem características espectrais semelhantes), uma vez que um alvo dificilmente é caracterizado por uma única assinatura espectral. • É constituído por um mapa de "pixels" classificados, representados por símbolos gráficos ou cores. • O processo de classificação digital transforma um grande número de níveis de cinza de cada banda espectral em um pequeno número de classes em uma única imagem. Técnicas de Classificação • classificações unidimensionais: técnicas aplicadas a um canal espectral (uma banda da imagem) • classificação multiespectral: o critério de decisão depende da distribuição de níveis digitais (ou níveis de cinza) em vários canais espectrais (várias bandas) • Regra Geral: “No geral, quanto maior o número de bandas espectrais, maior será a precisão da classificação” Classificadores • Classificadores "pixel a pixel”: usam de forma individual a informação espectral de cada pixel na busca por regiões homegêneas. • Ex: Máxima Verossimilhança (MAXVER), MAXVER – ICM, Distância Mínima (distância euclidiana) e Paralelepípedo. • Classificadores por regiões: utilizam a informação espectral de cada pixel e a relação espacial de vizinhança entre pixels (áreas homogêneas espectrais e espaciais da imagem) • O SPRING usa os classificadores: ISOSEG, Battacharya e ClaTex (não supervisionados) para classificar as regiões de uma imagem segmentada. Tipos de Classificação • SUPERVISIONADA (Pixel a Pixel) • • • • Paralelepípedo Distância Mínima MAXVER MAXVER-ICM (considera a vizinhança) • NÃO SUPERVISIONADA (por regiões) • ISOSEG • SUPERVISIONADA (por regiões) • Bhattacharya • ClaTex Classificação Supervisionada • Tipo de classificação que demanda o conhecimento prévio de alguns aspectos da área – verdade terrestre. • Tais áreas são padrão de comparação com as quais todos os pixels desconhecidos serão comparados e, posteriormente, classificados. • Nessa classificação, o treinamento diz respeito ao reconhecimento da assinatura espectral de cada uma das classes de uso do solo da área da imagem. • Para alguns classificadores (algoritmos), esse reconhecimento abrange a obtenção de parâmetros estatísticos (média, matriz de covariância, etc.) de cada classe presente na área. Para outros necessita-se somente do nível mínimo e máximo de níveis de cinza. (CROSTA, 1992) Treinamento • Área de treinamento: a área da imagem que o usuário identifica como representante de uma das classes em estudo. • Os limites da área de treinamento são traçados diretamente sobre a imagem, no monitor de vídeo do sistema de processamento de imagens. (Crosta, 1992) • Treinamento é o reconhecimento da assinatura espectral das classes. • Formas de treinamento: supervisionado e nãosupervisionado. • Área de treinamento = amostra homogênea da classe com toda a variabilidade dos níveis de cinza. • Recomenda-se que o usuário adquira mais de uma área de treinamento, utilizando o maior número de informações disponíveis, como trabalhos de campo, mapas, etc. • O número de "pixels" de treinamento de uma classe aumenta com a complexidade da área e do tema em estudo. Métodos de Classificação Supervisionada Limite de aceitação de uma classificação, no ponto onde as duas distribuições se cruzam. Desta forma, um "pixel" localizado na região sombreada, apesar de pertencer à classe 2, será classificado como classe 1, pelo limite de aceitação estabelecido. Fonte: Jensen, 1996 Métodos de Classificação Supervisionada: Paralelepípedo • Considera uma área, na forma de quadrado ou paralelepípedo, no espaço de atributos ao redor do conjunto de treinamento; • O algoritmo considera um intervalo de valores (nível de cinza) dentro de cada categoria na área de treinamento, definidos como valores mínimo e máximo para cada banda espectral. Métodos de Classificação Supervisionada: Distância Mínima • O classificador examina as “distâncias” entre um pixel e as médias das classes e atribui o pixel à classe que apresentar a menor distância; • Se a distância do pixel é maior do que a distância de qualquer categoria definida pelo analista, o pixel permanecerá como não classificado ou “desconhecido”. Métodos de Classificação Supervisionada: MAXVER • Considera a ponderação das distâncias entre médias dos níveis de cinza das classes, utilizando parâmetros estatísticos. • Utiliza estatísticas de treinamento para calcular a probabilidade de um pixel pertencer a uma determinada classe. • Examina a função de probabilidade de um pixel para cada classe e atribui o pixel à classe com a maior probabilidade. • Geralmente fornece classificações com as melhores precisões. • Para que a classificação por máxima verossimilhança seja precisa o suficiente, é necessário um número elevado de "pixels", para conjunto de treinamento. MAXVER • Este método parte do princípio que o usuário conhece bem a temática e a região da imagem a ser classificada para poder definir classes representativas. Fonte: CORREIA et al., 2004 Classificador MAXVER-ICM • Enquanto o classificador MAXVER associa classes considerando pontos individuais da imagem, o classificador MAXVER-ICM (Interated Conditional Modes) considera também a dependência espacial na classificação. • Em uma primeira fase, a imagem é classificada pelo algoritmo MAXVER atribuindo classes aos "pixels", considerando os valores de níveis digitais. • O algoritmo atribui classes a um determinado "pixel", considerando a vizinhança interativamente. Este processo é finalizado quando a % de mudança (porcentagem de "pixels" que são reclassificados) definida pelo usuário é satisfeita. • O SPRING fornece 5%, 1% e 0.5% para valores de porcentagem de mudanças. Um valor 5% significa que a reatribuição de classes aos "pixels" é interrompida quando até 5% do total de "pixels" da imagem foi alterado. Classificação Não-Supervisionada • Quando o usuário utiliza algoritmos para reconhecer as classes presentes na imagem, a classificação é dita nãosupervisionada. • Ao definir áreas para a classificação não-supervisionada, o usuário não deve se preocupar com a homogeneidade das classes. • As áreas escolhidas devem ser heterogêneas para assegurar que todas as possíveis classes e suas variabilidades sejam incluídas. • Os "pixels" dentro de uma área são submetidos a um algoritmo de agrupamento ("clustering") que determina o agrupamento do dado, numa feição espacial de dimensão igual ao número de bandas presentes. Este algoritmo assume que cada grupo ("cluster") representa a distribuição de probabilidade de uma classe. Classificação Supervisionada e não-Supervisionada Os dois tipos de classificação possuem regras de decisão para que o classificador associe certo pixel a certa classe ou regiões de similaridade de níveis de cinza. Essas regiões consideram as características espectrais do pixel (classificação pixel-a-pixel) ou do pixel e seus vizinhos (classificação por região). Se por um lado, na classificação pixel-a-pixel o pixel é considerado de forma isolada, na classificação por região considera-se tanto a informação espectral do pixel, como também a de seus vizinhos. Este último classificador procura simular o comportamento de um fotointérprete ao reconhecer áreas homogêneas dentro da imagem. O algoritmo mais utilizado é o de máxima verossimilhança (MAXVER) (MOREIRA, 2003) Segmentação da Imagem • É o processo de divisão de uma imagem em regiões uniformes - conjuntos de pixels contíguos - que devem corresponder às áreas de interesse. • A segmentação pode ser feita por: • crescimento de regiões, através de detecção de bordas: O crescimento de regiões utiliza medidas estatísticas de similaridade e agregação para realizar o agrupamento de dados. • por detecção de bacias: A classificação por detecção de bacias deve ser feita sobre uma imagem resultante da extração de bordas (filtro de Sobel) e pressupõe uma certa representação topográfica para a imagem. • A imagem rotulada resultante da segmentação deve ser classificada através de classificadores por regiões. Segmentação da Imagem A técnica da segmentação multi-resolução baseia-se na fusão de regiões que extrai objetos de contraste local, sendo que, no início, cada pixel é considerado como um único objeto de imagem e em cada iteração os objetos são unidos para formar objetos maiores de acordo com o critério de homogeneidade que descreve a semelhança entre objetos adjacentes. (Machado e Caetano, 2004) Segmentação da Imagem • A estratégia da segmentação seguida da classificação aproxima-se muito do procedimento de interpretação visual, pois primeiramente delimitamse unidades homogêneas da paisagem e depois atribuí-se um código. • Além disso, o mapa resultante não apresenta um aspecto salpicado como ocorre na classificação pixel-a-pixel, evitando-se operações de pósprocessamento ou generalização. (CAETANO, SOUZA e GONÇALVES, 2007). Segmentações sobrepostas à imagem Segmentador com parâmetros de similaridade = 8 e área = 20. Fonte: CORREIA et al., 2004 Segmentador com parâmetros de similaridade = 12 e área = 50. Classificadores Por Regiões • ISOSEG (automático) • É um algoritmo de agrupamento de dados nãosupervisionado, aplicado sobre o conjunto de regiões, que por sua vez são caracterizadas por seus atributos estatísticos de média, matriz de covariância, e a área. Fonte: CORREIA et al., 2004 Classificadores Por Regiões • K-médias • É um classificador não – supervisionado que utiliza uma abordagem de agrupamento. O espaço de atributos da imagem é partido em K grupos. A partir dessa situação inicial, cada pixel da imagem é alocado ao centro mais próximo segundo a distância euclidiana. Fonte: CORREIA et al., 2004 Classificadores Por Regiões Battacharya (requer treinamento) A medida da distância de Battacharya mede a separabilidade estatística entre um par de classes espectrais. Ou seja, mede a distância média entre as distribuições de probabilidades de classes espectrais. Fonte: CORREIA et al., 2004 Fonte: CORREIA et al., 2004 Classificadores por Regiões ClaTex (requer treinamento) É um algoritmo supervisionado que utiliza atributos texturais das regiões de uma imagem segmentada. A classificação é realizada pela técnica de agrupamento de regiões a partir de uma medida de similaridade entre elas. Classificadores por Regiões Orientada a Objetos Integra as informações de pixels vizinhos, deixando-se de analisar cada pixel isoladamente para trabalhar-se com regiões relativamente homogêneas, através da classificação orientada a segmentos. (Alves e Vergara, 2005) Considera a análise da relação de um objeto com seus objetos vizinhos. O objeto é o elemento da imagem constituído de relações espaciais, os quais podem ser agregados à objetos maiores, criando-se níveis de segmentação. A lógica de orientação a objeto considera as características semânticas dos objetos, que podem ser analisadas segundo seus aspectos geométricos (topologia, forma e posição) e temáticos (atributos não espaciais dos objetos). (ANTUNES e STURM, 2005) Classificadores por Regiões Orientada a Objetos Permite o conhecimento do analista e a utilização de parâmetros de cor, forma, textura e relações de vizinhança na classificação de imagens. Antes de realizar este tipo de classificação, é necessário realizar a segmentação das imagens, pois permite a delimitação dos objetos que serão classificados em seus níveis de detalhes, considerando-se tanto a dimensão espectral quanto a espacial. Para isto, o processo de segmentação deve ser moldado em função da resolução da imagem e da escala esperada para os objetos. (Pinho, Feitosa e Kux, 2005) Classificação MAXVER pixel a pixel X Orientada a Objetos A classificação MAXVER pixel-a-pixel detecta melhor as classes de vegetação e de água, porém há grande confusão entre as classes que apresentam comportamento espectral semelhantes: cobertura cerâmica X solo exposto; pavimentação X concreto/amianto escuro. Já na classificação orientada a objetos, esta confusão é minimizada devido à introdução de parâmetros espaciais (forma e topologia) e da utilização do dado auxiliar eixo das ruas durante os processos de segmentação e classificação. A classificação orientada também demonstra melhor identificação da classe sombra, permitindo uma definição visual dos objetos mais refinada. Entre os dois métodos, há maior preservação das formas dos alvos de interesse na classificação orientada a objetos, ao passo que o resultado da classificação MAXVER pixel-a-pixel denota uma aparência granulada. (CAETANO, SOUZA e GONÇALVES, 2007) Considerações Gerais • Estudos urbanos - as cidades apresentam uma variedade de cobertura num reduzido espaço, ocorrendo alterações significativas inter e intrapixel. Nessa área, há diversos alvos, como: concreto das construções, asfalto que recobre as ruas e avenidas, telhados de vários materiais, solo exposto, grama, árvores, dentre outros. Grande parte dessas superfícies é menor do que a resolução de um pixel de alguns sensores orbitais como: LANDSAT, TM, ETM, SPOT-PAN. (Freitas e Costa, 2003) • No meio urbano, a baixa resolução espectral, pode ser superada pelo maior aproveitamento da resolução espacial, considerando-se que os objetos existentes na cidade são mais distinguíveis pela resolução espacial. • Nessa realidade, novos métodos de classificação aparecem como alternativas aos métodos tradicionais. Os novos algoritmos de classificação se baseiam não somente na informação espectral de cada pixel, mas também na informação espacial que envolve a relação entre os pixels e seus vizinhos (contexto). (Souza et al., 2003) Referências Bibliográficas ANTUNES, A. F. B.; STURM, U. Segmentação orientada a objeto aplicado ao monitoramento de ocupações irregulares em áreas de preservação ambiental. In.: Simpósio Brasileiro de Sensoriamento Remoto, vol. 12, Anais. Goiânia, INPE, 15 a 21 abr., p. 2.019-2.026, 2005. CAETANO, M.; SANTOS, T.; GONÇALVES, L. Cartografia de ocupação do solo com imagens de satélite: estado da arte. Disponível em: www.igeo.pt/serviços/CDI/biblioteca/publicaçõesIGP_files/esig_2002/papers. Acessado em: 10 mar., 2007. CORREIA, V. R. de M. Uma aplicação dopSensoriamento Remoto para a investigação de endemias urbanas. Disponível em: www.scielo.br/img/revistas/csp/v23n5/04f1.gif. Acessado em: 04/05/2009. CROSTA, A. P. Processamento Digital de Imagens de Sensoriamento Remoto. Campinas: IG/UNICAMP, ISBN 85-853-690-27, 1992. FREITAS, R.N.; COSTA, S.M.F. da. A utilização de fotografias aéreas na avaliação das transformações sócio-espaciais ocorridas na zona sul da cidade de São José dos Campos/SP, de 1962-1997. In.: SIMPÓSIO BRASILEIRO DE SENSORIAMENTO REMOTO, n.11. 2003. Belo Horizonte. INPE. Anais. 05 a 10 de abril de 2003, p. 1811-1818. Referências Bibliográficas MACHADO, F.; CAETANO, M. Detecção de alterações de ocupação do solo com uma abordagem orientada por objetos. Disponível em: www.igeo.pt/IGEO/portugues/serviços/CDI/biblioteca/publicaçoesIGP_files/ ESIG_2004.pdf. Acessado em: 10 mar. 2007. MOREIRA, M.A. Fundamentos de Sensoriamento Remoto e Metodologias de Aplicação. 2ª ed. Viçosa, UFV, 2003 PINHO, C.M.D. de; FEITOSA, F. da F.; KUX, H. Classificação automática de cobertura do solo urbano em imagem IKONOS: comparação entre a abordagem pixel-a-pixel e orientada a objetos. In.: SIMPÓSIO BRASILEIRO DE SENSORIAMENTO REMOTO, n. 12. Goiânia. Anais. INPE, p. 4.217-4.224, 2005 SOUZA, I.M. e, et al. Mapeamento do uso do solo urbano através da classificação por regiões baseada em medidas texturais. In.: SIMPÓSIO BRASILEIRO DE SENSORIAMENTO REMOTO, n. 11. Belo Horizonte. Anais. INPE, p. 1967-1968, 2003.