Anais XVI Simpósio Brasileiro de Sensoriamento Remoto - SBSR, Foz do Iguaçu, PR, Brasil, 13 a 18 de abril de 2013, INPE
Utilização de Support Vector Machine para classificação multiclasses de imagens
Landsat TM+
Gabriel Henrique de Almeida Pereira
Jorge Antonio Silva Centeno
Universidade de Federal do Paraná – UFPR
Centro Politécnico, Curitiba – PR, CEP 81531-970
[email protected]; [email protected]
Abstract. The classification of images uses digital spectral information represented by digital values of each
pixel, for example, at one or more spectral bands, classifying this pixel in a class, this can be considered spectral
pattern recognition. Classification algorithms have been developed since the first Landsat image, acquired in
1972. Among the most popular and widely used is the maximum likelihood classifier, or proven as an
alternative, the Artificial Neural Networks (ANN). Support Vector Machine (SVM) have also been proposed to
improve the classification, and one of the main differences between RNA and SVM is that, while for RNA there
can be many solutions, the SVM converges to a single optimal solution. SVM are binary classifiers that assign a
given sample to a class, of only two possible classes. However, remote sensing applications involves multiple
classes. There are some solutions to use SVM in the multiclass problem, and in this work, the methodology used
in this work was 'one against all' for the six classes classification Landsat TM+ image of Ilha do Mel and Pontal
do Paraná region’s, Paraná - Brazil. For evaluating the performance of the classification algorithm, the results
were analyzed based on the error matrix (or confusion matrix), giving a good results on the discrimination of
similar targets, like mangroves and other vegetation, and with a total classification accuracy of 99.6%.
Palavras-chave: spectral pattern recognition, optimal solution, 'one against all', confusion matrix,
reconhecimento de padrão espectral, solução ótima, 'um contra todos', matriz de confusão.
1. Introdução
Dados de sensoriamento remoto são usados em inúmeras aplicações, sendo que uma das
principais finalidades do sensoriamento remoto é deduzir informações da cobertura do solo.
Isto é feito analisando os dados armazenados na imagem, de maneira a associá-los com o
mundo real. Várias são as opções para executar esta tarefa e a escolha de cada uma delas
depende do trabalho a ser executado. Em alguns casos, a análise visual dos dados é a forma
mais recomendada, principalmente quando se trata de pequenas áreas. A análise visual
oferece a vantagem de integrar outros dados junto com a imagem, pois faz proveito do
conhecimento e experiência do intérprete, o que, às vezes, é difícil de atingir numa análise
automática, baseada em algoritmos numéricos. No entanto, o processamento digital oferece
algumas vantagens, como por exemplo, o fato de usar todas as bandas espectrais, algo que o
humano não consegue visualizar simultaneamente. O processamento digital também oferece a
vantagem de repetir processos com facilidade e por isso torna-se útil em trabalhos que
envolvem grandes áreas. Uma solução completamente automática ainda está longe, embora
alguns passos significativos venham sendo dados nesta direção, com a aplicação de
algoritmos de inteligência artificial no processamento de imagens. Porém, a solução ainda
mais apropriada consiste em combinar a análise visual com técnicas digitais, de maneira a
imprimir maior dinâmica ao processo de interpretação, sem perder a qualidade dos resultados.
Infelizmente, a classificação da imagem não é uma tarefa trivial. Como observado por
Chen e Ho (2008), classificação de dados de sensoriamento remoto é particularmente difícil
porque a maioria dos métodos de aprendizagem supervisionada requer uma quantidade
suficientemente grande de amostras de treinamento. No entanto, definição e aquisição de
2322
Anais XVI Simpósio Brasileiro de Sensoriamento Remoto - SBSR, Foz do Iguaçu, PR, Brasil, 13 a 18 de abril de 2013, INPE
dados de referência é muitas vezes um problema crítico. Várias técnicas de classificação,
tanto paramétricas como não paramétricas, foram desenvolvidas e utilizadas em diferentes
contextos, inclusive de sensoriamento remoto. (Mountrakis et al., 2011)
Produção de mapas temáticos sobre o uso e cobertura do solo utilizando sensoriamento
remoto é comumente realizada através de classificação digital de imagens (Chintan et al.,
2004 apud Petropoulos et al., 2012). Segundo Kavzoglu e Colkesen (2009), a classificação
pode ser definida como a atribuição de cada pixel na imagem original a uma classe,
dependendo dos valores de reflectância espectral dos objetos.
A classificação digital de imagens utiliza a informação espectral representada pelos
valores dos contadores digitais (de cada pixel, por exemplo), de uma ou mais bandas
espectrais, classificando-o em cada classe, sendo considerado assim um reconhecimento de
padrão espectral (Kavzoglu e Colkesen, 2009).
Classificadores supervisionados também são comumente divididos em paramétricos e não
paramétricos. Classificadores paramétricos (por exemplo, a máxima verossimilhança) exigem
conhecimento prévio/suposições sobre a distribuição estatística dos dados a serem
classificados, o que é muitas vezes difícil de atingir na prática. (Petropoulos et al., 2012)
Algoritmos de classificação têm sido desenvolvidos desde a primeira imagem Landsat,
adquirida em 1972 (Townshend, 1992; Hall et al, 1995; Lu e Weng, 2007 apud Kavzoglu e
Colkesen, 2009). Entre os mais populares e amplamente utilizados está o classificador de
máxima verossimilhança (Huang et al., 2002 apud Kavzoglu e Colkesen, 2009). Este
classificador é uma aproximação paramétrica que assume a assinatura de cada classe como
uma distribuição normal. Embora esta suposição seja geralmente válida é inválida quando se
trata de classes com várias subclasses ou com diferentes informações espectrais (Kavzoglu e
Reis, 2008 apud Kavzoglu e Colkesen, 2009).
Para superar esse problema, algumas técnicas não paramétricas de classificação, como as
Redes Neurais Artificiais (RNA) foram recentemente introduzidas. Support Vector Machine
(SVM) também foi proposto para melhoria na classificação. SVM é um método com
treinamento supervisionado, usado tanto em problemas de classificação como de regressão.
(Vapnik, 1995 apud Kavzoglu e Colkesen, 2009)
Conforme Burges (1998), Suport Vector Machines é uma ferramenta que fornece uma
nova abordagem para o problema de reconhecimento de padrões. SVM é um classificador
supervisionado que tem por objetivo encontrar um hiperplano que separa um conjunto de
dados em classes discretas, utilizando-se de processo iterativo e de exemplos de treinamento
para ajustar este hiperplano. Para isto, SVM encontra um hiperplano que otimiza a separação
das classes, também conhecido como hiperplano ótimo ou ideal, que maximiza a distância
entre as classes, sendo usado como fronteira de decisão. (Zhu e Blumberg, 2002 apud
Mountrakis et al., 2011; Kavzoglu e Colkesen, 2009; Petropoulos et al., 2012; Costa et al.,
2010; Andreola e Haertel, 2009)
Uma das principais diferenças entre o RNA e SVM é que, enquanto que para a RNA pode
haver muitas soluções, o SVM converge para uma única solução ótima. Esta é uma
"vantagem" prática do SVM, quando comparado com RNA. Ou seja, como afirmado em
Burges (1998), SVM difere radicalmente das abordagens comparáveis, como redes neurais,
pois sempre encontra um mínimo global, uma solução ótima.
Além disso, sendo não-paramétrico, SVM não assume uma distribuição estatística
conhecida a priori dos dados a serem classificados. Isto é particularmente útil, porque os
dados adquiridos a partir de imagens de sensores remotos geralmente têm distribuições
desconhecidas. Isto permite que o SVM supere técnicas com base na classificação de máxima
verossimilhança, pois a normalidade nem sempre dá uma suposição correta da distribuição
real dos pixels em cada classe. (Su et al., 2009 apud Mountrakis et al., 2011)
2323
Anais XVI Simpósio Brasileiro de Sensoriamento Remoto - SBSR, Foz do Iguaçu, PR, Brasil, 13 a 18 de abril de 2013, INPE
Entretanto, Mountrakis et al. (2011) alertam que, na sua forma mais simples, SVM é um
classificador binário que atribui uma dada amostra a uma classe, de apenas duas classes
possíveis. Porém, aplicações de sensoriamento remoto envolvem várias classes (Foody e
Mathur et al., 2004). Andreola e Haertel (2009) acrescentam que o classificador SVM só pode
ser utilizado na separação de um par de classes a cada vez. Entretanto, dados de
sensoriamento remoto de cenas naturais envolvem a presença de um número maior de classes.
Desta forma, a aplicação da técnica SVM na classificação de imagens de sensoriamento
remoto requer abordagens especiais.
Duas abordagens principais têm sido sugeridas para a aplicação de SVM na classificação
multiclasses. Em cada uma, a base tem sido a de reduzir o problema multiclasse a um
conjunto de problemas de binário, permitindo a utilização da abordagem básica do SVM
(Foody e Mathur et al., 2004)
Segundo Petropoulos et al. (2012), SVM pode ser estendido a mais do que duas classes,
dividindo o problema em uma série de separações binárias. Isto pode ser feito escolhendo-se
entre duas abordagens: ‘um contra todos’ e ‘um contra um’.
Diversos métodos são conhecidos para ajustar SVM em um cenário multiclasse,
incluindo: (a) a formação de um classificador para distinguir cada classe de todas as outras
classes, comumente chamado de "um contra todos", (b) a formação de um classificador para
distinguir entre cada par de classes, chamado de "um contra um".
Além disso, a fim de representar formas mais complexas do que hiperplanos lineares, o
classificador pode utilizar funções kernel. Funções kernel comumente usadas em SVM
incluem função de base polinomial, radial (RBF) e kernel sigmóide. (Petropoulos et al., 2012)
No entanto, a função de base radial (RBF) e polinomial são comumente utilizados na
literatura para a classificação de imagens de sensoriamento remoto. (Huang et al, 2002;.
Keerthi e Lin , 2003; Pal e Mather, 2005 apud Kavzoglu e Colkesen, 2009)
Pesquisas recentes indicaram o potencial considerável de SVM para a classificação
supervisionada de dados de sensoriamento remoto. Mountrakis et al. (2011) afirmam que,
mesmo o método SVM não sendo muito popular, nos últimos anos têm havido um aumento
significativo em estudos sobre SVM em problemas de sensoriamento remoto. Estudos
comparativos têm mostrado que a classificação por um SVM pode ser mais preciso do que
redes neurais e árvores de decisão, bem como classificadores probabilísticos convencionais,
tais como a classificação máxima verossimilhança (Foody e Mathur, 2004; Huang et al, 2002
apud Foody e Mathur et al., 2004 b). Recentemente, SVM foi usado com sucesso na área de
sensoriamento remoto (Huang et al, 2002; Dixon e Candade, 2008; Yao et al, 2008; Foody e
Mathur, 2008 apud Kavzoglu e Colkesen, 2009).
2. Metodologia de Trabalho
A imagem Landsat TM+ a ser classificada é apresentada na Figura 1. Esta imagem
corresponde à região da Ilha do Mel e Pontal do Paraná, Estado do Paraná – Brasil. A Figura
1a apresenta a composição das faixas correspondentes à região do espectro visível, e as
Figuras 1b, 1c, 1d, 1e, 1f, 1g, 1h, representam as imagens correspondentes à região do
espectro do azul, verde, vermelho, infravermelho próximo, infravermelho médio,
infravermelho termal e infravermelho distante, respectivamente.
2324
Anais XVI Simpósio Brasileiro de Sensoriamento Remoto - SBSR, Foz do Iguaçu, PR, Brasil, 13 a 18 de abril de 2013, INPE
a
a
e
b
c
f
g
h
Figura 1 – Imagem Landsat TM+ da região da Ilha do Mel – PR – BR.
Para a classificação, foram utilizadas apenas 6 das 7 bandas espectrais apresentadas na
Figura 1(b-h). A única banda espectral que não foi utilizada foi a banda do infravermelho
termal (banda 6 – Figura 1g), pois o sensor responsável por esta banda possui falha e os dados
apresentam muitos ruídos.
A formulação do SVM pode ser entendida em Foody e Mathur (2004); Kavzoglu e
Colkesen (2009); Alonso e Malpica (2008); Burges (1998). O método consiste, basicamente,
em se identificar a fronteira de decisão entre as classes em função dos dados de treinamento
apresentados. Esta fronteira pode ser dada por:
g(x) =wt x +b =0
(1)
onde wt é o vetor transposto de pesos e b é o termo independente.
Os dados de treinamento então devem satisfazer as seguintes condições:
wt x +b ≥1
wt x +b ≤-1
para yi = 1
para yi = -1
(2)
Podendo ser combinadas na seguinte inequação, para todos os dados de treinamento:
yi(wt x +b) –1 ≥ 0
Estas condições e equações podem ser exemplificadas como na Figura 2.
2325
(3)
Anais XVI Simpósio Brasileiro de Sensoriamento Remoto - SBSR, Foz do Iguaçu, PR, Brasil, 13 a 18 de abril de 2013, INPE
Figura 2 - Representação do plano e margens obtidas no treinamento do SVM. (Kavzoglu e
Colkesen, 2009)
Nesta análise, foi utilizada a função de kernel de base radial (RBF), por ser vastamente
referenciada em trabalhos de classificação de dados de sensoriamento remoto utilizando
SVM.
Por tratar de um problema multiclasses, uma vez que se pretende classificar a imagem em
6 classes diferentes, adotou-se a metodologia de classificação ‘um contra todos’. As classes
estipuladas de interesse são, nomeadamente: água, areia, mangue, restinga, urbana e
vegetação. Sendo assim, ao se utilizar esta metodologia de ‘um contra todos’, foram treinados
SVM especializados em cada classe, ou seja, um SVM que separa água das demais classes,
areia das demais classes e assim por diante. Ao final da classificação de cada SVM, os
resultados são agrupados e têm-se todas as classes classificadas.
Para a avaliação do desempenho do algoritmo de classificação, os resultados foram
analisados com base na matriz de erros (ou matriz de confusão). Neste processo, é realizada a
comparação entre a verdade terrestre (ou verdade de campo) e os resultados disponíveis na
imagem temática classificada. Para isto, novas áreas de verificação são escolhidas na imagem,
sendo que a verdadeira classificação destas áreas deve ser conhecida. A matriz de erros
contém, nas suas células, o total de pixels corretamente classificados, bem como os
erroneamente classificados dentro de uma classe diferente daquela esperada, que são os erros
de comissão e de omissão.
3. Resultados e Discussão
A imagem Landsat TM+ classificada através do Support Vector Machine é apresentada na
Figura 3. Como descrito anteriormente, as classes classificadas foram água, areia, mangue,
restinga, urbana e vegetação, e ainda, como existiram pixels que não foram classificados em
nenhuma das classes, estes foram atribuídos à legenda sem informação.
2326
Anais XVI Simpósio Brasileiro de Sensoriamento Remoto - SBSR, Foz do Iguaçu, PR, Brasil, 13 a 18 de abril de 2013, INPE
Figura 3 – Imagem Landsat TM+ da região da Ilha do Mel e Pontal do Paraná, PR- BR,
classificada com Support Vector Machine.
Para quantificar os erros e acertos, foi feita a Matriz de Confusão, apresentada na Tabela
1. Nesta matriz, as colunas representam os pixels classificados por um técnico, para
representar a verdade de campo, enquanto que as linhas representam os pixels classificados
pelo classificador SVM.
Tabela 1 – Matriz de Confusão da Classificação da Imagem Landsat TM+ com Support Vector
Machine.
Nesta matriz, é possível verificar que os maiores valores das linhas e colunas se
encontram na diagonal principal da matriz o que representa que a maioria dos pixels foram
corretamente classificados pelo técnico e pelo Support Vector Machine, enquanto que os
valores fora da diagonal principal representam os pixels erroneamente classificados. Como
exemplificação dos valores que se encontram fora da diagonal principal, percebe-se que o
maior valor é o valor de 327, o que representa que 327 pixels foram classificados pelo SVM
como área de mangue, mas foram caracterizados na verdade de campo como vegetação. Esta
confusão se deu principalmente pela resposta espectral do mangue se assemelhar com a classe
vegetação.
Com relação às porcentagens, a última linha e a última coluna da tabela representam a
porcentagem de acertos das classes, a diferença do valor para 100% representa erros de
inclusão e omissão, respectivamente. É possível perceber valores elevados de acertos, os
valores mais baixos estão justamente nas classes com poucas amostras para cruzamento das
informações, uma vez que poucos pixels erroneamente classificados podem trazer erros
representativos em pequenas amostras de referência. Entretanto, atenta-se para o acerto global
da classificação, com valor de 99,6%, o que demonstra que o classificador Support Vector
Machine é capaz de ótimos resultados na classificação de imagens Landsat TM+.
2327
Anais XVI Simpósio Brasileiro de Sensoriamento Remoto - SBSR, Foz do Iguaçu, PR, Brasil, 13 a 18 de abril de 2013, INPE
4. Conclusões
Neste trabalho foi apresentada a utilização de uma metodologia para a classificação
multiclasses de uso e cobertura do solo a partir de uma imagem Landsat TM+, com o
classificador binário Support Vector Machine (SVM). Os resultados obtidos demonstraram a
elevada capacidade deste classificador, mesmo na classificação multiclasses de imagens de
sensoriamento remoto. Além da discriminação de alvos com resposta espectral semelhante,
como mangue e vegetação em geral, um acerto global de 99,6% na classificação do SVM, em
relação a uma classificação considerada verdade de campo, demonstram que o classificador é
uma poderosa ferramenta de reconhecimento de padrões, com elevadas taxas de acertos. Os
bons resultados obtidos foram considerados estimulantes e servem de motivação para novos
estudos, como a classificação de imagens de alta resolução e dados laser scanner.
Referências Bibliográficas
ALONSO, M. C., MALPICA, J. A., Classification of Multispectral High-Resolution
Satellite Imagery Using LIDAR Elevation Data. Springer-Verlag Berlin Heidelberg, ISVC
2008, Part II, LNCS 5359, p. 85–94, 2008.
ANDREOLA, R., HAERTEL, V., Support Vector Machines na Classificação de Imagens
Hiperespectrais. In: Simpósio Brasileiro de Sensoriamento Remoto (SBSR), 14, 2009, Natal.
Anais... São José dos Campos: INPE, 2009. Artigos, p.6757-6764.
BURGES, C. J. C., A Tutorial on Support Vector Machines for Pattern Recognition. Data
Mining and Knowledge Discovery, 2, p. 121–167, 1998.
CHEN, C. H., HO, P. P., Statistical pattern recognition in remote sensing. Pattern
Recognition, 41, p. 2731 – 2741, 2008.
FOODY E MATHUR, G. M., MATHUR, A., A Relative Evaluation of Multiclass Image
Classification by Support Vector Machines. Transactions on Geoscience and Remote
Sensing, vol. 42, nº. 6, p. 1335-1343, 2004.
FOODY E MATHUR, G. M., MATHUR, A., Toward Intelligent Training of Supervised
Image Classifications: Directing Training Data Acquisition for SVM Classification. Remote
Sensing of Environment, 93, p. 107–117, 2004b.
KAVZOGLU, T., COLKESEN, I., A Kernel Functions Analysis for Support Vector
Machines for Land Cover Classification. International Journal of Applied Earth
Observation and Geoinformation, 11, p. 352–359, 2009.
MOUNTRAKIS, G., IM, J., OGOLE, C., Support vector machines in remote sensing - A
review. ISPRS Journal of Photogrammetry and Remote Sensing, 66, p. 247-259, 2011.
PETROPOULOS, G. P., ARVANITIS, K., SIGRIMIS, N., Hyperion Hyperspectral
Imagery Analysis Combined with Machine Learning Classifiers for Land Use/Cover
Mapping. Expert Systems with Applications, 39, p. 3800-3809, 2012.
2328
Download

Utilização de Support Vector Machine para classificação