Anais XVI Simpósio Brasileiro de Sensoriamento Remoto - SBSR, Foz do Iguaçu, PR, Brasil, 13 a 18 de abril de 2013, INPE Utilização de Support Vector Machine para classificação multiclasses de imagens Landsat TM+ Gabriel Henrique de Almeida Pereira Jorge Antonio Silva Centeno Universidade de Federal do Paraná – UFPR Centro Politécnico, Curitiba – PR, CEP 81531-970 [email protected]; [email protected] Abstract. The classification of images uses digital spectral information represented by digital values of each pixel, for example, at one or more spectral bands, classifying this pixel in a class, this can be considered spectral pattern recognition. Classification algorithms have been developed since the first Landsat image, acquired in 1972. Among the most popular and widely used is the maximum likelihood classifier, or proven as an alternative, the Artificial Neural Networks (ANN). Support Vector Machine (SVM) have also been proposed to improve the classification, and one of the main differences between RNA and SVM is that, while for RNA there can be many solutions, the SVM converges to a single optimal solution. SVM are binary classifiers that assign a given sample to a class, of only two possible classes. However, remote sensing applications involves multiple classes. There are some solutions to use SVM in the multiclass problem, and in this work, the methodology used in this work was 'one against all' for the six classes classification Landsat TM+ image of Ilha do Mel and Pontal do Paraná region’s, Paraná - Brazil. For evaluating the performance of the classification algorithm, the results were analyzed based on the error matrix (or confusion matrix), giving a good results on the discrimination of similar targets, like mangroves and other vegetation, and with a total classification accuracy of 99.6%. Palavras-chave: spectral pattern recognition, optimal solution, 'one against all', confusion matrix, reconhecimento de padrão espectral, solução ótima, 'um contra todos', matriz de confusão. 1. Introdução Dados de sensoriamento remoto são usados em inúmeras aplicações, sendo que uma das principais finalidades do sensoriamento remoto é deduzir informações da cobertura do solo. Isto é feito analisando os dados armazenados na imagem, de maneira a associá-los com o mundo real. Várias são as opções para executar esta tarefa e a escolha de cada uma delas depende do trabalho a ser executado. Em alguns casos, a análise visual dos dados é a forma mais recomendada, principalmente quando se trata de pequenas áreas. A análise visual oferece a vantagem de integrar outros dados junto com a imagem, pois faz proveito do conhecimento e experiência do intérprete, o que, às vezes, é difícil de atingir numa análise automática, baseada em algoritmos numéricos. No entanto, o processamento digital oferece algumas vantagens, como por exemplo, o fato de usar todas as bandas espectrais, algo que o humano não consegue visualizar simultaneamente. O processamento digital também oferece a vantagem de repetir processos com facilidade e por isso torna-se útil em trabalhos que envolvem grandes áreas. Uma solução completamente automática ainda está longe, embora alguns passos significativos venham sendo dados nesta direção, com a aplicação de algoritmos de inteligência artificial no processamento de imagens. Porém, a solução ainda mais apropriada consiste em combinar a análise visual com técnicas digitais, de maneira a imprimir maior dinâmica ao processo de interpretação, sem perder a qualidade dos resultados. Infelizmente, a classificação da imagem não é uma tarefa trivial. Como observado por Chen e Ho (2008), classificação de dados de sensoriamento remoto é particularmente difícil porque a maioria dos métodos de aprendizagem supervisionada requer uma quantidade suficientemente grande de amostras de treinamento. No entanto, definição e aquisição de 2322 Anais XVI Simpósio Brasileiro de Sensoriamento Remoto - SBSR, Foz do Iguaçu, PR, Brasil, 13 a 18 de abril de 2013, INPE dados de referência é muitas vezes um problema crítico. Várias técnicas de classificação, tanto paramétricas como não paramétricas, foram desenvolvidas e utilizadas em diferentes contextos, inclusive de sensoriamento remoto. (Mountrakis et al., 2011) Produção de mapas temáticos sobre o uso e cobertura do solo utilizando sensoriamento remoto é comumente realizada através de classificação digital de imagens (Chintan et al., 2004 apud Petropoulos et al., 2012). Segundo Kavzoglu e Colkesen (2009), a classificação pode ser definida como a atribuição de cada pixel na imagem original a uma classe, dependendo dos valores de reflectância espectral dos objetos. A classificação digital de imagens utiliza a informação espectral representada pelos valores dos contadores digitais (de cada pixel, por exemplo), de uma ou mais bandas espectrais, classificando-o em cada classe, sendo considerado assim um reconhecimento de padrão espectral (Kavzoglu e Colkesen, 2009). Classificadores supervisionados também são comumente divididos em paramétricos e não paramétricos. Classificadores paramétricos (por exemplo, a máxima verossimilhança) exigem conhecimento prévio/suposições sobre a distribuição estatística dos dados a serem classificados, o que é muitas vezes difícil de atingir na prática. (Petropoulos et al., 2012) Algoritmos de classificação têm sido desenvolvidos desde a primeira imagem Landsat, adquirida em 1972 (Townshend, 1992; Hall et al, 1995; Lu e Weng, 2007 apud Kavzoglu e Colkesen, 2009). Entre os mais populares e amplamente utilizados está o classificador de máxima verossimilhança (Huang et al., 2002 apud Kavzoglu e Colkesen, 2009). Este classificador é uma aproximação paramétrica que assume a assinatura de cada classe como uma distribuição normal. Embora esta suposição seja geralmente válida é inválida quando se trata de classes com várias subclasses ou com diferentes informações espectrais (Kavzoglu e Reis, 2008 apud Kavzoglu e Colkesen, 2009). Para superar esse problema, algumas técnicas não paramétricas de classificação, como as Redes Neurais Artificiais (RNA) foram recentemente introduzidas. Support Vector Machine (SVM) também foi proposto para melhoria na classificação. SVM é um método com treinamento supervisionado, usado tanto em problemas de classificação como de regressão. (Vapnik, 1995 apud Kavzoglu e Colkesen, 2009) Conforme Burges (1998), Suport Vector Machines é uma ferramenta que fornece uma nova abordagem para o problema de reconhecimento de padrões. SVM é um classificador supervisionado que tem por objetivo encontrar um hiperplano que separa um conjunto de dados em classes discretas, utilizando-se de processo iterativo e de exemplos de treinamento para ajustar este hiperplano. Para isto, SVM encontra um hiperplano que otimiza a separação das classes, também conhecido como hiperplano ótimo ou ideal, que maximiza a distância entre as classes, sendo usado como fronteira de decisão. (Zhu e Blumberg, 2002 apud Mountrakis et al., 2011; Kavzoglu e Colkesen, 2009; Petropoulos et al., 2012; Costa et al., 2010; Andreola e Haertel, 2009) Uma das principais diferenças entre o RNA e SVM é que, enquanto que para a RNA pode haver muitas soluções, o SVM converge para uma única solução ótima. Esta é uma "vantagem" prática do SVM, quando comparado com RNA. Ou seja, como afirmado em Burges (1998), SVM difere radicalmente das abordagens comparáveis, como redes neurais, pois sempre encontra um mínimo global, uma solução ótima. Além disso, sendo não-paramétrico, SVM não assume uma distribuição estatística conhecida a priori dos dados a serem classificados. Isto é particularmente útil, porque os dados adquiridos a partir de imagens de sensores remotos geralmente têm distribuições desconhecidas. Isto permite que o SVM supere técnicas com base na classificação de máxima verossimilhança, pois a normalidade nem sempre dá uma suposição correta da distribuição real dos pixels em cada classe. (Su et al., 2009 apud Mountrakis et al., 2011) 2323 Anais XVI Simpósio Brasileiro de Sensoriamento Remoto - SBSR, Foz do Iguaçu, PR, Brasil, 13 a 18 de abril de 2013, INPE Entretanto, Mountrakis et al. (2011) alertam que, na sua forma mais simples, SVM é um classificador binário que atribui uma dada amostra a uma classe, de apenas duas classes possíveis. Porém, aplicações de sensoriamento remoto envolvem várias classes (Foody e Mathur et al., 2004). Andreola e Haertel (2009) acrescentam que o classificador SVM só pode ser utilizado na separação de um par de classes a cada vez. Entretanto, dados de sensoriamento remoto de cenas naturais envolvem a presença de um número maior de classes. Desta forma, a aplicação da técnica SVM na classificação de imagens de sensoriamento remoto requer abordagens especiais. Duas abordagens principais têm sido sugeridas para a aplicação de SVM na classificação multiclasses. Em cada uma, a base tem sido a de reduzir o problema multiclasse a um conjunto de problemas de binário, permitindo a utilização da abordagem básica do SVM (Foody e Mathur et al., 2004) Segundo Petropoulos et al. (2012), SVM pode ser estendido a mais do que duas classes, dividindo o problema em uma série de separações binárias. Isto pode ser feito escolhendo-se entre duas abordagens: ‘um contra todos’ e ‘um contra um’. Diversos métodos são conhecidos para ajustar SVM em um cenário multiclasse, incluindo: (a) a formação de um classificador para distinguir cada classe de todas as outras classes, comumente chamado de "um contra todos", (b) a formação de um classificador para distinguir entre cada par de classes, chamado de "um contra um". Além disso, a fim de representar formas mais complexas do que hiperplanos lineares, o classificador pode utilizar funções kernel. Funções kernel comumente usadas em SVM incluem função de base polinomial, radial (RBF) e kernel sigmóide. (Petropoulos et al., 2012) No entanto, a função de base radial (RBF) e polinomial são comumente utilizados na literatura para a classificação de imagens de sensoriamento remoto. (Huang et al, 2002;. Keerthi e Lin , 2003; Pal e Mather, 2005 apud Kavzoglu e Colkesen, 2009) Pesquisas recentes indicaram o potencial considerável de SVM para a classificação supervisionada de dados de sensoriamento remoto. Mountrakis et al. (2011) afirmam que, mesmo o método SVM não sendo muito popular, nos últimos anos têm havido um aumento significativo em estudos sobre SVM em problemas de sensoriamento remoto. Estudos comparativos têm mostrado que a classificação por um SVM pode ser mais preciso do que redes neurais e árvores de decisão, bem como classificadores probabilísticos convencionais, tais como a classificação máxima verossimilhança (Foody e Mathur, 2004; Huang et al, 2002 apud Foody e Mathur et al., 2004 b). Recentemente, SVM foi usado com sucesso na área de sensoriamento remoto (Huang et al, 2002; Dixon e Candade, 2008; Yao et al, 2008; Foody e Mathur, 2008 apud Kavzoglu e Colkesen, 2009). 2. Metodologia de Trabalho A imagem Landsat TM+ a ser classificada é apresentada na Figura 1. Esta imagem corresponde à região da Ilha do Mel e Pontal do Paraná, Estado do Paraná – Brasil. A Figura 1a apresenta a composição das faixas correspondentes à região do espectro visível, e as Figuras 1b, 1c, 1d, 1e, 1f, 1g, 1h, representam as imagens correspondentes à região do espectro do azul, verde, vermelho, infravermelho próximo, infravermelho médio, infravermelho termal e infravermelho distante, respectivamente. 2324 Anais XVI Simpósio Brasileiro de Sensoriamento Remoto - SBSR, Foz do Iguaçu, PR, Brasil, 13 a 18 de abril de 2013, INPE a a e b c f g h Figura 1 – Imagem Landsat TM+ da região da Ilha do Mel – PR – BR. Para a classificação, foram utilizadas apenas 6 das 7 bandas espectrais apresentadas na Figura 1(b-h). A única banda espectral que não foi utilizada foi a banda do infravermelho termal (banda 6 – Figura 1g), pois o sensor responsável por esta banda possui falha e os dados apresentam muitos ruídos. A formulação do SVM pode ser entendida em Foody e Mathur (2004); Kavzoglu e Colkesen (2009); Alonso e Malpica (2008); Burges (1998). O método consiste, basicamente, em se identificar a fronteira de decisão entre as classes em função dos dados de treinamento apresentados. Esta fronteira pode ser dada por: g(x) =wt x +b =0 (1) onde wt é o vetor transposto de pesos e b é o termo independente. Os dados de treinamento então devem satisfazer as seguintes condições: wt x +b ≥1 wt x +b ≤-1 para yi = 1 para yi = -1 (2) Podendo ser combinadas na seguinte inequação, para todos os dados de treinamento: yi(wt x +b) –1 ≥ 0 Estas condições e equações podem ser exemplificadas como na Figura 2. 2325 (3) Anais XVI Simpósio Brasileiro de Sensoriamento Remoto - SBSR, Foz do Iguaçu, PR, Brasil, 13 a 18 de abril de 2013, INPE Figura 2 - Representação do plano e margens obtidas no treinamento do SVM. (Kavzoglu e Colkesen, 2009) Nesta análise, foi utilizada a função de kernel de base radial (RBF), por ser vastamente referenciada em trabalhos de classificação de dados de sensoriamento remoto utilizando SVM. Por tratar de um problema multiclasses, uma vez que se pretende classificar a imagem em 6 classes diferentes, adotou-se a metodologia de classificação ‘um contra todos’. As classes estipuladas de interesse são, nomeadamente: água, areia, mangue, restinga, urbana e vegetação. Sendo assim, ao se utilizar esta metodologia de ‘um contra todos’, foram treinados SVM especializados em cada classe, ou seja, um SVM que separa água das demais classes, areia das demais classes e assim por diante. Ao final da classificação de cada SVM, os resultados são agrupados e têm-se todas as classes classificadas. Para a avaliação do desempenho do algoritmo de classificação, os resultados foram analisados com base na matriz de erros (ou matriz de confusão). Neste processo, é realizada a comparação entre a verdade terrestre (ou verdade de campo) e os resultados disponíveis na imagem temática classificada. Para isto, novas áreas de verificação são escolhidas na imagem, sendo que a verdadeira classificação destas áreas deve ser conhecida. A matriz de erros contém, nas suas células, o total de pixels corretamente classificados, bem como os erroneamente classificados dentro de uma classe diferente daquela esperada, que são os erros de comissão e de omissão. 3. Resultados e Discussão A imagem Landsat TM+ classificada através do Support Vector Machine é apresentada na Figura 3. Como descrito anteriormente, as classes classificadas foram água, areia, mangue, restinga, urbana e vegetação, e ainda, como existiram pixels que não foram classificados em nenhuma das classes, estes foram atribuídos à legenda sem informação. 2326 Anais XVI Simpósio Brasileiro de Sensoriamento Remoto - SBSR, Foz do Iguaçu, PR, Brasil, 13 a 18 de abril de 2013, INPE Figura 3 – Imagem Landsat TM+ da região da Ilha do Mel e Pontal do Paraná, PR- BR, classificada com Support Vector Machine. Para quantificar os erros e acertos, foi feita a Matriz de Confusão, apresentada na Tabela 1. Nesta matriz, as colunas representam os pixels classificados por um técnico, para representar a verdade de campo, enquanto que as linhas representam os pixels classificados pelo classificador SVM. Tabela 1 – Matriz de Confusão da Classificação da Imagem Landsat TM+ com Support Vector Machine. Nesta matriz, é possível verificar que os maiores valores das linhas e colunas se encontram na diagonal principal da matriz o que representa que a maioria dos pixels foram corretamente classificados pelo técnico e pelo Support Vector Machine, enquanto que os valores fora da diagonal principal representam os pixels erroneamente classificados. Como exemplificação dos valores que se encontram fora da diagonal principal, percebe-se que o maior valor é o valor de 327, o que representa que 327 pixels foram classificados pelo SVM como área de mangue, mas foram caracterizados na verdade de campo como vegetação. Esta confusão se deu principalmente pela resposta espectral do mangue se assemelhar com a classe vegetação. Com relação às porcentagens, a última linha e a última coluna da tabela representam a porcentagem de acertos das classes, a diferença do valor para 100% representa erros de inclusão e omissão, respectivamente. É possível perceber valores elevados de acertos, os valores mais baixos estão justamente nas classes com poucas amostras para cruzamento das informações, uma vez que poucos pixels erroneamente classificados podem trazer erros representativos em pequenas amostras de referência. Entretanto, atenta-se para o acerto global da classificação, com valor de 99,6%, o que demonstra que o classificador Support Vector Machine é capaz de ótimos resultados na classificação de imagens Landsat TM+. 2327 Anais XVI Simpósio Brasileiro de Sensoriamento Remoto - SBSR, Foz do Iguaçu, PR, Brasil, 13 a 18 de abril de 2013, INPE 4. Conclusões Neste trabalho foi apresentada a utilização de uma metodologia para a classificação multiclasses de uso e cobertura do solo a partir de uma imagem Landsat TM+, com o classificador binário Support Vector Machine (SVM). Os resultados obtidos demonstraram a elevada capacidade deste classificador, mesmo na classificação multiclasses de imagens de sensoriamento remoto. Além da discriminação de alvos com resposta espectral semelhante, como mangue e vegetação em geral, um acerto global de 99,6% na classificação do SVM, em relação a uma classificação considerada verdade de campo, demonstram que o classificador é uma poderosa ferramenta de reconhecimento de padrões, com elevadas taxas de acertos. Os bons resultados obtidos foram considerados estimulantes e servem de motivação para novos estudos, como a classificação de imagens de alta resolução e dados laser scanner. Referências Bibliográficas ALONSO, M. C., MALPICA, J. A., Classification of Multispectral High-Resolution Satellite Imagery Using LIDAR Elevation Data. Springer-Verlag Berlin Heidelberg, ISVC 2008, Part II, LNCS 5359, p. 85–94, 2008. ANDREOLA, R., HAERTEL, V., Support Vector Machines na Classificação de Imagens Hiperespectrais. In: Simpósio Brasileiro de Sensoriamento Remoto (SBSR), 14, 2009, Natal. Anais... São José dos Campos: INPE, 2009. Artigos, p.6757-6764. BURGES, C. J. C., A Tutorial on Support Vector Machines for Pattern Recognition. Data Mining and Knowledge Discovery, 2, p. 121–167, 1998. CHEN, C. H., HO, P. P., Statistical pattern recognition in remote sensing. Pattern Recognition, 41, p. 2731 – 2741, 2008. FOODY E MATHUR, G. M., MATHUR, A., A Relative Evaluation of Multiclass Image Classification by Support Vector Machines. Transactions on Geoscience and Remote Sensing, vol. 42, nº. 6, p. 1335-1343, 2004. FOODY E MATHUR, G. M., MATHUR, A., Toward Intelligent Training of Supervised Image Classifications: Directing Training Data Acquisition for SVM Classification. Remote Sensing of Environment, 93, p. 107–117, 2004b. KAVZOGLU, T., COLKESEN, I., A Kernel Functions Analysis for Support Vector Machines for Land Cover Classification. International Journal of Applied Earth Observation and Geoinformation, 11, p. 352–359, 2009. MOUNTRAKIS, G., IM, J., OGOLE, C., Support vector machines in remote sensing - A review. ISPRS Journal of Photogrammetry and Remote Sensing, 66, p. 247-259, 2011. PETROPOULOS, G. P., ARVANITIS, K., SIGRIMIS, N., Hyperion Hyperspectral Imagery Analysis Combined with Machine Learning Classifiers for Land Use/Cover Mapping. Expert Systems with Applications, 39, p. 3800-3809, 2012. 2328