avaliaÇÃo do uso de informaÇÃo de textura dos dados laser...
TRANSCRIPT
IV Simpósio Brasileiro de Geomática – SBG2017
II Jornadas Lusófonas - Ciências e Tecnologias de Informação Geográfica - CTIG2017
Presidente Prudente - SP, 24-26 de julho de 2017
p. 226-231
T. S. G. Mendes; A. N. Hernandes; A. P. Dal Poz ISSN 1981-6251
AVALIAÇÃO DO USO DE INFORMAÇÃO DE TEXTURA DOS DADOS
LASER NA CLASSIFICAÇÃO DE SUPERFÍCIES IMPERMEÁVEIS
1TATIANA SUSSEL GONÇALVES MENDES
1ANDRESSA NALU HERNANDES
2ALUIR PORFÍRIO DAL POZ
Universidade Estadual Paulista - Unesp1Instituto de Ciência e Tecnologia - ICT
Departamento de Engenharia Ambiental, São José dos Campos - SP2Faculdade de Ciências e Tecnologia - FCT
Departamento de Cartografia, Presidente Prudente - SP
[email protected], [email protected], [email protected]
RESUMO - Este trabalho tem como objetivo integrar informação espectral da imagem aérea de alta
resolução com informações dos dados LASER (intensidade do pulso LASER e Modelo Digital de
Superfície normalizado) e suas respectivas informações de texturas, calculadas a partir da matriz de co-
ocorrência dos níveis de cinza, para classificar superfícies impermeáveis em ambientes urbanos. A
classificação por Support Vector Machine foi aplicada em diferentes combinações de dados de entrada e a
acurácia é avaliada usando o coeficiente kappa. Os experimentos realizados mostraram que a acurácia
aumentou de 0,59 para 0,83 ao adicionar dados do LASER, e para 0,87 ao incluir os dados de textura.
Palavras chave: Support Vector Machine, dados de varredura a LASER, Textura.
ABSTRACT – This work aims to integrate spatial information by high resolution aerial image with
LASER data (LASER pulse intensity image and normalized Digital Surface Model) and their respective
textures information obtained by grey-level co-occurrence matrix in order to classify impervious surface
in urban environments. The classification using Support Vector Machine was applied in different
combinations of input data and the accuracy was evaluated using the kappa coefficient. The experiments
performed showed that the accuracy increased from 0.59 to 0.83 when adding the LASER data and 0.87
when including the texture data.
Key words: Support Vector Machine, LASER Scanner Data, Texture.
1 INTRODUÇÃO
Pesquisas relacionadas ao mapeamento de
superfícies impermeáveis a partir de dados de
Sensoriamento Remoto tem atraído interesse desde
1970. Superfícies impermeáveis são geralmente
definidas como objetos antrópicos, tais como, vias e
rodovias, edificações, estacionamentos, calçadas etc. No
contexto urbano, o estudo de superfícies impermeáveis é
altamente relevante, sendo importante para o
planejamento urbano e ambiental e para o
gerenciamento de recursos (WENG, 2012). O aumento
da impermeabilidade do solo por meio da urbanização
repercute na capacidade de infiltração das águas
(RIBEIRO, 2007), tendo como consequência o aumento
do volume de água e da velocidade de escoamento
superficial, com maior possibilidade de risco de
enchentes durante as tempestades. Dependendo do
relevo e da declividade do terreno, a baixa taxa de
infiltração também provoca erosões e deslizamentos.
Na literatura encontram-se diversas técnicas para
o mapeamento dessas superfícies, que utilizam diversos
métodos de classificação de imagens. Dentre eles, o
Support Vector Machine (SVM) tem recebido grande
atenção pelos pesquisadores devido a sua sólida
fundamentação teórica e determinadas características
atrativas, tais como arquitetura simples, moderada
complexidade computacional e excelente capacidade de
generalização (BRUZZONE e PERSELLO, 2009), com
diversas aplicações envolvendo dados de Sensoriamento
Remoto, por exemplo, na extração de rodovias
(MATKAN et al., 2014) e de edificações (TURKER e
KOC-SAN, 2015), na classificação de uso e cobertura
do solo (DIXON e CANDADE, 2008; SONG et al.,
2012; SHAO e LUNNETA, 2012), em detecção de
mudanças (SRIVASTAVA et al., 2012) e em detecção
IV Simpósio Brasileiro de Geomática – SBG2017
II Jornadas Lusófonas - Ciências e Tecnologias de Informação Geográfica - CTIG2017
T. S. G. Mendes; A. N. Hernandes; A. P. Dal Poz ISSN 1981-6251
de superfícies impermeáveis (SUN et al., 2011;
ZHANG et al., 2012).
Além da informação espectral, métodos têm
incorporado informações adicionais no processo de
classificação, como por exemplo, informações de dados
de varredura a LASER (HUANG et al., 2008, ALONSO
e MALPICA, 2010, GUO et al., 2011 e HUANG et al.,
2011) e informações de textura (ZHU e TOUTIN, 2013;
FERNÁNDEZ et al., 2014).
Este trabalho tem como objetivo integrar dados
LASER (intensidade do pulso LASER e Modelo Digital
de Superfície normalizado) e, suas respectivas
informações de textura, com a imagem de alta resolução
para mapear superfícies impermeáveis, avaliando a
contribuição da informação de textura na classificação
por SVM.
2 MATERIAL E MÉTODO
2.1 Materiais
No presente trabalho foi usado o conjunto de
dados (imagem aérea e dados LASER) correspondente a
uma área urbana da cidade de Curitiba-PR. A Figura 1
mostra o recorte da área.
Figura 1 – Recorte da imagem aérea de alta resolução.
Os softwares utilizados foram: LASTools para o
processamento dos dados LASER; e ENVI para a
classificação por SVM.
2.2 Classificação por SVM
O objetivo do SVM para a classificação é
determinar um hiperplano ótimo de separação entre
duas classes. Tal hiperplano é determinado usando
dados de treinamento e sua habilidade de generalização
é verificada usando dados de validação (SRIVASTAVA
et al., 2012).
Para uma classificação n-dimensional, n-1
hiperplanos são produzidos com o SVM. No entanto,
somente um hiperplano, considerado ótimo, fornece
uma máxima margem entre as duas classes
(KAVZOGLU e COLKESEN, 2009), conforme mostra
a Figura 2.
Figura 2 – Hiperplano de dados linearmente separáveis
(em cinza), vetores de suporte e o hiperplano ótimo (em
preto) (Adaptado de Kavzoglu e Colkesen (2009)).
A formulação original do método SVM permite
apenas a separação entre duas classes, não atendendo a
maioria dos problemas reais. Para contornar esta
limitação são empregadas estratégias multiclasse, por
exemplo, Um-Contra-Todos (One-Against-All - OAA).
No problema de separação dos dados em um número de
c de classes, são definidos c classificadores binários,
onde cada um é responsável pela separação de uma
classe específica com relação às demais.
2.3 Estratégia de classificação e avaliação da
acurácia
O método SVM foi empregado na classificação
usando diferentes combinações de dados de entrada. Os
dados de entrada são: imagem aérea decomposta em R,
G e B; imagem de intensidade e Modelo Digital de
Superfície normalizado (MDSn) oriundos dos dados
LASER; e imagens de textura (contraste, média,
segundo momento angular, correlação, dissimilaridade,
entropia, homogeneidade e variância) obtidas a partir da
matriz de co-ocorrência (HARALICK et al., 1973)
usando as imagens provenientes dos dados LASER.
As imagens de entrada na classificação foram
combinadas de modo a verificar a contribuição dos
dados no resultado, avaliando a acurácia atingida e a
imagem gerada. A técnica de Transformação por
Componentes Principais foi usada como uma das
formas de combinar as diferentes informações e reduzir
a dimensionalidade dos dados.
Uma vez que o SVM é um método
supervisionado, amostras de treinamento são
necessárias. Na cena, foram coletadas amostras para as
seguintes classes: asfalto, grama, árvore, telhado
vermelho (cerâmica), telhado cinza, concreto (quadras
de esporte cimentadas e calçadas de concreto, blocos e
pedras), solo exposto e água (piscinas). Diferentemente
da maioria das abordagens para a classificação, a classe
sombra não foi incluída, uma vez que a adição dos
dados LASER, principalmente da imagem de
intensidade, ajuda a diminuir a interferência desse
fenômeno no resultado.
IV Simpósio Brasileiro de Geomática – SBG2017
II Jornadas Lusófonas - Ciências e Tecnologias de Informação Geográfica - CTIG2017
T. S. G. Mendes; A. N. Hernandes; A. P. Dal Poz ISSN 1981-6251
Com o objetivo de avaliar os resultados e as
diferentes formas de combinar os dados, as acurácias
foram avaliadas usando o conjunto de amostras de
validação por meio do coeficiente kappa
(CONGALTON e GREEN, 2009).
3 EXPERIMENTOS
Os dados LASER e a imagem aérea foram
integrados num mesmo sistema de referência através do
registro rigoroso, que consiste em projetar
fotogrametricamente a nuvem de pontos LASER na
imagem aérea, seguida da regularização dos pontos
projetados segundo uma grade com mesma resolução da
imagem aérea, o que permite gerar o MDS e a imagem
de intensidade. Por meio do processo de filtragem dos
pontos LASER, usando o software LASTools, pontos
que representam a superfície topográfica foram obtidos
e o MDSn foi gerado. As Figuras 3(a) e 3(b)
apresentam, respectivamente, a imagem de intensidade e
o MDSn para a área de estudo.
(a)
(b)
Figura 3 - Imagens oriundas dos dados LASER: (a)
Imagem de intensidade; e (b) MDSn.
Amostras de treinamento e de validação foram
obtidas a partir da análise da imagem aérea. O número
de pixels de treinamento e de validação para cada classe
é apresentado na Tabela 1.
Na classificação por SVM, foi adotada a Função
Base Radial como função kernel. O parâmetro
penalidade foi definido com valor igual a 100. Altos
valores para a penalidade resultam em menores índices
de erro durante o treinamento, no entanto, pode ocorrer
a perda de generalidade do modelo.
Tabela 1 – Amostras de treinamento e de validação.
Classes Treinamento
(pixels/polígono)
Validação
(pixels/polígono)
Asfalto 564/17 315/10
Concreto 296/15 143/8
Telhado cinza 413/17 217/12
Telhado vermelho 284/15 160/9
Árvore 309/13 122/5
Grama 206/9 142/6
Água 38/4 21/2
Solo exposto 114/4 69/3
As diferentes combinações de dados de entrada
são apresentadas na Tabela 2, juntamente com os
valores do coeficiente kappa alcançados na
classificação. As imagens de entrada são:
RGB: imagens R, G e B;
(I): imagem de intensidade;
(H): Modelo Digital de Superfície
normalizado;
T[I]: imagens de textura provenientes da
imagem de intensidade;
T[H]: imagens de textura provenientes do
MDSn;
1CPT[I]: primeira componente principal
das imagens de textura da imagem de
intensidade;
1CPT[H]: primeira componente principal
das imagens de textura do MDSn;
T[I][Ent_2Mom_Var]: Imagens de textura
(entropia, segundo momento angular e
variância) obtidas a partir da imagem de
intensidade.
T[H][Ent_2Mom_Hom_Diss]: Imagens de
textura (entropia, segundo momento
angular, homogeneidade e dissimilaridade )
obtidas a partir do MDSn.
T[I][Var]: Imagem de textura (variância)
obtida a partir da imagem de intensidade.
T[H][Diss]: Imagem de textura
(dissimilaridade) obtida a partir do MDSn.
Tabela 2 – Combinações de dados de entrada.
Combinação Kappa
SVM
A RGB 0,59
B RGB + I + H 0,83
C RGB + I + H + T[I] 0,84
D RGB + I + H + T[H] 0,85
E RGB + I + H + T[I] + T[H] 0,83
F RGB + I + H + 1CPT[I] + 1CPT[H] 0,85
G RGB + I +H + T[I][Ent_2Mom_Var] 0,85
H RGB + I + H + T[H][Ent_2Mom_Hom_Diss] 0,85
I RGB + I + H + T[I][Var] + T[H][Diss] 0,87
IV Simpósio Brasileiro de Geomática – SBG2017
II Jornadas Lusófonas - Ciências e Tecnologias de Informação Geográfica - CTIG2017
T. S. G. Mendes; A. N. Hernandes; A. P. Dal Poz ISSN 1981-6251
As duas primeiras combinações (A e B),
apresentadas na Tabela 2, são para fins de comparação,
uma vez que estas não apresentam informação de
textura. As demais combinações usam informação de
textura acrescidas na combinação RGB+I+H, sendo que
a combinação F usa as primeiras componentes
principais das imagens de textura para reduzir a
dimensionalidade dos dados. As combinações de G a I
usam as imagens de textura, geradas a partir da imagem
de intensidade e do MDSn, que mais contribuem para
separar as classes.
A adição das informações dos dados LASER
(imagem de intensidade e MDSn) aumentou
consideravelmente o valor do kappa, de 0,59 para 0,83.
A inclusão da informação de textura, de uma forma
geral, aumentou a acurácia, alcançando o valor do kappa
igual a 0,87 quando as imagens de textura (segundo
momento angular para a imagem de intensidade e
dissimilaridade para o MDSn) foram incluídas na
classificação.
As imagens resultantes da classificação são
apresentadas na Figura 4. Na combinação A, por usar
somente as imagens RGB, verifica-se que houve muitos
pixels classificados como asfalto e a classe concreto não
é representada, ficando evidenciado a confusão entre as
classes asfalto, concreto, grama e telhado cinza. Na
combinação B, a inclusão da imagem de intensidade
melhora o resultado para a classe asfalto, reduz a
influência da sombra nesta classe e contribui para o
aparecimento da classe concreto (calçadas). O MDSn
permite melhor separar os objetos altos dos que estão no
nível do terreno, e por isso, melhora o resultado para as
classes edificação cinza e asfalto.
RGB (A)
RGB + I + H (B)
RGB + I + H + T[I] (C)
RGB + I + H + T[H]
(D) RGB + I + H + T[I] + T[H]
(E) RGB+I+H+1CPT[I]+1CPT[H]
(F)
RGB + I +H + T[I][Ent_2Mom_Var]
(G) RGB + I + H + T[H][Ent_2Mom_Hom_Diss]
(H) RGB + I + H + T[I][Var] + T[H][Diss]
(I)
Figura 4 - Imagens resultantes da classificação, segundo as combinações de A a I.
IV Simpósio Brasileiro de Geomática – SBG2017
II Jornadas Lusófonas - Ciências e Tecnologias de Informação Geográfica - CTIG2017
T. S. G. Mendes; A. N. Hernandes; A. P. Dal Poz ISSN 1981-6251
Ao incluir separadamente as imagens de textura da
imagem de intensidade e do MDSn na classificação
(combinações C e D) obteve resultados muitos próximo,
visualmente. O que se observa é que a combinação D, que
usa a imagem de textura do MDSn diferenciou melhor a
vegetação, enquanto que classificou mais pixels
erroneamente como classe solo exposto. Já a combinação
C, que usa a textura da imagem de intensidade, verificou-
se um resultado melhor para a classe asfalto e concreto.
A integração de todas as informações de textura no
processo de classificação (combinação E) reduziu o valor
de kappa, e apresentou, conforme Figura 5, um resultado
mais ruidoso em comparação com os dois anteriores. A
combinação que insere as primeiras componentes
principais das imagens de textura (combinação F)
apresentou um melhor resultado para a classe grama e
concreto, quando comparado com a combinação E.
Analisando todas as imagens de textura geradas,
verificou-se que as imagens entropia, segundo momento e
variância (combinação G) poderiam ajudar na
classificação, principalmente em relação às vias e
concreto. Da mesma forma o procedimento foi realizado,
selecionando as imagens entropia, segundo momento,
homogeneidade e dissimilaridade (combinação H),
obtidas a partir do MDSn. Entre o resultado das
combinações G e H, verificou-se uma ligeira diferença
entre as classes grama e concreto, com maior confusão
entre elas na combinação H, que inclui informação de
textura do MDSn.
A combinação I diminuiu a quantidade de imagens
que entram no processo de classificação, inserindo
somente uma imagem de textura gerada a partir da
imagem de intensidade (variância) e uma imagem de
textura do MDSn (dissimilaridade). O resultado dessa
classificação alcançou o valor de 0,87, com melhor
definição das bordas dos objetos e com o aparecimento de
mais pixels da classe concreto.
A Figura 5 mostra a classificação associando as
classes resultantes em duas: superfície impermeável (em
branco) e superfície permeável (em preto). Para a
superfície impermeável foram consideradas as classes
asfalto, concreto, telhado cinza, telhado vermelho e água.
Como os corpos d’água presentes na área de estudo
correspondem somente a piscinas, esta classe foi incluída
como impermeável. Para a classe permeável, foram
consideradas as classes árvore, grama e solo exposto.
Do total da área de estudo, 52% é considerada
como superfície impermeável e o restante, 48%, como
permeável. É importante considerar que apesar da área
possuir muitas edificações, há muitas áreas gramadas,
sendo duas delas de grande extensão, as quais contribuem
para que a área de estudo apresente aproximadamente
50% de superfície impermeável, conforme o método
proposto.
Figura 5 – Superfícies impermeáveis (em branco) obtidas
pela classificação integrando informações espectrais, de
dados LASER e de textura.
4 CONCLUSÕES
A classificação por SVM usando diferentes
combinações de dados de entrada (R, G e B; imagem de
intensidade e Modelo Digital de Superfície normalizado
(MDSn) oriundas dos dados LASER; e imagens de
textura obtidas a partir da matriz de co-ocorrência usando
as imagens provenientes dos dados LASER) foi realizada
para verificar se o uso da informação de textura contribui
para separar as classes de cobertura do solo com o
objetivo de mapear superfícies impermeáveis.
É fato que a integração dos dados LASER com as
imagens RGB melhora o resultado da classificação, como
ocorreu neste trabalho, aumentando o valor do kappa de
0,59 para 0,83. As experimentações foram realizadas para
verificar se os dados de textura obtidos a partir dos dados
LASER, incluídos aos dados espectrais, de intensidade e o
MDSn, melhoram os resultados da classificação. No
presente trabalho, houve um aumento da acurácia de 0,83
para 0,87 ao integrar as informações de textura (variância
da imagem de intensidade e dissimilaridade do MDSn).
O aumento da acurácia não foi muito expressivo,
uma vez que o resultado está relacionado a diversos
fatores, por exemplo, o método de classificação por pixel
e a baixa densidade da nuvem de pontos dos dados
LASER. Neste sentido, como trabalhos futuros pretende-
se analisar outras formas de inserir a informação de
textura no processo de classificação; propondo também
usar um método de classificação orientado a objeto; e
realizar os experimentos usando uma nuvem de pontos de
dados LASER mais densa, para produzir imagens com
menos ruído.
AGRADECIMENTOS
Os autores agradecem à FAPESP pelo apoio
financeiro através da bolsa de Iniciação Científica do
segundo autor (Processo 2016/05240-8) e ao LACTEC
pelo fornecimento dos dados de varredura a LASER.
IV Simpósio Brasileiro de Geomática – SBG2017
II Jornadas Lusófonas - Ciências e Tecnologias de Informação Geográfica - CTIG2017
T. S. G. Mendes; A. N. Hernandes; A. P. Dal Poz ISSN 1981-6251
REFERÊNCIAS
ALONSO, M. C.; MALPICA, J. A. Satellite imagery
classification with LiDAR data. In: International
Archives of the Photogrammetry, Remote Sensing and
Spatial Information Sciences, v. XXXVIII, Part 8,
Japan, pp. 730-735, 2010.
BRUZZONE, L.; PERSELLO, C. A novel context-
sensitive semisupervised SVM classifier robust to
mislabeled training samples. IEEE Transactions on
Geoscience and Remote Sensing, v. 47, n. 7, pp. 2142-
2154, 2009.
CONGALTON, R.; GREEN, K. Assessing the Accuracy
of Remotely Sensed Data: Principles and Practices. Boca
Raton: Lewis Press, 1999. Cap. 3, p. 12-14.
DIXON, B; CANDADE, N. Multispectral landuse
classification using neural networks and support vector
machine: one or the other, or both? International
Journal of Remote Sensing, v. 29, n. 4, pp. 1185-1206,
2008.
FERNÁNDEZ, I; AGUILAR, F. J.; AGUILAR, M. A.;
ÁLVAREZ, M. F. Influence of Data Source and Training
Size on Impervious Surface Areas Classification Using
VHR Satellite and Aerial Imagery through an Object-
Based Approach. IEEE Journal of Selected Topics in
Applied Earth Observations and Remote Sensing, v. 7,
n. 12, pp. 4681-4691, 2014.
GUO, L.; CHEHATA, N.; MALLET, C.; BOUKIR, S.
Relevance of airborne LiDAR and multispectral image
data for urban scene classification using Random
Forests,” ISPRS Journal of Photogrammetry and
Remote Sensing, v. 66, pp. 56-66, 2011.
HARALICK, R. M.; SHANMUGAN, K.; DINSTEIN, I.
Textural Features for Image Classification. IEEE
Transaction on System, man and Cybernetics, New
York, v. 3, n. 6, pp. 610-621, 1973.
HUANG, M; SHYUE, S.; LEE, L.; KAO, C. A
Knowledge-based Approach to Urban Feature
Classification Using Aerial Imagery with Lidar Data.
Photogrammetric Engineering & Remote Sensing, v.
74, n. 12, pp. 1473-1485, 2008.
HUANG, X.; ZHANG, L.; GONG, W. Information fusion
of aerial images and LIDAR data in urban areas: vector-
stacking, rec-classification and post-processing
approaches. International Journal of Remote Sensing,
v. 32, n. 1, pp. 69-84, 2011.
KAVZOGLU, T.; COLKESEN, I. A kernel functions
analysis for support vector machines for land cover
classification. International Journal of Applied Earth
Observation and Geoinformation, v. 11, pp. 352-359,
2009.
MATKAN, A. A.; HAJEB, M.; SADEGHIAN, S. Road
extraction from Lidar data using Support Vector Machine
classification. Photogrammetric Engineering &
Remote Sensing, v. 80, pp. 409-422, 2014.
SHAO, Y.; LUNETTA, R.S. Comparison of support
vector machine, neural network, and CART algorithms
for the land-cover classification using limited training
data points. ISPRS Journal of Photogrammetry and
Remote Sensing, v. 10, pp. 78-87, 2012.
SONG, X.; DUAN, Z.; JIANG, X. Comparison of
artificial neural networks and support vector machine
classifiers for land cover classification in Northen China
using a SPOT-5 HRG image. International Journal of
Remote Sensing, v. 33, pp. 3301-3320, 2012.
SRIVASTAVA, P.K.; HAN, D.; RICO-RAMIREZ,
M.A.; Bray, M.; Islam, T. Selection of classification
techniques for landuse/land cover change investigation.
Advances in Space Research, v. 50, pp. 1250-1265,
2012.
SUN, Z.; GUO, H.; LI, X.; LU, L.; DU, X. Estimating
urban impervious surfaces from Landsat-5 TM imagery
using multilayer perceptron neural network and support
vector machine. Journal of Applied Remote Sensing, v.
5, 2011.
TURKER, M.; KOC-SAN, D. Building extraction from
high-resolution optical spaceborne images using the
integration of support vector machine (SVM)
classification, Hough transformation and perceptual
grouping. International Journal of Applied Earth
Observation and Geoinformation, v. 34, pp. 58-69,
2015.
WENG, Q. Remote Sensing of impervious surfaces in the
urban areas: Requirements, methods, and trends. Remote
Sensing of Environment, v. 117, pp. 34-39, 2012.
ZHANG, H.; ZHANG, Y.; LIN, H. A comparison study
of impervious surfaces estimation optical and SAR
remote sensing images. International Journal of
Applied Earth Observation and Geoinformation, v. 18,
pp. 148-156, 2012.
ZHU, X; TOUTIN, T. Land cover classification using
airborne LiDAR products in Beauport, Québec, Canada.
International Journal of Image and Data Fusion, v. 4,
n. 3, pp. 252-271, 2013.