universidade federal do parÁ prÓ-reitoria de … · da classe vegetação, pois a vegetação,...

13
UNIVERSIDADE FEDERAL DO PARÁ PRÓ-REITORIA DE PESQUISA E PÓS-GRADUAÇÃO DIRETORIA DE PESQUISA PROGRAMA INSTITUCIONAL DE BOLSAS DE INICIAÇÃO CIENTÍFICA – PIBIC : CNPq, CNPq/AF, UFPA, UFPA/AF, PIBIC/INTERIOR, PARD, PIAD, PIBIT, PADRC E FAPESPA RELATÓRIO TÉCNICO – CIENTÍFICO Período: Agosto/2014 a Julho/2015 (X) Final Título do Projeto de Pesquisa: Formação e consolidação de recursos humanos em processamento de sinais. Nome do Orientador: Evaldo Gonçalves Pelaes Titulação do Orientador: Doutor Faculdade: Engenharia da Computação Instituto/Núcleo: ITEC – Instituto de Tecnologia Laboratório: LaPS – Laboratório de Processamento de Sinais Título do Plano de Trabalho: Análise da mudança de cobertura e uso da terra, com base em imagens LandSat o produto EVI/MODIS para os municípios de Belém, Canaã dos Carajás e Parauapebas (Pará) Nome do Bolsista: Helder Araujo Louzada Tipo de Bolsa: PIBIC/UFPA

Upload: hadan

Post on 11-Nov-2018

216 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: UNIVERSIDADE FEDERAL DO PARÁ PRÓ-REITORIA DE … · da classe Vegetação, pois a vegetação, densa e uniforme, apresenta grande absorção de energia, permitindo bom contraste

UNIVERSIDADE FEDERAL DO PARÁ PRÓ-REITORIA DE PESQUISA E PÓS-GRADUAÇÃO

DIRETORIA DE PESQUISA PROGRAMA INSTITUCIONAL DE BOLSAS DE INICIAÇÃO CIENTÍFICA – PIBIC : CNPq, CNPq/AF, UFPA, UFPA/AF, PIBIC/INTERIOR, PARD, PIAD, PIBIT, PADRC

E FAPESPA

RELATÓRIO TÉCNICO – CIENTÍFICO

Período: Agosto/2014 a Julho/2015 (X) Final Título do Projeto de Pesquisa: Formação e consolidação de recursos humanos em processamento de sinais. Nome do Orientador: Evaldo Gonçalves Pelaes Titulação do Orientador: Doutor Faculdade: Engenharia da Computação Instituto/Núcleo: ITEC – Instituto de Tecnologia Laboratório: LaPS – Laboratório de Processamento de Sinais Título do Plano de Trabalho: Análise da mudança de cobertura e uso da terra, com base em imagens LandSat o produto EVI/MODIS para os municípios de Belém, Canaã dos Carajás e Parauapebas (Pará) Nome do Bolsista: Helder Araujo Louzada Tipo de Bolsa: PIBIC/UFPA

Page 2: UNIVERSIDADE FEDERAL DO PARÁ PRÓ-REITORIA DE … · da classe Vegetação, pois a vegetação, densa e uniforme, apresenta grande absorção de energia, permitindo bom contraste

INTRODUÇÃO

O estudo de classificação digital de imagens de sensoriamento remoto é reconhecido como uma técnica capaz de suprir a escassez dos mapeamentos temáticos. Devido ao aumento de complexidade geográfica, o uso de novos sensores com maior resolução espacial, disponíveis no mercado consequentemente aumentando o uso deles, fazendo com que haja a necessidade da existência de ferramentas auxiliadoras a analise espacial dos fenômenos que englobam uma grande quantidade de dados. Estas novas imagens demandam o uso de novas técnicas de analise, pois oferece um alto nível de detalhe, o que possibilita a identificação de áreas em função de suas propriedades espectrais e espaciais. A classificação digital de imagens de satélites oferece a possibilidade de extração de informações dessas imagens. As pesquisas realizadas mostram que atualmente existem diversos métodos de classificação que buscam obter informação de cada pixel de uma imagem, classificando-o em categorias ou classes de acordo com a informação espectral. Os classificadores de imagens convencionais utilizados pelos Sistemas de informação geográficos (SIG) são inadequados para as necessidades de alta acurácia exigida pelos usuários (INPE, 2002). A fim de se conseguir melhores resultados, optou-se por utilizar classificadores de imagens baseado em Redes Neurais Artificiais devido a eficiência de uma rede neural semelhante ao cérebro humano para o processamento de grandes quantidades de dados de diversas fontes. JUSTIFICATIVA A necessidade de que se tenha uma solução para identificação e processamento de imagens requer um trabalho extenso e exaustivo envolvendo testes e simulações usando softwares, principalmente para imagens obtidas através de satélites. No Brasil o inicio do sensoriamento remoto foi baseado em técnicas de interpretação visual em imagens analógicas. Este processo, porém, sofreu diversas mudanças e hoje o processamento digital de imagens visa fornecer ferramentas para facilitar e identificação e a extração de informações contidas nas imagens para posteriormente serem feitas interpretações das mesmas. O ponto crítico desse desenvolvimento é a não aplicabilidade direta desses métodos devido à característica multi-dimensional desses dados, que costumam agregar conhecimento de diversas bandas frequências para sua representação espacial.

A compreensão da forma de ocupação do espaço através dos dados de sensoriamento remoto pode auxiliar na elaboração de politicas públicas de desenvolvimento, a fim de evitar problemas ambientais, sociais, econômicos. Por isso, o presente plano visa investigar as condições e restrições de aplicabilidade de métodos conhecidos de classificação, avaliando-os de acordo com métricas estabelecidas e outras medidas de eficiência.

Page 3: UNIVERSIDADE FEDERAL DO PARÁ PRÓ-REITORIA DE … · da classe Vegetação, pois a vegetação, densa e uniforme, apresenta grande absorção de energia, permitindo bom contraste

OBJETIVOS Investigar métodos de classificação de imagens no contexto de ocupação de regiões em imagens oriundas de sensores remotos através do uso de redes neurais artificiais. Especificamente, pretende-se investigar a eficiência desses métodos dado que esse tipo de imagem é, em geral, multi-resolução e agrega informações não comuns a imagens sintéticas. Estudo de técnicas de processamento digital de imagens Estudo de métodos para classificação de imagens Mapeamento de modelos melhores aplicados às cenas capturadas pelo

sensor TM à bordo do satélite Landsat-5 Implementação das técnicas de classificação de imagens Validação/Avaliação das técnicas Elaboração de artigos para publicação

MATERIAIS E MÉTODOS Para a execução do plano em questão, primeiramente foi feito o levantamento bibliográfico sobre o tema, e em seguida foram realizados estudos dos métodos utilizados atualmente para processamento de imagens. Na sequência, serão implementados métodos supervisionados de classificação de imagens baseados em rede neurais artificiais. Posteriormente serão avaliados os métodos de acordo com métricas e outras medidas para a determinação de condições e restrições quanto ao desempenho dessas abordagens diante das imagens capturadas pelo sensor Thematic Mapper (TM) à bordo do satélite Landsat 5. O diagrama da Figura 1 exibe de forma geral as etapas principais para o desenvolvimento da classificação das imagens através do uso de redes neurais artificiais.

Figure 1 Metodologia de trabalho

Page 4: UNIVERSIDADE FEDERAL DO PARÁ PRÓ-REITORIA DE … · da classe Vegetação, pois a vegetação, densa e uniforme, apresenta grande absorção de energia, permitindo bom contraste

Para todas as imagens estudadas, a metodologia de desenvolvimento da aplicação das redes neurais artificiais foi dividida em três etapas principais: na primeira foi realizado o pré-processamento dos dados, em que foram realizadas as correções geométricas das imagens e em seguida foi realizado o processo de realce por expansão histogrâmica. A segunda etapa é composta pela fase de treinamento da rede neural baseado nas amostras representativas das classes de interesse (Água, Vegetação e Solo), as quais foram coletadas nas imagens. Após o treinamento ainda na segunda etapa do processo metodológico, a rede treinada foi aplicada às imagens para realizar a classificação e geração dos mapas de uso do solo, possibilitando a análise do potencial da rede em discriminar as classes de saídas. A última etapa consiste em analisar os resultados e a exatidão da classificação, através de dados estatísticos, gráficos e mapas de classificações.

A Figura 2 apresenta a metodologia utilizada para a pré-processamento das imagens Landsat 5 TM, onde é realizado a aquisição das imagens nas bandas 3, 4 e 5, em seguida a etapa de correções geométricas e por último a aplicação da técnica de realce de imagens.

Figure 2 Metodologia de pré-processamento das imagens.

O procedimento metodológico para o treinamento e classificação pela rede neural pode ser visto no diagrama de blocos da Figura 3. Os dados multiespectrais utilizados para a classificação automática correspondem à um recorte da cena 227/65 capturada pelos satélites Landsat-5 TM das bandas 3 (0,63 a 0,69 m - vermelho), 4(0,76 a 0,90 m – infravermelho próximo) e 5 (1,55 a 1,75 m - infravermelho médio), no período de 1989 a 2011. As imagens possuem uma resolução radiométrica de 8 bits. As amostras de treinamento devem conter representações de todas as classes presentes na imagem. Neste trabalho as classes definidas são: Água, Vegetação e Solo. Cada recorte de representação de alguma determinada classe possui uma resolução 3x3x3, onde cada pixel de cada umas das bandas que compõem o recorte de representação possui um valor variando de 0 a 255 tons de cinza. Foram adquiridos 30 recortes para amostras de representação para cada uma das três classes utilizadas, contabilizando 90 amostras.

Page 5: UNIVERSIDADE FEDERAL DO PARÁ PRÓ-REITORIA DE … · da classe Vegetação, pois a vegetação, densa e uniforme, apresenta grande absorção de energia, permitindo bom contraste

Figure 3 Metodologia de treinamento e classificação pela rede neural.

A formação da matriz de características das classes é definida da seguinte maneira: Cada pixel da amostra é isolado em vetor 1x3 (Figura 5.8). Portanto, cada classe possui 30 amostras representativas de 9 pixels, totalizando 270 amostras de características da classe. Então um vetor de 810 amostras (para as três classes) é formado, das quais para o algoritmo ELM, 70% das amostras foram utilizadas para o treinamento da rede e 30% para teste.

A arquitetura de ambas as redes neurais utilizadas (ELM e Backpropagation) possui uma camada entrada, uma camada oculta com 10 neurônios e uma camada de saída.

Após o treinamento e testes das redes, foram realizados os testes das imagens referentes aos anos de 1989, 1997, 2005 e 2011. Cada imagem é passada como entrada da rede e é feita uma varredura sobre a imagem com uma janela de resolução 1x1 e cada janela é analisada pela rede neural, que classifica a amostra em uma das três classes determinadas, então cada pixel da imagem é pintado em um mapa de classificação de acordo com sua localização na imagem original e classificação realizada

Page 6: UNIVERSIDADE FEDERAL DO PARÁ PRÓ-REITORIA DE … · da classe Vegetação, pois a vegetação, densa e uniforme, apresenta grande absorção de energia, permitindo bom contraste

RESULTADOS Após os procedimentos de pré-processamento, são apresentados os resultados obtidos a partir da classificação realizada através das redes neurais artificiais baseadas nos algoritmos ELM e Backpropagation. Através das matrizes de erros das redes neurais podemos obter alguns índices de avaliação dos classificadores, as classificações são avaliadas de acordo com os índices de exatidão global, kappa, erros de omissão e inclusão e erro quadrático médio. Para o algoritmo ELM os dados foram separados em duas categorias: dados de treinamento, que serão utilizados para o treinamento da rede, e dados de teste, utilizados para verificar sua performance sob condições reais de utilização. Para o algoritmo Backpropagation foi definida uma terceira categoria, o conjunto de validação, utilizado para verificar a eficiência da rede quanto a sua capacidade de generalização durante o treinamento e usada como critério de parada para a fase de treinamento da rede. Lembrando que todos os conjuntos foram alocados em ordem aleatória. A classificação baseada no algoritmo ELM apresentou altos índices de exatidão global (G) e Kappa (K), tanto na fase de treinamento (G = 97.1% e K = 0.958) quanto na de teste (G = 95.5% e K = 0.932), o que evidencia de uma maneira geral que a rede conseguiu se adaptar muito bem a detecção dos padrões definidos. Na classificação da rede neural baseada no algoritmo Backpropagation os índices de exatidão global e Kappa das fases de treinamento, validação e teste foram de G = 92.8% e K = 0.891, G = 94.5% e K = 0.914, G = 91.0% e K = 0.863, respectivamente. Para o algoritmo ELM foram definidas 100 épocas treinamento, para o algoritmo de máquina de aprendizado extremo a definição dos pesos utilizados para o treinamento da rede neural é feita de maneira aleatória, portanto os erros quadráticos médios obtidos durante essa fase, também apresentam essa característica randômica. Ao detectar um menor valor de erro, os pesos definidos são passados para a fase de teste para verificar realmente a qualidade do erro. Ao final são escolhidos para a etapa de classificação das imagens os pesos referentes ao menor erro quadrático médio obtido na fase de teste, detectado na época 50. Para o algoritmo Backpropagation que trabalha com uma metodologia de correção de erros, o Erro Quadrático Médio (EQM) naturalmente vai diminuindo com o passar das épocas, tendo seu critério de parada no menor valor de EQM (0.03013) da etapa de validação da rede, detectado na época 39. Os baixos EQMs gerados pelas redes neurais evidenciam a boa relação entre a resposta da rede e os dados de referência, indicando que ambas as redes apresentaram respostas seguras para a classificação dos dados de teste. A tabela a seguir apresenta um resumo dos índices de avaliação das classificações.

Page 7: UNIVERSIDADE FEDERAL DO PARÁ PRÓ-REITORIA DE … · da classe Vegetação, pois a vegetação, densa e uniforme, apresenta grande absorção de energia, permitindo bom contraste

Tabela 1 Índices de exatidão das classificações ELM e Backpropagation.

Os mapas de uso do solo (Figuras 4, 5, 6 e 7) permitem visualizar as características descritas nos parágrafos anteriores para cada método de classificação.

Figure 4 Classificação do recorte de cena do ano de 1989.

Page 8: UNIVERSIDADE FEDERAL DO PARÁ PRÓ-REITORIA DE … · da classe Vegetação, pois a vegetação, densa e uniforme, apresenta grande absorção de energia, permitindo bom contraste

Figure 5 Classificação do recorte de cena do ano de 1997.

Figure 6 Classificação do recorte de cena do ano de 2005.

Page 9: UNIVERSIDADE FEDERAL DO PARÁ PRÓ-REITORIA DE … · da classe Vegetação, pois a vegetação, densa e uniforme, apresenta grande absorção de energia, permitindo bom contraste

Figure 7 Classificação do recorte de cena do ano de 2011.

A boa classificação realizada também é justificada devido a escolha das bandas de imagens utilizadas. A banda 3 ajudou significativamente para a precisão de acerto da classe Vegetação, pois a vegetação, densa e uniforme, apresenta grande absorção de energia, permitindo bom contraste entre as áreas ocupadas com vegetação. A banda 4 foi de grande importância para a acurácia da classe Água, pois os corpos de ´ agua absorvem muita energia nesta banda, permitindo o mapeamento da rede de drenagem e delineamento de corpos de ´ agua. A banda 5 apresenta características de sensibilidade ao teor de umidade das plantas, servindo para observar estresse na vegetação, embora a banda 5 n ˜ ao tenha uma importância direta em caracterizar alguma das classes definidas neste trabalho, foi importante para a composição da imagem, pois com o auxílio dela foi possível obter maiores informações sobre as classes. Outra diferença fundamental entre os algoritmos foi o tempo necessário para classificar os recortes de cenas utilizados. Para o algoritmo ELM o tempo necessário para classificar os recortes teve uma média de 119.3 segundos, enquanto que para o algoritmo Backpropagation a média de tempo necessária para classificar os mesmo recortes foi de 135minutos. Portanto além de o algoritmo ELM ter se mostrado como mais preciso, também apresentou o melhor tempo de execução da classificação de uma imagem comprovando as características de alta velocidade e ótimo desempenho [48] [43]. Deve-se levar em consideração que esse é o tempo gasto para formar o mapa de classificação, baseado no tempo de resposta de ambas as redes.

Page 10: UNIVERSIDADE FEDERAL DO PARÁ PRÓ-REITORIA DE … · da classe Vegetação, pois a vegetação, densa e uniforme, apresenta grande absorção de energia, permitindo bom contraste

PUBLICAÇÕES Helder Louzada, Ana Siravenha, Evaldo Pelaes, The use of extreme learning

machines in land changes classification: A case study of Novo Progresso, Brazil, artigo aceito no congresso internacional ”Image and Signal Processing for Remote Sensing- SPIE Remote Sensing”, Setembro de 2015 em Toulouse, França.

Artigo aceito no XVII Simpósio Brasileiro de Sensoriamento Remoto - SBRC 2015, realizado em abril de 2015 na cidade de João Pessoa - PB, intitulado: “Utilização de Redes Neurais do Tipo Extreme Learning Machine na Classificação da Cobertura de Solo do Município de Novo Progresso-PA”. Autores Helder Louzada, Ana Siravenha e Evaldo Pelaes.

ATIVIDADES A SEREM DESENVOLVIDAS NOS PRÓXIMOS MESES O presente plano de trabalho poderá ter continuidade implementando-se novos estudos de processamento de imagens digitais, no contexto de ocupação de regiões em imagens oriundas de sensores remotos, dentre elas: Testar novas arquiteturas das redes, por exemplo, aumentar o número de

camadas e de neurônios. Verificar a importância que outras bandas do sensor TM possam ter na

discriminação e classificação dos objetos da cena. CONCLUSÃO: O estudo de classificadores supervisionados vem sendo realizado há muito tempo, nas mais diversas áreas de aplicações. Portanto diversos métodos são propostos para a tarefa de classificação, porém não existe uma definição específica de como utilizá-los e nem em que áreas aplicá-los. O desenvolvimento de redes neurais artificiais para este tipo de tarefa apresenta alguns aspectos que devem ser considerados. Como quais modelos de redes neurais podem se enquadrar para a tarefa de reconhecimento de padrões. Como o conhecimento será apresentado a rede? Os dados de referência para as etapas de treinamento da rede são suficientes para a rede neural conseguir discriminar os alvos? Qual arquitetura de rede deve ser utilizada? Estes critérios usualmente são definidos pelo usuário da aplicação. Os algoritmos ELM e Backpropgation utilizados neste trabalho mostraram-se bastante eficazes. Dentre os dois o modelos, a máquina de aprendizado extremo conseguiu obter um melhor resultado, no que diz respeito a precisão e desempenho. Enquanto que o algoritmo Backpropagation apesar de apresentar bons índices de exatidão mostrou-se muito lento para a classificação de imagens de altas resoluções.

Page 11: UNIVERSIDADE FEDERAL DO PARÁ PRÓ-REITORIA DE … · da classe Vegetação, pois a vegetação, densa e uniforme, apresenta grande absorção de energia, permitindo bom contraste

REFERÊNCIAS BIBLIOGRÁFICAS [1] P. Meneses, E. Sano, and E. Assad, Introdução ao Processamento de Imagens Digitais de Satélites de Sensoriamento Remoto. Editora Universidade de Brasília, 1991. [2] Petrou, M. e Bosdogianni, P., “Image Processing: The Fundamentals”, John Wiley & Sons LTD, Ed. 1, 1999. [3] Gonzalez, Rafael C., Woods, Richard E., Eddins, Steven L., “Digital Image Processing Using MATLAB”, Pearson Education Inc., Ed. 1, 2004. [4] CONGALTON, R. G. A review of assessing the accuracy of classifications of remotely sensed data. Remote sensing of environment, Elsevier, v. 37, n. 1, p. 35–46, 1991. [5] ESCADA, M. I. S. et al. Levantamento do uso e cobertura da terra e da rede de infra-estrutura no distrito florestal da br-163. São José dos Campos: Inpe, 2009. [6] HAYKIN, S. Redes neurais: princípios e práticas. tradução: Paulo Martins Angel, ISBN:85-7307-718-2. [S.l.]: Porto Alegre: Bookman, 2001. [7] Chagas, César S., et al. "Utilização de redes neurais artificiais na classificação de níveis de degradação em pastagens." Revista Brasileira de Engenharia Agrícola e Ambiental 13.3 (2009): 319-327. [8] G.-B. Huang, D. H. Wang, and Y. Lan, “Extreme learning machines: A survey,” International Journal of Machine Learning and Cybernetics, vol. 2, no. 2, pp. 107–122, 2011. [9] Y. Yang, Y. Wang, and X. Yuan, “Bidirectional extreme learning machine for regression problem and its learning effectiveness,” Neural Networks and Learning Systems, IEEE Transactions on, vol. 23, no. 9, pp. 1498–1505, 2012.

Page 12: UNIVERSIDADE FEDERAL DO PARÁ PRÓ-REITORIA DE … · da classe Vegetação, pois a vegetação, densa e uniforme, apresenta grande absorção de energia, permitindo bom contraste

DIFICULDADES As principais dificuldades enfrentadas nos trabalhos realizados foram encontradas nas classificações supervisionadas através de Redes Neurais artificiais no que diz respeito a como modelar os dados de imagens para o processamento da rede e também quais definições de arquiteturas das redes neurais deveriam ser utilizadas. Outra dificuldade a ser considerado é o tempo de processamento necessário para realizar a classificação das imagens através do algoritmo Backpropagation, sendo necessário a utilização de um recorte de cena. PARECER DO ORIENTADOR: O bolsista cumpriu plenamente suas atividades previstas no cronograma do seu plano de trabalho. Mostrou dedicação e responsabilidade no cumprimento de suas tarefas e desempenhou seu trabalho de iniciação cientifica com rendimento acima do esperado. Seu trabalho originou duas publicações em congresso nacional em internacional.

DATA : 08/08/2015

_________________________________________ Evaldo Gonçalves Pelaes

Orientador INFORMAÇÕES ADICIONAIS: Em caso de aluno concluinte, informar o destino do mesmo após a graduação. Informar também em caso de alunos que seguem para pós-graduação, o nome do curso e da instituição.

Page 13: UNIVERSIDADE FEDERAL DO PARÁ PRÓ-REITORIA DE … · da classe Vegetação, pois a vegetação, densa e uniforme, apresenta grande absorção de energia, permitindo bom contraste

FICHA DE AVALIAÇÃO DE RELATÓRIO DE BOLSA DE INICIAÇÃO CIENTÍFICA

O AVALIADOR DEVE COMENTAR, DE FORMA RESUMIDA, OS SEGUINTES ASPECTOS DO RELATÓRIO :

1. O projeto vem se desenvolvendo segundo a proposta aprovada? Se ocorreram

mudanças significativas, elas foram justificadas? 2. A metodologia está de acordo com o Plano de Trabalho ? 3. Os resultados obtidos até o presente são relevantes e estão de acordo com os

objetivos propostos? 4. O plano de atividades originou publicações com a participação do bolsista?

Comentar sobre a qualidade e a quantidade da publicação. Caso não tenha sido gerada nenhuma, os resultados obtidos são recomendados para publicação? Em que tipo de veículo?

5. Comente outros aspectos que considera relevantes no relatório 6. Parecer Final:

Aprovado ( )

Aprovado com restrições ( ) (especificar se são mandatórias ou recomendações)

Reprovado ( )

7. Qualidade do relatório apresentado: (nota 0 a 5) _____________ Atribuir conceito ao relatório do bolsista considerando a proposta de plano, o desenvolvimento das atividades, os resultados obtidos e a apresentação do relatório.

Data : _____/____/_____.

________________________________________________ Assinatura do(a) Avaliador(a)