extraÇÃo de atributos de forma e seleÇÃo de atributos...

102
INPE-14671-TDI/1224 EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS USANDO ALGORITMOS GENÉTICOS PARA CLASSIFICAÇÃO DE REGIÕES Joelma Carla Santos Dissertação de Mestrado do Curso de Pós-Graduação em Computação Aplicada, orientada pelos Drs. João Ricardo de Freitas Oliveira e Luciano Vieira Dutra, aprovada em 2 de fevereiro de 2007. INPE São José dos Campos 2007

Upload: trantram

Post on 01-Feb-2018

217 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE

INPE-14671-TDI/1224

EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS USANDO ALGORITMOS GENÉTICOS PARA

CLASSIFICAÇÃO DE REGIÕES

Joelma Carla Santos

Dissertação de Mestrado do Curso de Pós-Graduação em Computação Aplicada, orientada pelos Drs. João Ricardo de Freitas Oliveira e Luciano Vieira Dutra, aprovada

em 2 de fevereiro de 2007.

INPE São José dos Campos

2007

Page 2: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE

Publicado por: esta página é responsabilidade do SID Instituto Nacional de Pesquisas Espaciais (INPE) Gabinete do Diretor – (GB) Serviço de Informação e Documentação (SID) Caixa Postal 515 – CEP 12.245-970 São José dos Campos – SP – Brasil Tel.: (012) 3945-6911 Fax: (012) 3945-6919 E-mail: [email protected] Solicita-se intercâmbio We ask for exchange Publicação Externa – É permitida sua reprodução para interessados.

Page 3: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE

INPE-14671-TDI/1224

EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS USANDO ALGORITMOS GENÉTICOS PARA

CLASSIFICAÇÃO DE REGIÕES

Joelma Carla Santos

Dissertação de Mestrado do Curso de Pós-Graduação em Computação Aplicada, orientada pelos Drs. João Ricardo de Freitas Oliveira e Luciano Vieira Dutra, aprovada

em 2 de fevereiro de 2007.

INPE São José dos Campos

2007

Page 4: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE

519.712 Santos, J. C. Extração de atributos de forma e seleção de atributos usando algoritmos genéticos para classificação de regiões / Joelma Carla Santos. – São José dos Campos: INPE, 2007. 99p. ; (INPE-14671-TDI/1224) 1.Algoritmos genéticos. 2.Extração de atributos. 3.Sensoriamento remoto. 4.Reconhecimento de padrões. 5.Processamento de imagens. 6.Seleção de atributos. 7.Atributos de forma. 8.Classificação de regiões. I.Título

Page 5: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE
Page 6: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE
Page 7: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE

O Senhor é meu pastor, nada me faltará. Em verdes prados ele me faz repousar. Conduz-me junto às águas refrescantes,

restaura as forças de minha alma. Pelos caminhos retos ele me leva,

por amor do seu nome. Ainda que eu atravesse o vale escuro,

nada temerei, pois estais comigo. Vosso bordão e vosso báculo

são o meu amparo. Preparais para mim a mesa

à vista de meus inimigos. Derramais o perfume sobre minha cabeça,

e transborda minha taça. A vossa bondade e misericórdia hão de seguir-me

por todos os dias de minha vida. E habitarei na casa do Senhor

por longos dias.

Salmo 22 (Heb. 23)

Page 8: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE
Page 9: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE

A meus pais, Antônio Paschoalito dos Santos e

Florinda Costa Santos. A meu marido,

Oberdan Martins Silva.

Page 10: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE
Page 11: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE

AGRADECIMENTOS

Agradeço a Deus, por estar sempre comigo, sendo o alicerce de minha vida. Agradeço aos meus pais por tudo que me ensinaram principalmente nunca fraquejar nos momentos difíceis. Agradeço em especial a minha mãe pelo exemplo de força e perseverança para realizar os sonhos. Ao meu marido Oberdan pelo amor, compreensão, e fundamental apoio. Agradeço aos meus irmãos Luciana e Marcelo e a Tia Deija pelo carinho e por nossa união. Aos meus orientadores Dr. João Ricardo de Freitas Oliveira e Dr. Luciano Vieira Dutra pela serenidade e confiança com que orientaram este trabalho e principalmente pela disponibilidade que tiveram em me atender sempre que necessário. Aos colegas de curso Danilo, Serginho, Adair, Olga, Eva, Karla e Joice Mota pela amizade. Ao meu amigo Sidnei Sant’Anna, pelas boas conversas, brincadeiras e apoio na realização deste trabalho. Ao Conselho Nacional de Desenvolvimento Científico e Tecnológico - CNPq, pelo auxílio financeiro de bolsa de mestrado. Ao Instituto Nacional de Pesquisas Espaciais – INPE, pela oportunidade de realizar este sonho. Ao Departamento de Processamento de Imagens – DPI, pelo ótimo ambiente de trabalho e excelente estrutura física. Aos meus colegas de senzala pelos bons momentos que vivemos e pela grande amizade. Alessandra, Érica, Flavinha, Vantier, Orlando, Annete, Joanito, Marckleuber, Ricardo, Fernanda e Graziela. Valeu pelo companheirismo e as boas rizadas! Obrigada a todos que torceram por mim na realização deste trabalho.

Page 12: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE
Page 13: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE

RESUMO

O crescente avanço tecnológico dos sensores remotos tem gerado imagens com alto poder de discriminação de alvos terrestres. Com esta possibilidade, é cada vez maior o número de estudos do sistema urbano usando dados de sensoriamento remoto. Imagens do ambiente urbano apresentam uma alta diversidade espacial e espectral de objetos. Para casos como este, a extração de atributos de forma é necessária para se reconhecer objetos com geometrias diferentes de mesma assinatura espectral. Neste trabalho foram propostos cinco atributos de forma que apresentaram ótimo desempenho no reconhecimento de tais objetos. Uma grande dimensionalidade do espaço de atributos pode causar degradação na classificação, devido à redundância de informações, e um alto custo de processamento. Este trabalho propõe o uso de algoritmos genéticos (AG) para a seleção de atributos. Estes algoritmos se baseiam nos mecanismos de evolução dos seres vivos. Para a busca da melhor solução é utilizada a distância Jeffrerys-Matusita (JM), ou seja, considera-se como melhor solução a que apresenta a maior distância média JM entre os pares de classe. Foram propostos dois algoritmos genéticos distintos: AG binário e AG permutação. A fim de se verificar a eficiência da metodologia proposta, foram realizados testes com uma imagem sintética e uma imagem Quickbird com 0,6m de resolução espacial. Em tais testes foram extraídos 46 atributos das amostras de treinamento. Foram selecionados subconjuntos de atributos de tamanhos 1, 2, 3 e 4, e para todos eles o AG permutação se mostrou um método mais eficiente e robusto do que o AG binário na solução do problema. Com os atributos selecionados foram alcançados coeficientes kappa de 0,8647 a 0,9927. Também foi constatado por esta pesquisa que uma boa classificação não depende apenas dos métodos de seleção de atributos, mas também do classificador utilizado. Este trabalho apresentou a importância da extração de atributos de forma e a necessidade da aplicação dos métodos de seleção de atributos nos sistemas de processamento de imagem.

Page 14: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE
Page 15: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE

SHAPE FEATURE EXTRACTION AND FEATURE SELECTION USING GENETIC ALGORITHM FOR REGION CLASSIFICATION

ABSTRACT

Discrimination power of earth surface targets has been continuously bettered with the increasing remote sensors technological advances. Urban systems applications are one of the areas that recently took benefit of these advances, particularly when using high resolution remote sensing data. In this scale, however, it is often necessary to take into account the shape of the objects to achieve a proper identification when separating objects with the same spectral signature. In this work five new shape features have been considered, in addition to those already existing in a system being developed for region classification. In such system, high feature space dimensionality can be readily achieved, which can jeopardize the image classification, due to information redundancy and high processing costs. This work also uses genetic algorithms (GA) as search strategy for feature selection and dimensionality reduction. These algorithms are based on living creatures evolution mechanisms. In order to reach the best solution, the Jeffrerys-Matusita (JM) distance is used as quality criterion. It is considered the best solution the one which presents the greatest JM average distance between pairs of classes. Two distinct genetic algorithms were tested: binary GA and permutation GA. In order to check the efficiency of the proposed methodology, tests were performed with a synthetic image and a Quickbird image with 0,6m of spatial resolution. In such tests 46 features were obtained from training samples. Feature subsets of size 1, 2, 3 and 4, were selected and in all of them the permutation AG showed a better performance than binary GA. With these selected features, kappa coefficient from 0,8647 to 0,9927 were reached. This research showed the importance of shape features for intra-urban classification; also showed an excellent performance of GA algorithms as search strategy, once, using it, a similar quality as exhaustive search was reached, at a fraction of the cost. This work, in a broad perspective, presented the importance of shape feature extraction and the need of an adequate feature selection procedure in image processing systems devoted to region classification.

Page 16: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE
Page 17: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE

SUMÁRIO Pág.

LISTA DE FIGURAS

LISTA DE TABELAS

LISTA DE SÍMBOLOS

CAPÍTULO 1 ................................................................................................................ 25

INTRODUÇÃO ............................................................................................................ 25 1.1 Contextualização ...................................................................................................... 25 1.2 Objetivo do trabalho ................................................................................................. 26 1.3 Organização do documento ...................................................................................... 26

CAPÍTULO 2 ................................................................................................................ 29

FUNDAMENTAÇÃO TEÓRICA............................................................................... 29 2.1 Sistema de Processamento de Imagens Texture ....................................................... 29 2.1.1 Pré-Processamento ................................................................................................ 30 2.1.2 Segmentação.......................................................................................................... 31 2.1.3 Extração e Seleção de Atributos............................................................................ 31 2.1.4 Classificação.......................................................................................................... 31 2.2 Extração de Atributos ............................................................................................... 34 2.2.1 Deficiência Convexa ............................................................................................. 34 2.2.2 Assimetria.............................................................................................................. 35 2.2.3 Densidade .............................................................................................................. 36 2.2.4 Direção Principal ................................................................................................... 36 2.2.5 Comprimento da fibra............................................................................................ 37 2.3 Seleção de Atributos................................................................................................. 38 2.3.1 Critérios de Qualidade Sub-Ótimos....................................................................... 39 2.3.2 Algoritmos Genéticos (AG) .................................................................................. 41 2.3.2.1 Representação..................................................................................................... 43 2.3.2.2 Seleção dos Indivíduos ....................................................................................... 44 2.3.2.3 Cruzamento e Mutação....................................................................................... 45 2.3.2.4 Função de Avaliação .......................................................................................... 47

CAPÍTULO 3 ................................................................................................................ 49

MATERIAIS E MÉTODOS........................................................................................ 49 3.1 Extração de Atributos e Imagens de Teste ............................................................... 49 3.1.1 Deficiência Convexa ............................................................................................. 51 3.1.2 Assimetria.............................................................................................................. 53 3.1.3 Densidade .............................................................................................................. 56 3.1.4 Direção Principal ................................................................................................... 58 3.1.5 Comprimento da fibra............................................................................................ 58 3.2 Seleção de Atributos e Imagens de Teste ................................................................. 60 3.3 Classificação das Imagens ........................................................................................ 66

CAPÍTULO 4 ................................................................................................................ 69

Page 18: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE

RESULTADOS E DISCUSSÕES ............................................................................... 69 4.1 Testes de Extração de Atributos ............................................................................... 69 4.1.1 Deficiência Convexa ............................................................................................. 69 4.1.2 Assimetria.............................................................................................................. 70 4.1.3 Densidade .............................................................................................................. 72 4.1.4 Direção Principal ................................................................................................... 75 4.1.5 Comprimento da fibra............................................................................................ 76 4.2 Testes de Seleção de Atributos................................................................................. 77 4.2.1 Imagem Sintética ................................................................................................... 77 4.2.2 Imagem Quickbird................................................................................................. 84

CAPÍTULO 5 ................................................................................................................ 87

CONCLUSÕES............................................................................................................. 87 5.1 Conclusões................................................................................................................ 87 5.2 Recomendações ........................................................................................................ 88 5.3 Trabalhos Futuros ..................................................................................................... 89

REFERÊNCIAS BIBLIOGRÁFICAS ....................................................................... 91

APÊNDICE A ............................................................................................................... 97

Page 19: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE

LISTA DE FIGURAS

2.1 Etapas para o processamento de Imagens no Texture ............................................. 30 2.2 – Deficiência convexa do objeto “O”...................................................................... 35 2.3 - Eixo menor e maior da elipse................................................................................ 35 2.4 - Direção principal de um objeto ............................................................................. 37 2.5 Comprimento da fibra de um objeto........................................................................ 37 2.6 Estratégia de Dutra e Huber (1999) para seleção de atributos ................................ 39 2.7 Roleta de cromossomos alocados em fatias proporcionais à aptidão...................... 44 2.8 Crossover de Um-ponto........................................................................................... 45 2.9 Mutação para representação binária ........................................................................ 46 3.1 Atributos do sistema Texture................................................................................... 50 3.2 Conjunto de Pontos do Objeto S.............................................................................. 51 3.3 Região triangular D ................................................................................................. 52 3.4 Círculos para triangulação de dalaunay................................................................... 52 3.5 Triangulação de delaunay........................................................................................ 52 3.6 Imagem Teste Deficiência Convexa........................................................................ 53 3.7 Imagem Teste Deficiência Convexa Rotacionada................................................... 53 3.8 Imagem Teste Assimetria ........................................................................................ 56 3.9 Imagem Teste Assimetria Rotacionada ................................................................... 56 3.10 Imagem Teste Densidade A................................................................................... 57 3.11 Imagem Teste Densidade B................................................................................... 57 3.12 Imagem Teste Densidade A Rotacionada.............................................................. 57 3.13 Imagem Teste Densidade B Rotacionada.............................................................. 57 3.14 Imagem Teste Direção Principal ........................................................................... 58 3.15 (a) Fronteira digital com uma grade de reamostragem sobreposta; (b) resultado da

eamostragem; (c) código da cadeia direcional de vizinhança 4 e (d) do código da cadeia direcional de vizinhança 8........................................................................... 59

3.16 Imagem Teste Comprimento da fibra.................................................................... 60 3.17 Imagem Teste Comprimento da fibra Rotacionada............................................... 60 3.18 Interface de seleção de atributos............................................................................ 63 3.19 Imagem sintética teste AG..................................................................................... 65 3.20 Imagem Quickbird teste AG.................................................................................. 65 3.21 Segmentação da imagem Quickbird ...................................................................... 65 4.1 Distribuição das amostras de treinamento para o atributo deficiência convexa...... 70 4.2 Imagem Teste Deficiência Convexa Classificada ................................................... 70 4.3 Imagem Teste Deficiência Convexa Rotacionada Classificada .............................. 70 4.4 Distribuição das amostras de treinamento para o atributo assimetria ..................... 71 4.5 Imagem Teste Assimetria Classificada.................................................................... 71 4.6 Imagem Teste Assimetria Rotacionada Classificada .............................................. 71 4.7 Distribuição das amostras de treinamento para a imagem teste densidade A ......... 72 4.8 Distribuição das amostras de treinamento para a imagem teste densidade B ......... 73 4.9 Imagem Teste Densidade A Classificada ................................................................ 73 4.10 Imagem Teste Densidade B Classificada .............................................................. 73

Page 20: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE

4.11 Imagem Teste Densidade A Rotacionada Classificada ......................................... 74 4.12 Imagem Teste Densidade B Rotacionada Classificada ......................................... 74 4.13 Imagem Teste Densidade A Classificada com Circularidade ............................... 74 4.14 Imagem Teste Densidade B Classificada com Circularidade................................ 74 4.15 Distribuição das amostras de treinamento para o atributo direção principal......... 75 4.16 Classificação Imagem Teste Direção Principal ..................................................... 75 4.17 Distribuição das amostras de treinamento para o atributo comprimento da fibra . 76 4.18 Imagem Teste Comprimento da fibra Classificada ............................................... 76 4.19 Imagem Teste Comprimento da fibra Rotacionada Classificada .......................... 76 4.20 Dispersão da adaptação dos indivíduos ................................................................. 80 4.21 Adaptação dos indivíduos AG Binário.................................................................. 81 4.22 Adaptação dos indivíduos AG Pemutação ............................................................ 82 4.23 Evolução da população para os AG binário e permutação.................................... 83 4.24 Imagem sintética teste AG classificada................................................................. 84 4.25 Classificação com atributos selecionados pelo AG Permutação........................... 85 4.26 Imagem Quickbird classificada com 46 atributos ................................................. 85

Page 21: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE

LISTA DE TABELAS

2.1 Exemplo de matriz de classificação (pixels)............................................................ 33 3.1 Descrição interface de seleção de atributos............................................................. 64 3.2 Atributos extraídos das regiões de treinamento....................................................... 66 4.1 Valores máximos e mínimos para o atributo direção principal ............................... 75 4.2 Resultado busca exaustiva de escolha fixa .............................................................. 77 4.3 Atributos selecionados pelos AG permutação e binário.......................................... 78

Page 22: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE
Page 23: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE

LISTA DE SIGLAS E ABREVIATURAS

AG - Algoritmo genético

ENVI - Enviroment for Visualizing Images

GIS - Sistema de Informação Geográfica

IDL - Interactive Data Language

JM - Jeffreys-Matusita

PMX - Partially matched crossover

ROI - Region of interest

SBS - Sequential Backward Feature Selection

SFS - Sequential Forward Feature Selection

Page 24: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE
Page 25: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE

LISTA DE SÍMBOLOS

π - Número PI

℮ - Exponencial

Page 26: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE
Page 27: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE

25

CAPÍTULO 1

INTRODUÇÃO

1.1 Contextualização

Os avanços tecnológicos cada vez maiores na área de sensores remotos têm gerado

imagens com maior poder de discriminação de alvos da superfície terrestre. Com a

possibilidade de discriminação de alvos urbanos, torna-se maior o número de aplicações

dos dados de sensoriamento remoto para estudos relativos ao sistema urbano (Donnay et

al., 2001) e aumenta-se a precisão das informações obtidas a partir deles (Souza et al.,

2003).

Para tratamento e obtenção de informações das imagens são usados sistemas de

processamento de imagens que abrangem operações como aquisição, armazenamento,

processamento e visualização. A operação de processamento pode envolver várias

etapas como pré-processamento, segmentação, extração de atributos, seleção de

atributos e classificação (Marques Filho; Vieira Neto, 1999). O foco deste trabalho é

direcionado às etapas de extração e seleção de atributos.

Extrair atributos significa extrair medidas associadas ao objeto que se deseja

reconhecer, de forma que essas medidas sejam semelhantes para objetos semelhantes e

diferentes para objetos distintos. Extrair medidas de forma dos objetos é uma importante

ferramenta para discriminar objetos de uma cena que possuem a mesma aparência

espectral com geometrias diferentes. No caso de cenas urbanas, a análise da forma se

torna ainda mais significativa uma vez que os objetos construídos pelo homem possuem

em geral formas geométricas bem definidas.

Uma grande dimensionalidade do espaço de atributos pode causar degradação na

classificação e um alto custo de processamento. O objetivo dos algoritmos de seleção de

atributos é escolher o menor subconjunto que ofereça a melhor classificação em

conformidade com custos computacionais razoáveis.

Page 28: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE

26

O método de classificação utilizado neste trabalho é a classificação por regiões.

Região é um conjunto de pixels contíguos pertencentes a um objeto. Os classificadores

de região utilizam, além da informação espectral de cada pixel, a informação espacial

que envolve a relação entre os pixels e seus vizinhos (Andrade et al., 2003a) (Gonzales;

Woods, 2000).

1.2 Objetivo do trabalho

O objetivo deste trabalho é aplicar métodos de extração e seleção de atributos para

classificação de regiões.

Pretende-se extrair medidas de forma das regiões da imagem, a fim de reconhecer

objetos intra-urbanos, principalmente arruamentos em imagens de sensoriamento

remoto de alta resolução espacial. Para isto são propostos cinco atributos: deficiência

convexa, assimetria, densidade, direção principal e comprimento da fibra.

Pretende-se selecionar atributos usando algoritmos genéticos. Os algoritmos

genéticos são métodos de busca e otimização baseados na evolução dos seres vivos

(Goldberg, 1989). Estes algoritmos partem do princípio que os indivíduos mais

adaptados ao seu ambiente são os que possuem maior chance de sobreviver e gerar

descendentes.

1.3 Organização do documento

Esta dissertação possui mais quatro capítulos, conforme descrito abaixo:

Capítulo 2: apresenta o conceito do sistema de processamento de imagens utilizado

neste trabalho e as técnicas desenvolvidas para extração e seleção de atributos.

Capítulo 3: descreve os materiais e métodos utilizados para o desenvolvimento das

técnicas de extração e seleção de atributos.

Capítulo 4: mostra os resultados e discussões dos testes realizados para verificação da

eficiência das técnicas propostas.

Page 29: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE

27

Capítulo 5: expõe as conclusões da aplicação das técnicas e sugere trabalhos futuros.

Page 30: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE

28

Page 31: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE

29

CAPÍTULO 2

FUNDAMENTAÇÃO TEÓRICA

Os métodos de extração e seleção de atributos utilizados na classificação de imagens

digitais constituem os pontos principais neste trabalho. Os métodos de extração são

direcionados a imagens urbanas de alta resolução. Para uma melhor compreensão

teórica destes métodos, uma breve descrição de imagens do espaço intra-urbano e as

etapas de seu processamento são apresentadas a seguir.

2.1 Sistema de Processamento de Imagens Texture

O ambiente urbano representa uma das áreas mais desafiadoras para o sensoriamento

remoto devido à alta diversidade espacial e espectral dos objetos presentes na superfície

da Terra (Herold et al., 2003). Áreas urbanas são compostas por numerosos materiais

(concreto, asfalto, metal, plástico, vidro, telhas, água, grama, árvores, arbustos e solo)

arranjados por seres humanos de diversas maneiras para construção de casas, sistemas

de transporte, indústrias, edifícios, áreas de recreação (Welch, 1982). A riqueza de

detalhes de uma imagem urbana de alta resolução torna o processamento dessas

imagens algo complexo e custoso.

O sistema de processamento de imagens Texture – A region classifier using

textural measures fornece um ambiente amigável ao usuário para extração e análise de

medidas texturais de imagens, e realiza a classificação de regiões baseada na pré-

seleção de medidas (Rennó et al., 1998) (www.dpi.inpe.br/texture). No trabalho

desenvolvido por Oliveira (2005) foram acrescentadas ao sistema funções de extração e

análise de medidas de formas tais como área, perímetro, complexidade e circularidade

além de alguns algoritmos para seleção de atributos. Na Figura 2.1 são mostradas etapas

típicas para análises de imagens neste sistema, onde as caixas brancas significam

resultados e entradas, as caixas azuis funções existentes hoje no sistema e as caixas

amarelas são funções realizadas fora do sistema Texture.

Page 32: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE

30

FIGURA 2.1 Etapas para o processamento de Imagens no Texture

2.1.1 Pré-Processamento

Uma imagem digital pode apresentar diversas imperfeições, tais como: presença de

pixels ruidosos, contraste e/ou brilho inadequados. As imagens podem ser corrompidas

por ruídos durante a aquisição ou durante a transmissão da imagem. A função da etapa

de pré-processamento é aprimorar a qualidade da imagem para etapas posteriores

(Marques Filho et al., 1999). O processo de correção das imperfeições nas imagens é

construído a partir do conhecimento a priori do fenômeno que causou a degradação.

Assim, técnicas de restauração são orientadas para a modelagem da degradação e

Page 33: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE

31

aplicação do processo inverso no sentido de recuperar a imagem original (Gonzales et

al., 2000).

2.1.2 Segmentação

A segmentação é um processo em que uma imagem é subdividida em partes ou objetos

constituintes (Andrade et al., 2003a). Estas partes ou objetos constituintes são regiões

conexas e homogêneas (Salembier; Marqués, 1999). Técnicas para segmentação de uma

imagem são encontradas em (Gonzales et al., 2000) e (Souza Júnior, 2005).

É importante ressaltar que a segmentação possui um papel muito importante na

classificação de regiões. O bom resultado de uma classificação de regiões é altamente

dependente de um bom resultado de segmentação.

2.1.3 Extração e Seleção de Atributos

O objetivo da extração de atributos é caracterizar medidas associadas com o objeto que

se deseja extrair, de forma que as medidas sejam similares para objetos similares e

diferentes para objetos distintos (Duda et al., 2001). O processo de extração de atributos

é fundamental para a obtenção de bons resultados na classificação, pois nesta fase é

criado o conjunto de características usado para a realização de treinamento e

classificação.

A seleção de atributos pode ser vista como um processo de busca onde o algoritmo

usado deve encontrar o menor subconjunto de atributos com a melhor acurácia de

classificação (Pappa, 2002). Uma grande dimensionalidade do espaço de atributos pode

causar degradação na classificação e um alto custo de processamento. Uma descrição

mais detalhada dos métodos de extração e seleção de atributos é apresentada nas seções

2.3 e 2.4.

2.1.4 Classificação

A classificação de imagens de sensoriamento remoto é um importante processo para

a produção de mapas temáticos, e uma das principais fontes de dados para os sistemas

Page 34: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE

32

de informações geográficas (Andrade et al., 2002). O sensoriamento remoto urbano não

é somente um ponto de encontro para ciências sociais e físicas, mas sim um campo de

pesquisa que forma uma ponte entre o sensoriamento remoto e o GIS – Sistema de

Informação Geográfica (Donnay et al., 2001).

O processo de classificação de uma imagem digital consiste na associação de

cada um dos seus pixels a um “rótulo” que descreve um objeto da superfície terrestre

gerando uma nova imagem onde é associada uma cor para cada classe, e todos os pixels

pertencentes a esta classe possuem a mesma cor. O resultado desta operação é um mapa

temático mostrando a distribuição geográfica das classes que compõem a cena

classificada.

Os métodos de classificação se dividem em duas categorias: a classificação

supervisionada e a não-supervisionada. A supervisionada, adotada pelo sistema Texture,

refere-se ao processo de classificação que usa um conjunto de amostras de treinamento

para classificar a imagem, enquanto que na classificação não-supervisionada o processo

de classificação não requer conhecimento a priori das classes em estudo. Alguns

exemplos de algoritmos de classificação supervisionada são: método da máxima

verossimilhança, planos discriminantes de Fisher, redes neurais. Na classificação não-

supervisionada as técnicas geralmente ad hoc, são baseadas na procura de agrupamentos

naturais no corpo de dados usando medidas de similaridade no processo de classificação

(Webb, 2002). Alguns exemplos são: isodata e k-médias.

No sistema Texture a classificação é aplicada a regiões previamente

identificadas. Os classificadores por regiões utilizam, além da informação espectral de

cada pixel, a informação espacial que envolve a relação entre os pixels e seus vizinhos.

Estes classificadores procuram simular o comportamento de um foto-intérprete ao

reconhecer áreas homogêneas de imagens, baseadas nas propriedades espectrais e

espaciais das imagens. Classificar regiões permite calcular medidas morfológicas das

feições que são essenciais na classificação de áreas de transporte e edificações (Carleer;

Wolff, 2006). A grande vantagem de classificar regiões é que o número de parâmetros

considerados na classificação pode aumentar, pois, além dos dados espectrais, é possível

Page 35: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE

33

descrever cada região usando parâmetros de forma, textura e associação entre objetos.

Com isto, os objetos podem ser mais adequadamente descritos. A grande desvantagem é

que o resultado, um mapa temático, é altamente dependente da segmentação, e os erros

de segmentação não podem ser corrigidos na classificação (Miqueles et al., 2003).

Um dos métodos existentes para avaliação de uma classificação é o cálculo do

coeficiente Kappa. Este coeficiente foi introduzido por (Cohen, 1960), sendo obtido a

partir da matriz de classificação, também conhecida como matriz de confusão ou matriz

de erros, que fornece a distribuição de pixels classificados correta e erroneamente. A

matriz de classificação é uma matriz quadrada capaz de mostrar a exatidão do resultado

de uma classificação, comparando este resultado com a verdade de campo, sendo esta

verdade dada por uma imagem ou por amostras que tomamos como representação da

realidade. Um exemplo de matriz de classificação dos pixels de uma imagem 400x400 é

ilustrado na Tabela 2.1.

TABELA 2.1 Exemplo de matriz de classificação (pixels) Verdade terrestre (Pixels)

Classe Vegetação Rua Construção Total

Vegetação 105690 0 0 105690 Rua 0 22875 0 22875 Construção 0 54 31381 31435 Total 105690 22929 31381 160000

O coeficiente Kappa k̂ é calculado pela Equação 2.1, onde n é o número de

pontos amostrados e r é o número de classes. O sinal de mais, representa a soma dos

elementos na linha/coluna correspondente.

∑∑

=++

=++

=

−= r

iii

r

iii

r

iii

xxn

xxxnk

1

2

11ˆ (2.1)

Page 36: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE

34

Para a matriz de classificação apresentada na Tabela 2.1, n = 160000 e r = 3,

logo k̂ = 0,9993.

Quando todos os elementos da matriz de classificação, fora da diagonal principal,

possuem valor nulo, o coeficiente Kappa alcançará o seu maior valor possível, no caso

1, o que significa um desempenho excelente. Quando nenhum dos pontos for

classificado corretamente, teremos o valor de Kappa igual a -1. Quanto menor o valor

do índice Kappa, pior é o desempenho do classificador.

Esse coeficiente foi desenvolvido para classificações ponto a ponto e não regiões,

embora utilizado neste trabalho vale ressaltar que existem questões a serem superadas

em relação ao uso deste coeficiente para classificações de regiões.

2.2 Extração de Atributos

Os atributos de forma são ferramentas poderosas para a discriminação de objetos que

possuem a mesma aparência espectral (Andrade et al., 2002). A análise da forma do

objeto é de fundamental importância para estudos relacionados com o espaço urbano.

Construções e asfalto na maioria das vezes apresentam aparência espectral muito

similar, o que dificulta a discriminação entre esses objetos. Essa dificuldade pode ser

menor se for levado em consideração que construções possuem uma forma retangular,

ao contrário do asfalto que possui uma forma mais alongada.

2.2.1 Deficiência Convexa

O fecho convexo “H” de um objeto “O” de uma imagem é o menor conjunto

convexo que contiver “O”. A diferença entre os conjuntos “H” e “O” é chamada

deficiência convexa “D” do objeto “O”. A área achurada na Figura 2.2 ilustra a

deficiência convexa do objeto “O”.

Page 37: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE

35

FIGURA 2.2 – Deficiência convexa do objeto “O”

A descrição de uma região pode basear-se na área de sua deficiência convexa, no

número de componentes de sua deficiência convexa, na posição relativa desses

componentes e assim por diante.

2.2.2 Assimetria

O atributo assimetria k (Asymmetry no eCongnition1) descreve o grau de alongamento

de um objeto a partir da relação entre o eixo menor n e o eixo maior m da elipse que

envolve este objeto. Quanto maior o comprimento de um objeto da imagem, maior é

essa relação (assimetria). Para o cálculo deste atributo usa-se a elipse que melhor se

ajusta ao objeto ou elemento analisado. O valor de k permanece no intervalo de 0 a 1.

mnk −= 1 (2.2)

FIGURA 2.3 - Eixo menor e maior da elipse

1 eCognition – Object Oriented Image Analysis é um software utilizado para classificação de imagens. Informações sobre esse software podem ser encontradas em sua homepage no endereço: http://www.definiens-imaging.com/

Page 38: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE

36

Os eixos desta elipse podem ser obtidos através da análise por componentes

principais (Richards, 1998). A partir dos valores das coordenadas dos pixels de uma

região é possível calcular a média e a matriz de covariância para cada região. A partir da

matriz de covariância (de dimensão igual a 2), podem ser estimados os dois autovalores

e os respectivos autovetores. Os autovetores estimam a direção dos dois eixos da elipse

gaussiana que descreve a distribuição dos dados e os autovalores o comprimento destes

eixos (variância nestas direções) (Andrade; Centeno, 2003b).

2.2.3 Densidade

Um outro atributo de forma utilizado no eCognition é o density d. A densidade

pode ser calculada segundo Equação 2.3,

)()(1 yVarxVarnd

++= (2.3)

onde n é o número de pixels que forma o objeto e Var(x) e Var(y) são as variâncias das

coordenadas x e y respectivamente. Quanto mais um objeto possui a forma arredondada,

maior a sua densidade.

2.2.4 Direção Principal

O atributo de direção principal de um objeto, também existente no eCognition, é

a direção do autovetor pertencente ao maior dos autovalores derivados da matriz de

covariância das coordenadas do objeto (Gonzales et al., 2000). Na Figura 2.4 a direção

do objeto pertence ao autovetor de cor vermelha.

Page 39: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE

37

FIGURA 2.4 - Direção principal de um objeto

2.2.5 Comprimento da fibra

Uma maneira de medir o comprimento aproximado de um objeto é através do parâmetro

conhecido como comprimento da fibra (Fiber Length). A Figura 2.5 ilustra esta medida.

FIGURA 2.5 Comprimento da fibra de um objeto

Segundo (Russ, 1991) uma das maneiras de se estimar é utilizando a Equação

2.4:

PerímetroÁreaPerímetrofibradaocompriment ∗−∗= 25,0 (2.4)

A demonstração do comportamento desta equação para as formas de círculo, quadrado e

retângulo encontra-se no Apêndice A.

Page 40: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE

38

2.3 Seleção de Atributos

Quando a dimensionalidade do espaço de atributos é grande, isso pode resultar em dois

tipos de problema (Bishop, 1995):

• Alto custo de processamento

• Geração do fenômeno conhecido como maldição da dimensionalidade

A maldição da dimensionalidade (ou fenômeno de Hughes) está ligada à

degradação na acurácia dos resultados da classificação com o aumento da

dimensionalidade dos dados, mantendo constante o número de amostras de treinamento

(Tadjudin; Landgrebe, 1998).

Em um maior nível de abstração, a seleção de atributos pode ser dividida em duas

partes: o método de busca e a função de avaliação usada para medir a qualidade dos

subconjuntos de atributos (Pappa, 2002). Os algoritmos de busca para seleção de

atributos são divididos em três grupos: exponenciais (busca exaustiva), seqüenciais e

randômicos (algoritmos genéticos) (Boz, 2002).

A busca exaustiva é o melhor critério de busca, pois são geradas todas as

combinações possíveis de atributos. Normalmente é um método inviável

computacionalmente devido ao seu tempo de processamento crescer exponencialmente

com o aumento do número de atributos disponíveis (Pappa et al., 2002).

Segundo Dutra e Huber (1999), os métodos seqüenciais de seleção de atributos

mais proeminentes são: Sequential Forward Feature Selection (SFS) e Sequential

Backward Feature Selection (SBS). No trabalho desenvolvido por (Oliveira, 2005),

foram implementados os métodos SFS, SBS e um algoritmo de escolha fixa do

subconjunto de atributos. Para todos esses métodos, o critério de qualidade adotado para

avaliação do melhor subconjunto foi a distância média Jeffreys-Matusita. Mais detalhes

em (Oliveira, 2005; Oliveira et al., 2005). Os algoritmos genéticos (método randômico)

será descrito no item 2.4.2.

Page 41: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE

39

O melhor critério de qualidade para avaliação dos subconjuntos de atributos é o

mínimo erro, onde as imagens são classificadas segundo os subconjuntos selecionados e

considera-se como o melhor subconjunto, aquele que apresenta a maior exatidão na

classificação. Adotar os critérios ótimos de busca e qualidade simultaneamente são

métodos “caros” computacionalmente devido ao tempo de processamento crescer

exponencialmente com o aumento do número de atributos. Possíveis soluções são adotar

critérios de busca “baratos (sub-ótimos)” com critérios de qualidade “caros (ótimos)”,

ou critérios de busca ótimos e qualidade sub-ótimos, ou ainda critérios de busca e

qualidade sub-ótimos. Dutra e Huber (1999) mencionam a estratégia a ser usada para

seleção de atributos, quando a dimensionalidade é muito alta, segundo a seguinte

seqüência da Figura 2.6.

FIGURA 2.6 Estratégia de Dutra e Huber (1999) para seleção de atributos

O objetivo dos algoritmos de seleção de atributos é escolher o menor subconjunto

que ofereça a melhor classificação em conformidade com custos computacionais

razoáveis.

2.3.1 Critérios de Qualidade Sub-Ótimos

Visando otimizar o conjunto de atributos para minimizar a probabilidade de erro na

classificação, deve-se maximizar a distância entre padrões ou atributos de classes

diferentes em tempo de escolha do atributo. Os critérios de qualidade são utilizados para

medir esta distância entre as classes no espaço de atributos. Abaixo são citados alguns

possíveis critérios de qualidade sub-ótimos.

Page 42: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE

40

• Distância Euclidiana: distância no espaço de atributos n-dimensional entre dois

pontos x = (x1, x2, ..., xn) e y = (y1, y2, ..., yn) definida por:

∑ =−=

n

i iie xyyxD1

2)(),( (2.5)

onde n representa o número de atributos.

• Distância de Mahalanobis: medida de similaridade entre o ponto (X) e o

centróide de uma distribuição. Essa medida depende da matriz de covariância

)(][)()( 1ii

tii XXxM µµ −−= −∑ (2.6)

onde µi é o vetor de média, centro da distribuição (Duda et al., 2001). e [Σi]-1

representa a inversa da matriz de covariância.

A distância de Mahalanobis entre duas classes é expressa de forma similar como

(Bow, 1984, , 1992):

)(][)( 1ji

tjiijM µµµµ −−= −∑ (2.7)

onde µi e µj são os vetores de média e [Σ]-1 é a inversa da matriz de média

ponderada das matrizes de covariância Σi e Σj (Chernoff, 1972).

• Distância de Bhattacharyya: medida de divergência entre duas populações

estatísticas definida por suas distribuições de probabilidade. Para o caso

Gaussiano a distância é dada por:

(2.8)

onde Σk e Σi são as matrizes de covariância das classes k e i, µk e µi são os

respectivos vetores de média (Bhattacharyya, 1943).

Para selecionar os atributos com base em distância entre classes, é necessário

definir uma função critério que possa avaliar a separabilidade entre todas as classes de

uma maneira global. A função critério para a maioria das distâncias citadas acima pode

ik

ik

ikikt

ikkiB∑∑

∑+∑

+−⎥⎦⎤

⎢⎣⎡ ∑+∑

−=−

2ln21)(

2)(

81 1

µµµµ

Page 43: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE

41

ser efetuada por uma simples operação de soma, média, desvio padrão e outras

características estatísticas entre os pares de classes existentes (Dutra; Huber, 1999). É

desejável que a função critério seja maior quanto menor for a redundância entre os

atributos e quanto maior for a facilidade de discriminar padrões de classes diferentes.

A distância Jeffreys-Matusita (JM) é uma transformação da distância de

Bhattacharyya de forma a limitar a influência da distância entre classes totalmente

separáveis, que no caso da distância de Bhattacharyya pode chegar a infinito (Dutra et

al., 1999). A distância JM entre as classes k e i é dada por:

)2,0[)1(2 ∈−= − JMeJM kiBki (2.9)

onde Bki representa a distância de Bhattacharyya entre as classes k e i. Segundo a

equação 2.9 a distância JM é limitada para o intervalo entre 0 e √2 sendo √2 para classes

totalmente separáveis. Para a seleção do subconjunto de atributos com maior

separabilidade entre as classes, pode-se usar a maior distância média JM entre os pares

de classes como função critério.

2.3.2 Algoritmos Genéticos (AG)

Algoritmos genéticos são métodos de busca e otimização baseados nos mecanismos de

evolução dos seres vivos. Foram desenvolvidos por John Holland, seus colegas e alunos

da Universidade de Michigan (Goldberg, 1989) , e popularizados por um de seus alunos,

David Goldberg. Estes algoritmos baseiam-se no processo da seleção natural e

sobrevivência dos mais aptos. Segundo o naturalista Charles Darwin, os indivíduos mais

adaptados ao seu ambiente são os que possuem maior chance de sobreviver e gerar

descendentes.

A otimização é um processo de busca visando a solução ótima ou sub-ótima de

problemas. Muitas vezes a otimização consiste em procurar várias soluções possíveis e

utilizar a informação obtida neste processo a fim de encontrar soluções cada vez

melhores (Lacerda; Carvalho, 1999a).

Page 44: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE

42

Os algoritmos genéticos iniciam seu processamento sobre uma população inicial de

candidatos explorando de forma paralela diferentes áreas do espaço de solução

(Goldberg, 1989). Como resultado, tais técnicas têm maior chance de atingir as áreas

mais promissoras do espaço de busca. Os AG têm se mostrado muito eficientes para

busca de soluções ótimas, ou aproximadamente ótimas, em diversos problemas das mais

variadas áreas (Carvalho et al., 2003).

Como foi dito anteriormente, o primeiro passo de um AG é a geração de uma

população inicial de indivíduos caracterizados por seus cromossomos que codificam as

possíveis soluções do problema. Durante o processo evolutivo, esta população é

avaliada e cada cromossomo recebe um valor, calculado pela função de aptidão,

refletindo sua habilidade de adaptação a determinado ambiente. Os cromossomos mais

aptos são selecionados e os menos aptos são descartados (Darwinismo). Os indivíduos

selecionados sofrem cruzamentos e mutações, gerando descendentes para a população

da próxima geração. Este processo é repetido até que uma solução satisfatória seja

encontrada (Goldberg, 1989) (Lacerda; Carvalho, 1999b). O Algoritmo 2.1 ilustra esse

procedimento.

Algoritmo 2.1: Algoritmo Genético

1: t = 0;

2: gerar população inicial P(t);

3: enquanto critério de parada não for satisfeito faça

4: para todo indivíduo i da população atual P(t) faça

5: Avaliar aptidão do indivíduo i;

6: fim para

7: t = t + 1;

8: Seleção, cruzamento e mutação a partir de P(t-1) para gerar nova população P(t);

9: fim enquanto

Page 45: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE

43

2.3.2.1 Representação

Um AG processa populações de indivíduos ou cromossomos. Um cromossomo é uma

estrutura de dados, geralmente um vetor ou uma cadeia de bits que representa uma

possível solução do problema a ser otimizado (Carvalho et al., 2003; Goldberg, 1989;

Lacerda et al., 1999b). O cromossomo representa o conjunto de parâmetros da função

de avaliação, também conhecida como função-objetivo, cuja resposta será maximizada

(ou minimizada). Se o cromossomo representa n parâmetros da função-objetivo, então o

espaço de busca possui n dimensões. O conjunto de todas as configurações que um

cromossomo pode adotar forma o espaço de busca (Lacerda et al., 1999a).

Quando o genótipo de um cromossomo é representado por um vetor binário,

cada elemento do vetor é um dígito binário (0 ou 1). Uma vez escolhida a representação

do cromossomo em vetores binários, os operadores genéticos são aplicados de forma

independente do problema, facilitando o uso dos AG em diferentes classes de

problemas. Essa característica de independer de parâmetros específicos do domínio do

problema determina a qualidade de robustez do algoritmo. Para facilitar a compreensão,

ao longo do texto esta forma de codificação será chamada de AG binário. Um exemplo

de cromossomo com esta representação é:

Cromossomo = 10111010011111011

Outra maneira de representar um cromossomo é através de uma lista de

elementos. Fazendo-se permutações em uma lista de elementos é possível criar vários

cromossomos. Permutações de n elementos são seqüências desses n elementos sem que

nenhum seja repetido. Para facilitar a compreensão em todo o texto esta forma de

codificação será chamada de AG permutação. Exemplos de dois cromossomos com os

elementos 1, 2, 3, 4 e 5 são:

Cromossomo A: 35142

Cromossomo B: 42351

Page 46: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE

44

2.3.2.2 Seleção dos Indivíduos

O AG começa com uma população inicial de n cromossomos. Quando não existe

nenhum conhecimento prévio sobre a região do espaço de busca onde se encontra a

solução do problema, na maioria das vezes, a população inicial é gerada de forma

aleatória. A cada cromossomo desta população é atribuído um valor dado pela função de

aptidão. Esta função recebe como entrada a codificação do cromossomo e fornece como

resultado sua aptidão (Carvalho et al., 2003). A partir dessa avaliação são selecionados

os indivíduos que serão submetidos ao cruzamento.

O método de seleção da roleta é o mais simples e também o mais utilizado

(Carvalho et al., 2003). Segundo Goldberg (1989), cada indivíduo possui uma fatia da

roleta proporcional à sua adaptação, que também representa a sua probabilidade de

seleção (Grefenstett, 1997). Este processo pondera as chances de seleção pelo valor da

adaptação, como ilustra a Figura 2.7 que por simplicidade considera uma população de

apenas quatro indivíduos de codificação binária.

11000 49,20%

01000 5,50%

10011 30,90%

01101 14,40%

FIGURA 2.7 Roleta de cromossomos alocados em fatias proporcionais à aptidão

Para a seleção dos indivíduos, a roleta é girada um determinado número de

vezes, definido pelo tamanho da população. A cada giro da roleta um indivíduo é

selecionado, tendo maior chance aqueles que possuem as maiores fatias.

Page 47: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE

45

2.3.2.3 Cruzamento e Mutação

Os operadores de cruzamento (crossover) e mutação são os principais mecanismos

dos AG para explorar regiões desconhecidas do espaço de busca. O crossover consiste

basicamente em misturar o material genético de dois indivíduos da população (pais),

produzindo dois novos indivíduos (filhos) que herdam características dos pais. O

crossover é aplicado com uma dada probabilidade a cada par de cromossomos

selecionados. Esta probabilidade, denominada de taxa de crossover, varia entre 60% e

90%. Não ocorrendo o crossover, os filhos serão iguais aos pais (isto permite que

algumas soluções sejam preservadas).

No cruzamento de Um-ponto, cada um dos cromossomos pais tem sua cadeia de

bits cortada em um ponto aleatório, produzindo duas partes cada cromossomo. As partes

são trocadas, gerando dois novos cromossomos (Goldberg, 1989).

FIGURA 2.8 Crossover de Um-ponto

Existem vários operadores genéticos para o AG permutação (Goldberg, 1989),

sendo um deles o crossover PMX. O crossover PMX se inicia com a escolha aleatória

de dois pontos de corte que definem uma sublista entre estes pontos. São realizadas

trocas no sentido de pai1 para pai2 e depois no sentido inverso para evitar cromossomos

inválidos. Este procedimento é ilustrado no exemplo seguinte. Considere os seguintes

pais e os dois cortes:

pai1 1 2 3 4 6 5 7 pai2 3 5 7 1 4 6 2

Page 48: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE

46

A primeira troca é feita no início da sublista, no sentido pai1, para pai2: 3 de pai1 é

trocado por 7 de pai2. Esta troca gera elementos duplicados, logo ao mesmo tempo 3 de

pai2 é trocado com 7 de pai1.

pai1 1 2 7 4 6 5 3 pai2 7 5 3 1 4 6 2

O procedimento também ocorre na segunda posição da sublista: 4 de pai1 é trocado com

1 de pai2. Simultaneamente 4 de pai2 é trocado com 1 de pai1.

pai1 4 2 7 1 6 5 3 pai2 7 5 3 4 1 6 2

Seguindo o mesmo processo, 6 de pai1 é trocado com 1 de pai2, e 6 de pai2 é trocado

com 1 de pai1. O resultado final é dado por:

pai1 4 2 7 6 1 5 3 pai2 7 5 3 4 6 1 2

A operação de mutação evita a convergência prematura do algoritmo, in-

troduzindo na busca novas regiões do espaço de soluções (Oliveira, 1998). Desta

maneira, assegura-se que a probabilidade de se chegar a qualquer ponto do espaço de

busca nunca será zero (Carvalho et al., 2003). Para o AG binário, o operador de

mutação inverte os valores de bits, ou seja, muda o valor de um dado bit de 1 para 0 ou

de 0 para 1.

FIGURA 2.9 Mutação para representação binária

Um dos métodos de mutação para o AG permutação consiste na escolha de dois

elementos do cromossomo de forma aleatória trocando suas posições.

Cromossomo: 1 2 3 4 6 5 7 Após a mutação: 1 6 3 4 2 5 7

Page 49: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE

47

A operação de mutação é feita com probabilidade baixa para cada gene do

cromossomo, algo em torno de um para mil, para não descaracterizar as boas soluções

encontradas até aquele momento (Goldberg, 1989; Oliveira, 1998). Nos AG, cada gene

representa um dos parâmetros codificados no cromossomo.

Não há um critério único para terminar a execução de um algoritmo genético.

Portanto podem ser usadas diferentes estratégias de parada, como por exemplo: após um

dado número de gerações; ou quando a aptidão média ou a do melhor indivíduo não

apresentar mais melhoras significativas; ou quando as aptidões dos indivíduos de uma

população se tornarem muito parecidas. Quando se conhece a resposta máxima da

função objetivo, é possível utilizar este valor como critério de parada (Carvalho et al.,

2003), porém muitas vezes não é garantido que se atinja tal valor.

Como os AG são de natureza estocástica, boas soluções podem deixar de ser

selecionadas para gerar descendência (Bittencourt, 1998) . Uma maneira de se evitar

isto é usar o conceito de elitismo, onde as n melhores soluções de uma geração passarão

automaticamente para a próxima. É importante observar que o melhor cromossomo

pode ser perdido de uma geração para outra devido ao corte do crossover ou à aplicação

da mutação. Por isso, pode ser interessante transportar os melhores cromossomos de

uma geração para outra, sem alterações (Lacerda et al., 1999b).

2.3.2.4 Função de Avaliação

A função de avaliação é utilizada para determinar o quão boa é uma solução

candidata para a resolução efetiva de um problema (Pappa, 2002). A escolha de uma

função de avaliação apropriada é um passo essencial para o sucesso de uma aplicação de

AG (Oliveira, 1998; Vafaie; De Jong, 1992, , 1993). Esta deve ser escolhida para cada

problema a ser resolvido (Beasley et al., 1993). A função de avaliação oferece ao AG

uma resposta sobre a aptidão de cada indivíduo da população (Goldberg, 1989) . O AG

usa esta informação para direcionar o processo de busca para a melhor solução (Vafaie

et al., 1993). O desempenho de um AG está condicionado à qualidade da avaliação da

adaptação dos indivíduos (Oliveira, 1998).

Page 50: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE

48

No caso deste trabalho, a função de avaliação usada é a distância média Jeffreys-

Matusita dada pela equação 2.9.

Page 51: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE

49

CAPÍTULO 3

MATERIAIS E MÉTODOS

Este capítulo apresenta a descrição dos algoritmos e interfaces criadas no sistema

Texture para o desenvolvimento deste trabalho. O sistema Texture foi desenvolvido na

linguagem IDL (Interactive Data Language) com o uso de funções do ENVI

(Enviroment for Visualizing Images). Este capítulo também ilustra as imagens sintéticas

e de sensoriamento remoto utilizadas na validação dos métodos de extração e seleção

dos atributos propostos. As imagens sintéticas foram usadas a fim de se obter um

completo controle sobre as regiões existentes na mesma, tanto na análise geométrica

como nos valores espectrais.

3.1 Extração de Atributos e Imagens de Teste

Os classificadores de regiões permitem considerar variantes geométricas e topológicas

como distância, perímetro, área, forma, conexão e textura para a realização das

classificações. O sistema Texture possui métodos de extração de atributos de textura e

forma divididos em quatro grupos: Distribucional, Co-ocorrência, Autocorrelação e

Forma (Oliveira, 2005). O sistema Texture foi desenvolvido para a linha de pesquisa de

processamento de imagens podendo ser utilizado em imagens de diferentes sensores

para diversas aplicações, como nas áreas médica e metalúrgica. Na Figura 3.1 é

apresentado um diagrama com todos os atributos existentes no sistema. As caixas em

vermelho destacam os atributos implementados neste trabalho.

Page 52: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE

50

FIGURA 3.1 Atributos do sistema Texture

As medidas extraídas de regiões das imagens são registradas em estruturas de dados

do tipo vetor. Utilizam-se esses vetores na seleção de atributos e na etapa de

classificação, examinando-se as distribuições estatísticas de cada atributo na distinção

das classes. Em conseqüência, a eficiência dos resultados apresentados pelo sistema está

diretamente ligada à delimitação das regiões através do processo de segmentação e da

aquisição dos ROIs (Region of interest) a partir do ENVI. A seguir serão descritos os

atributos de forma implementados neste trabalho.

Page 53: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE

51

3.1.1 Deficiência Convexa

Para cálculo da deficiência convexa usou-se o algoritmo quidkhull para determinar os

pontos pertencentes ao fecho convexo do objeto (Barber et al., 1996). Após isso foi feita

a triangulação de delaunay a partir dos pontos do fecho convexo. A área convexa foi

calculada somando-se a área de cada triângulo encontrado pela triangulação de

delaunay. Subtraiu-se a área convexa da área do objeto obtendo-se desta forma a área da

deficiência convexa do objeto. A área do objeto, que corresponde à quantidade de pixels

do objeto, foi calculada pela função já existente no sistema Texture (Oliveira, 2005).

O primeiro passo do quickhull é determinar quatro pontos extremos do conjunto

de pontos que forma o objeto S, esquerda, direita, acima e abaixo, ou seja, os quatro

pontos com máximas e mínimas ordenadas e abscissas. Posteriormente estes quatro

pontos são conectados formando um quadrilátero. Todos os pontos no interior deste

quadrilátero são descartados. Também é definido um retângulo envolvente mínimo para

o conjunto de pontos. Neste momento deve-se encontrar os pontos extremos nos quatro

triângulos definidos entre o quadrilátero inicial e o retângulo envolvente.

FIGURA 3.2 Conjunto de Pontos do Objeto S

Sabendo que para cada triângulo existem dois pontos pertencentes ao fecho

convexo, deve-se encontrar qual ponto contido no triângulo está mais distante do

segmento formado por estes pontos extremos, formando um novo triângulo. Na Figura

3.3, a região triangular D construída pelo passo inicial contém quatro pontos. Um

triângulo é formado entre os extremos já conhecidos e o mais distante deles, que é

naturalmente pertencente ao fecho convexo. Os pontos internos do triângulo D são

Page 54: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE

52

descartados, e as novas arestas do triângulo servem de base para a construção de novos

triângulos, recursivamente, até que nenhum ponto seja mais encontrado no interior ou

exterior (Barber et al., 1996) (Davis Jr.; Carvalho, 1999).

FIGURA 3.3 Região triangular D

Na triangulação de delaunay para uma dada distribuição de pontos deve-se

encontrar todos os triângulos definidos por três pontos da distribuição, de tal forma que

um círculo passando por estes três pontos não inclua nenhum outro ponto, conforme

Figura 3.4 (Davis Jr. et al., 1999).

FIGURA 3.4 Círculos para triangulação de dalaunay

Para cada conjunto de três pontos, deve-se gerar-se um triângulo conforme

Figura 3.5.

FIGURA 3.5 Triangulação de delaunay

Page 55: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE

53

Para realização dos testes deste atributo foi usada uma imagem de 500x500

pixels ilustrada na Figura 3.6 com três amostras para cada classe. A imagem foi

rotacionada conforme Figura 3.7 e processada com as mesmas amostras da Figura 3.6 a

fim de se verificar se o atributo é invariante em rotação.

Amostras: Rua = * Não-Rua = * FIGURA 3.6 Imagem Teste Deficiência

Convexa

FIGURA 3.7 Imagem Teste Deficiência Convexa Rotacionada

3.1.2 Assimetria

Implementou-se o atributo assimetria conforme Equação 2.2. Como dito anteriormente,

para o cálculo dos eixos da elipse foi usada a análise por componentes principais. A

análise por componentes principais é uma maneira de identificar padrões em dados. Os

passos seguidos para o cálculo foram:

1. Obter os dados das coordenadas x e y do objeto

2. Calcular a matriz de covariância entre as coordenadas. A covariância é

medida entre duas dimensões. A covariância entre uma dimensão e ela

mesma é chamada de variância.

Page 56: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE

54

)1())((

),cov( 1

−−= ∑ =

nyyxx

yxn

i ii

(3.1)

onde,

cov(x,y) = covariância entre duas dimensões =x média das coordenadas da dimensão x =y média das coordenadas da dimensão y n = número total de coordenadas logo, a matriz de covariância M é dada por:

⎥⎦

⎤⎢⎣

⎡=

),cov(),cov(),cov(),cov(

yyxyyxxx

M (3.2)

3. Calcular os autovetores e autovalores da matriz de covariância. Os

autovetores possuem comprimento igual a 1 e são ortogonais. O autovetor

de maior autovalor associado corresponde à componente principal do

conjunto de dados. Dizemos que um vetor y0 é um autovetor de uma matriz

quadrada M se M * y0 resulta num múltiplo de y0, ou seja, em λ * y0.

Dada a matriz de covariância ⎥⎦

⎤⎢⎣

⎡=

dcba

M e considerando λ um autovalor

de M, deve existir um vetor não nulo ⎥⎦

⎤⎢⎣

⎡=

0

00 y

xy , tal que M * y0 = λ * y0

Esta equação pode ser reescrita como:

⎩⎨⎧

=+=+

000

000

yydxcxybxa

λλ

(3.3)

que é equivalente ao sistema:

Page 57: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE

55

( )

( )⎩⎨⎧

=−+=+−

00

00

00

ydxcybxa

λλ

(3.4)

Uma vez que x0 e y0 não podem ser iguais a zero simultaneamente, então o

determinante do sistema é igual a zero. Isto é,

( )

( ) ( )( ) 0det =−−−=⎟⎟⎠

⎞⎜⎜⎝

⎛−

−bcda

dcba

λλλ

λ (3.5)

que se reduz à equação algébrica,

( ) 02 =−++− cbdada λλ (3.6)

A Equação 3.6 é uma equação de segundo grau cujas raízes são os

autovalores da matriz M. Para encontrar os autovetores correspondentes

substituem-se os autovalores assim encontrados, no sistema de equações

dado por 3.4.

Para realização dos testes deste atributo foi usada uma imagem de 400x400

pixels ilustrada na Figura 3.8 com nove amostras para cada classe. A imagem foi

rotacionada conforme Figura 3.9 e processada com as mesmas amostras da Figura 3.8 a

fim de verificar se o atributo é invariante em rotação.

Page 58: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE

56

Amostras: Rua = * Não-Rua = * FIGURA 3.8 Imagem Teste Assimetria

FIGURA 3.9 Imagem Teste Assimetria Rotacionada

3.1.3 Densidade

Implementou-se o atributo densidade conforme Equação 2.3, calculando as variâncias

das coordenadas x e y conforme Equação 3.1.

Para a realização dos testes deste atributo foram usadas duas imagens de

900x900 pixels ilustradas na Figuras 3.10 e 3.11 com três amostras para cada classe

(círculo, quadrado, retângulo e elipse). As imagens foram rotacionadas conforme

Figuras 3.12 e 3.13 e processadas com as mesmas amostras das Figuras 3.10 e 3.11

respectivamente a fim de verificar se o atributo é invariante em rotação.

Page 59: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE

57

Amostras: Círculo = * Quadrado = * Retângulo = * Elipse = *

FIGURA 3.10 Imagem Teste Densidade A

Amostras: Círculo = * Quadrado = * Retângulo = * Elipse = *

FIGURA 3.11 Imagem Teste Densidade B

FIGURA 3.12 Imagem Teste Densidade A Rotacionada

FIGURA 3.13 Imagem Teste Densidade B Rotacionada

Page 60: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE

58

3.1.4 Direção Principal

Implementou-se o atributo direção principal conforme equações 3.4 e 3.6. Para

realização dos testes deste atributo foi usada uma imagem de 500x500 pixels ilustrada

na Figuras 3.14 com cinco amostras para cada classe.

Amostras: Norte sul = * Leste oeste = * Sudoeste nordeste = * Sudeste noroeste = *

FIGURA 3.14 - Imagem Teste Direção Principal

3.1.5 Comprimento da fibra

Implementou-se o atributo comprimento da fibra conforme Equação 2.4. Para esta

equação foi usado o perímetro externo do objeto e a área correspondente a este

perímetro. Para estes cálculos foi utilizado o algoritmo find_boundary, um programa

open source desenvolvido por David Fanning (2006). Este algoritmo encontra os pixels

de borda de uma região para o cálculo do perímetro e calcula a área correspondente

(Fanning, 2006) (Russ, 1995). Para encontrar os pixels de borda este algoritmo se baseia

no algoritmo código de cadeia (Gonzales et al., 2000).

O algoritmo código de cadeia é usado para representar as fronteiras de regiões

através de segmentos de retas de tamanho e direção específicos. Esta representação

baseia-se tipicamente na 4- ou 8-conectividade, e a direção de cada segmento é

codificada usando-se um esquema de numeração chamado código de Freeman. Imagens

digitais são adquiridas e processadas em um formato de grade, com espaçamento

Page 61: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE

59

uniforme nas direções x e y. Desta forma, um código de cadeia pode ser gerado pela

perseguição no sentido horário dos segmentos que ligam cada par de pixels e atribuindo

o código de direção a cada segmento.

FIGURA 3.15 (a) Fronteira digital com uma grade de reamostragem sobreposta; (b)

resultado da reamostragem; (c) código da cadeia direcional de vizinhança 4 e (d) do código da cadeia direcional de vizinhança 8

Na Figura 3.15 (c) o código de cadeia é representado por 0033. . . 01 e em (d)

por 0766. . . 12. Evidentemente a precisão da representação depende do espaçamento da

grade utilizada.

Encontrados os pixels de borda, que são os pixels pertencentes ao perímetro, o

algoritmo find_boundary utiliza o método de Russ (1995) para encontrar a área

correspondente. Este método retorna a área de um polígono sendo dadas as coordenadas

de seus vértices. Considera-se o primeiro ponto do polígono conectado ao último ponto,

logo:

Page 62: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE

60

Área = 1/2 * [ x1y2 + x2y3 + x3y4 +...+x(n-1)yn + xny1 - y1x2 - y2x3 -...-y(n-1)xn -

ynx1) (3.7)

Para realização dos testes deste atributo foi usada uma imagem de 400x400

pixels, ilustrada na Figura 3.16 com nove amostras para cada classe. A imagem foi

rotacionada conforme a Figura 3.17 e processada com as mesmas amostras da Figura

3.16 a fim de verificar se o atributo é invariante em rotação.

Amostras: Rua = * Não-Rua = * FIGURA 3.16 Imagem Teste

Comprimento da fibra

FIGURA 3.17 Imagem Teste Comprimento da fibra

Rotacionada

3.2 Seleção de Atributos e Imagens de Teste

Para a realização da seleção de atributos neste trabalho foram usados dois algoritmos

genéticos diferentes: AG binário e AG permutação.

Como dito anteriormente, no AG binário o genótipo de um cromossomo é

representado por um vetor binário onde cada elemento do vetor é um dígito binário (0

ou 1). Um cromossomo de tamanho l corresponde a um vetor binário de atributos, onde

cada bit representa a presença ou ausência do atributo associado. Logo Xi = 0 representa

a ausência e Xi = 1 representa a presença do i-ésimo atributo (Vafaie et al., 1992, ,

1993). Para este AG foi usado o cruzamento de um ponto e mutação conforme descrito

na seção 2.4.2.3.

Page 63: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE

61

Conforme seção 2.4.2.1, para o AG permutação a representação do cromossomo

é feita através de uma lista de elementos que representam todos os atributos

considerados. Cada permutação em uma lista de elementos gera um cromossomo

diferente. Permutações de n elementos são seqüências desses n elementos sem que

nenhum seja repetido. Para este AG foi usado o cruzamento PMX e mutação conforme

descrito na seção 2.4.2.3.

Para situações, como a deste trabalho, onde foi necessário restringir o tamanho S

do subconjunto que se deseja encontrar, no AG permutação considerou-se apenas as S

primeiras posições para o cálculo da aptidão do cromossomo:

No caso do AG binário aplica-se um fator de penalização na expressão da função de

aptidão quando o número de atributos presentes no cromossomo não corresponde ao

tamanho S do subconjunto de atributos desejado. A função adotada neste trabalho foi:

openalizaçãsSd

openalizaçãc aptidaobaptidao // *−= (3.8)

onde b = constante de penalização dada pelo usuário; d = número de bits acesos; S =

tamanho do subconjunto de atributos desejado.

Não há um critério único para terminar a execução de um algoritmo genético; os

critérios utilizados neste trabalho foram: determinação do número de gerações ou

melhoras não significativas após C gerações, através da condição:

NCNN XKXX <− − (3.9)

onde XN = média da aptidão da população N; C = constante dada pelo usuário; K =

percentual de adaptação com valores entre 0 e 1, dado pelo usuário.

Page 64: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE

62

Nos dois AG implementados, para a avaliação de um indivíduo, como dito

anteriormente, foi usada a distância média Jeffreys-Matusita (JM) entre os pares de

classes; logo, para seleção dos indivíduos a roleta, método de seleção adotado, é alocada

com as respectivas distâncias, tendo mais chances de serem selecionados os indivíduos

que possuem os maiores valores. É considerado como melhor, o indivíduo que possui a

maior distância média Jeffreys-Matusita (JM) entre os pares de classes. Também para os

dois AG foi implementado o elitismo, onde o melhor indivíduo de uma geração é

passado para geração seguinte sem qualquer modificação.

A interface para seleção de atributos no sistema Texture é mostrada na Figura 3.18

e descrita na Tabela 3.1.

Page 65: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE

63

FIGURA 3.18 Interface de seleção de atributos

Page 66: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE

64

TABELA 3.1 Descrição interface de seleção de atributos 1 Conjunto de atributos 2 Tamanho do subconjunto 3 Métodos de seleção de atributos desenvolvidos por (Oliveira, 2005) 4 Tipo de AG 5 Constante de penalização para o AG binário (b da Equação 3.8) 6 Tamanho da população 7 Critétio da parada 8 Número de gerações para o critério de parada generation number ou constante C

(Equação 3.9) para critério de parada no improvements 9 Percentual de adaptação. Variável K da Equação 3.9 10 Taxas de crossover e mutação 11 Botão de execução do AG 12 Botão Limpar 13 Apresentação do subconjunto selecionado 14 Botão de Ok 15 Botão para cancelar

Um aspecto relevante nas interfaces do sistema Texture é a possibilidade da

aplicação dos métodos de seleção de atributos de forma iterativa, ou seja, podem-se usar

os métodos seqüenciais existentes ou os AG na seleção de um subconjunto de atributos,

e posteriormente usar o método de busca exaustiva de escolha fixa (Oliveira, 2005). Isso

se torna importante pois a complexidade dos métodos de busca exaustiva cresce

exponencialmente, impossibilitando o seu uso para um número alto de atributos.

Para avaliação dos resultados dos AG foram realizados testes em uma imagem

sintética e em uma imagem Quickbird de São José dos Campos com 0,6 m de resolução

espacial. Para as duas imagens foram colhidas amostras das classes “Rua” e “Não-Rua”.

A imagem sintética de 400x400 pixels é ilustrada na Figura 3.19 com nove amostras

para cada classe. A imagem Quickbird 280x280 pixels é ilustrada na Figura 3.20 com as

cinco amostras usadas para cada classe. O teste foi realizado com a banda G da imagem.

A segmentação da imagem Quickbird na Figura 3.21 foi feita manualmente dada a

necessidade de se ter uma segmentação com formas bem definidas. O bom desempenho

de um classificador de regiões é altamente dependente de uma boa segmentação.

Page 67: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE

65

Amostras: Rua = * Não-Rua = * FIGURA 3.19 Imagem sintética teste AG

Amostras: Rua = * Não-Rua = * FIGURA 3.20 Imagem Quickbird teste

AG

FIGURA 3.21 Segmentação da imagem Quickbird

Utilizou-se para a seleção de atributos todos os atributos disponíveis no sistema

conforme Figura 3.1. Para os atributos de co-ocorrência (Oliveira, 2005) utilizou-se uma

matriz 3x3. A Tabela 3.2 ilustra todos os atributos extraídos das regiões de treinamento.

Page 68: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE

66

TABELA 3.2 Atributos extraídos das regiões de treinamento F1 média (dist) F24 cluster prominense (cooc) F2 variância (dist) F25 média do vetor soma (cooc) F3 desvio padrão (dist) F26 variância do vetor soma (cooc) F4 desvio absoluto da média (dist) F27 entropia do vetor soma (cooc) F5 assimetria (dist) F28 energia do vetor soma (cooc) F6 curtose (dist) F29 média do vetor diferença (cooc) F7 coeficiente de variação (dist) F30 variância do vetor diferença (cooc) F8 mediana (dist) F31 entropia do vetor diferença (cooc) F9 entropia (dist) F32 energia do vetor diferença (cooc) F10 energia (dist) F33 contraste do vetor diferença (cooc) F11 média da log-normal (dist) F34 área (shape) F12 variância da log-normal (dist) F35 perímetro (shape) F13 desvio padrão da log-normal (dist) F36 complexidade (shape) F14 alpha da k-intensidade (dist) F37 circularidade (shape) F15 alpha da k-amplitude (dist) F38 direção principal (shape) F16 contraste (cooc) F39 assimetria (shape) F17 entropia (cooc) F40 densidade (shape) F18 energia (cooc) F41 comprimento da fibra (shape) F19 homogeniedade (cooc) F42 deficiência convexa (shape) F20 correlação (cooc) F43 lag 1,-1 (auto) F21 dissimilariadade (cooc) F44 lag 1, 0 (auto) F22 chi-quadrado (cooc) F45 lag 1, 1 (auto) F23 cluster shade (cooc) F46 lag 0, 1 (auto)

3.3 Classificação das Imagens

Todas as classificações realizadas nos testes deste trabalho foram feitas com o

classificador de distância euclidiana já disponível no sistema Texture. Para avaliação

dessas classificações foi usado o coeficiente kappa conforme seção 2.2.4. Para o cálculo

do coeficiente kappa da classificação de todas as imagens sintéticas usadas neste

trabalho foram usadas imagens de referência. Já para a imagem Quickbird foram usadas

amostras de referência conforme Figura 3.22.

Page 69: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE

67

Amostras: Rua = * Não-Rua = * FIGURA 3.22 Amostras de referência

Page 70: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE

68

Page 71: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE

69

CAPÍTULO 4

RESULTADOS E DISCUSSÕES

O objetivo deste capítulo é avaliar e discutir os resultados encontrados na aplicação dos

métodos de extração e seleção de atributos propostos neste trabalho.

4.1 Testes de Extração de Atributos

Os resultados encontrados nos experimentos realizados utilizando imagens sintéticas

para a avaliação dos atributos de forma propostos são apresentados a seguir.

4.1.1 Deficiência Convexa

O atributo deficiência convexa apresentou bom resultado na separabilidade das classes:

Rua *; Não-Rua *; conforme Figura 4.1. Esta figura ilustra uma interface do sistema

Texture que, utilizando os dados das amostras de treinamento, é capaz de apresentar

visualmente a separabilidade entre classes para um determinado atributo. O eixo x do

gráfico (groups) representa as classes, e o eixo y os valores encontrados para as

amostras de treinamento segundo o atributo que está sendo analisado. No caso da Figura

4.1 Groups: 1 = Rua; 2 = Não-Rua. Vale ressaltar que os valores mínimos e máximos

extraídos das amostras de treinamento para as classes foram: Rua: 9399,50 e 19710,0

respectivamente; Não-Rua: 0 e 0.

O valor do coeficiente kappa encontrado para a classificação (Figura 4.2),

usando a imagem de referência, foi igual a 1. O teste realizado na imagem rotacionada

verificou que este atributo é invariante em rotação conforme Figura 4.3.

Page 72: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE

70

1 = Rua 2 = Não-Rua

FIGURA 4.1 Distribuição das amostras de treinamento para o atributo deficiência convexa

FIGURA 4.2 Imagem Teste Deficiência Convexa Classificada

FIGURA 4.3 Imagem Teste Deficiência Convexa Rotacionada

Classificada

4.1.2 Assimetria

O atributo assimetria apresentou bom resultado na separabilidade das classes: Rua *;

Não-Rua *; conforme Figura 4.4, onde Groups: 1 = Rua; 2 = Não-Rua.

Page 73: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE

71

O valor do coeficiente kappa encontrado para a classificação (Figura 4.5),

usando a imagem de referência, foi igual a 0,9853. O teste realizado na imagem

rotacionada verificou que este atributo é invariante em rotação conforme Figura 4.6.

1 = Rua 2 = Não-Rua

FIGURA 4.4 Distribuição das amostras de treinamento para o atributo assimetria

FIGURA 4.5 Imagem Teste Assimetria Classificada

FIGURA 4.6 Imagem Teste Assimetria Rotacionada Classificada

Page 74: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE

72

4.1.3 Densidade

A classificação da imagem da Figura 3.10 apresentou um coeficiente kappa, calculado a

partir da imagem de referência, de 0,8177. A separabilidade entre as classes pode ser

vista na Figura 4.7, onde Groups: 1 = Quadrado; 2 = Retângulo; 3 = Círculo; 4 = Elipse.

1 = Quadrado 2 = Retângulo 3 = Círculo 4 = Elipse

FIGURA 4.7 Distribuição das amostras de treinamento para a imagem teste densidade A

Observa-se nas Figuras 4.7 e 4.9 que houve uma confusão entre as elipses e

retângulos. A classificação da imagem da Figura 3.11 apresentou um coeficiente kappa,

também calculado a partir da imagem de referência, de 0,7938. A separabilidade entre

as classes para a Figura 3.11 pode ser vista na Figura 4.8, onde Groups: 1 = Quadrado;

2 = Retângulo; 3 = Círculo; 4 = Elipse. Observa-se na Figura 4.10 que houve uma

confusão entre as elipses e retângulos; círculos e quadrados.

Com estes testes verifica-se que o atributo densidade é bom para distinguir objetos

redondos dos demais objetos, mas para isso a área de todos esses objetos precisa ter

valores próximos. Isso pode ser visto na Figura 4.9. Quando formas iguais possuem

áreas diferentes acontece uma confusão (Figura 4.10). Logo, verifica-se que o bom

desempenho deste atributo está ligado à área dos objetos considerados.

Nas Figuras 4.13 e 4.14 são mostradas as mesmas imagens teste classificadas com o

atributo circularidade (compactness) já existente no sistema Texture (Oliveira, 2005). O

Page 75: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE

73

atributo circularidade consegue separar os círculos dos demais objetos,

independentemente da área. Logo, para se reconhecer objetos redondos em imagens, o

atributo circularidade se apresenta mais apropriado.

Os testes realizados com o atributo densidade nas imagens rotacionadas mostraram

que este atributo é invariante em rotação conforme Figuras 4.11 e 4.12 .

1 = Quadrado 2 = Retângulo 3 = Círculo 4 = Elipse

FIGURA 4.8 Distribuição das amostras de treinamento para a imagem teste densidade B

FIGURA 4.9 Imagem Teste Densidade A Classificada

FIGURA 4.10 Imagem Teste Densidade B Classificada

Page 76: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE

74

FIGURA 4.11 Imagem Teste Densidade A Rotacionada Classificada

FIGURA 4.12 Imagem Teste Densidade B Rotacionada Classificada

FIGURA 4.13 Imagem Teste Densidade A Classificada com Circularidade

FIGURA 4.14 Imagem Teste Densidade B Classificada com Circularidade

Page 77: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE

75

4.1.4 Direção Principal

O atributo direção principal apresentou ótimo resultado na separabilidade das classes:

Norte sul *; Leste oeste *; Sudoeste nordeste *; Sudeste noroeste *; conforme Figura

4.15. Os valores mínimos e máximos extraídos das amostras de treinamento para as

classes estão na Tabela 4.1. O valor do coeficiente kappa encontrado para a

classificação (Figura 4.16), usando a imagem de referência, foi igual a 1.

TABELA 4.1 Valores máximos e mínimos para o atributo direção principal Classe Mínimo Máximo Norte sul (Groups: 1) 1,57080 1,570802 Leste oeste (Groups: 2) 0 0 Sudoeste nordeste (Groups: 3) 0,987170 1,19999 Sudeste noroeste (Groups: 4) 2,17496 2,35619

1 = Norte sul 2 = Leste oeste 3 = Sudoeste

nordeste 4 = Sudeste noroeste

FIGURA 4.15 Distribuição das amostras de treinamento para o atributo direção principal

FIGURA 4.16 Classificação Imagem Teste Direção Principal

2 Trabalhou-se com até oito casas decimais para checar a evolução do AG. Deve-se notar que o pequeno número de amostras disponíveis para o cálculo da distância JM não permite a confiança na existência de um grande número de algarismos significativos.

Page 78: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE

76

4.1.5 Comprimento da fibra

O atributo comprimento da fibra apresentou ótimo resultado na separabilidade das

classes: Rua *; Não Rua *; conforme Figura 4.17, onde Groups: 1 = Rua; 2 = Não-Rua.

O valor do coeficiente kappa encontrado para a classificação (Figura 4.18), usando a

imagem de referência, foi igual a 1. O teste realizado na imagem rotacionada verificou

que este atributo é invariante em rotação conforme Figura 4.19.

1 = Rua 2 = Não-Rua

FIGURA 4.17 Distribuição das amostras de treinamento para o atributo comprimento da fibra

FIGURA 4.18 Imagem Teste Comprimento da fibra Classificada

FIGURA 4.19 Imagem Teste omprimento da fibra Rotacionada Classificada

Page 79: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE

77

4.2 Testes de Seleção de Atributos

Os resultados encontrados nos experimentos realizados utilizando uma imagem sintética

e uma imagem de sensoriamento remoto para a avaliação dos métodos de seleção de

atributos propostos são apresentados a seguir.

4.2.1 Imagem Sintética

A Tabela 4.2 apresenta os resultados alcançados na seleção de atributos, usando o

método de busca exaustiva de escolha fixa (Oliveira, 2005) existente no sistema

Texture, e da classificação da imagem da Figura 3.19 usando os respectivos atributos

selecionados. A fim de se facilitar o entendimento, no decorrer do texto os atributos

selecionados por este método serão chamados de solução ideal.

TABELA 4.2 Resultado busca exaustiva de escolha fixa Qtd Atributos Atributos Selecionados * Média JM Kappa

1 F37 1,3238615 0,9993 2 F37, F40 1,41414986 0,9996 3 F36, F37, F39 1,41421334 0,9794 4 F1, F37, F40, F43 1,41421356 0,9927

* As siglas referem-se aos atributos descritos na Tabela 3.2

A Tabela 4.3 ilustra os resultados alcançados na seleção de atributos usando os AG

permutação e binário. Os parâmetros usados para os AG foram: população = 900

indivíduos; taxa de crossover = 0,6; taxa de mutação = 0,0333; critério de parada =

melhoras não significativas com C = 5 e K = 0,01 (Equação 3.9); constante de

penalização = 0,7 (Equação 3.8).

Para a seleção de um atributo, com o AG permutação foi possível chegar à solução

ideal com um número menor de gerações.

Na seleção de dois atributos, o AG permutação alcançou a solução com a

quantidade de atributos desejada pelo usuário em 10 gerações. Com os mesmos

parâmetros o AG binário não encontrou a solução com a quantidade de atributos

desejada pelo usuário gastando ainda para isto 16 gerações. Vale ressaltar que o método

do AG permutação sempre apresentará ao usuário, independente dos parâmetros

Page 80: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE

78

utilizados, uma solução com a quantidade de atributos escolhida por ele. Com o método

do AG binário isto não acontece, tal como a seleção de dois atributos deste teste, mas

uma vez ajustados novos parâmetros o AG binário convergirá eficientemente para a

solução desejada. Os diversos parâmetros que envolvem a implementação de um AG

precisam ser ajustados de modo a otimizar o desempenho do algoritmo . Em geral este

ajuste é feito por tentativa-e-erro através da realização de testes (Oliveira, 1998).

TABELA 4.3 Atributos selecionados pelos AG permutação e binário

AG Qtd Atributos

Atributos Selecionados *

Número de Gerações

Alcançado Média JM Kappa

Binário F37 42 1,3238615 0,9993 Permutação 1 F37 9 1,3238615 0,9993

Binário F37 16 1,85340604 0,9993 Permutação 2 F37, F40 10 1,41414986 0,9996

Binário F35, F37, F36 16 1,41420174 0,9993 Permutação 3 F36, F37, F39 8 1,41421334 0,9794

Binário F25, F35, F37, F40 14 1,41421334 0,9966 Permutação 4 F1, F37, F40, F43 9 1,41421356 0,9927

* As siglas referem-se aos atributos descritos na Tabela 3.2

Para a seleção de três atributos, o AG permutação alcançou a solução ideal com um

número menor de gerações. É importante observar nesse exemplo que o subconjunto

que apresentou a maior distância média JM não foi o que apresentou o maior coeficiente

kappa na classificação. Isso se deve ao fato de que métodos de seleção que utilizam

distâncias estatísticas garantem uma boa separabilidade entre as classes, mas uma boa

classificação depende também do classificador utilizado.

Na seleção de quatro atributos, o AG permutação encontrou a solução com um

número menor de gerações, sendo esta a solução ideal. Para encontrar a solução ideal,

no método da busca exaustiva de escolha fixa, foram analisadas 163.185 combinações

possíveis de atributos, enquanto o AG permutação encontrou a solução analisando 8.100

(tamanho da população x número de gerações alcançado). Para a seleção de quatro

atributos com o AG permutação, gráficos de dispersão da adaptação entre os indivíduos

Page 81: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE

79

da população inicial, e das populações da 5a e da 9a geração são apresentados na Figura

4.20.

Para uma noção mais clara a respeito da convergência dos AG, as Figuras 4.21 e

4.22 mostram o comportamento da adaptação do melhor indivíduo (máximo) e da média

da população em função da geração para os AG binário e permutação respectivamente.

Os gráficos da Figura 4.23 mostram de modo conjunto, para os AG permutação e

binário, a evolução da média da adaptação dos indivíduos, e a evolução do máximo

indivíduo da população, respectivamente.

É importante observar que no caso do AG permutação a população inicial, ainda

que formada de modo aleatório, possui todos os indivíduos com excelente aptidão uma

vez que seus cromossomos já satisfazem o critério do tamanho do subconjunto de

atributos. No caso do AG binário, a sua população inicial, também gerada de forma

aleatória, possui cromossomos com todos os tamanhos de subconjuntos de atributos,

fazendo com que a aptidão média seja muito baixa. No entanto, dirigido pelas

penalizações aos cromossomos inadequados, o AG binário evolui eficientemente para a

solução desejada.

Page 82: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE

80

Dispersão da Adaptação da População Inicial

0

0,2

0,4

0,60,8

1

1,2

1,4

1,6

0 100 200 300 400 500 600 700 800 900

Índice do Indivíduo

Aptid

ão

Dispersão da Adaptação da População na 5a geração

00,2

0,40,60,8

11,2

1,41,6

0 100 200 300 400 500 600 700 800 900

Índice do Indivíduo

Apt

idão

Dispersão da Adaptação da População na 9a Geração

00,2

0,40,60,8

11,2

1,41,6

0 100 200 300 400 500 600 700 800 900

Índice do Indivíduo

Apt

idão

FIGURA 4.20 Dispersão da adaptação dos indivíduos

Page 83: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE

81

Evolução do Máximo no AG Binário

00,2

0,40,6

0,81

1,21,4

1,6

1 2 3 4 5 6 7 8 9 10 11 12 13 14Geração

Apt

idão

Evolução da Média da População no AG Binário

0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

1 2 3 4 5 6 7 8 9 10 11 12 13 14Geração

Apt

idão

FIGURA 4.21 Adaptação dos indivíduos AG Binário

Page 84: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE

82

Evolução do Máximo no AG Permutação

1,41421281,41421291,414213

1,41421311,41421321,41421331,41421341,41421351,4142136

1 2 3 4 5 6 7 8 9

Geração

Apt

idão

Evolução da Média da População no AG Permutação

1,26

1,27

1,28

1,29

1,3

1,31

1,32

1 2 3 4 5 6 7 8 9

Geração

Apt

idão

FIGURA 4.22 Adaptação dos indivíduos AG Pemutação

Page 85: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE

83

Evolução do Máximo da População

0

0,2

0,4

0,6

0,8

1

1,2

1,4

1,6

1 2 3 4 5 6 7 8 9 10 11 12 13 14

Geração

Apt

idão

PermutaçãoBinário

Evolução da Média da População

0

0,2

0,4

0,6

0,8

1

1,2

1,4

1 2 3 4 5 6 7 8 9 10 11 12 13 14

Geração

Apt

idão

PermutaçãoBinário

FIGURA 4.23 Evolução da população para os AG binário e permutação

Baseado nos resultados dos testes realizados verifica-se que o AG permutação se

mostrou um método mais eficiente e robusto do que o AG binário na solução do

problema.

A imagem classificada (Figura 4.24) com os quatro atributos selecionados pelo AG

permutação alcançou um coeficiente kappa de 0,9927.

Page 86: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE

84

FIGURA 4.24 Imagem sintética teste AG classificada

4.2.2 Imagem Quickbird

No teste da imagem Quickbird, para a seleção de três atributos foi utilizado o AG

permutação com os seguintes parâmetros: população = 1.000 indivíduos; taxa de

crossover = 0,6; taxa de mutação = 0,0333; critério de parada = melhoras não

significativas com C = 5 e K = 0,01. O subconjunto selecionado (Perímetro, cluster

prominence e média do vetor soma) possui aptidão de 1,41421356.

A classificação realizada com os atributos encontrados pelo AG permutação é

mostrada na Figura 4.25. O coeficiente kappa encontrado para esta classificação foi de

0,9663. Como dito anteriormente, para o cálculo deste coeficiente foram usadas

amostras de referência ilustradas na Figura 3.22.

Para comparação com o resultado do AG permutação também foi feita uma

classificação com três atributos que foram selecionados pela busca exaustiva de escolha

fixa (Oliveira, 2005). Os atributos selecionados, segundo Tabela 3.2, foram F40, F41 e

F45. Esta classificação obteve um coeficiente Kappa de 0,8647 calculado também com

as amostras de referência da Figura 3.22.

Na Figura 4.26 é mostrada a classificação da imagem Quickbird usando todos os

quarenta e seis atributos extraídos das regiões de treinamento (Tabela 3.2). Observa-se

Page 87: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE

85

nesta classificação uma degradação muito grande, ou seja, o número de regiões

classificadas corretamente é menor do que na Figura 4.25.

FIGURA 4.25 Classificação com atributos selecionados pelo AG Permutação

FIGURA 4.26 Imagem Quickbird Classificada com 46 atributos

Page 88: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE

86

Page 89: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE

87

CAPÍTULO 5

CONCLUSÕES

5.1 Conclusões

Os objetivos propostos neste trabalho foram alcançados uma vez que os algoritmos de

extração de atributos de forma e seleção de atributos obtiveram resultados bastante

eficientes.

Os atributos de forma desenvolvidos obtiveram resultados eficientes nos testes

realizados com imagens sintéticas. Estes testes comprovam a viabilidade da utilização

desses atributos em análise de imagens. O atributo densidade se apresentou menos

eficiente que o atributo circularidade no reconhecimento de objetos arredondados de

tamanhos diferentes. Exceto o atributo de direção principal, todos os demais se

mostraram invariantes em rotação.

No processo de classificação, uma quantidade alta de atributos pode não aumentar a

precisão do classificador; isso acontece devido à redundância das informações. Os

resultados obtidos neste trabalho mostram a viabilidade em se utilizar métodos de

seleção de atributos, objetivando a redução da dimensionalidade sem haver perda no

poder discriminatório entre as classes. Os AG binário e permutação, propostos neste

trabalho, mostraram seu poder ao encontrar boas soluções, porém como dito

anteriormente, o AG permutação se mostrou um método mais eficiente e robusto do que

o AG binário na solução deste problema.

Também é importante dizer que se obter uma boa classificação não depende apenas

dos métodos de seleção de atributos, mas também do classificador utilizado. Um dos

exemplos foi a classificação feita na imagem Quickbird de São José dos Campos, onde

foi selecionada pela busca exaustiva a combinação de atributos, entre todas as possíveis,

que oferecia a maior distância média JM entre as classes; porém a classificação obtida

Page 90: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE

88

com os atributos selecionados pelo AG permutação, que possuem um distância média

JM menor, obteve um coeficiente kappa maior.

As principais contribuições deste trabalho foram:

• Adição de novos atributos de forma ao sistema Texture.

• Desenvolvimento e testes de algoritmos genéticos como método de busca

em problemas de seleção de atributos.

• Demonstração de eficiência do método proposto para estudos intra-urbanos.

• Disponibilização de métodos automáticos de seleção de atributos para

classificação de regiões não existente em softwares comerciais ou livres

disponíveis atualmente.

5.2 Recomendações

Dos métodos implementados neste trabalho, para a realização da seleção automática de

atributos no sistema Texture recomenda-se a utilização do AG permutação, uma vez que

este algoritmo, como dito anteriormente, sempre apresentará ao usuário, independente

dos parâmetros utilizados, uma solução com a quantidade de atributos escolhida por ele.

Como critério de parada recomenda-se utilizar o de melhoras não-significativas

alterando os parâmetros K e C conforme equação 3.9. O resultado do AG pode ser

melhorado aumentando-se o tamanho da população. O sistema apresenta sugestões de

taxa de cruzamento e mutação baseado na literatura utilizada. Estas taxas podem ser

variadas, mas é importante citar que uma probabilidade de mutação muito alta não

favorece o AG (Oliveira, 1998).

Page 91: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE

89

5.3 Trabalhos Futuros

Como evolução natural do sistema Texture, recomenda-se:

• Ampliar o conjunto de atributos de forma do sistema, uma vez que a utilização

destes atributos, como comprovado por este trabalho, é de fundamental

importância na separabilidade de regiões que possuem respostas espectrais

similares e geometrias diferentes.

• Agregar ao sistema um processo robusto de segmentação de imagens, sabendo

que o bom desempenho de um classificador de regiões está diretamente ligado a

uma segmentação que defina eficientemente a forma dos objetos.

• Adicionar ao sistema medidas de avaliação da classificação através de análise

estatística.

• Desenvolver novos critérios de parada para os algoritmos genéticos propostos

neste trabalho a fim de se obter resultados ainda melhores.

Considerando a possibilidade do desenvolvimento de um sistema de processamento de

imagens de acesso livre, algumas questões do sistema Texture precisam ser resolvidas.

Deve-se elaborar um estudo para a modificação das funções ENVI para funções

específicas do IDL. Isto se deve ao fato do IDL possuir um utilitário (IDL Virtual

Machine) multi-plataforma de distribuição gratuita para executar aplicações compiladas

em código IDL. O IDL Virtual Machine proporciona aos desenvolvedores a

possibilidade de distribuir suas aplicações IDL sem a necessidade de uma licença.

Page 92: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE

90

Page 93: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE

91

REFERÊNCIAS BIBLIOGRÁFICAS

Andrade, A. F.; Botelho, M. F.; Centeno, J. A. S. Classificação de imagens de alta resolução integrando variáveis espectrais e forma utilizando redes neurais artificiais. In: Simpósio Brasileiro de Sensoriamento Remoto, 2003a, Belo Horizonte. Anais...São José dos Campos: INPE, 2003, p. 265-272. Disponível em: <http://marte.dpi.inpe.br/rep-/ltid.inpe.br/sbsr/2002/11.14.14.55> Acesso em: 7 mar. 2005. Andrade, A. F.; Centeno, J. A. S. Integração de informações espectrais e de forma na classificação de imagens com redes neurais. Boletim de Ciências Geodésicas, v. 9. n. 2, p. 217-231, jul-dez 2003. Disponível em: http://calvados.c3sl.ufpr.br/bcg/viewarticle.php?id=91. Acesso em: 16 abr. 2005. Andrade, A. F.; Centeno, J. A. S.; Araki, H. Utilização de parâmetros de forma como dado auxiliar na classificação de imagens Ikonos através de redes neurais artificiais. In: Simpósio Brasileiro de Geomática, 2002, Presidente Prudente, SP. Anais... Presidente Prudente: Unesp, 2002. p. 342-349. Disponível em: http://www.geomatica.ufpr.br/docentes/centeno/pessoal/download/2002/andreaf_unesp_A_091.pdf Acesso em: 15 dez. 2004. Barber, C. B.; Dobkin, D. P.; Huhdanpaa, H. The quickhull algorithm for convex Hulls. ACM Transactions on Mathematical Software, v. 22, n. 4, p. 469-483. Disponível em: http://portal.acm.org/citation.cfm?id=235821&coll=ACM&dl=ACM&CFID=6489668&CFTOKEN=40908650. Acesso em: 27 abr 2007. Beasley, D.; Bull, D. R.; Martin, R. R. An overview of genetic algorithms: part 1, fundamentals. 1993, p. 58-69. Disponível em: http://www.geocities.com/egmlacerda/curso_ag.html. Acesso em: 7 mar. 2005. Bhattacharyya, A. On a measure of divergence between two statistical populations defined by their probability distributions. Bulletin of the Calcutta Mathematics Society v. 35, p. 99–110, 1943. Bishop, C. M. Neural networks for pattern recognition. New York: Oxford University Press, 1995. 482 p. Bittencourt, G. Inteligência artificial ferramentas e teorias. Florianópolis - SC: Editora da UFSC, 1998. 319 p. Bow, S. Pattern recognition applications to large data-set problems. New York: Marcel Dekker, Inc, 1984. 323 p.

Page 94: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE

92

___. Pattern recognition and image preprocessing. New York: Marcel Dekker, Inc, 1992. 558 p. Boz, O. Feature Subset Selection by Using Sorted Feature Relevance. In: International Conference on Machine Learning and Applications (ICMLA' 02), 2002, Las Vegas, Nevada, USA. Proceedings…Las Vegas: CSREA Press, 2002. p. 147-153. ISBN 1-892512-29-7. Disponível em: http://www.doc.ic.ac.uk/~xh1/Referece/feature-selection/Feature-Subset-Selection-by-Using-Sorted-Feature-Relevance.pdf Acesso em: 7 jul. 2005. Carleer, A. P.; Wolff, E. Urban land cove multi-level region-based classification of VHR data by selecting relevant features. International Journal of Remote Sensing, v. 27, n. 6, p. 1035-1051, 20 mar 2006. Carvalho, A. C. P. L. F.; Braga, A. P.; Ludermir, T. B. Computação evolutiva. In: Rezende, S. O. (org.).Sistemas inteligentes fundamentos e aplicações. Barueri: Manole, 2003, p. 225-248. Chernoff, H. The selection of effective attributes for deciding between hypotheses using Linear discriminant functions. In: Watanabe, S. (Ed.). Frontiers of pattern recognition. New York: Academic Press, Inc, 1972, p. 55-60. Cohen, J. Coefficient of agreement for nominal scales. Educational and Psychological Measurement, v. 20, n. 1, p. 37-46, 1960. Davis Jr., C. A.; Carvalho, P. C. P. Geometria computacional para SIG. In: Câmara, G.; Davis Jr., C. A.; Monteiro, A. M. V.; Paiva, J. A.; d'Alge, J. C. (Ed.). Geoprocessamento: teoria e aplicações. São José dos Campos: Instituto Nacional de Pesquisas Espaciais, 1999. Donnay, J. P.; Barnsley, M. J.; Longley, P. A. Remote sensing and urban analysis. In: Donnay, J. P.; Barnsley, M. J.; Longlay, P. A. (orgs.). Remote sensing and urban analysis. London: Taylor & Francis, 2001, p. 7-12. Duda, R. O.; Hart, P. E.; Stork, D. G. Pattern classification. New York: Wiley, 2001. 654 p. Dutra, L. V.; Huber, R. Feature extraction and selection for ERS-1/2 InSAR classification. International Journal of Remote Sensing, v. 20, n. 5, p. 993-1016, 1999. Fanning, D. Find_Boundary. Fort Collins: Fanning Software Consulting, 2006. Disponível em: http://www.dfanning.com/programs/find_boundary.pro. Acesso em 27 abr 2007.

Page 95: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE

93

Goldberg, D. E. Genetic algorithms in search, optimization, and machine learning. New York: Addison-Wesley, 1989. 412 p. ISBSN 0-201-15767-5. Gonzales, R. C.; Woods, R. E. Processamento de imagens digitais. São Paulo: Editora Edgard Blucher Ltda, 2000. 509 p. Grefenstett, J. Proportional selection and sampling algorithms. In: Back., T.; Fogel, D. B.; Michalewies, Z. (Eds.). Handbook of evolucionary computation. New York: Oxford University Press, 1997. Acesso em: 1 mar. 2005. Herold, M.; Gardner, M. E.; Roberts, D. A. Spectral resolution requirement for mapping urban areas. IEEE Transactions on Geoscience and Remote Sensing, v. 41, n. 9, p. 1907-1019. 2003, Lacerda, E. G. M.; Carvalho, A. C. P. L. F. Introdução aos algoritmos genéticos. In: Hídricos., E. U. U. A. B. d. R. (Eds.). Sistemas inteligentes: aplicações a recursos hídricos e ciências ambientais. Porto Alegre, 1999a, p. 99-150. ___. Introdução aos algoritmos genéticos. In: Congresso Nacional da Sociedade Brasileira de Computação, 19., 1999b, Rio de Janeiro. Anais... Rio de Janeiro: [S.l], 1999. Marques Filho, O.; Vieira Neto, H. Processamento digital de imagens. Rio de Janeiro: Brasport, 1999. 406 p. Miqueles, M. A.; Cavassim Jr, I.; Centeno, J. A. S. Classificação de imagens obtidas do laser scanner baseada em atributos espectrais e epaciais. In: Simpósio Brasileiro de Sensoriamento Remoto, 11, 2003, Belo Horizonte. Anais... São José dos Campos: INPE, 2003. p. 1883-1890. Acesso em: 26 abr. 2005. OLIVEIRA, Joanito de Andrade. Classificação de regiões usando atributos de forma e seleção de atributos. 2005-04-01. 104 p. (INPE-13746-TDI/1050). Dissertação (Mestrado em Computação Aplicada) - Instituto Nacional de Pesquisas Espaciais, São José dos Campos. 2005. Disponível em: <http://mtc-m16.sid.inpe.br/rep-/sid.inpe.br/iris@1913/2005/05.05.13.41>. Acesso em: 27 abr. 2007. rep: sid.inpe.br/iris@1913/2005/05.05.13.41. OLIVEIRA, Joanito de Andrade; DUTRA, Luciano Vieira; RENNÓ, Camilo Daleles. Aplicação de métodos de extração e seleção de atributos para classificação de regiões. In: SIMPÓSIO BRASILEIRO DE SENSORIAMENTO REMOTO, 12. (SBSR), 16-21 abr. 2005, Goiânia. Anais... São José dos Campos: INPE, 2005. Artigos, p. 4201-4208. CD-ROM, On-line. ISBN 85-17-00018-8. Publicado como: INPE-12766-PRE/8056. Disponível em: <http://marte.dpi.inpe.br/rep-/ltid.inpe.br/sbsr/2004/11.20.21.24>. Acesso em: 27 abr. 2007. rep: ltid.inpe.br/sbsr/2004/11.20.21.24.

Page 96: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE

94

OLIVEIRA, João Ricardo de Freitas. O uso de algoritmos genéticos na decomposição morfológica de operadores invariantes em translação aplicados a imagens digitais. 1998-12-17. 110 p. (INPE-7513-TDI/726). Tese (Doutorado em Computação Aplicada) - Instituto Nacional de Pesquisas Espaciais, São José dos Campos. 1998. Disponível em: <http://mtc-m16.sid.inpe.br/rep-/sid.inpe.br/jeferson/2005/03.04.15.16>. Acesso em: 27 abr. 2007. rep: sid.inpe.br/jeferson/2005/03.04.15.16. Pappa, G. L. Seleção de atributos usando algoritmos genéticos multiobjetivos. 85 p.(Mestrado em Informática Aplicada) – Pontifícia Universidade Católica do Paraná, Curitiba, 2002. Disponível em: http://www.ppgia.pucpr.br/ensino/defesas/Gisele_Lobo_2002.PDF Acesso em: 15 fev. 2005. Pappa, G. L.; Freitas, A. A.; Kaestner, C. A. A. A multiobjective genetic algorithm for attribute selection. In: Conf. on Recent Advances in Soft Computing (RASC - 2002), 4., 2002, Nottingham. Proceedings… Nottingham: Nottingham Trent University, p. 116-121. RENNO, C. D.; FREITAS, C. C.; SANT'ANNA, S. J. S. A system for region image classification based on textural measures. In: SIMPOSIO BRASILEIRO DE SENSORIAMENTO REMOTO, 9., 11-18 set. 1998, Santos, BR. Anais... São José dos Campso: INPE, 1998. Sessão Especial II Jornada de Radar, p. 1195-1202. CD-ROM. Publicado como: INPE-6952-PRE/2914. Disponível em: <http://marte.dpi.inpe.br/rep-/sid.inpe.br/deise/1999/02.11.14.26>. Acesso em: 27 abr. 2007. rep: sid.inpe.br/deise/1999/02.11.14.26. Richards, J. A. Remote sensing digital image analysis an introduction. London: Springer, 1998. 281p. Russ, J. C. Computer-assisted microscopy the measurement and analysis of images. New York: Plenum Press, 1991. 453 p. _____. The image processing handbook. 2. Boca Raton, FL: CRC Press, 1995. 674 p. ISBSN 0-8493-2516-1. Salembier, P.; Marqués, F. Region-based representations of image and video: Segmentation tools for multimedia services. IEEE Transactions on Circuits and Systems for Video Technology, v. 9, n. 8, p. 1147-1667, 8 Dec 1999. Disponível em: http://gps-tsc.upc.es/imatge/pub/ps/IEEE_CSVT99_Salembier_Marques.pdf. Acesso em: 08 out 2006.

Page 97: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE

95

SOUZA, I. M.; PEREIRA, M. N.; FONSECA, L. M. G.; KURKDJIAN, M. L. N. O. Mapeamento do uso do solo urbano através da classificação por regiões baseada em medidas texturais. In: SIMPÓSIO BRASILEIRO DE SENSORIAMENTO REMOTO, 11., 5-10 abr. 2003, Belo Horizonte. Anais... São José dos Campos: INPE, 2003. p. 1967 - 1968. CD-ROM. Publicado como: INPE--PRE/. Disponível em: <http://marte.dpi.inpe.br/rep-/ltid.inpe.br/sbsr/2002/11.14.15.20>. Acesso em: 27 abr. 2007. rep: ltid.inpe.br/sbsr/2002/11.14.15.20. Souza Júnior, M. A. Segmentação multi-níveis e multi-modelos para imagens de radar e òpticas. 2005. 131 p.(INPE-14466-TDI/1147). Dissertação (Mestrado em Computação Aplicada) – Instituto Nacional de Pesquisas Espaciais, São José dos Campos, 2007. Tadjudin, S.; Landgrebe, D. A. Classification of high dimensional data with limited training samples. West Lafayette: School of Elec. and Comp. Eng. Purdue University. 1998. (TRECE 98-8). Vafaie, H.; De Jong, K. Genetic algorithms as a tool for feature selection in machine learning. In: International Conference on Tools with Artificial Intelligence, 4., 1992, Arlington, VA. Proceedings… Arlington: GMU, 200-204. Disponível em: http: //cs.gmu.edu/~eclab/papers/TAI92.pdf. Acesso em: 15 dez. 2004. _____.Improving the Performance of a rule induction system using genetic algorithms. In: Michalski, R. S.; Tecuci, G. (Ed.). Machine learning: a multistrategy approach,. v. IV. San Mateo, CA: Morgan Kaufmann, 1993. Disponível em: http://cs.gmu.edu/~eclab/papers/msl91.pdf. Acesso em: 22 feb. 2005. Webb, A. R. Statistical pattern recognition. 2. Malvern, UK: John Wiley and Sons Ltd, 2002. 534 p. ISBSN 978-0-470-84513-4. Welch, R. Spatial resolution requirements for urban studies. International Journal of Remote Sensing, v. 3. n.2, p. 138-146, May 1982.

Page 98: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE

96

Page 99: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE

97

APÊNDICE A

Demonstração do comportamento da equação de comprimento da fibra para as formas

de círculo, quadrado e retângulo.

PerimeterAreaPerimeterlengthfiber ∗−∗= 25,0

P = Perímetro

S = Área

F = Fiber length

Logo,

PSPF 2

2−= (A.1)

Círculo:

2

2RS

RPπ

π

=

=

Substituindo P e S na Equação A.1:

DiâmetroRR

RRR

RRRF

=≅≅

−=−=

−=

214,2

)1(

22

22 2

ππ

πππ

Logo, para o círculo o valor de F é aproximadamente o seu diâmetro.

Quadrado:

L = Lado

Page 100: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE

98

2

4LS

LP=

=

Substituindo P e S na Equação A.1:

L

L

LL

LLLF

5,12

32

2

42

24 2

=

=

−=

−=

Logo, para o quadrado o valor de F é 1,5 de seu lado.

Retângulo:

L = lado maior do retângulo

W = Lado menor do retângulo

WLSWLP

=+= 22

Substituindo P e S na Equação A.1:

WLWLWL

WLWLWLF

+−+=

+−

+=

222

222

LWWL

LWLWLFLWLWLSe

=−+=

−+=⇒≅+>> ,

Page 101: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE

99

L

LL

LLL

LLLL

LLLL

LL

LLL

L

LLLLF

LWSe

01,1

09,01,1

1110

1110

1110

1010

1010

1010

10

1010

10

2

2

2

=

−=

−+=

−+=

⎟⎟⎠

⎞⎜⎜⎝

⎛×−+=

+−+=

+−+=

=

L

Logo, se L for maior que W a ponto de quase desprezar o valor de W, o valor de F será

o próprio L.

Page 102: EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE ATRIBUTOS ...mtc-m16b.sid.inpe.br/col/sid.inpe.br/mtc-m17@80/2007/04.04.16.56/... · EXTRAÇÃO DE ATRIBUTOS DE FORMA E SELEÇÃO DE

PUBLICAÇÕES TÉCNICO-CIENTÍFICAS EDITADAS PELO INPE

Teses e Dissertações (TDI)

Manuais Técnicos (MAN)

Teses e Dissertações apresentadas nos Cursos de Pós-Graduação do INPE.

São publicações de caráter técnico que incluem normas, procedimentos, instruções e orientações.

Notas Técnico-Científicas (NTC)

Relatórios de Pesquisa (RPQ)

Incluem resultados preliminares de pesquisa, descrição de equipamentos, descrição e ou documentação de programa de computador, descrição de sistemas e experimentos, apresenta- ção de testes, dados, atlas, e docu- mentação de projetos de engenharia.

Reportam resultados ou progressos de pesquisas tanto de natureza técnica quanto científica, cujo nível seja compatível com o de uma publicação em periódico nacional ou internacional.

Propostas e Relatórios de Projetos (PRP)

Publicações Didáticas (PUD)

São propostas de projetos técnico-científicos e relatórios de acompanha-mento de projetos, atividades e convê- nios.

Incluem apostilas, notas de aula e manuais didáticos.

Publicações Seriadas

Programas de Computador (PDC)

São os seriados técnico-científicos: boletins, periódicos, anuários e anais de eventos (simpósios e congressos). Constam destas publicações o Internacional Standard Serial Number (ISSN), que é um código único e definitivo para identificação de títulos de seriados.

São a seqüência de instruções ou códigos, expressos em uma linguagem de programação compilada ou inter- pretada, a ser executada por um computador para alcançar um determi- nado objetivo. São aceitos tanto programas fonte quanto executáveis.

Pré-publicações (PRE)

Todos os artigos publicados em periódicos, anais e como capítulos de livros.