fenix.tecnico.ulisboa.pt€¦ · os mapas históricos em formato digital disponíveis nas...

136
Indexação de mapas históricos digitalizados Ricardo Manuel Pereira Pestana Dissertação para obtenção do Grau de Mestre em Engenharia Mecânica Júri Presidente: Prof. José Manuel Gutierrez Sá da Costa Orientador: Prof. João Miguel da Costa Sousa Co-Orientador: Prof. João Rogério Caldas Pinto Vogal: Prof. José Luís Borbinha Maio de 2008

Upload: others

Post on 18-Oct-2020

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

Indexação de mapas históricos digitalizados

Ricardo Manuel Pereira Pestana

Dissertação para obtenção do Grau de Mestre em

Engenharia Mecânica

Júri Presidente: Prof. José Manuel Gutierrez Sá da Costa Orientador: Prof. João Miguel da Costa Sousa Co-Orientador: Prof. João Rogério Caldas Pinto Vogal: Prof. José Luís Borbinha

Maio de 2008

Page 2: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações
Page 3: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

Resumo:

Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações geográficas. Esta catalogação pode ser realizada por um operador humano mas essa é uma tarefa que consome muito tempo. Com o desenvolvimento de técnicas de processamento de imagem e de indexação, poderão ser usados métodos automáticos que permitam realizar esta tarefa. É nesta segunda opção que se insere o trabalho desenvolvido nesta dissertação. São apresentados dois métodos automáticos de indexação de imagens de mapas históricos segundo as suas localizações geográficas. Em ambos os métodos é necessário extrair em primeiro lugar os contornos das linhas de costa e fronteiras políticas. Usou-se um método de segmentação de texturas usando a decomposição wavelet DWF, um método que usa filtros de textura e outro de segmentação segundo cor usando k-means clustering. Ambos os métodos de segmentação segundo textura dão os melhores resultados. É desenvolvido e testado um métodos de indexação que usa diferentes grupos de features de vários tipos de descritores de forma. O grupo de features obtido a partir do descritor de forma orientação é o que dá melhores resultados. Contudo, um método de indexação apresentado que usa um método de sobreposição de áreas tem um desempenho ainda melhor.

Palavras-chave: Indexação de mapas históricos digitalizados, segmentação segundo cor, segmentação segundo textura, método de sobreposição de área, descritores de forma

i

Page 4: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

ii

Page 5: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

Abstract:

Most of old or historical maps in digital form available in European libraries are not organized by its geographical locations. The indexing could be processed by a human operator but it is a very time consuming task. With the recent development of image processing and indexing techniques, automatic methods can be used in order to accomplish this task. This paper proposes two automatic indexing methods for historical digitized maps. For both methods, it is required first to extract the contours of coastline and political boundaries. This was done by using a wavelet DWF decomposition texture segmentation method, a texture filter segmentation method and also a color k-means clustering segmentation method. The two texture segmentation methods gave the best results. A indexing method that uses features obtained by various shape descriptors is tested. The group of features using the orientation shape descriptor gave the best results using this indexing method. However, a indexing method that uses a proposed superposition method gives better results than using the other method using orientation shape descriptor.

Keywords: Indexing of historical digitized maps, Color Segmentation, Texture Segmentation, Superposition Method, Shape Descriptors

iii

Page 6: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

iv

Page 7: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

Agradecimentos Ao Professor João Sousa pela orientação prestada no desenvolvimento desta dissertação, pela sua disponibilidade e sentido crítico que me conduziu neste período de aquisição de conhecimentos para um desenvolvimento pessoal e científico na área estudada. Ao Professor João Caldas Pinto pela dedicação e ajuda prestada ao longo da realização desta dissertação. Ao Professor José Borbinha e ao Engenheiro João Gil pelo apoio prestado por parte do grupo DIGMAP. Ao Dr. Mohammad Faizal Ahmad Fauzi por me fornecer o código em Matlab do método de segmentação e nos esclarecimentos dados. À minha família e em especial aos meus pais por todo o apoio dado ao longo de todo o curso.

v

Page 8: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

vi

Page 9: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

Índice

1  Introdução .............................................................................................................................. 1 

2  Segmentação .......................................................................................................................... 3 

2.1  Estado da arte da segmentação ....................................................................................... 3 

2.1.1  Fase inicial ........................................................................................................... 4 

2.1.2  Fase intermédia .................................................................................................... 7 

2.1.3  Fase mais recente ................................................................................................. 9 

2.2  Segmentação automática por textura usando a decomposição DWF ........................... 14 

2.2.1  Algoritmo .......................................................................................................... 14 

2.2.2  Fase de decomposição top-down ....................................................................... 15 

2.2.3  Fase de segmentação Bottom-up ........................................................................ 29 

2.3  Segmentação usando filtros de textura ......................................................................... 31 

2.3.1  Algoritmo .......................................................................................................... 32 

2.3.2  Entropia local ..................................................................................................... 32 

2.3.3  Operações morfológicas .................................................................................... 33 

2.4  Segmentação segundo cor usando k-means clustering ................................................. 36 

2.4.1  Algoritmo k-means clustering ........................................................................... 36 

2.4.2  Espaços de cor ................................................................................................... 37 

3  Técnicas de indexação ......................................................................................................... 39 

3.1  Descritores de formas ................................................................................................... 39 

3.1.1  Compacticidade ................................................................................................. 40 

3.1.2  Rectangularidade ............................................................................................... 40 

3.1.3  Excentricidade ................................................................................................... 40 

3.1.4  Orientação .......................................................................................................... 41 

3.1.5  Solidez ............................................................................................................... 41 

3.1.6  Convexidade ...................................................................................................... 42 

3.1.7  Descritores de Fourier ....................................................................................... 42 

3.2  Método de sobreposição de áreas ................................................................................. 45 

3.2.1  Algoritmo .......................................................................................................... 45 

3.2.2  Diferença absoluta entre duas imagens .............................................................. 46 

3.2.3  Exemplos de graus de semelhança aplicados a formas simples ........................ 46 

3.3  Avaliação da indexação e selecção de features ............................................................ 47 

3.3.1  Recuperação ...................................................................................................... 47 

3.3.2  Precisão .............................................................................................................. 48 

3.3.3  Curva de recuperação ........................................................................................ 48 

vii

Page 10: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

3.3.4  Curva de precisão .............................................................................................. 49 

3.3.5  Curvas de precisão vs recuperação .................................................................... 50 

4  Segmentação e indexação de mapas .................................................................................... 51 

4.1  Segmentação de mapas ................................................................................................. 51 

4.1.1  Remoção de moldura ......................................................................................... 52 

4.2  Indexação de mapas ...................................................................................................... 54 

4.2.1  Indexação de mapas usando descritores de forma ............................................. 54 

4.2.2  Indexação de mapas usando método de sobreposição de áreas ......................... 56 

5  Resultados obtidos ............................................................................................................... 57 

5.1  Resultados da segmentação .......................................................................................... 57 

5.1.1  Método de segmentação usando a decomposição DWF .................................... 57 

5.1.2  Método de segmentação usando filtros de textura ............................................. 61 

5.1.3  Método de segmentação segundo cor usando k-means clustering .................... 63 

5.2  Resultados de descritores de forma .............................................................................. 65 

5.2.1  Formas Simples ................................................................................................. 65 

5.2.2  Contornos dos mapas ......................................................................................... 68 

5.3  Indexação usando descritores de forma ........................................................................ 69 

5.3.1  Contornos obtidos à mão ................................................................................... 71 

5.3.2  Formas obtidas pelo método de segmentação de filtros de textura ................... 73 

5.3.3  Formas obtidas pelo método de segmentação da decomposição DWF ............. 75 

5.3.4  Discussão ........................................................................................................... 77 

5.4  Indexação usando o método da sobreposição de áreas ................................................. 78 

5.5  Resumo de resultados da indexação ............................................................................. 80 

6  Conclusões ........................................................................................................................... 85 

Índice de Tabelas

Tabela 1 - Técnicas de segmentação de imagens em graus de cinzento (retirado de Vergés Llahí, J. (2005)) ....................................................................................................................................... 5 Tabela 2 - Técnicas de segmentação de imagens em graus de cinzento (retirado de Vergés Llahí, J. (2005)) ....................................................................................................................................... 6 Tabela 3 – Descritores de Fourier de um contorno bt de um objecto que sofre rotação, translação, escala e mudança de ponto inicial ............................................................................. 44 Tabela 4 – Exemplo de subtracção de imagens ........................................................................... 46 Tabela 5 – Imagens de teste ........................................................................................................ 46 Tabela 6 – Valores obtidos do grau de semelhança para as imagens de teste escolhidas ........... 47 Tabela 7 – Gama de parâmetros usados ...................................................................................... 58 

viii

Page 11: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

Tabela 8 – Valores de descritores simples, variando a escala e respectivos desvios padrão ...... 66 Tabela 9 - Valores de descritores simples, variando a rotação e respectivos desvios padrão ..... 67 Tabela 10 – Valores do desvio padrão mudando a escala ........................................................... 68 Tabela 11 – Valores do desvio padrão variando a rotação .......................................................... 68 Tabela 12 – Grupos de features testados ..................................................................................... 69 Tabela 13 – Curvas de Precisão e Recuperação para os conjuntos 1, 2, 3, 4, 5 e 6 de features para imagens cujo contorno foi tirado à mão. ............................................................................. 71 Tabela 14 - Curvas de Precisão e Recuperação para os conjuntos 7, 8, 9, 10, 11 e 12 de features para imagens cujo contorno foi tirado à mão. ............................................................................. 72 Tabela 15 - Curvas de Precisão e Recuperação para os conjuntos 1, 2, 3, 4, 5 e 6 de features para imagens obtidas a partir do método de segmentação de filtros de textura. ......................... 73 Tabela 16 - Curvas de Precisão e Recuperação para os conjuntos 7, 8, 9, 10, 11 e 12 de features para imagens obtidas a partir de método de segmentação de filtros de textura........................... 74 Tabela 17 - Curvas de Precisão e Recuperação para os conjuntos 1, 2, 3, 4, 5 e 6 de features para imagens obtidas a partir do método de segmentação da decomposição DWF. ................... 75 Tabela 18 - Curvas de Precisão e Recuperação para os conjuntos 7, 8, 9, 10, 11 e 12 de features para imagens obtidas a partir de método de segmentação da decomposição DWF. ................... 76 Tabela 19 – Resultados obtidos de Precisão e Recuperação para as primeiras 15 e 30 imagens indexadas, usando contornos retirados à mão ............................................................................. 80 Tabela 20 - Resultados obtidos de Precisão e Recuperação para as primeiras 15 e 30 imagens indexadas, usando contornos obtidos com o método de segmentação da decomposição DWF . 81 Tabela 21 - Resultados obtidos de Precisão e Recuperação para as primeiras 15 e 30 imagens indexadas, usando contornos obtidos com o método de segmentação de filtros de textura ........ 82 Tabela 22 – Valores médios de precisão e recuperação .............................................................. 83 Tabela 23 – Círculo ................................................................................................................... 109 Tabela 24 – Estrela .................................................................................................................... 109 Tabela 25 – Quadrado ............................................................................................................... 109 Tabela 26 – Rectângulo ............................................................................................................. 109 Tabela 27 - Triângulo ................................................................................................................ 109 Tabela 28 – Valores dos descritores simples para a forma do círculo ...................................... 110 Tabela 29 – Valores dos descritores de Fourier (magnitude) para a forma do círculo ............. 110 Tabela 30 - Valores dos descritores de Fourier (fase) para a forma do círculo ........................ 110 Tabela 31 - Valores dos descritores para a forma do quadrado ................................................ 110 Tabela 32 - Valores dos descritores de Fourier (magnitude) para a forma do quadrado .......... 110 Tabela 33 - Valores dos descritores de Fourier (Fase) para a forma do quadrado ................... 111 Tabela 34 - Valores dos descritores para a forma do triângulo ................................................. 111 Tabela 35 - Valores dos descritores de Fourier (magnitude) para a forma do triângulo .......... 111 Tabela 36 - Valores dos descritores de Fourier (fase) para a forma do triângulo ..................... 111 Tabela 37 - Valores dos descritores para a forma do rectângulo .............................................. 112 Tabela 38 - Valores dos descritores de Fourier (magnitude) para a forma do rectângulo ........ 112 Tabela 39 - Valores dos descritores de Fourier (Fase) para a forma do rectângulo ................. 112 Tabela 40 - Valores dos descritores para a forma de estrela ..................................................... 112 Tabela 41 - Valores dos descritores de Fourier (magnitude) para a forma de estrela .............. 113 Tabela 42 - Valores dos descritores de Fourier (Fase) para a forma de estrela ........................ 113 Tabela 43 – Valores dos descritores simples dos contornos tirados à mão de imagens da Península Ibérica ....................................................................................................................... 113 Tabela 44 – Valores dos descritores de Fourier (Magnitude) dos contornos tirados à mão de imagens da Península Ibérica .................................................................................................... 114 

ix

Page 12: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

Tabela 45 - Valores dos descritores de Fourier (Fase) dos contornos tirados à mão de imagens da Península Ibérica .................................................................................................................. 114 Tabela 46 - Valores dos descritores simples dos contornos tirados à mão de imagens de África ................................................................................................................................................... 114 Tabela 47 - Valores dos descritores de Fourier (Magnitude) dos contornos tirados à mão de imagens de África ..................................................................................................................... 115 Tabela 48 - Valores dos descritores de Fourier (Fase) dos contornos tirados à mão de imagens de África .................................................................................................................................... 115 Tabela 49 - Valores dos descritores simples dos contornos tirados à mão de imagens da América do Sul ........................................................................................................................................ 115 Tabela 50 – Valores dos descritores de Fourier (Magnitude) dos contornos tirados à mão de imagens da América do Sul ....................................................................................................... 116 Tabela 51 - Valores dos descritores de Fourier (Fase) dos contornos tirados à mão de imagens da América do Sul ..................................................................................................................... 116 Tabela 52 – Valores dos descritores simples para imagens da Península Ibérica ..................... 116 Tabela 53 – Valores dos descritores de Fourier (Magnitude) para imagens da Península Ibérica segmentadas pelo método da decomposição DWF ................................................................... 117 Tabela 54 - Valores dos descritores de Fourier (Fase) para imagens da Península Ibérica segmentadas pelo método da decomposição DWF ................................................................... 117 Tabela 55 - Valores dos descritores para imagens de África .................................................... 117 Tabela 56 - Valores dos descritores de Fourier (Magnitude) para imagens de África segmentadas pelo método da decomposição DWF ................................................................... 118 Tabela 57 - Valores dos descritores de Fourier (Fase) para imagens de África segmentadas pelo método da decomposição DWF ................................................................................................ 118 Tabela 58 - Valores dos descritores para imagens da América do Sul ..................................... 118 Tabela 59 - Valores dos descritores de Fourier (Magnitude) para imagens da América do Sul segmentadas pelo método da decomposição DWF ................................................................... 119 Tabela 60 - Valores dos descritores de Fourier (Fase) para imagens da América do Sul segmentadas pelo método da decomposição DWF ................................................................... 119 Tabela 61 - Valores dos descritores para imagens da Península Ibérica ................................... 119 Tabela 62 - Valores dos descritores de Fourier (Magnitude) para imagens da Península Ibérica segmentadas pelo método dos filtros de textura ........................................................................ 120 Tabela 63 - Valores dos descritores de Fourier (Fase) para imagens da Península Ibérica segmentadas pelo método dos filtros de textura ........................................................................ 120 Tabela 64 - Valores dos descritores para imagens de África .................................................... 120 Tabela 65 - Valores dos descritores de Fourier (Magnitude) para imagens de África segmentadas pelo método dos filtros de textura ........................................................................ 121 Tabela 66 - Valores dos descritores de Fourier (Fase) para imagens de África segmentadas pelo método dos filtros de textura ..................................................................................................... 121 Tabela 67 - Valores dos descritores para imagens da América do Sul ..................................... 121 Tabela 68 - Valores dos descritores de Fourier (Magnitude) para imagens da América do Sul segmentadas pelo método dos filtros de textura ........................................................................ 122 Tabela 69 - Valores dos descritores de Fourier (Fase) para imagens da América do Sul segmentadas pelo método dos filtros de textura ........................................................................ 122 Tabela 70 – Valores dos descritores simples das imagens de referência .................................. 122 Tabela 71 – Valores dos descritores de Fourier (Magnitude) das imagens de referência ........ 122 Tabela 72 - Valores dos descritores de Fourier (Fase) das imagens de referência ................... 122 

x

Page 13: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

Índice de Figuras

Figura 1 - Fluxograma do algoritmo de segmentação ................................................................. 15 Figura 2 - Espectros de wavelets tocando-se resultantes da dilatação da wavelets mãe no domínio do tempo (figura retirada de Vlanes (2007)) ................................................................. 22 Figura 3 - Como um número infinito de wavelets é substituído por uma função de escala (figura retirada de Vlanes (2007)) ........................................................................................................... 23 Figura 4 - Splitting do espectro do sinal com um banco de filtros iterativo (figura retirada de Vlanes (2007)) ............................................................................................................................. 25 Figura 5 - Implementação da Equação (2-26) e da Equação (2-26)como uma etapa dum banco de filtros iterativo (figura retirada de Vlanes(2007)) .................................................................. 28 Figura 6 – Exemplo de dilatação BA⊕ do conjunto A com o elemento estrutural B (imagem retirada de Gonzalez, R. e Woods, R. (2002)) ............................................................................ 33 Figura 7 – Elemento Estrutural e dilatação resultante (imagem retirada de Gonzalez, R. e Woods, R. (2002)) ....................................................................................................................... 34 Figura 8 – Conjunto A e sua erosão usando o elemento estrutural B (imagem retirada de Gonzalez, R. e Woods, R. (2002)) .............................................................................................. 34 Figura 9 – Elemento estrutural vertical e respectiva erosão (imagem retirada de Gonzalez, R. e Woods, R. (2002)) ....................................................................................................................... 35 Figura 10 - Cubo RGB a 24 bits .................................................................................................. 38 Figura 11 – a) Forma compacta; b) Forma não compacta ........................................................... 40 Figura 12 – Orientação ................................................................................................................ 41 Figura 13 – Contorno de um objecto (imagem retirada de Gonzalez e Woods (2002)) .............. 42 Figura 14 – Contorno original e reconstrução usando a transformação inversa e um número P de descritores de Fourier (imagem retirada de Gonzalez e Woods (2002)) .................................... 43 Figura 15 - Curva de recuperação ............................................................................................... 48 Figura 16 – Curva de Precisão .................................................................................................... 50 Figura 17 – Curva de Precisão vs Recuperação .......................................................................... 50 Figura 18 – Esquema do processo de remoção de moldura ........................................................ 53 Figura 19 – Histograma e processo de remoção da moldura....................................................... 53 Figura 20 – Fluxograma do algoritmo de indexação ................................................................... 55 Figura 21 – Fluxograma do algoritmo ......................................................................................... 56 Figura 22 - Alguns resultados obtidos do método de segmentação usando a decomposição DWF ..................................................................................................................................................... 60 Figura 23 - Alguns resultados obtidos do método de segmentação de filtros de textura ............ 62 Figura 24 - Alguns resultados obtidos do método de segmentação segundo cor ........................ 64 Figura 25 - Curvas de precisão e recuperação para o método da sobreposição obtido a partir de contornos tirados à mão............................................................................................................... 78 Figura 26 - Curvas de precisão e recuperação para o método da sobreposição obtido a partir de contornos obtidos a partir do método de segmentação usando filtros de textura ........................ 78 Figura 27 - Curvas de precisão e recuperação para o método da sobreposição obtido a partir de contornos obtidos a partir do método de segmentação da decomposição DWF ......................... 79 

xi

Page 14: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

xii

Page 15: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

1 Introdução

Os mapas históricos em formato digital disponível nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações geográficas. Esta catalogação pode ser realizada por um operador humano mas essa é uma tarefa que consome muito tempo. Com o desenvolvimento de técnicas de processamento de imagem e de indexação, poderão ser usados métodos automáticos que permitam realizar esta tarefa. É nesta segunda opção que se insere o trabalho desenvolvido nesta dissertação.

A indexação dos mapas digitalizados deverá ser efectuada de acordo com as suas localizações geográficas. Esta, pode ser feita de várias maneiras: procurar texto nas imagens dos mapas que dê a informação da localização geográfica (por exemplo, procurar o título do mapa, o nome do mar ou oceano junto à costa, ou o nome de uma região específica desse mapa); retirar os contornos de rios e tentar indexar os mapas de acordo com a forma destes; ou segmentar as regiões delimitadas por fronteiras ou linhas de costa e indexá-las segundo a sua forma. Seguiu-se esta última abordagem no trabalho desenvolvido nesta dissertação.

De modo a se obterem as regiões delimitadas por fronteiras ou linhas de costa utilizaram-se métodos de segmentação. Na Secção 2.1 apresenta-se um estudo do estado da arte de métodos de segmentação de modo a escolher as melhores técnicas para esta tarefa. Com este estudo, concluiu-se que se deveriam utilizar duas abordagens na segmentação:

• Métodos de segmentação por textura

• Métodos de segmentação por cor

Usaram-se dois métodos por textura, um de acordo com Fauzi e Lewis (2006) e outro baseado no método de segmentação usando filtros de textura. Estes métodos estão descritos nas Secções 2.2 e 2.3 respectivamente. O método de segmentação por cor utiliza o algoritmo k-means clustering. Este encontra-se descrito na Secção 2.4. As razões da escolha destes métodos e a sua aplicação nas imagens de mapas são apresentadas na secção 4.1. Definiu-se um grupo de imagens de teste composta por imagens de mapas de três regiões diferentes, tendo 15 imagens de cada região. Aplicou-se estes métodos de segmentação ao conjunto de imagens de mapas de teste estando os resultados obtidos na Secção 5.7.

Neste trabalho foram utilizados dois métodos de indexação. No primeiro método, apresentado, na Secção 4.2, as formas dos contornos a indexar, ou seja, as formas das regiões delimitadas por fronteiras ou linhas de costa, são comparadas com os contornos de imagens de referência. Os contornos são descritos numericamente usando descritores de forma. Estes descritores de forma são explicados na Secção 3.1. A indexação é realizada verificando quais as descrições mais próximas entre os contornos dos mapas a indexar, das descrições dos contornos de imagens de referência. As imagens de referência contêm contornos de regiões de localizações geográficas conhecidas. Foram efectuados vários testes de modo a verificar qual o melhor conjunto de descritores de forma, sendo a avaliação dos resultados feita através da utilização de curvas de precisão e recuperação, sendo estas descritas e analisadas na Secção 3.3. Os resultados destes testes encontram-se na Secção 5.3.

1

Page 16: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

Foi utilizado outro método de indexação, apresentado na Secção 4.3 onde se usa um método proposto para comparar os contornos extraídos dos mapas com contornos de imagens de referência. Este método de comparação de formas, apresentado na secção 3.2, consiste em sobrepor duas formas a comparar e calcular o valor da semelhança entre as formas. Este valor de semelhança permite comparar a forma de um dado mapa com a forma padrão da região a indexar. Aplicou-se este método de indexação ao conjunto de imagens de teste e a avaliação dos resultados foi feita através da utilização de curvas de precisão e recuperação. Os resultados encontram-se na Secção 5.4.

Finalmente comparou-se os resultados de ambos os métodos de indexação na Secção 5.5 e tiraram-se conclusões.

2

Page 17: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

2 Segmentação

A segmentação é um processo que consiste na divisão de uma imagem digital em múltiplas regiões (conjunto de pixeis). O objectivo da segmentação é simplificar ou alterar a representação de uma imagem em algo que tenha mais significado e seja mais fácil de usar. Tipicamente, a segmentação é utilizada para localizar objectos ou contornos em imagens. O resultado da segmentação de uma imagem é um conjunto de regiões que cobre toda a imagem ou um conjunto de contornos extraídos da imagem. Cada um dos pixeis da região é semelhante em relação a uma dada propriedade, por exemplo cor, intensidade, ou textura. Os pixeis de regiões adjacentes têm características significativamente diferentes.

A segmentação é usada em várias áreas como, por exemplo, imagens médicas, onde se tenta localizar tumores, ajudar em diagnósticos e estudo da estrutura anatómica; localizar objectos em imagens de satélite, carros, prédios, rios, etc; reconhecimento da face ou de impressões digitais; situações de segurança de edifícios; sistemas de controlo de trânsito, etc.

Fez-se um estudo do estado da arte de métodos de segmentação na secção seguinte 2.1 e nas secções 2.2 e 2.3 apresentam-se os métodos de segmentação testados.

2.1 Estado da arte da segmentação

Até recentemente, as técnicas de segmentação de imagens eram dirigidas a imagens de graus de cinzento. Em Fu e Mui (1985) e em Haralick e Shapiro (1985) encontram-se descritas várias técnicas dirigidas a este tipo de imagens. Apesar de a cor permitir uma informação mais completa das imagens e uma segmentação mais fiável, era necessário um poder computacional significativamente maior do que o necessário para imagens em tons de cinza. Mas hoje em dia isso já é um problema menor devido ao aumento da rapidez de cálculo e da diminuição do custo de computação.

Por esta razão tem havido um crescimento notável na última década, no número de algoritmos para segmentar imagens a cor como descrito em Skarbek e Koschan (1994), Lucchese e Mitra (1999), Lucchese e Mitra (2001) e em Cheng et al. (2001). Na maior parte das vezes, estes algoritmos são extensões para múltiplas dimensões de outros já idealizados para imagens em tons de cinza, explorando os conhecimentos já adquiridos nessa área. Noutros casos, são técnicas ad hoc especialmente desenhadas para aquela própria natureza da cor e na física presente na interacção entre luz e materiais coloridos.

As características desejadas para uma boa segmentação de acordo com Haralick e Shapiro (1985) são: “As regiões obtidas a partir da segmentação de uma imagem deverão ser uniformes e homogéneas em relação a uma característica como textura ou tom de cinzento. O interior das regiões deverá ser simples e com poucos buracos. Regiões adjacentes deverão possuir valores bem diferentes nas características que as caracterizam. Os contornos de cada segmento deverão ser simples, não rugosos e deverão ter boa exactidão espacial.”

Em seguida serão apresentados os mais importantes algoritmos sobre segmentação de imagens a cor. Tal como descrito em Vergés-Llahí, J. (2005) a apresentação será divida em três fases:

3

Page 18: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

inicial, intermédia e mais recente. A divisão deve-se ao facto de os métodos dividirem-se em categorias diferentes consoante a época.

2.1.1 Fase inicial

Nos primeiros anos os algoritmos de segmentação eram desenhados apenas para imagens em tons de cinza. A segmentação era baseada na descontinuidade ou na homogeneidade dos graus de cinzento de uma região. Estas abordagens baseadas na descontinuidade levam a particionar uma imagem detectando pontos isolados, linhas ou arestas de acordo com mudanças bruscas nos níveis de cinzento. A abordagem baseada na descontinuídade inclui: thresholding, clustering, region-growing, region splitting e region splitting e merging. Em Fu, K. e Mui, J. (1981), as técnicas de segmentação são divididas em três categorias: clustering ou thresholding de features característicos, detecção de arestas e extracção de regiões. Como este artigo está direccionado para imagens médicas é dado muito pouca informação sobre segmentação de imagens a cores. São descritos esquemas de selecção de thresholds baseados em histogramas de níveis de cinzento e propriedades locais e também técnicas baseadas em textura. As técnicas de clustering são apresentadas como uma extensão multidimensional do conceito de thresholding.

São também apresentadas algumas técnicas de detecção de arestas em ambas as vertentes, paralela e sequencial. Na paralela, a decisão de se um conjunto de pontos pertence a uma aresta, depende do grau de cinzento do conjunto de pontos e dos seus vizinhos. Estas técnicas incluem spatial frquency filtering, operadores de gradiente, operadores locais adaptativos, functional approzimation, procura heurística e programação dinâmica, relaxation, e ajuste de linhas e curvas. Nas técnicas sequenciais, a decisão é em base nos pontos já referidos e é dado uma ideia geral sobre o assunto. E por fim são referidas técnicas de region splitting and merging.

4

Page 19: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

Técnicas de Segmentação Vantagens Desvantagens Thresholding de histogramas • Não necessita de

informação a priori da imagem

• O método funciona muito bem para o grupo de imagens que cumpre os requisitos e necessita de baixo poder computacional

• Não funciona bem em imagens com picos ou vales menos óbvios

• Não tem em consideração informação espacial por isso não garante que as regiões segmentadas sejam contíguas

Clustering do espaço de features

• Adequada para classificação e fácil de implementar

• Como determinar o número de clusters

• As features são geralmente dependentes da imagem e não é claro quais as features a seleccionar de modo a obter uma segmentação satisfatória

Abordagens baseadas na região

• Funciona melhor quando é fácil definir a homogeneidade da região

• São ainda mais imunes ao ruído do que as técnicas baseadas em arestas

• São sequenciais e são bastante pesadas em termos de poder computacional e de memória necessária

• As técnicas do tipo region growing têm uma dependência inerente na selecção das sementes e na ordem que os pixels e as regiões são examinadas

• As regiões segmentadas obtdas por técnicas region splitting são muito quadradas

Tabela 1 - Técnicas de segmentação de imagens em graus de cinzento (retirado de Vergés Llahí, J. (2005))

5

Page 20: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

Técnicas de Segmentação Vantagens Desvantagens Abordagens baseadas em detecção de arestas

• A detecção de arestas é a maneira como os humanos vêm os objectos

• Funciona bem para imagens onde há um bom contraste entre as regiões

• Não funcionam bem em imagens onde as arestas são mal definidas ou onde há demasiadas arestas

• Não é trivial conseguir uma curva fechada

• Menos imune ao ruído do que outras técnicas: thresholding e clustering

Abordagens fuzzy • Podem ser usadas funções de pertença fuzzy para representar o grau de algumas propriedades ou frases linguísticas e também regras fuzzy do tipo if-then para efectuar inferências aproximadas

• A determinação da função de pertença não é trivial

• O poder computacional pode ser elevado

Abordagens baseadas em redes neuronais

• Não são necessários programas complexos.

• Tempo de treino é longo • A inicialização pode

afectar os resultados • Tem de ser evitado o

overtraining Tabela 2 - Técnicas de segmentação de imagens em graus de cinzento (retirado de Vergés Llahí,

J. (2005))

Em Haralick e Shapiro (1985) são apresentadas várias técnicas de segmentação: spatial clustering, algoritmos region-growing com single, hybrid ou centroid linkage, e algoritmos split and merge. Este artigo apresenta abordagens de clustering espacial que combina clustering no espaço de features com técnicas region-growing ou linkagem espacial. São também discutidos os problemas de elevada correlação e redundância espacial de histogramas multi-banda de imagens. Porém este artigo falha em falar sobre o tema de segmentação de imagens a cores.

A revisão de técnicas de segmentação de imagens realizada em Pal, N. e Pal, S. (1993), é de novo concentrada em imagens que podem ser reduzidas aos seus níveis de cinzento mas desta vez existe uma secção dedicada a algoritmos de segmentação de imagens a cor. Além disso, este artigo critica os artigo de Haralick e Shapiro (1985) e Fu, K. e Mui, J. (1981), por duas razões: em primeiro lugar, técnicas baseadas em lógica fuzzy nem em redes neuronais foram tidas em conta; em segundo não é mencionado nenhuma avaliação da segmentação nem é apresentado nenhum método para imagens a cores.

São também revistas as técnicas anteriormente referidas e referidas outras: thresholding de níveis de cinzento, detecção de arestas e abordagens usando campos de Markov. As imagens de teste são imagens de range e de ressonância magnética. Depois da discussão destas abordagens à segmentação de imagens, os autores fazem uma comparação entre seis métodos baseados em histogramas e dois métodos iterativos de classificação de pixeis, baseados em relaxation e na

6

Page 21: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

estimativa de máximo a posteriori, respectivamente. Finalmente tenta implementar uma avaliação quantitativa dos resultados da segmentação.

2.1.2 Fase intermédia

Finalmente em Skarbek, W. e Koschan, A. (1994), é feita uma revisão extensa e exaustiva de algoritmos de segmentação de imagens a cor dando uma resposta ao número elevado de artigos de segmentação de imagens em tons de cinza e do aparente vazio dedicado a imagens a cores. Este artigo contém 81 referências em 80 páginas onde 50 métodos diferentes são examinados em pormenor. É também apresentado uma revisão dos vários espaços de cor existentes e várias conclusões sobre este assunto.

Neste artigo, o processo de segmentação é definido como a extracção de um grupo de segmentos ligados entre si que satisfazem uma condição de uniformidade, baseado nas características da cor da imagem num dado espaço de cor. O conceito mais importante no processo de segmentação é a definição de segmento. Neste artigo são dadas quatro definições:

• Um conjunto de pixeis que satisfazem uma função de pertença.

• Um conjunto máximo de pixeis ligados entre si que satisfazem uma condição de uniformidade.

• Um conjunto de pixeis ligados entre si rodeados de pixeis que formam um contorno a cores.

• Uma superfície de um objecto feito de um material uniforme.

Com estas definições, definiu-se quatro categorias de métodos de segmentação: baseados em pixeis, em áreas, em contornos e em propriedades físicas respectivamente.

2.1.2.1 Métodos baseados nos pixeis

Estes algoritmos dividem-se em três classes:

Técnicas baseadas em histogramas – são identificados clusters através da procura da frequência de picos num histograma. Assim, os pixeis são classificados como pertencentes a uma destas classes que são formadas. Como em imagens a cores, os histogramas são multidimensionais, a procura é feita independentemente em cada canal de cor ou no histograma completo a 3D.

Técnicas de clustering – os pixeis são agrupados consoante os valores das cores destes, formando clusters cujos protótipos são posteriormente usados na classificação dos pixeis da imagem.

Técnicas fuzzy clustering – Várias funções de pertença são avaliadas em Skarbek, W. e Koschan, A. (1994). O agrupamento de pixeis, o qual é conhecido por crisp

7

Page 22: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

clusters é obtido por um processo de defuzzyficação e na subdivisão do máximo de componentes interligados. Uma escolha bastante popular é o algoritmo k-means.

2.1.2.2 Métodos baseados em área

São divididos em duas classes:

Técnicas region-growing – Esta estratégia necessita de um conjunto inicial de “sementes” e também de um critério de juntar regiões vizinhas. De modo a distinguir este método do próximo, é importante referir que as sementes não resultam de um processo prévio de divisão de regiões não uniformes mas apenas de uma selecção. Estes métodos são sensíveis quanto à escolha inicial das sementes e também da maneira com as estatísticas dos segmentos são calculados.

Técnicas Split & Merge – Este método começa a partir de regiões não-uniformes que vão sendo divididas até um critério de uniformidade ser satisfeito. Posteriormente, as regiões obtidas são recombinadas de maneira a obter regiões uniformes as maiores possíveis. A fase de splitting é análoga à das sementes anteriormente referida e é normalmente feita através da análise do histograma da imagem. Por outro lado, a fase de merging é feita por um método region-growing.

2.1.2.3 Métodos baseados em contornos

São divididos em duas classes:

Técnicas locais – Apenas a informação contida nos pontos da vizinhança é necessária para saber se um pixel está localizado num contorno ou não. Normalmente estes detectores de contornos são mais rápidos do que os da próxima categoria.

Técnicas globais – A maior parte destes algoritmos têm em conta métodos globais de optimização baseados principalmente em Campos de Markov. Estas abordagens costuma convergir muito lentamente mas dão bons resultados especialmente em zonas com muito ruído.

2.1.2.4 Métodos baseados nas propriedades físicas

O objectivo destes métodos é segmentar imagens usando modelos reflectivos baseados nas propriedades do material presente na imagem e evitando ser “enganado” por sombras ou outros pormenores na imagem. Este é um objectivo bem difícil devido a problemas derivados de inter-reflecções, sombras, ruído dos sensores, iluminação não-uniforme ou a existência de uma textura na superfície.

8

Page 23: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

• Materiais dieléctricos não-uniformes – há um elevado número de modelos de reflexão como Torrance, K. e Sparrow, E. (1967), Phong, B. (1975, Cook, R. e Torrance, K. (1981 e Wolff, L. (1994). Entre estes métodos, o modelo dicromático de reflexão em Shafer, S. (1985) é a escolha mais usual.

2.1.3 Fase mais recente

Em Lucchese, L. e Mitra, S. (1999) e em Lucchese, L. e Mitra, S. (2001) é revista uma extensa bibliografia sobre as abordagens mais recentes sobre segmentação de imagens a cor. Os métodos mais interessantes são descritos a seguir. Nesta análise, a característica mais importante a definir na segmentação é que a divisão de uma imagem em regiões deverá ser de acordo com a aplicação que usará os resultados. Por outro lado, nas possíveis aplicações da segmentação a cor, são incluídas aplicações multimédia de recuperação de imagens e vídeo de bases de dados digitais, transmissão de informação através da Internet e última geração de telemóveis, assim como compressão de imagem para transmissão por meio de televisão. Estes dois artigos dividem as técnicas de segmentação em três grandes categorias:

1. Técnicas baseadas em features

a. Clustering

b. Adaptive k-means clustering

c. Thresholding de histogramas

2. Técnicas baseadas na imagem

a. Split&Merge

b. Region-growing

c. Teoria dos grafos

d. Detecção de arestas

e. Redes neuronais

3. Técnicas baseadas em propriedades físicas

2.1.3.1 Métodos baseados em features

A ideia por detrás destes métodos é que a cor é uma característica constante na superfície dos objectos de maneira que num certo espaço de cores forma um cluster ou um pico num histograma de cores. A variação dentro de um cluster é devida a variações da cor causada por sombras, marcas ou ruído. Uma característica fundamental nesta abordagem é que é completamente desprezada a informação espacial entre pixeis da mesma cor.

9

Page 24: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

Métodos de clustering

Clustering pode ser definido como uma classificação não-supervisionada de objectos em que se gera classes ou partições sem nenhum conhecimento à priori. Dado um certo número de padrões, são calculadas as regiões em que todos estes padrões se verificam mas nunca em duas regiões adjacentes ao mesmo tempo. A classificação de padrões em classes segue uma regra de senso comum em que objectos dento de uma classe apresentam um maior grau de similaridade do que entre classes diferentes. Entre diferentes classes, o grau de similaridade é baixo. Um dos algoritmos mais comuns é o k-means (Park, et al. (1998)). Uma versão fuzzy é também muito usada assim como também a abordagem semelhante de probabilistic clustering. Uma comparação entre versões crisp e fuzzy pode ser encontrada em Ray, S et. al. (1995). Outro algoritmo bastante usado é o ISODATA (Takahashi, K. e Abe, K. (1999)).

Outra abordagem interessante e com bons resultados é o algoritmo mean-shift publicado em Comaniciu, D. e Meer, P. (1997, 1999, 2002) assim como o proposto em Yung, N. e Lai, H. (1998) onde dois pontos num dado espaço de cor são modelados como duas partículas massivas tendo uma interacção ditada pela lei de gravitação de Newton. Outra técnica que tem ganho terreno hoje em dia é a abordagem baseada no modelo probabilístico em aprendizagem não-supervisionada que usa finite mixtures para a modelação estatística dos dados como descrito em Jain e Dubes (1988), Jain, et. al. (2000) e McLachlan e Peel (2000).

Métodos clustering adaptativo

Os métodos anteriores como o clustering k-mean apenas têm em conta a cor dos pixeis e não a disposição espacial dos mesmos. De modo a incluir constrangimentos espaciais Pappas, T. (1992) propôs uma generalização do algoritmo k-means onde considera a segmentação de imagens em graus de cinza como um problema de estimação de probabilidade Maximum A Posteriori (MAP). A aplicação desta técnica à segmentação está descrita em Chang et. al. (1994).

Métodos de Thresholding de histogramas

Thresholding de histogramas é uma das técnicas mais usadas em imagens em tons de cinza. Numa imagem a cor, o problema é mais complexo dado que tem de combinar os picos e vales entre 3 histogramas ou tendo em conta um histograma a 3D. Um problema comum é que devido ao ruído, é comum aparecer pequenos picos que dificulta a segmentação. Para contornar este problema poderá fazer-se um alisamento.

Normalmente a cor de um pixel, é distribuída por três histogramas que são independentemente restringidos por thresholds como por exemplo Celenk e Haag (1998). Em Shafarenko et. al.

10

Page 25: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

(1998), é adoptado um esquema watershed para segmentar histogramas a 2D ou um a 3D de uma imagem a cores.

2.1.3.2 Métodos baseados na imagem

Uma das desvantagens dos métodos baseados em espaços de features é que não inclui informação sobre a disposição espacial dos pixeis. Seria de esperar que as classes que estes algoritmos originam fossem homogéneos em relação à característica representada nesses espaços mas não há nenhuma garantia de compactação espacial que também seria de esperar numa boa segmentação para além de homogeneidade. De facto a análise por cluster e por histogramas não tem em conta a localização espacial dos pixeis. A sua descrição é global e não explora o importante facto de que pontos dum mesmo objecto estão geralmente perto. Por outro lado, se os pixeis fossem exclusivamente agrupados com base apenas na sua informação espacial na segmentação as regiões iriam aparecer muito coesas mas pouco homogéneas. Na literatura existem sugestões para garantir homogeneidade do espaço de features e também da compactação espacial, por exemplo em Haralick, R. e Shapiro, L. (1985), em Fu, K. e Mui, J. (1981) e em Pal, N. e Pal, S. (1993). Dependendo da estratégia adoptada para o agrupamento espacial, estes algoritmos estão classificados em split & merge e técnicas region-growing.

Métodos Split & Merge

Inicialmente, nestes métodos, começa-se com uma partição não-homogénea e vai sendo dividida até se obterem regiões homogéneas. Uma estrutura de dados muito usada para implementar este método é a representação quadtree. A seguir à fase da divisão, existem muitas regiões pequenas e fragmentadas que têm de ser ligadas de alguma forma numa fase de fusão. A estrutura de dados Region Adjacency Graph (RAG) é mais usada nesta fase. Em muitos algoritmos, a suavidade dos contornos das regiões e a sua homogeneidade são reforçados pela adopção do Campos de Markov (MRF) (Geman e Geman (1984), Li (1995) e Wang, J. (1998) ).

Várias variações de split & merge foram investigadas. Um algoritmo k-means em Celenk, M. (1997) na fase de splitting para classificação dos pixeis e na fase de fase merging para agrupar classes de padrões. Em Ji e Park, (1998), a fase splitting é feita através da transformação watershed do gradiente da imagem do componente luminance, simplificada por uma operação morfológica de abertura. A fase de merging é feita usando um Kohonen’s Self Organizing Map (SOM).

Métodos Region-Growing

Estes métodos consistem em obter uma região homogénea de uma imagem a partir de um processo de crescimento começado a partir de uma semente pré-seleccionada, progressivamente

11

Page 26: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

aglomerando pontos à volta satisfazendo um critério de homogeneidade. O crescimento pára quando não for possível adicionar mais pontos à região. Um pós-processamento possível é uma fase de fusão (merging) que tenta eliminar pequenas regiões ou pontos vizinhos com atributos similares criando regiões maiores.

Region-growing pode ser considerado como um processo de clustering sequencial ou classificação. Por isso, os resultados podem depender da ordem que os pontos são processados. A principal vantagem nestes métodos é que as regiões obtidas são geralmente compactas e espacialmente ligadas. Por outro lado, como nas técnicas de clustering já referidas, o problema em escolher os pontos para as sementes e uma condição de homogeneidade adequada é uma das dificuldades.

Para imagens a cores, a maior parte das estratégias imitam as de imagens em graus de cinzento e há poucas novidades na revisão feita em Shafarenko et. al. (1998). À parte de algumas diferenças na maneira como as sementes são encontradas e refinadas (normalmente um processo de quantificação ou método de procura de extremos), uma estratégia comum de crescimento (growing) é o da watershed. Para reduzir o número de regiões finais é normalmente usado uma fase de fusão (merging).

Em Tremeau e Norel (1997), são sugeridos vários critérios de homogeneidade que controlam o processo de crescimento numa primeira fase onde se obtém um certo número de regiões ligadas entre si e onde as componentes que têm distribuições de cor similares são fundidas numa segunda fase. Kanai, Y. (1998) desenvolveu um algoritmo que se baseia na cor e também na intensidade. As sementes são extraídas a partir da intensidade por meio de operações morfológicas de abertura e fecho e também pela cor através da quantificação do espaço HSV.

Métodos baseados na teoria dos grafos

Outra abordagem interessante é a que é baseada na teoria dos grafos. O objectivo é particionar um grafo que representa a toda a imagem numa série de componentes que correspondem às regiões. Há pelo menos duas maneiras de fazer isto. Por um lado, há métodos splitting que particionam o grafo removendo arestas supérfluas. Por outro lado, métodos region-growing juntam os componentes em função dos atributos dos nós e das arestas. Em seguida, algumas das abordagens são descritas sucintamente.

Os algoritmos mais eficientes usam thresholds fixos e medidas locais para encontrar as regiões. Por exemplo, a abordagem segundo Zahn, C. (1971) consiste em “partir” grandes arestas numa árvore mínima do grafo. Um método mais recente (Wu e Leahy (1993)), é baseado no cálculo do corte mínimo do grafo que representa a imagem. O critério de corte é de tal modo a minimizar a similaridade entre regiões que estão a ser cortadas. Esta abordagem retira propriedades não locais da imagem mas requer mais tempo de cálculo em relação a métodos mais eficientes como o descrito em baixo que se baseia em informação local.

Em Urquhart, R. (1997), a medida da variabilidade local é usada para decidir quais as arestas a remover. As medidas locais apenas se baseiam nos pontos vizinhos próximos a não são suficientes para ter uma ideia da variabilidade de toda a imagem, dado que eles não capturam as propriedades não locais. Este problema é explicado em Felzenszwalb e Huttenlocher (1998).

12

Page 27: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

Em Wang, J. (1998), são apresentados algoritmos “baratos” para simulação probabilística e simulated annealing como os algoritmos Hastings e algoritmos generalizados Metropolis.

Métodos de detecção de arestas

A segmentação pode ser obtida através da detecção de arestas como já foi intensamente investigado para imagens em graus de cinzento em Pal e Pal (1993). Aqui as arestas são encontradas através de funções que aproximam o gradiente ou o Laplaciano da imagem. O problema é arranjar um equivalente do gradiente para imagens a cores. Pode ser feito de duas maneiras: uma é trabalhar com uma variação dos três canais de cores ou então calcular o gradiente para cada canal em separado e depois combiná-los de acordo com um determinado critério.

A primeira abordagem requer conhecimentos básicos de geometria diferencial como o da primeira forma fundamental. Os seus vectores próprios fornecem a direcção da variação máxima e mínima e os valores próprios fornecem a taxa de variação. Os detectores de arestas cromáticos em Chapron (1997), são baseados nesta métrica. Em Lucchese e Mitra (1999) e em Lucchese e Mitra (2001) são dados outros exemplos usando esta técnica.

Em Ma e Manjunath (1997), é proposto um algoritmo de detecção de contornos original. É usado um tipo de modelo codificado preditivo para identificar a direcção da taxa de variação na cor e na textura em qualquer ponto e em qualquer escala. Redes neuronais podem também ser usadas na segmentação de contornos de acordo com Lucchese e Mitra (1999) e Lucchese e Mitra (2001).

Um framework para segmentação de objectos baseado em color snakes ou active contours é proposto em Kass et. al. (1987) que também se encaixa no contexto das técnicas de detecção de arestas. A abordagem clássica das cobras (snakes) consiste em deformar um contorno inicial até à fronteira de um objecto detectado. A deformação é obtida minimizando a energia mínima de maneira que o mínimo local atinge a fronteira do objecto. A formulação de contornos activos para imagens a cores de acordo como Sapiro (1996) e Sapiro (1997) é baseado na métrica de Rieman que capta a informação de todos os componentes da imagem.

Em Gevers (1998), são propostas snakes invariantes na cor que usam informação do gradiente invariante na cor. Desta maneira, as snakes devolvem contornos de regiões menos sensíveis a variâncias devido a sombras e marcas.

Métodos com redes neuronais

Finalmente em Lucchese e Mitra (1999) e (2001), é citado a classes de técnicas de segmentação de imagens que adoptam uma classificação baseada em redes neuronais. Sabe-se que redes neuronais são processadores elementares massivamente ligados entre si em que cada um faz tarefas simples. Apesar da complexidade, as redes neuronais oferecem duas importantes propriedades em tarefas de reconhecimentos de padrões, nomeadamente elevado grau de

13

Page 28: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

paralelismo, que possibilita pequenos tempos de computação e torna-as adequadas para processos em tempo real e boa robustez a perturbações originando resultados fiáveis.

Outra característica importante é que permitem ter em conta a informação espacial. Por outro lado, a maior parte das vezes é necessário saber de antemão o número de segmentos na imagem e é necessário realizar uma fase de aprendizagem para treinar a rede de modo a reconhecer os padrões. Normalmente os segmentos são dados como um conhecimento a priori ou então são estimados numa fase de pré-processamento.

É importante realçar que este tipo de técnicas é a escolha certa quando um problema específico de classificação é bem estudado e também o número de possíveis classes é conhecido a priori.

Mais recentemente, em Goldman et. al. (2002), é proposta uma ferramenta precisa para segmentar imagens a cores, baseada numa abordagem baseada em clusters para treinar grandes redes neuronais feed-forward. Este artigo mostra o potencial desta técnica em imagens médicas onde é necessário precisão o mais elevada possível.

2.2 Segmentação automática por textura usando a decomposição DWF

Este método de segmentação é um método de segmentação por textura. É automático na medida em que não necessita de um conhecimento a priori do tipo ou do número de texturas na imagem. O método usa uma modificação da decomposição Discrete Wavelet Frames (DWF) de modo a extrair features das imagens dos mapas. Estas features são descritores espectrais da textura. Depois disso é aplicado o algoritmo mean-shift juntamente com o fuzzy c-means (FCM) clustering de maneira a segmentar a imagem em regiões de diferentes texturas.

2.2.1 Algoritmo O algoritmo tem uma estrutura hierárquica e consiste em duas fases: fase de decomposição top-down seguida da fase de segmentação bottom-up. Na Figura 1 é apresentado o fluxograma do algoritmo:

14

Page 29: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

Figura 1 - Fluxograma do algoritmo de segmentação

2.2.2 Fase de decomposição top-down

Na fase de decomposição top-down, é efectuada a decomposição DWF de nível K. Para uma imagem nn 22 × , isto resulta em 13 +K planos de nn 22 × dados. A quantidade de dados é reduzida aplicando os passos descritos no fim da Secção 2.2.2.1. Isto resulta em coeficientes de estrutura do tipo piramidal. Nesta fase, chamamos a imagem original de tamanho nn 22 × com o índice de nível 0 (nível base), as quatro sub-imagens de tamanho 11 22 −− × nn de nível 1 e assim

15

Page 30: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

por diante. Como a DWF providencia uma boa localização de energia espacial e de frequência, podemos tomar o valor de energia de cada coeficiente da DWF modificada como uma feature de energia. Contudo, a variância da feature é mesmo assim alta dado que é feita apenas uma amostragem. Assumindo que os coeficientes DWF vizinhos são idênticos e distribuídos independentemente, a variância pode ser reduzida aplicando uma operação de média local ou operação de alisamento.

Por um lado, é desejável ter uma variância maior de modo a reduzir variações estatísticas. Por outro, dado que uma grande janela de dados centrada em pontos na região de fronteira da textura pode conter múltiplas classes de texturas, o tamanho da janela terá de ser pequeno. Para contornar este problema foi usado um algoritmo de alisamento adaptativo (Chang et al., 1998)) que repetidamente implementa uma simples operação de média até um dado critério ser satisfeito. Um operador típico de alisamento é o seguinte:

⎟⎟⎟

⎜⎜⎜

⎛=

121242121

161W

(2-1)

Para uma imagem ),( yxf de tamanho NN × , o critério de paragem para uma sub-imagem num nível p é dado por:

2

228.1 Npk

α=Γ (2-2)

Em que

∑∑++

=Γ−

x ykk

k

k yxfWyxfW

yxfD

ε),(),(

),(1 (2-3)

Onde α é uma estimativa da percentagem do número de pixeis de fronteira (valor recomendado 1/N), ε é um numero bastante pequeno, 1−−≡ kkk WWD , e kW significa aplicar o operador de alisamento k vezes.

Os valores de energia são depois normalizados num intervalo de 0 a 1.

2.2.2.1 Wavelets

É bem conhecido da teoria de Fourier que um sinal pode ser representado como uma soma, possivelmente infinita, de uma série de senos e co-senos. Este soma é conhecida como a expansão de Fourier. A grande desvantagem de uma expansão de Fourier é que só tem uma resolução de frequência e nenhuma resolução de tempo. Isto significa que apesar de ser possível determinar todas as frequências presentes num sinal, não sabemos quando estas estão presentes. De modo a ultrapassar este problema, foram desenvolvidas nas últimas décadas, soluções mais ou menos capazes de representar ao mesmo tempo o domínio em frequência e em tempo dum sinal.

16

Page 31: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

A ideia por detrás destas representações conjuntas frequência/tempo é cortar o sinal de interesse em várias partes e analisá-las separadamente. É óbvio que analisar um sinal desta maneira vai fornecer mais informação a cerca do onde e quando dos diferentes componentes de frequência mas isto levanta outro problema: como cortar o sinal? Supúnhamos que queríamos conhecer exactamente todos os componentes de frequência presentes num dado instante de tempo. Se cortarmos apenas este pequeno intervalo de tempo usando um impulso de Dirac (Nota: um impulso de Dirac é definido como f(t) = 1 para t=0 e f(t) = 0 para qualquer outro valor de t), algum está mal.

O problema aqui é que o cortar do sinal corresponde a um convolução entre o sinal e a janela de corte. Dado que convolução na janela de tempo é idêntica à multiplicação no domínio da frequência e dado que a transformação de Fourier de um impulso de Dirac contém todas as possíveis frequências, os componentes de frequência do sinal ficarão “borradas”por todo o eixo das frequências (Atenção de que estamos a falar duma transformação tempo/frequência bidimensional e não de uma transformação unidimensional). De facto, esta situação é o oposto da transformação Fourier standard dado que agora temos resolução de tempo mas não de frequência.

O princípio por detrás deste fenómeno descrito é o princípio de incerteza de Heisenberg que em termos de processamento de sinal, diz que é impossível saber a frequência exacta e o exacto tempo de ocorrência desta frequência num sinal. Por outras palavras, um sinal não pode simplesmente ser representado como um ponto no espaço de frequência/tempo. O princípio de incerteza mostra quão importante é a maneira de cortar o sinal.

A transformação wavelet ou análise de wavelet é provavelmente a solução mais recente que tenta ultrapassar as limitações da transformação de Fourier. Na análise de wavelet o uso de uma janela completamente dimensionável e modelável resolve o problema do corte do sinal. A janela é desviada ao longo do sinal e para cada posição é calculado o espectro (representação em frequência). Então este processo é repetido várias vezes com uma janela ligeiramente mais curta (ou longa) para cada novo ciclo. No fim, o resultado vai ser uma colecção de representações frequência/tempo do sinal, todas com diferentes resoluções. Devido a esta colecção de representações podemos falar de uma análise multiresolução. No caso das wavelets normalmente não se fala em representações frequência/tempo mas sim em representações escala de tempo, sendo escala num sentido oposto de frequência porque o termo frequência é da transformação de Fourier.

Nas secções seguintes será apresentada a transformação wavelet e uma maneira que permite implementar a transformação wavelet de uma maneira eficiente num computador digital.

A teoria de wavelets já não é recente existindo há mais de quinze anos havendo já alguns bons livros sobre o assunto tais como: Hernández e Weiss (1996), Goswami e Chan (1999) e Burrus et al (1997).

A transformação wavelet contínua

A análise wavelet descrita anteriormente é conhecida como a transformação wavelet contínua (continuous wavelet transform ou CWT). É formalmente escrita como:

17

Page 32: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

∫= dtttfs s )()()0,( *,τψγ (2-4)

Onde * significa o complexo conjugado. Esta equação mostra como uma função f(t) é decomposta num conjunto de funções básicas )(, tS τψ chamadas wavelets. As variáveis s e τ,

escala e translação, são as novas dimensões depois da transformação wavelet. A transformação inversa é definida como:

∫∫= dsdtstf s τψτγ τ )(),()( , (2-5)

As wavelets são geradas a partir de uma única wavelet básica )(tψ chamada wavelet mãe, através de dilatação e translação:

⎟⎠⎞

⎜⎝⎛ −

=s

ts

tsτψψ τ

1)(, (2-6)

Onde s é o factor de escala e τ é o factor de translação e o factor é para a normalização da energia ao longo das várias escalas.

2/1−s

É importante dizer que nestas três equações as funções wavelet de base não são especificadas. Esta é a diferença entre a transformação wavelet e a transformação Fourier ou outras transformações. A teoria das transformações wavelet trabalha com apenas propriedades gerais das wavelets e transformações wavelet. Define uma base de trabalho onde se pode desenhar wavelets ao gosto de cada um.

Propriedades das wavelets

As propriedades mais importantes das wavelets são a admissibilidade e a regularidade. Pode ser demonstrado em Sheng (1996) que as funções )(tψ do tipo “square integrable” (funções f(x)

tais que dxxf2

)(∫∞

∞− é finito) que satisfazem a condição de admissibilidade,

∫ +∞<ωωωψ

d2)(

(2-7)

Podem ser usadas para em primeiro lugar analisar e em seguida reconstruir o sinal sem perda de informação. )(ωψ significa a transformação de Fourier de )(tψ . A condição de admissibilidade implica que a transformação de Fourier de )(tψ torna-se nula para uma frequência nula, i.e.

18

Page 33: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

0)(0

2 ==ω

ωψ (2-8)

Isto significa que as wavelets deverão ter um espectro do tipo passa-banda. Este é uma observação muito importante, dado que vai ser utilizada mais tarde na construção de uma transformação wavelet eficiente.

Um zero na frequência nula significa também que o valor médio da wavelet no domínio do tempo deverá ser zero,

0)( =∫ tdtψ (2-9)

E por isso deverá ser oscilatória. Por outras palavras )(tψ deverá ser uma onda.

Como se poder ver na Equação (2-4) a transformação wavelets de uma função unidimensional é bidimensional, a transformação wavelets de uma função bidimensional é de dimensão 4. De modo que a transformação wavelets decresça rapidamente com o aumento escala s são impostas condições adicionais. São as chamadas condições de regularidade em que dizem que a função wavelets deverá ter alguma suavidade e concentração nos domínios de tempo e frequência. Regularidade é um conceito complexo. Vai ser explicado usando o conceito de vanishing moments.

Se expandirmos a transformação waveles em série de Taylor em t=0 até ordem n (onde τ=0 para simplificar) obtemos:

( )⎥⎦

⎤⎢⎣

⎡++⎟

⎠⎞

⎜⎝⎛= ∑ ∫

=

1!

)0(1)0,(0

)( nOdtst

ptf

ss

n

p

pp ψγ (2-10)

Aqui )( pf significa a p-nésima derivada de f e ( )1+nO significa o resto da expansão. Agora, se definirmos os momentos da wavelet por Mp,

∫= dtttM pp )(ψ (2-11)

Podemos reescrever Equação (2-10) como o desenvolvimento finito

( )⎥⎦

⎤⎢⎣

⎡+++++= ++ 21

)()2(2

1

)1(

!)0(....32

!2)0(

!1)0()0(1),( nn

n

n

o sOsMn

fsMfsMfsMfs

osγ (2-12)

Da condição de admissibilidade já sabemos que o 0-nésimo momento M0 = 0 de modo que o primeiro termo do lado direito da Equação (2-12) é nulo. Se fixarmos de maneira que os outros momentos até Mn também sejam nulos então os coeficientes wavelet ),( τγ s vão decair tão rapidamente como sn+2 para um sinal suave f(t). Isto é conhecido na literatura como vanishing moments ou ordem de aproximação. Se uma wavelet tem N vanishing moments, então a ordem de aproximação da transformação wavelet é N. Os momentos não têm de ser zero, um valor

19

Page 34: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

pequeno já é o suficiente. De facto, resultados experimentais sugerem que o número de vanishing moments requeridos depende em grande parte da aplicação.

Resumindo, a condição de admissibilidade dá-nos a onda, a regularidade e os vanishing moments dão-nos um decaimento rápido ou o let. Isto tudo dá-nos a wavelet.

Wavelets Discretas

Agora que sabemos o que é uma transformação wavelet é desejável torná-la prática. Contudo, a transformação wavelet descrita até agora tem três propriedades que a tornam difícil de usar directamente na forma da Equação (2-4). A primeira é a redundância da CWT. Na Equação (2-4) a transformação wavelet é calculada desviando continuamente uma função dimensionável sobre um sinal e calculando a correlação entre ambos. È notório que estas funções dimensionáveis nunca irão estar perto de uma base ortonormal e os coeficientes wavelet obtidos irão ser altamente redundantes. Era desejável que na maior parte das aplicações se retirasse esta redundância.

Mesmo sem a redundância da CWT ainda temos um número infinito de wavelets na transformação wavelet e era bom reduzir este número até um valor razoável. Este é o segundo problema que temos.

O terceiro problema é que para a maior parte das funções, as transformações wavelet não têm soluções analíticas e apenas podem ser calculadas numericamente ou por um computador analógico. São necessários algoritmos eficientes de modo a explorar o poder da transformação wavelet e é de facto a existência destes algoritmos que puseram hoje em dia na ribalta as wavelets.

Comecemos com a remoção da redundância.

Como já foi referido anteriormente, a CWT mapa um sinal unidimensional numa representação conjunta a duas dimensões em escala de tempo que é altamente redundante. E como estamos à procura de eficiência, queremos a descrição dum sinal com o menor número possível de componentes. Para ultrapassar este problema foram introduzidas wavelets discretas. Estas não são continuamente dimensionáveis e translacionáveis mas apenas em pequenos passos. Isto é conseguido, modificando a Equação (2-6) de modo a criar

⎟⎟⎠

⎞⎜⎜⎝

⎛ −= 0

00

0,1)(

j

j

j

kj sskt

st

τψψ (2-13)

Apesar de se chamar wavelet discreta é na verdade uma função linear. Na Equação (2-13) j e k são inteiros e s0>0 é o passo de dilatação fixo. O factor de translação 0τ depende do passo de dilatação. O efeito da discretização da wavelet é que o espaço tempo-escala é agora amostrado em intervalos discretos. Geralmente escolhe-se s0 = 2 de modo que a amostragem do eixo de

20

Page 35: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

frequências corresponda á amostragem dyadic. Para o factor de translação, normalmente escolhe-se τ0 = 1 de modo que se tenha amostragem dyadic no eixo do tempo.

Quando são usadas wavelets discretas para transformar um sinal contínuo, o resultado é uma série de coeficientes wavelet. Este processo é denominado wavelet series decomposition. Uma questão importante da decomposição é claro a reconstrução. Se não se puder reconstruir o sinal não tem utilidade. De facto é possível reconstruir o sinal a partir da decomposição wavelet. Prova-se que a condição necessária e suficiente para uma reconstrução estável é que a energia dos coeficientes wavelet deverão estar entre extremos positivos, isto é:

22

,,

2 , fBffAkj

kj ≤≤∑ ψ (2-14)

Onde 2f é a energia de f(t), A>0, B<∞ e A,B independentes de f(t). Quando a Equação (2-14)

é satisfeita, a família das funções de base )(, tkjψ com é chamada de frame com extremos A e B. Quando A=B o frame é “apertado” e as wavelets discretas comportam-se como uma base ortonormal. Quando A ≠ B é possível uma reconstrução exacta à custa de um frame duplo. Num duplo frame a transformada wavelet discreta, a decomposição wavelet é diferente da reconstrução wavelet.

Por agora vamos esquecer os frames e vamos nos concentrar na remoção de toda a redundância na transformação wavelet. O último passo que temos de tomar é tornar as wavelets discretas ortonormais. Isto apenas pode ser feito com wavelets discretas. As wavelets discretas podem ser ortonormais às suas próprias dilatações e translações através de escolhas especiais na wavelet mãe, querendo dizer:

∫⎩⎨⎧ ==

=situações outras as para0

nk e mj 1)()( *

,,

sedttt nmkj ψψ (2-15)

Um sinal arbitrário pode ser reconstruído somando as funções wavelet de base ortonormais, pesadas pelos coeficientes da transformação wavelet:

∑=kj

kj tkjtf,

, )(),()( ψγ (2-16)

A Equação (2-16) mostra a transformada inversa para wavelets discretas.

Filtro passa-banda

Com a redundância removida, ainda temos dois problemas a serem resolvidos até termos a transformação wavelet em termos práticos. Continua-se com a tentativa de reduzir o número de wavelets necessárias na transformação wavelet e por fim resolver o problema da dificuldade em obter uma solução analítica.

Mesmo com wavelets discretas precisamos de um número infinito de dimensionalizações e translações para calcular a transformação wavelet. A maneira mais fácil de resolver este

21

Page 36: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

problema é simplesmente não usar um número infinito de wavelets discretas. Claro que isto faz pôr a questão da qual a qualidade da transformação. É possível reduzir o número de wavelets ao analisar um sinal e mesmo assim ter um resultado útil?

As translações das wavelets são limitadas pela duração do sinal que estamos a analisar de modo a ter um limite superior para as wavelets. Isto deixa-nos com a questão da dilatação: quantas escalas são necessárias para analisar o sinal? Como obter um limite inferior? Podemos resolver a estas questões olhando para a transformação wavelet de outra maneira.

Se olharmos para a Equação (2-8), vemos que a wavelet tem um espectro do tipo passa-banda. Da teoria de Fourier sabemos que a compressão no tempo é equivalente a esticar o espectro e deslocá-lo para cima.

{ } ⎟⎠⎞

⎜⎝⎛=

aF

aatfF ω1)( (2-17)

Isto significa que uma compressão no tempo da wavelet por um factor de 2 vai esticar o espectro de frequência da wavelet por um factor de 2 e vai também deslocar todos os componentes de frequência para cima por um factor de 2. Usando isto, podemos percorrer o espectro finito do nosso sinal, com o espectro de wavelets dilatadas da mesma maneira que foi coberto o nosso sinal no domínio do tempo, usando wavelets translacionadas. De modo a ter um bom alcance do espectro do sinal, os espectros das wavelets esticadas devem tocar entre si desta maneira:

Figura 2 - Espectros de wavelets tocando-se resultantes da dilatação da wavelets mãe no domínio do tempo (figura retirada de Vlanes (2007))

Resumindo, se uma wavelet for vista como um filtro passa-banda, então uma série de wavelets dilatadas podem ser vistas como um banco de filtros passa-banda. Se olharmos para o rácio entre a frequência central do espectro da wavelet e a largura deste espectro, vê-se que é o mesmo para todas as wavelets. Este rácio é conhecido como o factor de fidelidade Q de um filtro e no caso das wavelets fala-se portanto de um factor constante de um banco de filtros.

Um constrangimento de energia

Existe outro constrangimento bastante importante: o sinal a analisar tem de ter energia finita. Se o sinal tiver energia infinita será impossível percorrer o espectro de frequência e a sua duração no tempo com wavelets. Este constrangimento aparece na forma:

22

Page 37: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

∞<∫∞

dttf0

2)( (2-18)

E é equivalente a dizer que a norma L2 do nosso sinal f(t) deverá ser finita. Isto é onde entra o espaço de Dilbert.

A função de escala

Uma pergunta interessante a colocar será como percorrer todo o espectro até o zero? Porque cada vez que se estica uma wavelet no domínio do tempo com um factor de 2 a sua largura de banda fica na metade. Por outras palavras, com cada esticar da wavelet apenas percorremos metade do espectro restante significando que será necessário um número infinito de wavelets.

A solução para este problema é simplesmente não tentar cobrir todo o espectro até o zero com a wavelet mas usar uma “rolha” (cork) para tapar o buraco quando for pequeno o suficiente. Esta “rolha” será então um espectro tipo passa-baixo e pertence à chamada função de escala. Devido à natureza do espectro da função de escala ser um passa-baixo é por vezes chamado averaging filter.

Se olharmos para a função de escala como sendo apenas um sinal com um espectro tipo passa-baixo então podemos decompor em componentes wavelet e expressá-la como:

∑=kj

kj tkjt,

, )(),()( ψγϕ (2-19)

Dado que escolhemos a função de escala )(tϕ de maneira que o seu espectro coubesse no espaço deixado pelas wavelets, a expressão Equação (2-19) usa um número infinito de wavelets até uma certa escala j (ver Figura 3) enquanto que o resto é feito pelas wavelets. Assim, limitámos o número de wavelets de um número infinito para um número finito.

Figura 3 - Como um número infinito de wavelets é substituído por uma função de escala (figura retirada de Vlanes (2007))

Ao introduzir a função de escala, resolveu-se o problema do número infinito de wavelets e escolheu-se um limite inferior para as wavelets. Claro que ao usar uma função de escala em vez de wavelets perdemos informação. Isto é, de um ponto de vista da representação do sinal não perdemos qualquer informação dado que ainda é possível reconstruir o sinal original mas de um ponto de vista da análise wavelet, é desprezada informação importante da dilatação. Mas como

23

Page 38: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

sempre, haverá limitações práticas do número de coeficientes wavelet que se consegue manejar. Como veremos mais tarde, na transformada wavelet discreta este problema é mais ou menos resolvido automaticamente.

O espectro tipo passa-baixo da função de escala permite-nos declarar outra condição semelhante à Equação (2-9):

∫ = 1)( dttϕ (2-20)

Que mostra que o momento 0 da função de escala não pode ser nulo.

Resumindo, se uma wavelet pode ser vista como filtro passa-banda e a função de escala como um filtro passa-baixo, então um conjunto de wavelets dilatadas em conjunto com uma função de escala pode ser vistos com um banco de filtros.

Subband coding

Dois dos três problemas mencionados na anteriormente foram resolvidos mas ainda não sabemos como calcular a transformada wavelet.

Se olharmos para a transformação wavelet como um banco de filtros, então podemos considerar a transformação wavelet do sinal como um sinal ao passar por este banco de filtros. As saídas das diferentes etapas dos filtros são os coeficientes da transformação wavelet e os da função de escala. Não é uma ideia nova analisar o passar do sinal num banco de filtros, é já há alguns anos designada com o nome de subband coding. É usado por exemplo em aplicações de visão computacional.

24

Page 39: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

Figura 4 - Splitting do espectro do sinal com um banco de filtros iterativo (figura retirada de Vlanes (2007))

O banco de filtros na subband coding pode ser construído de várias maneiras. Uma maneira é construir vários filtros passa-banda de modo a dividir o sinal em bandas de frequência. A vantagem neste caso é que a largura de cada banda pode ser escolhida de qualquer maneira de modo que o espectro do sinal a analisar seja coberto nas partes que interessa. Outra maneira é dividir o espectro do sinal em duas partes (iguais), uma de baixas frequências e outra de altas frequências. A parte das altas frequências contém os detalhes mais pequenos que estamos interessado e podemos parar por aqui. Agora temos duas bandas. Contudo, a parte das baixas frequências contém alguns detalhes e por isso podemos dividir outra vez. E outra até estarmos satisfeitos com o número de bandas que se criou. Desta maneira criou-se um banco de filtros iterativo. Normalmente o número de bandas é limitado por exemplo pela quantidade de dados e pelo poder computacional existente. O processo de divisão do espectro é mostrado na Figura 4. A vantagem deste método é que temos de desenhar apenas dois filtros e a desvantagem é que a cobertura do espectro do sinal é fixa.

Olhando para a Figura 4, observa-se que o que fica depois da divisão sucessiva do espectro é uma série de bandas (típicas dum filtro passa-banda) com largura de banda que duplica e uma banda típica dum passa-baixo (apesar de em teoria a primeira divisão dar-nos uma banda do tipo passa-alto e outra do tipo passa-baixo, na realidade a banda típica do passa-alto é um banda típica dum filtro passa-banda devido à largura de banda limitado do sinal). Por outras palavras, podemos proceder à análise subband passando o sinal por um banco de filtros passa-banda em que cada filtro tem uma largura de banda dupla da do seu vizinho esquerdo (o eixo da frequência aqui está para o lado esquerdo) e por um filtro passa-baixo. No início desta secção foi dito que isto era o mesmo que aplicar a transformação wavelet ao sinal. As wavelets dão-nos as bandas do tipo passa-banda com largura de banda a dobrar e a função de escala dá-nos a banda do tipo-baixo. Daqui podemos concluir que a transformação wavelet é o mesmo que um

25

Page 40: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

esquema do tipo subband coding usando banco de filtros com constante Q. De modo geral referimo-nos a este tipo de análise, análise multiresolução.

Resumindo, se implementarmos a transformação wavelet com um banco de filtros iterativos, não é necessário especificar as wavelets explicitamente.

A transformação wavelet discreta

Em muitas aplicações o sinal em questão é amostrado. De modo a ver os resultados que se conseguiu até agora com um sinal discreto, temos de construir também a transformação wavelet discreta. Relembrando que as wavelets discretas não são discretas no tempo, apenas a translação e o passo de escala são discretos, parece intuitivo simplesmente implementar o banco de filtros wavelet, como um banco de filtros digital mas precisamos de ter a certeza.

Na Equação (2-19) demonstrou-se que a função de escala pode ser expressa em wavelets desde -∞ até uma certa escala j. Se adicionarmos ao espectro da função de escala o espectro da wavelet, obtemos uma nova função de escala com um espectro mais largo o dobro do que o anterior. Podemos expressar esta formalidade na chamada formulação multiresolução ou two-scale relation:

∑ −= ++

k

jj

j ktkht )2()()2( 11 ϕϕ (2-21)

A relação two-scale diz que a função de escala numa determinada escala pode ser expressa em termos de função de escala translacionada na próxima escala mais pequena. Atenção que escala mais pequena significa mais detalhe.

A primeira função de escala substituiu um conjunto de wavelets e portanto podemos mostrar as wavelets neste conjunto em termos de funções de escala translacionadas na próxima escala. Mais especificamente, podemos escrever para a wavelet num nível j:

∑ −= ++

k

jj

j ktkgt )2()()2( 11 ϕψ (2-22)

Que é a relação two-scale entre a função de escala e a wavelet.

Dado que ao nosso sinal f(t) pode ser expresso de wavelet dilatadas e translacionadas até uma escala j-1, isto leva ao resultado que diz que f(t) pode ser expressa de funções de escala dilatadas e translacionadas numa escala j:

∑ −=k

jj ktktf )2()()( ϕλ (2-23)

De modo a ser consistente com a notação devemos falar neste caso de funções de escala discretas dado que apenas são permitidas dilatações de translações discretas.

Se nesta equação dermos um passo até uma escala j-1, temos de adicionar wavelets de modo a manter o mesmo nível de detalhe. Podemos expressar o sinal f(t) como:

26

Page 41: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

∑ ∑ −+−= −−

−−

k k

jj

jj ktkktktf )2()()2()()( 1

11

1 ψγϕλ (2-24)

Se a função de escala )(, tkjϕ e as wavelets )(, tkjψ são ortonormais ou um tight frame, então os

coeficientes )(1 kj−λ e )(1 kj−γ são encontrados tomando os produtos internos

)(,)()( ,1 ttfk kjj ϕλ =−

)(,)()( ,1 ttfk kjj ψγ =− (2-25)

Se substituirmos )(, tkjϕ e )(, tkjψ nos produtos internos por versões adequadas translacionadas e dilatadas da Equação (2-19) e da Equação (2-22) as manipularmos um pouco, tendo em conta que o produto interno pode também ser escrito como uma integração, chega-se a um importante resultado:

∑ −=−m

jj mkmhk )()2()(1 λλ (2-26)

∑ −=−m

jj mkmgk )()2()(1 γγ (2-27)

Estas duas equações indicam que os coeficientes da função wavelet e da função de escala numa certa escala podem ser encontrados calculando a soma pesada dos coeficientes da função de escala da escala anterior. Agora recordando da secção de função de escala que os coeficientes de função de escala vêm dum filtro passa-baixo e recordando também da secção da subband coding onde o banco do filtros iterativo era o espectro tipo passa-baixo a ser dividido numa parte tipo passa-baixo e noutra parte tipo passa-alto. O banco de filtros iterativo começava com o espectro do sinal, então se imaginarmos que o espectro do sinal é a saída dum filtro passa-baixo numa escala anterior (imaginária), então podemos considerar o nosso sinal amostrado como os coeficientes da função de escala da escala (imaginária) anterior. Por outras palavras, o nosso sinal f(t) amostrado é simplesmente igual a )(kλ na maior escala.

De acordo com a teoria de processamento de sinais uma soma pesada discreta como a da Equação (2-26) e da Equação (2-27) é a mesma dum filtro digital e também como sabemos que

os coeficientes )(kjλ vem da banda tipo passa-baixo do espectro do sinal dividido, os factores de peso h(k) na Equação (2-26) devem formar um filtro passa-baixo. E como sabemos que os

coeficientes )(kjγ vêm da banda tipo passa-alto do espectro do sinal dividido, os factores de peso g(k) na Equação (2-27) devem formar um filtro passa-alto. Isto significa que a Equação (2-26) e a Equação (2-27) formam ambas uma etapa dum filtro digital iterativo e a partir de agora vamos nos referir aos coeficientes h(k) como filtros de dilatação e os coeficientes g(k) como filtros wavelet.

Agora demonstrou-se que é possível implementar a transformação wavelet como um banco de filtros digital iterativo a partir de agora podemos falar da Transformação Wavelet Discreta (DWT). Se olharmos para a Equação (2-26) e a Equação (2-27) vemos que os filtros de

27

Page 42: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

dilatação e os filtros wavelet têm um passo 2 na variável k. Isto faz com que apenas depois de todos os outros coeficientes j(k) serem usados na convolução com o resultado de que a variação dos dados de saída ser igual à variação dos dados de entrada. Estas duas equações definem a propriedade de subamostragem.

A propriedade de subamostragem também resolve o nosso problema que aparece no fim da secção da função de escala, que era como escolher a largura do espectro da função de escala. Porque, cada vez que avançamos uma iteração no banco de filtros, o número de amostras da próxima etapa é metade de modo que no fim ficamos só com uma amostra (no caso mais extremo). Será claro que é neste caso que a iteração tem de parar e isto determina a largura do espectro da função de escala. Normalmente a iteração pára no ponto onde o número de amostras ficou menor do que o comprimento do filtro de dilatação ou do filtro wavelet, qual for o mais longo. O comprimento do filtro mais longo determina a largura do espectro da função de escala.

Figura 5 - Implementação da Equação (2-26) e da Equação (2-26)como uma etapa dum banco de filtros iterativo (figura retirada de Vlanes(2007))

Modificação da decomposição Discrete Wavelet Frames

Para uma transformação wavelet standard, o output dos filtros é sub-amostrado em cada nível resultando num output com o mesmo tamanho da imagem de input. Por outro lado na DWF os dados de output são todos preservados. Para uma imagem MM × , o output da transformação wavelet são 2M coeficientes enquanto que o output da DWF será 2)13( MK ×+ coeficientes.

Se se amostrar o output da DWF para todos as k2 amostragens, em que k = 1,…,K é o nível associado com uma dada imagem filtrada, o output será exactamente igual ao da transformação standard wavelet. Os coeficientes da transformação standard são de facto um subconjunto de um maior conjunto de coeficientes DWF. Por isso computacionalmente é vantajoso usar a transformação wavelet standard em vez da DWF.

No entanto, devido à sub-amostragem, os coeficientes da transformação wavelet são de elevada variância o que poderá afectar gravemente o processo de clustering. A DWF não sofre deste problema. A transformação standard é perfeitamente reconstrutível sendo vantajosa nalgumas aplicações mas não é muito adequada à segmentação de imagens, pelo menos para o caso automático.

28

Page 43: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

Por outro lado, é possível reduzir os coeficientes da discrete wavelet frames de modo a usar a estrutura piramidal da transformação wavelet standard sem afectar grandemente a distribuição dos dados no espaço de features. Se os coeficientes da DWF forem escolhidos cuidadosamente em vez de desprezar valores à toa como no caso da transformação wavelet standard, podem ser preservados clusters bem definidos e a quantidade de dados pode ser reduzido grandemente. Um método simples e fiável é tomar a média da energia em blocos distintos. Para cada imagem filtrada, os coeficientes DWF são divididos em blocos distintos de tamanho kk 22 × e a energia média dos coeficientes nos blocos são tidos como os novos coeficientes da DWF naquele nível. Isto resulta numa redução de dados de um factor ( kk 22 × ) para aquela imagem filtrada em particular. Se este procedimento for repetido para cada imagem filtrada da DWF teremos a mesma estrutura piramidal da transformação wavelet standard mas com melhores coeficientes.

2.2.3 Fase de segmentação Bottom-up

Na fase de segmentação Bottom-up, começamos com o nível K e produzimos uma segmentação intermédia para o nível K-1 usando as quatro sub-imagens do nível K. Para gerar a segmentação intermédia, as quatro sub-imagens de tamanho knkn −− × 22 são integradas de uma maneira que possa ser vista como dados a quatro dimensões knkn −− × 22 , antes do algoritmo means shift ser aplicado e devolver o número de clusters detectados nos dados assim como as posições dos seus centros. O algoritmo FCM é a seguir aplicado nos dados a quatro dimensões, usando a informação dada pelo algoritmo mean shift.

2.2.3.1 Algoritmo fuzzy c-means clustering

Dados M pontos de input { Mmxm ,...,1; }= , o número de clusters C ( )MC <≤2 , e o

expoente de peso fuzzy w , ∞<< w1 , inicializar as funções fuzzy de pertença )0(,mcu com

MmCc ,...,1 e ,...,1 == que são as entradas da matrix Uo de dimensão MC × . Realizar a seguinte iteração ,...2,1=l

O algoritmo é o seguinte:

• Calcular os centros dos clusters fuzzy lcv com

( )( )

∑∑=

=

=M

mM

m

wmc

mwmcc

u

xuv

1

1,

, (2-28)

• Actualizar )(lU com

29

Page 44: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

∑=

⎟⎟⎠

⎞⎜⎜⎝

⎛=

C

i

w

mi

mc

mc

dd

u

1

12

,

,

,1

(2-29)

onde ( ) 22, immi vxd −=

• Se ε≤−+ )()1( ll UU parar; senão regressar ao passo 1

O algoritmo means shift é usado de modo a inicializar valores da matriz )0(U sendo o valor inicial de )0(U muito próximo do valor final de )0(U . Assim, parte do trabalho do FCM que é descobrir os centros dos clusters já está feito. Está demonstrado que o algoritmo termina após poucas iterações devido à localização precisa dos centros dos clusters.

O output do FCM é uma função de pertença knkn −− × 22 de tamanho NC onde NC é o número de clusters. Cada elemento da função de pertença descreve o valor de pertença em relação a um determinado cluster e a soma destes elementos é igual a 1. A função de pertença é depois interpolada para o tamanho 11 22 +−+− × knkn de modo que tenha o mesmo tamanho dos dados do nível seguinte. Por simplicidade, é usado um algoritmo de interpolação linear.

Num nível K-1 a função de pertença interpolada é integrada com as 3 sub-imagens deste nível resultando num conjunto de dados de dimensão (NC+3) que vai ser usada no próximo passo do algoritmo means shift e do FCM. Estes processos de integração de dados, mean shift, clustering e interpolação são aplicados recursivamente de baixo para cima de maneira que se obtém o resultado da segmentação no nível de base, isto é, a imagem original.

30

Page 45: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

2.2.3.2 Algoritmo Mean Shift

O algoritmo mean shift é uma nova técnica de clustering que procura possíveis centros de clusters baseando-se no gradiente da densidade dos dados permitindo assim ter segmentação de imagens sem conhecer a priori o tipo de texturas existentes.

A ideia por detrás deste algoritmo é mover todos os pontos do espaço de features até uma determinada distância até convergirem para certos pontos. Os pontos de convergência são subsequentemente analisados de maneira a encontrar possíveis centros dos clusters. Um ponto é movido para uma nova localização baseada na média de todos os pontos contidos numa esfera de raio h do ponto em causa. Teoricamente, o ponto será movido para o máximo local de densidade do conjunto de dados.

O algoritmo usado na técnica de segmentação pode ser dividido em 5 fases:

Amostragem dos dados – De modo a reduzir o peso computacional, é seleccionado aleatoriamente um conjunto m de pontos chamado conjunto de amostra. São impostos dois constrangimentos nos pontos contidos no conjunto de amostra. A distância entre duas vizinhanças não deverá ser menor que h, o raio da hiperesfera Sh(x) e os pontos de amostragem não deverão pertencer a regiões esparsas. O objectivo da última condição é evitar clusters de baixa densidade. A região é esparsa quando o número de pontos dentro da esfera é menor que um threshold T.

Mode seeking - Para cada um dos pontos de amostragem, aplicar o procedimento do mean shift até os pontos convergirem para pontos estacionários. O cálculo dos mean shift para cada ponto de amostragem é baseado na totalidade do conjunto de dados. Os pontos de convergência são considerados candidatos a centros dos clusters.

Cálculo dos centros dos clusters – Qualquer subconjunto de candidatos a centros de clusters que esteja suficientemente perto entre si (para qualquer ponto no subconjunto de dados, existe um outro ponto no subconjunto em que a distância entre eles é menor que h) define um centro de cluster. O centro dos clusters é a média dos centros de clusters candidatos no subconjunto.

Validação dos centros dos clusters – Entre dois centros de clusters, deverá existir um vale no valor da densidade. A existência deste vale é testada para cada par de centros de clusters. Se a densidade em qualquer ponto entre os dois centros é menor que V x (densidade máxima entre dois centros); 10 <<V , então existe um vale e os dois centros são válidos. Se não for encontrado o vale, o centro do cluster é removido do conjunto de centros de clusters.

Delineação dos clusters – Neste fase, cada ponto é associado a um centro de cluster usando a técnica de clustering fuzzy c-means (FCM).

2.3 Segmentação usando filtros de textura

O algoritmo deste método de segmentação consiste numa série de transformações à imagem a segmentar. É tirado um descritor de textura e em seguida é aplicado um threshold de modo a

31

Page 46: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

dividir a imagem em diferentes regiões. Em seguida são aplicadas várias transformações de modo a obter regiões coesas.

2.3.1 Algoritmo

O Algoritmo consiste no seguinte:

• Calcular a matriz de uma imagem onde cada pixel contém o valor da entropia local de uma vizinhança 9x9 à volta do pixel correspondente da imagem a segmentar

• Redimensionar os valores de matriz do passo anterior de modo que estejam entre os valores típicos de uma imagem de intensidade

• Aplicar um threshold à matriz obtida no passo anterior obtendo uma imagem binária

• Remover da imagem binária todos os componentes ligados (objectos) que têm menos do que P pixeis

• Aplicar uma operação de fecho à imagem anterior com um elemento estrutural nxn de modo a uniformizar as regiões

• Aplicar uma operação de abertura à imagem anterior com um elemento estrutural nx1 de modo a remover linhas horizontais

• Aplicar uma operação de abertura à imagem anterior com um elemento estrutural 1xn de modo a remover linhas verticais

• Preencher os “buracos” da imagem binária anterior

2.3.2 Entropia local

Entropia é um descritor de região que quantifica uma textura. Existem 3 abordagens em processamento de imagem para descrever a textura de uma região: estatística, estrutural e espectral. Entropia é um descritor do tipo estatístico que mede a aleatoriedade da intensidade dos pixeis. É, de acordo com Gonzalez, R e Woods, R. (2003), definida da seguinte maneira:

∑−

=

−=1

02 )(log)(

L

iii zpzpe (2-30)

Onde zi é uma variável aleatória que indica a intensidade e p(zi) é o histograma de níveis de intensidade numa região, L é o número possível de níveis de intensidade. A entropia tende a ser menor em regiões onde os níveis de intensidade não variam muito, caso de imagens com textura mais lisa, mais uniforme. E tende a ser maior em regiões de imagem onde a textura é mais rugosa, onde os níveis de intensidade variam mais.

32

Page 47: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

2.3.3 Operações morfológicas Operações morfológicas aplicadas a processamento de imagem são um conjunto de técnicas baseadas em morfologia matemática. Algumas destas operações são: abertura, fecho, dilatação, erosão, etc.

Dilatação Considerando dois conjuntos A e B em Z2, a dilatação de A por B, denotada por é definida como:

BA⊕

( )( )؈| ≠∩=⊕ ABzBA Z (2-31)

Esta equação é baseada na obtenção da reflexão de B em relação à sua origem e translacionando

a sua imagem um valor z, de modo que B̂ e A se sobreponham por pelo menos um elemento. Baseando-se nesta interpretação, a equação (2-31) pode ser reescrita como:

( )[ ]( )AABzBA Z ⊆∩=⊕ ˆ| (2-32)

O conjunto B é o chamado elemento estrutural na dilatação assim como noutras operações morfológicas.

Figura 6 – Exemplo de dilatação do conjunto A com o elemento estrutural B (imagem retirada de

Gonzalez, R. e Woods, R. (2002)) BA⊕

Na Figura 6 é apresentado um conjunto simples A e um elemento estrutural B e a sua reflexão (o ponto a negro representa a origem do elemento). Neste caso o elemento estrutural e a sua reflexão são iguais porque B é simétrico em relação à sua origem. A linha a traço interrompido no conjunto mostra o conjunto original A de referência e a linha sólida de mostra o

limite para o quais quaisquer novos deslocamentos da origem de

BA⊕

B̂ por z iria causar que a intersecção de B̂ com A fosse vazia. Por isso, todos os pontos dentro desta fronteira constituem a dilatação de A por B. Na Figura 7 é mostrado um elemento estrutural desenhado para conseguir uma maior dilatação vertical que horizontal e a dilatação conseguida por esse elemento.

33

Page 48: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

Figura 7 – Elemento Estrutural e dilatação resultante (imagem retirada de Gonzalez, R. e Woods, R. (2002))

Erosão Considerando dois conjuntos A e B em Z2, a erosão de A por B, denotada por A B é definida como:

A B ( )( )ABz Z ⊆= | (2-33)

Esta equação indica que a erosão de A por B é o conjunto de todos os pontos z tais que B, translacionado por z, está contido em A.

Figura 8 – Conjunto A e sua erosão usando o elemento estrutural B (imagem retirada de Gonzalez, R. e

Woods, R. (2002))

Na Figura 8, o conjunto A é apresentado como a linha a traço interrompido. A fronteira da região a sombreado mostra o limite para o qual quaisquer deslocamentos da origem de B causariam que este conjunto estivesse completamente contido em A. Esta região mostra a erosão de A usando B.

34

Page 49: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

Figura 9 – Elemento estrutural vertical e respectiva erosão (imagem retirada de Gonzalez, R. e Woods, R. (2002))

Na Figura 9 é apresentada uma erosão originada por um elemento estrutural vertical. O conjunto original foi erodido até ficar numa linha.

Abertura e Fecho

A Abertura do conjunto A pelo elemento estrutural B, denominada c Bomo Ao é definida como:

(ABA =o BB ⊕) (2-34)

Assim, a abertura de A por B é a erosão de A por B seguida da dilatação do resultado por B.

fecho do conjunto A usando o elemento estrutural B, denominado

Similarmente, o BA• é definida como:

( )BABA ⊕=• B (2-35)

35

Page 50: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

2.4 Segmentação segundo cor usando k-means clustering

O algoritmo do método de segmentação é o seguinte:

• Ler a imagem a cores

• Converter a imagem do espaço de cores RGB para o espaço L*a*b*

• Considerando como objectos os valores dos pixeis com valores “a*” e “b*”, aplicar o algoritmo k-means para um número n de clusters usando a distância Euclidiana.

O número n de clusters deverá ser igual ao número de cores presente na imagem a segmentar. Este algoritmo não é automático na medida em que é necessário saber a priori o número de cores presentes na imagem a segmentar.

Ao usar o algoritmo k-means obtém-se um índex que relaciona cada pixel da imagem a segmentar a um cluster apenas. Assim para se obterem as regiões, basta verificar quais os pixeis pertencentes a cada cluster.

2.4.1 Algoritmo k-means clustering

O algoritmo k-means é um dos algoritmos mais simples que resolve um problema de clustering. O procedimento segue uma maneira fácil e simples de classificar dados através de um dado número de clusters (assumir k clusters) fixo a priori. A ideia principal é definir k centróides, um para cada cluster. Estes centróides deverão ser colocados de uma forma ardilosa porque diferentes locais originam diferentes resultados. Então, a melhor maneira é colocá-los o mais longe possível uns dos outros. O próximo passo é tomar em cada ponto pertencente a um conjunto de dados e associá-lo ao centróide mais perto. Depois é necessário recalcular k novos centróides como baricentros dos clusters obtidos anteriormente. Depois de termos estes novos k novos centróides tem de haver uma nova correspondência entre os mesmos pontos dos dados e o novo centróide mais próximo. Isto cria um ciclo. Assim, vemos que os k centróides mudam de localização passo a passo até um certo ponto. Quando os centróides ficam fixos a um lugar, o ciclo termina.

Finalmente, este algoritmo tem como objectivo minimizar uma função objectivo, neste caso uma função de erro quadrático:

∑∑= =

−=k

j

k

ij

ji cxJ

1

2

1

)( (2-36)

Onde 2)(

jj

i cx − é uma medida da distância escolhida entre um ponto dos dados e um

centro dum cluster , é um indicador da distância entre os n pontos dos respectivos centros dos

clusters.

)( jix

jc

36

Page 51: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

O algoritmo consiste nos seguintes passos:

1. Colocar k pontos no espaço representado pelos objectos.

2. Corresponder cada objecto ao grupo que tem ao centróide mais próximo

3. Quando todos os objectos forem correspondidos, recalcular as posições dos K centróides

4. Repetir os passos 2 e 3 até os centróides não se moverem.

Apesar de se poder provar que o procedimento termina sempre, o algoritmo k-means não encontra necessariamente a solução óptima correspondendo ao mínimo global da função objectivo. O algoritmo é também significativamente sensível aos centros dos clusters escolhidos aleatoriamente. O algoritmo k-means pode ser corrido várias vezes para minimizar este efeito.

2.4.2 Espaços de cor

Um Espaço de Cor, é um modelo matemático abstracto que descreve como as cores são representadas por tuplas de números (uma sequência ordenada de n elementos, que pode ser definida pela recursão do par ordenado), tipicamente três ou quatro valores (ou componentes de cor), por exemplo RGB ou HSV. Um Espaço de Cor pode ser visto como um sistema definido por uma base representativa das componentes, de acordo com a definição do espaço considerado. A representação de qualquer cor pode então ser feita à custa da combinação dessas componentes

Espaço de cor RGB

O espaço de cores RGB é semelhante ao sistema visual humano. Os espaços RGB geralmente são definidos através de três cores primárias (verde, vermelho e azul). Este espaço é baseado num referencial cartesiano cujo sub-espaço de interesse é um cubo.

O modelo é implementado de diferentes maneiras, dependendo das capacidades do sistema usado. A utilização mais comum hoje em dia é a implementação a 24 bits, com 8 bits, ou 256 níveis discretos de cor por canal. Qualquer espaço de cor baseado num modelo RGB a 24bits é limitado a 7,16256256256 ≈×× milhões de cores.

37

Page 52: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

Figura 10 - Cubo RGB a 24 bits

Para um modelo a 24 bits (ver a Figura 10) nos vértices do cubo RGB, encontram-se as cores primárias (vermelho, verde e azul), as cores secundárias (magenta, amarelo e ciano, que se obtêm através das cores primárias), o branco e o preto. É ainda de salientar que a diagonal que une os vértices correspondentes ao preto e ao branco representa a escala de cinza. Cada componente de cor (R, G e B) pode ser vista como uma imagem monocromática (escala de cinza) cujos pixeis apresentam valores de intensidade contidas no intervalo [0; 255], sendo que a união destas três componentes origina a imagem a cores.

Espaço de cor L*a*b*

O espaço L*a*b* é um de dois espaços desenvolvidos pela CIE que são aproximadamente perceptualmente uniformes. Isto significa que as cores que aparentam ser similares para um observador estão localizadas perto umas das outras no espaço de coordenadas L*a*b*.

No espaço de cor L*a*b*:

• L* representa a luminosidade.

• a* representa a sensação vermelho-verde em que um valor positivo de a* indica uma cor avermelhada e negativo, uma cor esverdeada.

• b* representa a sensação amarelo-azul em que um valor positivo de b* indica uma cor amarelada e negativo, uma cor azulada

Níveis de cinzento ou pontos em cor estão localizados no eixo da luminosidade (a* = 0 e b* = 0) com o preto a L* = 0 e o branco com L* = 100.

A transformação de RGB para o espaço L*a*b* é feita transformando em primeiro lugar para o espaço CIE XYZ e a seguir para o L*a*b*. Isso é explicado em Hanburry, A. e Serra, J. (2001) .

38

Page 53: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

3 Técnicas de indexação

Neste capítulo são apresentadas técnicas que se usaram nos métodos de indexação descritos nas secções 4.2 e 4.3. Em primeiro lugar, na secção 3.1 são apresentados descritores de forma que têm como função descrever numericamente a forma de um objecto. Em seguida, na secção 3.2, é apresentado o método de sobreposição de áreas usado para obter um valor numérico que quantifica a semelhança entre a forma de dois objectos. Por fim, na secção 3.3 são descritas e analisadas as curvas de precisão e recuperação, um método de avaliação da indexação.

3.1 Descritores de formas

Foram desenvolvidas várias técnicas qualitativas e quantitativas para caracterizar a forma de objectos numa imagem. Estas técnicas podem ser úteis para por exemplo classificar objectos num sistema de reconhecimento de padrões.

Depois de uma imagem ser segmentada em regiões usando métodos como os apresentados no Capítulo 3, o conjunto agregado de pixeis é usualmente representado e descrito numa forma mais adequada para processamento por computador.

Estes métodos de representação podem ser caracterizados através dos diferentes pontos de vista:

• Forma de representação de entrada: A representação da região envolve duas escolhas, representar a região em termos das suas características externas (por exemplo, o seu contorno) ou em termos das suas características internas (os pixeis que compõem a região.

• Capacidade de reconstrução do objecto: a forma de um objecto pode ou não ser reconstruída a partir da descrição. Existem vários tipos de métodos que preservam a forma, diferindo no grau de precisão da reconstrução desta.

• Capacidade de reconhecimento da forma incompleta: em que medida a forma de um objecto pode ser reconhecida a partir da descrição se os objectos estão oclusos na imagem e apenas existe uma informação parcial da forma.

• Robustez de uma descrição à translação, rotação e mudança de escala.

Problemas de resolução são comuns em imagens digitais. A sensibilidade à escala é ainda mais significativa se for retirada a descrição de forma, porque a forma pode mudar substancialmente com a resolução de imagem. A detecção do contorno pode ser afectada por ruído a baixas resoluções. Por isso ao estudar a forma em diferentes resoluções, aparecem dificuldades quando sa comparam imagens de resoluções diferentes. Pequenas variações na resolução de uma dada imagem podem originar grandes variações nos valores da descrição da forma.

Os métodos apresentados em seguida foram escolhidos de modo a serem invariantes à escala, orientação e translação. Todos eles são invariantes excepto a orientação que não é invariante, obviamente, à rotação.

39

Page 54: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

3.1.1 Compacticidade

A compacticidade define-se como:

objecto

objecto

ÁreaPerímetro

dadeCompactici2

= (3-1)

A figura mais compacta é o círculo. A compacticidade assume valores no intervalo [ ]∞,1 quando o contorno é definido como o contorno interior. Se for usado o exterior assume valores no intervalo [ . A invariância é conseguida se for usado o contorno exterior. A diferença entre contorno interior e exterior reside no facto se usarem os pixeis do bordo pertencentes à forma (interior) ou não pertencentes à forma (exterior). Exemplos de uma figura compacta e de uma não compacta são apresentadas na

]∞,16

Figura 11.

Figura 11 – a) Forma compacta; b) Forma não compacta

3.1.2 Rectangularidade

Rectangularidade é definida como a razão entre a área do objecto e a área mínima do rectângulo envolvente (RE). O valor máximo é 1 para um objecto de forma rectangular. É calculada através da seguinte expressão:

RE

objecto

ÁreaÁrea

=ridaderectangula (3-2)

3.1.3 Excentricidade

Este descritor é definido como a excentricidade da elipse que tem os mesmos segundos momentos que a forma. A excentricidade de uma elipse é a razão da distância entre os focos da

40

Page 55: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

elipse e o comprimento do seu eixo maior. O valor varia entre 0 e 1, sendo 0 para um círculo e 1 um segmento de recta.

Pode ser calculada através das expressões dos momentos:

20220

2211

20220

)(4)(dadeExcentrici

μμμμμ

++−

=

(3-3)

Onde

)()(),()()( yydxxdyxyyxx qppq −−−−= ∫ ∫

∞−

∞−ρμ (3-4)

Em que ),( yxρ é o valor da intensidade da imagem em ),( yx e )y é a posição do centróide da forma na imagem.

,(x

3.1.4 Orientação

A orientação β define-se como o ângulo entre a horizontal e o maior eixo da elipse que tem o mesmo segundo momento central que o objecto. É dada por:

0220

111 2tan21

μμμ−

= −Orientação (3-5)

Sendo pqμ dado pela equação (2-4).

Figura 12 – Orientação

O descritor orientação é invariante à translação e escala mas não obviamente à rotação. O ângulo varia entre [ ]º90,º90− sendo o ângulo nulo quando a elipse tem o seu maior eixo na horizontal.

3.1.5 Solidez

A solidez mede a densidade de um objecto. É obtido através da razão entre a área do objecto e a área do convex hull do objecto. Os objectos que tenham contornos irregulares ou tenham buracos têm solidez menor que 1.

Convex Hull de uma dada forma S é a menor região convexa H que satisfaz a condição . HS ⊂

41

Page 56: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

A solidez é calculada da seguinte maneira:

convexhull

objecto

ÁreaÁrea

Solidez = (3-6)

3.1.6 Convexidade

Convexidade define-se como a razão entre o perímetro do convex hull do objecto e o perímetro do objecto tal como descrito na seguinte equação:

objecto

convexhull

PerímetroPerímetro

=econvexidad (3-7)

3.1.7 Descritores de Fourier

Dada a forma de um objecto no plano complexo, o seu contorno pode ser traçado obtendo uma função complexa a uma dimensão bt ao longo do tempo. Por exemplo, um ponto movendo-se ao longo do contorno mostrado na Figura 13, gera uma função complexa bt = xt + jyt para t = 0,…, N-1 sendo esta periódica com período N. Neste caso N é o comprimento do contorno, ou seja o perímetro da forma. Isto é, o eixo x da figura é considerado com o eixo real e o eixo y o eixo imaginário de uma sequência de números complexos.

Figura 13 – Contorno de um objecto (imagem retirada de Gonzalez e Woods (2002))

Dada uma função de contorno bt, a sua transformada de Fourier pode ser escrita como:

42

Page 57: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

∑ −

=

=1

0

21 N

tN

tfj

tf ebN

(3-8)

Em que ⎣ ⎦ ⎡ ⎤{ 2/)1(,...,0,...,2/)1( }−−∈ NNf e 1−=j é a unidade imaginária. Os

coeficientes , são chamados os descritores de Fourier e descrevem a forma do

objecto no domínio da frequência. É possível fazer a reconstrução original do contorno usando a transformação inversa dada por:

,..., 10 ±BB

∑ −

=

=1

0

2N

tN

tfj

ft eBbπ

(3-9)

Em que t = 0, …, N-1

Como o número de descritores de Fourier vai depender do número de pontos do contorno usa-se apenas PM =+ 12 coeficientes em que NP ≤ . Desta maneira podemos comparar dois objectos através dos descritores de Fourier. Neste caso os descritores de ambos os objectos têm o mesmo número de coeficientes.

Os coeficientes Bf de um dado objecto, para f próximo de zero, são os coeficientes de baixa frequência, dão a forma geral do objecto; os restantes componentes Bf, são os coeficientes de baixa frequência e dão os detalhes do objecto.

Figura 14 – Contorno original e reconstrução usando a transformação inversa e um número P de descritores de Fourier (imagem retirada de Gonzalez e Woods (2002))

A Figura 14 mostra um contorno de um quadrado com K = 64 pontos e os contornos resultantes retirados da Equação (3-19) para vários valores de P. Nota-se que o valor de P tem de ser maior que 8 para o contorno reconstruído parecer mais um quadrado que um circulo. Note-se também a definição do canto apenas aparece definido para P = 56 e que para apenas P = 61 as curvas ficam rectas assemelhando-se mais ao contorno original. Assim, poucos coeficientes de baixa ordem são capazes de obter uma forma grosseira do objecto mas são necessários vários coeficientes de ordem mais elevada para definir com mais precisão os cantos e linhas rectas.

Os descritores de Fourier não são invariantes à rotação, escala ou translação. Existe também outro problema: os descritores variam quando o ponto inicial que se escolhe para o contorno

43

Page 58: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

varia. Mas a mudança nos coeficientes devido a estes parâmetros podem ser relacionadas com simples transformações aos descritores.

A seguinte tabela mostra as transformações a aplicar aos descritores de forma a dar os mesmos valores para um objecto quando este sofreu uma translação, rotação, mudança de escala ou mudança de ponto inicial do contorno:

Transformação Contorno Descritores de Fourier

Identidade tb fB

Rotação θjt

Rt ebb = θj

fRf eBB =

Translação xytt bb Δ+=T )(uBB xyf

Tf δΔ+=

Escala t

Et bb α= ff BB α=E

Ponto inicial 0tt

PIt bb −= Nftj

fPIf eBB /2 0= π−

Tabela 3 – Descritores de Fourier de um contorno bt de um objecto que sofre rotação, translação, escala e mudança de ponto inicial

A Tabela 3 sumariza os descritores de Fourier de um contorno bt de um objecto que sofre rotação, translação, escala e mudança de ponto inicial. O símbolo xyΔ é definido como

de modo que a notação indique redefinir a sequência como: yjxxy Δ+Δ=Δ xytTt bb Δ+=

[ ] [ ])()()()( tytyjtxtxbTt Δ++Δ+= (3-10)

Por outras palavras, a translação consiste em adicionar um deslocamento constante a todas as coordenadas do contorno. Note-se que a translação não tem efeito nos descritores excepto para

que tem o valor da função de impulso 0=f )(uδ . A transformação de Fourier de uma constante é um impulso localizado na origem, sendo nula no resto do domínio.

Finalmente a expressão significa redefinir a sequência como: 0tt

PIt bb −=

)()( ooPIt ttjyttxb −+−= (3-11)

que apenas altera o ponto inicial da sequência de 0=t para ott = . A última entrada na Tabela 3

mostra que a mudança do ponto inicial altera todos os descritores de uma maneira diferente (mas conhecida), no sentido em que o termo multiplicativo é função de f.

44

Page 59: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

3.2 Método de sobreposição de áreas

Este método permite comparar duas formas e daí tirar um valor numérico que representa a semelhança entre elas. As duas formas são sobrepostas, normalizando em primeiro lugar as áreas de ambas para um valor fixo. Depois disso é tirada a subtracção absoluta entre as imagens com as formas a comparar e obtido um “grau de semelhança”.

3.2.1 Algoritmo

Consiste nos seguintes passos:

1. Retirar a bounding box da forma contida na imagem binária i e a bounding box da forma contida na imagem binária j.

2. Redimensionar cada uma das imagens das bounding boxes de modo que ambas as formas contidas nestas imagens fiquem com um valor de área pré-definido.

3. Normalizar o tamanho das imagens das bounding boxes para um determinado tamanho, acrescentando linhas ou colunas sem alterar a área das formas.

4. Tirar a diferença absoluta entre as imagens binárias obtidas anteriormente.

5. Calcular o grau de semelhança G:

ABAGij

−= (3-12)

Em que:

A é a área da forma contida numa das imagens obtidas no passo 3, definida como forma de referência.

B é a área da região da imagem obtida no passo 4.

As áreas neste caso são calculadas através do número de pixeis das formas presentes nas imagens.

O grau de semelhança obtido é invariante à escala pois as formas são sempre normalizadas para valores de área fixos. Mas poderão acontecer problemas naturais devido à discretização das imagens, ao se usarem imagens digitais.

O método apresentado não é invariante à rotação pois não tem em conta a orientação das formas. De qualquer maneira isto poderá ser realizado, tirando por exemplo a orientação de ambas as formas e rodá-las de maneira que ambas fiquem com a mesma orientação. Finalmente tira-se o valor do grau de semelhança de ambas as possibilidade de orientação e o valor do grau de semelhança final, sendo o maior valor de ambos os graus de semelhança obtidos.

45

Page 60: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

3.2.2 Diferença absoluta entre duas imagens

No caso de duas imagens binárias, onde cada pixel apenas pode assumir um valor 0 ou 1, a diferença absoluta entre ambas será o módulo da subtracção de cada pixel correspondente de ambas as imagens.

Exemplo:

Imagem i Imagem j Diferença absoluta entre i e j

Tabela 4 – Exemplo de subtracção de imagens

3.2.3 Exemplos de graus de semelhança aplicados a formas simples Como exemplo, considera-se as seguintes imagens de teste:

Imagem A Imagem B Imagem C Imagem D

Imagem E Imagem F Imagem G Imagem H

Tabela 5 – Imagens de teste

46

Page 61: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

Obtêm-se os seguintes valores do grau de semelhança: Imagens A B C D E F G H

A - ‐  ‐ ‐ ‐ ‐ ‐  ‐ B 0.8205 - ‐ ‐ ‐ ‐ ‐  ‐ C 0.2392 0.1747 - ‐ ‐ ‐ ‐  ‐ D 0.8082 0.7114 -0.7371 - ‐ ‐ ‐  ‐ E 0.6986 0.6369 -0.6858 0.7398 - ‐ ‐  ‐ F 0.7631 0.6715 -0.7311 0.8588 -0.2201 - ‐  ‐ G 0.5884 0.5132 -0.7808 0.5132 0.1046 0.4980 - - H 0.5659 0.4919 -0.7717 0.5511 -0.1443 0.5611 0.4336 -

Tabela 6 – Valores obtidos do grau de semelhança para as imagens de teste escolhidas

Como se pode verificar o grau de semelhança é maior entre as imagens A e B, D e A e D e F e é menor para o grau entre a imagem C e todas as restantes. Observa-se também que o grau de semelhança pode tomar valores negativos quando a semelhança entre formas é reduzida e que se aproxima de 1 quando as formas são semelhantes.

3.3 Avaliação da indexação e selecção de features No caso de uma indexação onde se pretende seleccionar dum conjunto de objectos, os que têm uma característica com interesse, os objectos pretendidos são os chamados relevantes, enquanto que os outros são os não relevantes. Ao se proceder á indexação, os objectos que foram seleccionados como prováveis de ter a característica pretendida são os recuperados. Os que não foram seleccionados na indexação são os não-recuperados.

Generalidade, de acordo com Buckland e Gey (1994), define-se como a proporção de objectos em todo o documento que são considerados relevantes, sendo definida pela seguinte equação:

totalrelvante NNG /= (3-13)

3.3.1 Recuperação

Para um conjunto de objectos recuperados, Recuperação é o número de objectos recuperados que são relevantes como uma proporção de todos os itens relevantes. Recuperação, é assim, uma medida da medida da completude da recuperação medindo assim se todos os itens relevantes são recuperados. Uma percentagem de 100% na Recuperação pode ser conseguida recuperando toda a base de dados mas isto vai contra os princípio de um sistema de indexação dado que é desejável ter o mínimo de itens não relevantes no conjunto de itens recuperados. Mas no entanto é desejável ter uma recuperação alta, o mais próxima possível de 100%.

rel

relrec

N∩=oRecuperaçã N

(3-14)

47

Page 62: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

3.3.2 Precisão

Precisão é o número de objectos recuperados que são relevantes como uma proporção da quantidade de todos os objectos recuperados. Precisão é uma medida da exactidão ou fidelidade da recuperação. Mede a capacidade de excluir itens não relevantes do conjunto de itens recuperados. É também desejável uma precisão alta, sendo 100% o ideal.

rec

relrec

N∩=Precisão N

(3-15)

3.3.3 Curva de recuperação Considere-se, por exemplo um caso onde há 100 objectos relevantes num conjunto recuperável de 1000, sendo um décimo dos objectos relevantes. A Generalidade, neste exemplo é igual a 0.1. No caso ideal, todos os itens relevantes são recuperados em primeiro lugar antes de qualquer item não relevante. Na Figura 15, os primeiros 100 objectos recuperados seriam todos relevantes levando a uma linha recta com inclinação elevada atingindo um máximo de recuperação 1,0 para apenas 10% dos objectos recuperados. Dado que a partir deste ponto, já todos os objectos relevantes foram recuperados, a recuperação permanece com um valor 1. A inclinação da linha é 1/G, o inverso de Generalidade, até todos os objectos relevantes terem sido recuperados.

Figura 15 - Curva de recuperação

Escolher itens aleatoriamente de uma base de dados significaria neste caso obter um item relevante com uma probabilidade de 10%. Isto originaria uma linha recta desde a origem até ao canto superior direito do gráfico. A inclinação da recta é dada pela Generalidade, neste caso 0.1. Se os eixos forem normalizados para um intervalo [0;1] a linha teria uma inclinação de 45º.

48

Page 63: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

Podemos imaginar outro cenário, onde todos os objectos não relevantes são recuperados antes de todos os objectos relevantes, caso perverso. Neste caso, até cerca de 90% dos objectos serem recuperados, o próximo objecto a ser recuperado iria ser sempre não relevante e o numerador da equação de Recuperação iria ser sempre zero, mantendo por isso o valor da recuperação a zeros até não se recuperar nenhum objecto não relevante. A partir deste ponto, o sistema comporta-se como um sistema perfeito e a curva atinge rapidamente o canto superior direito já que todos os objectos seguintes a serem recuperados são todos relevantes, atingindo o valor 1. Novamente a inclinação desta recta é o inverso da Generalidade.

Em todos os casos, a Recuperação é limitada pelo paralelograma definido pelo caso ideal e o perverso. Como a recuperação é um processo acumulativo, a curva tem de começar na origem, acabar no canto superior direito e apenas se pode mover para a direita ou diagonalmente para a cima e para a direita. Um sistema de indexação deverá ter um desempenho melhor que um sistema aleatório mas dificilmente será tão bom como num caso ideal. Assim, um sistema de indexação deverá ter uma curva algures entre a curva do sistema aleatório e a dum caso ideal.

3.3.4 Curva de precisão

Quanto à curva da Precisão, num caso aleatório, a probabilidade de encontrar um objecto relevante está relacionado com a proporção de objectos relevantes na base de dados, isto é, está relacionado com a Generalidade, no caso de exemplo apresentado anteriormente, igual a 0.1. Assim, nesse caso, a curva de precisão tende a ser a uma recta horizontal com uma precisão igual a 0.1.

No caso ideal, todos os objectos relevantes são recuperados em primeiro lugar. Assim, a precisão será sempre 1.0, até se recuperarem todos os objectos relevantes. Assim se continuarem a recuperar itens, vão aparecer os objectos não relevantes fazendo decrescer hiperbolicamente a curva da precisão até atingr o valor 0.1, o valor da Generalidade, quando se recuperarem todos os objectos.

O caso perverso, onde todos os objectos relevantes são apenas recuperados no fim, nos primeiros 900 objectos a serem recuperados, os não relevantes, a precisão permanece sempre nula, dado que ainda não se encontrou nenhum objecto relevante. Os objectos relevantes são todos recuperados de uma vez levado a precisão a aumentar até ao valor de 0.1.

49

Page 64: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

Figura 16 – Curva de Precisão

3.3.5 Curvas de precisão vs recuperação

As curvas de Precisão e a Recuperação estão relacionadas inversamente: aumentar o desempenho numa, faz decrescer o desempenho da outra. Mas ao desenhar um sistema de indexação é desejável que ambas sejam altas. Para ter uma ideia do melhor compromisso num sistema de indexação, as curvas de Precisão vs Recuperação são úteis na medida em que é visível a relação entre ambas as medidas.

Figura 17 – Curva de Precisão vs Recuperação

Tendo em conta as curvas de Precisão e de Recuperação apresentadas anteriormente chega-se aos casos típicos, ideal, aleatório e perverso de uma curva de Precisão vs Recuperação. Estes casos estão apresentados no gráfico da Figura 17.

50

Page 65: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

4 Segmentação e indexação de mapas

Dada a abordagem escolhida para se proceder à indexação das imagens de mapas históricos segundo as suas localizações geográficas que consiste em comparar as formas das regiões limitadas por linhas de costa e/ou fronteiras políticas ou geográficas presentes nas imagens dos mapas a indexar com outras formas de regiões mas de localizações geográficas conhecidas, é necessário em primeiro lugar, obter estas formas das imagens dos mapas, usando métodos de segmentação. Na secção 2.1 fez-se um estudo do estado da arte dos métodos de segmentação e nas secções seguintes, 2.2, 2.3 e 2.4, apresentou-se três métodos de segmentação. Na secção 4.1 são apresentadas as razões da escolha destes métodos, das duas abordagens seguidas na segmentação e também a aplicação dos métodos de segmentação a um conjunto da imagens de mapas de teste escolhido.

Na secção 4.2 encontra-se a descrição de ambos os métodos de indexação. O método que usa descritores de forma na secção 4.2.1 e o método indexação que usa o método de sobreposição de áreas na secção 4.2.2.

4.1 Segmentação de mapas

Foi escolhido um grupo de 45 imagens de teste de três regiões diferentes: Península Ibérica, África e América do Sul. De cada região existem 15 imagens. Este conjunto de imagens de teste está incluído no Anexo A1.

Olhando para o grupo de imagens de mapas de teste escolhidas, verifica-se que algumas imagens como as imagens 3, 5, 7, 12, 14, 15, 19, 25 ou 29 possuem nas suas linhas de costa e fronteiras geográficas, uma cor distinta. Se se conseguisse encontrar com clareza estas linhas tínhamos o problema da segmentação resolvido. Portanto a escolha adequada para estas imagens é um método de segmentação segundo cor como o algoritmo apresentado na secção 2.4, o método de segmentação segundo cor usando k-means clustering.

Outra opção é usar são técnicas baseadas em histogramas mas não deverão ser adequados às imagens dos mapas no conjunto de teste, dado que nestas imagens os picos e vales não são tão óbvios, as cores não são assim tão bem definidas devido à existência de muitas linhas nos mapas. Técnicas de detecção de arestas também verifica-se que não deverão ser adequadas pois existem demasiadas arestas nas imagens fica logo excluída.

Noutras imagens, existem regiões bem definidas pela sua cor como as imagens 1, 4, 5, 11, 13, 16, 20, 21, 22, 23, 25, 30 ou 38. Verifica-se que também métodos de segmentação segundo cor são adequados para este tipo de imagens. Assim também se testou o método de segmentação segundo cor usando k-means clustering para se conseguir encontrar estas regiões.

Outra abordagem que se pode seguir na segmentação, é fazer a distinção entre as regiões de terra e as de mar através da sua textura. Na maior parte das imagens, verifica-se que a textura das regiões de terra é significativamente diferente do que as do mar. A textura na zona de terra é muito mais rugosa do que a do mar, havendo uma maior quantidade de linhas, fazendo variar bastante os níveis de intensidade dos pixeis. Na região de mar existem apenas linhas de latitude

51

Page 66: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

e longitude e por vezes algumas letras mas a quantidade de linhas é menor. Isto é mais visível em imagens de mapas como a 7, 10, 39 ou 41. Observa-se que seguindo esta abordagem, não se irá conseguir uma boa segmentação em todas as imagens, por exemplo, nas imagens 21, 28 e 30 há zonas na região de terra que a rugosidade não é elevada como noutras. Isto fará com que a região de terra com menor rugosidade seja confundida com a região do mar devido à pouca existência de linhas.

Tendo em conta que ambas as sugestões enunciadas de abordagem a seguir na segmentação não são aptas para todo o conjunto de imagens, decidiu-se no entanto usar dois métodos de segmentação por textura, dado que esta abordagem é apta para quase todo o conjunto de imagens de teste e também decidiu-se usar um método de segmentação de cores para tentar obter os contornos das linhas de costa e também obter as regiões demarcadas a cores distintas, de regiões geográficas, tendo em conta que este método apenas será útil para algumas imagens de mapas. Os métodos usados foram os apresentados nas secções 2.2, 2.3 e 2.4 deste relatório.

Uma questão a ter em conta é que as imagens obtidas a partir da segmentação, estão divididas em várias regiões. Existe a dificuldade em determinar qual é a região pertencente à zona do mar e qual a região pertencente à região da terra. Este é uma dificuldade presente no método de segmentação que usa a decomposição DWF, já que este método apenas diferencia entre texturas diferentes mas não escolhe uma em particular como o método de filtros de textura que faz a diferenciação das regiões através da entropia. Neste método sabemos qual a região mais rugosa e a menos rugosa e podemos assumir que a mais rugosa é a região da terra. Para simplificar considerou-se à mão qual a região respectiva mas isto poderá ser feito automaticamente se calcularmos a entropia nas regiões: as regiões que tiverem uma maior entropia serão aquelas pertencentes à região da terra. Ou então podemos assumir que a região que está no interior e o seu contorno é que nos interessa e podemos desprezar o contorno exterior já que deverá ser um rectângulo.

4.1.1 Remoção de moldura

Existe outra dificuldade na segmentação das imagens dos mapas que é a existência de uma moldura à volta do mapa. Ao se usar um método de segmentação baseado em textura, esta moldura irá ter uma textura semelhante à da região da terra pois por vezes é tão rugosa como esta. Deste modo, usou-se um método baseado em histogramas onde se tira o histograma dos níveis de cinzento na horizontal e na vertical e se procuram vales mais profundos no início e fim do histograma. Estes vales evidenciam a existência da moldura pois a moldura apresenta valores de cinzento mais baixos do que os pixeis circundantes. Depois de se encontrar estes vales resta seleccionar uma nova imagem a partir da original entre os picos encontrados.

52

Page 67: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

Figura 18 – Esquema do processo de remoção de moldura

Na Figura 18, é apresentado o esquema de remoção da moldura. Em cima, no lado esquerdo temos a imagem original e no lado direito temos o histograma da soma dos níveis de cinzento das linhas, em função da coluna e em baixo do lado esquerdo temos o histograma dos níveis de cinzento das colunas, em função da linha. Por fim, em baixo, no lado direito, temos a imagem final, sem a moldura, em níveis de cinzento.

Figura 19 – Histograma e processo de remoção da moldura

53

Page 68: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

Olhando para a Figura 19, o processo de remoção da moldura consiste no seguinte:

• Definir em primeiro lugar um intervalo de procura, à esquerda e á direita, visível a negro nesta figura

• Tirar a média do histograma e aplicar um threshold tendo em conta o valor da média, o threshold encontra-se no valor definido pelo traço a vermelho

• Tirar a posição máxima do intervalo esquerdo e a posição mínima do intervalo direito, dos valores abaixo do threshold, dentro do intervalo definido de início. Estes valores estão evidenciados a verde. De seguida, definir uma tolerância e retirar a nova imagem no intervalo definido entre os valores encontrados dos vales mas dando uma tolerância de modo a excluir totalmente e moldura. O local onde tinha a moldura é substituído por pixeis com valores iguais às da média dos níveis de cinzento na imagem.

4.2 Indexação de mapas

4.2.1 Indexação de mapas usando descritores de forma

Depois de se terem obtidos as regiões demarcadas pelas linhas de costa ou fronteiras políticas através dos métodos de segmentação, é necessário descrever estas formas quantitativamente. Para se poder ligar estas formas a localizações geográficas, é necessário comparar a descrição de cada forma com a descrição das formas de regiões de zonas geográficas conhecidas. Para isso é necessário ter uma base de dados de imagens de referência de várias localizações geográficas. De modo a definir este conjunto de imagens de referência, é necessário ter uma ideia das zonas geográficas presentes no conjunto de mapas que queremos indexar. Dado que foi definido um conjunto de imagens de teste composta por 45 imagens de 3 regiões geográficas, Península Ibérica, África e América do Sul, incluídas no Anexo A1, foi também definido um conjunto de imagens de referências destas localizações geográficas. Estas imagens estão incluídas no Anexo A2.

A descrição das formas das regiões é feita através de descritores de forma como os que estão descritos na secção 3.1. Para cada imagem deverá ser retirado um vector de features onde estão presentes os valores obtidos a partir dos descritores de forma. Depois, os vectores de features de cada imagem de mapa a indexar deverão ser comparados com os vectores de features das formas das regiões das imagens de referência de modo a associar cada imagem a uma dada localização geográfica. Na Figura 20, está incluído o fluxograma deste algoritmo de indexação.

54

Page 69: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

Imagens digitalizadas de mapas a indexar

Aplicar métodos de segmentação

Retirar vector de features

Localização geográfica

indexação

Imagens de referência

Retirar vector de features

Figura 20 – Fluxograma do algoritmo de indexação

Para cada imagem segmentada dos mapas obtêm-se várias regiões, umas referentes a continentes ou penínsulas e outras de menor dimensão referentes a ilhas. Para simplificar o processo de indexação, acha-se a região de maior área e apenas se usa esta região para a indexação. Assim podemos também eliminar alguns eventuais erros na segmentação como por exemplo o aparecimento de regiões referentes a palavras ou símbolos presentes na imagem. É certo que também se poderia usar a informação das regiões mais pequenas como ilhas mas isto traria vantagens e desvantagens. Poder-se-ia usar a informação da posição relativa entre regiões para ajudar na indexação e reconhecimento da localização geográfica mas os eventuais erros na segmentação, devido a objectos presentes na imagem, iriam induzir a um maior erro a indexação. Assim, para simplificar, desprezam-se as regiões de menor dimensão.

Um dos aspectos a ter em conta nos vectores de features é sua invariância quanto à rotação, translação e escala. Invariância à rotação porque queremos ter a mesma descrição de uma forma, independentemente da sua rotação: a forma do continente África continua a ser a mesma mesmo depois de rodada. Invariância à escala, pois as imagens a indexar não têm um tamanho fixo, por isso o tamanho das formas das linhas de costa variam em função do tamanho da imagem, sendo necessário ter uma mesma descrição para uma mesma forma com diferentes escalas. E por fim invariância à translação, pois as formas podem aparecer em qualquer localização na imagem. Destas três a menos importante é a da rotação pois podemos considerar que as imagens dos mapas estão sempre alinhadas com o Norte para cima.

Uma maneira simples de proceder à indexação, é calcular a distância Euclidiana entre vectores de features das imagens de mapas a indexar e os vectores das imagens de referência. Dado um vector de features vi de uma imagem i de um mapa a indexar e um vector ur de features de uma imagem de referência r, a distância Euclidiana entre as imagem i e r é dada por:

55

Page 70: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

∑=

−=M

krkikir uvd

1

22 (4-1)

Em que k é uma dada feature de um vector de features e M é o número total de features no vector de features.

Para uma dada imagem de um mapa a indexar i, este mapa será da localização geográfica dada pela imagem de referência h se para qualquer ikih dd < hk ≠ .

4.2.2 Indexação de mapas usando método de sobreposição de áreas Outro método de indexar as imagens de mapas é usar o método de sobreposição de áreas apresentado na secção 3.2. Consiste em sobrepor as formas obtidas a partir dos métodos de segmentação nas formas das imagens de referência. Assim obtém-se um grau de semelhança entre uma dada imagem a indexar i e uma imagem de referência j. Depois, podemos concluir que uma dada imagem de um mapa a indexar é referente a uma dada localização geográfica h se o grau de semelhança entre esta imagem e a imagem de referência da localização geográfica h, apresenta o maior valor do grau de semelhança em comparação com o das outras imagens de referências.

Figura 21 – Fluxograma do algoritmo

À semelhança do método de indexação apresentado anteriormente, apenas são escolhidas as regiões de maior área de cada imagem obtida a partir dos métodos de segmentação. Assim se faz de modo a reduzir o impacto dos erros originados na segmentação e é também uma maneira de simplificar o problema.

56

Page 71: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

5 Resultados obtidos

Foi escolhido um grupo de 45 imagens de teste de três regiões diferentes: Península Ibérica, África e América do Sul. De cada região existem 15 imagens. Este conjunto de imagens de teste está incluído no Anexo A1.

Aplicaram-se os métodos de segmentação apresentados nas Secções 2.2, 2.3 e 2.4, estando os resultados apresentados na Secção 5.1. Forem feitos testes nos descritores de forma escolhidos estando os resultados na secção 5.2. Aplicaram-se ambos os métodos de indexação apresentados na secção 4.2, estando os resultados apresentados sob a forma de curvas de precisão e recuperação na Secção 5.3. Na secção 5.4 é feito um resumo dos resultados obtidos usando os métodos de indexação.

5.1 Resultados da segmentação

5.1.1 Método de segmentação usando a decomposição DWF

Este método tem vários parâmetros que são necessários definir. Alguns foram mantidos fixos para todo o conjunto de imagens de imagens e outros verificaram-se ser necessários mudar o seu valor consoante a imagem que se pretendia aplicar. Do algoritmo de alisamento, existem dois parâmetros: α e ε. Para o parâmetro α, usou-se a sugestão dada em Fauzi, M. e Lewis, P. (2006), tomou-se o valor 1/N sendo N o tamanho da imagem. Para o parâmetro ε usou-se um valor pequeno, considerou-se 10-15.

No algoritmo mean shift é também necessário definir dois parâmetros, nomeadamente, o raio h da esfera e o valor do threshold T. O threshold T considerou-se como vinte avos do número total de pontos de dados em cada nível, tal como sugerido em Fauzi, M. e Lewis, P. (2006). O raio h é necessário acertar consoante a imagem a aplicar.

Outros parâmetros que são dependentes da imagem são: nível K da decomposição DWF, o tipo de wavelet a usar e o expoente de peso fuzzy w do algoritmo Fuzzy C-Means. As wavelets usadas foram todos da família das Daubechies mas variou-se a ordem. Foram testadas outras famílias de wavelets como as Coiflets, Symlets, Meyer ou Biorthogonal mas verificou-se que não se conseguia bons resultados e decidiu-se optimizar os resultados usando apenas as Daubechies seguindo a recomendação indicada em Fauzi, M. e Lewis, P. (2006).

57

Page 72: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

Parâmetro Gama de valores

ordem da wavelet Daubechies Ordem 4,7 e 8

Nível K de decomposição 2,3 e 5

Expoente fuzzy w 2,3,4 e 5

Raio da esfera h 0,2 ou 0,33

Tabela 7 – Gama de parâmetros usados

Na Tabela 7 estão apresentados os valores dos parâmetros usados neste método de segmentação. O algoritmo mean shift é usado de modo a determinar o número de regiões de textura logo os parâmetros deste algoritmo afectam o número final de segmentos de textura. Por outro lado os parâmetros do algoritmo fuzzy clustering e os de alisamento adaptativo contribuem para a precisão das fronteiras dos segmentos de textura. Um aumento no expoente fuzzy vai aumentar a precisão da definição das fronteiras das regiões mas também vai aumentar os “buracos” nas regiões de textura homogénea.

A família das wavelets usadas e a sua ordem e também o nível K da decomposição variam muito com o tipo de imagem que se está a segmentar e o método usado foi o de tentativa e erro pois não se conseguiu verificar alguma relação entre estes parâmetros e os resultados da segmentação obtidos.

No Anexo C1 encontram-se as imagens segmentadas das imagens de teste respectivas. São apresentadas segundo a forma de uma imagem binária. Como já se referiu anteriormente, este método apenas diferencia tipos de textura. Neste caso, nos resultados apresentados, apenas são encontrados dois tipos de textura, estando os dois tipos demarcados pela cor branca e negra. Como o objectivo é diferenciar a zona de terra da zona do mar, é necessário saber à partida qual corresponde a qual. Neste método, essa informação não existe à partida mas é possível determiná-la automaticamente calculando a entropia em ambos os tipos de regiões. Podemos considerar que o tipo de região que tiver o maior valor de entropia será a região da terra. Mas aqui fez-se isso à mão para simplificar o problema.

Neste método de segmentação não se usou o método de remoção da moldura através de histogramas.

Na Figura 22 estão apresentados alguns resultados obtidos usando este método de segmentação. Verifica-se que para a imagem 7 o método conseguiu diferenciar a zona com textura mais rugosa da outra com menos rugosidade. Com isso conseguiu uma região com os contornos correctos da Península Ibérica. Repare-se também que aparecem outras regiões mais pequenas, umas representando as Ilhas Baleares e também outras duas no canto inferior direito, uma devido à representação da ilha Minorca e outra devido à representação da escala do mapa. Aparece no canto superior direito duas pequenas regiões devido à presença na imagem do mapa da palavra “FRANCE”.

Na imagem 14 onde estão presentes alguns desenhos e símbolos em redor do mapa e também uma moldura mais trabalhada e com uma maior espessura do que a do mapa anterior, estas zonas aparecem “fundidas” à zona da península. Isto deve-se ao facto de este método considerar

58

Page 73: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

que a textura na zona destes símbolos e na moldura é similar à da zona de terra do mapa. Assim, não se conseguiu obter um contorno correcto da Península Ibérica.

Na imagem 15, aparecem menos símbolos e gravuras em redor da península e a moldura não tem uma espessura e detalhe tão elevados por isso o contorno da Península na zona Oeste e Norte tem um contorno mais correcto. Parte das Ilhas Baleares aparecem fundidas com a região da Península Ibérica. A zona de Gibraltar, na Península Ibérica encontra-se também fundida com a zona de Tanger em Marrocos, distorcendo a forma da Península Ibérica. Este mapa tem outra dificuldade que é a representação de uma outra região no canto inferior direito. Na segmentação, esta região fundiu-se com a região da Península Ibérica.

Na imagem 24, o resultado da segmentação é semelhante ao da imagem 14. Novamente a região da península fundiu-se com a da moldura e com os símbolos e palavras presentes na imagem. Neste caso, a diferença de rugosidade entre a textura da região da terra e a do mar não é tão pronunciada levando à fusão destas duas regiões. Comparando por exemplo com a imagem 7, esta diferença é bem maior.

Na imagem 45, um mapa da América do Sul, o método de segmentação conseguiu obter um contorno algo semelhante à deste continente. Novamente, no canto inferior direito aparece uma pequena região devido à existência do título do mapa.

Olhando para os restantes resultados obtidos, incluídos no anexo C1, nota-se sempre uma dificuldade em distinguir a zona de terra da zona onde estão presentes símbolos e palavras. À custa disto, os contornos obtidos não são os mais correctos e aparecem regiões isoladas na imagem sem se conseguir distinguir se são ilhas ou se são os símbolos.

Quando aparecem demasiadas letras ou linhas junto às linhas de costa, o contorno da região de terra da península ou continente aparece distorcido devido ao facto de o método de segmentação achar que a textura nestas zonas é semelhante à da zona de terra.

Outro aspecto é o da moldura. Muitas vezes a textura da moldura é semelhante à da zona de terra levando à zona desta ser incluída na zona de terra. Isto acontece para imagens que possuem molduras com mais detalhe e maior espessura.

Quando a imagem a segmentar possui uma zona de terra muito menos rugosa do que a zona do mar, o método não consegue fazer a distinção entre as duas. Isto é bastante visível em imagens como a 37, 33 ou 17.

Por fim, quando as linhas de costa estão muito juntas, como por exemplo na zona do Sul da Europe e norte de África, as regiões adjacentes tendem-se a se juntar. O método não tem atenção ao pormenor, apenas tem em conta uma visão macroscópica da imagem, no seu todo.

59

Page 74: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

Imagem 7

Imagem 14

Imagem 15

Imagem 24

Imagem 45

Figura 22 - Alguns resultados obtidos do método de segmentação usando a decomposição DWF

60

Page 75: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

5.1.2 Método de segmentação usando filtros de textura

São vários os parâmetros a ter em conta ao implementar este método de segmentação ao conjunto de imagens de teste. Em primeiro lugar é necessário definir o threshold. Este varia consoante a diferença entre a rugosidade da zona de terra e as restantes zonas da imagem. Quando uma imagem possui uma diferença notória entre a rugosidade da textura da zona de terra e as restantes zonas da imagem, este valor é mais fácil definir pois uma pequena variação no seu valor irá causar pouco impacto no resultado final da segmentação. Mas por outro lado se esta diferença entre rugosidades é menor, mais importante é o valor do threshold e mais sensível é o seu valor. Uma pequena variação no seu valor irá causar variações significativas na forma das regiões obtidas. Para a maior parte das imagens um valor de 0,8 é mais aconselhado. Porém, nalgumas imagens este pode variar desde os 0,7 aos 0,9.

Outro valor a definir é o número mínimo de pixeis em regiões pequenas. Este valor varia com o tamanho da imagem. Ao definir este valor é preciso ter em conta os pequenos símbolos ou letras presentes na imagem do mapa. Ao implementar este método esses objectos vão aparecer como regiões e este passo do algoritmo é uma maneira de os remover, pelo menos os de menor dimensão. O valor mais usado foi o de 2000 nas imagens do conjunto de teste, tendo estas imagens, dimensões variam dos 300 pixeis aos 3000 de lado.

O elemento estrutural usado na operação de fecho tem como objectivo uniformizar as regiões. Quando por exemplo a textura não é constante na zona de terra na imagem do mapa, esta operação tem como objectivo minimizar seus efeitos. Se se usar um elemento muito grande, as regiões obtidas tendem a ser maiores do que deveriam ser e irá causar uma probabilidade de haver fusão entre regiões próximas. Se for pequeno demais, as regiões de terra irão aparecer mais pequenas do que deveriam ser, faltando bocados. Na maioria das imagens usou-se o elemento 10x10 mas noutras teve que se aumentar para 30x30.

Por fim, nas operações de abertura onde é utilizado um elemento estrutural nx1 e 1xn, vertical e horizontal respectivamente, o tamanho deste elemento tem de ter em conta a espessura das linhas da moldura e das linhas de latitude e longitude. Este passo, tem como objectivo fazer com que o método de segmentação ignore estas linhas, eliminando as linhas finas horizontais e verticais. Isto funciona, claro, apenas se as linhas estiverem separadas de outra região com maior rugosidade. Isto tem o inconveniente de também eliminar zonas mais estreitas de terra. Nas imagens de teste usou-se um elemento do tipo 10x1 e 1x10.

Aqui neste método já se tirou partido do método de remoção da moldura presente na imagem dos mapas apresentado na secção 4.1.

No Anexo C2 encontram-se as imagens segmentadas obtidas a partir deste método. A branco aparecem as regiões com maior entropia e a preto as de menor valor.

Usando este método nota-se uma maior dificuldade em fazer a distinção entre a região de terra e a da moldura. Daí se ter usado aqui o método de remoção de moldura. Mas nota-se que a remoção da moldura também não ajuda a definir melhor as linhas de costa pois olhando por exemplo para a segmentação obtida na imagem 14, presente na Figura 23. A região de terra obtida não tem os contornos de costa que deveria ter mas tem sim um contorno recto no local onde se encontrava a moldura.

61

Page 76: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

Imagem 7

Imagem 14

Imagem 15

Imagem 24

Imagem 45

Figura 23 - Alguns resultados obtidos do método de segmentação de filtros de textura

62

Page 77: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

E de novo aparecem os problemas já encontrados no método de segmentação anterior: a dificuldade em distinguir zonas de terra com zonas com símbolos ou palavras; pouco detalhe na definição das regiões levando à fusão de várias zonas que deveriam aparecer como separadas. O que se nota de melhoria neste método em relação ao outro é uma maior capacidade em definir zonas de terra com menor rugosidade que as restantes. Por exemplo na imagem 24 ou 33 já se conseguiu encontrar com muito melhor definição as linhas de costa desta imagem que tem uma diferença entre rugosidades menor do que em outras.

5.1.3 Método de segmentação segundo cor usando k-means clustering

Neste método de segmentação é necessário especificar o número de clusters que deverá ser igual ao número de cores presentes na imagem. No algoritmo k-means, consideraram-se os seguintes parâmetros: a medida da distância usada foi a Euclidiana, foram repetidas duas vezes o clustering e se houvesse algum cluster vazio esse cluster seria removido

Os resultados obtidos estão presentes no anexo C3. As imagens apresentam as regiões em tons de cinzento. Regiões com o mesmo tom de cinzento, significa que a cor foi considerada igual.

Verifica-se que nas imagens onde este método seria útil, em imagens onde as regiões estão definidas por cores distintas tais como as imagens 1,4,5,11,13,16, 20,21, 22, 23, 25 e 38, estas regiões não ficaram bem definidas, havendo sobre-segmentação (over-segmentation) devido a ruído. As regiões obtidas não são coesas. Este ruído provém da enorme quantidade de linhas presentes.

Nas imagens onde seria útil obter o contorno, tais como as imagens 3, 7, 12, 14, 15, 19, 22, 23, 24, 2, 26, 27, 29, 32, 41, 44 ou 45 não se consegue obter um contorno com clareza o suficiente. Por exemplo, na imagem 12, consegue-se distinguir claramente duas regiões, uma a branco e outra a negro (para além de outras regiões obtidas) com os contornos de Espanha e Portugal respectivamente, mas por exemplo na imagem 3, os contornos não são contínuos. Noutras imagens, como a 14 e a 15, não se vislumbra qualquer região que se possa considerar uma linha mas sim apenas um conjunto enorme de pequenas regiões em que nenhuma pode ser usada para localizar geograficamente pois nenhuma delas tem as formas de uma região conhecida que se possa indexar.

Ao usar este método ficou-se com a noção da maior dificuldade em seguir esta abordagem. Este método apenas pode ser útil a duas ou três imagens do grupo de teste, porque em imagens quase monocromáticas, não é adequado, nem em imagens do tipo da Imagem 2. Fica também por perceber como é possível descobrir automaticamente se este método é útil ou não para uma dada imagem. Como determinar automaticamente o número de cores presente no mapa. Se se conseguir obter uma região que corresponda ao contorno de uma região indicada no mapa, falta perceber como detectar essa região no meio de todas as outras regiões, ou seja terá de se usar um método para detectar uma linha fechada no conjunto das regiões obtidas. Se conseguir obter as regiões demarcadas pela cor há também a dificuldade de a indexação ser muito mais complexa. Teria de ser necessário arranjar imagens de referência, por exemplo, de todas as regiões possíveis da Península Ibérica, de várias épocas e tipo: políticas, linguísticas, culturais, tipo de vegetação, clima, etc.

63

Page 78: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

Face a estes resultados, e à maior quantidade de dificuldades que se teria de resolver, decidiu-se prosseguir à indexação apenas com os resultados dos métodos de segmentação por texturas.

Imagem 1

Imagem 2

Imagem 4

Imagem 5

Imagem 12

Figura 24 - Alguns resultados obtidos do método de segmentação segundo cor

64

Page 79: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

5.2 Resultados de descritores de forma

De modo a testar se os descritores de forma, úteis para o método de indexação apresentado na secção 4.2, são invariantes à rotação, translação e escala, obteve-se valores de formas simples. È importante que os descritores sejam invariantes, pois as imagens do conjunto de teste têm todas tamanhos diferente. As formas das linhas de costa e das fronteiras geográficas de uma mesma região, não aparecem todas na mesma posição, sendo necessário a invariância à translação. A invariância à rotação é também importante, pois numa aplicação real as imagens digitalizadas dos mapas poderão aparecer rodadas. No conjunto de teste, as imagens estão todas alinhadas com o Norte para cima, logo as formas das regiões nãos sofrem uma grande variação na rotação. Mas há uma pequena variação devendo-se a pequenos erros no desenho dos mapas pois na altura em que foram desenhados as técnicas existentes não eram muito desenvolvidas.

Assim, testou-se os descritores de forma a imagens simples, estando os resultados obtidos e respectiva análise na secção 5.2.1. Depois, a aplicação dos descritores às formas presentes nos mapas está descrita na secção 5.2.2.

5.2.1 Formas Simples

Para verificar se os descritores de forma são invariantes à rotação, translação e escala, aplicou-se de início a imagens com formas simples. Essas imagens estão incluídas no anexo D1. Foram escolhidas as dadas formas incluídas nestas imagens, de modo a se ter uma maior variedade de formas diferentes para testar os descritores: um rectângulo esbelto, um quadrado, um círculo, um triângulo e um polígono irregular. O descritor orientação não faz sentido usar em todos os polígonos regulares, mas apenas em formas esbeltas, por isso incluiu-se um rectângulo esbelto e uma forma do tipo estrela de modo a ter uma ideia da sua variação.

As imagens testadas incluem todas as possíveis variações de escala, translação e rotação. Para além destas imagens apresentadas no Anexo D1, testaram-se outras semelhantes com 2 escalas diferentes. As formas que sofreram uma rotação foram rodadas 45 graus no sentido horário.

Os resultados obtidos dos descritores aplicados às formas simples estão incluídos no Anexo D2. É necessário referir que Escala 1 > Escala 2 > Escala 3. Podemos logo constatar que todos os descritores escolhidos são independentes à translação pois todos os valores dos descritores são exactamente iguais quando a forma sofre apenas uma translação na imagem.

Na Tabela 16 e na Tabela 17 estão presentes os valores dos descritores simples variando a escala e rotação respectivamente. Vem incluído os valores dos desvios padrão de modo a se ter uma ideia da variação dos descritores com a variação da escala e rotação. Mas é preciso ter em conta que o desvio padrão considera que o valor esperado é a média e usa as mesmas unidades dos nossos dados por isso, não podemos comparar directamente o desvio padrão de um descritor que dá valores entre 0 e 1 e o de outro descritor que dá valores até + ∞.

65

Page 80: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

Olhando para a Tabela 16, verifica-se que a excentricidade não sofre nenhuma variação com a mudança de escala. A solidez também varia pouco, na ordem de 0,01 excepto no rectângulo onde variou 0,11. A rectangularidade e a convexidade também variaram pouco, a primeira um máximo de 0,13 para o rectângulo e a segunda um máximo de 0,13 para o triângulo. Estes descritores referidos anteriormente apenas variam entre 0 e 1. A compacticidade pode atingir + ∞. Esta teve um maior desvio no rectângulo com um valor de cerca de 25,31 mas é na forma estrela que os valores obtidos são mais díspares, o menor é 89, 16 e o maior 133,19. A orientação sofreu um desvio máximo de 0,11 graus.

Imagem Orientação Excentricidade Compacticidade Solidez Rectangularidade Convexidade Circulo1 - 0,06 19,41 0,99 0,78 0,85 Circulo2 - 0,06 13,94 0,99 0,79 1,00 Circulo3 - 0,06 14,01 0,98 0,78 0,98

Desvio Padrão - 0,00 3,14 0,01 0,00 0,08 Quadrado1 - 0,47 23,45 0,99 0,99 0,83 Quadrado2 - 0,47 15,86 1,00 1,00 1,00 Quadrado3 - 0,47 18,71 0,99 0,99 0,90

Desvio Padrão - 0,00 3,83 0,01 0,01 0,09 Triângulo1 - 0,65 38,35 0,98 0,50 0,77 Triângulo2 - 0,65 22,53 0,99 0,50 1,00 Triângulo3 - 0,65 20,50 0,97 0,53 1,00

Desvio Padrão 0,02 0,00 9,77 0,01 0,02 0,13 Rectângulo1 0,00 1,00 168,75 0,97 0,97 0,88 Rectângulo2 0,00 1,00 127,36 1,00 1,00 1,00 Rectângulo3 0,03 1,00 173,28 0,80 0,79 0,87

Desvio Padrão 0,02 0,00 25,31 0,11 0,11 0,07 Estrela1 32,10 0,63 133,19 0,42 0,24 0,59 Estrela2 32,08 0,63 92,90 0,42 0,24 0,70 Estrela3 32,28 0,63 89,16 0,44 0,25 0,69

Desvio Padrão 0,11 0,00 24,41 0,01 0,01 0,06 Tabela 8 – Valores de descritores simples, variando a escala e respectivos desvios padrão

66

Page 81: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

Imagem Orientação Excentricidade Compacticidade Solidez Rectangularidade ConvexidadeQuadrado1 - 0,47 23,45 0,99 0,99 0,83 + Rotação - 0,47 24,31 0,99 0,50 0,81

Desvio Padrão - 0,00 0,61 0,00 0,35 0,01 Quadrado2 - 0,47 15,86 1,00 1,00 1,00 + Rotação - 0,47 15,88 1,00 0,50 1,00

Desvio Padrão - 0,00 0,01 0,00 0,35 0,00 Quadrado3 - 0,47 18,71 0,99 0,99 0,90 + Rotação - 0,48 16,34 0,99 0,50 0,97

Desvio Padrão - 0,00 1,67 0,00 0,34 0,05 Triângulo1 - 0,65 38,35 0,98 0,50 0,77 + Rotação - 0,65 39,07 0,98 0,49 0,76

Desvio Padrão - 0,00 0,51 0,00 0,01 0,00 Triângulo2 - 0,65 22,53 0,99 0,50 1,00 + Rotação - 0,65 25,51 0,98 0,49 0,94

Desvio Padrão - 0,00 2,11 0,01 0,01 0,04 Triângulo3 - 0,65 20,50 0,97 0,53 1,00 + Rotação - 0,65 23,45 0,94 0,50 0,94

Desvio Padrão - 0,00 2,09 0,02 0,01 0,04 Rectângulo1 0,00 1,00 168,75 0,97 0,97 0,88 + Rotação -45,00 1,00 150,39 0,98 0,06 0,93

Desvio Padrão 0,00 12,98 0,01 0,64 0,04 Rectângulo2 0,00 1,00 127,36 1,00 1,00 1,00 + Rotação -45,00 1,00 124,05 1,00 0,06 1,00

Desvio Padrão 0,00 2,34 0,00 0,66 0,00 Rectângulo3 0,03 1,00 173,28 0,80 0,79 0,87 + Rotação -45,02 1,00 193,70 0,76 0,07 0,78

Desvio Padrão 0,00 14,44 0,03 0,51 0,06 Estrela1 32,10 0,63 133,19 0,42 0,24 0,59

+ Rotação -12,86 0,63 132,97 0,42 0,25 0,59 Desvio Padrão 0,00 0,15 0,00 0,01 0,00

Estrela2 32,08 0,63 92,90 0,42 0,24 0,70 + Rotação -12,82 0,63 102,59 0,42 0,25 0,67

Desvio Padrão 0,00 6,85 0,00 0,01 0,02 Estrela3 32,28 0,63 89,16 0,44 0,25 0,69

+ Rotação -15,37 0,62 92,03 0,45 0,26 0,67 Desvio Padrão 0,01 2,03 0,01 0,01 0,01

Tabela 9 - Valores de descritores simples, variando a rotação e respectivos desvios padrão

Na Tabela 17 verifica-se que a orientação foi modificada 45 graus aproximadamente como seria de esperar e a excentricidade praticamente não varia com a rotação. A solidez sofre um desvio máximo de 0,03, a rectangularidade de 0,66 e a convexidade de 0,06. E a rectangularidade um máximo de 14,44 na forma do rectângulo.

67

Page 82: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

Retiraram-se também os coeficientes de Fourier ao conjunto de imagens com as formas simples, e usou-se N = 14. Os resultados obtidos encontram-se no Anexo D2. Verificou-se novamente que são invariantes à translação, pois os valores dão exactamente os mesmos face à translação de qualquer forma.

Círculo Quadrado Triângulo Rectângulo Estrela

Magnitude 462,90  0,37  1,50  0,03  0,81 

Fase 41,32  2,32  8,68  8,50  4,54 

Tabela 10 – Valores do desvio padrão mudando a escala

Quadrado Triângulo Rectângulo Estrela

Magnitude 6,44  2,25  0,39  1,21 

Fase 119,16  33,97  37,82  16,70 

Tabela 11 – Valores do desvio padrão variando a rotação

Quanto à variação da escala e da rotação, construiu-se duas tabelas, a Tabela 18 e a Tabela 19 em que se retirou os desvios padrão para cada figura, da fase e da magnitude dos coeficientes de Fourier. Tirou-se o desvio padrão para cada coeficiente de Fourier para f = -7, -6 ,…, 7, de uma mesma forma variando a escala e rotação e depois somou-se os valores dos desvios padrão obtidos para cada coeficiente de um dado f de Fourier. Com o valor obtido dá para ter uma ideia dos erros acumulados em cada coeficiente ao se variar a escala ou rotação.

Verifica-se que o círculo sofre mais variações nos valores dos descritores do que todas as outras formas quando se modifica a escala, usando tanto a fase como a magnitude dos coeficientes de Fourier mas a variação é maior usando a magnitude. Na rotação a forma que sofre mais variações é o quadrado, usando a fase dos coeficientes de Fourier. Verifica-se também que a fase dos coeficientes de Fourier sofre mais variações no geral do que a magnitude. A excepção ocorre apenas quando se varia a escala do círculo.

5.2.2 Contornos dos mapas

Retirou-se os valores dos descritores de forma para as formas dos contornos das linhas de costa dos mapas retiradas à mão e também para as formas obtidas a partir dos métodos de segmentação. Os resultados dos contornos tirados à mão encontram-se no Anexo D3, os dos contornos obtidos a partir do método de segmentação da decomposição DWF no Anexo D4 e os dos contornos obtidos a partir do método de segmentação dos filtros de textura no Anexo D5. No anexo D6, encontram-se os valores dos descritores das imagens de referência usadas.

68

Page 83: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

5.3 Indexação usando descritores de forma

Para fazer uma selecção das features a usar na indexação, testaram-se vários grupos de features e verificou-se a sua eficácia na indexação usando curvas de precisão e recuperação.

Grupo de features Descritor usado Grupo 1 Compacticidade Grupo 2 Rectangularidade Grupo 3 Excentricidade Grupo 4 Orientação Grupo 5 Solidez Grupo 6 Convexidade Grupo 7 Descritores de Fourier – Magnitude – N = 14 Grupo 8 Descritores de Fourier – Magnitude – N = 8 Grupo 9 Descritores de Fourier – Magnitude – N = 4 Grupo 10 Descritores de Fourier – Fase – N =14 Grupo 11 Descritores de Fourier – Fase – N = 8 Grupo 12 Descritores de Fourier – Fase – N = 4

Tabela 12 – Grupos de features testados

Para cada grupo de features é usado apenas um tipo de descritor como está demonstrado na tabela anterior. Nos grupos 7, 8 e 9 usou-se como features o módulo dos coeficientes de Fourier e variou-se o número de coeficientes usados: 14, 8 e 4 coeficientes. O mesmo se fez para os grupos 10, 11 e 12 onde se usou a fase dos coeficientes de Fourier.

A indexação é feita calculando a distância Euclidiana Dij entre os grupos de features dos contornos obtidos a partir das imagens i do grupo de teste incluídas no anexo A1 e as imagens de referência j incluídas no anexo A2, excepto para as features do Grupo 4 onde é usado o descritor Orientação. Neste caso é calculado o módulo da diferença entre orientações. Em ambos os casos o que interessa é o valor mínimo, ou seja, a distância e o módulo da diferença entre orientações mínimos. Quanto menor o valor, maior a semelhança entre os mapas.

Para as orientações, considerando uma orientação ai de uma imagem de teste i e uma orientação bj de uma imagem de referência j, o módulo cij da diferença entre orientações será dado por:

{ }{ }⎪

⎪⎩

⎪⎪⎨

>∧<−+−+=

<∧>−+−+=

≤∧≤∨≥∧≥−=

0b 0a se 9090;min

0b 0a se 9090;min

0b 0a 0b 0a se

jjijjiij

jijijiij

jijijiij

abbac

babac

bac (5-1)

ai, bj variam entre -90 e 90 graus.

Antes de se tirarem os valores dos descritores para os grupos de features, são aplicados às imagens do grupo de teste, métodos de segmentação de modo a se terem os contornos dos mapas. Mas como a segmentação não é perfeita, optou-se também por tirar os contornos dos mapas à mão de modo a se testar os grupos de features face a uma segmentação perfeita. Estes contornos estão incluídos no Anexo B. E os contornos obtidos a partir dos métodos de segmentação estão incluídos nos Anexos C1, C2 e C3. Assim é possível verificar se os maus resultados nas curvas de Precisão e Recuperação se devem ou não aos métodos de segmentação ou apenas à escolha dos descritores usados. Não foram usados os contornos obtidos a partir do

69

Page 84: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

método de segmentação segundo cor devido aos maus resultados obtidos para a grande maioria das imagens de teste e das dificuldades em usar esta abordagem na indexação

No caso das regiões obtidas a partir de métodos de segmentação e também nas imagens de referência, temos à escolha várias regiões. Escolheu-se a região que possui a maior área. Por exemplo se tivermos uma imagem de África pressupõe-se que a região de maior área para todas as imagens seja a do continente Africano sem as ilhas incluídas. Assim, deste modo, podemos desprezar as regiões obtidas nos métodos de segmentação que aparecem devido a símbolos ou palavras contidas na imagem. Também assim, temos a certeza de que apenas as regiões de maior dimensão nas imagens são comparadas, as ilhas, com uma área de menor dimensão são desprezadas. Assim não é necessário comparar todas as regiões presentes numa imagem com as imagens de referência. As imagens dos contornos tirados à mão contidas no anexo B apenas incluem o continente e excluem as ilhas já tendo em conta a situação explicada anteriormente.

Os resultados da indexação são apresentados usando curvas de Precisão e Recuperação, dividindo-se em 3 grupos: curvas obtidas a partir de contornos tirados à mão, contornos obtidos a partir do método segmentação da decomposição DWF e contornos obtidos a partir do método de segmentação de filtros de textura.

70

Page 85: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

5.3.1 Contornos obtidos à mão

Tabela 13 – Curvas de Precisão e Recuperação para os conjuntos 1, 2, 3, 4, 5 e 6 de features para imagens cujo contorno foi tirado à mão.

71

Page 86: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

Tabela 14 - Curvas de Precisão e Recuperação para os conjuntos 7, 8, 9, 10, 11 e 12 de features para imagens cujo contorno foi tirado à mão.

72

Page 87: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

5.3.2 Formas obtidas pelo método de segmentação de filtros de textura

Tabela 15 - Curvas de Precisão e Recuperação para os conjuntos 1, 2, 3, 4, 5 e 6 de features para imagens obtidas a partir do método de segmentação de filtros de textura.

73

Page 88: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

Tabela 16 - Curvas de Precisão e Recuperação para os conjuntos 7, 8, 9, 10, 11 e 12 de features para imagens obtidas a partir de método de segmentação de filtros de textura

74

Page 89: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

5.3.3 Formas obtidas pelo método de segmentação da decomposição DWF

Tabela 17 - Curvas de Precisão e Recuperação para os conjuntos 1, 2, 3, 4, 5 e 6 de features para imagens obtidas a partir do método de segmentação da decomposição DWF.

75

Page 90: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

Tabela 18 - Curvas de Precisão e Recuperação para os conjuntos 7, 8, 9, 10, 11 e 12 de features para

imagens obtidas a partir de método de segmentação da decomposição DWF.

76

Page 91: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

5.3.4 Discussão

De todos os grupos de features, o que faz uma melhor indexação das imagens, é o grupo 4, composto por features obtidas pelo descritor orientação. Usando os contornos obtidos à mão a indexação é perfeita pois todas as imagens relevantes de cada região geográficas aparecem em primeiro lugar que o resto das imagens. Usando os contornos obtidos pelos métodos de segmentação, a indexação já não é perfeita mas continua ser a melhor em comparação com a dos restantes grupos de features.

O pior grupo de features em termos de indexação é o grupo 6 onde se usou o descritor convexidade. De, facto a curva de precisão e recuperação obtida, situa-se entre uma indexação do tipo aleatório e do tipo perverso onde todas as imagens relevantes aparecem em último lugar.

Verifica-se que nalguns grupos de features, a qualidade da indexação varia com a localização geográfica. Por exemplo, o grupo 3, composto por features obtidas a partir do descritor excentricidade, indexa melhor as imagens de África usando os métodos de segmentação mas imagens de outras regiões (Península Ibérica e América do Sul) a indexação está entre o caso aleatório e o perverso.

Quanto aos coeficientes de Fourier, não se nota nenhuma alteração nas curvas se alterarmos o número de descritores usados no caso da magnitude. No caso da fase, existem algumas melhorias se forem usados 14 coeficientes. No entanto, no caso das curvas obtidas pelos contornos obtidos através do método de segmentação com a decomposição DWF com 4 valores, a indexação de imagens de África ter uma maior precisão. Os coeficientes de Fourier dão umas melhores curvas do que as do grupo 6 mas não são melhores do que as do grupo 4 onde se usou a orientação.

77

Page 92: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

5.4 Indexação usando o método da sobreposição de áreas

Aplicou-se o método de indexação que usa o método de sobreposição de áreas ao conjunto de contorno obtidos â mão incluído no Anexo B e também aos contornos obtidos pelos método de segmentação segundo textura, incluídos nos Anexos C1 e C2. Novamente os resultados da indexação são apresentados usando curvas de precisão e recuperação.

Figura 25 - Curvas de precisão e recuperação para o método da sobreposição obtido a partir de contornos tirados à mão

Figura 26 - Curvas de precisão e recuperação para o método da sobreposição obtido a partir de contornos obtidos a partir do método de segmentação usando filtros de textura

78

Page 93: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

Figura 27 - Curvas de precisão e recuperação para o método da sobreposição obtido a partir de contornos obtidos a partir do método de segmentação da decomposição DWF

Verifica-se que usando o método de sobreposição de áreas a indexação é perfeita usando os contornos retirados à mão. Todas as imagens relevantes são obtidas em primeiro lugar na indexação.

Ao se usarem as formas obtidas a partir dos métodos de segmentação a precisão baixa especialmente ao se indexar imagens de África.

79

Page 94: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

5.5 Resumo de resultados da indexação

Criaram-se três tabelas com valores de precisão e recuperação, para cada grupo de features utilizadas para as primeiras 15 e 30 imagens indexadas. Incluiu-se também os valores da precisão e recuperação do método de sobreposição de áreas. Dividiu-se em três tabelas, a primeira para os contornos tirados à mão e outras duas para os contornos obtidos pelos dois métodos de segmentação.

Precisão Recuperação PE África AS PE África AS

Grupo 1 15 0,20 0,06 0,80 0,20 0,06 0,80 30 0,20 0,40 0,43 0,40 0,80 0,86

Grupo 2 15 0,93 0,73 0,26 0,93 0,73 0,26 30 0,50 0,50 0,50 1,00 1,00 1,00

Grupo 3 15 0,00 0,80 0,53 0,00 0,80 0,53 30 0,03 0,50 0,46 0,06 1,00 0,93

Grupo 4 15 1,00 1,00 1,00 1,00 1,00 1,00 30 0,50 0,50 0,50 1,00 1,00 1,00

Grupo 5 15 0,93 0,53 0,60 0,93 0,53 0,60 30 0,50 0,50 0,46 1,00 1,00 0,93

Grupo 6 15 0,93 0,73 0,26 0,93 0,73 0,26 30 0,50 0,50 0,50 1,00 1,00 1,00

Grupo 7 15 0,93 0,20 0,20 0,93 0,20 0,20 30 0,46 0,40 0,40 0,93 0,80 0,80

Grupo 8 15 0,93 0,13 0,80 0,93 0,13 0,80 30 0,46 0,43 0,50 0,93 0,86 1,00

Grupo 9 15 0,93 0,13 0,80 0,93 0,13 0,80 30 0,46 0,43 0,50 0,93 0,86 1,00

Grupo 10 15 0,93 0,20 0,06 0,93 0,20 0,06 30 0,46 0,16 0,33 0,93 0,33 0,66

Grupo 11 15 0,93 0,33 0,00 0,93 0,33 0,00 30 0,46 0,16 0,33 0,93 0,33 0,66

Grupo 12 15 0,93 0,33 0,13 0,93 0,33 0,13 30 0,46 0,16 0,40 0,93 0,33 0,80

Sobreposição15 1,00 1,00 1,00 1,00 1,00 1,00 30 0,50 0,50 0,50 1,00 1,00 1,00

Tabela 19 – Resultados obtidos de Precisão e Recuperação para as primeiras 15 e 30 imagens indexadas, usando contornos retirados à mão

80

Page 95: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

Precisão Recuperação PE África AS PE África AS

Grupo 1 15 0,26 0,20 0,20 0,26 0,20 0,20 30 0,33 0,30 0,26 0,66 0,60 0,53

Grupo 2 15 0,53 0,60 0,53 0,53 0,60 0,53 30 0,46 0,40 0,40 0,93 0,80 0,80

Grupo 3 15 0,13 0,20 0,60 0,13 0,20 0,60 30 0,33 0,20 0,46 0,66 0,40 0,93

Grupo 4 15 0,80 0,73 0,73 0,80 0,73 0,73 30 0,50 0,46 0,43 1,00 0,93 0,86

Grupo 5 15 0,46 0,26 0,20 0,46 0,26 0,20 30 0,40 0,26 0,26 0,80 0,53 0,53

Grupo 6 15 0,33 0,26 0,13 0,33 0,26 0,13 30 0,33 0,30 0,26 0,66 0,60 0,53

Grupo 7 15 0,93 0,20 0,26 0,93 0,20 0,26 30 0,46 0,23 0,40 0,93 0,46 0,80

Grupo 8 15 0,93 0,26 0,66 0,93 0,26 0,66 30 0,46 0,26 0,43 0,93 0,53 0,86

Grupo 9 15 0,93 0,20 0,66 0,93 0,20 0,66 30 0,46 0,26 0,43 0,93 0,53 0,86

Grupo 10 15 0,93 0,33 0,26 0,93 0,33 0,26 30 0,46 0,36 0,16 0,93 0,73 0,33

Grupo 11 15 0,93 0,4 0,13 0,93 0,40 0,13 30 0,46 0,36 0,20 0,93 0,733 0,40

Grupo 12 15 0,93 0,40 0,26 0,93 0,40 0,26 30 0,46 0,36 0,16 0,93 0,733 0,33

Sobreposição 15 0,86 0,66 0,73 0,86 0,66 0,73 30 0,50 0,43 0,36 1,00 0,86 0,73

Tabela 20 - Resultados obtidos de Precisão e Recuperação para as primeiras 15 e 30 imagens indexadas, usando contornos obtidos com o método de segmentação da decomposição DWF

81

Page 96: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

Precisão Recuperação PE África AS PE África AS

Grupo 1 15 0,40 0,26 0,53 0,40 0,26 0,53 30 0,30 0,33 0,36 0,60 0,66 0,73

Grupo 2 15 0,46 0,40 0,60 0,46 0,40 0,60 30 0,33 0,43 0,43 0,66 0,86 0,86

Grupo 3 15 0,20 0,20 0,53 0,20 0,20 0,53 30 0,26 0,26 0,46 0,53 0,53 0,93

Grupo 4 15 0,93 0,66 0,86 0,93 0,66 0,86 30 0,50 0,46 0,50 1,00 0,93 1,00

Grupo 5 15 0,73 0,46 0,40 0,73 0,46 0,40 30 0,43 0,40 0,36 0,86 0,80 0,73

Grupo 6 15 0,33 0,13 0,33 0,33 0,13 0,33 30 0,30 0,33 0,33 0,60 0,66 0,66

Grupo 7 15 0,93 0,26 0,20 0,93 0,26 0,20 30 0,46 0,23 0,36 0,93 0,46 0,73

Grupo 8 15 0,93 0,26 0,66 0,93 0,26 0,66 30 0,46 0,26 0,46 0,93 0,53 0,93

Grupo 9 15 0,93 0,26 0,66 0,93 0,26 0,66 30 0,46 0,26 0,46 0,93 0,53 0,93

Grupo 10 15 0,93 0,40 0,06 0,93 0,40 0,06 30 0,46 0,36 0,13 0,93 0,73 0,26

Grupo 11 15 0,93 0,533 0,13 0,93 0,53 0,13 30 0,46 0,36 0,16 0,93 0,73 0,33

Grupo 12 15 0,93 0,53 0,20 0,93 0,53 0,20 30 0,46 0,36 0,13 0,93 0,73 0,26

Sobreposição15 1,00 0,86 0,73 1,00 0,86 0,73 30 0,50 0,43 0,43 1,00 0,86 0,86

Tabela 21 - Resultados obtidos de Precisão e Recuperação para as primeiras 15 e 30 imagens indexadas, usando contornos obtidos com o método de segmentação de filtros de textura

Tirou-se a média entre os valores de precisão e recuperação obtidos para cada região e também a média dos valores obtidos por ambos os métodos de segmentação, construindo-se a Tabela 30.

82

Page 97: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

Contornos à mão Contornos da segmentação Precisão Recuperação Precisão Recuperação

Grupo 1 15 0,35 0,35 0,31 0,31 30 0,34 0,69 0,31 0,63

Grupo 2 15 0,64 0,64 0,52 0,52 30 0,50 1,00 0,41 0,82

Grupo 3 15 0,44 0,44 0,31 0,31 30 0,33 0,66 0,33 0,66

Grupo 4 15 1,00 1,00 0,79 0,79 30 0,50 1,00 0,48 0,95

Grupo 5 15 0,69 0,69 0,42 0,42 30 0,49 0,98 0,35 0,71

Grupo 6 15 0,64 0,64 0,25 0,25 30 0,50 1,00 0,31 0,62

Grupo 7 15 0,44 0,44 0,46 0,46 30 0,42 0,84 0,36 0,72

Grupo 8 15 0,62 0,62 0,62 0,62 30 0,46 0,93 0,39 0,79

Grupo 9 15 0,62 0,62 0,61 0,61 30 0,46 0,93 0,39 0,79

Grupo 10 15 0,40 0,40 0,49 0,49 30 0,32 0,64 0,32 0,65

Grupo 11 15 0,42 0,42 0,51 0,51 30 0,32 0,64 0,33 0,68

Grupo 12 15 0,46 0,46 0,54 0,54 30 0,34 0,69 0,32 0,65

Sobreposição 15 1,00 1,00 0,81 0,81 30 0,50 1,00 0,44 0,89

Tabela 22 – Valores médios de precisão e recuperação

Verifica-se que usando método de indexação que usa o método de sobreposição de áreas, consegue-se obter uma precisão de 81% e uma recuperação de 81% logo nas primeiras 15 imagens recuperadas. No entanto, ao se recuperarem 30 ainda não foram recuperadas todas as relevantes. Usando o grupo 4 de features, no método de indexação que usa descritores de forma. Consegue-se obter uma precisão de 79% e uma recuperação de 79% logo nas primeiras 15 imagens recuperadas mas ao se recuperarem 30 imagens, consegue-se recuperar 95 % das imagens. O método de sobreposição pode ser mais preciso mas usando o método consegue-se uma maior recuperação.

83

Page 98: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

84

Page 99: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

6 Conclusões

No trabalho desenvolvido nesta dissertação foram desenvolvidos dois métodos de indexação de mapas históricos segundo as suas localizações geográficas. Em ambos os métodos foram extraídas as formas das regiões limitadas pelas linhas de costa e fronteiras políticas. Estes contornos foram utilizados para indexar, comparando-os com um conjunto de contornos de referência.

Escolheu-se um conjunto de teste de imagens de mapas e uma das abordagens que se seguiu de modo a extrair os contornos, foi observando que as zonas de terra nas imagens dos mapas, têm uma rugosidade maior do que as zonas de mar. Deste modo, escolheram-se dois métodos de segmentação segundo texturas, um usando a decomposição wavelet DWF e outro usando filtros de textura. Constatou-se que ambos os métodos, dão bons resultados quando a diferença de rugosidade entre regiões de terra e regiões de mar é elevada.

No entanto, esta abordagem tem as suas limitações. É difícil fazer a distinção entre zonas de terra e símbolos, figuras ou letras que estão incluídos nas imagens dos mapas. Além disso, constatou-se que uma moldura existente na maioria das imagens dos mapas, origina regiões com formas distorcidas das regiões de terra dos mapas. Quanto mais perto ficam as regiões de terra da moldura e quanto mais detalhada e larga é esta, maior a distorção nas formas. Desenvolveu-se um método de eliminação da moldura mas verificou-se que em algumas imagens onde a moldura foi removida, as formas das regiões de terra continuam distorcidas.

Outra abordagem usada para extrair os contornos, foi usar a cor. Verificou-se que em certas imagens do conjunto de teste, as fronteiras e linhas de costa possuíam uma cor distinta. Noutras imagens, regiões limitadas por fronteiras têm também cores distintas. Deste modo, tentou-se usar um método de segmentação segundo cor de modo a extrair as regiões com cores distintas. O método de segmentação testado foi usando o algoritmo k-means clustering. Testou-se o método escolhido mas no entanto verificou-se que ele falhou em obter regiões coesas devido a problemas de sobre-segmentação. A grande quantidade de linhas dos mapas impossibilita a obtenção destas regiões. Então devido aos maus resultados e também pelo facto de poucas imagens no conjunto de teste beneficiar desta abordagem decidiu-se não usar os resultados da segmentação deste método na indexação.

O método de indexação utilizado, que usa descritores de forma, consiste em extrair features, baseadas em descritores de forma, dos contornos obtidos a partir dos métodos de segmentação e compará-las com as features de formas de contornos de referência. O método de indexação onde é utilizado um método proposto de sobreposição de áreas, consiste em sobrepor os contornos obtidos através dos métodos de segmentação aos contornos de imagens de referência. Daí é extraído um valor numérico que representa a semelhança entre ambas as formas comparadas.

Usando contornos obtidos à mão e contornos obtidos por ambos os métodos de segmentação por textura, testaram-se ambos os métodos de indexação. Testaram-se vários grupos de features compostos por diferentes descritores de forma e veio a verificar-se, através da avaliação das curvas de precisão e recuperação do método de indexação por descritores de forma, que as features obtidas pelo descritor de forma orientação é o que origina uma melhor indexação. Testou-se também o método de indexação por sobreposição de áreas e veio a verificar-se que as

85

Page 100: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

curvas de precisão e recuperação denunciam uma melhor indexação usando este método em comparação ao método de indexação que usa o descritor de forma orientação.

Como desenvolvimentos futuros, propõe-se usar outro método de segmentação segundo cor, um que use a informação espacial de modo a obter regiões mais coesas e eliminar o problema da sobre-segmentação. De modo a melhor os resultados na segmentação segundo textura, deverão desenvolver-se métodos que eliminem os símbolos, palavras ou figuras presentes nas imagens dos mapas.

Ambos os métodos de indexação, deverão ser testados num conjunto muito maior de imagens de mapas, de modo a validar melhor os métodos de indexação apresentados. Poder-se-á usar grupos de features com valores de vários descritores de forma e também escolher outros descritores de forma, como por exemplo momentos invariantes tais como descritos em Hu (1962). Outra opção é usar um método de indexação que use os descritores de forma como features e também o método de sobreposição de áreas.

86

Page 101: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

Referências bibliográficas

 

Alexandre, H. (2005), Descrição de texturas naturais baseada na construção wavelet, Dissertação de Mestrado. Instituto Superior Técnico, Lisboa, Portugal. 120pp.

Buckland, M. e Gey, F. (1994) The Relationship between Recall and Precision, Journal of the American Society for Information Science, 45(1):12-19

Burrus, C., Gopinath, R. e Guo, H. (1997) Introduction to Wavelets and Wavelet Tranforms. Prentice Hall, New Jersey

Celenk, M e Haag, M. (1998), Optimal thresholding for color images, Proc. Of the SPIE – The Int’l Soc. For Optical Eng., Non Linear Image Processing 9: 250-259

Celenk, M. (1997) Hierarquical color clustering for segmentation of textured images, Proc. Of the 29th Southeastern Symposium on System Theory 483-487

Chang, M. , Sezan, I. e Tekalp, M. (1994), Adaptive Bayesian segmentation of color images, Journal of Electronics Imaging 3(4): 404-414

Chang, T, Lyn, Y. e Kuo, C. (1998) Techniques in texture analysis. In Medical Imaging Systems Techniques and Applications: Computational Techniques, pp 777-780. Golden and Breach Science Publishers, US.

Chapron, M. (1997), A chromatic contour detector based on abrupt change techniques, Proc, of Int. Conf. On Image Processing, ICIP’87 volume III 18-21

Chen, J., Pappas, T., Mojsilovié, A. e Rogowitz, B. (2005) Adaptive Perceptual Color-Texture Image Segmentation, IEEE Transactions On Image Processing 14(10)

Cheng, H., Jiang, X., Sun, Y. e Wanj, J. (2001), Color Image Segmentation: Advances and Prospects, Patterns Recognition 34:2259-2281

Comaniciu, D. e Meer, P. (1997), Robust analysis of feature spaces: Color image segmentation, Proc. Of VCPF97 1:750-755

Comaniciu, D. e Meer, P. (1999), Mean Shift analysis and applications, Proc. IEEE Int. Conf. on Computer Vision 1:1197-1203

Comaniciu, D. e Meer, P. (2002), Mean Shift: A Robust approach toward feature space analysis, IEEE Trans. on Pattern Analysis and Machine Inteligence 24(5):603-619

Cook, R. e Torrance, K. (1981) A reflectance model for computer graphics, Computer Graphics 15(3):307-316

Deshmukh K. S. e Shinde G. N. (2005) An Adaptive Color segmentation, Electronic Letters on Computer Vision and Image Analysis 5(4):12-23

Fauzi, M. e Lewis, P. (2006) Automatic texture segmentation for content based-image retrieval application, Pattern Anal. Applic. 9:307-323

87

Page 102: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

Felzenszwalb, P. e Huttenlocher, D. (1998), Image Segmentation using local variation, Proc IEEE Conf. Computer Vision and Pattern Recognition 98-104

Fu, K. e Mui, J. (1981), A Survey On Image Segmentation, Pattern Recognition 13: 13-16

Geman, S. e Geman, D. (1984), Stochastic relaxation, Gibbs distribuition and the Bayesian restoration of images, IEEE Trans. On Pattern Analysis and Machine Intelligence 6(11):721-741

Gevers, T. Ghebreab, S. e Smeulders, A. (1998), Color invariant snakes, Porc, of the 9th British Machine Vision Conference volume 2 578-588

Goldman, D. Yang, M. e Bourbakis, N. (2002), A neural network-based segmentation tool for color images, Proc. 14th IEEE International Conference on Tools with artificial Intelligence (IC-TAI) 500-511

Gonzalez, R e Woods, R. (2003) Image Processing Using MATLAB, New Jersey, Prentice Hall, Chapter 11

Gonzalez, R. e Woods, R. (2002) Digital Image Processing. Prentice Hall, Upper Saddle River, New Jersey 07458

Goswami, J. e Chan, A. (1999) Fundamentals of Wavelets – Theory, Algorithm and Applications. John Wiley & Sons, Inc

Guo, G. Yu, S. e Ma, S. (1998), Unsupervised segmentation of color images, Proc. Of 1998 Int’l Conf. on Image Processing, ICIP’98, Volume III 299-302

Hanburry, A. e Serra, J. (2001) Mathematical Morphology in the L*a*b* Colour Space, Technical Report N-36/01/MM, Centre de Morphologie Mathématique, Ecole des Mines de Paris, France

Haralick, R. e Shapiro, L. (1985), Survey On Image Segmentation Techniques, Computer Vision Graphics and Image Processing 29: 100-132

Hernández, E. e Weiss, G. (1996) A First Course on Wavelets. CRC Press

Hu, M (1962), Visual Pattern Recognition by Moment Invariants, IRE Trans. Information Theory, IT-8:179-187

Jain, A. e Dubes, R. (1988), Algorithms for Clustering Data, Prentice Hall

Jain, A., Mao, J. e Dubes, R (2000), Statistical pattern recognition: A review, IEEE Trans. On Pattern Analysis and Machine Intelligence 22(1): 4-38

Ji, S. e Park, W. (1998), Image segmentation of color image based on region coherency, Proc. 1998 Int’l Conf. On Image Processing (ICIP’98) volume I

Kanai, Y. (1998), Image segmentation using intensidade e informação sobre cor, Proc SPIE – Visual Communications and Image Processing’98 709-720

Kass, M. Witkin, A. e Terzopoulos, D. (1987), Snakes: Active Contour models, Int. J. of Computer Vision 1:321-331

88

Page 103: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

Li, S. (1995), Markov Random Field in Computer Vision, Ed. Tosiyasu L. Kunii, Springer-Verlag, Berlin

Liu, J. , Lu, J., Yang, J., Liu, K., Wu, Y. e Li, S. (1994), Efficient Segmentation of nuclei in different color spaces, Proc. Of the SPIE – The Int’l Soc. For Optical Eng., Image and Video Proc. Volume XVI 773-778

Lucchese, L. e Mitra, S. (1999), Advances in Color Segmentation, Proc. Global Telecommunications Conference Globecom 2038-2044

Lucchese, L. e Mitra, S. (2001), Color Image Segmentation: A state-of-the-art survey, Proc of the Indian National Science Academy (INSA-A) 67, A(2):207-221

Ma, W. e Manjunath, B. (1997), Edge Flow: a framework of boundary detection and image segmentation, Proc. Of IEEE Int. Conf. on Computer Vision and Pattern Recognition (CVPR’97) 744-749

Maaβ, P e Stark, H (1994) Wavelets and Digital Image Processing, Surv. Math. Ind. 4:195-235

Matteucci, M. A Tutorial on Clustering Algorithms - K-Means Clustering. Disponível em http://home.dei.polimi.it/matteucc/Clustering/tutorial_html/kmeans.html . Acesso em 7/11/2007

McLachlan, G. e Peel, D. (2000), Finite Mixture Models, John Wiley & Sons

Mezaris, V., Kompatsiaris, I. e Strintzis, M. (2002) A Framework for the Efficient Segmentation of Large-Format Color Images, IEEE ICIP

Pal, N. e Pal, S. (1993). A review on image segmentation techniques, Patterns Recognition 26(9):1277-1294

Pappas, T. (1992), An adaptive clustering algorithm for image segmentation, Computer Graphics and Image Processing 40(4):901-913

Park, S., Yun, I. e Lee, S. (1998), Color image segmentation based on 3D clustering: Morphological approach, Pattern Recognition 31(8): 1061-176

Phong, B. (1975), Illumination for computer generated pictures, Comm. ACM 18(6):311-317

Rafiei, D. e Meldelzon, A. (2002) Efficient retrieval of similar shapes, The VLDB Journal 11:17-27

Ray, S., Turi, R. e Tischer, P. (1995), Clustering-based color segmentation: An evaluation study, Proc. Of Digital Image Computing: Technology and Applications 86-92

Saber, E. Tekalp, A., Eschbach, R. e Knox, K, (1995), Annotation of natural scenes using adaptive color segmentation, Proc. Of the SPIE – The Int’l Soc. For Optical Eng., Image and Video Proc. Volume III 72-82

Sapiro (1997), Color snakes, Computer Vision and Image Understanding 68(2):247-253

Sapiro, G. (1996), Vector (self) snakes: A geometric approach for color texture and multiscale iamge segmentation, Proc. Int. Conf. Image Processing volume 817-820

89

Page 104: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

Sarfraz, M. e Ridha, A. (2007) Content-based Image Retrieval using Multiple Shape Descriptors, Computer Systems and Applications: 730-737

Shafarenko, L. Petron, M. e Kittler, J. (1998), Automatic watershed segmentation of randomly texture color images, IEEE Trans. On Image Processing IP-6(11):1530-1544

Shafarenko, L. Petron, M. e Kittler, J. (1998), Histogram-based segmentation in a perceptually color space, IEEE Trans. On Image Processing IP-7(9):1354-1358

Shafer, S. (1985), Using color to separate reflection components, Color Research and Application 10(4)-210-218

Sheng, Y. (1996) The transforms and applications handbook. CRC Press, Boca Raton, Fl (USA)

Skarbek, W e Koschan, A (1994), Color Image Segmentation: A survey, Technical Report, Computer Science Department, Berlin Technical University

Skarbek, W. e Koschan, A. (1994), Colour Image Segmentation: A survey, Technical Report 94-32, Computer Science Department, Berlin Technical University

Sobottka, K. e Pitas, I. (1997), Segmentation and tracking of faces in color images, Proc. 2nd Conf. on Automatic face and gesture recoginition 236-241

Takahashi, K. e Abe, K. (1999), Color Image Segmentation using isodata clustering algorithm, Trans. of the Institute of Electronics, Information an Communication Engineers D-II, J82D-II(4):751-762

Torrance, K. e Sparrow, E. (1967), Theory for off-specular reflection from roughened surfaces, J. Opt. Soc. Am. 57(9):1105-1114

Tremeau, A. e Norel, N. (1997), A region growing and merging algorithm to color segmentation, Pattern Recoginition 30(7):1191-1204

Urquhart, R. (1997), Graph theoretical clustering based on limited neighbourhood sets, Proc IEEE Conf. Computer Vision and Pattern Recognition 731-737

Vergés-Llahí, J. (2005), Color Constancy and Image Segmentation Techniques for Applications to Mobile Robotics, Ph. D. Thesis. Universitat Politécnica de Catalunya

Vlanes, C. A Really Friendly Guide to Wavelets. Disponível em: http://perso.orange.fr/polyvalens/clemens/wavelets/wavelets.html . Acesso em 23/10/2007.

Wang, J. (1998) Stochastic relaxation on partitions with connected components and its application to image segmentation, IEEE Trans. On Pattern Analysis and Machine Intelligence 20(6): 619-635

Wang, J. (1998), Stochastic relaxation on partitions with connected components and its applications to image segmentation, IEEE Trans. On Pattern Analysis and Machine Intelligence 20(6):619-635

Wolff, L. (1994) Diffuse-reflectance model for smooth dielectric surfaces, J. Opt. Soc. Am. 11(11): 2956-2968

90

Page 105: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

Wu, Z. e Leahy, R. (1993) An optimal graph theoretic approach to data clustering: Theory and its applications to image segmentation, IEEE Trans. On Patterns Analysis and Machine Intelligence 15(11): 1101-1113

Yung, N. e Lai, H. (1998), Segmentation of color images based on gravitational clustering concept, The Journal of SPIE Optical Engineering 37(3):989-1000

Zahn, C. (1971) Graph-theoretical methods for detecting and describing gestalt glusters, IEEE Trans, On Computers, 20:68-86

The MathWorks, Inc. (2008) Image Processing Toolbox™ 6.1 - Texture Segmentation Using Texture Filters, Disponível em http://www.mathworks.com/products/image/demos.html?file=/products/demos/shipping/images/ipextexturefilter.html. Acesso em 11/04/2008.

91

Page 106: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

92

Page 107: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

Anexo A – Imagens utilizadas

Anexo A1 – Imagens de teste

Imagem 1 Imagem 2 Imagem 3

Imagem 4 Imagem 5 Imagem 6

Imagem 7 Imagem 8 Imagem 9

Imagem 10 Imagem 11 Imagem 12

Imagem 13 Imagem 14 Imagem 15

93

Page 108: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

Imagem 16 Imagem 17 Imagem 18

Imagem 19 Imagem 20 Imagem 21

Imagem 22 Imagem 23 Imagem 24

Imagem 25 Imagem 26 Imagem 27

94

Page 109: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

Imagem 28 Imagem 29 Imagem 30

Imagem 31 Imagem 32 Imagem 33

Imagem 34 Imagem 35 Imagem 36

Imagem 37 Imagem 38 Imagem 39

Imagem 40 Imagem 41 Imagem 42

Imagem 43 Imagem 44 Imagem 45

95

Page 110: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

Anexo A2 - Imagens de referência

Península Ibérica

África

América do Sul

96

Page 111: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

Anexo B – Imagens de contornos tirados à mão

Imagem 1 Imagem 2 Imagem 3

Imagem 4 Imagem 5 Imagem 6

Imagem 7 Imagem 8 Imagem 9

Imagem 10 Imagem 11 Imagem 12

Imagem 13 Imagem 14 Imagem 15

97

Page 112: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

Imagem 16 Imagem 17 Imagem 18

Imagem 19 Imagem 20 Imagem 21

Imagem 22 Imagem 23 Imagem 24

Imagem 25 Imagem 26 Imagem 27

Imagem 28 Imagem 29 Imagem 30

98

Page 113: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

Imagem 31 Imagem 32 Imagem 33

Imagem 34 Imagem 35 Imagem 36

Imagem 37 Imagem 38 Imagem 39

Imagem 40 Imagem 41 Imagem 42

Imagem 43 Imagem 44 Imagem 45

99

Page 114: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

Anexo C – Resultados da segmentação

Anexo C1 – Método de segmentação automática por textura usando a decomposição DWF

Imagem 1 Imagem 2 Imagem 3

Imagem 4 Imagem 5 Imagem 6

Imagem 7 Imagem 8 Imagem 9

Imagem 10 Imagem 11 Imagem 12

Imagem 13 Imagem 14 Imagem 15

100

Page 115: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

Imagem 16 Imagem 17 Imagem 18

Imagem 19 Imagem 20 Imagem 21

Imagem 22 Imagem 23 Imagem 24

Imagem 25 Imagem 26 Imagem 27

Imagem 28 Imagem 29 Imagem 30

101

Page 116: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

Imagem 31 Imagem 32 Imagem 33

Imagem 34 Imagem 35 Imagem 36

Imagem 37 Imagem 38 Imagem 39

Imagem 40 Imagem 41 Imagem 42

Imagem 43 Imagem 44 Imagem 45

102

Page 117: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

Anexo C2 – Método de segmentação de filtros de textura

Imagem 1 Imagem 2 Imagem 3

Imagem 4 Imagem 5 Imagem 6

Imagem 7 Imagem 8 Imagem 9

Imagem 10 Imagem 11 Imagem 12

Imagem 13 Imagem 14 Imagem 15

103

Page 118: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

Imagem 16 Imagem 17 Imagem 18

Imagem 19 Imagem 20 Imagem 21

Imagem 22 Imagem 23 Imagem 24

Imagem 25 Imagem 26 Imagem 27

Imagem 28 Imagem 29 Imagem 30

104

Page 119: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

Imagem 31 Imagem 32 Imagem 33

Imagem 34 Imagem 35 Imagem 36

Imagem 37 Imagem 38 Imagem 39

Imagem 40 Imagem 41 Imagem 42

Imagem 43 Imagem 44 Imagem 45

105

Page 120: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

Anexo C3 – Método de segmentação segundo cor usando k-means clustering

Imagem 1 Imagem 2 Imagem 3

Imagem 4 Imagem 5 Imagem 6

Imagem 7 Imagem 8 Imagem 9

Imagem 10 Imagem 11 Imagem 12

Imagem 13 Imagem 14 Imagem 15

106

Page 121: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

Imagem 16 Imagem 17 Imagem 18

Imagem 19 Imagem 20 Imagem 21

Imagem 22 Imagem 23 Imagem 24

Imagem 25 Imagem 26 Imagem 27

Imagem 28 Imagem 29 Imagem 30

107

Page 122: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

Imagem 31 Imagem 32 Imagem 33

Imagem 34 Imagem 35 Imagem 36

Imagem 37 Imagem 38 Imagem 39

Imagem 40 Imagem 41 Imagem 42

Imagem 43 Imagem 44 Imagem 45

108

Page 123: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

Anexo D – Resultados dos descritores de forma

Anexo D1 – Formas simples

Tabela 23 – Círculo

Tabela 24 – Estrela

Tabela 25 – Quadrado

Tabela 26 – Rectângulo

Tabela 27 - Triângulo

109

Page 124: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

110

Anexo D2 – Resultados dos descritores de forma aplicados a formas simples

Orientação Excentricidade Compacticidade Solidez Rectangularidade Convexidade

Escala 1 89,148 0,057 19,414 0,991 0,783 0,850Escala 1 + trans 89,148 0,057 19,414 0,991 0,783 0,850

Escala 2 90,000 0,058 13,944 0,994 0,786 1,000Escala 2 + trans 90,000 0,058 13,944 0,994 0,786 1,000

Escala 3 -40,929 0,061 14,009 0,980 0,785 0,983Escala 3 + trans -40,929 0,061 14,009 0,980 0,785 0,983

Tabela 28 – Valores dos descritores simples para a forma do círculo

f -7 -6 -5 -4 -3 -2 -1 2 3 4 5 6 7Escala 1 0,21 0,11 0,45 0,17 1,01 0,49 64,99 0,16 0,48 0,09 0,20 0,12 0,27

Escala 1 + trans 0,21 0,11 0,45 0,17 1,01 0,49 64,99 0,16 0,48 0,09 0,20 0,12 0,27Escala 2 0,05 0,31 13,40 1,18 1,68 3,10 863,00 1,17 13,41 0,49 0,82 0,37 1,11

Escala 2 + trans 0,05 0,31 13,40 1,18 1,68 3,10 863,00 1,17 13,41 0,49 0,82 0,37 1,11Escala 3 0,27 0,57 2,04 0,71 0,91 1,94 124,72 0,57 2,08 0,59 0,40 0,30 0,23

Escala 3 + trans 0,27 0,57 2,04 0,71 0,91 1,94 124,72 0,57 2,08 0,59 0,40 0,30 0,23Tabela 29 – Valores dos descritores de Fourier (magnitude) para a forma do círculo

f -7 -6 -5 -4 -3 -2 -1 2 3 4 5 6 7Escala 1 -19,85 -16,78 -12,26 -9,70 -5,65 -8,34 -4,37 4,10 6,65 11,12 13,93 15,09 21,15

Escala 1 + trans -19,85 -16,78 -12,26 -9,70 -5,65 -8,34 -4,37 4,10 6,65 11,12 13,93 15,09 21,15Escala 2 -12,57 -7,85 -6,28 -4,71 -3,14 -1,57 -3,14 1,57 3,14 4,71 6,28 7,85 12,57

Escala 2 + trans -12,57 -7,85 -6,28 -4,71 -3,14 -1,57 -3,14 1,57 3,14 4,71 6,28 7,85 12,57Escala 3 -10,53 -9,10 -8,25 -6,11 -4,09 -2,73 -3,58 2,30 4,24 5,18 7,41 8,71 10,31

Escala 3 + trans -10,53 -9,10 -8,25 -6,11 -4,09 -2,73 -3,58 2,30 4,24 5,18 7,41 8,71 10,31Tabela 30 - Valores dos descritores de Fourier (fase) para a forma do círculo

Orientação Excentricidade Compacticidade Solidez Rectangularidade ConvexidadeEscala 1 0,008 0,475 23,448 0,994 0,993 0,827

Escala 1 + rot -44,999 0,473 24,313 0,993 0,497 0,813Escala 1 + tran + rot -44,999 0,473 24,313 0,993 0,497 0,813

Escala 1 + trans 0,008 0,475 23,448 0,994 0,993 0,827Escala 2 0,000 0,475 15,861 1,000 1,000 1,000

Escala 2 + rot -44,986 0,472 15,877 1,000 0,500 1,000Escala 2 + trans + rot -44,986 0,472 15,877 1,000 0,500 1,000

Escala 2 + trans 0,000 0,475 15,861 1,000 1,000 1,000Escala 3 0,268 0,471 18,709 0,986 0,985 0,903

Escala 3 + rot -44,766 0,476 16,344 0,989 0,502 0,972Escala 3 + tran + rot -44,766 0,476 16,344 0,989 0,502 0,972

Escala 3 + trans 0,268 0,471 18,709 0,986 0,985 0,903Tabela 31 - Valores dos descritores para a forma do quadrado

f -7 -6 -5 -4 -3 -2 -1 2 3 4 5 6 7 Escala 1 0,14 0,01 0,77 0,00 0,33 0,02 19,87 0,02 2,20 0,00 0,20 0,01 0,39

Escala 1 + rot 0,25 0,25 0,55 1,04 1,06 2,58 27,25 0,63 2,88 0,71 0,45 0,51 0,24 Escala 1 + tran + rot 0,25 0,25 0,55 1,04 1,06 2,58 27,25 0,63 2,88 0,71 0,45 0,51 0,24

Escala 1 + trans 0,14 0,01 0,77 0,00 0,33 0,02 19,87 0,02 2,20 0,00 0,20 0,01 0,39 Escala 2 0,14 0,02 0,76 0,01 0,33 0,05 19,79 0,05 2,20 0,00 0,20 0,02 0,39

Escala 2 + rot 0,14 0,02 0,76 0,01 0,33 0,07 19,98 0,07 2,23 0,01 0,20 0,02 0,39 Escala 2 + trans + rot 0,14 0,02 0,76 0,01 0,33 0,07 19,98 0,07 2,23 0,01 0,20 0,02 0,39

Escala 2 + trans 0,14 0,02 0,76 0,01 0,33 0,05 19,79 0,05 2,20 0,00 0,20 0,02 0,39 Escala 3 0,14 0,06 0,74 0,02 0,33 0,17 19,63 0,17 2,21 0,02 0,20 0,06 0,40

Escala 3 + rot 0,18 0,46 0,62 0,14 0,81 1,75 22,90 0,45 2,48 0,59 0,38 0,09 0,29 Escala 3 + tran + rot 0,18 0,46 0,62 0,14 0,81 1,75 22,90 0,45 2,48 0,59 0,38 0,09 0,29

Escala 3 + trans 0,18 0,46 0,62 0,14 0,81 1,75 22,90 0,45 2,48 0,59 0,38 0,09 0,29 Tabela 32 - Valores dos descritores de Fourier (magnitude) para a forma do quadrado

Page 125: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

111

f -7 -6 -5 -4 -3 -2 -1 2 3 4 5 6 7Escala 1 -3,33 -3,98 -6,40 -3,76 -0,10 -0,68 -3,17 -0,54 0,07 2,80 3,24 2,72 3,31

Escala 1 + rot 20,94 20,46 14,39 10,25 9,06 8,20 1,56 -7,40 -10,98 -11,25 -18,37 -19,62 -23,96Escala 1 + tran + rot 20,94 20,46 14,39 10,25 9,06 8,20 1,56 -7,40 -10,98 -11,25 -18,37 -19,62 -23,96

Escala 1 + trans -3,33 -3,98 -6,40 -3,76 -0,10 -0,68 -3,17 -0,54 0,07 2,80 3,24 2,72 3,31Escala 2 -3,54 -4,23 -6,53 -4,08 -0,20 -0,89 -3,19 -0,69 0,15 2,61 3,34 2,65 3,50

Escala 2 + rot -21,42 -16,85 -16,93 -9,21 -9,14 -4,57 -4,64 4,57 7,64 9,07 12,28 16,86 19,91Escala 2 + trans + -21,42 -16,85 -16,93 -9,21 -9,14 -4,57 -4,64 4,57 7,64 9,07 12,28 16,86 19,91Escala 2 + trans -3,54 -4,23 -6,53 -4,08 -0,20 -0,89 -3,19 -0,69 0,15 2,61 3,34 2,65 3,50

Escala 3 -3,14 -4,26 -6,28 -4,07 0,00 -1,11 -3,14 -1,11 0,00 2,21 3,14 2,02 3,14Escala 3 + rot -19,80 -15,96 -15,69 -12,50 -8,37 -4,71 -4,38 3,65 6,83 7,41 11,10 14,77 17,92

Escala 3 + tran + rot -19,80 -15,96 -15,69 -12,50 -8,37 -4,71 -4,38 3,65 6,83 7,41 11,10 14,77 17,92Escala 3 + trans -19,80 -15,96 -15,69 -12,50 -8,37 -4,71 -4,38 3,65 6,83 7,41 11,10 14,77 17,92

Tabela 33 - Valores dos descritores de Fourier (Fase) para a forma do quadrado

Orientação Excentricidade Compacticidade Solidez Rectangularidade ConvexidadeEscala 1 -2,061 0,650 38,347 0,980 0,497 0,769

Escala 1 + rot -47,052 0,650 39,069 0,978 0,489 0,762Escala 1 + tran + rot -47,052 0,650 39,069 0,978 0,489 0,762

Escala 1 + trans -2,061 0,650 38,347 0,980 0,497 0,769Escala 2 -2,060 0,651 22,526 0,989 0,498 0,999

Escala 2 + rot -47,076 0,651 25,506 0,980 0,490 0,939Escala 2 + trans + rot -47,076 0,651 25,506 0,980 0,490 0,939

Escala 2 + trans -2,060 0,651 22,526 0,989 0,498 0,999Escala 3 -2,089 0,647 20,499 0,973 0,525 1,000

Escala 3 + rot -47,363 0,648 23,452 0,941 0,504 0,943Escala 3 + tran + rot -47,363 0,648 23,452 0,941 0,504 0,943

Escala 3 + trans -2,089 0,647 20,499 0,973 0,525 1,000Tabela 34 - Valores dos descritores para a forma do triângulo

f -7 -6 -5 -4 -3 -2 -1 2 3 4 5 6 7Escala 1 0,14 0,04 0,09 0,34 0,18 0,11 6,61 1,64 0,17 0,17 0,17 0,07 0,04

Escala 1 + rot 0,09 0,06 0,12 0,34 0,17 0,24 6,23 1,49 0,23 0,14 0,18 0,11 0,05Escala 1 + tran + rot 0,09 0,06 0,12 0,34 0,17 0,24 6,23 1,49 0,23 0,14 0,18 0,11 0,05

Escala 1 + trans 0,14 0,04 0,09 0,34 0,18 0,11 6,61 1,64 0,17 0,17 0,17 0,07 0,04Escala 2 0,00 0,02 0,21 0,20 0,22 0,57 5,74 1,31 0,40 0,12 0,08 0,17 0,01

Escala 2 + rot 0,12 0,09 0,13 0,44 0,19 0,57 7,77 2,01 0,17 0,04 0,31 0,08 0,05Escala 2 + trans + rot 0,12 0,09 0,13 0,44 0,19 0,57 7,77 2,01 0,17 0,04 0,31 0,08 0,05

Escala 2 + trans 0,00 0,02 0,21 0,20 0,22 0,57 5,74 1,31 0,40 0,12 0,08 0,17 0,01Escala 3 0,01 0,02 0,22 0,21 0,21 0,59 5,76 1,28 0,39 0,12 0,07 0,15 0,01

Escala 3 + rot 0,13 0,11 0,14 0,45 0,20 0,63 8,30 2,14 0,18 0,06 0,34 0,07 0,06Escala 3 + tran + rot 0,13 0,11 0,14 0,45 0,20 0,63 8,30 2,14 0,18 0,06 0,34 0,07 0,06

Escala 3 + trans 0,01 0,02 0,22 0,21 0,21 0,59 5,76 1,28 0,39 0,12 0,07 0,15 0,01Tabela 35 - Valores dos descritores de Fourier (magnitude) para a forma do triângulo

f -7 -6 -5 -4 -3 -2 -1 2 3 4 5 6 7Escala 1 -16,67 -12,21 -10,70 -9,99 -6,52 -3,99 -3,27 3,42 3,56 6,75 10,14 10,52 12,80

Escala 1 + rot -22,68 -18,26 -14,77 -13,76 -9,49 -5,89 -4,80 4,14 11,38 8,83 13,14 14,07 17,50Escala 1 + tran + rot -22,68 -18,26 -14,77 -13,76 -9,49 -5,89 -4,80 4,14 11,38 8,83 13,14 14,07 17,50

Escala 1 + trans -16,67 -12,21 -10,70 -9,99 -6,52 -3,99 -3,27 3,42 3,56 6,75 10,14 10,52 12,80Escala 2 -13,04 -13,00 -9,77 -9,70 -6,50 -3,25 -3,20 3,30 3,36 6,55 9,85 9,86 9,90

Escala 2 + rot -22,75 -15,64 -17,66 -13,77 -6,70 -8,78 -4,81 4,15 8,02 12,70 13,11 16,93 21,34Escala 2 + trans + rot -22,75 -15,64 -17,66 -13,77 -6,70 -8,78 -4,81 4,15 8,02 12,70 13,11 16,93 21,34

Escala 2 + trans -13,04 -13,00 -9,77 -9,70 -6,50 -3,25 -3,20 3,30 3,36 6,55 9,85 9,86 9,90Escala 3 -11,39 -13,33 -9,48 -9,53 -6,38 -3,10 -3,15 3,19 3,20 6,41 9,49 9,53 15,15

Escala 3 + rot -21,87 -15,12 -17,25 -13,31 -6,45 -8,65 -4,70 3,94 7,83 11,64 12,59 16,58 20,26Escala 3 + tran + rot -21,87 -15,12 -17,25 -13,31 -6,45 -8,65 -4,70 3,94 7,83 11,64 12,59 16,58 20,26

Escala 3 + trans -11,39 -13,33 -9,48 -9,53 -6,38 -3,10 -3,15 3,19 3,20 6,41 9,49 9,53 15,15Tabela 36 - Valores dos descritores de Fourier (fase) para a forma do triângulo

Page 126: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

112

Orientação Excentricidade Compacticidade Solidez Rectangularidade ConvexidadeEscala 1 0,000 1,000 168,747 0,970 0,969 0,876

Escala 1 + rot -45,000 1,000 150,387 0,978 0,061 0,933Escala 1 + tran + rot -45,000 1,000 148,777 0,978 0,061 0,936

Escala 1 + trans 0,000 1,000 168,747 0,970 0,969 0,876Escala 2 0,000 1,000 127,361 1,000 1,000 1,000

Escala 2 + rot -45,000 0,999 124,053 1,000 0,064 1,000Escala 2 + trans + rot -45,000 1,000 132,077 1,000 0,060 1,000

Escala 2 + trans 0,000 1,000 127,361 1,000 1,000 1,000Escala 3 0,034 0,999 173,284 0,797 0,790 0,869

Escala 3 + rot -45,023 0,999 193,699 0,759 0,067 0,778Escala 3 + tran + rot -44,965 0,999 251,166 0,690 0,049 0,798

Escala 3 + trans 0,034 0,999 173,284 0,797 0,790 0,869Tabela 37 - Valores dos descritores para a forma do rectângulo

f -7 -6 -5 -4 -3 -2 -1 2 3 4 5 6 7Escala 1 0,03 0,00 0,05 0,00 0,13 0,00 1,10 0,00 0,10 0,00 0,03 0,00 0,01

Escala 1 + rot 0,00 0,04 0,02 0,06 0,11 0,13 1,10 0,11 0,08 0,04 0,01 0,02 0,00Escala 1 + tran + rot 0,00 0,04 0,02 0,06 0,11 0,13 1,10 0,11 0,08 0,04 0,01 0,02 0,00

Escala 1 + trans 0,03 0,00 0,05 0,00 0,13 0,00 1,10 0,00 0,10 0,00 0,03 0,00 0,01Escala 2 0,03 0,00 0,05 0,00 0,13 0,00 1,10 0,00 0,10 0,00 0,03 0,00 0,01

Escala 2 + rot 0,03 0,00 0,05 0,00 0,13 0,00 1,10 0,00 0,10 0,00 0,03 0,00 0,01Escala 2 + trans + rot 0,03 0,00 0,05 0,00 0,13 0,00 1,10 0,00 0,10 0,00 0,03 0,00 0,01

Escala 2 + trans 0,03 0,00 0,05 0,00 0,13 0,00 1,10 0,00 0,10 0,00 0,03 0,00 0,01Escala 3 0,02 0,00 0,05 0,00 0,12 0,00 1,06 0,00 0,10 0,00 0,03 0,00 0,02

Escala 3 + rot 0,03 0,02 0,03 0,08 0,04 0,24 1,07 0,21 0,03 0,06 0,03 0,01 0,02Escala 3 + tran + rot 0,03 0,02 0,04 0,07 0,04 0,23 1,05 0,21 0,03 0,06 0,03 0,02 0,02

Escala 3 + trans 0,02 0,00 0,05 0,00 0,12 0,00 1,06 0,00 0,10 0,00 0,03 0,00 0,02Tabela 38 - Valores dos descritores de Fourier (magnitude) para a forma do rectângulo

f -7 -6 -5 -4 -3 -2 -1 2 3 4 5 6 7Escala 1 -12,57 -6,51 -9,43 -3,36 -6,28 -0,20 -3,14 6,11 3,14 2,98 6,28 6,13 9,42

Escala 1 + rot -18,31 -14,92 -7,84 -10,21 -9,41 -5,49 -4,71 7,06 4,70 11,79 9,41 10,21 17,57Escala 1 + tran + rot -12,22 -14,93 -7,85 -10,21 -9,43 -5,51 -4,71 7,08 4,72 11,78 9,42 10,22 17,50

Escala 1 + trans -12,57 -6,51 -9,43 -3,36 -6,28 -0,20 -3,14 6,11 3,14 2,98 6,28 6,13 9,42Escala 2 -12,58 -7,13 -9,43 -3,98 -6,29 -0,84 -3,14 5,45 3,14 8,60 6,28 11,75 9,41

Escala 2 + rot -18,84 -13,99 -14,13 -9,28 -9,42 -4,57 -4,71 4,85 4,71 9,56 9,43 14,26 14,15Escala 2 + trans + rot -18,84 -14,05 -14,13 -9,35 -9,42 -4,64 -4,71 4,77 4,71 9,48 9,43 14,18 14,16

Escala 2 + trans -12,58 -7,13 -9,43 -3,98 -6,29 -0,84 -3,14 5,45 3,14 8,60 6,28 11,75 9,41Escala 3 -12,53 -7,58 -9,41 -4,48 -6,27 -1,38 -3,14 4,76 3,15 7,79 6,30 10,79 9,48

Escala 3 + rot -21,97 -18,30 -11,17 -13,41 -9,23 -8,64 -4,71 3,93 10,81 8,60 13,02 13,78 17,36Escala 3 + tran + rot -21,97 -17,98 -11,09 -13,25 -9,29 -8,59 -4,71 3,88 10,83 8,62 12,62 19,59 17,29

Escala 3 + trans -12,53 -7,58 -9,41 -4,48 -6,27 -1,38 -3,14 4,76 3,15 7,79 6,30 10,79 9,48Tabela 39 - Valores dos descritores de Fourier (Fase) para a forma do rectângulo

Orientação Excentricidade Compacticidade Solidez Rectangularidade Convexidade

Escala 1 32,105 0,629 133,192 0,418 0,236 0,586Escala 1 + rot -12,855 0,628 132,975 0,418 0,247 0,586

Escala 1 + tran + rot -11,848 0,628 134,749 0,418 0,248 0,582Escala 1 + trans 32,105 0,629 133,192 0,418 0,236 0,586

Escala 2 32,078 0,628 92,900 0,419 0,236 0,700Escala 2 + rot -12,824 0,629 102,591 0,419 0,248 0,665

Escala 2 + trans + rot -12,790 0,627 103,432 0,420 0,248 0,662Escala 2 + trans 32,078 0,628 92,900 0,419 0,236 0,700

Escala 3 32,284 0,627 89,160 0,436 0,250 0,687Escala 3 + rot -15,368 0,619 92,035 0,445 0,262 0,670

Escala 3 + tran + rot -11,357 0,603 96,633 0,431 0,260 0,661Escala 3 + trans 32,284 0,627 89,160 0,436 0,250 0,687

Tabela 40 - Valores dos descritores para a forma de estrela

Page 127: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

113

f -7 -6 -5 -4 -3 -2 -1 2 3 4 5 6 7Escala 1 0,32 0,29 0,61 0,52 1,00 0,71 5,19 0,99 1,34 1,00 0,70 0,15 0,24

Escala 1 + rot 0,31 0,27 0,50 0,61 0,91 0,96 4,99 0,82 1,41 0,91 0,69 0,31 0,18Escala 1 + tran + rot 0,34 0,29 0,53 0,64 0,98 0,97 5,20 0,86 1,43 1,01 0,73 0,31 0,16

Escala 1 + trans 0,32 0,29 0,61 0,52 1,00 0,71 5,19 0,99 1,34 1,00 0,70 0,15 0,24Escala 2 0,23 0,26 0,62 0,41 0,96 0,47 4,88 1,04 1,19 0,92 0,64 0,08 0,25

Escala 2 + rot 0,32 0,31 0,45 0,62 0,94 1,07 5,03 0,70 1,46 0,91 0,69 0,36 0,17Escala 2 + trans + rot 0,32 0,31 0,45 0,64 0,96 1,11 5,09 0,72 1,48 0,92 0,70 0,37 0,17

Escala 2 + trans 0,23 0,26 0,62 0,41 0,96 0,47 4,88 1,04 1,19 0,92 0,64 0,08 0,25Escala 3 0,22 0,27 0,57 0,41 0,89 0,45 4,82 1,04 1,16 0,91 0,62 0,10 0,26

Escala 3 + rot 0,29 0,37 0,47 0,52 0,96 0,93 5,06 0,75 1,34 1,04 0,64 0,33 0,18Escala 3 + tran + rot 0,35 0,35 0,51 0,60 0,98 0,91 5,48 0,87 1,46 1,07 0,78 0,33 0,20

Escala 3 + trans 0,22 0,27 0,57 0,41 0,89 0,45 4,82 1,04 1,16 0,91 0,62 0,10 0,26Tabela 41 - Valores dos descritores de Fourier (magnitude) para a forma de estrela

f -7 -6 -5 -4 -3 -2 -1 2 3 4 5 6 7Escala 1 -7,40 -8,00 -4,96 -3,09 -2,31 -0,56 -2,20 2,94 0,71 3,24 3,27 7,61 7,38

Escala 1 + rot -12,82 -6,84 -9,32 -6,50 -5,18 -2,73 -3,67 3,62 2,08 5,24 5,71 10,69 11,06Escala 1 + tran + -12,66 -6,79 -9,24 -6,50 -5,16 -2,68 -3,64 3,60 2,06 5,23 5,67 10,63 10,87Escala 1 + trans -7,40 -8,00 -4,96 -3,09 -2,31 -0,56 -2,20 2,94 0,71 3,24 3,27 7,61 7,38

Escala 2 -8,43 -8,55 -5,59 -3,62 -2,61 -0,77 -2,32 3,09 0,97 3,66 4,11 8,75 8,51Escala 2 + rot -12,11 -6,34 -8,89 -6,15 -4,94 -2,59 -3,59 3,49 1,89 4,92 5,17 10,08 10,51

Escala 2 + trans -12,23 -6,45 -8,98 -6,22 -4,98 -2,63 -3,60 3,54 1,95 4,98 5,25 10,20 10,62Escala 2 + trans -8,43 -8,55 -5,59 -3,62 -2,61 -0,77 -2,32 3,09 0,97 3,66 4,11 8,75 8,51

Escala 3 -8,53 -8,74 -5,73 -3,71 -2,69 -0,83 -2,34 3,16 1,07 3,75 4,19 8,55 8,62Escala 3 + rot -13,14 -7,15 -9,63 -6,85 -5,46 -2,92 -3,73 3,58 2,33 5,57 5,94 10,92 11,77

Escala 3 + tran + -12,04 -6,13 -8,68 -6,08 -4,91 -2,54 -3,58 3,42 1,78 4,84 5,13 9,84 10,59Escala 3 + trans -8,53 -8,74 -5,73 -3,71 -2,69 -0,83 -2,34 3,16 1,07 3,75 4,19 8,55 8,62

Tabela 42 - Valores dos descritores de Fourier (Fase) para a forma de estrela

Anexo D3 – Resultados dos descritores para os contornos tirados à mão

imagem Orientação Excentricidade Compacticidade Solidez Rectangularidade Convexidade1 20,054 0,588 25,382 0,858 0,640 0,8622 27,391 0,622 24,347 0,871 0,641 0,8753 8,647 0,708 34,021 0,846 0,644 0,7544 28,627 0,558 26,086 0,866 0,644 0,8515 32,122 0,521 25,817 0,854 0,624 0,8636 31,706 0,290 26,379 0,848 0,640 0,8447 25,106 0,559 30,425 0,861 0,623 0,7958 23,729 0,556 24,701 0,869 0,628 0,8789 27,748 0,570 24,830 0,866 0,636 0,869

10 28,197 0,566 25,482 0,859 0,635 0,86311 29,778 0,581 25,580 0,864 0,631 0,85712 26,067 0,572 28,169 0,856 0,638 0,82113 24,861 0,520 24,372 0,867 0,636 0,88214 24,661 0,591 24,862 0,869 0,628 0,87515 24,423 0,617 23,681 0,878 0,657 0,885

Tabela 43 – Valores dos descritores simples dos contornos tirados à mão de imagens da Península Ibérica

Page 128: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

114

f -7 -6 -5 -4 -3 -2 -1 2 3 4 5 6 7 1 0,198 0,076 0,238 0,215 0,031 0,275 7,675 0,729 0,596 0,122 0,312 0,039 0,008 2 0,112 0,049 0,274 0,119 0,122 0,227 7,437 0,555 0,633 0,027 0,293 0,095 0,022 3 0,034 0,098 0,261 0,135 0,122 0,477 5,645 0,558 0,374 0,073 0,261 0,150 0,116 4 0,109 0,146 0,245 0,207 0,219 0,197 8,497 0,823 0,762 0,124 0,315 0,135 0,057 5 0,142 0,138 0,314 0,185 0,264 0,158 9,760 0,854 0,888 0,094 0,430 0,186 0,038 6 0,027 0,045 0,049 0,010 0,122 0,487 1,013 0,488 0,119 0,010 0,047 0,045 0,026 7 0,092 0,127 0,255 0,204 0,146 0,015 8,210 0,846 0,691 0,064 0,351 0,077 0,048 8 0,186 0,091 0,230 0,189 0,072 0,158 8,324 0,828 0,720 0,090 0,284 0,059 0,078 9 0,126 0,090 0,272 0,239 0,148 0,157 8,506 0,666 0,745 0,050 0,303 0,122 0,061

10 0,068 0,152 0,218 0,281 0,260 0,336 8,099 0,705 0,748 0,108 0,319 0,183 0,070 11 0,141 0,085 0,292 0,214 0,208 0,284 9,219 0,751 0,813 0,057 0,360 0,114 0,028 12 0,120 0,218 0,290 0,328 0,185 0,120 9,407 0,882 0,799 0,124 0,397 0,102 0,093 13 0,201 0,067 0,321 0,316 0,126 0,375 9,814 0,922 0,851 0,113 0,386 0,088 0,059 14 0,121 0,018 0,248 0,006 0,348 0,023 7,835 0,018 0,820 0,003 0,201 0,005 0,103 15 0,151 0,040 0,313 0,225 0,121 0,083 8,378 0,792 0,702 0,090 0,317 0,066 0,017

Tabela 44 – Valores dos descritores de Fourier (Magnitude) dos contornos tirados à mão de imagens da Península Ibérica

f -7 -6 -5 -4 -3 -2 -1 2 3 4 5 6 7 1 -9,017 -4,361 -7,564 -2,797 -3,390 -3,208 -2,368 4,133 3,001 5,592 4,277 8,645 5,099 2 -8,135 -5,664 -7,152 -3,063 0,328 -1,716 -2,235 3,599 2,545 5,594 3,632 7,813 6,934 3 -5,841 -0,751 -3,821 -4,910 -1,844 -1,520 -2,792 -1,789 4,054 0,248 -0,069 4,604 1,106 4 -7,922 -5,004 -7,177 -2,481 -0,287 -0,580 -2,256 3,765 2,606 5,675 3,745 2,235 4,207 5 -8,061 -4,876 -7,061 -2,245 -0,024 -1,488 -2,218 3,768 2,582 0,753 3,784 2,048 8,676 6 5,950 1,489 0,268 3,349 3,099 -1,075 -1,861 -3,638 -3,864 -1,778 -3,019 0,082 -6,103 7 -8,966 -4,914 -7,362 -2,843 -0,814 -2,966 -2,345 3,970 2,878 5,368 4,122 8,461 4,219 8 -8,603 -4,429 -7,309 -2,477 -0,765 -2,997 -2,323 3,955 2,810 5,309 4,018 7,826 3,624 9 -8,293 -4,231 -6,960 -2,220 -0,125 -1,706 -2,232 3,727 2,504 5,897 3,612 1,802 3,012

10 -7,682 -4,665 -1,151 -2,362 -0,580 -0,337 -2,266 3,783 2,581 0,739 3,656 2,203 3,834 11 -8,668 -5,132 -6,911 -2,550 0,429 -1,621 -2,202 3,686 2,535 6,413 3,660 7,949 8,152 12 -9,089 -5,398 -8,117 -3,036 -0,392 0,907 -2,383 3,941 3,085 5,959 4,500 3,079 5,731 13 -8,961 -5,129 -7,581 -2,916 0,064 -3,034 -2,319 4,067 2,958 5,901 4,269 8,395 9,251 14 -9,907 -7,102 -6,555 -5,279 -0,204 -3,048 -3,192 -1,199 0,157 4,316 3,390 4,490 9,754 15 -8,728 -5,472 -7,518 -3,044 -5,632 -2,267 -2,334 4,050 2,938 5,363 4,092 8,215 4,804

Tabela 45 - Valores dos descritores de Fourier (Fase) dos contornos tirados à mão de imagens da Península Ibérica

imagem Orientação Excentricidade Compacticidade Solidez Rectangularidade Convexidade16 -56,013 0,765 25,865 0,809 0,507 0,86917 -38,898 0,843 24,988 0,821 0,574 0,85718 -55,094 0,806 25,657 0,811 0,516 0,87219 -53,647 0,769 27,339 0,794 0,491 0,85820 -56,153 0,771 26,862 0,804 0,501 0,85621 -56,327 0,772 27,678 0,796 0,494 0,84822 -55,242 0,768 27,141 0,802 0,497 0,85323 -42,799 0,744 30,521 0,765 0,478 0,83124 -55,001 0,775 26,542 0,806 0,511 0,85925 -57,875 0,774 26,614 0,807 0,512 0,86426 -54,364 0,742 27,344 0,790 0,484 0,86627 -41,756 0,722 27,004 0,805 0,505 0,85328 -55,478 0,771 27,424 0,801 0,500 0,84929 -56,882 0,781 28,581 0,783 0,483 0,86030 -53,723 0,759 24,862 0,811 0,508 0,884

Tabela 46 - Valores dos descritores simples dos contornos tirados à mão de imagens de África

Page 129: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

115

f -7 -6 -5 -4 -3 -2 -1 2 3 4 5 6 7 16 0,114 0,067 0,044 0,422 0,582 0,511 5,429 0,663 0,444 0,063 0,164 0,106 0,150 17 0,030 0,022 0,053 0,223 0,491 0,407 3,891 0,337 0,214 0,131 0,135 0,060 0,046 18 0,110 0,039 0,028 0,364 0,519 0,329 4,743 0,565 0,354 0,039 0,123 0,102 0,147 19 0,128 0,083 0,044 0,399 0,629 0,552 5,329 0,725 0,481 0,045 0,137 0,104 0,173 20 0,092 0,075 0,035 0,435 0,579 0,448 5,401 0,673 0,478 0,054 0,153 0,102 0,153 21 0,104 0,100 0,052 0,448 0,621 0,443 5,563 0,698 0,517 0,071 0,158 0,125 0,164 22 0,101 0,093 0,029 0,439 0,603 0,479 5,521 0,702 0,494 0,063 0,153 0,125 0,159 23 0,183 0,152 0,104 0,603 0,711 0,341 6,692 1,072 0,540 0,163 0,315 0,209 0,173 24 0,123 0,076 0,032 0,406 0,585 0,461 5,349 0,660 0,455 0,040 0,138 0,105 0,161 25 0,112 0,069 0,028 0,398 0,561 0,434 5,352 0,740 0,444 0,042 0,111 0,113 0,155 26 0,120 0,057 0,096 0,470 0,486 0,443 5,800 0,819 0,541 0,035 0,160 0,154 0,170 27 0,175 0,164 0,143 0,644 0,742 0,485 6,914 1,009 0,615 0,158 0,264 0,145 0,142 28 0,121 0,084 0,068 0,437 0,609 0,369 5,619 0,725 0,513 0,042 0,170 0,108 0,155 29 0,058 0,098 0,050 0,355 0,624 0,440 5,455 0,907 0,427 0,070 0,144 0,167 0,135 30 0,088 0,128 0,029 0,415 0,631 0,490 6,062 0,784 0,535 0,069 0,181 0,140 0,172

Tabela 47 - Valores dos descritores de Fourier (Magnitude) dos contornos tirados à mão de imagens de África

f -7 -6 -5 -4 -3 -2 -1 2 3 4 5 6 716 18,732 17,938 12,299 10,889 8,617 6,493 1,190 -8,454 -9,690 -12,805 -14,866 -19,919 -19,37717 -16,704 -16,232 -16,125 -12,854 -9,351 -5,175 -4,579 3,840 7,496 11,825 15,187 14,866 16,46118 -19,237 -19,422 -13,447 -14,254 -10,227 -6,269 -5,083 4,136 9,227 12,259 16,704 17,661 18,33719 24,424 18,211 18,482 10,787 8,425 6,231 1,154 -8,461 -9,639 -11,391 -14,647 -20,051 -19,18120 18,496 17,711 12,156 10,775 8,535 6,293 1,153 -8,364 -9,648 -12,934 -14,686 -19,652 -19,06821 18,408 18,071 13,037 10,868 8,652 6,237 1,166 -8,451 -9,686 -13,390 -14,607 -19,716 -19,22922 24,828 18,009 13,068 10,915 8,623 6,302 1,172 -8,485 -9,739 -13,370 -14,638 -19,760 -19,28723 -22,393 -16,319 -15,617 -12,441 -9,124 -5,102 -4,616 3,039 7,643 12,413 14,284 14,381 20,81724 24,847 18,414 12,742 10,961 8,620 6,469 1,202 -8,495 -9,696 -12,783 -14,736 -20,138 -19,46225 24,003 17,645 12,844 10,410 8,175 6,244 1,053 -8,348 -9,375 -12,799 -14,092 -18,971 -18,24626 18,112 17,773 12,366 10,764 8,408 6,116 1,124 -8,499 -9,480 -12,992 -14,277 -19,542 -18,97627 -21,681 -15,703 -15,130 -12,164 -8,912 -4,999 -4,565 2,964 7,427 12,262 13,969 14,084 20,64528 18,522 18,198 13,016 10,877 8,609 6,345 1,182 -8,437 -9,722 -13,167 -14,705 -19,864 -19,34729 23,992 17,453 12,290 10,443 8,319 5,937 1,062 -8,411 -9,284 -12,426 -13,777 -18,617 -18,21930 -18,626 -19,123 -13,111 -13,896 -9,973 -6,148 -5,019 3,969 8,857 11,696 16,294 17,433 24,199

Tabela 48 - Valores dos descritores de Fourier (Fase) dos contornos tirados à mão de imagens de África

imagem Orientação Excentricidade Compacticidade Solidez Rectangularidade Convexidade31 -88,152 0,740 29,445 0,784 0,473 0,90032 84,498 0,626 36,983 0,749 0,477 0,80233 -82,711 0,665 23,963 0,857 0,535 0,91434 69,097 0,658 29,202 0,845 0,593 0,83035 74,572 0,725 32,740 0,807 0,491 0,83936 -85,869 0,779 29,165 0,816 0,488 0,89437 83,613 0,821 31,812 0,774 0,465 0,90638 -87,901 0,719 31,426 0,790 0,476 0,86939 -86,455 0,714 32,623 0,783 0,465 0,85540 -88,006 0,748 34,202 0,764 0,454 0,84841 -85,685 0,697 28,712 0,793 0,462 0,91042 -87,976 0,726 29,106 0,795 0,475 0,90243 83,737 0,752 25,758 0,820 0,520 0,91044 -87,345 0,728 27,872 0,793 0,473 0,92345 82,347 0,736 29,380 0,788 0,492 0,885

Tabela 49 - Valores dos descritores simples dos contornos tirados à mão de imagens da América do Sul

Page 130: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

116

f -7 -6 -5 -4 -3 -2 -1 2 3 4 5 6 731 0,056 0,080 0,059 0,290 0,172 0,322 3,876 0,833 0,130 0,072 0,113 0,052 0,06132 0,101 0,035 0,088 0,406 0,160 0,292 4,961 1,196 0,258 0,284 0,077 0,082 0,08633 0,061 0,107 0,135 0,425 0,299 0,363 6,517 1,169 0,266 0,184 0,039 0,122 0,08134 0,081 0,172 0,158 0,537 0,082 0,325 5,622 1,016 0,235 0,186 0,098 0,104 0,09535 0,071 0,081 0,024 0,349 0,120 0,238 3,945 0,883 0,067 0,151 0,091 0,034 0,07936 0,060 0,067 0,031 0,305 0,175 0,162 3,924 0,792 0,176 0,028 0,107 0,078 0,05837 0,076 0,083 0,033 0,203 0,211 0,222 2,954 0,675 0,056 0,037 0,100 0,044 0,01338 0,069 0,113 0,004 0,353 0,147 0,351 3,940 0,854 0,111 0,062 0,089 0,074 0,05039 0,093 0,067 0,063 0,278 0,123 0,324 3,732 0,798 0,184 0,058 0,067 0,094 0,04440 0,051 0,053 0,029 0,265 0,226 0,422 3,527 0,784 0,031 0,117 0,134 0,055 0,04241 0,078 0,071 0,026 0,328 0,207 0,434 4,054 0,890 0,121 0,064 0,108 0,076 0,05442 0,058 0,091 0,027 0,319 0,192 0,397 3,818 0,818 0,091 0,065 0,087 0,076 0,04743 0,056 0,066 0,006 0,317 0,236 0,321 4,049 0,781 0,145 0,080 0,061 0,052 0,05244 0,067 0,060 0,016 0,280 0,227 0,408 3,791 0,800 0,171 0,057 0,103 0,092 0,03045 0,048 0,083 0,046 0,290 0,217 0,368 3,761 0,821 0,070 0,095 0,074 0,049 0,084

Tabela 50 – Valores dos descritores de Fourier (Magnitude) dos contornos tirados à mão de imagens da América do Sul

f -7 -6 -5 -4 -3 -2 -1 2 3 4 5 6 731 12,782 13,829 8,184 6,741 5,939 2,922 -0,166 -6,762 -6,126 -7,811 -11,849 -11,932 -13,39532 11,586 7,036 11,347 5,565 4,350 3,507 -0,415 -0,404 -6,763 -7,964 -5,724 -8,541 -12,14233 14,417 15,461 13,233 7,368 5,861 3,986 0,055 -7,255 -6,896 -8,822 -8,141 -12,383 -15,58534 7,699 9,952 5,693 4,383 5,236 1,215 -0,856 -5,869 -6,691 -6,209 -9,672 -11,785 -9,07835 -3,128 -1,393 1,904 -1,097 -0,948 2,144 -0,643 -0,056 -0,914 0,099 1,725 1,369 1,46636 12,950 15,152 12,628 7,244 5,953 2,995 -0,018 -6,914 -6,305 -8,686 -12,528 -12,433 -14,64837 10,953 12,661 9,854 6,294 5,457 3,186 -0,344 -6,503 -5,301 -6,480 -11,188 -11,226 -13,13538 12,545 14,021 11,562 6,922 5,978 3,042 -0,169 -6,700 -6,205 -8,031 -11,897 -12,088 -13,50039 13,254 8,787 7,383 7,036 6,481 3,407 -0,076 -6,924 -6,248 -8,170 -12,248 -12,330 -13,98440 11,210 13,184 8,088 6,760 6,298 2,768 -0,180 -6,750 -6,919 -7,908 -11,884 -12,186 -13,08241 12,222 13,618 9,205 6,778 5,835 3,044 -0,189 -6,673 -5,752 -7,614 -11,860 -11,959 -13,50642 12,442 13,711 8,589 6,841 6,042 3,033 -0,179 -6,709 -5,979 -7,881 -11,804 -11,989 -13,49943 11,189 12,464 6,877 5,942 4,970 3,317 -0,362 -6,534 -6,005 -7,603 -10,664 -10,934 -12,67444 12,682 13,901 7,307 6,838 6,071 3,348 -0,120 -6,781 -5,868 -8,089 -11,668 -11,836 -14,09345 10,552 12,387 6,647 5,865 5,230 2,745 -0,459 -6,493 -6,328 -6,856 -10,757 -10,796 -12,016

Tabela 51 - Valores dos descritores de Fourier (Fase) dos contornos tirados à mão de imagens da América do Sul

Anexo D4 - Resultados dos descritores para formas obtidas usando o método de segmentação que usa a decomposição DWF

imagem Orientação Excentricidade Compacticidade Solidez Rectangularidade Convexidade1 29,6811 0,6026 33,3898 0,8426 0,6127 0,74412 12,2403 0,2369 95,9797 0,681 0,6373 0,49513 6,7713 0,723 45,5984 0,8066 0,7409 0,64524 32,1862 0,5836 56,4575 0,7423 0,5649 0,59685 37,5871 0,7249 30,3735 0,836 0,5757 0,80966 -14,4535 0,5269 101,0451 0,7577 0,6574 0,45547 29,0403 0,5977 24,7552 0,8825 0,6537 0,85068 27,4674 0,5668 28,5633 0,8444 0,5889 0,8179 16,6158 0,5897 68,7685 0,7626 0,6822 0,5365

10 38,9297 0,6544 43,2999 0,7661 0,576 0,699311 38,6171 0,608 55,9307 0,7589 0,6422 0,602812 29,1305 0,623 42,1709 0,8459 0,7003 0,66 13 22,9475 0,6084 69,7402 0,8101 0,6829 0,516714 6,2883 0,5618 60,6647 0,6871 0,6684 0,616615 -29,9442 0,667 77,1027 0,7002 0,6089 0,5329

Tabela 52 – Valores dos descritores simples para imagens da Península Ibérica

Page 131: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

117

f -7 -6 -5 -4 -3 -2 -1 2 3 4 5 6 71 0,242 0,181 0,267 0,257 0,343 0,319 7,398 0,978 0,255 0,376 0,230 0,143 0,1822 0,129 0,213 0,178 0,222 0,740 2,275 3,719 0,956 0,732 0,301 0,244 0,394 0,1593 0,267 0,431 0,018 0,515 0,367 1,529 6,456 0,610 0,403 0,463 0,168 0,272 0,1374 0,421 0,279 0,699 0,918 0,519 1,830 8,618 0,488 0,938 0,888 0,640 0,398 0,1485 0,088 0,050 0,222 0,186 0,122 0,202 5,314 0,685 0,291 0,114 0,289 0,084 0,0856 0,179 0,841 0,521 0,502 1,054 1,153 6,373 0,530 0,853 0,337 0,510 0,543 0,3307 0,202 0,056 0,318 0,268 0,084 0,256 8,320 0,712 0,514 0,133 0,331 0,070 0,0158 0,279 0,061 0,353 0,297 0,159 0,189 9,938 0,903 0,682 0,197 0,409 0,219 0,0639 0,409 0,643 0,086 0,221 0,287 2,367 10,096 0,633 0,726 0,651 0,586 0,516 0,156

10 0,252 0,221 0,473 0,232 0,509 1,181 6,672 1,400 0,377 0,475 0,187 0,249 0,18211 0,037 1,868 0,670 1,588 2,523 2,632 29,354 3,250 3,643 0,390 0,969 1,554 0,57912 0,184 0,315 1,023 0,737 0,320 2,133 14,087 1,587 0,870 0,740 0,240 0,258 0,38413 0,105 0,164 0,688 0,616 0,558 1,736 6,574 0,239 0,520 0,442 0,853 0,231 0,05514 0,788 0,539 0,327 1,022 1,532 4,963 14,444 2,423 0,772 1,695 0,509 0,724 0,04415 1,133 0,638 1,412 3,245 4,230 4,079 26,112 3,240 4,054 1,257 1,555 0,696 1,039

Tabela 53 – Valores dos descritores de Fourier (Magnitude) para imagens da Península Ibérica segmentadas pelo método da decomposição DWF

f -7 -6 -5 -4 -3 -2 -1 2 3 4 5 6 71 -4,703 -0,755 -5,143 0,805 -1,874 -2,076 3,589 1,724 1,626 0,743 3,062 1,199 3,5892 21,061 16,271 14,173 12,825 10,042 4,411 -6,553 -7,017 -10,016 -13,130 -18,909 -22,802 -6,5533 -7,229 -8,787 -3,590 -2,168 -3,175 -4,693 1,821 6,808 2,334 7,206 4,896 11,089 1,8214 1,634 0,327 2,148 -1,412 -1,198 -1,247 2,083 3,076 -1,063 1,333 -0,038 1,521 2,0835 -3,971 -4,498 -5,337 -1,182 -3,673 -1,301 3,421 1,569 0,058 1,323 2,168 5,038 3,4216 -10,604 -6,722 -7,795 -4,596 -5,305 -5,259 4,349 2,063 7,372 5,327 4,372 10,837 4,3497 -7,465 -2,678 -6,620 -2,006 -4,922 -2,929 3,729 2,375 4,275 3,002 6,724 5,241 3,7298 -8,491 -4,290 -1,068 -2,411 0,070 0,053 3,764 2,438 1,202 3,435 7,450 4,393 3,7649 -13,750 -14,916 -12,243 -10,339 -9,018 -4,844 1,934 6,799 8,740 13,681 11,589 17,595 1,934

10 1,075 1,341 3,671 4,565 -0,663 0,595 -3,936 -1,251 -2,115 -0,854 -4,605 -4,184 -3,93611 -2,891 0,930 -0,687 -2,547 -2,819 -1,508 -2,436 0,746 2,808 3,725 1,298 1,066 -2,43612 3,193 0,679 0,084 2,193 1,875 -1,275 -2,223 -3,493 1,211 -2,868 -3,904 -0,806 -2,22313 1,051 -1,869 0,495 -1,923 -2,900 -2,546 -1,219 -2,225 -0,209 3,368 2,244 0,260 -1,21914 -4,517 -2,723 -4,118 -2,386 -0,600 -1,961 -1,108 0,751 -0,693 1,782 3,007 0,779 -1,10815 0,788 1,184 0,723 -2,173 -0,336 -1,744 -0,622 2,761 0,857 -2,639 -0,398 -0,048 -0,622

Tabela 54 - Valores dos descritores de Fourier (Fase) para imagens da Península Ibérica segmentadas pelo método da decomposição DWF

imagem Orientação Excentricidade Compacticidade Solidez Rectangularidade Convexidade16 65,5281 0,5021 43,3076 0,735 0,5476 0,691717 -33,1758 0,8071 67,5095 0,7793 0,5092 0,549918 -55,6406 0,6451 38,2371 0,745 0,5569 0,739819 -79,3542 0,4633 121,081 0,5497 0,4941 0,486320 52,958 0,6063 103,0512 0,686 0,5998 0,463621 2,328 0,4649 181,7011 0,6078 0,474 0,377222 -60,5379 0,644 42,6363 0,826 0,6431 0,678523 -43,9112 0,211 81,5738 0,6949 0,6081 0,516724 -77,6939 0,5846 69,735 0,7231 0,7109 0,561125 -42,4391 0,3148 38,0246 0,7921 0,5611 0,72726 -36,3205 0,4918 57,5985 0,7091 0,5443 0,647627 -22,276 0,5722 66,2291 0,7401 0,5321 0,57428 -62,6225 0,7736 58,4307 0,6928 0,4545 0,615229 -44,9212 0,5653 56,8125 0,6992 0,5073 0,647330 -65,5307 0,6806 92,4153 0,6491 0,6491 0,5188

Tabela 55 - Valores dos descritores para imagens de África

Page 132: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

118

f -7 -6 -5 -4 -3 -2 -1 2 3 4 5 6 716 0,337 1,888 0,464 2,571 4,654 7,768 40,438 5,384 1,857 0,785 4,044 0,904 0,54317 0,018 0,107 0,082 0,335 0,427 1,155 4,136 0,164 0,182 0,369 0,159 0,197 0,13018 0,087 0,332 0,193 0,209 0,492 0,729 6,909 1,153 0,371 0,380 0,311 0,318 0,21719 0,273 0,395 0,304 1,292 1,000 1,267 7,752 0,013 1,090 1,492 0,755 0,237 0,63620 0,584 0,124 0,048 1,322 2,313 2,077 8,103 1,272 1,661 0,574 0,870 0,597 0,28221 1,714 1,064 1,712 5,381 4,105 3,530 24,770 6,285 0,323 2,476 3,155 1,201 0,52822 0,222 0,430 0,185 0,143 0,415 1,041 5,827 0,693 0,269 0,122 0,346 0,275 0,15123 0,424 0,399 0,885 0,607 1,697 2,744 11,770 1,543 2,036 0,114 0,930 0,105 0,25524 0,223 0,597 0,306 1,182 3,271 9,605 16,695 4,257 2,573 2,648 1,731 0,989 0,70125 0,484 0,841 0,074 1,619 1,577 2,253 22,730 4,147 0,702 1,629 0,920 0,032 0,14526 0,189 0,221 0,059 0,196 0,647 0,550 4,657 0,770 0,622 0,233 0,266 0,286 0,04027 0,091 0,255 0,484 0,701 0,517 1,727 9,441 2,110 0,433 0,467 0,457 0,357 0,23128 0,264 0,036 0,279 0,371 0,325 0,670 6,218 0,434 0,572 0,275 0,439 0,209 0,18229 0,111 0,295 0,258 0,507 0,445 0,227 6,682 1,231 0,393 0,599 0,239 0,068 0,18230 2,914 4,861 11,335 8,347 16,388 13,562 89,990 7,154 22,682 7,264 7,293 5,444 1,372

Tabela 56 - Valores dos descritores de Fourier (Magnitude) para imagens de África segmentadas pelo método da decomposição DWF

f -7 -6 -5 -4 -3 -2 -1 2 3 4 5 6 716 3,156 2,564 4,313 2,257 4,484 0,351 -0,824 -4,062 -2,978 -5,888 -5,100 -3,195 -4,63317 -17,733 -12,480 -10,082 -6,056 -8,314 -4,597 -4,131 1,340 9,522 6,779 9,911 13,786 12,62918 21,474 21,339 14,081 11,021 10,166 5,478 1,306 -8,368 -12,085 -13,371 -16,924 -17,719 -24,35619 0,141 3,019 -2,456 -1,697 -2,334 0,934 -0,757 -2,165 -1,083 -1,359 -0,525 -0,426 -2,88820 1,264 -1,015 1,104 -2,490 -2,054 0,352 -1,641 1,637 2,429 -2,227 0,428 0,695 -3,70021 -1,045 -3,386 -2,522 -0,143 -2,418 -2,456 -3,041 -1,835 0,446 2,255 -2,196 -0,718 0,50022 22,883 15,786 14,025 8,695 8,852 4,247 1,044 -7,707 -11,683 -14,150 -14,790 -16,830 -23,50123 10,216 6,626 4,643 8,976 3,356 2,053 -0,915 0,001 -6,539 -7,288 -7,364 -7,302 -9,55924 3,170 3,720 -0,579 3,525 -0,443 -0,640 -2,140 0,751 1,788 -3,210 -0,092 -0,634 1,09725 -17,015 -15,488 -9,022 -9,441 -5,108 -5,690 -3,865 1,877 8,760 7,256 10,911 12,277 12,97826 -15,830 -13,537 -10,426 -6,784 -6,710 -6,731 -4,476 3,193 4,155 10,647 7,745 11,025 13,55627 -11,145 -9,714 -8,900 -5,521 -2,943 -4,294 -3,028 0,415 6,738 3,757 6,308 8,463 6,46828 16,277 15,395 11,301 10,819 9,160 3,560 1,118 -6,672 -10,214 -11,902 -13,729 -18,734 -18,20329 -22,060 -19,418 -16,403 -12,699 -6,865 -6,437 -4,504 3,056 10,619 10,368 14,308 15,113 17,95130 -22,321 -20,863 -13,120 -9,700 -11,755 -5,717 -5,177 6,988 11,933 15,373 13,487 19,390 23,023

Tabela 57 - Valores dos descritores de Fourier (Fase) para imagens de África segmentadas pelo método da decomposição DWF

imagem Orientação Excentricidade Compacticidade Solidez Rectangularidade Convexidade31 -81,0182 0,7445 54,9321 0,7288 0,4541 0,675532 38,2025 0,7932 83,9813 0,5945 0,4727 0,555833 -75,4293 0,6417 17,632 0,9600 0,9124 0,962834 -38,1378 0,5985 83,5679 0,6702 0,5862 0,52235 36,064 0,8532 100,4464 0,5263 0,3845 0,546836 88,9531 0,581 86,8745 0,7017 0,5432 0,502937 -0,1266 0,8623 22,933 0,9461 0,8816 0,904338 -81,7823 0,7607 33,1771 0,8111 0,5408 0,820939 86,009 0,7515 40,2102 0,7116 0,4388 0,795440 -80,0803 0,7656 33,5946 0,7623 0,4631 0,853641 79,856 0,6565 25,4287 0,8566 0,6101 0,88442 -87,4766 0,779 24,8165 0,8656 0,5363 0,926843 -81,4655 0,6675 23,7846 0,8388 0,5903 0,889844 80,1635 0,6735 20,0192 0,8931 0,7342 0,925145 86,9103 0,7465 31,3047 0,7541 0,4842 0,866

Tabela 58 - Valores dos descritores para imagens da América do Sul

Page 133: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

119

f -7 -6 -5 -4 -3 -2 -1 2 3 4 5 6 731 0,144 0,120 0,165 0,193 0,211 0,259 3,461 0,712 0,432 0,125 0,147 0,028 0,07132 0,014 0,112 0,275 0,490 0,653 1,585 3,250 0,696 0,699 0,335 0,298 0,154 0,03733 0,205 0,200 0,141 0,287 0,457 0,262 10,095 0,416 0,730 0,297 0,325 0,223 0,08634 0,503 0,322 1,050 0,820 1,668 2,204 11,291 0,470 1,534 0,431 0,420 0,397 0,13935 0,078 0,022 0,056 0,282 0,193 1,074 1,814 0,376 0,249 0,210 0,103 0,058 0,15836 0,706 0,406 0,390 0,913 0,399 1,432 6,611 0,976 0,646 0,740 0,132 0,419 0,22337 0,043 0,060 0,097 0,175 0,103 0,232 3,333 0,195 0,238 0,094 0,127 0,070 0,05038 0,080 0,095 0,136 0,257 0,186 0,279 4,105 0,800 0,124 0,037 0,029 0,152 0,02939 0,057 0,104 0,087 0,226 0,171 0,398 3,618 0,907 0,014 0,094 0,055 0,162 0,02840 0,088 0,078 0,077 0,267 0,175 0,227 4,126 0,922 0,209 0,076 0,063 0,125 0,01141 0,107 0,197 0,033 0,519 0,327 0,380 6,191 1,187 0,269 0,343 0,157 0,071 0,08942 0,062 0,046 0,103 0,306 0,229 0,278 4,250 0,821 0,092 0,076 0,006 0,094 0,02843 0,099 0,029 0,110 0,589 0,632 0,802 7,012 1,052 0,063 0,424 0,193 0,076 0,10444 0,127 0,143 0,076 0,272 0,288 0,237 7,257 0,561 0,233 0,291 0,200 0,110 0,08245 0,078 0,094 0,133 0,272 0,209 0,392 4,420 1,046 0,096 0,071 0,098 0,169 0,039

Tabela 59 - Valores dos descritores de Fourier (Magnitude) para imagens da América do Sul segmentadas pelo método da decomposição DWF

f -7 -6 -5 -4 -3 -2 -1 2 3 4 5 6 731 16,664 14,730 9,291 7,413 3,694 6,585 0,145 -7,552 -7,253 -9,853 -8,093 -16,480 -13,98132 -6,646 -5,565 -6,404 -5,636 -3,934 -4,451 -1,503 -0,122 5,483 3,746 4,374 6,307 4,24433 17,902 16,183 11,140 7,350 6,716 4,699 0,405 -6,330 -4,261 -9,122 -10,758 -11,403 -14,21234 -13,093 -9,472 -8,803 -5,098 -5,736 -5,786 -3,787 4,574 1,567 3,884 6,515 11,608 11,02435 -8,945 -7,797 -6,527 -7,069 -4,890 -4,886 -1,807 0,284 5,537 4,108 6,251 4,108 5,11136 6,857 8,114 5,965 2,357 2,745 0,336 -0,716 -5,081 -4,079 -2,362 -2,935 -9,499 -6,77437 -14,869 -13,229 -11,968 -4,132 -5,654 -1,636 -3,009 3,301 5,396 5,515 8,063 7,826 10,79738 16,646 16,662 14,931 8,530 7,902 4,640 0,358 -7,673 -7,314 -13,011 -11,887 -19,403 -17,06339 15,082 15,024 13,706 7,474 7,044 4,227 0,011 -7,237 -6,554 -11,862 -14,627 -17,856 -20,86440 16,343 15,906 14,402 8,266 7,273 4,675 0,342 -7,722 -7,457 -12,354 -15,042 -19,322 -21,32041 7,633 9,980 4,064 4,138 2,168 5,273 -0,742 -5,203 -6,423 -4,398 -7,565 -4,045 -7,60642 20,389 14,537 13,490 7,527 6,620 4,178 0,104 -7,214 -6,257 -11,384 -13,417 -18,293 -21,05543 21,484 14,348 15,135 8,521 7,609 4,763 0,434 -7,428 -7,101 -11,339 -12,369 -13,256 -17,60844 13,737 15,006 9,167 6,179 6,195 2,891 -0,291 -6,767 -9,309 -9,457 -7,945 -15,310 -13,27045 20,993 14,559 13,481 7,428 6,652 4,457 0,042 -7,324 -7,738 -12,011 -14,446 -18,041 -19,673

Tabela 60 - Valores dos descritores de Fourier (Fase) para imagens da América do Sul segmentadas pelo método da decomposição DWF

Anexo D5 - Resultados dos descritores para formas obtidas usando o método de segmentação de filtros de textura

imagem Orientação Excentricidade Compacticidade Solidez Rectangularidade Convexidade1 16,1677 0,6314 43,2882 0,8258 0,6652 0,65862 28,9926 0,684 39,5105 0,8317 0,6709 0,69123 -2,6815 0,7921 78,4941 0,855 0,8527 0,49794 36,8052 0,5263 86,3053 0,6781 0,5391 0,51345 25,7641 0,6998 81,1689 0,8352 0,6425 0,49496 26,0643 0,6051 76,4521 0,7962 0,6049 0,50577 34,3429 0,6765 26,658 0,9149 0,7005 0,82818 16,7828 0,6514 65,0626 0,8235 0,6996 0,53829 24,0376 0,517 45,5576 0,8602 0,7919 0,6307

10 30,6868 0,6803 34,2828 0,8548 0,6288 0,748211 13,775 0,5089 90,3462 0,7222 0,6746 0,479912 28,7616 0,6334 28,5249 0,9179 0,8111 0,776913 18,4684 0,7013 33,3282 0,923 0,7977 0,720214 36,3435 0,4852 33,7898 0,883 0,8394 0,722515 -27,9185 0,7017 110,27 0,7102 0,6428 0,445

Tabela 61 - Valores dos descritores para imagens da Península Ibérica

Page 134: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

120

f -7 -6 -5 -4 -3 -2 -1 2 3 4 5 6 71 0,330 0,194 0,205 0,304 0,176 0,963 6,491 0,365 0,280 0,281 0,471 0,088 0,0782 0,339 0,139 0,577 0,443 0,230 2,009 7,603 0,982 0,064 0,768 0,277 0,204 0,3243 0,120 0,278 0,173 0,005 0,860 1,354 4,217 0,602 0,242 0,260 0,299 0,105 0,2364 0,031 0,412 0,229 0,643 0,743 2,012 6,707 1,407 0,873 0,291 0,327 0,533 0,2005 0,092 0,198 0,048 0,457 0,723 1,023 5,433 0,576 0,478 0,243 0,257 0,099 0,1006 0,282 0,187 0,448 0,436 0,744 1,457 6,532 0,391 0,630 0,645 0,143 0,255 0,0997 0,054 0,030 0,228 0,248 0,171 0,688 6,232 0,688 0,619 0,048 0,128 0,086 0,0678 0,063 0,220 0,361 0,400 0,173 1,770 5,724 0,318 0,702 0,409 0,298 0,087 0,2639 0,972 1,787 1,076 0,935 1,319 7,559 25,488 1,685 1,861 2,060 0,831 1,517 0,404

10 0,110 0,083 0,234 0,158 0,110 0,213 6,208 0,822 0,379 0,177 0,263 0,123 0,06911 0,614 0,302 0,692 0,802 0,196 2,687 12,042 1,501 1,436 0,189 0,323 0,160 0,75012 0,094 0,073 0,383 0,431 0,391 0,666 7,409 0,327 0,657 0,176 0,236 0,204 0,08313 0,174 0,065 0,397 0,456 0,333 1,653 5,262 0,103 0,592 0,454 0,117 0,198 0,07814 0,782 0,436 0,722 0,442 0,732 4,463 17,572 1,068 2,237 0,183 0,722 0,326 0,15815 0,389 1,591 0,741 3,220 2,242 6,954 22,354 3,713 3,619 0,561 0,267 0,148 0,963

Tabela 62 - Valores dos descritores de Fourier (Magnitude) para imagens da Península Ibérica segmentadas pelo método dos filtros de textura

f -7 -6 -5 -4 -3 -2 -1 2 3 4 5 6 71 -10,381 -5,588 -9,176 -4,035 -5,933 -4,196 -2,507 4,469 4,869 8,354 6,060 4,761 8,1572 -0,415 -0,946 1,471 3,804 -0,771 -0,111 -1,443 -3,312 -0,603 -0,484 -3,549 -2,175 -2,2793 -5,233 -7,775 -6,574 -1,630 -4,083 -4,044 -2,984 1,600 -0,039 0,792 6,353 2,331 2,9604 7,561 4,292 5,859 5,591 1,010 1,532 -0,496 -4,608 -2,552 -2,574 -7,981 -6,883 -10,1075 -10,015 -4,350 -7,572 -7,800 -1,501 -3,376 -2,693 -0,270 5,192 4,255 4,131 9,176 8,0866 -6,357 -4,823 -5,901 -7,413 -2,642 -4,054 -2,856 3,581 6,789 5,321 3,997 7,976 9,7947 4,673 1,262 -0,123 3,990 1,639 -1,741 -1,917 -2,636 -3,979 -0,970 -3,480 -4,790 -3,6318 -3,422 -5,158 -2,743 -4,717 0,369 -3,326 -2,492 0,249 4,766 3,070 6,110 8,449 6,8389 -0,272 -2,931 -4,598 1,411 1,763 -3,138 -2,465 0,459 4,299 -1,007 2,247 -0,020 4,224

10 -6,090 -5,893 -6,184 -1,978 -4,815 -1,296 -2,002 3,761 2,301 0,988 2,552 3,857 7,09111 -21,118 -15,240 -12,152 -13,246 -7,515 -6,603 -4,387 4,063 9,869 11,392 14,686 20,252 18,61212 2,609 0,011 -1,877 3,094 -0,189 -2,413 -2,247 -2,209 -2,775 2,584 -1,111 -3,292 -0,61413 -6,372 -3,123 -5,318 -1,007 -2,494 -3,938 -2,740 2,579 -0,144 5,450 3,003 2,192 6,92814 -10,853 -5,561 -7,872 -4,456 -3,396 -5,059 -3,491 2,625 1,246 1,744 4,071 8,461 8,79615 -1,891 0,880 2,765 -1,259 0,888 -1,902 -1,656 -1,085 2,399 -1,541 -2,902 2,401 -0,068Tabela 63 - Valores dos descritores de Fourier (Fase) para imagens da Península Ibérica segmentadas pelo método dos filtros de

textura

imagem Orientação Excentricidade Compacticidade Solidez Rectangularidade Convexidade16 65,5281 0,5021 43,3076 0,735 0,5476 0,691717 -33,1758 0,8071 67,5095 0,7793 0,5092 0,549918 -55,6406 0,6451 38,2371 0,745 0,5569 0,739819 -79,3542 0,4633 121,081 0,5497 0,4941 0,486320 52,958 0,6063 103,0512 0,686 0,5998 0,463621 2,328 0,4649 181,7011 0,6078 0,474 0,377222 -60,5379 0,644 42,6363 0,826 0,6431 0,678523 -43,9112 0,211 81,5738 0,6949 0,6081 0,516724 -77,6939 0,5846 69,735 0,7231 0,7109 0,561125 -42,4391 0,3148 38,0246 0,7921 0,5611 0,72726 -36,3205 0,4918 57,5985 0,7091 0,5443 0,647627 -22,276 0,5722 66,2291 0,7401 0,5321 0,57428 -62,6225 0,7736 58,4307 0,6928 0,4545 0,615229 -44,9212 0,5653 56,8125 0,6992 0,5073 0,647330 -65,5307 0,6806 92,4153 0,6491 0,6491 0,5188

Tabela 64 - Valores dos descritores para imagens de África

Page 135: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

121

f -7 -6 -5 -4 -3 -2 -1 2 3 4 5 6 716 0,505 0,410 0,544 0,075 1,635 2,395 12,822 1,924 1,839 0,919 0,145 0,336 0,19017 0,098 0,208 0,060 0,352 0,104 0,488 3,287 0,281 0,213 0,040 0,153 0,157 0,07018 0,180 0,263 0,136 0,691 0,711 0,753 9,405 1,216 0,415 0,514 0,267 0,103 0,09519 1,315 0,712 1,892 0,990 2,586 5,927 24,641 3,778 0,865 2,108 0,757 1,019 1,06620 0,283 0,374 0,588 0,476 0,595 2,569 3,863 1,746 0,465 0,067 0,113 0,273 0,67021 0,296 0,132 0,660 0,130 1,213 0,799 3,781 0,267 0,186 0,584 0,304 0,400 0,26922 0,287 0,145 0,544 0,371 0,761 1,065 8,264 0,924 0,726 0,377 0,212 0,234 0,09923 0,244 0,634 0,095 0,595 1,951 2,564 9,172 1,629 1,820 0,160 0,466 0,048 0,28524 0,080 0,188 0,167 0,249 0,559 0,466 5,871 0,285 0,353 0,118 0,361 0,107 0,01025 0,237 0,300 0,410 0,538 0,810 1,801 9,701 2,046 0,579 0,099 0,679 0,182 0,25126 0,132 0,108 0,214 0,279 0,819 0,677 4,374 0,510 0,347 0,394 0,265 0,272 0,06027 0,122 0,164 0,188 0,234 0,625 0,508 4,345 0,785 0,290 0,432 0,257 0,051 0,06328 0,147 0,401 0,093 0,040 0,372 0,762 5,102 0,445 0,503 0,259 0,259 0,243 0,05429 0,117 0,106 0,498 0,141 0,760 1,017 4,957 0,536 0,754 0,173 0,288 0,230 0,09330 0,238 0,121 0,589 0,102 0,958 1,163 7,889 0,778 0,252 0,457 0,207 0,265 0,307

Tabela 65 - Valores dos descritores de Fourier (Magnitude) para imagens de África segmentadas pelo método dos filtros de textura

f -7 -6 -5 -4 -3 -2 -1 2 3 4 5 6 716 -15,528 -16,996 -13,530 -7,029 -6,879 -6,069 -4,310 2,930 4,202 9,267 13,374 13,878 13,54017 -16,700 -13,755 -14,399 -11,482 -10,316 -2,240 -4,123 3,800 6,536 8,712 15,109 11,696 16,33518 -20,728 -15,292 -16,860 -14,140 -9,098 -7,518 -5,005 4,162 6,647 12,288 17,441 19,189 18,85919 17,760 19,131 12,742 12,197 8,850 3,805 1,178 -8,076 -11,746 -12,579 -15,554 -16,272 -21,07720 6,914 6,659 3,976 1,940 1,015 -1,222 -1,247 -3,273 -5,552 -3,289 -2,929 -7,444 -8,77121 -21,295 -14,330 -10,711 -13,665 -9,180 -6,761 -4,164 3,901 5,333 13,335 15,062 14,969 18,12622 19,388 14,046 11,610 10,161 8,009 4,240 0,790 -7,414 -10,782 -10,942 -12,766 -17,141 -17,65123 -6,329 -6,108 -3,450 -5,011 -3,809 -4,402 -1,201 0,745 0,666 3,775 0,413 1,024 5,24824 20,305 13,811 10,449 9,470 7,416 2,899 0,832 -7,466 -9,625 -11,613 -12,310 -17,117 -16,19925 -2,604 -7,283 -5,844 -3,024 -1,503 -3,499 -2,443 -1,016 -0,093 3,577 3,401 4,578 7,93126 -13,412 -11,026 -7,233 -5,727 -6,026 -5,624 -4,070 3,018 3,451 9,603 11,731 9,478 12,89127 -11,736 -7,471 -6,762 -8,784 -5,023 -3,633 -3,588 1,568 1,657 7,361 4,537 6,177 9,09028 -18,702 -19,331 -15,383 -11,831 -7,042 -7,140 -4,553 3,395 11,376 10,701 15,048 17,385 22,89529 -11,557 -13,485 -12,922 -9,577 -6,597 -6,369 -4,113 2,140 4,193 6,132 11,370 10,620 16,69730 18,060 13,208 8,561 6,471 6,331 2,038 0,340 -6,403 -9,183 -9,099 -10,642 -11,153 -16,146

Tabela 66 - Valores dos descritores de Fourier (Fase) para imagens de África segmentadas pelo método dos filtros de textura

imagem Orientação Excentricidade Compacticidade Solidez Rectangularidade Convexidade31 -76,4357 0,8177 120,7892 0,5602 0,5131 0,4907 32 37,344 0,8359 173,6492 0,6089 0,4358 0,3912 33 -79,836 0,6867 132,1413 0,5568 0,4331 0,4741 34 -40,9024 0,6782 110,6379 0,7379 0,6422 0,4368 35 75,2888 0,7327 46,6812 0,7099 0,5305 0,7063 36 -76,4932 0,7458 68,1804 0,7703 0,6898 0,5428 37 78,7004 0,6565 63,2538 0,5667 0,3426 0,7357 38 -86,5727 0,6336 45,5194 0,8314 0,5525 0,6834 39 -85,8514 0,733 29,789 0,79 0,4668 0,9046 40 -83,4873 0,7873 37,3588 0,7394 0,4607 0,8214 41 87,0605 0,7168 51,1732 0,7409 0,5331 0,6904 42 -85,1119 0,7733 38,7465 0,746 0,4695 0,7956 43 -88,494 0,8104 36,7105 0,7144 0,4962 0,8138 44 -74,7367 0,766 43,2124 0,7012 0,4485 0,7648 45 86,2372 0,7408 38,5598 0,7163 0,4423 0,816

Tabela 67 - Valores dos descritores para imagens da América do Sul

Page 136: fenix.tecnico.ulisboa.pt€¦ · Os mapas históricos em formato digital disponíveis nas bibliotecas europeias, na sua maioria, não estão catalogados segundo as suas localizações

122

f -7 -6 -5 -4 -3 -2 -1 2 3 4 5 6 731 0,330 0,194 0,205 0,304 0,176 0,963 6,491 0,365 0,280 0,281 0,471 0,088 0,07832 0,339 0,139 0,577 0,443 0,230 2,009 7,603 0,982 0,064 0,768 0,277 0,204 0,32433 0,120 0,278 0,173 0,005 0,860 1,354 4,217 0,602 0,242 0,260 0,299 0,105 0,23634 0,031 0,412 0,229 0,643 0,743 2,012 6,707 1,407 0,873 0,291 0,327 0,533 0,20035 0,092 0,198 0,048 0,457 0,723 1,023 5,433 0,576 0,478 0,243 0,257 0,099 0,10036 0,282 0,187 0,448 0,436 0,744 1,457 6,532 0,391 0,630 0,645 0,143 0,255 0,09937 0,054 0,030 0,228 0,248 0,171 0,688 6,232 0,688 0,619 0,048 0,128 0,086 0,06738 0,063 0,220 0,361 0,400 0,173 1,770 5,724 0,318 0,702 0,409 0,298 0,087 0,26339 0,972 1,787 1,076 0,935 1,319 7,559 25,488 1,685 1,861 2,060 0,831 1,517 0,40440 0,110 0,083 0,234 0,158 0,110 0,213 6,208 0,822 0,379 0,177 0,263 0,123 0,06941 0,614 0,302 0,692 0,802 0,196 2,687 12,042 1,501 1,436 0,189 0,323 0,160 0,75042 0,094 0,073 0,383 0,431 0,391 0,666 7,409 0,327 0,657 0,176 0,236 0,204 0,08343 0,174 0,065 0,397 0,456 0,333 1,653 5,262 0,103 0,592 0,454 0,117 0,198 0,07844 0,782 0,436 0,722 0,442 0,732 4,463 17,572 1,068 2,237 0,183 0,722 0,326 0,15845 0,389 1,591 0,741 3,220 2,242 6,954 22,354 3,713 3,619 0,561 0,267 0,148 0,963Tabela 68 - Valores dos descritores de Fourier (Magnitude) para imagens da América do Sul segmentadas pelo método dos filtros

de textura

f -7 -6 -5 -4 -3 -2 -1 2 3 4 5 6 731 -10,381 -5,588 -9,176 -4,035 -5,933 -4,196 -2,507 4,469 4,869 8,354 6,060 4,761 8,15732 -0,415 -0,946 1,471 3,804 -0,771 -0,111 -1,443 -3,312 -0,603 -0,484 -3,549 -2,175 -2,27933 -5,233 -7,775 -6,574 -1,630 -4,083 -4,044 -2,984 1,600 -0,039 0,792 6,353 2,331 2,96034 7,561 4,292 5,859 5,591 1,010 1,532 -0,496 -4,608 -2,552 -2,574 -7,981 -6,883 -10,10735 -10,015 -4,350 -7,572 -7,800 -1,501 -3,376 -2,693 -0,270 5,192 4,255 4,131 9,176 8,08636 -6,357 -4,823 -5,901 -7,413 -2,642 -4,054 -2,856 3,581 6,789 5,321 3,997 7,976 9,79437 4,673 1,262 -0,123 3,990 1,639 -1,741 -1,917 -2,636 -3,979 -0,970 -3,480 -4,790 -3,63138 -3,422 -5,158 -2,743 -4,717 0,369 -3,326 -2,492 0,249 4,766 3,070 6,110 8,449 6,83839 -0,272 -2,931 -4,598 1,411 1,763 -3,138 -2,465 0,459 4,299 -1,007 2,247 -0,020 4,22440 -6,090 -5,893 -6,184 -1,978 -4,815 -1,296 -2,002 3,761 2,301 0,988 2,552 3,857 7,09141 -21,118 -15,240 -12,152 -13,246 -7,515 -6,603 -4,387 4,063 9,869 11,392 14,686 20,252 18,61242 2,609 0,011 -1,877 3,094 -0,189 -2,413 -2,247 -2,209 -2,775 2,584 -1,111 -3,292 -0,61443 -6,372 -3,123 -5,318 -1,007 -2,494 -3,938 -2,740 2,579 -0,144 5,450 3,003 2,192 6,92844 -10,853 -5,561 -7,872 -4,456 -3,396 -5,059 -3,491 2,625 1,246 1,744 4,071 8,461 8,79645 -1,891 0,880 2,765 -1,259 0,888 -1,902 -1,656 -1,085 2,399 -1,541 -2,902 2,401 -0,068

Tabela 69 - Valores dos descritores de Fourier (Fase) para imagens da América do Sul segmentadas pelo método dos filtros de textura

Anexo D6 – Valores dos descritores para imagens de referência

imagem Orientação Excentricidade Compacticidade Solidez Rectangularidade ConvexidadePenínsula Ibérica 8,8074 0,7644 31,0806 0,8612 0,624 0,8092

África -53,866 0,7726 33,5852 0,7912 0,508 0,7721América do Sul 84,5177 0,7442 46,8548 0,7775 0,4929 0,7019

Tabela 70 – Valores dos descritores simples das imagens de referência

f -7 -6 -5 -4 -3 -2 -1 2 3 4 5 6 7Península Ibérica 0.018 0.038 0.046 0.118 0.196 0.353 1.371 0.134 0.138 0.050 0.124 0.042 0.015

África 0.045 0.030 0.051 0.114 0.279 0.741 2.247 0.313 0.201 0.301 0.137 0.059 0.033América do Sul 0.288 0.177 0.276 1.089 0.491 0.761 4.927 1.025 0.238 0.179 0.234 0.273 0.233

Tabela 71 – Valores dos descritores de Fourier (Magnitude) das imagens de referência

f -7 -6 -5 -4 -3 -2 -1 2 3 4 5 6 7Península Ibérica 17.80 12.78 10.40 6.66 4.66 6.78 -0.23 -6.47 -6.83 -10.58 -13.20 -11.16 -18.53

África 18.97 14.15 10.92 8.91 6.09 7.70 0.35 -4.04 -8.91 -11.90 -10.43 -18.08 -15.43América do Sul -8.47 -9.33 -3.37 -6.92 -2.41 -4.65 -3.52 5.57 2.83 7.63 6.89 8.97 7.09

Tabela 72 - Valores dos descritores de Fourier (Fase) das imagens de referência