2 - o esboÇo primÁrio bruto -...

11
A DISCRIMINAÇÃO DE TEXTURAS USANDO UMA REPRESENTAÇÃO SIMBÕLICA PARA DADOS VISUAIS Antonio Miguel Vieira Monteiro Flávio Roberto Dias Velasco Ministério da Ciência e Tecnologia - MCT Instituto de Pesquisas Espaciais - INPE Caixa Postal 515 - 12201 - São José dos Campos - SP 1 - INTRODUÇÃO A análise de textura tem-se mostrado fundamental para a percepção de regiões e superfícies em imagens. Por exemplo, nõs facilmente distinguimos entre um tecido de lã e um de algodão, na mesma coloração. Na análise de imagens de satélite, propriedades de textura são sempre usadas pelos especialistas, direta ou indiretamente, quando classificando as diferenciadas regiões em uma imagem. Este fato levou a muitos estudos e algoritmos propondo reconhecimento e descrição de texturas por computador. No entanto, como poucas definições de textura têm sido dadas, e nenhuma precisamente define o problema, as técnicas de discriminação da textura são grandemente "ad hoc" (Brady, 1982). Duas são as abordagens principais para a discriminação de textura: a estatística e a estrutural. As propriedades para a caracterização da textura, têm sido derivadas no domínio estatístico, usando principalmente matrizes de coocorrência. ( Haralick et al. (1973) e Conners et al. (1984)). Processos mais recentes sugerem que a extração de características locais de textura, e as relações entre as regiões que ficam determinadas por estas características, levariam a definição de elementos de textura, ou primitivas de textura. Estas primitivas teriam papel central na percepção de regiões e/ou superfícies de texturas diferenciadas. A idéia deste trabalho é utilizar as primitivas definidas no Esboço Primário (Marr, 1978) como elementos de textura. As texturas, neste enfoque, são caracterizadas por estatísticas e relações entre as primitivas. A organização deste trabalho apresenta na secção 2 uma descrição sumária da proposta de Marr para descrição de imagens, na secção 3 alguns experimentos de discriminação de texturas são apresentados sendo então analisados na secção 4. 2 - O ESBOÇO PRIMÁRIO BRUTO A representação mais comumente encontrada para imagens é uma matriz de inteiros, onde cada elemento é chamado pixel. Para realizar tarefas visuais por máquina esta é uma representação "pobre", na medida em que mistura as informações sobre a estrutura física da cena imageada. SUPORTE FINANCEIRO: SID INFORMÁTICA S/A - PROJETO ESTRA 123

Upload: lamdan

Post on 09-Nov-2018

218 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 2 - O ESBOÇO PRIMÁRIO BRUTO - mtc-m12.sid.inpe.brmtc-m12.sid.inpe.br/col/sid.inpe.br/iris@1912/2005/07.18.21.14.21... · no Esboço Primário ... na medida em que mistura as informações

A DISCRIMINAÇÃO DE TEXTURAS USANDO UMA REPRESENTAÇÃO SIMBÕLICA PARA DADOS VISUAIS

Antonio Miguel Vieira Monteiro Flávio Roberto Dias Velasco

Ministério da Ciência e Tecnologia - MCT Instituto de Pesquisas Espaciais - INPE

Caixa Postal 515 - 12201 - São José dos Campos - SP

1 - INTRODUÇÃO

A análise de textura tem-se mostrado fundamental para a percepção de regiões e superfícies em imagens. Por exemplo, nõs facilmente distinguimos entre um tecido de lã e um de algodão, na mesma coloração. Na análise de imagens de satélite, propriedades de textura são sempre usadas pelos especialistas, direta ou indiretamente, quando classificando as diferenciadas regiões em uma imagem. Este fato levou a muitos estudos e algoritmos propondo reconhecimento e descrição de texturas por computador. No entanto, como poucas definições de textura têm sido dadas, e nenhuma precisamente define o problema, as técnicas de discriminação da textura são grandemente "ad hoc" (Brady, 1982).

Duas são as abordagens principais para a discriminação de textura: a estatística e a estrutural. As propriedades para a caracterização da textura, têm sido derivadas no domínio estatístico, usando principalmente matrizes de coocorrência. ( Haralick et al. (1973) e Conners et al. (1984)).

Processos mais recentes sugerem que a extração de características locais de textura, e as relações entre as regiões que ficam determinadas por estas características, levariam a definição de elementos de textura, ou primitivas de textura. Estas primitivas teriam papel central na percepção de regiões e/ou superfícies de texturas diferenciadas.

A idéia deste trabalho é utilizar as primitivas definidas no Esboço Primário (Marr, 1978) como elementos de textura. As texturas, neste enfoque, são caracterizadas por estatísticas e relações entre as primitivas. A organização deste trabalho apresenta na secção 2 uma descrição sumária da proposta de Marr para descrição de imagens, na secção 3 alguns experimentos de discriminação de texturas são apresentados sendo então analisados na secção 4.

2 - O ESBOÇO PRIMÁRIO BRUTO

A representação mais comumente encontrada para imagens é uma matriz de inteiros, onde cada elemento é chamado pixel. Para realizar tarefas visuais por máquina esta é uma representação "pobre", na medida em que mistura as informações sobre a estrutura física da cena imageada.

SUPORTE FINANCEIRO: SID INFORMÁTICA S/A - PROJETO ESTRA

123

Page 2: 2 - O ESBOÇO PRIMÁRIO BRUTO - mtc-m12.sid.inpe.brmtc-m12.sid.inpe.br/col/sid.inpe.br/iris@1912/2005/07.18.21.14.21... · no Esboço Primário ... na medida em que mistura as informações

Quando vemos uma cena, existe uma variação de energia luminosa que é "capturada" pelos elementos da retina. O objetivo de uma representação primãria para dados visuais é então "capturar" estas variações de energia. Cada pixel possui um valor numérico que representa uma intensidade da energia capturada. Em uma cena existem vários fatores responsáveis por estes valores de intensidade, mas quatro (4) são os principais:

(1) A geometria das superfícies visíveis imageadas; (2) A reflectância destas superfícies; (3) A iluminação sobre a qual está submetida a cena e (4) O ponto de visada do observador.

Na representação matricial todos estes fatores estão fundidos em um único valor dado pelo valor do pixel.

Na verdade, as variações de intensidade que ocorrem sao devido a estas causas isoladamente ou a combinações destas. O objetivo básico da representação proposta por Marr é, então, definir quais variações sao definidas por quais fatores e a partir daí criar uma representação que explicite os eventos físicos responsáveis pelas variações de intensidade, que em última análise, provocam a nossa "visão" da cena.

Para fazer isto se deve achar representações e métodos de detecção adequados para as variações e para as estruturas das superfícies existentes na cena imageada. A este estágio da representação é que chamamos ESBOÇO PRIMARIO BRUTO (EPB).

Na nossa implementação, a primitiva simbólica básica de representação para as variações de intensidade, em uma determinada escala (canalv 2 G), é o SEGMENTO CRUZAMENTO POR ZERO (SCZ). Os SCZ's são caracterizados por seus atributos: POSIÇÃO, TAMANHO, CONTRASTE E ORIENTAÇAO. A estrutura de dados para o SCZ é vista abaixo na Fig. 1. Para mais detalhes sobre o EPB veja Marr (1982) e Monteiro (1988).

SCZ POSIÇÃO ..,-------.TAMANHO

[x,y] ------------

CONTRASTE ORIENTA-------- ÇÃO

PONTOS

[x.,y.] 11

[xf ,y

f i

Fig 1 - Estrutura do SCZ

3 - O EXPERIMENTO

Nesta implementação, nenhuma primitiva específica para a textura foi estudada. No entanto, a textura se caracteriza por algum tipo de "regularidade" nos elementos primitivos que compõem a cena. A repetição ou quase-repetição dos elementos fundamentais, pode caracterizar uma região e/ou superfície. As características de • organização destes elementos também podem fazê-lo.

124

Page 3: 2 - O ESBOÇO PRIMÁRIO BRUTO - mtc-m12.sid.inpe.brmtc-m12.sid.inpe.br/col/sid.inpe.br/iris@1912/2005/07.18.21.14.21... · no Esboço Primário ... na medida em que mistura as informações

Pensando textura desta forma, podemos considerar os elementos primitivos do ESBOÇO PRIMÃRIO BRUTO (EPB) como nossos elementos de textura. Usando, então, estatísticas simples (de primeira ordem) sobre o EPB, podemos discriminar texturas, baseando nossa análise nas relações espaciais e nas propriedades de cada primitiva básica do EPB, ou de um determinado canal 57 2 G.

Para testar estas considerações, utilizamos imagens de texturas obtidas com uma câmara de TV, a partir do Brodatz (1968), com tamanhos de (128 X 128) pixels. Fizemos dez (10) amostras de cada textura. Na Fig 2 estão apresentadas uma das amostras de cada uma das imagens trabalhadas.

125

Page 4: 2 - O ESBOÇO PRIMÁRIO BRUTO - mtc-m12.sid.inpe.brmtc-m12.sid.inpe.br/col/sid.inpe.br/iris@1912/2005/07.18.21.14.21... · no Esboço Primário ... na medida em que mistura as informações

(a) (b)

(c) (d)

Fig 2 - As imagens originais, retiradas de Brodatz (1968) de (a) veio (b) ráfia, (c) cortiça e em (d) mica.

Para cada tipo de textura, uma descrição simbe. para cada canal v 2 G com W (diâmetro do operador v 2 G e 10 pixels foi obtida. Escolhemos para trabalhar c W = 6 e 8 pixels, visto que em W - 4 pixels, houve bastante ruidosa e em W = 10 havia pouca informação. descrições, verificamos as distribuições de TAMANHO para as primitivas encontradas. A discriminação c baseia-se na análise destas distribuições.

lica isolada ) de 4, 6, 8 s canais com uma detecção Sobre estas e ORIENTAÇÃO as texturas,

126

Page 5: 2 - O ESBOÇO PRIMÁRIO BRUTO - mtc-m12.sid.inpe.brmtc-m12.sid.inpe.br/col/sid.inpe.br/iris@1912/2005/07.18.21.14.21... · no Esboço Primário ... na medida em que mistura as informações

No canal com W = 6 pixels, o veio e a ráfia são diretamente separáveis observando a distribuição do TAMANHO. O veio apresenta um histograma com pico em (18) em uma dada orientação preferencial (no caso w90 graus), enquanto a ráfia apresenta picos em (18) e (4) com duas orientações preferenciais defasadas de aproximadamente 180 graus. Estas configurações das primitivas, definindo estruturas diferenciadas para a ráfia e para o veio, discriminam visualmente as texturas e podem ser quantizadas. Veja na Fig 3 as descrições (conjunto de primitivas geradas) para o canal W = 6 pixels e na Fig 4 as distribuições para o veio e a ráfia.

Page 6: 2 - O ESBOÇO PRIMÁRIO BRUTO - mtc-m12.sid.inpe.brmtc-m12.sid.inpe.br/col/sid.inpe.br/iris@1912/2005/07.18.21.14.21... · no Esboço Primário ... na medida em que mistura as informações

(a) (b)

(c) (d)

Fig 3 - Primitivas para (a), o veio, (b), a ráfia, (c) cortiça e, em (d), a mica

Page 7: 2 - O ESBOÇO PRIMÁRIO BRUTO - mtc-m12.sid.inpe.brmtc-m12.sid.inpe.br/col/sid.inpe.br/iris@1912/2005/07.18.21.14.21... · no Esboço Primário ... na medida em que mistura as informações

i'1 1 1 1 1 - 1 . I I

lamanho

I 1 I el

11,, 1 I . 1 111 III 11'1,1 111

1,11.1111t1 a. lis 111 111(1 1 111111. 1:

1 1 l Gi i I •

1 I

111

Met 1.1 ei I

e, I., e loe •.e J ■ I 11• , .1 ,Hese

Orleritéçi;',/ (graus) 11,31 1 . 4,, ti 5,55 i

(a)

11 1

, , 1

.1 1„ . !

1 , = 1

; W

1

1 1

.1 1

. ,

; 1 -,i

, 1 1

.1

1 ,

1 • , ; 1 ' , , , ,

i l it il l' i', 11'

. 1 - 1 i 1 1, 1: i I , ‘ , 11 111H

i , , H 1,

1 '1 1 1 1 i 1,1'1'1111 W 11, 1', '1.i i, ',1

I, —1 • _.

1 I 1

1 ,

.- I ti .; - , , , • .• , ,. ,_ , , . ; ' "; 1 1 • - • •,;

ir, terlt a, .à("., ( yr

(b)

Fig 4 - Distribuições de TAMANHO e ORIENTAÇÃO

para (a), o veio, e (b), a ráfia.

129

Page 8: 2 - O ESBOÇO PRIMÁRIO BRUTO - mtc-m12.sid.inpe.brmtc-m12.sid.inpe.br/col/sid.inpe.br/iris@1912/2005/07.18.21.14.21... · no Esboço Primário ... na medida em que mistura as informações

O veio e a ráfia se diferenciam diretamente da cortiça, também observando a distribuição de TAMANHO. A cortiça tem concentração de primitivas com tamanho (4), sem nenhuma orientação preferencial. As primitivas distribuem-se em todas as direções, não se podendo determinar alinhamentos direcionais. Esta organização caracteriza a textura, diferenciando-a do veio e da ráfia. Na Fig 5 apresentamos as distribuições de TAMANHO e ORIENTAÇÃO da cortiça para o canal v 2 G com W = 6 pixels.

1 . IC,C3E11 : cir kified

-

1 H H

- 1 1 1

111

1 )

_ i

1- 1 7 :

Tamanno

ru.,1 PCIF .t.n OSE• 4

i. 1 A T.1-1 ■-,f4,40 7

mE 1•11F, . 1 Z.`

; 1 1 — I ' _. — 1

i

1 1, 1. , 1 l' 1 1 Is 1 ' - li, 1 , 11! , '1 ' i ¡ II 1 1, X !

- H 1 i ; , i i ! 1 ; i , , ■ i i , I - H

1 I 1 I WIL i ! H1 H 11 ii 1 ■ 1 i ! j , r,

• • ; I • ' , j I , J I j , . , , , , 1 • , i I .. , 4 ,. ;. .. . , - ! i • ' ; , ■ , •

. ,

Gr1C1ILAÇa0 (graus)

F

Fig 5 - Distribuição em TAMANHO e ORIENTAÇÃO.

A mica diferencia-se do veio e da ráfia pelas mesmas características apresentadas em relação a cortiça. Na Fig 6 tem-se as distribuições da mica para o canal v 2 G com W = 6 pixels.

130

Page 9: 2 - O ESBOÇO PRIMÁRIO BRUTO - mtc-m12.sid.inpe.brmtc-m12.sid.inpe.br/col/sid.inpe.br/iris@1912/2005/07.18.21.14.21... · no Esboço Primário ... na medida em que mistura as informações

I 1F3d3EM : rn1 c amed

I I II

1 ' 1 1H I ri-

T antãnhO

ri, I F CIF-k übe,

1 Ali.,1111,C , .3, 8 - 3

Fig 6 - Distribuição em TAMANHO e ORIENTAÇÃO.

Aparece, então, um problema. Como diferenciar a mica e a cortiça. Observando as imagens originais de ambas na Fig ', é fácil verificar que a mica é semelhante a cortiça, só que em uma escala maior. Visto isto, tentamos estabelecer um novo canal v 2 G e verificar os resultados. Utilizando v 2 G com W = 8 pixels obtivemos os resultados apresentados na Fia 7.

Fig 7 - Descrição com W = 8 pixels para v 2 G em (a) cortiça e (h) mica.

131

Page 10: 2 - O ESBOÇO PRIMÁRIO BRUTO - mtc-m12.sid.inpe.brmtc-m12.sid.inpe.br/col/sid.inpe.br/iris@1912/2005/07.18.21.14.21... · no Esboço Primário ... na medida em que mistura as informações

IMAGEM:c oe- 1.5.8

.2,

1i

.!?

1 i I li

1 1 1 ! i ;

;

1 , ! 1 ii 11 1 1 ..._ 1 I I i i

__ 1 1 i --, - , 1 41.4 „.„___+.1_1 , 1 _ i , , ! i T-T--1

. ...: 1 ,.. 2 , .• :....1 "... r,

1 ãtohnno

.1: , ...,:,

l'..,;". ,,,, ir, .., , , , i ., •

ta — -ri — cr tu —

if 1 — I

1i

-1 1 11 11

1

1 1 1 1 1 I 1 ii

— 11 1

1L Hilil,1

; i 1 , ".1 ■ 11' ! 1 It 1 1,1 lt, lm Iii,1 í -- ■ II '. li 'í l itili 1 I !

-1 'I 11 1 1HH 1 1 1 t HI H i -. " 1 ¡II L1111 , t ' 1

._!....1 4 1 1.-i--,----t-... ', -- i•1 1 1 , ,

prIentdci ao (cit Ci4S .

( c )

4

1 . I 1

1 1 1 1 - '1 1

1 U. r•, "4 • , 1 •i. 'Mo

1.1

T.Nmanho Or

•ht9 f fU ()'3 .1 111'111 1 10 1 , 1

piA 1,01,41,411 11 1)In 111I1P. itt

(d)

Fig 7 - Distribuições de TAMANHO e ORIENTAÇA0 em (c) cor- tiça e (d) mica, para W = 8 pixels

Para este canal, conseguimos determinar uma nova caracterização para as texturas. A distribuição de TAMANHO para a mica, passou a definir uma organização com primitivas de tamanho (24), formando a base de percepção da cena. A cortiça, continuou definindo primitivas de tamanhos entre (4) e (6) como sua base perceptiva. Ambas sem preferências direcionais, portanto não definindo alinhamentos. Esta diferenciação, possibilitada pela nova escala do operador v 2 G, torna possível discriminar a mica da cortiça.

132

Page 11: 2 - O ESBOÇO PRIMÁRIO BRUTO - mtc-m12.sid.inpe.brmtc-m12.sid.inpe.br/col/sid.inpe.br/iris@1912/2005/07.18.21.14.21... · no Esboço Primário ... na medida em que mistura as informações

4 - A ANALISE DOS RESULTADOS

No escopo deste trabalho, objetivamos com estes experimentos, estabelecer empiricamente, a possibilidade de uso de um modelo estrutural de representação para dados visuais para caracterizar texturas. Fazendo isto, trabalhando somente estatísticas simples sobre a representaçãó simbólica da cena. Nosso objetivo posterior é trabalhar a segmentação da imagem, baseando nosso algoritmo na extração de características de textura da cena, utilizando esta abordagem aqui apresentada. Um EPB local na imagem, forneceria medidas baseadas nas distribuições, de maneira a caracterizar quantitativamente a textura na região. Trabalhando então com grafos, onde os nós representariam regiões com mesmas características de textura, buscaríamos definir regiões ou limiares entre regiões.

O experimento realizado indica a viabilidade em tentar esta abordagem para segmentação por textura Com isto, passamos a utilizar uma representação simbólica e estrutural da cena para executar tarefas visuais, aproximando o trabalho do modelo de visão por máquina da forma de trabalho dos modelos de percepção visual biológicos.

REFERÊNCIAS BIBLIOGRÁFICAS

Brady, M.; 1982, Computational approaches to image understanding. Computing surveys, vol 14, nl, mar, p. 3 - 71

Conners, R.W.; Triveldi, M.M.; Harlow, C.A.; 1984, Segmentation of a high-resolution urban scene using texture operators. Computer vision, graphics and image process, vol 25, p. 273 - 310

Haralick, R.M.; Shanmugam, K.; Dinstein, I.; 1973, Textura] features for image classification. IEEE Trans. sys. man. cyb., vol 3, p. 610 - 621

Marr, D.; 1978, Representing a visual information - a computational approach. Computer vision systems, ed. Hanson,A.R; Riseman,E.M., Academic Press, New York, p. 61 - 80

Marr, D.; 1982, Vision. W. H. Freeman and company, San Francisco.

Monteiro,A.M.V.; 1988, Processamento de imagens de satélites usando estruturas simbõlicas do baixo nível da visão, INPE-4638-TDL/337, Dissertação de Mestrado.