introdução - pgmat.ufba.br · e hierárquicos, sendo que os dois últimos geram uma seqüência...

54
1 Introdução Computacionalmente a interpretação direta de imagens digitais é difícil devido à sua representação por grande quantidade de dados organizados na forma de matrizes, o que serve como uma forte motivação para a procura de métodos capazes de alcançar a redução de dados. Este trabalho apresenta um estudo de dois algoritmos bastante interessantes: os métodos de agrupamento e a Transformada de Hough (TH). Ambos utilizam a idéia de agrupar dados similares para tornar possível o seu processamento em tempo real. Os métodos de agrupamento dividem os dados em grupos de acordo com a medida de similaridade entre as características das amostras, que são expressas por valores numéricos. A TH utiliza ferramentas matemáticas simples na detecção de retas, círculos e praticamente qualquer tipo de curva na imagem digital, acumulando nas células de uma matriz o número de pontos pertencentes a cada curva da imagem. Os métodos de agrupamento não têm suas aplicações limitadas a imagens digitais, mas constituem uma boa alternativa para a segmentação de imagens, um passo importante para a obtenção das informações mais significativas para sua posterior interpretação. A segmentação é o processo de subdivisão da imagem em suas partes básicas constituintes, e é com base na análise destas informações que será implementada a TH. Ao final da etapa de segmentação da imagem obtém-se um mapa de bordas que servirá de base à detecção das curvas propostas de acordo com a aplicação específica. Embora a TH tenha sido introduzida para detecção de retas, é possível generalizá-la para detectar círculos, elipses ou ainda uma curva qualquer parametrizável na forma h(v,c), onde v é o vetor de coordenadas e c é o vetor de parâmetros. Entretanto, quanto maior o número de parâmetros, maior o esforço computacional envolvido decorrente do aumento das dimensões do espaço de parâmetros. Neste trabalho nos detivemos apenas à detecção de retas e círculos através da TH. Na etapa de aplicação da TH será feita uma varredura de pontos no plano da imagem, x-y, os quais serão mapeados em curvas no espaço de parâmetros. À medida que é feita esta varredura, será simultaneamente construída uma matriz A(v,c), acumulando em cada célula (v,c) o número N de pontos pertencentes à curva h(v,c), indicado pela interseção de N curvas na célula correspondente no espaço de parâmetros.

Upload: ngoxuyen

Post on 11-Jan-2019

220 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Introdução - pgmat.ufba.br · e hierárquicos, sendo que os dois últimos geram uma seqüência de partições e, ... nas matrizes esparsas Sw e Sb que são as matrizes intra-grupo

1

Introdução

Computacionalmente a interpretação direta de imagens digitais é difícil devido à

sua representação por grande quantidade de dados organizados na forma de matrizes, o que

serve como uma forte motivação para a procura de métodos capazes de alcançar a redução

de dados. Este trabalho apresenta um estudo de dois algoritmos bastante interessantes: os

métodos de agrupamento e a Transformada de Hough (TH). Ambos utilizam a idéia de

agrupar dados similares para tornar possível o seu processamento em tempo real. Os

métodos de agrupamento dividem os dados em grupos de acordo com a medida de

similaridade entre as características das amostras, que são expressas por valores numéricos.

A TH utiliza ferramentas matemáticas simples na detecção de retas, círculos e

praticamente qualquer tipo de curva na imagem digital, acumulando nas células de uma

matriz o número de pontos pertencentes a cada curva da imagem.

Os métodos de agrupamento não têm suas aplicações limitadas a imagens digitais,

mas constituem uma boa alternativa para a segmentação de imagens, um passo importante

para a obtenção das informações mais significativas para sua posterior interpretação. A

segmentação é o processo de subdivisão da imagem em suas partes básicas constituintes, e

é com base na análise destas informações que será implementada a TH.

Ao final da etapa de segmentação da imagem obtém-se um mapa de bordas que

servirá de base à detecção das curvas propostas de acordo com a aplicação específica.

Embora a TH tenha sido introduzida para detecção de retas, é possível generalizá-la para

detectar círculos, elipses ou ainda uma curva qualquer parametrizável na forma h(v,c),

onde v é o vetor de coordenadas e c é o vetor de parâmetros. Entretanto, quanto maior o

número de parâmetros, maior o esforço computacional envolvido decorrente do aumento

das dimensões do espaço de parâmetros. Neste trabalho nos detivemos apenas à detecção

de retas e círculos através da TH.

Na etapa de aplicação da TH será feita uma varredura de pontos no plano da

imagem, x-y, os quais serão mapeados em curvas no espaço de parâmetros. À medida que é

feita esta varredura, será simultaneamente construída uma matriz A(v,c), acumulando em

cada célula (v,c) o número N de pontos pertencentes à curva h(v,c), indicado pela

interseção de N curvas na célula correspondente no espaço de parâmetros.

Page 2: Introdução - pgmat.ufba.br · e hierárquicos, sendo que os dois últimos geram uma seqüência de partições e, ... nas matrizes esparsas Sw e Sb que são as matrizes intra-grupo

2

Este trabalho está organizado do seguinte modo: no capítulo 1 apresentaremos os

métodos de agrupamento, a matemática envolvida na distribuição das amostras em grupos

para cada um dos métodos, além das vantagens e desvantagens de cada um deles em

relação às possíveis aplicações, e, por fim, será comentada uma aplicação do agrupamento

em comércio eletrônico.

No capítulo 2 introduziremos a fundamentação teórica relativa à imagem digital,

apresentando modelos abstratos para uma imagem e sua representação, descreveremos

resumidamente as etapas relativas ao processo de segmentação da imagem, e para concluir

apresentaremos três aplicações de agrupamento voltadas para imagem digital: um

algoritmo para consulta e busca de imagens baseadas em conteúdo, outro para quantização

de imagens coloridas e o último para detecção de pólipos na tomografia computadorizada

do cólon.

No capítulo 3 estudaremos como a TH transforma uma curva do plano x-y em um

único ponto no espaço de parâmetros, a construção da matriz de acumuladores e como

identificar as curvas procuradas nesta matriz. Em seguida estabelecemos uma comparação

entre o agrupamento e a TH.

Por fim, apresentaremos algumas importantes aplicações, onde a TH tem mostrado

resultados satisfatórios. A primeira aplicação citada combina agrupamento com TH no

planejamento de radioterapia, para identificação dos círculos correspondentes aos olhos em

imagens de tomografia computadorizada. A segunda aplicação utiliza a TH na

identificação das formas dos objetos, para que um robô com realimentação sensorial possa

segurá-los com firmeza com sua garra com dois dedos paralelos.

No capítulo 4 faremos a conclusão da presente dissertação e comentaremos alguns

artigos estudados na elaboração deste trabalho.

Page 3: Introdução - pgmat.ufba.br · e hierárquicos, sendo que os dois últimos geram uma seqüência de partições e, ... nas matrizes esparsas Sw e Sb que são as matrizes intra-grupo

3

Capítulo 1

Agrupamento

O problema da análise de dados representa uma grande preocupação atual nas mais

diversas áreas do conhecimento humano, e uma boa alternativa para solucionar este

problema são os métodos de agrupamento, cujo objetivo é produzir uma distribuição destes

dados em grupos de amostras, as quais possuem similaridades internas fortes, além de

organizar uma conveniente redução dos dados em seus grupos. A similaridade entre

amostras é definida por medidas numéricas ou por um conjunto de atributos variáveis,

dependendo do tipo de dados envolvidos e da aplicação tratada. É grande a diversidade de

aplicações dos métodos de agrupamento, algumas das quais serão comentadas ao longo

desta dissertação.

Os métodos de agrupamento organizam os dados, vistos como vetores de um

espaço d-dimensional, onde d corresponde ao número de características, em K grupos.

Os métodos de agrupamento dividem-se em três classes: particionais, grafo-teóricos

e hierárquicos, sendo que os dois últimos geram uma seqüência de partições e, geralmente,

requerem somente a matriz de proximidades entre os objetos e são mais populares em áreas

nas quais é necessário construir taxonomias, como biologia, ciências sociais e do

comportamento [C1].

Os métodos de agrupamento particionais, como do tipo minimização de custo,

geram uma única partição dos dados, requeridos na forma de uma matriz de amostras, são

adequados a grandes conjuntos de dados e são largamente utilizados, especialmente em

segmentação de imagens.

Para solucionar o problema de divisão ou aglomeração das amostras nos

respectivos grupos, são estabelecidos critérios matemáticos chamados funções critério, os

quais comentaremos a seguir.

Page 4: Introdução - pgmat.ufba.br · e hierárquicos, sendo que os dois últimos geram uma seqüência de partições e, ... nas matrizes esparsas Sw e Sb que são as matrizes intra-grupo

4

1.1 Funções Critério

As funções critério são utilizadas para determinar os grupos e seus respectivos

centros ou representantes padrão.

1.1.1 Soma de Erro-Quadrático

A função critério mais simples e mais freqüentemente utilizada para agrupamento

particional é o critério soma de erro quadrático. Esta função tem o objetivo de encontrar

uma partição contendo K grupos que minimize o erro quadrático associado ao agrupamento

Ek2, que representa os desvios das amostras em relação aos centros dos seus respectivos

grupos. Em outras palavras, as amostras são vistas como uma coleção de K nuvens de

forma esférica, e este critério tenta fazer com que as K nuvens fiquem compactas

internamente e bem separadas entre si. O conceito básico deste critério será descrito a

seguir.

Consideremos uma matriz de n amostras de dimensão d, ou seja, com d

características, a ser particionada em K grupos {C1, C2, ..., Ck}, tal que o grupo Ck tem nk

amostras e cada amostra está em um único grupo. Estes fatos geram a seguinte afirmação:

∑=

=K

kk nn

1.

O vetor médio ou centro do grupo Ck é definido como o centróide do grupo, ou:

∑∈

=ki Cx

kik

k xnm )()( )1(

onde xi(k) é a i-ésima amostra pertencente ao grupo Ck. O erro quadrático em um grupo Ck é

igual à soma das distâncias Euclidianas quadráticas entre o seu centro m(k) e cada uma das

nk amostras:

∑=

−−=kn

i

kki

Tkkik mxmxe

1

)()()()(2 ).()(

O erro quadrático para o agrupamento contendo K grupos é a soma dos erros

quadráticos dos grupos, ou seja,

Page 5: Introdução - pgmat.ufba.br · e hierárquicos, sendo que os dois últimos geram uma seqüência de partições e, ... nas matrizes esparsas Sw e Sb que são as matrizes intra-grupo

5

∑=

=K

kkK eE

1

22 .

A distância Mahalanobis quadrática entre as amostras xi e xk, também é usada como

medida de distância em agrupamento do tipo erro quadrático [C1]. Esta distância é definida

pela expressão

)()(),( 1ki

Tki xxSxxkid −−= − ,

onde S é a matriz de covariância das amostras definida como

∑∑= =

=K

k

n

j

Tkj

kj

k

xxS1 1

)*()*( ))(( ,

mxx kjj −= )(*

e ( )∑=

=K

k

kk mnnm

1

)(.1

A distância Mahalanobis incorpora a correlação entre características e normaliza

cada característica para média zero e variância unitária. Se S é a matriz identidade, as

distâncias Mahalanobis quadrática e Euclidiana quadrática se igualam.

1.1.2 Caso Rígido

O particionamento de um conjunto de amostras em grupos disjuntos é bem

adequado quando os grupos são compactos e bem separados, não havendo incerteza quanto

à atribuição de uma amostra a um grupo. Este agrupamento é conhecido como rígido, o

qual descreveremos a seguir.

Dada uma matriz Xdxn de n amostras e d características utilizadas, cuja fila xi = (xi1,

xi2, ..., xid)T corresponde ao vetor de características da i-ésima amostra, e o número de

grupos K, o problema consiste em encontrar a matriz Ykxn que minimiza a variação total

intra-grupo, definida por:

⎩⎨⎧

∉∈

=ki

kiik Cxse

Cxsey

,0,1

O centróide do k-ésimo grupo é zk = (zk1, ..., zkd), onde:

Page 6: Introdução - pgmat.ufba.br · e hierárquicos, sendo que os dois últimos geram uma seqüência de partições e, ... nas matrizes esparsas Sw e Sb que são as matrizes intra-grupo

6

∑∑==

=n

iikij

n

iikkj yxyz

11).(/)( (1)

Cada amostra pertence ao grupo cujo centróide esteja mais próximo, isto é, tenha a

menor distância quadrática. A variação intra-grupo total ST é:

∑∑ ∑= = =

−=n

i

K

k

d

jkjijikT zxyS

1 1 1

2 .)(

Assim, dada uma matriz X de n amostras, e o número de grupos K, o problema

consiste em encontrar a matriz Ykxn, que minimiza ST, com:

11

=∑=

K

kiky (2)

e (3) 01

>∑=

n

iiky

onde o termo yik denota o relacionamento da i-ésima amostra com o k-ésimo grupo. A

matriz Y é composta de 0’s e 1’s, com exatamente um 1 em cada coluna e ao menos um 1

em cada linha. Este agrupamento é conhecido como rígido, semelhante ao agrupamento

flexível, que será visto mais à frente.

O exemplo 1 mostra uma matriz de relacionamentos, que representa o agrupamento

das amostras {x1,...,x5} nos grupos {x1,x5}, {x2,x3} e {x4}.

⎥⎥⎥

⎢⎢⎢

⎡=

010000011010001

Y

Exemplo 1: agrupamento rígido das amostras {x1,...,x5} nos três grupos {x1,x5}, {x2,x3} e {x4}.

Page 7: Introdução - pgmat.ufba.br · e hierárquicos, sendo que os dois últimos geram uma seqüência de partições e, ... nas matrizes esparsas Sw e Sb que são as matrizes intra-grupo

7

1.1.3 Traço

Um critério de agrupamento erro-quadrático pode ser obtido da decomposição da

matriz esparsa S, nas matrizes esparsas Sw e Sb que são as matrizes intra-grupo e inter-

grupo, respectivamente, que se relacionam entre si através de:

ST = Sw + Sb

onde

∑∑= =

−−=K

k

n

j

Tkkj

TkkjW

k

mxmxS1 1

)()()()( )()( e

∑∑= =

−−=K

k

n

j

TkkB

k

mmmmS1 1

)()( ))(( .

A matriz S é fixa, isto é, não depende de como as amostras estão particionadas em

grupos, depende somente do número total de amostras. Entretanto as matrizes Sw e SB

dependem do particionamento, sendo que na partição ideal Sw deve ser mínima, pois mede

a variação entre as características correspondentes dentro de um mesmo grupo, e de modo

análogo, SB deve ser máxima, pois mede a variação entre grupos distintos. Assim um

critério de agrupamento é obtido a partir do traço destas matrizes:

∑ ∑∑= = =

=−−==K

k

K

kK

n

i

kki

Tkki

kW EmxmxStrStr

k

1 1

2

1

)()()()()( )()()()( ,

sendo que o traço representa uma medida escalar das matrizes.

O tr(S(k)) é a soma das variâncias ao longo das direções características para o grupo

k e mede a compactação do grupo Ck. Minimizar tr(SW) é equivalente a maximizar tr(SB)

porque

)()()( BW StrStrStr +=

e tr(S) é o mesmo para qualquer partição.

Page 8: Introdução - pgmat.ufba.br · e hierárquicos, sendo que os dois últimos geram uma seqüência de partições e, ... nas matrizes esparsas Sw e Sb que são as matrizes intra-grupo

8

1.1.4 Caso Flexível

Todos os critérios vistos até aqui levam ao particionamento de um conjunto de

amostras em grupos disjuntos. Apesar de úteis para muitos problemas, não são

universalmente aplicáveis. Quando os grupos são próximos ou há superposição de grupos,

é possível definir uma função critério para o agrupamento flexível, de forma que, uma

amostra pertence a um grupo, mas possui um certo grau de relacionamento com outros

grupos, isto é, algumas similaridades com amostras pertencentes a outros grupos, como

veremos a seguir.

Seja xij a j-ésima característica, da i-ésima amostra, i=1,...,n; j=1,...,d. O centróide

do k-ésimo grupo é

),...,( 1 kdkk zzz = ,

onde

∑∑==

=n

i

mik

n

iij

mikkj yxyz

11)(/)( ,

e m≥1 é o expoente peso para relacionamento flexível.

Formalmente, a função critério correspondente é

∑∑ ∑= = =

−=n

i

K

k

d

jkjij

mikT zxyS

1 1 1

2)( .

O problema consiste em: dadas uma matriz Xdxn de n amostras e d características, e

o número de grupos K, encontrar a matriz YnxK que minimize ST. No agrupamento flexível,

o grau de relacionamento corresponde a um valor pertencente ao intervalo [0,1], sendo

válidas as condições dadas pelas equações (2) e (3).

O grau de relacionamento da i-ésima amostra para o k-ésimo grupo, nesse caso, é

dado por:

∑ ∑∑=

==

−−=d

l

md

ljdilklil

K

jik zxzxy

1

)1/(2

11

]})(/[)]({[/1 .

Portanto, numa partição flexível, o grau de relacionamento é relaxado para um

valor no intervalo [0,1]. Quando o expoente m→1, o grau de relacionamento yik→0 ou 1.

Assim, quando m=1 tem-se um agrupamento rígido, idêntico ao caso descrito

Page 9: Introdução - pgmat.ufba.br · e hierárquicos, sendo que os dois últimos geram uma seqüência de partições e, ... nas matrizes esparsas Sw e Sb que são as matrizes intra-grupo

9

anteriormente, cuja função critério é definida pela equação (1). Fica claro então que uma

partição rígida é um caso particular de partição flexível.

O critério para agrupamento flexível pode ser considerado do tipo erro quadrático,

levando em conta que sua saída não somente inclui uma partição dos dados, como também

informação adicional na forma de valores de relacionamento. A principal vantagem desta

abordagem é o fato de se obter mais informação sobre a estrutura dos grupos, mostrando o

grau pelo qual cada amostra se ajusta a um determinado grupo, permitindo a diferenciação

entre amostras que se ajustam completamente daquelas que são ambíguas com relação a

determinados grupos. Entretanto, da mesma forma que os demais critérios abordados

anteriormente, o critério para agrupamento flexível leva a uma partição na qual os grupos

se apresentam com populações mais ou menos equalizadas, não resolvendo adequadamente

situações nas quais os grupos apresentam diferenças significativas quanto ao número de

amostras.

O exemplo 2 mostra o agrupamento flexível para as amostras {x1,...,x5}, onde

podemos observar o forte grau de relacionamento entre as amostras x1 e x5 e o grupo 1,

assim como as amostras x2 e x3 ao grupo 2. A amostra x4 é moderadamente relacionada aos

grupos 2 e 3.

Y= ⎥⎥⎥

⎢⎢⎢

051.014.011.002.0047.081.078.003.0102.005.011.095.0

Exemplo 2: agrupamento flexível das amostras {x1,...,x5} nos três grupos {x1,x5}, {x2,x3} e {x4}.

1.2 Métodos de Agrupamento Particionais

Dadas n amostras em um espaço d-dimensional, o problema do agrupamento

particional consiste em determinar uma partição das amostras em K grupos, onde K deve

ser bem menor que n, de forma que amostras pertencentes a um grupo são mais similares

Page 10: Introdução - pgmat.ufba.br · e hierárquicos, sendo que os dois últimos geram uma seqüência de partições e, ... nas matrizes esparsas Sw e Sb que são as matrizes intra-grupo

10

entre si do que em relação a amostras em grupos diferentes. É adotada uma função critério

para medir a qualidade do agrupamento de uma partição de dados. Assim, o problema

consiste em encontrar a partição que extremiza a função critério. Os exemplos 1 e 2 citados

anteriormente ilustram os métodos de agrupamento particional.

1.3 Métodos Grafo-teóricos

Agrupamentos hierárquicos podem ser obtidos aplicando-se a teoria dos grafos ao

problema do agrupamento, partindo da matriz de proximidades Dnxn= [d(i,j)], que expressa

as dissimilaridades entre n amostras, gerando n(n-1)/2 entradas de dissimilaridades abaixo

da diagonal desta matriz.

Podemos obter um grafo de limiar G(v) não direcionado e sem peso, sobre n nodos,

onde cada nodo representa uma amostra. Para cada nível de dissimilaridade v, é inserida

uma aresta entre os nodos i e j se as amostras correspondentes têm dissimilaridade menor

ou igual a v, isto é:

(i,j)∈G(v) se, e somente se, d(i,j)≤v, sendo d(i,i) = 0, ∀i.

O exemplo 3 apresenta uma matriz de dissimilaridades Di entre 5 amostras, que

geram 10 entradas de dissimilaridades abaixo da diagonal. A figura 1 ilustra os primeiros

sete grafos de limiar da seqüência de dez grafos gerados a partir da matriz Di.

1 2 3 4 5

⎥⎥⎥⎥⎥⎥

⎢⎢⎢⎢⎢⎢

=

0,00,40,90,30,70,00,100,50,2

0,00,10,80,00,6

0,0

54321

iD

Exemplo 3: matriz de dissimilaridades entre 5 amostras. 2 • • 3 2 3 2 3 2 3

• 5 • 5 • 5 5

1• • 4 1• • 4 1 4 1 4 G(0) G(1) G(2) G(3)

Page 11: Introdução - pgmat.ufba.br · e hierárquicos, sendo que os dois últimos geram uma seqüência de partições e, ... nas matrizes esparsas Sw e Sb que são as matrizes intra-grupo

11

2 3 2 3 2 3 2 3

5 5 5 5

1 4 1 4 1 4 1 4 G(4) G(5) G(6) G(7) Figura 1: grafos de limiar.

1.4 Métodos de Agrupamento Hierárquico

Um método de agrupamento hierárquico é um procedimento para a criação de uma

seqüência aninhada de partições dos dados a partir de uma matriz de proximidades que será

organizada como um tipo de árvore evolutiva. As linhas e colunas dessa matriz

correspondem às amostras e as entradas são as distâncias ou dissimilaridades entre elas.

A cada agrupamento hierárquico corresponde uma árvore, que mostra como as

amostras estão agrupadas. A árvore de limiar é aquela que mostra uma escala que registra a

ordem pela qual os agrupamentos acontecem e árvore de proximidade é aquela que vem

acompanhada de uma escala proporcional, que registra o valor de dissimilaridade em cada

nível do agrupamento. A visão gráfica da estrutura hierárquica do gráfico em forma de

árvore é conveniente e de fácil compreensão.

Os métodos de agrupamento hierárquico podem ser classificados em aglomerativos

e divisivos. Nos métodos aglomerativos cada uma das n amostras constitui um grupo. Estes

grupos serão unidos seqüencialmente até que se tenha um único grupo contendo todas as

amostras. Já os métodos divisivos iniciam o agrupamento com todas as amostras em um

único grupo, que será seqüencialmente subdividido em outros grupos, até que cada grupo

contenha apenas uma amostra. Esta última classe é menos popular e menos referenciada

que os métodos aglomerativos [C1].

Uma desvantagem dos métodos hierárquicos, tanto divisivos quanto aglomerativos,

é que uma partição inadequada não pode ser reparada no estágio posterior, pois amostras

separadas ou unidas num determinado nível, permanecem separadas ou unidas nos níveis

subseqüentes.

Page 12: Introdução - pgmat.ufba.br · e hierárquicos, sendo que os dois últimos geram uma seqüência de partições e, ... nas matrizes esparsas Sw e Sb que são as matrizes intra-grupo

12

1.4.1 Métodos Hierárquicos Aglomerativos

Um procedimento de agrupamento hierárquico aglomerativo produz uma série de

partições dos dados, Pn, Pn-1, ... P1. A primeira, Pn, é formada por n grupos com um único

indivíduo, Pn-1 será obtida encontrando-se o par de grupos mais próximos Ci e Cj para

reuní-los em um único grupo e assim diminuir o número de grupos de uma unidade. Essa

operação será repetida até que só exista um único grupo, ou seja, em cada estágio, os

indivíduos ou grupos que estiverem mais próximos serão unidos.

Existem outras maneiras de definir distância entre um indivíduo e um grupo, ou

entre dois grupos. Entre outras, as seguintes medidas podem ser usadas para medir a

distância entre dois grupos Xi e Yj:

1 - 'min),(',min xxYXd

ji YxXxji −=∈∈

,

onde dmin é a distância mínima entre os elementos x ∈ Xi e x’∈ Yj.

2 - 'max),(',max xxYXd

ji YxXxji −=∈∈

,

onde dmax é a distância máxima entre os elementos x ∈ Xi e x’∈ Yj.

3 - ∑ ∑∈ ∈

−=i jXx Xx

jijiavg xxnnXXd ,")1(),("

onde davg é a razão entre os somatórios de todas as distâncias entre os elementos x ∈

Xi e x’∈ Yj e o produto dos números de elementos dos grupos Xi e Yj.

4 - ( ) jijimean mmYXd −=,

onde dmean é a distância entre os centróides dos grupos Xi e Yj.

Todas essas medidas normalmente produzem os mesmos resultados quando os

grupos são compactos e bem separados. Entretanto, se os grupos são próximos uns dos

outros ou se suas formas não são basicamente hiperesféricas, resultados diferentes podem

ser obtidos [C1].

As medidas dmin e dmax representam dois extremos tendendo a ser sensíveis a ruídos,

podendo não apresentar bons resultados quando os grupos são alongados, ou apresentam

formas e tamanhos diferentes.

Page 13: Introdução - pgmat.ufba.br · e hierárquicos, sendo que os dois últimos geram uma seqüência de partições e, ... nas matrizes esparsas Sw e Sb que são as matrizes intra-grupo

13

Uma alternativa para substituir o critério “encontrar o par de grupos distintos mais

próximos” pode ser “encontrar o par de grupos distintos, cuja união melhore a função

critério, tanto quanto possível”. Um exemplo de função critério que pode ser utilizada é a

soma de erro-quadrático. Desta forma, fica assegurada uma melhor escolha de grupos a

cada iteração.

A figura 2 mostra uma árvore de limiar de um problema hipotético envolvendo 5

amostras. O nível 0 mostra as 5 amostras como grupos isolados, no nível 1 são agrupadas

as amostras x1 e x5, que permanecem juntas até o final, no nível 2 são agrupadas as

amostras x2 e x3, e assim sucessivamente.

Quando não há interesse em completar a hierarquia, pode-se obter partições

cortando-se horizontalmente a árvore ou selecionando algumas das soluções na seqüência

aninhada de agrupamentos que compõem a hierarquia. Em muitas aplicações faz-se

necessário utilizar alguma heurística para determinar qual a partição que produz o número

apropriado de grupos.

Agrupamentos:

Nível 0: ((x1),(x2),(x3),(x4),(x5)) Nível 1: ((x1,x5),(x2),(x3),(x4)) Nível 2: ((x1,x5),(x2,x3),(x4)) Nível 3: ((x1,x5),(x2,x3,x4)) Nível 4: ((x1,x2,x3,x4,x5)) Níveis

0 x1 x5 x2 x3 x4

1

2

3

4 Figura 2: árvore de limiar.

Page 14: Introdução - pgmat.ufba.br · e hierárquicos, sendo que os dois últimos geram uma seqüência de partições e, ... nas matrizes esparsas Sw e Sb que são as matrizes intra-grupo

14

1.4.2 Métodos Hierárquicos Divisivos

Os métodos de agrupamento hierárquico divisivos são menos populares que os

métodos aglomerativos. Existem basicamente dois tipos de métodos divisivos: os

monotéticos, que dividem os dados considerando um único atributo de cada vez, e os

politéticos, onde as divisões são baseadas em valores tomados por todos os atributos dos

dados de uma só vez.

Apresentaremos a seguir um exemplo hipotético de aplicação de um método

divisivo politético. Neste exemplo um grupo divisor vai seqüencialmente acumulando

indivíduos cuja medida de dissimilaridade seja mais próxima do grupo divisor do que do

grupo restante. Quando os dois primeiros grupos estiverem completos, o processo é

repetido separadamente para os dois subgrupos encontrados, até que todos os subgrupos

tenham apenas uma amostra.

O exemplo 4 ilustra o método de agrupamento hierárquico divisivo.

1 2 3 4 5

⎥⎥⎥⎥⎥⎥

⎢⎢⎢⎢⎢⎢

=

0,00,110,220,250,290,00,210,230,30

0,00,70,70,00,10

0,0

54321

D

Consideremos a matriz D de distâncias entre 5 amostras. Podemos observar

na coluna 1 desta matriz, que o indivíduo 1 é o que possui maior distância para os

outros elementos e portanto ele será usado para iniciar o grupo divisor (1) e (2,3,4,5)

formam o grupo restante.

Nas tabelas 1 a 3 temos:

A = distância média entre um indivíduo e o grupo divisor

B = distância média entre um indivíduo e o grupo restante

B−A= diferença entre as distâncias médias de cada indivíduo para o grupo

restante e o grupo divisor.

Page 15: Introdução - pgmat.ufba.br · e hierárquicos, sendo que os dois últimos geram uma seqüência de partições e, ... nas matrizes esparsas Sw e Sb que são as matrizes intra-grupo

15

Tabela 1 Indivíduo A B B−A

2 10,0 18,3 8,3 3 7,0 16,6 7,6 4 30,0 17,0 −13,0 5 29,0 18,0 −11,0

A maior diferença obtida entre as médias é B−A=8,3 correspondente ao

individuo 2, isto indica que ele está mais próximo do grupo divisor do que do grupo

restante. Este indivíduo é incluído ao grupo divisor (1,2) e o novo grupo restante é

(3,4,5).

Repetindo o processo de busca de um elemento para o grupo divisor, obtemos

a tabela 2, que indica que o indivíduo 3 está mais próximo do grupo divisor do que

do grupo restante, pois B−A=14,5. Este indivíduo é incluído ao grupo divisor (1,2,3)

e o novo grupo restante é (4,5).

Tabela 2

Indivíduo A B B−A 3 7,0 21,5 14,5 4 26,5 14,0 −12,5 5 27,0 14,5 −13,5

Repetindo o processo obtemos a tabela 3, que leva a conclusão que o

particionamento em dois grupos está completo, pois todos os indivíduos restantes

estão mais próximos entre si que dos elementos do grupo divisor.

Tabela 3

Indivíduo A B B−A 4 24,6 7,0 −17,6 5 25,3 7,0 −18,5

A partir daí o processo pode continuar para cada grupo separadamente, até

que cada indivíduo constitua um grupo isolado.

Exemplo 4: agrupamento divisivo com 5 amostras a partir da matriz de distâncias.

Page 16: Introdução - pgmat.ufba.br · e hierárquicos, sendo que os dois últimos geram uma seqüência de partições e, ... nas matrizes esparsas Sw e Sb que são as matrizes intra-grupo

16

A seção seguinte apresenta um exemplo onde o algoritmo de agrupamento é

utilizado para solucionar um problema de gerenciamento de venda eletrônica: como usar o

histórico de compra do consumidor no comércio eletrônico para cruzar vendas.

1.5 Visualização de Associações Dirigidas em Transações de Dados de Comércio

Eletrônico

A análise de cestas de compras procura entender os relacionamentos entre as

transações eletrônicas e as linhas de produtos, para visualizar e prever as áreas de interesse

dos seus clientes. A partir destas informações serão planejadas estratégias para influenciar

a tomada de decisões no comportamento de compras.

As técnicas para visualização de associações com os dados organizados em uma

matriz ou representados através de um grafo, mostradas nas figuras 3A e 3B, tornam-se

impraticáveis quando o número de itens é muito grande.

Figura 3: A) técnica de matriz; B) técnica baseada em grafo.

Descreveremos a seguir um sistema “Visualização de Associação Dirigida (VAD)”

no plano 3D, desenvolvido nos laboratórios Hewlett-Packard para tornar possível a

visualização das relações e implicações entre grandes volumes de transações eletrônicas

[H1].

Page 17: Introdução - pgmat.ufba.br · e hierárquicos, sendo que os dois últimos geram uma seqüência de partições e, ... nas matrizes esparsas Sw e Sb que são as matrizes intra-grupo

17

O sistema VAD consiste no mapeamento dos itens da transação eletrônica e sua

distribuição aleatória sobre uma superfície visual esférica. Em seguida, é posicionado no

centro da esfera o item mais intimamente relacionado aos outros, que serão distribuídos ao

seu redor. Através de vários algoritmos de associação, obtém-se um grafo que consiste no

seguinte:

1 – A distância entre cada par de itens representa o suporte, que é a freqüência de

ocorrência da união destes conjuntos de itens.

2 – A borda dirigida indica a direção da associação e a sua cor representa o nível de

confidência, que é a probabilidade do que se a transação contém o antecedente também

contém o conseqüente.

3 – Um grupo é usado para conter os itens estreitamente relacionados em uma

superfície elipsoidal.

1.5.1 Estrutura VAD

O sistema VAD é constituído de quatro componentes básicos – iniciação,

relaxação, direção de associação e agrupamento, conforme ilustra a figura 4.

Figura 4: arquitetura do dispositivo de mineração de dados.

Para melhor compreensão dos próximos passos, começaremos apresentando

algumas definições.

Page 18: Introdução - pgmat.ufba.br · e hierárquicos, sendo que os dois últimos geram uma seqüência de partições e, ... nas matrizes esparsas Sw e Sb que são as matrizes intra-grupo

18

São dados X e Y, dois conjuntos de itens associados. Definimos então uma regra de

associação X→Y, onde X e Y são chamados respectivamente de antecedente e conseqüente

desta regra. A força desta regra é expressa por dois fatores: suporte e confidência. O

suporte é definido como razão entre o número de transações nas quais X e Y ocorrem e o

número total de transações. A confidência é a razão do o número de transações que contém

X e Y e o número de transações que contém X.

1.5.1.1 Iniciação

O primeiro passo é organizar itens extraídos dos dados de transações eletrônicas em

vértices de uma superfície esférica, do seguinte modo:

Transações {T1, T2, ..., Tn}

Produtos{P1, ..., Pm}

Transação Ti = {P1, ..., Pmi}, i = [1..n]

A posição inicial dos itens na superfície esférica deve ser aleatória. Depois de

computadas essas posições, o item mais estreitamente relacionado aos outros, é

posicionado no centro e os outros são posteriormente distribuídos ao seu redor. O grau de

relacionamento de um item é a soma de todos os suportes dos seus itens diretamente

adjacentes.

1.5.1.2 Relaxação

Nesta etapa é organizada uma matriz de freqüência F, onde cada elemento

corresponde à freqüência de ocorrência da associação em relação ao item mais freqüente

em todas as transações.

⎥⎥⎥⎥

⎢⎢⎢⎢

=

nnn

iiii

ff

ffff

F

......

1

21

11

Page 19: Introdução - pgmat.ufba.br · e hierárquicos, sendo que os dois últimos geram uma seqüência de partições e, ... nas matrizes esparsas Sw e Sb que são as matrizes intra-grupo

19

fij= #trans (Pi, Pj)/Max {PTk/k= [1..m]}

onde #trans (Pi, Pj) é o conjunto de transações que contém Pi e Pj.

1.5.1.3 Direção de Associação

São associados o antecedente e o conseqüente de uma regra usando uma borda com

seta para representar a direção da associação. Os níveis de confidência são dados em uma

matriz D, isto, é obtido pela divisão do suporte de um conjunto de itens pelo suporte do

antecedente da regra.

⎥⎥⎥⎥

⎢⎢⎢⎢

=

nnn

iiii

n

ddddd

ddd

D

...

.........

1

21

11211

d(Pi, Pj) = #trans (Pi, Pj)/#trans (Pi)

dij = direção de associação de confidência e nível Pi → Pj.

1.5.1.4 Agrupamento

Nesta etapa o algoritmo k-means é utilizado para agrupar automaticamente itens

relacionados e cada grupo é envolvido por um elipsóide cuja forma é controlada pelo

número de itens e suas posições neste grupo [C1].

1.5.2 Conclusão

O sistema VAD tem sido aplicado para minerar importantes visualizações de

aplicações. Neste caso seu uso é citado em análise de aplicações de cestas de compras e

perfil do consumidor. Este sistema proporciona a visualização para descobrir afinidades e

relacionamentos entre linhas de produtos e dados de transações, permitindo a navegação

sobre o gráfico de vendas de produtos gerado pelo VAD e a solução de questões sobre os

Page 20: Introdução - pgmat.ufba.br · e hierárquicos, sendo que os dois últimos geram uma seqüência de partições e, ... nas matrizes esparsas Sw e Sb que são as matrizes intra-grupo

20

grupos de produtos freqüentemente comprados juntos, as forças de correlação e as suas

direções.

Page 21: Introdução - pgmat.ufba.br · e hierárquicos, sendo que os dois últimos geram uma seqüência de partições e, ... nas matrizes esparsas Sw e Sb que são as matrizes intra-grupo

21

Capítulo 2

Fundamentos de Imagens Digitais

Este capítulo tem o propósito de introduzir conceitos relacionados à imagem digital,

apresentando modelos abstratos para uma imagem e diversas formas de representação. O

interesse em métodos de processamento de imagens digitais decorre de duas áreas

principais de aplicação: melhoria da informação visual para a interpretação humana e o

processamento de dados de cenas para percepção automática através de máquinas.

Em medicina, por exemplo, procedimentos computacionais melhoram o contraste

ou codificam os níveis de intensidade em cores, de modo a facilitar a interpretação de

imagens radiográficas e outras imagens biomédicas. Geógrafos usam técnicas similares

para estudar padrões de poluição em imagens aéreas ou de satélites. Em arqueologia,

métodos de processamento de imagens têm restaurado fotografias borradas, que eram os

únicos registros disponíveis de artefatos raros perdidos ou danificados. Similarmente,

aplicações de processamento de imagens podem ser encontradas na física, astronomia,

biologia, medicina nuclear, apoio da lei, defesa e aplicações industriais. Esses são

exemplos de melhoria da informação visual para a interpretação humana.

No caso de problemas relacionados à percepção por máquinas, o interesse se

concentra em procedimentos para extrair de uma imagem informação de forma adequada

para o processamento computacional, como momentos estatísticos, medidas

multidimensionais, etc. Problemas típicos em percepção por máquinas, que rotineiramente

usam técnicas de processamento de imagens, são o reconhecimento automático de

caracteres, visão computacional industrial para a montagem e inspeção de produtos,

reconhecimento militar, processamento automático de impressões digitais, processamento

de imagens aéreas e de satélites para previsão do tempo e monitoração de plantio.

 

Page 22: Introdução - pgmat.ufba.br · e hierárquicos, sendo que os dois últimos geram uma seqüência de partições e, ... nas matrizes esparsas Sw e Sb que são as matrizes intra-grupo

22

2.1 Modelo de imagem

Uma imagem é definida como uma aplicação de um conjunto do plano, um retângulo na

prática, em um espaço de cor, conforme a expressão [G1]:

f : U ⊂ ℜ2 → ζ(ℜ3).

Esta definição, embora pareça um pouco abstrata, capta com precisão a noção de

que uma imagem é definida pelas cores dos seus pontos. O espaço de cor é o ℜ3 se for

usado um espaço perceptual de cor de dimensão 3. Assim, cada ponto da imagem tem sua

cor definida como uma tripla de números reais (x1,x2,x3), também conhecida como RGB,

onde R corresponde a cor vermelha, G a cor verde e B a cor azul.

2.2 A Discretização da Imagem

O armazenamento da imagem no computador cria um problema, pois a imagem contínua

possui infinitos pontos e precisamos uma representação finita, isto é, uma imagem discreta,

obtida a partir de um número finito de amostras colhidas da imagem original, as quais

serão codificadas para tornar possível o armazenamento.

Para codificar uma imagem, em geral, discretiza-se também o espaço de cor, para

que as informações possam ser armazenadas com um número finito de bits. A discretização

do espaço de cor é chamada de quantização [G1].

2.3 Representação Matricial

Considerando que o domínio espacial de uma imagem digital é um retângulo,

utiliza-se uma matriz para sua representação, isto é, pode-se fixar um par de eixos

ortogonais x e y, paralelos aos lados do retângulo, particionados uniformemente em células

de comprimento Δx e Δy, respectivamente. Através do produto cartesiano das células

correspondentes, obtemos uma matriz onde cada célula (i,j) é chamada de pixel, que

significa elemento da imagem.

Page 23: Introdução - pgmat.ufba.br · e hierárquicos, sendo que os dois últimos geram uma seqüência de partições e, ... nas matrizes esparsas Sw e Sb que são as matrizes intra-grupo

23

A etapa seguinte, a segmentação da imagem, vem auxiliar a interpretação de

imagens representadas por matrizes com grandes quantidades de dados.

2.4 Segmentação da Imagem

O processo de segmentação de uma imagem refere-se ao seu particionamento em

segmentos correspondentes a regiões homogêneas, segundo algum critério previamente

definido, existindo uma correspondência entre regiões e objetos ou pares de objetos na

cena. As técnicas de segmentação de imagens podem ser classificadas em duas categorias

distintas: abordagens baseadas em região, que buscam agrupar pixels em regiões de acordo

com a similaridade de suas propriedades, e abordagens baseadas em borda, que buscam

detectar mudanças abruptas de contraste na imagem.

2.4.1 Segmentação de Imagens por Agrupamento

Na segmentação de imagens por agrupamento os elementos da imagem dentro de

um grupo apresentam uma maior similaridade entre si. Essa similaridade é calculada pela

comparação de suas características, organizadas na forma de vetores (x1,x2,...,xn). A seleção

das características apropriadas representa um passo essencial na segmentação por

agrupamento, pois dados de dimensões muito grandes implicam em um esforço

computacional muito alto. Logo as características devem ser em pequeno número e com

alto grau discriminatório, associadas ao tipo de aplicação.

A segmentação de imagens por agrupamento apresenta algumas dificuldades, como

por exemplo, a obtenção de uma boa estimativa inicial sobre o número de regiões

desejadas, a verificação da conexão entre regiões e a atualização do número de regiões com

base nos resultados obtidos. Uma alternativa para superar estas deficiências é a sua

associação do agrupamento à técnica de detecção de bordas, que fornece uma indicação

inicial coerente sobre o número de regiões da imagem, isto é, o número de grupos e, além

disso, simplifica o processo de análise de conectividade entre estas regiões.

Page 24: Introdução - pgmat.ufba.br · e hierárquicos, sendo que os dois últimos geram uma seqüência de partições e, ... nas matrizes esparsas Sw e Sb que são as matrizes intra-grupo

24

O algoritmo de agrupamento será aplicado tomando por base as informações

fornecidas por um operador de borda padrão, utilizando como características as

componentes da normal a cada pixel. O número inicial K de regiões esperadas deve ser

fornecido ao algoritmo, sendo escolhido com base nas informações de bordas e, depois da

convergência, o resultado obtido é uma imagem composta por K regiões. Uma vez testada

a qualidade da segmentação, as informações de borda atuam como um parâmetro de

realimentação usado para o refinamento dos limites entre regiões vizinhas.

Ao final da etapa de segmentação será obtido um mapa de bordas que servirá de

base à aplicação da Transformada de Hough (TH) para detecção das curvas procuradas na

imagem digital.

Comentaremos a seguir algumas aplicações de agrupamento na área de imagem

digital. A primeira aplicação é um algoritmo para pesquisa em biblioteca de imagens à

procura daquelas que possuam certas características especificas como cores, texturas,

formas, etc. A segunda aplicação utiliza agrupamento na quantização de imagens coloridas.

A terceira aplicação utiliza elementos da geometria para auxiliar o diagnóstico de câncer de

intestino, na detecção de pólipos em imagens da tomografia computadorizada do cólon.

2.5 Consulta e Busca de Imagens Baseadas em Conteúdo

O algoritmo de consulta e busca de imagens baseadas em conteúdo visa selecionar

todas as imagens que possuem algumas características específicas em um banco de dados,

por exemplo, todas as imagens médicas armazenadas de pacientes com uma determinada

doença. Esta consulta é realizada através da comparação dos vetores de características de

uma imagem pesquisada, com todos os vetores das imagens armazenadas no banco de

dados. Para iniciar esta pesquisa são estabelecidas as características desejadas na imagem e

seus respectivos pesos de acordo com a sua importância [B2].

A idéia básica do algoritmo é combinar características simples para agrupá-las em

“modelos de consulta”, os quais são subdivididos em camadas que identificam uma

característica, sua função distância, peso e valor limite. Este limite descreve a distância

máxima entre uma imagem e a imagem pesquisada. As características podem ser

Page 25: Introdução - pgmat.ufba.br · e hierárquicos, sendo que os dois últimos geram uma seqüência de partições e, ... nas matrizes esparsas Sw e Sb que são as matrizes intra-grupo

25

selecionadas através de pesos, por propriedades ou por combinação. Os limites podem ser

obtidos a partir do peso de uma característica, o número provável de imagens retornadas,

ou por uma combinação linear destes métodos.

A figura 5 descreve o modelo do processo de consulta, no qual o usuário escolhe

inicialmente um grupo de imagens, define subjetivamente similaridade e pede a busca de

todas as imagens semelhantes a esse grupo.

Seleção do Usuário

Pesquisa de

Imagens

Geração do Modelo de Consulta

Descrição da Consulta

Execução da Consulta

Refinamento da Consulta

Resultados

Processamento da imagem

Julgamento de Relevância

Figura 5: modelo de consulta e refinamento.

Para cumprir esta tarefa, o algoritmo agrupa as imagens selecionadas e calcula um

modelo de consulta para cada agrupamento de imagens pesquisadas. Se o agrupamento

consiste de apenas uma imagem, o algoritmo é aplicado, caso contrário, o centróide do

agrupamento é utilizado como a imagem buscada e as características e limites são obtidos

através da média e variância das distâncias entre cada elemento do agrupamento e todos os

Page 26: Introdução - pgmat.ufba.br · e hierárquicos, sendo que os dois últimos geram uma seqüência de partições e, ... nas matrizes esparsas Sw e Sb que são as matrizes intra-grupo

26

outros elementos. Num processo iterativo de refinamento, o resultado pode ser melhorado

pela informação de relevância fornecida pelo usuário.

2.5.1 Conclusão

O algoritmo fornece um bom ponto de entrada para o processo iterativo de buscas,

pois este modelo possui a vantagem de reduzir a questão da subjetividade de interpretação

humana, além de ser mais simples do que o sistema de consulta tradicional. O usuário

precisa apenas selecionar exemplos para a consulta e indicar os resultados para o

julgamento de relevância.

2.6 Agrupamento de Par em Par para Quantização de Imagens Coloridas

A quantização de uma imagem digital é uma grande preocupação em computação

gráfica e processamento de imagens. A quantização corresponde a discretização do espaço

de cor da imagem.

A idéia proposta pelo agrupamento é identificar na imagem original N grupos de

cores similares de acordo com a medida de quantização. Estes grupos constituem as células

de quantização e para cada grupo será computado o respectivo nível de quantização [G2].

Para isto, é preciso definir a função quantização de cor q: C ⊂ ℜn → C’, onde ℜn é

o espaço de cor e C’⊂ ℜn é um subconjunto finito de cores deste espaço. Esta função

produz uma família de células de quantização Ci, que constituem uma partição de cores do

espaço C. A cada pixel de cor c na imagem está associado, através da função q, o valor ci =

q(c), chamado de nível de quantização da célula Ci.

A técnica de otimização de agrupamento de par em par é utilizada na procura de um

nível de quantização ótimo para a escala de cores. Este método consiste de um processo de

relaxação que computa a seqüência de níveis de quantização pela performance ótima local

de agrupamento de par em par, conforme descreve o algoritmo 1.

Page 27: Introdução - pgmat.ufba.br · e hierárquicos, sendo que os dois últimos geram uma seqüência de partições e, ... nas matrizes esparsas Sw e Sb que são as matrizes intra-grupo

27

Os dados de entrada para quantização são o conjunto finito C de M cores do espaço

de cor da imagem C = {c1, c2, ..., cM}. Cada cor ci tem a freqüência Fi = F(ci) e será

associado a um erro de quantização acumulado E(ci) inicialmente igual a 0.

Depois que os níveis de quantização são gerados, a quantização da imagem é

computada. Cada cor c da imagem é quantizada para o nível mais próximo usando a

métrica quadrática do espaço de cor.

1. Compute o histograma da imagem,

2. Compute o erro de quantização E(ci, cj) de todo grupo de duas de cores {ci,cj}

do conjunto de entrada,

3. Escolha o grupo de duas cores K0 = {ci,cj} do conjunto de entrada que

minimize o erro de quantização E(ci,cj) computado no passo anterior,

4. Compute o nível de quantização c do grupo K0 = {ci,cj} escolhido no passo 2,

5. Substitua o grupo K0 = {ci,cj} por seu nível de quantização ck. Isto resulta em

um conjunto quantizado de cores C’ com M-1 cores. A freqüência F(ck) é dada

pela soma de freqüências de ci e cj, ou seja, F(ck) = Fi + Fj e o erro de

quantização acumulado E(ck) da cor ck é dado por E(ck) = E(ci, cj) + E(ci) + E(cj),

6. Compute o erro de quantização de todo grupo de duas cores {ci,cj} do

conjunto C’,

7. Use o conjunto C’ como conjunto de entrada no passo 3 do algoritmo e

repita os passos 3 a 7 até que o número de níveis de quantização seja obtido.

Algoritmo 1: quantização de imagens

  2.6.1 Conclusão

Para demonstrar os resultados deste algoritmo de quantização de cores, foi selecionada

uma fotografia de papagaios, mostrada na figura 6. Para possibilitar a visualização dos grupos

de cores gerados pelo método em estudo, foi selecionado um detalhe de um papagaio com o

conjunto da componente azul zerado, como pode ser visto na figura 7A, de modo que o

espaço de cor da imagem é restrito ao plano vermelho-verde. Os conjuntos de cores são

Page 28: Introdução - pgmat.ufba.br · e hierárquicos, sendo que os dois últimos geram uma seqüência de partições e, ... nas matrizes esparsas Sw e Sb que são as matrizes intra-grupo

28

mostrados na figura 7B, onde os pontos coloridos têm uma área proporcional à freqüência de

suas cores associadas.

A imagem na figura 8A é quantizada para 16 cores por este método e as cores

produzidas são mostradas nas figuras 8A e 8B. Note como a partição do espaço de cor é bem

adaptada ao conjunto de cores da imagem.

Figura 6: imagem original RGB.

Figura 7: A) Detalhes de papagaios no plano de cores vermelho-verde à esquerda e B) área de pontos proporcional à freqüência de cores à direita.

Figura 8: A) Imagem em vermelho-verde quantizada para 16 cores à esquerda e B) grupos de cores e níveis de quantização à direita.

Page 29: Introdução - pgmat.ufba.br · e hierárquicos, sendo que os dois últimos geram uma seqüência de partições e, ... nas matrizes esparsas Sw e Sb que são as matrizes intra-grupo

29

As figuras 9 e 10 apresentam quantizações de cores de imagens originais. Os

resultados gerados pelo algoritmo de agrupamento de par em par (AAPP) são comparados

com aqueles gerados pelo algoritmo corte do mediano (ACM), os quais foram escolhidos

devido ao seu uso bastante amplo em aplicações de imagens.

Nas figuras 9A e 9B, as imagens de papagaios quantizadas para 256 cores em AAPP e

ACM parecem similares. A mais extrema quantização para 16 cores é mostrada nas figuras

10A e 10B, neste caso, ACM produziu cores que não estão presentes na imagem original,

especialmente no fundo onde aparecem áreas vermelhas.

Figura 9: papagaios quantizados para 256 cores. A) AAPP à esquerda e B) ACM à direita.

Figura 10: papagaios quantizados para 16 cores. (A) AAPP à esquerda e (B) ACM à direita.

Segundo Gomes e Velho o AAPP espalha o erro de quantização pela imagem

inteira, enquanto que ACM tende a concentrar o erro em algumas regiões [G2].

Page 30: Introdução - pgmat.ufba.br · e hierárquicos, sendo que os dois últimos geram uma seqüência de partições e, ... nas matrizes esparsas Sw e Sb que são as matrizes intra-grupo

30

2.7 Método Auxiliar Diagnóstico de Pólipos na Colonografia

O câncer de cólon é a segunda maior causa de mortes por câncer nos Estados

Unidos, muitas dessas mortes poderiam ser evitadas pelo diagnóstico precoce e remoção

dos pólipos precursores. Este diagnóstico é feito pela análise das imagens obtidas na

colonografia, entretanto a precisão deste diagnóstico pode ser comprometida por falhas

desde a obtenção até a interpretação destas imagens.

Para superar estas dificuldades, pesquisadores desenvolveram um método

diagnóstico assistido por computador para auxiliar o médico na detecção de pólipos,

(CAD), este método visa aumentar a precisão diagnóstica, além de reduzir o tempo gasto

na interpretação radiológica.

Inicialmente são selecionadas imagens das paredes do cólon obtidas através da

colonografia, em seguida são identificados os candidatos a pólipos através da extração dos

aspectos geométricos tridimensionais que efetivamente os caracterizam. Pólipos aderindo

às paredes do cólon devem aparecer relativamente pequenos, com estrutura convexa e em

forma de bulbo, ao passo que dobras do intestino aparecem alongadas, com estrutura de

cordilheira. Para caracterizar estas formas e medir as diferenças são utilizados dois

aspectos geométricos, o índice volumétrico e a curvatura volumétrica.

O índice volumétrico caracteriza a forma topológica de um elemento em relação a

sua vizinhança, cada forma distinta é classificada por um valor único de índice que varia

no intervalo de 0 a 1, conforme pode ser visto na figura 11. A curvatura volumétrica mede

a suavidade da curvatura de uma superfície, tendo medidas que variam de −∞ a +∞,

conforme ilustra a figura 12.

Figura 11: A) imagem do cólon e B) classificação de índice volumétrico

Page 31: Introdução - pgmat.ufba.br · e hierárquicos, sendo que os dois últimos geram uma seqüência de partições e, ... nas matrizes esparsas Sw e Sb que são as matrizes intra-grupo

31

Para identificação dos candidatos a pólipos são selecionados elementos de volume

com índice entre 0,9 e 1,0 e valores de curvatura geométrica entre 5,0 e 12,5 mm para

seleção de regiões onde os pólipos devem estar localizados. Em seguida, o CAD utiliza o

algoritmo de agrupamento flexível para reunir as múltiplas detecções de um mesmo pólipo.

Este algoritmo reúne dados de acordo com valores de características similares em um

mesmo grupo, que corresponde a um único pólipo maior, mas que gera múltiplas detecções

devido à rugosidade de sua superfície.

O algoritmo de agrupamento flexível mantém em pequeno e isolados grupos os

candidatos a pólipos cujos valores de características diferem muito dos elementos vizinhos

devido ao ruído. Em seguida é aplicado a cada grupo indivialmente um limiar com valor

mínimo de 35 mm3 para remover estes pequenos grupos ruidosos e manter apenas os

pólipos significativos com largura maior que 5 mm.

Figura 12: curvatura volumétrica.

No processo de detecção de pólipos também são detectadas estruturas semelhantes,

chamadas de falsos pólipos, que atrapalham o diagnóstico. O método CAD utiliza a

concentração direcional do gradiente combinado com o índice de variação volumétrica

para eliminar falsos pólipos, pois os vetores gradientes convergem para o centro de um

pólipo, formando uma concentração hemisférica, enquanto que restos de fezes são

alongados, em forma de cordilheira, e portanto, os vetores tangentes não se concentram em

um ponto particular como nos pólipos.

A detecção final dos pólipos é obtida através de classificadores estatísticos para

combinar os aspectos texturais, baseada na análise de discriminante quadrática [Y1].

Page 32: Introdução - pgmat.ufba.br · e hierárquicos, sendo que os dois últimos geram uma seqüência de partições e, ... nas matrizes esparsas Sw e Sb que são as matrizes intra-grupo

32

2.7.1 Conclusão

Pesquisadores esperam reduzir substancialmente o tempo gasto na interpretação dos

resultados da colonografia, mantendo, ou até mesmo aumentando a precisão no diagnóstico

do câncer, através do método CAD.

Page 33: Introdução - pgmat.ufba.br · e hierárquicos, sendo que os dois últimos geram uma seqüência de partições e, ... nas matrizes esparsas Sw e Sb que são as matrizes intra-grupo

33

Capítulo 3

A Transformada de Hough

Considerado um eficiente algoritmo computacional para detectar retas e curvas em

imagens binárias, a Transformada de Hough (TH) propõe aplicar à imagem uma

transformação, tal que todos os pontos pertencentes a uma mesma curva sejam mapeados

num único ponto de um espaço de parâmetros, também chamado de espaço de Hough. Por

exemplo, a representação de todas as retas existentes no plano de uma imagem pode ser

feita através de um espaço paramétrico bidimensional, no qual cada reta “se transforma”

em um único ponto, cujas coordenadas são os coeficientes angular e linear da reta

correspondente. A TH é aplicada aos dados de um mapa de bordas obtido na etapa de

segmentação da imagem e permite detectar praticamente qualquer tipo de curva, mesmo

aquelas pouco visíveis e fortemente ruidosas [C2].

3.1 Detecção de Retas através da TH

Analisaremos agora a aplicação da TH para detecção de retas na imagem digital,

utilizando primeiro a equação reduzida da reta e em seguida sua parametrização normal.

3.1.1 Aplicação da TH à Equação Reduzida da Reta

A abordagem da TH consiste em reescrever a equação geral das infinitas retas que

passam por um ponto (xi,yi) dada por y=f(x) definidas por:

yi=axi+b

para diferentes valores de a, o coeficiente angular, e b, o coeficiente linear, na forma

g(a)=b tal que:

b=−xia+yi (4)

Page 34: Introdução - pgmat.ufba.br · e hierárquicos, sendo que os dois últimos geram uma seqüência de partições e, ... nas matrizes esparsas Sw e Sb que são as matrizes intra-grupo

34

obtendo uma única reta no plano a-b associada a cada ponto (xi,yi). Para dois pontos

distintos (xi,yi) e (xj,yj), serão obtidas duas retas distintas no plano a-b cuja interseção, no

ponto (a’,b’), define os coeficientes da equação da reta que contém os respectivos pontos,

como se pode ver na figura 13.

Figura 13: Transformação dos pontos (xi,yi) e (xj,yj) no plano x-y em retas no plano a-b.

A vantagem da TH advém da subdivisão do espaço de parâmetros em células

acumuladoras, pela discretização dos valores de a entre amin e amax e de b entre bmin e bmax,

que são os domínios esperados dos valores dos coeficientes a e b. É construída uma matriz

de acumuladores onde cada célula de coordenadas (i,j) corresponde ao quadrado associado

às coordenadas (ai,bj). Inicialmente todos os valores A(i,j) dos acumuladores são zerados.

Em seguida, para cada ponto (xk,yk) varrem-se os valores de a entre amin e amax e calcula-se

os valores correspondentes de b usando a equação (4), arredondando os valores obtidos

para os valores mais próximos discretizados de b. Se a escolha de um dado a resulta em

uma solução b, acrescenta-se então uma unidade ao valor A(a,b) da célula correspondente.

No final de tal processo, quando todos os pontos (xk,yk) forem percorridos, um valor N

numa célula (i,j) dos acumuladores indicará que N pontos serão colineares na reta por

y=aix+bj.

A extração de retas existentes na imagem é efetuada através dos acumuladores de

valores mais altos, os quais indicam um maior número de pontos colineares. A precisão

dessa colinearidade é determinada pelo número de subdivisões do plano a-b, onde serão

Page 35: Introdução - pgmat.ufba.br · e hierárquicos, sendo que os dois últimos geram uma seqüência de partições e, ... nas matrizes esparsas Sw e Sb que são as matrizes intra-grupo

35

analisadas as relações de prioridades entre vários fatores, tais como: o grau de exatidão

pretendida na detecção das retas, o tempo despendido nos cálculos e a própria resolução da

imagem binária.

3.1.2 Aplicação da TH à Parametrização Normal da Reta

A dificuldade que ocorre no esquema anterior é que quando a reta torna-se vertical,

os valores de a e b tendem para o infinito. A solução consiste em parametrizar a reta na

forma normal, conforme demonstraremos a seguir.

São dados no plano x-y o ponto A=(xj,yj) e uma reta genérica r que contém este ponto. Ao

traçarmos a reta r’ que passa pela origem na direção perpendicular à r, será determinado

um ponto B=(xi,yi) de interseção destas retas, sendo

xi=ρ.cosθ e yi = ρ.senθ,

onde ρ é a distância do ponto B à origem e θ é o ângulo formado entre o eixo x e a reta r’,

conforme ilustra a figura 14.

0 y θ ρ •A B

r’ x

Figura 14: pontos A=(xj,yj) e B=(xi,yi) no plano x-y.

Os vetores v=(cosθ,senθ) e AB=(xj−ρ.cosθ,yj−ρ.senθ) são perpendiculares, portanto

seu produto escalar é nulo, isto é,

v.AB=(cosθ,senθ).(xj-ρ.cosθ,yj-ρ.senθ)=0.

Page 36: Introdução - pgmat.ufba.br · e hierárquicos, sendo que os dois últimos geram uma seqüência de partições e, ... nas matrizes esparsas Sw e Sb que são as matrizes intra-grupo

36

Desenvolvendo o produto escalar tem-se:

xj.cosθ−ρ.cos2θ+yjsenθ−ρ.sen2θ=0.

Colocando ρ em evidência e reescrevendo a expressão anterior chega-se a

ρ(cos2θ+sen2θ)=xjcosθ+yjsenθ,

ou mais simplesmente

ρ=xjcosθ+yjsenθ. (5)

Esta expressão denomina-se “parametrização normal”, sendo cada reta identificada

pelos parâmetros (θ,ρ). Deve-se observar que ao variarmos os parâmetros θ e ρ, obtemos o

conjunto de todas as retas que passam pelo ponto B=(xj,yj), que correspondem aos pontos

{(θ1,ρ1),...,(θk,ρk)} no plano θ-ρ.

O uso da parametrização normal na construção de uma matriz de acumuladores é

idêntico ao do método discutido anteriormente, porém curvas senoidais são formadas no

plano θ-ρ ao invés de retas, isto é, N pontos colineares levam a N curvas senoidais que se

cruzam em (θj,ρi) no espaço de parâmetros e a precisão da colinearidade desses pontos é

determinada pela escolha das subdivisões para θ e ρ. A partir da análise dos acumuladores

de maior valor pode-se chegar à detecção das retas existentes na imagem e, através da

Transformada Inversa de Hough,

TH−1:(θ,ρ)→(a,b),

reescrevendo a equação (5) obtemos

⎟⎠⎞

⎜⎝⎛+⎟

⎠⎞

⎜⎝⎛−=

θρ

θθ

sensencos xy .

Daí, as expressões que permitem obter as constantes a e b da reta são

θtga 1

−= e θ

ρsen

=b .

Na figura 15 ilustra-se a TH baseada na parametrização normal da reta.

Page 37: Introdução - pgmat.ufba.br · e hierárquicos, sendo que os dois últimos geram uma seqüência de partições e, ... nas matrizes esparsas Sw e Sb que são as matrizes intra-grupo

37

Figura 15: Cinco pontos rotulados no plano x-y transformados em cinco curvas senoidais no plano θ-ρ [G4].

A figura 15(A) mostra uma imagem com cinco pontos rotulados no plano x-y, que

são transformados em cinco curvas senoidais no plano θ-ρ, conforme a figura 15(B). O

domínio dos valores de θ é de ±90o, enquanto que o domínio dos valores de ρ é D2± ,

em que D é a distância entre os vértices opostos da imagem. A figura 15(C) evidencia o

fato de que as curvas correspondentes aos pontos 1, 3 e 5 se cruzam no ponto A, cuja

localização indica que estes três pontos estão sobre uma reta orientada a −45o passando

pela origem (ρ=0) e as curvas correspondentes aos pontos 2, 3 e 4 se cruzam no ponto B,

cuja localização indica que estes três pontos estão sobre uma reta orientada a 45o e com

distância até a origem igual a D)( 22 . Finalmente a figura 15(D) indica o fato de que a TH

exibe uma relação de adjacência reflexiva nos cantos direito e esquerdo do espaço de

parâmetros, isto é, os pontos A, B e C mostram como ρ e θ mudam de sinal nas fronteiras

±90o.

Page 38: Introdução - pgmat.ufba.br · e hierárquicos, sendo que os dois últimos geram uma seqüência de partições e, ... nas matrizes esparsas Sw e Sb que são as matrizes intra-grupo

38

A figura 16 mostra a imagem natural de uma cidade onde as construções não estão

perfeitamente visíveis por causa da neblina e a TH pode ser aplicada para detectar algumas

das linhas correspondentes aos contornos pouco visíveis, já que um detector de bordas não

obteve com clareza os contornos de cada construção, conforme ilustra a figura 17.

Figura 16: imagem natural de uma cidade

Figura 17: imagem obtida por um detector de bordas

A figura 18(A) mostra a representação da imagem original no espaço de parâmetros

e a figura 18(B) imagem obtida pela TH utilizando um limiar de 70%, onde apenas alguns

poucos contornos foram detectados, além de existirem muitos contornos obtidos em

duplicidade devido a sua fragmentação.

Page 39: Introdução - pgmat.ufba.br · e hierárquicos, sendo que os dois últimos geram uma seqüência de partições e, ... nas matrizes esparsas Sw e Sb que são as matrizes intra-grupo

39

Figura 18: (A) representação da imagem original no espaço de parâmetros e (B) imagem obtida pela TH utilizando um limiar de 70%

Figura 18(C): imagem obtida pela TH utilizando um limiar de 50%

Aplicando um limiar de 50%, conforme ilustra a figura 18(C), aumenta o número

de contornos obtidos, mas aumenta também o número de contornos em duplicidade.

Page 40: Introdução - pgmat.ufba.br · e hierárquicos, sendo que os dois últimos geram uma seqüência de partições e, ... nas matrizes esparsas Sw e Sb que são as matrizes intra-grupo

40

3.2 Aplicação da TH para Círculos

Embora a TH tenha sido introduzida para detecção de retas, é possível generaliza-la

para detectar círculos, elipses ou ainda uma curva qualquer parametrizável na forma h(v,c),

onde v é o vetor de coordenadas e c é o vetor de parâmetros. O problema que ocorre é o

aumento considerável do esforço computacional, decorrente do aumento da

dimensionalidade do espaço de parâmetros, pois estas curvas já não poderão mais ser

representadas num espaço bidimensional, como veremos a seguir.

Seja λ uma circunferência de centro (a,b) e raio r do plano x-y representada pela

equação

λ: (x−a)2+(y−b)2=r2.

Através da TH um ponto (xi,yi) pertencente a λ pode ser transformado numa

superfície cônica λ’ do plano paramétrico tridimensional a-b-r, definida por

λ’:(a-xi)2+(b−yi)2=r2.

Assim como o espaço paramétrico, os acumuladores também serão tridimensionais

para as configurações circulares na imagem. E, de modo análogo à detecção de retas, será

construída a matriz de acumuladores, onde um valor N numa célula (ai,bj,rk) indicará que N

pontos pertencem a circunferência λ no plano x-y definida por (x−ai)2+(y−bj)2=(rk)2. A

extração de circunferências existentes na imagem é efetuada através dos acumuladores de

maior peso, os quais representam pontos com maior número de interseções entre os cones

paramétricos. A figura 19 apresenta o ponto (a’,b’,r’) de interseção dos cones λ1, λ2 e λ3,

de origem (a1,b1,0), (a2,b2,0) e (a3,b3,0) respectivamente, do espaço a-b-r, no plano α:r=r’.

Este ponto define uma circunferência de centro (a’, b’) e raio r no plano x-y.

Page 41: Introdução - pgmat.ufba.br · e hierárquicos, sendo que os dois últimos geram uma seqüência de partições e, ... nas matrizes esparsas Sw e Sb que são as matrizes intra-grupo

41

Figura 19: plano α:r=r’, paralelo ao plano a-b, cortando os cones paramétricos λ1, λ2 e λ3 de, no ponto (a’,b’,r’) de interseção entre eles.

3.3 Comparação entre a TH e o Método de Agrupamento

Ao observamos uma imagem digital temos a impressão de estar diante de uma

imagem contínua, o que não é verdade. Uma reta, por exemplo, é formada por um número

finito de pontos. Isto pode ser observado através da matriz de acumuladores obtida pela

TH, onde os valores mais elevados, ou picos, desta matriz estão cercados por uma nuvem

de células vizinhas com valores também elevados que indicam “retas similares” que

compõem a reta observada na imagem digital.

Comparando a TH ao agrupamento, temos que cada reta da imagem digital

corresponde a um grupo de retas no espaço de parâmetros, reunidas ao redor de sua

representante padrão, que corresponde a reta identificada pelo respectivo pico da matriz de

acumuladores. O valor desse pico indica o número de pontos pertencentes a esta reta, além

de identificar seus respectivos coeficientes angular e linear. Os valores destes coeficientes

servem para medir as similaridades entre as retas dentro de um mesmo grupo.

Page 42: Introdução - pgmat.ufba.br · e hierárquicos, sendo que os dois últimos geram uma seqüência de partições e, ... nas matrizes esparsas Sw e Sb que são as matrizes intra-grupo

42

Apresentaremos a seguir duas aplicações da TH: a primeira, baseada nos trabalhos de

Geus [G3] e Kaggelides [K1], utiliza a TH na identificação dos olhos nas imagens de

tomografia computadorizada para planejamento de radioterapia e a segunda, baseada no

trabalho de Castro [C2], utiliza a TH na identificação da informação tátil e de proximidade

para controle de robôs com realimentação sensorial.

3.4 Localização de Olhos Através da TH em Tomografia Computadorizada, para

Planejamento de Radioterapia.

A radioterapia consiste na emissão de radiação para destruir tumores malignos ou pelo

menos manter o seu crescimento sob controle. A idéia básica é utilizar múltiplos feixes de

raios, fazendo com que a radiação se concentre na região doente e minimizando sua

incidência nas áreas saudáveis, conforme ilustra a figura 20.

A Tomografia Computadorizada (TC) é a modalidade de imagem médica mais

utilizada em planejamento de radioterapia, pois as imagens da TC podem fornecer

informações que ajudam a solucionar questões como [G3]:

• Localização do tumor;

• A definição da região-alvo; e

• O reconhecimento e a localização precisa das estruturas críticas que não podem ser

expostas a altos níveis de radiação, como é o caso dos olhos e da coluna cervical.

O processo de definição do volume-alvo é complexo, pois requer o conhecimento e a

experiência do médico para identificar os contornos da região doente em cada fatia da TC

separadamente. É imprescindível também identificar e localizar as regiões sensíveis onde a

exposição à radiação pode provocar efeitos colaterais indesejáveis. Os olhos são áreas que

estão no topo da lista de risco e devem ser levados em consideração durante os estágios de

planejamento.

Page 43: Introdução - pgmat.ufba.br · e hierárquicos, sendo que os dois últimos geram uma seqüência de partições e, ... nas matrizes esparsas Sw e Sb que são as matrizes intra-grupo

43

(A)

(B)

Figura 20: (A) e (B) imagens geradas através de rendering de volumes [G3], mostrando o crânio, o tumor na cor verde, as estilizações da espinha, os glóbulos oculares e alguns feixes de radiação.

Descreveremos a seguir um algoritmo que tem mostrado desempenho satisfatório na

tarefa de localizar automaticamente os olhos num conjunto de dados da TC do cérebro, o que

poupa tempo e minimiza o trabalho de segmentação manual do médico, acelerando todo o

processo de planejamento [K1].

3.4.1 Remoção de Fundo

No caso da imagem de TC apenas um terço dos pixels contém informações

significativas, o resto é considerado fundo. O primeiro passo é realizar uma análise para

Page 44: Introdução - pgmat.ufba.br · e hierárquicos, sendo que os dois últimos geram uma seqüência de partições e, ... nas matrizes esparsas Sw e Sb que são as matrizes intra-grupo

44

localizar áreas de interesse e remoção das características não desejadas na imagem, como por

exemplo, o suporte da cabeça. Após a junção de todos os cortes e identificação de cada

objeto, são apagados todos os pixels conectados aos objetos indesejáveis.

3.4.2 Encontro da Caixa Craniana

As fronteiras da caixa craniana são determinadas através da análise da assinatura. As

assinaturas verticais e horizontais do sistema são essencialmente o número de conjuntos de

pixels em cada linha ou coluna respectivamente. Uma vez localizada a cabeça e usando a

suposição de que a cabeça do paciente tem orientação para cima, espera-se que os olhos

estejam no topo da caixa craniana, portanto podemos localizá-los dentro de duas

subestruturas menores, usualmente 50 x 50 pixels.

3.4.3 Detecção de Bordas

A forma dos dados a serem processados é posteriormente reduzida pela aplicação de

um detector de bordas, para delinear mudanças de intensidade significativas entre diferentes

regiões dentro da imagem.

3.4.4 Encontro dos Círculos Utilizando a TH

A TH é utilizada na detecção dos círculos que contêm os olhos, devido ao seu bom

desempenho com dados incompletos ou degenerados. Mas a localização prévia da caixa

craniana e das subestruturas onde estão os olhos minimiza os problemas apresentados pela

TH, como os custos de espaço e tempo de processamento [K1].

Para a construção da matriz de acumuladores, cada pixel da detecção de bordas da

imagem vota numa estrutura de dados tridimensional (x,y,r) como um acumulador para todos

os pontos pertencentes ao círculo de centro (x,y) e raio r.

Page 45: Introdução - pgmat.ufba.br · e hierárquicos, sendo que os dois últimos geram uma seqüência de partições e, ... nas matrizes esparsas Sw e Sb que são as matrizes intra-grupo

45

3.4.5 Geração de Hipóteses

Anteriormente todos os processos foram aplicados a dados 2D, agora combinaremos

os resultados para conjuntos de dados 3D. O algoritmo de agrupamento ISODATA agrupa os

círculos sugeridos (x,y,r), juntamente com o número do corte e o número de votos que o

elegeram, no espaço x-y-z, onde z é o número do corte [C1]. Os diferentes agrupamentos

representam hipóteses diferentes para localização dos olhos e a hipótese dominante é

selecionada através do número de votos para cada agrupamento. O algoritmo ISODATA

tenta minimizar a dispersão total de agrupamento de modo a obter convergência.

3.4.6 Refinamento da Hipótese

A hipótese dominante é refinada através da implementação de uma segunda TH entre

membros do agrupamento selecionado, e para esferas. Cada membro vota em todas as

localizações possíveis de z e raio r dessa esfera hipotética. O raio varia num intervalo

conhecido dentro do qual esperamos que o olho esteja. Finalmente, a esfera selecionada é

usada como um filtro para rejeitar partes inconsistentes da hipótese. Após esse estágio, a

estimativa de posição do centro do olho é precisa.

3.4.7 Conclusão

O sistema descrito foi testado por Kaggelides e mostrou-se rápido e eficiente, portanto

uma solução alternativa confiável para ajudar o médico, reduzindo o tempo gasto na

segmentação manual. Foram feitos testes com cinco diferentes conjuntos de dados e localizou

os olhos com precisão satisfatória em todos eles. Os resultados podem ser observados na

figura 21.

Page 46: Introdução - pgmat.ufba.br · e hierárquicos, sendo que os dois últimos geram uma seqüência de partições e, ... nas matrizes esparsas Sw e Sb que são as matrizes intra-grupo

46

Figura 21: resultado da aplicação do sistema a cinco conjuntos de dados.

3.5 Integração de Informação Tátil em Robôs Dotados de Garra Servo-Controlada

Esta seção apresenta uma aplicação da TH na área de controle de robôs com

realimentação sensorial, em que a TH é utilizada na identificação das formas dos objetos que

devem ser carregados pelo robô. Através destas informações é estabelecida a melhor maneira

de segurar cada objeto pela garra servo-controlada de dois dedos paralelos, dotada de

integração de informação tátil e de proximidade [C2].

Este estudo foi baseado em uma estação de trabalho em ambiente MatlabTM em que

foram desenvolvidos algoritmos de processamento de informação tátil. A TH foi

implementada para a detecção de retas e circunferências na informação de tato.

3.5.1 Ambiente MatlabTM

A estação de trabalho permite ao usuário a aquisição, o armazenamento e o

processamento de informação tátil através da aplicação de diversos operadores dispostos

segundo os seguintes módulos: Aquisição de dados, Interface com o manipulador e a garra, e

Processamento de dados.

Page 47: Introdução - pgmat.ufba.br · e hierárquicos, sendo que os dois últimos geram uma seqüência de partições e, ... nas matrizes esparsas Sw e Sb que são as matrizes intra-grupo

47

O módulo de processamento é constituído de uma biblioteca de operadores de

filtragem, de aplicação de limiar, de detecção de contornos, de aplicação da TH e de

tratamento estatístico dos dados. Por sua vez, o módulo de interface com o manipulador torna

possível o envio de comandos ao robô em tempo real, enquanto que o módulo de aquisição de

dados permite uma comunicação direta com o sensor, e assim adquirir dados, armazená-los

em disco e visualizá-los em forma de gráficos.

3.5.2 Apresentação dos Operadores

A detecção de contornos em imagens de tato pode ser abordada através de técnicas

baseadas nas características físicas da matriz de tato, ou através de técnicas convencionais de

processamento de imagem. Para se obterem os atributos desejados da informação, os dados

de tato devem sofrer vários níveis de processamento. Um dos operadores de pré-

processamento é a filtragem no domínio do espaço, que pode ser expresso por,

g(x,y)−h[f(x,y)]

sendo f(x,y) a imagem tátil inicial e g(x,y) a imagem resultante da operação h.

Imagens binárias podem ser geradas por aplicação de um limiar ou de um processo de

filtragem. No caso do sensor de tato, a ausência de pressão pode corresponder ao nível 0 e a

existência de pressão ao nível 1.

A aplicação de limiar a uma imagem é uma das técnicas mais utilizadas de detecção

de contornos, na fase pré-processamento. A função deste operador é preservar os pixels que

são relevantes na definição do contorno do objeto e desprezar os restantes. A operação limiar

consiste em confrontar os valores dos pixels da matriz com um dado valor limiar T que é

função da amplitude do pixel de coordenadas (x,y), f(x,y), e de uma dada propriedade local

do pixel, p(x,y), como por exemplo a amplitude média da vizinhança centrada no respectivo

pixel (x,y).

A imagem resultante da aplicação do limiar é definida por:

1, se f(x,y)>T

g(x,y)=

0, se f(x,y)≤T

Page 48: Introdução - pgmat.ufba.br · e hierárquicos, sendo que os dois últimos geram uma seqüência de partições e, ... nas matrizes esparsas Sw e Sb que são as matrizes intra-grupo

48

na qual os pixels em g(x,y) com valor 1 correspondem ao contorno e os de valor 0

correspondem ao fundo da imagem. O limiar aplicável a uma imagem pode ser otimizado,

considerando o histograma bimodal da imagem, que apresenta informação relativa à imagem

de contato e ao fundo.

3.5.3 Aplicação da TH aos Dados do Sensor Matricial de Tato

Através da aplicação da TH a representação de qualquer reta existente no plano da

imagem tátil é feita por um único ponto do espaço de parâmetros, sendo cada reta

identificada pelos parâmetros (ρ,θ),

Segundo a metodologia sugerida em Duda e Hart (1973), é necessário quantificar o

plano θ-ρ para um erro aceitável de θ e ρ. O que confina estes parâmetros às regiões

θ ∈ [0,π] e

ρ ∈ [-R,R],

onde R representa o valor máximo de ρ. Esta quantificação dá origem a dois acumuladores

bidimensionais, o acumulador positivo de dimensão (θ, ρ ∈ [0,R]) e o acumulador negativo

de dimensão (θ, ρ ∈ [−R,0]).

Em relação à detecção de configurações circulares na informação tátil, o acumulador

necessário teria que ser tridimensional, como vimos na seção 4.2, mas em vez de um

acumulador tridimensional, foram implementados dois acumuladores bidimensionais (r,a) e

(r,b). Do preenchimento destes dois acumuladores resulta, para os valores de maior peso, o

cone paramétrico (a’,b’,r’), que representa o centro do círculo com as coordenadas

cartesianas (a’,b’) e o raio r’.

3.5.4 Estratégias de Análise dos Acumuladores

A técnica mais usual na análise dos acumuladores é a aplicação de um limiar global,

que pode ser escolhido com base num dado objetivo ou por análise da distribuição dos pesos

no acumulador. Na estação de MatlabTM está implementado um algoritmo que efetua um

Page 49: Introdução - pgmat.ufba.br · e hierárquicos, sendo que os dois últimos geram uma seqüência de partições e, ... nas matrizes esparsas Sw e Sb que são as matrizes intra-grupo

49

limiar global aos acumuladores, sendo o valor do limiar introduzido pelo usuário ou com base

em critérios heurísticos.

3.5.5 Exemplos

Como ilustração de uma aplicação de desenvolvimento usando a estação de trabalho

descrita, apresenta-se a detecção de um contorno gerado pelo contato de aresta de um objeto

cúbico com a superfície planar do sensor. A figura 22A mostra os dados originais fornecidos

pelo sensor. Para tal objetivo foi utilizada a seguinte seqüência de operadores:

iFiltro de mediana iterativo, com a finalidade de eliminar o ruído existente nos

dados sem destruir os contornos, conforme a figura 22B;

iOperador de limiar com um valor de limiar inferido do histograma bimodal;

iTH na detecção da linha reta, como pode ser observado na figura 22C.

Como exemplo da aplicação da TH à informação tátil dos dados da experiência com

um objeto de forma anelar, a figura 23 representa o contorno da última leitura de seus dados,

e a respectiva circunferência detectada pela TH.

3.5.6 Conclusão

A resposta dinâmica do sensor de tato, como realimentação sensorial de informação

tátil num sistema de controle foi considerada bastante satisfatória, pois os sensores de

proximidade revelaram grande aptidão para orientação e posicionamento da garra em relação

às superfícies do objeto. A capacidade de integração de informação tátil e de proximidade

permite a execução da fase de pré-contato sem que haja interação física entre a garra e o

objeto, tornando possível a preensão de objetos na presença de incerteza posicional.

Page 50: Introdução - pgmat.ufba.br · e hierárquicos, sendo que os dois últimos geram uma seqüência de partições e, ... nas matrizes esparsas Sw e Sb que são as matrizes intra-grupo

50

(A) informação tátil adquirida (B) informação tátil filtrada.

(C) visualização no plano cartesiano. Figura 22: reta detectada pela TH

Figura 23: circunferência detectada pela TH.

Page 51: Introdução - pgmat.ufba.br · e hierárquicos, sendo que os dois últimos geram uma seqüência de partições e, ... nas matrizes esparsas Sw e Sb que são as matrizes intra-grupo

51

Capítulo 4

Conclusão

A presente dissertação apresentou dois algoritmos distintos, mas com a finalidade comum

de promover uma organização dos dados em grupos, facilitando, ou até mesmo tornando

viável, seu processamento em tempo real. As ferramentas matemáticas envolvidas nestes

algoritmos são bastante simples, o que os torna mais práticos e de fácil entendimento.

O algoritmo de agrupamento compara as características dos dados, medidas por valores

numéricos, formando um número predefinido de grupos de dados, de acordo com as

similaridades desejadas nas características. Entre os dados de um mesmo grupo será eleito

um elemento chamado de representante padrão, cujo cálculo envolve a definição de uma

medida de distância matemática adequada à aplicação específica. O representante padrão

será aquele elemento que possui características de valores mais próximos em relação às

respectivas características dos outros elementos.

Embora estas não sejam suas únicas aplicações, este trabalho de pesquisa foi direcionado à

segmentação de imagens digitais, onde os algoritmos de agrupamentos têm se mostrado

muito eficientes. Isto pode ser observado através dos artigos estudados e comentados ao

longo desta dissertação.

O algoritmo da Transformada de Hough tem a finalidade de detectar determinadas curvas

presentes na imagem digital. Sua idéia básica é organizar uma matriz de dados onde cada

célula indica a quantidade de pontos pertencentes a uma mesma curva. A TH permite a

localização de qualquer curva, desde que esta seja parametrizável, mas quanto maior a

complexidade da curva, maior será o tempo gasto no processamento [C2]. Esta pesquisa se

restringiu apenas ao estudo de detecção de retas e circunferências através da TH. A

aplicação da TH para outros tipos de curvas pode ser objeto de um trabalho futuro.

Pudemos observar uma grande diversidade de trabalhos onde o agrupamento e a TH têm

contribuído de modo satisfatório na identificação de elementos importantes na imagem

digital. Dentre os artigos estudados, comentaremos os mais interessantes.

Page 52: Introdução - pgmat.ufba.br · e hierárquicos, sendo que os dois últimos geram uma seqüência de partições e, ... nas matrizes esparsas Sw e Sb que são as matrizes intra-grupo

52

Análise e avaliação de técnicas de segmentação utilizando agrupamento rígido e

flexível [B2]. Este artigo apresenta os resultados da segmentação de imagens digitais de

pacientes queimados para facilitar o diagnóstico e o estabelecimento do tratamento. Esta

segmentação é feita através de três algoritmos de agrupamento, o algoritmo rígido C-médio

e os algoritmos flexíveis k-vizinho próximo e C-médio.

Agrupamento de múltiplas características para segmentação de seqüências de

imagens fotográficas [K2]. Este artigo discute um método de organização de

características para gerar a resolução desejada nas fotografias, baseado no método de

agrupamento de rede neural de mapeamento.

Filtragem adaptativa de manchas para imagens de sonar usando agrupamento

estatístico [M1]. Este artigo apresenta um filtro adaptativo para reduzir manchas em

imagens de sonar, que utiliza o algoritmo de agrupamento K-médio para acumular pixels

com dados estatísticos semelhantes. A TH é utilizada para avaliar a dispersão ao longo das

bordas retas da imagem filtrada e reduzir a interferência de ruídos entre pontos de objetos

diferentes.

Visualização 3D e análise metodológica: A perspectiva presente [U1]. Este artigo

apresenta um sistema voltado a provisão de informações de imagens médicas obtidas em

exames como Radiografia Digital, Tomografia Computadorizada e Ressonância Magnética

entre outros, que utiliza o algoritmo de agrupamento k-vizinho próximo na segmentação

destas imagens.

Registro nacional de prontuários médicos [P1]. Este artigo é apresentado um banco de

dados cuja principal finalidade é fornecer os dados médicos de um paciente em casos de

atendimentos de urgência, principalmente se o paciente não possui condições de fornecer

as informações necessárias, como doenças pré-existentes ou alergias a medicamentos. O

algoritmo de agrupamento é utilizado neste sistema para organizar centenas de milhares de

dados de acordo similaridades entre as suas características.

Page 53: Introdução - pgmat.ufba.br · e hierárquicos, sendo que os dois últimos geram uma seqüência de partições e, ... nas matrizes esparsas Sw e Sb que são as matrizes intra-grupo

53

Referências Bibliográficas

[B1] BELLON, O. R. P.; CASTANHO, J. E. C. Segmentação/ reconstrução de imagens de

profundidade associando detecção de bordas e agrupamento, Anais do VIII

SIBGRAPI, p. 219-226, 1995.

[B2] BERTANZOS, A. A.; VARELA, B. A.; MARTINEZ, A. C. Analysis and evaluation of

hard and fuzzy clustering segmentation techniques in burned patient images,

Image and vision computing, Elsevier Science, 18: p. 1045-1054, 2000.

[B3] BELL, G. B.; SETHI, A. Matching records in a national medical patient index,

Communications of the ACM, vol. 44, n0 9, p. 83-89, 2001.

[C1] CELINSKI, T. M. Métodos de agrupamento: uma abordagem comparativa com

aplicação em segmentação de imagens de profundidade. Curitiba, 1998. Tese de

Mestrado em Informática – SCE, UFPR.

[C2] CASTRO, D. J. L. Garra servo-controlada com integração de informação táctil e de

proximidade. Coimbra, 1996. Tese de Mestrado – DEE - FCT, Universidade de

Coimbra - Portugal.

[E1] EIDENBERGER, H. Query model-based content-based image retrieval: similarity

definition, aplication and automation, Vienna University of Technology,

Institute of Software Technology, 11/188, A-1040, Vienna, Áustria.

[G1] GOMES, J.; VELHO, L.; ROMA, P. Introdução à computação gráfica, Notas do

programa do curso de verão, IMPA, 1995.

[G2] GOMES, J.; VELHO, L.; SOBREIRO, M. V. R. Color Image Quantization by Pairwise

Clustering, IMPA – Rio de Janeiro, RJ

Page 54: Introdução - pgmat.ufba.br · e hierárquicos, sendo que os dois últimos geram uma seqüência de partições e, ... nas matrizes esparsas Sw e Sb que são as matrizes intra-grupo

54

[G3] GEUS, K. Visualização 3D em planejamento de radioterapia usando rendering de

volumes por Ray Casting, Anais do SIBGRAPI VI, p. 303-312, 1993.

[G4] GONZALEZ, R.; WOODS, R. E. Processamento de Imagens Digitais, Ed. Edgard

Blücher Ltda, p. 308-312, 2000.

[H1] MING, C. HAO, et alli. Visualization of Direted Associations in E-comerce Transations

Data, Joint EG-IEEE TVCG IEEE IV Symposium on Visualization – 2001.

[K1] KAGGELIDES, K.; ELLIOTT, P. J.; FISHER, R. B. Automatic location of eyes in CT

images, Computer Assisted Radiology, p. 683-388, 1993.

[K2] KIM, J.; CHEN, T. Multiple feature clustering for image sequence segmentation, Pattern

Recognition Letters, 22: p. 1207-1217, 2001.

[M1] MEDEIROS, F. N. S.; MASCARENHAS, N. D. A.; COSTA, L. F. Adaptative speckle

MAP filtering for SAR images using statistical clustering, IEEE, p. 303-310,

1998.

[P1] PLATT, J. C.; CZERWINSKI, M.; FIELD, B. A. Photo TOC: Automatic clustering for

browsing personal photographs, 1 Microsoft way Redmond, WA98052,

Technical report, 2002.

[U1] UDUPA, J. K., Three dimensional visualization and análisis methodologies: A current

perspective, Radiographics, 19: p. 783-806, 1999.

[Y1] YOSHIDA, H.; NAPPI, I.; MACENEANEY, P.; RUBIN, D. T.; DACHMAN, A.

Computer-aided diagnosis scheme for detection of polyps at CT colonography,

Radiographics, p. 963-979, 2002.