técnicas de reconhecimento automatizado de imagens digitais

44
Fátima Aparecida Tagliaferro 0402007 TÉCNICAS DE RECONHECIMENTO AUTOMATIZADO DE PADRÕES BASEADOS EM IMAGENS DIGITAIS. Jaguariúna 2007

Upload: ralf-junior

Post on 04-Jul-2015

987 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Técnicas de reconhecimento automatizado de imagens digitais

Fátima Aparecida Tagliaferro

0402007

TÉCNICAS DE RECONHECIMENTO AUTOMATIZADO DE

PADRÕES BASEADOS EM IMAGENS DIGITAIS.

Jaguariúna

2007

Page 2: Técnicas de reconhecimento automatizado de imagens digitais

Fátima Aparecida Tagliaferro

0402007

TÉCNICAS DE RECONHECIMENTO AUTOMATIZADO DE

PADRÕES BASEADOS EM IMAGENS DIGITAIS.

Monografia apresentada a disciplina Trabalho de Graduação III do Curso de Ciência da Computação da Faculdade de Jaguariúna, sob a orientação do Prof. Ms. Peter Jandl Junior, como exigência para a conclusão do curso de graduação.

Jaguariúna

2007

Page 3: Técnicas de reconhecimento automatizado de imagens digitais

TAGLIAFERRO, Fátima Aparecida Tagliaferro. Técnicas de reconhecimento

automatizado de padrões baseados em imagens digitais. Monografia defendida e

aprovada na Faculdade de Jaguariúna em 13 de dezembro de 2007 pela banca

examinadora constituída pelos professores:

___________________________________ Prof. Ms. Peter Jandl Junior – FAJ – Orientador __________________________________ Prof. Ms. Christiane Novo Barbato – FAJ ____________________________________ Prof. Ms. Ricardo Menezes Salgado – FAJ

Page 4: Técnicas de reconhecimento automatizado de imagens digitais

Dedico este trabalho a Deus e a minha família.

Page 5: Técnicas de reconhecimento automatizado de imagens digitais

AGRADECIMENTOS

Em primeiro lugar agradeço a Deus por tudo porque sem ele, com certeza, eu não

estaria aqui e pela minha família que sempre esteve presente.

Agradeço também aos meus professores, pela dedicação e empenho, e em especial

ao meu orientador Prof. Ms. Peter Jandl Junior, que me ensinou a buscar soluções para o

meu projeto.

Aos funcionários da FAJ que sempre realizaram um excelente trabalho, em principal às

funcionárias da biblioteca e do Núcleo de Estágios.

Pela compreensão, ajuda e amizade: a turminha do Núcleo de Informática do Hospital

das Clínicas da Unicamp; ao Prof. Ricardo Menezes Salgado da Faculdade de Jaguariúna; e

ao Prof. Konradin Metze, coordenador do Grupo de Patologia Analítica Celular da Unicamp.

Como não poderia deixar de ser, agradeço também aos meus colegas de classe, aos

que partiram para novos horizontes e aos que hoje estão aqui partilhando da mesma vitória:

Elis C. M. Garavelli, José Antonio Garavelli e Luciani Vilas Boas.

Para evoluirmos e colhermos bons frutos é preciso descobrir uma fórmula balanceada

que permita desorganizar organizando. Ousando desorganizar nossos pensamentos, nós

nos tornamos capazes de formular novos pensamentos e assim, evoluímos e adquirimos

sabedoria, uma sabedoria afogada em informações e aflorada de dúvidas, uma sabedoria

que gera medo, mas que, com um pouco de imaginação, transforma-se em bons frutos.

No entanto, para que seja dado o primeiro passo rumo ao desconhecido, é necessário

um grande sonho, um sonho grande o suficiente que nos leve a superar os desafios

impostos no caminho, e amigos.

Não sei se consegui adquirir sabedoria, mas com toda certeza descobri muitas coisas

novas, das quais espero colher bons frutos no futuro.

Page 6: Técnicas de reconhecimento automatizado de imagens digitais

Imagination is more important than knowledge.

Albert Einsten

Page 7: Técnicas de reconhecimento automatizado de imagens digitais

TAGLIAFERRO, Fátima Aparecida. Técnicas de reconhecimento automatizado de padrões baseados em imagens digitais. 2007. Monografia (Bacharelado em Ciência da Computação) – Curso de Ciência da Computação da Faculdade de Jaguariúna, Jaguariúna.

RESUMO

O reconhecimento de padrões possui aplicações em muitos domínios, permitindo a identificação de dados de maneira mais eficaz do que por meio da visão humana, porque consegue eliminar ou reduzir os erros ocasionados pelo cansaço ou fadiga, por exemplo. A área é dividida em: visão computacional; processamento de dados; computação gráfica; e processamento de imagens. Isto também envolve: forma de aquisição da imagem, identificação de estruturas, quantificação, visualização e interpretação. Este trabalho pretendeu estudar as técnicas de reconhecimento de imagens digitais e realizar a implementação de algoritmos aplicados ao problema de identificação e contagem de células sangüíneas. O método escolhido consiste de pesquisa bibliográfica; estudo das técnicas de reconhecimento; codificação e testes de algoritmos escolhidos; e análise dos resultados obtidos. A classificação prévia das imagens determina os algoritmos adequados para o reconhecimento. Softwares como o Scion Image foram usados para o reconhecimento e contagem de células sanguíneas específicas em imagens digitais tipo bitmap. A imagem dada é pré-processada para remoção de seu fundo e passa por transformações adicionais para adequá-la ao reconhecimento. As células desejadas são parametrizadas por meio de seus tamanhos mínimo e máximo, possibilitando obtenção de sua contagem.

Palavras-chave: RECONHECIMENTO DE PADRÕES; IMAGENS DIGITAIS; VISÃO COMPUTACIONAL.

Page 8: Técnicas de reconhecimento automatizado de imagens digitais

TAGLIAFERRO, Fátima Aparecida. Técnicas de reconhecimento automatizado de padrões baseados em imagens digitais. 2007. Monografia (Bacharelado em Ciência da Computação) – Curso de Ciência da Computação da Faculdade de Jaguariúna, Jaguariúna.

ABSTRACT

The recognition of patterns has applications in many domains, allowing a data identification in a more efficient way than by human vision, because it can eliminate or reduce the mistakes caused by tiredness or fadigue for example. The area is divided in: computer vision; data processing; computer graphics; and image processing. This also involves: way of acquisition of the image; identification of structures; quantification; visualization and comprehension. This work intended to study the techniques of recognition of digital images and hold the implementation of the algorithms applied to the problem of identification and counting of blood cells. The chosen method consists of a bibliographic research, study of techniques of recognition, coding and testing of the chosen algorithms and analysis of results. The previous classification of images determines the adequate algorithms to the recognition. Softwares as the Scion Image were used to the recognition and counting of specific blood cells in digital images as bitmap. The given image is pre-processed for removal of its fund and undergoes additional changes to accommodate it to the recognition. The desired cells are analyzed through their minimum and maximum sizes making their counting possible.

Keywords: PATTERN RECOGNITION; DIGITAL IMAGE; COMPUTER VISION.

Page 9: Técnicas de reconhecimento automatizado de imagens digitais

SUMÁRIO

LISTA DE FIGURAS......................................................................................................... 10

LISTA DE TABELAS......................................................................................................... 11

1 INTRODUÇÃO ............................................................................................................... 12

1.1 Metodologia................................................................................................................ 13

2 CONCEITO DE IMAGEM............................................................................................... 14

2.1 Visão Computacional................................................................................................ 15

2.2 Questões do processamento visual........................................................................ 17

2.3 Imagem Digital........................................................................................................... 19

3 ALGORITMOS................................................................................................................ 22

4 RECONHECIMENTO E INTERPRETAÇÃO.................................................................. 24

4.1 Métodos de decisão................................................................................................... 26

4.2 Classificador de distância mínima / distância Euclidiana..................................... 27

4.3 Classificador Bayesiano........................................................................................... 27

4.4 Filtros.......................................................................................................................... 28

4.5 Segmentação da imagem.......................................................................................... 29

5 TECNOLOGIA DE SOFTWARE.................................................................................... 30

5.1 Matlab.......................................................................................................................... 30

5.2 Scion Image................................................................................................................ 32

6 TESTES.......................................................................................................................... 33

6.1 Matlab.......................................................................................................................... 34

6.1.1 Pseudo-código........................................................................................................ 36

6.2 Scion Image................................................................................................................ 37

6.2.1 Pseudo-código........................................................................................................ 39

7 RESULTADOS............................................................................................................... 40

8 REFERÊNCIAS BIBLIOGRÁFICAS.............................................................................. 41

9 ASSINATURAS.............................................................................................................. 44

Page 10: Técnicas de reconhecimento automatizado de imagens digitais

LISTA DE FIGURAS

Figura 1 - Rel. dos trabalhos pub. em congressos pelo Grupo Vision - USP.............. 12

Figura 2 - Velha Moça.................................................................................................. 13

Figura 3 - Macro-áreas da imagem digital.................................................................... 14

Figura 4 - Processo e elementos da visão computacional........................................... 15

Figura 5 - Fatos explícitos em imagens....................................................................... 17

Figura 6 - Diagrama de agulhas................................................................................... 17

Figura 7 - Generalização de volumes.......................................................................... 17

Figura 8 - Representação numérica de uma imagem ampliada de 10 x 10 com 256 tons de cinza................................................................................................ 19

Figura 9 - Vetor de componentes de imagens coloridas (RGB)................................... 19

Figura 10 - Relação entre comprimento e velocidade de onda...................................... 20

Figura 11 - Espectros de luz.......................................................................................... 20

Figura 12 - Espectro eletromagnético............................................................................ 20

Figura 13 - Nível alto de dificuldade no reconhecimento de imagem............................ 25

Figura 14 - Representação por cadeias......................................................................... 25

Figura 15 - Fronteira das classes usando o classificador bayesiano............................. 28

Figura 16 - Macro Threshold do Software Scion Image................................................. 29

Figura 17 - Tela de abertura do programa Matlab......................................................... 30

Figura 18 - Uso de matrizes no Matlab.......................................................................... 31

Figura 19 - Janela do Software SDC Morphology Toolbox for Matlab........................... 31

Figura 20 - Tela de abertura do programa Scion Image................................................ 32

Figura 21 - Elementos figurados do sangue.................................................................. 33

Figura 22 - Macro utilizada no Matlab............................................................................ 36

Figura 23 - Macro utilizada no Scion Image................................................................... 38

Page 11: Técnicas de reconhecimento automatizado de imagens digitais

LISTA DE TABELAS

Tabela 1 - Funções da visão humana e da máquina.................................................... 16

Tabela 2 - Classificação das tarefas para sistemas de visão de computadores.......... 18

Tabela 3 - Seqüência de testes realizados no software Matlab................................... 35

Tabela 4 - Seqüência de testes realizados no software Scion Image.......................... 38

Page 12: Técnicas de reconhecimento automatizado de imagens digitais

12

1 INTRODUÇÃO

Se há décadas atrás, não seria possível imaginar a robótica, o reconhecimento da fala

e a computação paralela, hoje é aceitável a idéia de que um computador possa fazer no

futuro próximo o reconhecimento de pessoas mantendo com elas um diálogo agradável.

Quando o tema deste trabalho foi escolhido, esperava-se encontrar um mundo ainda

inexplorado, no entanto, surpreendentemente, foi verificado que as técnicas de visão e

processamento digital encontram aplicações nos mais diversos domínios, como por

exemplo: medicina, automação industrial, cartografia, geologia, sensoriamento remoto etc.

Estas áreas são marcadas por envolverem métodos, conceitos e algoritmos de várias

disciplinas, como, matemática, física, engenharia elétrica e computação, sendo objeto de

estudos de diversas universidades de renome há muitos anos.

Em matéria sobre saúde animal do Jornal da USP, Miguel Glugoski reporta Arthur

Gruber, professor do Departamento de Parasitologia do Instituto de Ciências Biomédicas e

pesquisador da USP:

“... a utilização de algoritmos computacionais para a análise e reconhecimento de formas tem sido freqüente em várias aplicações, como a identificação de impressões digitais e faces humanas. Contudo, a aplicação totalmente integrada e automatizada dessa tecnologia para o diagnóstico remoto de agentes patogênicos é inédita no mundo e representa novo paradigma na área de diagnóstico de parasitas. Em razão desse ineditismo, um artigo científico do grupo da USP, descrevendo o sistema Coccimorph, acaba de ser publicado no mais importante periódico cientifico da área de reconhecimento de padrões, a revista Pattern Recognition, nos Estados Unidos”(Gruber apud Glugoski, 2007).

Pode-se ter uma noção do crescimento da área, ao passar dos anos, através da

Figura 1, que mostra um gráfico com a relação dos trabalhos publicados, pelo grupo de

pesquisa de visão computacional da USP, em anais de congressos, ele foi obtido através de

um script desenvolvido na linguagem perl, fazendo a extração e compilação das publicações

de uma lista de códigos Lattes, do site do CNPq.

Figura 1 – Rel. das publicações em congressos (Mena-Chalco; César Jr, 2007).

Page 13: Técnicas de reconhecimento automatizado de imagens digitais

13

O processo de classificação de imagens visual, feito pelo homem, é muito eficaz,

porém sujeito à falhas ocasionadas pelo cansaço, fadiga etc. Um diagnóstico utilizando

visão computacional não elimina ou substitui o profissional porém, ajuda a diminuir

estatísticas de erros em processos críticos.

“Um diagnóstico mais preciso evitaria estatísticas como essa, revelada em trabalho da pesquisadora Maryellen Lissak Giger, publicado em 2000 na revista Computing in Science and Engineering: 10% a 30% das mulheres que fazem a mamografia e recebem resultado negativo têm, na verdade, câncer de mama” (Angelo apud Moraes, 2007).

Outro fator importante, no processo, é que nem sempre profissionais com a mesma

competência possuem a mesma opinião sobre a mesma imagem. Na Figura 2, é possível

observar uma famosa imagem da qual o Prof. Metze comenta:

“À primeira vista, trata-se do perfil de uma jovem delicada, com cabelos longos e uma gargantilha que lhe orna o pescoço. Focando o olhar nos cabelos, porém, vemos as rugas de uma velha senhora de nariz enorme e desdentada. “É uma brincadeira para demonstrar que a mesma imagem, vista por dois observadores, pode gerar opiniões diferentes. Por isso, experts nem sempre têm a mesma opinião sobre determinada imagem microscópica”, justifica o anatomopatologista” (Metze apud Sugimoto, 2007).

Figura 2 - Velha Moça (CCS, 2007).

1.1 Metodologia

O objetivo deste trabalho foi fazer um estudo das técnicas usadas no reconhecimento

de imagens, além de um estudo de algoritmos de reconhecimento de imagens e a

implementação na contagem e identificação de células sangüíneas. Como em geral, as

soluções do campo de processamento de imagens requerem um extenso trabalho

experimental envolvendo simulações e teste, para a implementação dos algoritmos foram

utilizados os softwares Scion Image e Matlab.

No trabalho foram realizadas pesquisas bibliográficas, através de livros, revistas e

sites especializados, além de discussões com profissionais da área.

Page 14: Técnicas de reconhecimento automatizado de imagens digitais

14

2 CONCEITO DE IMAGEM

Durante a vida, tudo o que é sentido, ouvido e visto é relacionado a padrões já pré-

estabelecidos, os recursos ópticos são os responsáveis por fazer o registro e a ampliação

destas sensações. O primeiro grande passo da humanidade para a evolução do registro

visual foi à descoberta da fotografia e, graças aos computadores, é possível transformar os

dados contidos nas imagens em informações quantificadas, expressando assim cor, brilho,

estrutura etc.

Os olhos humanos funcionam como se fossem câmeras fotográficas perfeitas, sendo

que em cada olho têm-se em torno de 125 milhões de receptores visuais, no entanto, as

ilusões de ótica demonstram que a visão compete por atenção do cérebro. (Pinker, 2007;

Menezes, 2007). O mecanismo de funcionamento dos olhos é composto de uma abertura

para passagem de luz, de uma lente e um anteparo, onde a imagem é recebida e registrada,

e é utilizado para a formação dos conceitos das macro-áreas da imagem digital.

As macro-áreas que trabalham com o conceito de imagem digital podem ser

representadas de acordo com a Figura 3. Dentro do processo de visão computacional, um

marco da computação gráfica com o conceito de visão computacional é o filme Matrix1,

originado da coleção de contos Animatrix, o filme faz uma fusão entre a computação gráfica

e o tradicional anime japonês. Para Albuquerque (2007), as áreas de processamento de

imagens e de computação gráfica apesar de serem vistas como totalmente opostas, tem

técnicas complementares, senão iguais.

SÍMBOLOS

IMAGENS

PROCESSAMENTO DEIMAGENS

PROCESSAMENTO DE DADOS

COMPUTAÇÃOGRÁFICA

VISÃOCOMPUTACIONAL

Figura 3 – Macro-áreas da Imagem Digital (César Jr., 2007).

1 The Matrix; E.U.A.;1999; Mistura de ação e ficção científica. Direção: Larry e Andy Wachowshi.

Page 15: Técnicas de reconhecimento automatizado de imagens digitais

15

2.1 Visão computacional

O conceito de imagem envolve todo o processo de visão computacional (Figura 4),

assim, compreender os aspectos de aquisição, processamento e análise desta, é de

extrema importância para o desenvolvimento de sistemas que envolvam o processamento e

análise de imagens. De uma forma simplificada um processo de visão computacional

consiste na extração de características e no reconhecimento e classificação destas (Jähne,

2000).

Os princípios físicos que envolvem a formação da imagem são:

• Formação: corresponde a aquisição, que pode ser através de um tomógrafo, por

exemplo;

• Identificação de estruturas: pré-processamento, segmentação, reconhecimento

das imagens;

• Quantificação e visualização: cálculos, computação gráfica, parametrizações;

• Interpretação: classificação, inteligência artificial, redes neurais, integração de

informações.

Figura 4 – Processo e elementos da visão computacional (Gonzaga, 2007).

A visão computacional pode ser entendida, desta forma, como uma multidão de

técnicas usadas para adquirir, processar, analisar e entender dados extremamente

complexos. Seguindo a regra de que é mais simples comparar sistemas sobre o ponto de

vista biológico, podem ser destacados alguns pontos comuns entre os sistemas de visão

biológico e o computacional, além de compará-los através de sua função (Tabela 1)(Jähne,

2000):

• Campo de radiação: usando a radiação é possível observar uma cena ou objeto;

Page 16: Técnicas de reconhecimento automatizado de imagens digitais

16

• Câmera: realiza a coleta da radiação recebida do objeto fixando tudo em um só

ponto (como as lentes ópticas). Pode ser: um tomógrafo ou um espectrômetro;

• Sensor: faz a conversão do sinal de radiação recebido para um conjunto de dados

que possam ser processados;

• Unidade de Processamento: extrai um conjunto de características de um grande

volume de dados, mensurando e categorizando. Um componente importante é a

memória, pois ela permite coletar e armazenar conhecimento de uma cena e

apagar dados sem valor. Para Albuquerque (2007), o processamento de uma

imagem consiste em transformá-la de forma a facilitar a extração de

características,

• Atores: reagem ao resultado da observação de forma ativa, tornando-se parte

essencial da visão do sistema.

VISÃO HUMANA X VISÃO DE MÁQUINA

Tarefa Visão Humana Visão de Máquina

Visualização.

Passiva, principalmente

pela reflexão da luz do

sobre superfícies opacas.

Passiva e ativa (controle da

iluminação) usando partículas

eletromagnéticas e radiação

acústica.

Formação da imagem. Sistema de refração óptica. Vários sistemas.

Controle da radiação. Músculos controlam a

pupila.

Sistemas motorizados que

simulam o movimento da pupila,

com filtros em forma de círculos ou

túneis.

Foco. Músculos controlam a

mudança de foco.

Sistema de foco automático

baseado em vários princípios de

medidas de distância.

Resolução da radiação. Sensibilidade logarítmica.

Sensibilidade linear, quantificada

em 8 e 16 bits e sensibilidade

logarítmica.

Movimento. Altamente móvel. Scanners e robôs montados com

câmeras.

Processamento e

análise.

Processamento paralelo

organizado

hierarquicamente.

Processamento serial ainda

dominante; processamento

paralelo, não usado geralmente.

Tabela 1 - Funções da visão humana e da máquina (Jähne, 2000).

Page 17: Técnicas de reconhecimento automatizado de imagens digitais

17

2.2 Questões do processamento visual

Dentre os problemas particulares do processamento visual, os melhores

compreendidos são (Winston, 1988):

• Estéreo binocular: encontrar a distância do observador em relação à superfície,

usando dois pontos de observação ligeiramente diferentes;

• Sombreamento: determinar a direção da superfície a cada ponto, em uma

imagem, tirando proveito das partes sombreadas.

Para identificar, descrever e localizar objetos, são necessárias representações

intermediárias que explicitem várias espécies de conhecimento revelando vários tipos de

restrições e fatos, entre elas (Winston, 1988):

� Valores de brilhância são explícitos em imagens;

� Mudanças de brilhância, grupos com mudanças similares, bolhas e texturas são

fatos explícitos no espaço principal (Figura 5);

Figura 5 – Fatos explícitos em imagens (Winston, 1988).

� Dados da superfície ficam explícitos no modelo de mundo 2 ½ D (usando

diagramas de agulhas Figura 6);

Figura 6 - Diagrama de agulhas (Winston, 1988).

� Os volumes ficam explícitos no processo, assim como a distância do observador do

mundo, no modelo de mundo. Através do uso do conceito de cilindros

generalizados, um conceito simples assim como grandes idéias, consegue-se

distinguir formas variadas fazendo com que a forma bidimensional mova-se

através de uma linha chamada de eixo. A linha não precisa necessariamente ser

uma reta e a forma do objeto varia com a movimentação (Figura 7).

Figura 7 - Generalização de volumes (Winston, 1988).

Desenvolver sistemas de automação, recursos gráficos, reconhecimentos de padrões

e algoritmos para o tratamento da informação visual e fazer estudos de novos métodos são

as principais atividades de pesquisa em visão de computadores, concentrando-se em:

Page 18: Técnicas de reconhecimento automatizado de imagens digitais

18

• Arquiteturas e subsistemas dedicados em tempo real;

• Determinação de movimento em uma seqüência de imagens;

• Fusão de imagens de satélites;

• Hipermídia e telesupervisão com o uso redes de computadores;

• Inspeção visual automática, usada para controle de qualidade;

• Utilização de processadores digitais de sinais.

A visão de computadores pode ser categorizada em partes distintas, de acordo com o

problema que busca solucionar (Tabela 2):

REFERÊNCIA TAREFA

Geometria 2D e 3D.

Posição e distância;

Tamanho e área;

Profundidade e metrologia 3D;

Formatos 2D;

Formatos 3D.

Radiometria.

Reflexão;

Cor;

Temperatura;

Fluorescência;

Espectro.

Movimento. Movimento 2D;

Movimento 3D.

Estrutura espacial e textura.

Contornos e linhas;

Ondas e escalas;

Orientação local;

Texturas.

Tarefas de alto nível.

Segmentação;

Identificação de objetos;

Classificação de objetos;

Modelo e base de conhecimento.

Modelagem 3D.

Reconhecimento de objetos 3D;

Síntese de objetos 3D;

Caminhos.

Tabela 2 - Classificação das tarefas para sistemas de visão de computadores (Jähne, 2000).

Page 19: Técnicas de reconhecimento automatizado de imagens digitais

19

2.3 Imagem Digital

Uma imagem digital pode ser definida, geralmente, como uma função f(x,y), onde o

valor nas coordenadas x e y correspondem ao brilho (radiância) da imagem nos pontos da

coordenada (Gonzales and Woods, 1992 apud Silva, 2005). A imagem digital corresponde à

representação numérica do objeto, é uma função quantificada e amostrada, sendo a sua

menor unidade denominada de pixel (picture element). Na Figura 8, é possível visualizar a

representação de uma imagem com 256 tons de cinza.

Figura 8 – Repres. de uma imagem ampliada de 10x10 com 256 tons de cinza (Silva, 2005).

As imagens digitais coloridas são, em geral, funções quantificadas e apresentadas

como um vetor de três componentes de acordo com o modelo escolhido (Gattass, 2002),

onde cada componente varia de 0 a 255 de acordo com a cor (Figura 9): Segundo

Hashimoto (2003), os modelos são:

• Modelo RGB (Red, Blue e Green): formado pelas cores primárias;

• Modelo CMY (Cyan, Magenta e Yellow): modelo RGB com cores

secundárias;

• Modelo HSI (Hue, Saturation e Intensity): formado por uma cor dominante

(matiz), saturação (diluição da matiz na luz branca) e intensidade (quantidade

de luz refletida).

Figura 9 – Vetor de componentes de imagens coloridas (RGB).

Page 20: Técnicas de reconhecimento automatizado de imagens digitais

20

As cores são sensações da luz que incide nos olhos. Analisando a luz como uma

onda, pode-se relacionar o seu comprimento λ , com a sua freqüência f e a sua velocidade

v , através de fv λ= , de acordo com a Figura 10 (Gattass, 2002).

Figura 10 - Relação entre comprimento e velocidade de onda (Gattass, 2002).

De acordo com o comprimento da onda (Figura 11) e o seu espectro é possível obter

uma sensação de cor diferente.

Figura 11 - Espectros de luz (1 nm = 10-9 m) (Gattass, 2002).

Na Figura 12, é possível observar as mudanças de coloração de acordo com o

espectro eletromagnético.

Figura 12 - Espectro eletromagnético (Gattass, 2002).

Page 21: Técnicas de reconhecimento automatizado de imagens digitais

21

A imagem a qual se quer representar em uma função, pode seguir diferentes formas

(INCOR-HC, 2007) e segundo a maioria dos estudos (Müller, Dalmolin e Araki, 1999), é

feita, principalmente, através do reconhecimento de padrões em imagens em tom de cinza e

falsa-cor. Dentre as formas de representação tem-se:

• Função contínua:

f(x,y)

f:Rn =>Rp

• Função discreta:

f(i,j)

f:Z+n => Z+p

• Pixel (picture element):

f(i,j)

• Voxel (volume element):

f(i,j,k)

• Spel (space element):

f(i,j,...n)

• Representação matricial:

F[i][j]

Page 22: Técnicas de reconhecimento automatizado de imagens digitais

22

3 ALGORITMOS

A evolução dos algoritmos para visão de computadores foi por muito tempo

negligenciada e os resultados, por esse motivo, apresentavam muitos erros. O que causou

esta situação foi por um lado, certamente, a dificuldade de tratar os problemas e por outro, o

fato da comunidade ignorar tal problema. Os três maiores critérios para análise da

performance destes algoritmos são segundo (Jähne, 2000):

• Sucesso na solução do problema;

• Precisão;

• Rapidez.

O estudo dos algoritmos pode ser dividido, de acordo com estes critérios (Jähne,

2000), em:

• Estudo analítico: este é, matematicamente, o caminho mais rigoroso usado

para verificação dos algoritmos, checar erros de propagação e prever falhas

graves;

• Teste de performance com imagens geradas por computador: estes

testes são usados para controlar cuidadosamente as condições;

• Teste de performance com imagens do mundo real: este é o teste final de

uma aplicação.

Os algoritmos de reconhecimento são utilizados de forma conjunta, para melhores

resultados podendo agir de forma totalmente automatizada ou semi-automatizada, em geral,

os de uso comercial são patenteados. Como exemplo, têm-se a seguir algoritmos de

segmentação, que utilizam imagens de referência para fazer as comparações:

• Algoritmo genético de segmentação por Quadtree;

• Algoritmo genético com método de segmentação limiar Treshold;

• Algoritmo genético com método de segmentação por crescimento de regiões;

• Algoritmo Snake, usado para detecção de contorno da imagem e

segmentação.

Pode-se também fazer a interpretação de uma imagem através da análise de

agrupamentos (Cluster Analysis), sendo este um método estatístico que identifica grupos

Page 23: Técnicas de reconhecimento automatizado de imagens digitais

23

através de suas características. O processo de análise de dados, usando o Cluster Analysis,

é dividido em quatro passos (Gonzaga, 2007):

1. Seleção das variáveis de agrupamento (características) e da medida de

distância (distância Euclidiana e distância de Pearson);

2. Seleção do algoritmo de agrupamento (hierárquico (árvores de grupo –

cluster tree) ou não-hierárquico (método k-means));

3. Realização da análise de agrupamento;

4. Interpretação dos agrupamentos.

Uma outra forma de fazer o reconhecimento de imagens é usando autômatos, para

Menezes (2000) a implementação de um autômato finito de reconhecimento consiste

basicamente em um algoritmo que controla a mudança de estado do autômato a cada

símbolo lido da entrada. Assim, o tempo de processamento necessário para aceitar ou

rejeitar é proporcional ao tamanho da entrada de forma exponencial. A construção de

reconhecedores usando autômatos de pilha é relativamente simples e imediata, porém não

é muito recomendado para entradas de tamanhos consideráveis, por consumirem muito

tempo. Os reconhecedores, segundo Menezes (2000) podem ser de dois tipos: Top-Down,

constrói-se uma árvore de derivação e ramos para a palavra a ser reconhecida, ou símbolos

terminais que compõem a palavra; e Bottom-Up, que é o oposto do Top-Down, parte dos

símbolos terminais indo em direção à raiz.

Page 24: Técnicas de reconhecimento automatizado de imagens digitais

24

4 RECONHECIMENTO E INTERPRETAÇÃO

O reconhecimento de padrões em uma imagem depende muito da qualidade da

própria imagem, portanto, para que não ocorram erros no reconhecimento é necessário que

a imagem passe por um tratamento anterior, através, por exemplo, da correção da

iluminação, e/ou uso de colorantes químicos.

Outros aspectos importantes para o reconhecimento de uma imagem são:

• Definir anteriormente como será adquirida a imagem, de que tipo ela será

(bmp, jpeg, tiff etc) e qual será a sua escala de cores;

• Fazer o melhoramento da imagem, pois apesar dos cuidados tomados, a

imagem ainda pode sofrer interferências que prejudicam ou impossibilitam o

seu reconhecimento. Essas interferências são chamadas de ruídos, e sua

correção é feita através de filtros (filtro passa baixo, filtro passa alto etc);

• Segmentar a imagem ou escolher pedaços relevantes, diminuindo assim a área

de dados a ser analisada, assim como o tempo gasto para a análise. Podem

ser usados para isso, por exemplo, os algoritmos de segmentação por

Quadtree;

• Estabelecimento de parâmetros a serem seguidos e de tipos (área, perímetro,

descrição estrutural, topologia etc).

Somente após estas etapas é feito o reconhecimento e a classificação dos objetos, de

acordo com os padrões estabelecidos previamente, para que assim possam ser

minimizados possíveis erros no processamento da imagem.

Um padrão é uma descrição quantitativa (vetores) ou estrutural (strings) de um objeto

ou algum outro ponto de interesse, neste trabalho, referente a uma imagem digital. Um

padrão é formado por um ou mais descritores, ou características. O ato de gerar descritores

é chamado de “Extração de Características”. Os arranjos de padrões são representados da

seguinte forma (Gonzaga, 2007):

• Vetores – contém informações quantitativas;

• Cadeias e Árvores – contém informações estruturais.

Algumas aplicações são melhores descritas através da relação estrutural que

possuem, por exemplo o reconhecimento de digitais, onde não se mensura apenas a

imagem e sim são feitas relações espaciais entre padrões para determinar a qual classe o

membro pertence.

Pode-se dizer assim que o enfoque do reconhecimento de padrões pode ser dividido

em duas áreas principais: Teoria de decisão e Estrutura. Na primeira categoria, são

utilizados padrões quantitativos (comprimento, área, textura etc), na segunda, são utilizadas

strings que descrevem o relacionamento entre símbolos (Gonzalez, Woods e Eddins, 2004).

Page 25: Técnicas de reconhecimento automatizado de imagens digitais

25

A área de reconhecimento de padrões trata da classificação de elementos extraídos

(César Júnior, Barrera e Costa, 2007) e da sua análise computadorizada ou semi-

computadorizada tornando possível a detecção de falhas. O processo de reconhecimento de

padrões apesar de ser aparentemente simples, envolve muitas variáveis, portanto fazer a

seleção das características que geram o vetor de características é de extrema importância,

pois influirá no desempenho do sistema (Gonzaga, 2007). Exemplos de como fazer a

seleção de características:

• Assinatura: a cada intervalo, é gerado um vetor de características;

• Momentos: calculam-se os momentos de um objeto e gera-se um vetor com

os primeiros momentos;

• Momentos por peça e vetor de características: gera-se um vetor com os

primeiros momentos.

Utilizar características através de diferentes métodos facilita o processo de

reconhecimento, no entanto, em alguns problemas de reconhecimento, é necessário

estabelecer (além das medidas quantitativas) relações espaciais. Neste caso, os problemas

são mais bem resolvidos utilizando abordagens estruturais (Gonzaga, 2007).

Na Figura 13, por exemplo, sem um conhecimento prévio da cena, ficaria muito difícil

fazer a identificação do dálmata presente na imagem.

Figura 13 - Nível alto de dificuldade no reconhecimento de imagem (César Jr, 2007).

As representações por cadeias geram estruturas padronizadas baseadas na

conectividade de primitivas, associadas à fronteira, vide exemplo Figura 14.

Figura 14 - Representação por cadeias (Gonzaga, 2007).

Page 26: Técnicas de reconhecimento automatizado de imagens digitais

26

Para Bonventi Júnior e Costa (2007), na área de reconhecimento de padrões, e

também em visão de máquina, várias técnicas têm sido desenvolvidas e testadas, sendo a

classificação uma das principais tarefas.

O processo de reconhecimento de padrões passa pelas etapas de percepção,

extração, segmentação e classificação. A etapa de classificação irá variar de acordo com a

linha de pesquisa a ser seguida, porém, podemos dividi-la em: teorias adotadas (Bayer,

classificação linear, classificação não-linear, modelo de Markov etc); padrões a serem

reconhecidos (cor, formato, tamanho etc); métodos usados (estatístico, supervisionado e

não-supervisionado); e técnicas de reconhecimento utilizadas (gramáticas formais, redes

neurais, operadores morfológicos, geometria diferencial para análise de contornos, topologia

digital etc).

A seguir serão vistos:

• Método de decisão: função de decisão ou função discriminante;

• Classificação de padrões:

� Classificador de distância mínima ou euclidiana;

� Classificador Bayesiano.

• Filtros: lineares e não-lineares;

• Segmentação da imagem: Threshold e Edge.

Existem outros como, por exemplo, os classificadores por Redes Neurais ou por

Lógica Nebulosa (“Fuzzy Sets”). De acordo com Albuquerque (2007), não existe uma única

técnica que seja abrangente e que funcione para todos os problemas devido ao fato desta

estar associada ao reconhecimento e a análise das informações, e o processo de

reconhecimento por sua vez, em geral, só ocorre após uma fase de segmentação e

parametrização da imagem.

O tema central do conceito de reconhecimento de padrões é o conceito de “aprender”,

através de exemplos, de forma automática ou envolvendo no mínimo possível o homem

(Gonzalez, Woods e Eddins, 2004).

4.1 Métodos de decisão

Métodos de decisão (funções de decisão ou funções discriminantes) são para

Gonzaga (2007), x = (x1, x2, x3,..., xn)t um vetor de características n-dimensional e w1, w2, w3,...,

wm, uma classes de padrões. O reconhecimento consiste em encontrar funções “M” de

decisão d1(x), d2(x), ...,dm(x) tal que:

di(x) > dj(x) j = 1, 2, ..., M; j ≠ i

Ou seja: x ∈ wi se di(x) é o maior valor

Page 27: Técnicas de reconhecimento automatizado de imagens digitais

27

A fronteira de decisão para wi e wj é dada pelos valores de x para os quais di(x) =

dj(x), ou seja:

di(x) - dj(x) = 0

Identifica-se à fronteira de decisão entre as duas classes através da função:

dij = di(x) - dj(x) = 0

Ou seja, se dij(x) > 0 , o padrão pertence à classe wi

e se dij(x) < 0 , então, o padrão pertence à classe wj.

4.2 Classificador de distância mínima / distância Euclidiana

Uma classe de padrões pode ser representada através de um valor médio ou por um

vetor protótipo, de acordo com Gonzaga (2007).

mj = jN

1 ∑

∈ jwx

x j = 1, 2, ..., M

Para definir, de acordo com Gonzaga (2007), a pertinência de um vetor de

características (x) desconhecido, pode-se atribuí-lo a classe mais próxima do seu protótipo.

A distância euclidiana é dada por:

Dj (x) = x - mj j = 1, 2, ..., M

Onde: a = (at a)1/2 é a norma euclidiana.

x ∈ wi se Di(x) for a menor distância

De acordo com Gonzaga (2007), é o equivalente:

dj (x) = xt mj - ½ m t

j m j j= 1, 2, ..., M

x ∈ wi se di(x) for o maior valor

Sendo a fronteira de decisão entre as duas classes wi e wj :

dij = di(x) - dj(x) = xt (mi - mj ) - ½ (mi - mj )

t (mi - mj ) = 0

n = 2 ---- uma reta

n = 3 ---- um plano

n > 3 ---- um hiperplano

4.3 Classificador Bayesiano

De acordo com Gonzaga (2007), para resolver um problema que envolve duas classes

de padrões governados por densidades gaussianas, com médias m1 e m2 e desvios padrões

σ 1 e σ 2 , pode-se resolver da seguinte forma:

Page 28: Técnicas de reconhecimento automatizado de imagens digitais

28

dj (x) = p( x / wj) P(wj) =

jπσ2

1exp

−−

2

2

2

)(

j

jmx

σP(wj) j = 1,2

Na Figura 15, é possível identificar o ponto x 0, que equivale à fronteira entre as

classes.

Figura 15 - Fronteira das classes classificador bayesiano (Gonzaga, 2007).

4.4 Filtros

A utilização de filtros permite equalizar a intensidade de tons da imagem, de forma a

obter a redução de ruídos, o método usado para esse processamento é chamado de

histograma. O método tem um princípio simples, são considerados momentos de nível

contínuo que são normalizados dentro de um intervalo [0, 1], através de níveis de

intensidade fornecidos para entrada e saída, esse processo permite obter um nível de

densidade mais uniforme. Espacialmente os filtros podem ser lineares ou não-lineares

(Gonzalez, Woods e Eddins, 2004).

O conceito de filtro linear tem suas raízes em Fourier, com o processamento de sinais

em uma freqüência e o conceito espacial de filtros não-lineares esta baseado nas operações

com a vizinhança. Ou seja, enquanto os filtros lineares trabalham baseados em operações e

produtos lineares, os filtros não-lineares trabalham com operações não-lineares que

envolvem pixels vizinhos (Gonzalez, Woods e Eddins, 2004).

Dentre as formas de equalizar histogramas de imagens, através de filtros lineares

pode ser citado o filtro de freqüências passa-baixas Gaussiano2, e através de filtros não-

lineares, o filtro Mediano, que como o próprio nome diz utiliza o valor mediano (Gonzalez,

Woods e Eddins, 2004).

2 Método de Gauss – é um método que consiste na aplicação de operações elementares à matriz aumentada no sistema, chegando-se assim a uma matriz escalonada, neste caso ele produz um efeito de desfocagem.

Page 29: Técnicas de reconhecimento automatizado de imagens digitais

29

4.5 Segmentação da Imagem

A segmentação subdivide uma imagem em regiões ou objetos, o nível desta divisão

depende no entanto do problema a ser resolvido. A segmentação não é um processo trivial,

pois pode interferir no processo de análise da imagem, e é um passo essencial no processo

de reconhecimento de padrões e análise do problema. Os algoritmos de segmentação

monocromáticos são geralmente baseados em duas propriedades básicas de intensidade de

valores: continuidade e similaridade (Gonzalez, Woods e Eddins, 2004).

A detecção Edge em particular, foi o principal algoritmo de segmentação por muitos

anos, o método Threshold por sua vez é fundamental pois consegue diminuir o tempo de

processamento da imagem (Gonzalez, Woods e Eddins, 2004).

Além da detecção de ponto e da detecção de linha, certamente a detecção Edge é de

longe a mais utilizada para procurar por valores descontínuos. Dentre os diversos tipos de

máscaras para detectores Edge temos: Sobel; Prewitt; Canny e Roberts (Gonzalez, Woods

e Eddins, 2004).

A implementação do método Threshold por suas propriedades intuitivas e simples,

merece uma posição central na aplicação se segmentação das imagens (Gonzalez, Woods

e Eddins, 2004). Na Figura 16 um exemplo de macro que pode ser gerada no software

Scion Image.

Uma outra forma de facilitar o processo de segmentação de uma imagem é utilizando

os métodos: splitting e merging, de forma a atender de forma satisfatória as condições

estabelecidas. Uma particular técnica de divisão é chamada de Quadtree, que divide a

imagem em quadrantes e construindo assim uma árvore, onde cada subdivisão torna-se um

nó e a sua raiz é a imagem inicial (Gonzalez, Woods e Eddins, 2004).

Figura 16 – Macro Threshold do Software Scion Image.

Page 30: Técnicas de reconhecimento automatizado de imagens digitais

30

5 TECNOLOGIA DE SOFTWARE

No mercado existem vários softwares que fazem os trabalhos de quantificações,

amostragens, conversões, edições etc, no entanto, os preços e as plataformas disponíveis

variam de acordo com o produto escolhido, entre eles tem-se:

• AVS (Advanced Visualization System);

• IBM Data Explorer;

• IDL (Interactive Data Language);

• Khoros;

• Mathlab;

• Paraview:

• ProEikon;

• Scion Image.

5.1 Matlab

Matlab (Figura 17) é um sistema interativo de matrizes (Figura 18) que pode ser usado

tanto para o ensino de matemática fundamental quanto para cálculos complexos de

engenharia. O nome é uma abreviação de MATrix LABoratory, e foi originalmente

desenvolvido, com a intenção de facilitar o acesso a matrizes, para os projetos LINPACK

(Linear System Package) e EISPACK (Eigen System Package). Hoje, o Matlab incorpora as

bibliotecas LAPACK (Linear Álgebra Package) e BLAS (Basic Linear Álgebra Subprograms)

(Gonzalez, Woods e Eddins, 2004).

O Matlab consegue executar uma seqüência de ações através de arquivos chamados

de “M-files”, que possuem a extensão “*.m”. Os M-files são de 2 tipos, os “scripts files”, que

são uma seqüência normal de passos do Matlab e os “function files”, que são funções

criadas para necessidades específicas (Gonzalez, Woods e Eddins, 2004).

Figura 17 – Tela de abertura do programa Matlab.

Page 31: Técnicas de reconhecimento automatizado de imagens digitais

31

Figura 18 – Exemplo de uso de matrizes no Matlab.

Uma forma de utilizar o MatLab para análise e reconhecimento de padrões, é usando

SDC Morphology Toobox for Matlab (Figura 19), que é um software para análise e

processamento de sinais. Ele é composto por uma família de filtros chamados de

operadores morfológicos, que permitem a restauração, segmentação e análise das imagens

e sinais de forma quantitativa.

Figura 19 – Janela do Software SDC Morphology Toolbox for Matlab.

Page 32: Técnicas de reconhecimento automatizado de imagens digitais

32

5.2 Scion Image for Windows

O software Scion Image (Figura 20), trabalha com fundamentos de densiometria3,

escalonando pixels com concentrações correspondentes. Outros exemplos do uso da

densiometria podem ser encontrados na ótica e na eletrônica. Scion Image é um programa

que foi baseado na plataforma NIH Image da Macintosh, sendo possível automatizar rotinas

através de macros, usando a linguagem de programação Pascal. Uma vantagem do

software para a área médica é a possibilidade de importar arquivos DICOM (Digital Imaging

and Communication in Medicine), que é um formato padrão usado principalmente na área de

radiologia.

Figura 20 – Tela de abertura do programa Scion Image.

3 A densiometria foi descrita como ciência graças a Pierre Bouguer (1729) e Johann Heindrich Lambert (1760) que descreveram o processo de radiação (ou luz) (Andrade, 2000).

Page 33: Técnicas de reconhecimento automatizado de imagens digitais

33

6 TESTES

Os testes dos algoritmos de reconhecimento foram implementados utilizando os

softwares: Matlab e Scion Image. Segundo Amabis e Martho (1990), as células sangüíneas,

chamadas também de elementos figurados do sangue (Figura 21), são de três tipos:

hemácias (ou eritrócitos ou glóbulos vermelhos), leucócitos (ou glóbulos brancos) e

plaquetas (ou tombócitos). Essas células ficam mergulhadas em um material intercelular

líquido do sangue, chamado de plasma.

Podem ser identificadas as seguintes características nestas células (Amabis e Martho,

1990; Junqueira e Carneiro, 1999):

• Hemácias: são células sem núcleo e com formato discóides, nos humanos

tem em média 7,5 µm de diâmetro e 2,6 µm de espessura;

• Glóbulos brancos: são maiores que as hemácias e apresentam um núcleo

volumoso. Existem vários tipos, entre eles: os linfócitos e os neutrófilos. Nos

humanos tem em média de 15 µm de diâmetro variando de acordo com o

tipo;

• Plaquetas: são fragmentos de células que se formam pelo rompimento dos

megacariócitos. Têm seu tamanho em torno de 3 µm.

GLÓBULOS VERMELHOS

PLAQUETAS

GLÓBULOS BRANCOS

Figura 21 – Células sangüíneas com hemácias, glóbulos brancos e plaquetas (Borja, 2007).

Page 34: Técnicas de reconhecimento automatizado de imagens digitais

34

6.1 Matlab

O Matlab reconhece vários tipos de extensões de imagens porém, para o estudo das

técnicas de reconhecimento de imagens, os testes foram realizados com a imagem na

escala de tons cinza e com a extensão bitmap (“*.bmp”). O Matlab é um software completo e

permite a manipulação de matrizes de forma relativamente fácil. Permite fazer interfaces

com linguagens de programação “C” e “Java” por exemplo, de forma a tornar o processo de

reconhecimento de imagens o mais automatizado possível. Na Tabela 3, é possível

visualizar a seqüência de testes realizados no software Matlab.

Seqüência de Testes Matlab

Imagem inicial Matlab, em escala de cinza e com

extensão bitmap.

Imagem com filtro gaussiano (Matriz 7X7). A aplicação

do filtro gaussiano na imagem fez a correção e a

remoção de ruídos.

Aplicação da função Threshold.

Binarização da imagem e exportação da imagem para

um arquivo tipo texto, é necessário a criação de um

programa para fazer a tradução do arquivo do Matlab.

Page 35: Técnicas de reconhecimento automatizado de imagens digitais

35

Contornos da imagem através da função Edge.

Threshold da imagem.

Histograma da imagem.

Tabela 3 – Seqüência de testes realizados no software MatLab.

Na Figura 22, é exibido o arquivo utilizado para gerar a rotina realizada na Tabela 3, a

rotina criada foi executada através de um ícone na área de trabalho mapeado para

“C:\MATLAB701\bin\win32\MATLAB.exe -nojvm -r celsang”. Foram feitas as etapas de

limpeza de ruídos, detecção de borda e Threshold, além de exibir o histograma para análise

da imagem. Com o software Matlab é possível conseguir mais liberdade na programação,

porém é necessário um conhecimento anterior do software e de suas funcionalidades.

No início do código é executada uma função que faz o tratamento da imagem para a

escala de cor cinza. Para a limpeza de ruídos da imagem é utilizado um filtro gaussiano e é

utilizada a função threshold. É feita a verificação da imagem para identificar se ela esta em

formato binário ou não, após essa rotina a imagem binária é salva, no entanto a visualização

do código binário só seria possível com a implementação de um programa que fizesse a

conversão do arquivo “*.m” para um arquivo “*.txt” .

É utilizada a função edge para detecção de contornos e novamente a função threshold

para alterar o fundo da imagem. A imagem é plotada para visualização.

Page 36: Técnicas de reconhecimento automatizado de imagens digitais

36

Figura 22 – Macro utilizada no Matlab.

6.1.1 Pseudo-código

1. Início do programa 2. Ler imagem 3. Se imagem ≠ escala de cinza então

Converte imagem para escala de cinza Armazena imagem em uma função “y”

Senão Armazena imagem em uma função “y”

4. Aplicar filtro na imagem 5. Aplicar função threshold na imagem 6. Se imagem ≠ binário

Converte imagem para binário Salva imagem binária

Senão Salva imagem binária

7. Aplicar função edge na imagem 8. Plotar resultado na tela

6.2 Scion Image

Com o intuito de facilitar o reconhecimento e análise das células, a imagem original foi

alterada para a extensão bitmap (“*.bmp”) com coloração em escala de cinza. Na Tabela 4,

é possível visualizar a seqüência de testes realizada para o reconhecimento e diferenciação

das células, usando o programa Scion Image. O software se mostrou eficaz e de simples

utilização.

Page 37: Técnicas de reconhecimento automatizado de imagens digitais

37

Seqüência de Testes Scion Image

Imagem inicial Scion Image, em escala de cinza e com

extensão bitmap.

Imagem após o processo de correção e remoção de

ruídos, usando-se um filtro gaussiano (Matriz 7X7)

para a equalização de valores.

A aplicação da função Threshold, faz com que o

volume de dados da imagem diminua e neste caso,

trabalha fechando os contornos da imagem de acordo

com a intensidade dos pixels.

A imagem gerada foi exportada para um arquivo tipo

texto.

Contornos da imagem gerados através da função

Edge.

Usando-se a função Analyze é feita a filtragem por

tamanho de partículas com densiometria de 50 a 300

pixels, para reconhecimento de plaquetas na imagem.

A função Analyse cruza as bordas de uma ponta a

outra até percorrer o objeto inteiro.

Page 38: Técnicas de reconhecimento automatizado de imagens digitais

38

O mesmo processo de análise é feito filtrando-se o

tamanho de partículas de área de 500 a 600 pixels,

para reconhecimento de glóbulos vermelhos.

Filtragem analisando-se partículas com área de 610 a

2300 pixels, para reconhecimento de glóbulos

brancos.

Tabela 4 – Seqüência de testes realizados no software Scion Image.

Na Figura 23, é exibida a macro criada para gerar a rotina que fará o reconhecimento

das células de acordo com a densidade.

Figura 23 – Macro utilizada no Scion Image.

A macro da figura 23, faz o reconhecimento e a contagem de células sangüíneas de

acordo a densidade e de forma semi-automática. Para o seu funcionamento é necessário

“carregar” a imagem e a macro no software. Além disso, é exibida uma janela de diálogo

para que o usuário possa especificar o tamanho mínimo e o máximo das células sangüíneas

que ele está analisando.

Page 39: Técnicas de reconhecimento automatizado de imagens digitais

39

No início do código, são declaradas as variáveis “min” e “max" que serão utilizadas na

busca de acordo com o tamanho do componente da imagem (o tamanho é dado em pixels),

também são zerados os contadores para evitar erros. Após isso, é criada no código uma

“matriz gaussiana” que servirá para a aplicação do filtro na matriz da imagem. Com a

finalidade de diminuir a área de análise da imagem é utilizada a função “Auto Threshold” e é

gerada uma imagem binária. Para a aplicação da função “Cross”, que determinará a

densiometria dos componentes, é chamada a função “TraceEdges” que traça os contornos

da imagem. A função “Cross” percorre de um ponto da borda até o outro para fazer o cálculo

da área para fazer a densiometria. São exibidas as telas de diálogo para entrada dos

valores mínimo e máximo das partículas que serão analisadas, além disso são definidos

alguns parâmetros que não estão inclusos na função “default” da função “AnalyzerParticles”.

O resultado é exibido na tela através da imagem.

Durante os testes, foi observado que na contagem das hemácias, devido à

sobreposição das mesmas e a qualidade da imagem (tonalidade), estas eram consideradas

uma única célula, sendo assim, como a análise foi feita através da densiometria, estas

apareceram na contagem de glóbulos brancos ao invés de aparecerem na de glóbulos

vermelhos.

6.2.1 Pseudo-código

1. Início do programa 2. Declarar variáveis “mínimo” e “máximo” 3. Zerar contador 4. Ler imagem 5. Criar matriz de ruído 6. Aplicar filtro na imagem utilizando a matriz de ruído 7. Aplicar função threshold 8. Gerar imagem binária 9. Aplicar função edge na imagem 10. Carregar valores padrão para a função 11. Aplicar função de análise nas partículas 12. Plotar resultado na tela

Page 40: Técnicas de reconhecimento automatizado de imagens digitais

40

7 RESULTADOS

O reconhecimento de padrões em imagens em tons de cinza são, geralmente, mais

fáceis de serem implementados do que no caso de imagens coloridas, que trabalham com

três componentes.

Através da análise computadorizada automática ou semi-automática de imagens é

possível eliminar, ou ao menos diminuir grande parte dos erros inerentes do processo visual,

tornando possível à detecção de falhas que seriam imperceptíveis em uma linha de

produção, por exemplo, e eliminando a subjetividade. O processo de reconhecimento visual

de padrões, apesar de ser aparentemente simples, envolve muitas variáveis, portanto, foi

realizado um estudo das técnicas que envolvem o processo, que faz parte da área de

computação gráfica. O estudo mostrou-se não somente importante, mas também essencial

para o processo de reconhecimento de padrões, pois se as técnicas não forem bem

utilizadas e definidas o processo não será eficaz ou será muito lento.

Os testes foram feitos com o objetivo de fazer o reconhecimento de células

sangüíneas e a sua contagem, embora realizado com sucesso, na prática essa forma de

reconhecimento mostra-se de pouca eficiência, dado que já existem equipamentos que

fazem a análise de amostras sanguíneas instantaneamente. Devido ao tempo disponível,

foram feitas opções por métodos e processos simples, a fim de diminuir a complexidade.

Uma boa implementação de reconhecimento de imagens de células sangüíneas, seria a

identificação de organismos estranhos na imagem, como por exemplo bactérias, com base

em um banco de dados. Fora da área médica, um ramo interessante e lucrativo que esta

investindo em sistemas apoiados em imagens digitais é o setor bancário.

Finalmente, este estudo também mostrou que a escolha adequada de uma técnica de

reconhecimento mesmo que simples, depende principalmente da análise e do conhecimento

anterior do problema.

Page 41: Técnicas de reconhecimento automatizado de imagens digitais

41

8 REFERÊNCIAS BIBLIOGRÁFICAS

ALBUQUERQUE, Marcelo P.; ALBUQUERQUE, Márcio. Processamento de imagens:

métodos e análises. Apostila de Imagens. Centro Brasileiro de Pesquisas

Físicas – CBPF / MCT. CAT. Disponível em: <

http://mesonpi.cat.cbpf.br/e2002/cursos/NotasAula/Apostila_Imagens.pdf>.

Acesso em: 12 de outubro de 2007.

AMABIS, José Mariano; MARTHO, Gilberto Rodrigues. Fundamentos da Biologia

Moderna. São Paulo, S.P.; Editora Moderna, 1990.

ANGELO, Michele Fulvia apud MORAES, Aline. Software pioneiro acessível via internet

permite análise mais detalhada de mamografias. Agência USP de Notícias.

USP. Reportagens 26/04/2007. Ano XXII nº 797. Disponível em: <

http://noticias.usp.br/acontece/obterNoticia?acesso=n&imprimir=s&print=s&cod

ntc=15949&codnucjrn=1>. Acesso em: 16 de maio de 2007.

BONVENTI JÚNIOR, Waldemar; COSTA, Anna Helena Reali. Classificação por

agrupamento nebuloso de padrões de cores em imagens. Departamento

de Engenharia de Computação e Sistemas Digitais, Escola Politécnica da

Universidade de São Paulo, São Paulo. Disponível em:

<http://www.lti.pcs.usp.br/publicacoes/BonventiCosta02-WORKCOMP.pdf>.

Acesso em: 27 de fevereiro de 2007.

BORJA, Fernando. Histologia. Centro de Saúde & Tecnologia Rural, Universidade

Federal de Campina Grande, Campus de Patos, Patos – P.B.. Disponível em: <

http://www.cstr.ufcg.edu.br/histologia/atlas_sangue_linfa.htm>. Acesso em: 05

de outubro de 2007.

CCS USP. Variedades – Ilusão de Ótica. Espaço Aberto. Coordenadoria de

Comunicação Social. Universidade de São Paulo. Ano IV – nº32.

janeiro/fevereiro de 1999. Disponível em: <

http://www.ccs.usp.br/espacoaberto/fevereiro99/variedades.html >. Acesso em:

08 de outubro de 2007.

CESAR JR, Roberto M. Imagens Digitais. Computer Vision Research Group at São

Paulo. Departamento de Ciência da Computação. Instituto de Matemática e

Estatística. Universidade de São Paulo. Disponível em:

<http://www.vision.ime.usp.br/~cesar/talks/mac420/imagensDigitais.pdf>.

Acesso em: 01 de abril de 2007.

Page 42: Técnicas de reconhecimento automatizado de imagens digitais

42

CESAR JÚNIOR, Roberto M.; BARRERA, Junior; COSTA, Luciano da F. . Modelagem

por redes (grafos) e técnicas de reconhecimento de padrões: estrutura,

dinâmica e aplicações. Grupo de visão do IME-USP e IFSC-USP.

Universidade de São Paulo, São Paulo. Disponível em:

<http://www.vision.ime.usp.br/~jb/projects/sumario.pdf>. Acesso em: 27 de

fevereiro de 2007.

GATTASS, Marcelo. Introdução às cores. 21/08/2002. Computer Vision Research Group

at São Paulo. Departamento de Ciência da Computação. Instituto de

Matemática e Estatística. Universidade de São Paulo. Disponível em:

<http://www.vision.ime.usp.br/~ronaldo/mac0417-03/aula_02/02_Cor.pdf>.

Acesso em: 01 de abril de 2007.

GONZAGA, Adilson. Aula 9 – Reconhecimento e interpretação de imagens. SEL -

Departamento de Engenharia Elétrica de São Carlos. Universidade de São

Paulo. Disponível em: <http://iris.sel.eesc.sc.usp.br/sel886>. Acesso em: 25 de

março de 2007.

GONZALEZ, R. C.; WOODS, R. E. apud SILVA, Renato Ramos da. Reconhecimento de

imagens digitais utilizando redes neurais artificiais. 2005. 51 f. Monografia

(Graduação em Ciência da Computação). Universidade Federal de Lavras,

Lavras – MG.

GONZALEZ, Rafael C.; WOODS, Richard E.; EDDINS, Steven L.. Digital Image

Processing using MATLAB. Pearson Education, Inc. , 2004.

GRUBER, Arthur apud GLUGOSKI, Miguel. Diagnóstico a distancia é mais seguro.

Saúde Animal. Jornal da USP. Universidade de São Paulo. 9 a 15 de abril de

2007. ano XXII nº 797. Disponível em:

<http://www.usp.br/jorusp/arquivo/2007/jusp797/pag0405.htm>. Acesso em: 16

de maio de 2007.

HASHIMOTO, Ronaldo Fumio. Visão e processamento de imagens. Primeiro Semestre

de 2003. Aula 02. Disciplinas: MAC0417(Graduação)/ MAC5768(Pós-

graduação). Computer Vision Research Group at São Paulo. Departamento de

Ciência da Computação. Instituto de Matemática e Estatística. Universidade de

São Paulo. Disponível em: <http://www.vision.ime.usp.br/~ronaldo/mac0417-

03/aula_02.html>. Acesso em: 01 de abril de 2007.

INCOR-HC. Técnicas Avançadas de Processamento de Imagens Médicas. Indução,

motivação, princípios físicos e modelos. SF 15/06/2006. Fundação Zerbini.

Universidade de São Paulo. Disponível em:

Page 43: Técnicas de reconhecimento automatizado de imagens digitais

43

<http://www.incor.usp.br/spdweb/cursos/downloads/ptc5750_introd_coracao200

6.pdf>. Acesso em: 01 de abril de 2007.

JÄHNE, Bernd. Computer Vision and Applications – A guide for students and

practitioners, Introduction, Academic Press, San Diego, CA, USA, 2000.

JUNQUEIRA, Luiz C.; CARNEIRO, José. Histologia Básica. 9ª Edição. Rio de Janeiro,

R.J..; Editora Guanabara Koogan, 1999.

MENA-CHALCO, Jesús P.; CESAR JR, Roberto Marcondes. ScriptLattes. Incubadora

Fapesp. CNPq. Disponível em: <http://scriptlattes.incubadora.fapesp.br/portal>.

Acesso em: 25 de março de 2007.

MENEZES, Luís Carlos (coord.) et al. Leituras de física. GREF Óptica para ver, fazer e

pensar. Universidade de São Paulo. Junho-1998. Disponível em:

<http://axpfep1.if.usp.br/~gref/optica/optica1.pdf. >. Acesso em: 01 de abril de

2007.

MENEZES, Paulo Fernando Blauth. Linguagens formais e autômatos. Instituto de

Informática da UFRGS. Número 3. 4ª Edição. Editora Sagra Luzzatto, 2000.

METZE, Konradin apud SUGIMOTO, Luiz. Detectando o imperceptível, descrevendo o

indescritível. Sala de Imprensa. Jornal da Unicamp. Universidade Estadual de

Campinas. Edição 278. 28 de fevereiro a 6 de março de 2005. Disponível em: <

http://www.unicamp.br/unicamp/unicamp_hoje/ju/fevereiro2005/ju278pag09.htm

l>. Acesso em: 08 de junho de 2007.

MÜLLER, Sonia Isoldi Marty Gama; DALMOLIN, Quintino; ARAKI, Hideo. Comparação

entre os métodos de máxima verossimilhança, distância mínima e o

método de Fisher para reconhecimento de padrões em imagens coloridas.

Boletim Ciências Geod. de Curitiba, Universidade Federal do Paraná. 1999.

Disponível em:

<http://calvados.c3sl.ufpr.br/ojs2/index.php/bcg/article/viewPDFInterstitial/1496/

1250>. Acesso em: 27 de fevereiro de 2007.

PINKER, Steven. The mystery of consciousness. Time. 12/02/2007. vol. 169 nº7.

SILVA, Renato Ramos da. Reconhecimento de imagens digitais utilizando redes

neurais artificiais. 2005. 51 f. Monografia (Graduação em Ciência da

Computação). Universidade Federal de Lavras, Lavras – MG.

WINSTON, Patrick Henry; Inteligência Artificial, tradução de Carlos Octávio Pavel, Rio

de Janeiro: LTC – Livros Técnicos e Científicos, 1988.

Page 44: Técnicas de reconhecimento automatizado de imagens digitais

44

9 ASSINATURAS

________________________________

FÁTIMA APARECIDA TAGLIAFERRO

________________________________

PETER JANDL JUNIOR