processamento de imagens no aux´ılio `a detec¸c˜ao de ... · processamento de imagens no...

66
Universidade Federal de Goi´ as - UFG Campus Catal˜ ao Departamento de Ciˆ encia da Computa¸ ao - DCC Bacharelado em Ciˆ encia da Computa¸ ao Projeto Final de Curso Processamento de Imagens no Aux´ ılio ` a Detec¸ ao de Cˆ ancer de Pele utilizando Redes Neurais Artificiais Autor: Glenda Michele Botelho Orientador: Prof. Ms. Marcos Aur´ elio Batista Catal˜ ao – 2007

Upload: vukhanh

Post on 08-Nov-2018

217 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Processamento de Imagens no Aux´ılio `a Detec¸c˜ao de ... · Processamento de Imagens no Aux´ılio `a ... por cuidar de mim e por estar sempre ao meu lado.` ... por todo o conhecimento

Universidade Federal de Goias - UFG

Campus Catalao

Departamento de Ciencia da Computacao - DCC

Bacharelado em Ciencia da Computacao

Projeto Final de Curso

Processamento de Imagens no Auxılio aDeteccao de Cancer de Pele utilizando Redes

Neurais Artificiais

Autor: Glenda Michele Botelho

Orientador: Prof. Ms. Marcos Aurelio Batista

Catalao – 2007

Page 2: Processamento de Imagens no Aux´ılio `a Detec¸c˜ao de ... · Processamento de Imagens no Aux´ılio `a ... por cuidar de mim e por estar sempre ao meu lado.` ... por todo o conhecimento

Glenda Michele Botelho

Processamento de Imagens no Auxılio a Deteccao de Cancer de Pele utilizandoRedes Neurais Artificiais

Monografia apresentada ao Curso deCiencia da Computacao da

Universidade Federal de Goias, Campus Catalaocomo requisito parcial para obtencao do tıtulo de

Bacharel em Ciencia da Computacao

Area de Concentracao: Processamento de ImagensOrientador: Prof. Ms. Marcos Aurelio Batista

Catalao - 2007

Page 3: Processamento de Imagens no Aux´ılio `a Detec¸c˜ao de ... · Processamento de Imagens no Aux´ılio `a ... por cuidar de mim e por estar sempre ao meu lado.` ... por todo o conhecimento

.

Botelho, Glenda Michele

Processamento de Imagens no Auxılio a Deteccao de Cancer de PeleUtilizando Redes Neurais Artificiais/Marcos Aurelio Batista - Catalao -2007

54p.

Projeto Final de Curso (Bacharelado) Universidade Federal de Goias, CampusCatalao, Curso de Bacharelado em Ciencia da Computacao, 2007.

Palavras-Chave: 1.Processamento de Imagens 2.Cancer de Pele 3.Classificacao deImagens 4.Redes Neurais Artificiais.

Page 4: Processamento de Imagens no Aux´ılio `a Detec¸c˜ao de ... · Processamento de Imagens no Aux´ılio `a ... por cuidar de mim e por estar sempre ao meu lado.` ... por todo o conhecimento

Glenda Michele Botelho

Processamento de Imagens no Auxılio a Deteccao de Cancer de Pele utilizandoRedes Neurais Artificiais

Monografia apresentada e aprovada em de de 2007,Pela Banca Examinadora constituıda pelos professores.

Prof. Ms. Marcos Aurelio Batista - Presidente da Banca

Prof. Dr. Dino Rogerio Coinete Franklin

Prof. Ms. Ivan da Silva Sendin

Page 5: Processamento de Imagens no Aux´ılio `a Detec¸c˜ao de ... · Processamento de Imagens no Aux´ılio `a ... por cuidar de mim e por estar sempre ao meu lado.` ... por todo o conhecimento
Page 6: Processamento de Imagens no Aux´ılio `a Detec¸c˜ao de ... · Processamento de Imagens no Aux´ılio `a ... por cuidar de mim e por estar sempre ao meu lado.` ... por todo o conhecimento

Aquelas que amo demais,Helena, Elenita e Gleice.

Page 7: Processamento de Imagens no Aux´ılio `a Detec¸c˜ao de ... · Processamento de Imagens no Aux´ılio `a ... por cuidar de mim e por estar sempre ao meu lado.` ... por todo o conhecimento

Agradecimentos

A Deus, por guiar meus passos e me manter forte diante das dificuldades.A minha mae Elenita Tavares, por ter me educado com muito carinho e pelo seu apoio,

dedicacao e amor incondicional.A minha avo Helena Goncalves, por cuidar de mim e por estar sempre ao meu lado.A minha irma Gleice Botelho, por me apoiar em todas as situacoes, por me fazer rir muito

e por suportar minha “chatice” e meu stress durante estes ultimos meses.Ao meu padrasto Jeronimo Silva, pelo apoio.Ao meu orientador Prof. Ms. Marcos Aurelio Batista, por seu interesse, incentivo e com-

petencia para conduzir da melhor maneira este trabalho.Aos professores, por todo o conhecimento transmitido a mim durante as aulas e fora delas.A minha amiga Fabıola Goncalves, que hoje tenho como irma, por permanecer ao meu

lado durante estes quatro anos de faculdade, me apoiando nos momentos mais difıceis e meacompanhando nos momentos mais felizes.

As amigas queridas Dayse Silveira e Kenia Santos, pelo carinho, apoio e por todos osmomentos inesquecıveis que passamos juntas.

A todas as minhas companheiras de republica, em especial Ana Carla Rodrigues e LuanaraRodrigues, pela amizade sincera, pelo apoio e por estarem comigo durante o desenvolvimentodeste trabalho.

Aos amigos de faculdade Osias Confort, Leonardo Garcia e Tiago de Paulo, por estaremsempre dispostos a me ajudar durante a graduacao.

Ao Douglas Farias, por me incentivar a seguir o caminho da pesquisa e pelo carinho e apoiodurante a graduacao.

Aos colegas Deborah Ribeiro, Fabio Gomes e Rogerio Farias por terem compartilhado bonsmomentos comigo.

Enfim, a todas as pessoas maravilhosas que fizeram e que fazem parte de minha vida...

Page 8: Processamento de Imagens no Aux´ılio `a Detec¸c˜ao de ... · Processamento de Imagens no Aux´ılio `a ... por cuidar de mim e por estar sempre ao meu lado.` ... por todo o conhecimento

“Suba o primeiro degrau com fe.Voce nao precisa ver a escadaria inteira.

Apenas de o primeiro passo.”

Martin Luther King

Page 9: Processamento de Imagens no Aux´ılio `a Detec¸c˜ao de ... · Processamento de Imagens no Aux´ılio `a ... por cuidar de mim e por estar sempre ao meu lado.` ... por todo o conhecimento

Resumo

Botelho, G.M., Processamento de Imagens no Auxılio a Deteccao de Cancer de Pele uti-lizando Redes Neurais Artificiais, Departamento de Ciencia da Computacao, Campus Catalao,UFG, Catalao, Brasil, 2007, 54p.

O grande desenvolvimento das tecnicas de processamento de imagens digitais (incluindo analisede imagens) ocorrido nas ultimas decadas propiciou o surgimento de uma grande quantidadede aplicacoes praticas em variados campos como, por exemplo, na medicina.

Na medicina, uma das aplicacoes concebidas e o diagnostico de doencas atraves da analisede imagens digitais. Esses diagnosticos vem apresentando resultados significativos e auxili-ando profissionais da saude. Dentre as doencas que estao sendo estudadas com o intuito deserem diagnosticadas destaca-se o cancer devido a sua letalidade e, consequentemente, a suanecessidade de identificacao precoce.

Diante disso, este trabalho busca reconhecer imagens de cancer de pele do tipo Melanoma.Para isso, uniu-se tecnicas de processamento de imagens digitais, mais precisamente a analisedas cores das imagens, com o poder de aprendizagem das Redes Neurais Artificiais para pos-sibilitar a elaboracao de um sistema capaz de realizar a diferenciacao entre imagens de lesoesMelanoma e imagens de lesoes nao Melanoma.

Palavras-chave: processamento de imagens, cancer de pele, classificacao de imagens, redesneurais artificiais.

i

Page 10: Processamento de Imagens no Aux´ılio `a Detec¸c˜ao de ... · Processamento de Imagens no Aux´ılio `a ... por cuidar de mim e por estar sempre ao meu lado.` ... por todo o conhecimento

Sumario

Lista de Figuras 1

1 Introducao 31.1 Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41.2 Organizacao do Trabalho . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

2 Cancer de Pele 52.1 O que e o Cancer? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52.2 Causas do Cancer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62.3 Tipos de Canceres de Pele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

3 Processamento de Imagens Digitais 93.1 Representacao de Imagens Digitais . . . . . . . . . . . . . . . . . . . . . . . . . 9

3.1.1 Amostragem e Quantizacao . . . . . . . . . . . . . . . . . . . . . . . . . 113.2 Pixels: Conceitos Basicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

3.2.1 Vizinhanca . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123.2.2 Conectividade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133.2.3 Caminho . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133.2.4 Componente Conexo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133.2.5 Relacao Binaria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143.2.6 Medidas de Distancia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143.2.7 Operacoes Logico-Aritmeticas . . . . . . . . . . . . . . . . . . . . . . . . 15

3.3 Etapas Basicas do Processamento de Imagens . . . . . . . . . . . . . . . . . . . 15

4 Caracterizacao de Imagens Digitais 174.1 Caracterizacao de Imagens atraves das Cores . . . . . . . . . . . . . . . . . . . . 17

4.1.1 Fundamentos de Cores . . . . . . . . . . . . . . . . . . . . . . . . . . . . 174.1.2 Sistemas de Representacao de Cores RGB e CMY . . . . . . . . . . . . . 194.1.3 Histograma de Cores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

4.2 Caracterizacao de Imagens atraves da Forma . . . . . . . . . . . . . . . . . . . . 224.2.1 Caracterizacao baseada em fronteiras . . . . . . . . . . . . . . . . . . . . 224.2.2 Caracterizacao baseada em regiao . . . . . . . . . . . . . . . . . . . . . . 23

ii

Page 11: Processamento de Imagens no Aux´ılio `a Detec¸c˜ao de ... · Processamento de Imagens no Aux´ılio `a ... por cuidar de mim e por estar sempre ao meu lado.` ... por todo o conhecimento

iii

4.3 Caracterizacao de Imagens atraves da Textura . . . . . . . . . . . . . . . . . . . 24

5 Classificacao de Imagens Digitais 255.1 Padroes e Classes de Padroes . . . . . . . . . . . . . . . . . . . . . . . . . . . . 255.2 Metodos de Decisao Teorica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26

5.2.1 Classificador de Distancia Mınima . . . . . . . . . . . . . . . . . . . . . . 265.2.2 Classificadores Estatısticos Otimos . . . . . . . . . . . . . . . . . . . . . 275.2.3 Redes Neurais Artificiais . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

5.3 Metodos Estruturais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 285.3.1 Casamento de Numeros de Formas . . . . . . . . . . . . . . . . . . . . . 295.3.2 Casamento de Cadeias . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

6 Redes Neurais Artificiais 306.1 Redes Neurais Biologicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 306.2 Redes Neurais Artificiais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

6.2.1 Neuronio Artificial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 326.3 Arquitetura das Redes Neurais . . . . . . . . . . . . . . . . . . . . . . . . . . . . 356.4 Processos de Aprendizagem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

6.4.1 Algoritmos de Aprendizagem . . . . . . . . . . . . . . . . . . . . . . . . 376.4.2 Paradigmas de Aprendizagem . . . . . . . . . . . . . . . . . . . . . . . . 406.4.3 Algoritmo de Aprendizado Supervisionado do Perceptron . . . . . . . . . 40

7 Modelo Proposto 427.1 Caracterizacao das Imagens Digitais . . . . . . . . . . . . . . . . . . . . . . . . . 42

7.1.1 Selecao do Banco de Imagens de Treinamento . . . . . . . . . . . . . . . 427.1.2 Formacao do Vetor de Caracterısticas . . . . . . . . . . . . . . . . . . . . 43

7.2 Implementacao da Rede Neural Artificial . . . . . . . . . . . . . . . . . . . . . . 447.3 Treinamento da Rede Neural Artificial . . . . . . . . . . . . . . . . . . . . . . . 447.4 Processo de Classificacao de Imagens . . . . . . . . . . . . . . . . . . . . . . . . 45

8 Testes e Resultados Experimentais 468.1 Aquisicao das Imagens . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 468.2 Implementacao das Caracterısticas de Cores das Imagens . . . . . . . . . . . . . 468.3 Implementacao da Rede Neural . . . . . . . . . . . . . . . . . . . . . . . . . . . 478.4 Fase de Testes da Rede Neural . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47

9 Conclusoes 509.1 Trabalhos Futuros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50

Referencias bibliograficas 52

Page 12: Processamento de Imagens no Aux´ılio `a Detec¸c˜ao de ... · Processamento de Imagens no Aux´ılio `a ... por cuidar de mim e por estar sempre ao meu lado.` ... por todo o conhecimento

iv

Page 13: Processamento de Imagens no Aux´ılio `a Detec¸c˜ao de ... · Processamento de Imagens no Aux´ılio `a ... por cuidar de mim e por estar sempre ao meu lado.` ... por todo o conhecimento

Lista de Figuras

2.1 ABCD do melanoma. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

3.1 Posicionamento dos eixos para representacao de imagens digitais. . . . . . . . . 103.2 Efeitos da variacao dos parametros: (a)256 x 256 / 256 nıveis; (b)32 x 32 / 256

nıveis; (c)256 x 256 / 64 nıveis; (d)256 x 256 / 2 nıveis. . . . . . . . . . . . . . . 123.3 (a)Vizinhanca-de-4 do pixel p; (b)Vizinhanca-de-8 do pixel p. . . . . . . . . . . . 133.4 Etapas do processamento de imagens digitais. . . . . . . . . . . . . . . . . . . . 16

4.1 Espectro de radiacao visıvel. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 184.2 Sistema de cores da CIE. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 184.3 Cubo do sistema de representacao de cores RGB. . . . . . . . . . . . . . . . . . 194.4 Imagem de amostra. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 204.5 Histograma em tons de cinza. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 204.6 Imagem de amostra. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 214.7 Histogramas do canal R, G e B respectivamente. . . . . . . . . . . . . . . . . . . 214.8 Exemplos de texturas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24

6.1 Neuronio biologico. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 316.2 Modelo de McCulloch e Pitts. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 326.3 Neuronio artificial. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 336.4 Grafico da Funcao de Limiar. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 346.5 Grafico da Funcao Linear por Partes. . . . . . . . . . . . . . . . . . . . . . . . . 346.6 Grafico da Funcao Sigmoide com parametro de inclinacao variavel. . . . . . . . . 356.7 Rede com camada unica. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 366.8 Rede Completamente Conectada com uma camada oculta. . . . . . . . . . . . . 366.9 Rede Recorrente. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

7.1 Pequena amostra das imagens usadas no banco de treinamento. . . . . . . . . . 437.2 Exemplo da rotulacao das imagens a uma saıda alvo. . . . . . . . . . . . . . . . 437.3 Exemplo de extracao de caracterısticas para a formacao do vetor. . . . . . . . . 447.4 Treinamento da rede neural proposta. . . . . . . . . . . . . . . . . . . . . . . . . 45

8.1 Imagem de lesao melanoma com seu histograma. . . . . . . . . . . . . . . . . . . 47

1

Page 14: Processamento de Imagens no Aux´ılio `a Detec¸c˜ao de ... · Processamento de Imagens no Aux´ılio `a ... por cuidar de mim e por estar sempre ao meu lado.` ... por todo o conhecimento

2 LISTA DE FIGURAS

8.2 Imagem de lesao nao melanoma com seu histograma. . . . . . . . . . . . . . . . 478.3 Resultados obtidos para imagens de lesoes Melanoma. . . . . . . . . . . . . . . . 488.4 Resultados obtidos para imagens de lesoes nao Melanoma. . . . . . . . . . . . . 488.5 Imagens Melanoma - Resultado: verdadeiro positivo. . . . . . . . . . . . . . . . 498.6 Imagens nao Melanoma - Resultado: verdadeiro negativo. . . . . . . . . . . . . . 498.7 Imagens Melanoma - Resultado: falso negativo . . . . . . . . . . . . . . . . . . . 498.8 Imagens nao Melanoma - Resultado: falso positivo. . . . . . . . . . . . . . . . . 49

Page 15: Processamento de Imagens no Aux´ılio `a Detec¸c˜ao de ... · Processamento de Imagens no Aux´ılio `a ... por cuidar de mim e por estar sempre ao meu lado.` ... por todo o conhecimento

Capıtulo 1Introducao

O desenvolvimento das primeiras tecnicas de processamento de imagens digitais (inclusive decaracterizacao de imagens) inicialmente nao obteve grande atencao dos estudiosos. Entretanto,a partir da decada 1960, quando imagens da Lua foram processadas com o intuito de removerdistorcoes, esta area comecou a ter o seu potencial reconhecido [Gonzalez and Woods 2000],apresentando desde entao uma significativa evolucao, o que proporcionou o surgimento deaplicacoes importantes em diversas areas, inclusive na medicina.

Atualmente, a medicina beneficia-se muito com o desenvolvimento de tecnicas computaci-onais responsaveis pela ampliacao da capacidade e da qualidade dos diagnosticos de diversasdoencas, atraves da analise de imagens digitais. Estes diagnosticos vem apresentando resulta-dos significativos e auxiliando varios profissionais da saude. Dentre os trabalhos desenvolvidosque unem computacao e medicina, o diagnostico de cancer vem se destacando devido a sualetalidade e, consequentemente, a sua necessidade de identificacao precoce.

Entre os varios tipos de canceres, o cancer de pele e o mais frequente na populacao mundiale brasileira [da Saude 2005], sendo que o seu tipo mais letal, o Melanoma, e de difıcil iden-tificacao devido ao fato de possuir semelhancas com outras doencas de pele ou mesmo comnevos, popularmente conhecidos como pintas [Mendonca and Azevedo 1992]. A partir disso,este trabalho busca identificar precocemente este tipo de cancer, aumentando as chances e aqualidade de vida dos pacientes.

Para isso, uniu-se tecnicas de processamento de imagens digitais, mais precisamente a analisedas cores das imagens de lesoes Melanoma e lesoes nao Melanoma (atraves da extracao de seuHistograma), com o poder de aprendizagem das Redes Neurais Artificiais para possibilitar aelaboracao de um sistema capaz de classificar estas imagens. Ressalta-se que se optou por uti-lizar as Redes Neurais para classificar as imagens pois estas permitem que o conhecimento sejaadquirido atraves de exemplos (imagens de exemplo), tendo este conhecimento a possibilidadede ser “refinado” pela experiencia [Haykin 2001].

3

Page 16: Processamento de Imagens no Aux´ılio `a Detec¸c˜ao de ... · Processamento de Imagens no Aux´ılio `a ... por cuidar de mim e por estar sempre ao meu lado.` ... por todo o conhecimento

4 Introducao

1.1 Objetivos

Os principais objetivos deste trabalho sao:

� Realizar um trabalho baseado em uma area que nao e muito estudada no Brasil, ou seja,a classificacao de imagens de cancer de pele;

� Estudar e aplicar tecnicas de processamento de imagens digitais e caracterizacao de ima-gens digitais no desenvolvimento da solucao do problema proposto;

� Utilizar as redes neurais artificiais para avaliar as caracterısticas das imagens de cancerde pele, visto que pretende-se reconhecer o cancer de pele atraves de suas caracterısticas;

� Auxiliar profissionais da saude na deteccao precoce do cancer de pele do tipo Melanoma,maximizando as chances e a qualidade de vida dos pacientes;

1.2 Organizacao do Trabalho

Este trabalho e composto por 9 capıtulos. No Capıtulo 1 faz-se uma introducao sobre oassunto e apresenta-se os objetivos. No Capıtulo 2 apresenta-se conceitos e caracterısticas doCancer de Pele. No Capıtulo 3 ressalta-se conceitos inicias de Processamento de Imagens,incluindo representacao de imagens e relacionamento entre pixels. Uma introducao a Caracte-rizacao de Imagens, bem como a descricao de tecnicas de extracao de caracterısticas e feita noCapıtulo 4.

O Capıtulo 5 apresenta alguns dos diversos metodos de Classificacao de Imagens e oCapıtulo 6 explora detalhadamente as Redes Neurais Artificiais. No Capıtulo 7 explica-seo Modelo Proposto para a classificacao das imagens e no Capıtulo 8 apresenta-se os tes-tes realizados e os resultados obtidos. Por fim, o Capıtulo 9 apresenta as conclusoes destetrabalho.

Page 17: Processamento de Imagens no Aux´ılio `a Detec¸c˜ao de ... · Processamento de Imagens no Aux´ılio `a ... por cuidar de mim e por estar sempre ao meu lado.` ... por todo o conhecimento

Capıtulo 2Cancer de Pele

Cancer e o nome dado a um conjunto de doencas cuja principal caracterıstica e o crescimentoautonomo e desordenado das celulas compositoras de uma determinada parte do corpo. Existemmais de 200 tipos de canceres, dentre eles, o cancer de pele e o tipo mais frequente na populacao,compreendendo a maior parte dos diagnosticos [da Saude 2005]. Apesar de o cancer ser umadas doencas mais temidas pelas pessoas, ja existem diversos tratamentos e em muitos casos, acura e possıvel, mas, para que isso aconteca, deve-se realizar o diagnostico nas fases iniciais dadoenca.

Este capıtulo aborda o desenvolvimento das celulas cancerıgenas e suas possıveis causas.Alem disso, realiza-se uma explanacao sobre o cancer de pele, definindo seus tipos e carac-terısticas principais.

2.1 O que e o Cancer?

O corpo humano e formado por diversos tipos de celulas e cada uma delas contem carac-terısticas que variam conforme a funcao que executam. Entretanto, todas as celulas do corpohumano sao formadas por tres partes basicas: a membrana plasmatica, o citoplasma e o nucleo.A membrana plasmatica e a parte externa da celula, o citoplasma e o corpo celular constituıdopor diversas estruturas como, por exemplo, o citoesqueleto e os ribossomos, e o nucleo e ocentro de controle da celula formado principalmente por cromossomos que, por sua vez saoformados por genes [Linhares and Gewandsznajder 1998].

Os genes sao uma especie de arquivo que guardam as informacoes necessarias para reproduzirtoda a estrutura do corpo em um material quımico, conhecido como Acido Desoxirribonucleico(DNA). Alem disso, o crescimento, a multiplicacao e a diferenciacao de todas as celulas doorganismo sao determinados por comandos geneticos.

Uma celula normal esta sujeita a alteracoes no DNA dos genes devido a fatores externos,como substancias quımicas, radiacoes e infeccoes virais. Essas alteracoes, tambem chamadas demutacoes geneticas, podem causar mudancas significativas no comportamento celular. Quandoocorre uma mutacao que altera os comandos de divisao, diferenciacao e morte celular, possibi-litando sua multiplicacao descontrolada, origina-se o tumor [Herzberg and Ferrari 2006].

5

Page 18: Processamento de Imagens no Aux´ılio `a Detec¸c˜ao de ... · Processamento de Imagens no Aux´ılio `a ... por cuidar de mim e por estar sempre ao meu lado.` ... por todo o conhecimento

6 Cancer de Pele

O tumor maligno, frequentemente chamado de cancer ou neoplasia, e um conjunto de celulaspraticamente identicas formadas por sucessivas divisoes celulares. Como o sistema imunologiconao consegue destruir as celulas anormais, o tumor evolui e invade estruturas proximas. Asvezes, as celulas cancerıgenas adquirem a capacidade de se disseminar para outras regioes docorpo, atraves do sangue ou da linfa – processo chamado de metastase. Tambem existem ostumores benignos que sao aglomerados de celulas que crescem devagar e permanecem separadosdo tecido que o rodeia, podendo ser removidos cirurgicamente.

Um dos maiores obstaculos ao tratamento do cancer e a formacao de metastases, pois a partirdo momento que as celulas cancerıgenas invadem varias regioes do corpo, o tratamento se tornamais difıcil e traumatico, muitas vezes nao existindo chances de cura. Por isso, a prevencao ea deteccao precoce do cancer sao de fundamental importancia para o seu tratamento. E, umadas melhores formas de prevencao e conhecer as possıveis causas da doenca.

2.2 Causas do Cancer

Existem agentes capazes de modificar o DNA do gene alterando o processo de divisaocelular e permitindo que as celulas se proliferem descontroladamente. Esses agentes sao conhe-cidos como agentes carcinogenicos, os quais podem ser representados por produtos quımicos,radiacoes e microorganismos [Herzberg and Ferrari 2006].

Alguns dos principais agentes carcinogenicos quımicos sao encontrados no fumo e podemcausar varios tipos de canceres, como o de pulmao, faringe, laringe e outros. Alem dos agentesdo fumo, o contato prolongado com asbesto (mineral composto por fibras, muito usado naindustria naval e de construcao civil), aminas aromaticas (composto quımico organico, presentena manufatura de tintas) e benzeno (hidrocarboneto presente na industria quımica) tambempode propiciar o desenvolvimento de cancer. Em relacao a radiacao, tem-se como principalexemplo de agente carcinogenico a luz solar, que com seus raios ultravioleta e responsavel pelamaioria dos canceres de pele. Por fim, tem-se microorganismos como o vırus Papiloma e o vırusEpstein-Baar capazes de favorecer a malignizacao das celulas que invadem.

E necessario ressaltar que devido a fatores hereditarios muitas pessoas possuem maior pre-disposicao para desenvolver o cancer, visto que herdam todas as caracterısticas de seus paisatraves do DNA. Isso quer dizer que, por exemplo, uma mulher que possui parentes que tiveramcancer de mama, tera maiores chances de tambem desenvolver a doenca. Entretanto, apenasos fatores hereditarios nao originam o cancer, eles somente aumentam o risco caso o organismoseja exposto aos agentes carcinogenicos.

Portanto, uma das melhores formas de prevenir o cancer e evitar a exposicao do organis-mo aos agentes carcinogenicos, o que em muitos casos nao e uma tarefa muito difıcil. Comoexemplo, a nao utilizacao do fumo evitaria varios tipos de canceres e a exposicao controladaaos raios solares impediria o desenvolvimento do cancer mais frequente atualmente, ou seja, ocancer de pele.

Page 19: Processamento de Imagens no Aux´ılio `a Detec¸c˜ao de ... · Processamento de Imagens no Aux´ılio `a ... por cuidar de mim e por estar sempre ao meu lado.` ... por todo o conhecimento

2.3 Tipos de Canceres de Pele 7

2.3 Tipos de Canceres de Pele

O cancer de pele se caracteriza pelo crescimento autonomo e desordenado das celulas quecompoem a pele. Em alguns casos, estas celulas adquirem a capacidade de disseminar-se(metastase) para outros tecidos e orgaos do corpo, dificultando o tratamento. Como a pelee formada por mais de um tipo de celula, tem-se diferentes tipos de canceres de pele, dentreeles os mais comuns sao o Carcinoma Basocelular, o Carcinoma Espinocelular e o Melanoma.

� Carcinoma Basocelular: Este e o tumor maligno cutaneo mais frequente, compreendendocerca de 75% dos diagnosticos, porem, e de baixa letalidade devido a facilidade de iden-tificacao e, principalmente, pelo fato de raramente apresentar metastase. Na maioria dasvezes, localiza-se na regiao da cabeca e do pescoco, acomete pessoas com mais de 40 anosde idade, de pele clara e com historico de exposicao frequente ao sol [Mantese et al. 2006].

O Carcinoma Basocelular origina-se nas celulas da camada basal da epiderme e e caracteri-zado pela formacao de lesoes (feridas ou nodulos) de crescimento lento [Martinez et al. 2006].Apesar de raramente apresentar metastase, pode ser localmente destrutivo se descober-to tardiamente. O tratamento e realizado atraves de procedimentos cirurgicos para aretirada do tumor e, se necessario, emprega-se a radioterapia.

� Carcinoma Espinocelular: Este tumor representa 20% dos diagnosticos de neoplasiascutaneas e origina-se nos queratinocios (celulas produtoras de queratina) da epiderme, po-dendo tambem surgir no tecido epitelial que cobre mucosas [Martinez et al. 2006]. Causamais mortes que o carcinoma basocelular, visto que apresenta maior possibilidade deproduzir metastase, fato este que torna o diagnostico precoce muito importante para acura.

O Carcinoma Espinocelular caracteriza-se pela formacao de feridas de rapida evolucao,que muitas vezes vem acompanhadas de secrecao e coceira. Tende a desenvolver-se emareas previamente inflamadas ou com cicatrizes e a localizar-se em regioes expostas docorpo como, por exemplo, pescoco e cabeca (principalmente no labio inferior, nariz eorelhas) [Nasser 2004]. O tratamento e feito basicamente atraves de cirurgia, radioterapiae se preciso, quimioterapia.

� Melanoma: Esta e a neoplasia cutanea de menor incidencia, porem de maior letalidadedevido a dificuldade de identificacao e a formacao de metastases. Este tumor origina-senos melanocitos (celulas produtoras de melanina) e pode surgir em varias regioes do corpo,fato que torna a exposicao solar excessiva apenas uma de suas causas. Outros fatores derisco sao determinados pela existencia de lesoes pigmentadas irregulares, presenca denevos (pintas) transformados, historico familiar de melanoma e pigmentacao clara dapele [Mendonca and Azevedo 1992].

Apesar do melanoma ser o cancer de pele mais letal, se identificado precocemente e remo-vido cirurgicamente, a probabilidade de cura tera um aumento significativo. Entretanto,para que isto aconteca e necessario saber reconhecer as caracterısticas que o identificam.

Existem quatro caracterısticas que sao conhecidas como ABCD do melanoma e que saofaceis de identificar em uma lesao. Sao elas: Assimetria, Bordas irregulares, Cor variada

Page 20: Processamento de Imagens no Aux´ılio `a Detec¸c˜ao de ... · Processamento de Imagens no Aux´ılio `a ... por cuidar de mim e por estar sempre ao meu lado.` ... por todo o conhecimento

8 Cancer de Pele

e Diametro maior que 6mm, como ilustrado na Figura 2.1. Portanto, lesoes que surgemno corpo com essas caracterısticas ou pintas pre-existentes que tem sua forma, cor oudiametro alterado, devem ser analisadas por um especialista devido a possibilidade de seruma lesao melanoma.

O tratamento deste tipo de cancer e realizado atraves de remocao cirurgica da lesao,radioterapia e quimioterapia. Entretanto, o paciente so tera chances de ser curado se alesao for diagnosticada nos estagios iniciais.

Figura 2.1: ABCD do melanoma.

O grande crescimento do numero de casos de cancer de pele devido a destruicao da camadade ozonio e ao culto a pele bronzeada fez com que a preocupacao com a prevencao e a iden-tificacao precoce aumentasse. Atualmente, investe-se em campanhas preventivas que tentamconscientizar a populacao do risco de se ter uma neoplasia cutanea e incentiva-se a exploracaocientıfica, inclusive no campo computacional, em busca de formas de identificar precocementeesses tumores, especialmente o melanoma, o que aumentara as chances e a qualidade de vidados pacientes.

No campo computacional, o aperfeicoamento de tecnicas de processamento de imagenspermitiu que a qualidade dos diagnosticos, atraves da analise de imagens digitais, aumentassesignificativamente. Inclusive a classificacao de imagens de cancer de pele vem apresentandoresultados satisfatorios devido as inumeras tecnicas de processamento de imagens utilizadas.

Page 21: Processamento de Imagens no Aux´ılio `a Detec¸c˜ao de ... · Processamento de Imagens no Aux´ılio `a ... por cuidar de mim e por estar sempre ao meu lado.` ... por todo o conhecimento

Capıtulo 3Processamento de Imagens Digitais

No inıcio da decada de 1920 foi realizada uma das primeiras experiencias com as tecnicas deprocessamento de imagens, com o objetivo de melhorar as imagens digitalizadas para jornais,enviadas por meio de cabos submarinos de Londres para Nova York. No entanto, o proces-samento de imagens nao foi estudado amplamente ate a decada de 1960, pois somente com oadvento dos computadores digitais de grande porte e com a popularidade do programa espacialem 1964, quando distorcoes de imagens da Lua foram retiradas, que o potencial dos conceitos deprocessamento de imagens foi reconhecido e obteve maior atencao [Gonzalez and Woods 2000].

Desde aquela epoca, o processamento de imagens digitais evoluiu intensamente e hoje possuidiversas aplicacoes, entre elas encontram-se: interpretacao de raios-X e outras imagens medicas,monitoramento de plantacoes, queimadas e desmatamentos, restauracao de imagens antigas,reconhecimento de padroes e outras. Alem do mais, a medida que os equipamentos graficos eos computadores ficam mais poderosos e mais baratos, a quantidade de aplicacoes aumenta.

A partir da aplicacao desenvolvida, a area processamento de imagens divide-se em categoriasfundamentais, que sao: Realce de Imagens (utilizado para melhorar as propriedades visuaisde uma imagem, tornando-a mais apropriada para uma aplicacao especıfica), Restauracao deImagens (tem por objetivo reconstruir ou recuperar uma imagem danificada) e Analise deImagens (busca extrair informacoes ou caracterısticas a partir de uma imagem).

Em muitos casos, e necessario utilizar tecnicas incluıdas em mais de uma categoria paraalcancar um resultado satisfatorio. Contudo, antes de executar qualquer processamento emuma imagem precisa-se digitaliza-la, o que permitira a manipulacao de seus elementos. Nestecapıtulo sera abordada a representacao de imagens digitais, juntamente com diversos conceitosfundamentais relacionados com a manipulacao de seus elementos. Alem disso, sera apresentadouma visao geral sobre os passos fundamentais realizados ao se processar imagens.

3.1 Representacao de Imagens Digitais

Uma imagem monocromatica pode ser considerada a discretizacao de uma funcao bidimen-sional f(x, y), onde x e y sao as coordenadas espaciais e o valor de f em algum ponto (x, y) cor-responde ao brilho ou nıveis de cinza da imagem naquele ponto. Cada ponto na imagem digital

9

Page 22: Processamento de Imagens no Aux´ılio `a Detec¸c˜ao de ... · Processamento de Imagens no Aux´ılio `a ... por cuidar de mim e por estar sempre ao meu lado.` ... por todo o conhecimento

10 Processamento de Imagens Digitais

e denominado de elemento da imagem ou pixel (abreviacao de picture elements). O posiciona-mento dos eixos x e y em uma imagem e apresentado na Figura 3.1 [Gonzalez and Woods 2000].

Figura 3.1: Posicionamento dos eixos para representacao de imagens digitais.

A geracao de imagens e afetada por dois componentes: a iluminacao, i(x, y), que representaa quantidade de luz incidente sobre o ponto (x, y) e a reflectancia, r(x, y), que representa aquantidade de luz refletida pelo ponto (x, y). A multiplicacao de i(x, y) e r(x, y) formam f(x, y):

f(x, y) = i(x, y).r(x, y) (3.1)

onde

0 < i(x, y) < ∞ (3.2)

0 < r(x, y) < 1 (3.3)

A reflectancia e limitada entre 0, que corresponde a absorcao total da luz e 1 que correspondea reflectancia total. Alem disso, destaca-se que i(x, y) e definida pela fonte de iluminacao, en-quanto r(x, y) e definida pelas caracterısticas dos objetos da cena [Gonzalez and Woods 2000].

No caso de imagens coloridas, a representacao e feita quase da mesma forma. Considerandoo sistema RGB de cores, cada pixel pode ser visto como um vetor f(x, y) = (fR(x, y), fG(x, y),fB(x, y)), cujas componentes representam as intensidades das cores vermelho, verde e azul doponto (x, y). Portanto, uma imagem colorida e a composicao de tres imagens monocromaticas,

Page 23: Processamento de Imagens no Aux´ılio `a Detec¸c˜ao de ... · Processamento de Imagens no Aux´ılio `a ... por cuidar de mim e por estar sempre ao meu lado.` ... por todo o conhecimento

3.1 Representacao de Imagens Digitais 11

fR(x, y), fG(x, y), fB(x, y), denominadas, respectivamente, de banda vermelha, banda verde, ebanda azul, no ponto (x, y) [Queiroz and Gomes 2006].

Tanto em imagens monocromaticas quanto em imagens coloridas, para que a funcao f(x, y)seja adequada para o processamento computacional, ela precisa ser digitalizada atraves dosprocessos de Amostragem e Quantizacao.

3.1.1 Amostragem e Quantizacao

Os processos de Amostragem e Quantizacao sao utilizados para digitalizar uma imagem,ou seja, modifica-la de forma que ela possa ser armazenada e processada em um computador.O processo de Amostragem consiste em digitalizar as coordenadas espaciais (x, y) da imagem,enquanto o processo de Quantizacao consiste em digitalizar os valores de brilho da imagem[Gonzalez and Woods 2000].

Na realidade, uma imagem digital pode ser visualizada como uma matriz N ×M de valoresinteiros, na qual os ındices de linhas e colunas representarao um ponto (x, y) na imagem e ovalor do elemento da matriz indicara o nıvel de brilho naquele ponto, como pode ser observadona equacao 3.4:

f(x, y) ≈

f(0, 0) f(0, 1) ... f(0, M − 1)f(1, 0) f(1, 1) ... f(1, M − 1)

.

.

.f(N − 1, 0) f(N − 1, 1) ... f(N − 1, M − 1)

(3.4)

Em uma matriz monocromatica, cada elemento e uma aproximacao do nıvel de cinza daimagem no ponto amostrado para um valor no conjunto {0, 1, ..., L−1}, onde 0 corresponde aopreto e L − 1 corresponde ao branco. Os pixels entre estes dois valores terao diferentes nıveisde cinza, sendo que quanto mais proximo ao 0, mais escuro sera.

Uma imagem digitalizada e uma aproximacao de uma imagem analogica da qual ela foiobtida. Com isso, a qualidade da aproximacao dependera essencialmente dos valores de N , Me L usados. Em geral, quanto maiores estes parametros, melhor a qualidade da digitalizacao.Porem, maior sera o numero de bits necessarios para a codificacao binaria da imagem, vistoque:

bits = N ×M × l (3.5)

Onde N×M corresponde a dimensao da imagem e l e o menor inteiro tal que o conjunto denıveis de cinza L ≤ 2l. Ao variar estes parametros, modifica-se a qualidade da imagem, comopode ser observado na Figura 3.2. De fato, diversas alteracoes realizadas em imagens resultamna modificacao de seus pixels e, para alcancar um resultado satisfatorio atraves das diversastecnicas existentes torna-se necessario o conhecimento de conceitos basicos relacionados aospixels.

Page 24: Processamento de Imagens no Aux´ılio `a Detec¸c˜ao de ... · Processamento de Imagens no Aux´ılio `a ... por cuidar de mim e por estar sempre ao meu lado.` ... por todo o conhecimento

12 Processamento de Imagens Digitais

Figura 3.2: Efeitos da variacao dos parametros: (a)256 x 256 / 256 nıveis; (b)32 x 32 / 256nıveis; (c)256 x 256 / 64 nıveis; (d)256 x 256 / 2 nıveis.

3.2 Pixels: Conceitos Basicos

Os pixels sao os elementos basicos que compoem as imagens digitais, ou seja, cada ponto(x, y) na imagem representa um pixel. Ao se processar uma imagem, manipula-se os seus pixelse, para que esta manipulacao seja adequada a aplicacao deve-se conhecer os relacionamentosexistentes entre eles. As subsecoes posteriores apresentam alguns conceitos basicos realizadosaos pixels, os quais sao bastante uteis no processamento de imagens digitais.

3.2.1 Vizinhanca

Em uma imagem digital, um pixel p no ponto (x, y) possui dois vizinhos horizontais e doisverticais, cujas coordenadas sao dadas por: (x + 1, y), (x − 1, y), (x, y + 1), (x, y − 1). Esteconjunto de pixels e conhecido como vizinhanca-de-4 do pixel p e e representado por N4(p). Hatambem os quatro vizinhos diagonais representados pelos pontos: (x + 1, y + 1), (x + 1, y− 1),(x− 1, y + 1), (x− 1, y − 1) e denotados por ND(p) [Gonzalez and Woods 2000]. Unindo-se osvizinhos diagonais com a vizinhanca-de-4 tem-se a chamada vizinhanca-de-8 (N8(p)). A Figura3.3 ilustra a vizinhanca-de-4 e a vizinhanca-de-8 do pixel p.

Ressalta-se que a vizinhanca pode ser estendida de acordo com a aplicacao e que em cer-tas posicoes como, por exemplo, nas bordas da imagem, um pixel p nao tera alguns de seus

Page 25: Processamento de Imagens no Aux´ılio `a Detec¸c˜ao de ... · Processamento de Imagens no Aux´ılio `a ... por cuidar de mim e por estar sempre ao meu lado.` ... por todo o conhecimento

3.2 Pixels: Conceitos Basicos 13

vizinhos. Por isso, ao se aplicar algumas tecnicas de processamento de imagens deve-se efetuarmodificacoes ao se trabalhar com as bordas das imagens com o intuito de obter um resultadouniforme em toda a imagem, nao deixando nenhum pixel da borda sem a alteracao desejada.

Figura 3.3: (a)Vizinhanca-de-4 do pixel p; (b)Vizinhanca-de-8 do pixel p.

3.2.2 Conectividade

Dois pixels p1 e p2 sao ditos conectados quando satisfazem dois criterios. O primeiro dizque os pixels devem ser adjacentes, ou seja, devem ser vizinhos-de-8. O segundo diz que ospixels devem atender a algum criterio de classificacao, digamos, seus nıveis de cinza devem seriguais [Gonzalez and Woods 2000].

Para esclarecer o conceito de conectividade, pode-se usar como exemplo uma imagem binaria(com apenas valores 0 e 1), na qual dois de seus pixels vizinhos-de-4 so serao conectados se seusvalores forem iguais. Ressalta-se que o conceito de conectividade e importante para estabeleceras bordas dos objetos e os componentes de regioes de uma imagem.

3.2.3 Caminho

Um caminho entre os pixels p0 = (x0, y0) e pn = (xn, yn) e uma sequencia de pixels distintoscom coordenadas (x0, y0), (x1, y1),..., (xn, yn), onde n e o comprimento do caminho e, (xi, yi) e(xi−1, yi−1), com i = 1, 2, ...n, sao adjacentes. A definicao de caminho e util para se determinaros componentes conexos em uma imagem.

3.2.4 Componente Conexo

Dado um subconjunto S de uma imagem e dois pixels p1 e p2 contidos neste subconjunto,entao, p1 estara conectado a p2 em S se existir um caminho entre p1 e p2 consistindo somentede pixels de S. Portanto, o componente conexo sera o conjunto de pixels em S que estaoconectados a p1, para qualquer pixel p1 em S [Gonzalez and Woods 2000]. Ressalta-se que emum componente conexo, quaisquer dois pixels estao conectados um ao outro e os componentesconexos distintos sao disjuntos.

Page 26: Processamento de Imagens no Aux´ılio `a Detec¸c˜ao de ... · Processamento de Imagens no Aux´ılio `a ... por cuidar de mim e por estar sempre ao meu lado.` ... por todo o conhecimento

14 Processamento de Imagens Digitais

3.2.5 Relacao Binaria

Seja A uma imagem ou um componente conexo da imagem. Entao, uma Relacao BinariaR sobre A sera um conjunto de pares de elementos contidos em A [Gonzalez and Woods 2000].Quando um par (a, b) esta em R, diz-se que a esta relacionado a b (aRb). Alem disso, umarelacao binaria R sobre A pode ser:

� Reflexiva: Para cada a em A, aRa.

� Simetrica: Para cada a e b em A, aRb implica em bRa.

� Transitiva: Para cada a, b e c em A, aRb e bRc implica que aRc.

Quando uma relacao binaria satisfaz estas tres propriedades recebe o nome de Relacao deEquivalencia. A relacao binaria e utilizada para ilustrar e verificar conceitos de relacoes eequivalencias entre imagens e componentes conexos (atraves do relacionamento entre os pixelsdas imagens).

3.2.6 Medidas de Distancia

Ao se manipular imagens digitais e muito frequente a utilizacao de medidas de distancia.Considerando os pixels p1, p2 e p3, com coordenadas (x1, y1), (x2, y2) e (x3, y3) respectivamente,D e uma funcao distancia se [Gonzalez and Woods 2000]:

1. D(p1, p2) ≥ 0.

2. D(p1, p2) = D(p2, p1).

3. D(p1, p3) ≤ D(p1, p2) + D(p2, p3).

A partir destas tres condicoes tem-se algumas medidas de distancia. Dentre elas, a maisclassica e Distancia Euclidiana, representada pela equacao 3.6. Alem da Distancia Euclidiana,tem-se a Distancia D4 (ou Distancia City Block) e a Distancia D8 (ou Distancia Xadrez),representadas, respectivamente, pelas equacoes 3.7 e 3.8.

De(p1, p2) =√

(x1 − x2)2 + (y1 − y2)2 (3.6)

D4(p1, p2) = |x1 − x2|+ |y1 − y2| (3.7)

D8(p1, p2) = max(|x1 − x2|, |y1 − y2|) (3.8)

As medidas de distancia sao frequentemente usadas para verificar a similaridade entre ima-gens. Quanto menor a distancia entre os pixels das imagens, maior sera a semelhanca entreelas. Entretanto, calcular a distancia pixel a pixel pode requerer um tempo consideravel edespender muito esforco computacional se as imagens forem grandes.

Page 27: Processamento de Imagens no Aux´ılio `a Detec¸c˜ao de ... · Processamento de Imagens no Aux´ılio `a ... por cuidar de mim e por estar sempre ao meu lado.` ... por todo o conhecimento

3.3 Etapas Basicas do Processamento de Imagens 15

3.2.7 Operacoes Logico-Aritmeticas

As operacoes logico-aritmeticas sao bastante usadas no processamento de imagens digitais.Elas sao realizadas pixel a pixel em uma imagem inteira ou sao orientadas para uma vizinhanca.Inicialmente, as operacoes logicas so podiam ser usadas em imagens binarias (apenas com duascores: preto e branco), entretanto, o advento de novos conceitos como, por exemplo, a LogicaFuzzy fez com que as operacoes logicas pudessem ser aplicadas em qualquer imagem. Asoperacoes aritmeticas tambem podem ser aplicadas a pixels variados.

As operacoes logicas realizadas entre dois pixels p1 e p2 sao E, OU, e COMPLEMENTO,enquanto as operacoes aritmeticas sao Adicao, Subtracao, Multiplicacao e Divisao. As repre-sentacoes de ambas as operacoes sao dadas por:

E: p1 E p2

OU: p1 OU p2

COMPLEMENTO: NAO p1 (ou, p1)

Adicao: p1 + p2

Subtracao: p1 − p2

Multiplicacao: p1 ∗ p2 (ou, p1p2)Divisao: p1 ÷ p2 (ou, p1

p2), quando p2 6= 0

Geralmente, as operacoes logicas sao utilizadas em deteccao de caracterısticas, mascara-mento e analise de formas. Ja as operacoes aritmeticas sao usadas para realizar a media deimagens (Adicao), remover informacao estatica do fundo de imagens (Subtracao) e corrigirsombras de nıveis de cinza (Multiplicacao e Divisao) [Gonzalez and Woods 2000].

Apos a compreensao de alguns conceitos basicos relacionados ao elemento fundamental daimagem - o pixel - e importante destacar as etapas gerais pelas quais uma imagem passa ao serprocessada, apesar de nem todas serem usadas em determinadas aplicacoes.

3.3 Etapas Basicas do Processamento de Imagens

Ao se processar uma imagem, esta deve passar por algumas etapas basicas que vao desdesua aquisicao ate a sua exibicao, como pode ser visto na Figura 3.4. Estas etapas englobamum sistema de processamento completo, entretanto, em algumas aplicacoes, nem todas saoutilizadas.

A primeira etapa consiste em Capturar a imagem atraves de um sensor de imageamento(como exemplo, tem-se cameras de TV e cameras de varredura). Em seguida, se necessario,digitaliza-se a imagem, atraves de um conversor analogico-digital, para que ela possa ser mani-pulada pelo computador. Apos a digitalizacao, realiza-se o Pre-Processamento com o objetivode melhorar a qualidade da imagem para os proximos passos. Geralmente, nesta etapa executa-se a filtragem para remover ruıdos e aprimora-se o contraste. Entretanto, em alguns casos, asaplicacoes requerem apenas o pre-processamento [Queiroz and Gomes 2006].

A proxima etapa e a Segmentacao, a qual divide a imagem em partes ou objetos constituintesde acordo com cada aplicacao [Gonzalez and Woods 2000]. Como saıda desta fase, tem-se um

Page 28: Processamento de Imagens no Aux´ılio `a Detec¸c˜ao de ... · Processamento de Imagens no Aux´ılio `a ... por cuidar de mim e por estar sempre ao meu lado.` ... por todo o conhecimento

16 Processamento de Imagens Digitais

conjunto de pixels que representam tanto a fronteira de uma regiao quanto os pontos dentro damesma. Assim, a escolha de uma das formas de representar a fronteira e o interior dos objetose chamado de fase de Representacao. Apos a escolha da representacao, passa-se ao processo deDescricao, o qual extrai caracterısticas uteis ou que facilite a diferenciacao de classes.

Por fim, com base na descricao, o Reconhecimento atribui um rotulo a cada objeto segmen-tado, enquanto a Interpretacao associa um significado a um conjunto de objetos reconhecidos.Apos chegar a um resultado final, ou mesmo durante qualquer etapa, a visualizacao dos resul-tados pode ser feita atraves de monitores e dispositivos de impressao.

Como dito anteriormente, em determinadas aplicacoes nao e necessario a realizacao detodas estas etapas. Por exemplo, este trabalho dara enfase apenas ao processo de descricao deimagens (tambem conhecido como caracterizacao de imagens) devido a sua importancia paraa aplicacao em questao.

Figura 3.4: Etapas do processamento de imagens digitais.

Page 29: Processamento de Imagens no Aux´ılio `a Detec¸c˜ao de ... · Processamento de Imagens no Aux´ılio `a ... por cuidar de mim e por estar sempre ao meu lado.` ... por todo o conhecimento

Capıtulo 4Caracterizacao de Imagens Digitais

Uma imagem digital e, na realidade, uma matriz contendo as intensidades dos pixels semnenhum significado aparente. Entretanto, a partir destes dados e possıvel extrair informacoesque venham caracterizar essas imagens. Quando se trata de imagens digitais, o termo “carac-terıstica” e definido como um atributo ou uma propriedade que a diferencie. Existem carac-terısticas que estao naturalmente presentes na visualizacao da imagem como, por exemplo, aluminancia dos pixels de uma regiao ou a textura, enquanto outras caracterısticas sao o resul-tado de manipulacoes especıficas em uma imagem como, por exemplo, a obtencao do histogramade cores e do espectro da frequencia [Pratt 2001].

A caracterizacao de uma imagem e fundamental para o isolamento de regioes com propri-edades comuns dentro da imagem e a subsequente identificacao e classificacao de tal regiao.Para isso, as caracterısticas sao extraıdas, atraves de diversas tecnicas. Geralmente, as ca-racterısticas sao classificadas em genericas e de domınio especıfico. Entre as caracterısticasgenericas encontram-se a cor, a forma e a textura e entre as caracterısticas de domınio es-pecıfico tem-se, por exemplo, as faces humanas e as impressoes digitais [Rui et al. 1997]. Estecapıtulo explorara as tres caracterısticas genericas das imagens: cor, forma e textura, visto quesao as mais utilizadas, abordando algumas de suas representacoes.

4.1 Caracterizacao de Imagens atraves das Cores

A caracterizacao de imagens digitais atraves das cores e amplamente utilizada devido aofato de ser relativamente invariante quanto ao tamanho, resolucao e orientacao da imagem.Alem disso, a extracao das cores de uma imagem e computacionalmente facil de se realizar[Bender 2003]. Atualmente, o Histograma de Cores e a tecnica de caracterizacao por coresmais usada, porem antes de entender sua concepcao, e necessario conhecer alguns conceitosbasicos relacionados as cores.

4.1.1 Fundamentos de Cores

As cores percebidas em objetos sao determinadas pela natureza da luz refletida no objeto. Aluz e uma onda eletromagnetica, sendo que apenas uma pequena banda da frequencia, situada

17

Page 30: Processamento de Imagens no Aux´ılio `a Detec¸c˜ao de ... · Processamento de Imagens no Aux´ılio `a ... por cuidar de mim e por estar sempre ao meu lado.` ... por todo o conhecimento

18 Caracterizacao de Imagens Digitais

entre aproximadamente 400 e 700 nm, e percebida pelo sistema visual humano. Nesta bandaencontram-se as cores violeta (menor frequencia), azul, ciano, verde, amarelo, laranja e vermelho(maior frequencia), denominadas de cores visıveis, como pode ser observado na Figura 4.1[Azevedo and Conci 2003].

Figura 4.1: Espectro de radiacao visıvel.

Existem cores que sao capazes de formar quase todas as cores presentes na natureza. Dentreelas as mais populares sao as primarias RGB, compostas pelas cores vermelho (Red), verde(Green) e azul (Blue) do espectro visıvel, e as secundarias CMY, compostas pelas cores ciano(Cyan), magenta (Magenta) e amarelo (Yellow). Destaca-se que as cores secundarias saoobtidas a partir da adicao das primarias RGB e as primarias RGB tambem podem ser obtidasa partir da subtracao das secundarias CMY.

Na tentativa de definir todas as cores atraves de radiacoes primarias, a Commission Inter-national de l’Eclairage (CIE) criou o sistema de representacao de cores XYZ, apresentado naFigura 4.2, no qual todas as cores podem ser geradas atraves da combinacao de tres cores (quenao possuem representacao visual) supersaturadas, chamadas de X, Y e Z. A vantagem dografico da CIE e que ele auxilia no calculo de alguns atributos das cores, como a saturacao e ocomprimento de onda [Azevedo and Conci 2003].

Figura 4.2: Sistema de cores da CIE.

Alem do sistema de representacao de cores da CIE, existem outros sistemas bastante utili-zados. Dentre eles, o RGB e o CMY sao importantes para o processamento de imagens digitais,

Page 31: Processamento de Imagens no Aux´ılio `a Detec¸c˜ao de ... · Processamento de Imagens no Aux´ılio `a ... por cuidar de mim e por estar sempre ao meu lado.` ... por todo o conhecimento

4.1 Caracterizacao de Imagens atraves das Cores 19

visto que a maioria das cameras usadas para aquisicao das imagens utilizam o sistema RGB eos dispositivos de saıdas (impressoras e copiadoras) usam o sistema CMY.

4.1.2 Sistemas de Representacao de Cores RGB e CMY

O sistema de representacao RGB baseia-se na sensibilidade do olho humano e utiliza ascores vermelho (R), verde(G) e azul (B) como cores primarias, sendo que R, G e B sao ascoordenadas cartesianas responsaveis pela formacao do cubo unitario (todas as arestas saoiguais a 1) que representa o espaco de cores, como pode ser visto na Figura 4.3. Este modelotambem e conhecido como modelo aditivo, pois as diversas cores sao formadas atraves da adicaodas primarias RGB.

Figura 4.3: Cubo do sistema de representacao de cores RGB.

Matematicamente, uma cor C de um pixel pode ser definida por C = r.R+ g.G+ b.B, ondeR,G e B sao as cores primarias e r,g e b sao os coeficientes correspondentes as intensidades asso-ciadas a cada uma das cores [Azevedo and Conci 2003]. Como a resposta do olho aos estımulosespectrais nao e linear, algumas cores presentes na natureza nao podem ser reproduzidas pelasobreposicao das primarias RGB.

Ja o sistema de representacao CMY usa as cores secundarias ciano (C), magenta (M) eamarelo (Y) para representar o espaco de cores, tambem formado por um cubo unitario. Estemodelo e conhecido como modelo subtrativo, pois a formacao de cada cor se da atraves dasubtracao da luz incidente de uma das componentes RGB pelas cores secundarias e a reflexaodas outras. Por exemplo, o ciano subtrai a luz vermelha e reflete as outras, o magenta subtrai overde e o amarelo subtrai o azul. Com isso, a variacao das cores acontece devido a diminuicaodos comprimentos de luz que serao absorvidos [Azevedo and Conci 2003].

Depois de entender como as cores sao formadas torna-se mais facil compreender como elaspodem ser extraıdas computacionalmente de uma imagem. Existem algumas tecnicas usadaspara a extracao de cores como, por exemplo, o Histograma de Cores e os Momentos de Cores,mas, neste trabalho destaca-se apenas o Histograma de Cores, por ser esta a tecnica escolhidapara representar as caracterısticas de cores das imagens das lesoes de pele. Ressalta-se queescolheu-se o Histograma por ser uma tecnica simples, popular e facil de calcular computacio-nalmente.

Page 32: Processamento de Imagens no Aux´ılio `a Detec¸c˜ao de ... · Processamento de Imagens no Aux´ılio `a ... por cuidar de mim e por estar sempre ao meu lado.` ... por todo o conhecimento

20 Caracterizacao de Imagens Digitais

4.1.3 Histograma de Cores

O histograma de cores e uma tecnica bastante usada na representacao das caracterısticasdas cores de imagens digitais, por ser facil de calcular. Ele pode ser obtido de imagens mo-nocromaticas (compostas por diferentes tons de cinza) ou de imagens coloridas. Em imagensmonocromaticas, o histograma corresponde ao calculo da quantidade de pixels de uma imagempara cada nıvel de cinza [Gonzalez and Woods 2000]. Geralmente, e representado por um con-junto de barras verticais, sendo uma barra para cada nıvel de cinza presente na imagem. Jaa altura de cada barra e proporcional ao numero de pixels que apresentam o mesmo nıvel decinza. Na figura 4.5 pode ser observado o histograma da imagem monocromatica da Figura4.4.

Figura 4.4: Imagem de amostra.

Figura 4.5: Histograma em tons de cinza.

Em imagens coloridas, como exemplo imagens no formato RGB, tem-se o calculo de treshistogramas, um para cada canal de cor (neste caso, vermelho, verde e azul). Primeiramente,extrai-se de cada pixel a intensidade da cor no formato RGB e, em seguida, conta-se o numerode ocorrencias de cada intensidade para cada canal de cor [Azevedo and Conci 2003], obtendotres graficos que representam o histograma de cada canal, como pode ser observado na figura4.7.

Percebe-se que o histograma apresenta uma descricao global da imagem. Quando e obtidoa partir de imagens monocromaticas fornece uma visao sobre a distribuicao dos pixels, docontraste e da luminancia da imagem, sendo muito util nas fases de pre-processamento. Alemdisso, e invariante a operacoes como rotacao e translacao. Entretanto, imagens diferentes podem

Page 33: Processamento de Imagens no Aux´ılio `a Detec¸c˜ao de ... · Processamento de Imagens no Aux´ılio `a ... por cuidar de mim e por estar sempre ao meu lado.` ... por todo o conhecimento

4.1 Caracterizacao de Imagens atraves das Cores 21

ter o mesmo histograma, o que faz necessario, em algumas aplicacoes, a utilizacao conjunta deoutras caracterısticas da imagem, como forma ou textura.

Neste trabalho optou-se por utilizar somente o Histograma de Tons de Cinza como tecnicade caracterizacao das imagens de lesoes Melanoma e lesoes nao Melanoma, obtendo resultadossatisfatorios. Entretanto, existem tecnicas de caracterizacao por forma e textura, que seraoapresentadas a seguir, que tambem poderiam ter sido utilizadas.

Figura 4.6: Imagem de amostra.

Figura 4.7: Histogramas do canal R, G e B respectivamente.

Page 34: Processamento de Imagens no Aux´ılio `a Detec¸c˜ao de ... · Processamento de Imagens no Aux´ılio `a ... por cuidar de mim e por estar sempre ao meu lado.` ... por todo o conhecimento

22 Caracterizacao de Imagens Digitais

4.2 Caracterizacao de Imagens atraves da Forma

A caracterizacao de imagens digitais atraves da forma e muito util na identificacao deregioes ou de objetos importantes contidos nas imagens. Basicamente, a caracterizacao deimagens atraves da forma pode ser dividida em duas categorias: baseada em fronteiras oubaseada em regioes. Na caracterizacao baseada em fronteiras tem-se apenas a representacaoexterna da regiao, ou seja, de suas fronteiras (bordas), enquanto que a caracterizacao baseadaem regioes representa as caracterısticas internas da regiao, ou seja, os pixels que a compoem[Gonzalez and Woods 2000].

As duas categorias apresentadas sao compostas por diversas tecnicas que sao escolhidasde acordo com a aplicacao desenvolvida. Na maioria das vezes, a aplicacao requer que acaracterizacao seja invariante a rotacao, translacao ou mudanca de escala e, atualmente, muitastecnicas satisfazem uma ou mais destas propriedades. Nas proximas secoes serao apresentadasalgumas tecnicas de representacao das caracterısticas das imagens de ambas as categorias.

4.2.1 Caracterizacao baseada em fronteiras

Existem algumas tecnicas simples de representacao das caracterısticas das fronteiras dosobjetos contidos em uma imagem digital, como exemplo tem-se o Perımetro e o Diametro. OPerımetro e definido como a quantidade dos pixels contidos ao longo da fronteira, enquantoque o Diametro e a distancia maxima entre dois pixels (pi e pj) da fronteira B, como pode serobservado na equacao 4.1 [Gonzalez and Woods 2000]. Apesar de simples, estas medidas saobastante uteis para discriminar formas com grandes dissimilaridades.

Diam(B) = maxi,j[D(pi, pj)] (4.1)

Alem destas medidas, existem outros metodos mais eficazes para a representacao das frontei-ras dos objetos de uma imagem, dentre eles encontra-se os Descritores de Fourier. Neste metodorepresenta-se uma fronteira digital de N pontos no plano xy, a partir de um ponto arbitrario, porexemplo (x0, y0), e gera-se a sequencia (x0, y0), (x1, y1), (x2, y2), ..., (xN−1, yN−1) a partir desteponto, ao longo da fronteira. Resumindo, uma fronteira sk pode ser representada por umasequencia de coordenadas sk = [xk, yk], com k = 0, 1, 2, ..., N − 1 [Gonzalez and Woods 2000].

Pode-se tambem interpretar cada par de coordenadas como um numero complexo, o quefara com que a representacao da fronteira seja dada por sk = xk + jyk, onde o eixo x e o eixoreal, y e o eixo imaginario e j e uma unidade imaginaria [Gonzalez and Woods 2000]. A partirda fronteira sk pode-se definir a transformada discreta de Fourier da seguinte forma:

au =1

N

N−1∑k=0

ske−j2πuk

N (4.2)

Onde u = 0, 1, 2, ...N−1. Ressalta-se que os coeficientes complexos au, denominados Descri-tores de Fourier, descrevem a forma dos objetos, o que os torna bastante uteis na diferenciacao

Page 35: Processamento de Imagens no Aux´ılio `a Detec¸c˜ao de ... · Processamento de Imagens no Aux´ılio `a ... por cuidar de mim e por estar sempre ao meu lado.` ... por todo o conhecimento

4.2 Caracterizacao de Imagens atraves da Forma 23

dos formatos de fronteiras. Ha tambem a transformada inversa de Fourier de au que reconstroia fronteira sk, para k = 0, 1, 2, ..., N − 1, da seguinte forma [Rafiei and Mendelzon 2002]:

sk =N−1∑u=0

auej2πuk

N (4.3)

A principal vantagem dos descritores de Fourier e que eles podem ser modificados mate-maticamente de forma que fiquem insensıveis a rotacao, translacao e mudanca de escala. Porexemplo, uma sequencia rotacionada e dada por ske

jθ, onde θ e o angulo de rotacao e j e umaunidade imaginaria. Com isso, os descritores de Fourier serao definidos por:

au =1

N

N−1∑k=0

skejθe

−j2πukN (4.4)

Resumindo, a translacao e realizada atraves da adicao de um deslocamento constante a todasas coordenadas da fronteira e a mudanca de escala atraves da multiplicacao de uma constanteem todas as coordenadas da fronteira [Gonzalez and Woods 2000]. Sao estas vantagens dosdescritores de Fourier que fazem com que eles sejam amplamente usados na caracterizacao dasfronteiras dos objetos das imagens. Entretanto, existem aplicacoes que necessitam tambem dacaracterizacao interna dos objetos, neste caso faz-se necessario a utilizacao de metodos baseadosem regiao. A proxima secao apresenta alguns destes metodos.

4.2.2 Caracterizacao baseada em regiao

A caracterizacao baseada em regiao busca representar a regiao interna de um objeto contidoem uma imagem digital e nao apenas sua borda. E muito usada quando as regioes apresentamcaracterısticas internas uteis na sua representacao, como por exemplo buracos. Existem algunsdescritores simples de regiao, como a Area, que e definida pelo numero de pixels contidos dentrode uma fronteira, e o Perımetro, definido na secao anterior. Esses dois descritores sao maisuteis quando usados para medir a Compacidade de uma regiao, visto que esta e invariante amudancas de escala. A Compacidade e dada por [Gonzalez and Woods 2000]:

Compacidade =(perimetro)2

area(4.5)

Outras medidas simples para descrever regioes ou objetos contidos em uma imagem incluema media e a mediana dos nıveis de cinza, seus valores mınimo e maximo e o numero de pixelsde uma regiao com nıvel de cinza acima ou abaixo da media [Gonzalez and Woods 2000].

Ha ainda descritores de regiao mais complexos e mais difıceis de implementar, porem queapresentam resultados satisfatorios, como por exemplo tem-se os Momentos Invariantes. Estatecnica e bastante utilizada devido ao fato de ser invariante a transformacoes como translacao,rotacao e mudanca de escala [Rui et al. 1997]. Uma breve descricao dos Momentos Invariantes

Page 36: Processamento de Imagens no Aux´ılio `a Detec¸c˜ao de ... · Processamento de Imagens no Aux´ılio `a ... por cuidar de mim e por estar sempre ao meu lado.` ... por todo o conhecimento

24 Caracterizacao de Imagens Digitais

pode ser encontrada em [Gonzalez and Woods 2000]. Por fim, uma outra forma de descreveras caracterısticas de uma dada regiao baseia-se na extracao de suas texturas.

4.3 Caracterizacao de Imagens atraves da Textura

A caracterizacao de imagens digitais atraves da textura e muito util na classificacao ereconhecimento de regioes ou objetos em imagens, porem a textura nao e um atributo facil dese extrair computacionalmente. Ate os dias atuais, nao existe um consenso sobre a definicaoformal de textura, mas, para alguns autores a textura pode ser definida como um padraoaleatorio ou regular que se repete em uma determinada regiao ou objeto da imagem e queapresenta caracterısticas como regularidade, rugosidade, suavidade, aspereza e outras, comopode ser observado na Figura 4.8 [Gonzalez and Woods 2000].

Figura 4.8: Exemplos de texturas.

Para a descricao de caracterısticas de texturas em imagens digitais sao usadas tres aborda-gens principais: Estatıstica, Estrutural e Espectral [Gonzalez and Woods 2000]. A abordagemEstatıstica busca descrever uma textura atraves de regras estatısticas que trabalham com adistribuicao e o relacionamento entre os diferentes nıveis de cinza de uma imagem. Dentrodesta categoria, uma das tecnicas mais usadas e a Matriz de Co-Ocorrencia de Nıveis de Cinza,da qual pode ser extraıdas medidas como entropia, correlacao, contraste, variancia e media[Alves et al. 2006].

Ja a abordagem Estrutural baseia-se na ideia de que “primitivas texturais” sao usadaspara gerar padroes de texturas mais complexos, atraves de regras bem definidas que res-tringem a quantidade de arranjos possıveis das primitivas. Por fim, a abordagem Espec-tral baseia-se nas propriedades do espectro de Fourier, no qual a identificacao de picos dealta energia indicam a existencia de padroes periodicos ou quase periodicos em uma imagem[Gonzalez and Woods 2000]. Atualmente, a abordagem mais utilizada de caracterizacao atravesda textura e a Estatıstica, visto que e a mais simples de se calcular computacionalmente.

Apos escolher o tipo de caracterizacao (cor, forma ou textura) de imagens mais adequado aaplicacao, inicia-se o processo de classificacao das imagens, ou seja, a partir das caracterısticasobtidas pode-se inferir rotulos as imagens ou a objetos contidos nas mesmas. O processo declassificacao sera apresentado no proximo capıtulo.

Page 37: Processamento de Imagens no Aux´ılio `a Detec¸c˜ao de ... · Processamento de Imagens no Aux´ılio `a ... por cuidar de mim e por estar sempre ao meu lado.` ... por todo o conhecimento

Capıtulo 5Classificacao de Imagens Digitais

Apos a realizacao da caracterizacao das imagens digitais, ou seja, a formacao dos vetores decaracterısticas, pode-se iniciar o processo de classificacao das imagens. A classificacao consisteem atribuir rotulos as imagens ou a objetos contidos nas mesmas, a partir de informacoesfornecidas pelas suas caracterısticas [Gonzalez and Woods 2000].

Os metodos usados para a classificacao de imagens dividem-se em metodos de decisao teoricae metodos estruturais. Os metodos de decisao teorica baseiam-se na representacao dos padroesatraves de vetores, e os metodos estruturais baseiam-se na representacao dos padroes na formasimbolica (cadeias e arvores). Este capıtulo abordara alguns exemplos destes dois metodos,iniciando com a definicao de padroes e classes de padroes.

5.1 Padroes e Classes de Padroes

Um padrao e definido como uma descricao quantitativa ou estrutural de algum objeto ouentidade de uma imagem e pode ser formado por uma ou mais caracterıstica, como as discutidasno capıtulo anterior. Ja uma classe de padroes e um conjunto de padroes que compartilhampropriedades comuns e sao representadas por wi, w2, ..., wM , onde M e o numero de classes[Gonzalez and Woods 2000].

Geralmente, utilizam-se tres tipos de arranjos de padroes: os vetores (para descricoes quan-titativas), as cadeias e arvores (para descricoes estruturais). Os vetores de padroes sao repre-sentados por:

x =

x1

x2

...xn

(5.1)

onde xi representa a i-esima caracterıstica e n e o numero de caracterısticas. Este trabalhoutiliza apenas vetores de padroes para representar as caracterısticas das imagens, por isso arepresentacao de cadeias e arvores nao sera apresentada aqui, mas pode ser encontrada em

25

Page 38: Processamento de Imagens no Aux´ılio `a Detec¸c˜ao de ... · Processamento de Imagens no Aux´ılio `a ... por cuidar de mim e por estar sempre ao meu lado.` ... por todo o conhecimento

26 Classificacao de Imagens Digitais

[Gonzalez and Woods 2000]. A seguir expoe-se os metodos de decisao teorica, os quais utilizamvetores de padroes para representar as caracterısticas das imagens.

5.2 Metodos de Decisao Teorica

Os metodos de decisao teorica baseiam-se na utilizacao de funcoes de decisao. Segundoestes metodos, dado um vetor de padroes x = (x1, x2, ..., xn)T n-dimensional e M classes depadroes w1, w2, ..., wM , deve-se encontrar M funcoes de decisao d1(x), d2(x), ..., dM(x), para asquais, se o padrao x pertencer a classe wi, entao [Gonzalez and Woods 2000]:

di(x) > dj(x) (5.2)

onde j = 1, 2, ...,M e j 6= i. Ja a fronteira de decisao que separa as classes wi e wj e dadapelos valores de x para os quais di(x) = dj(x). Com base na equacao 5.2, pode-se desenvolvervarias abordagens que a satisfacam. Em seguida, sera apresentado tres destas abordagens: oclassificador de distancia mınima, o classificador estatıstico otimo e as redes neurais artificiais.

5.2.1 Classificador de Distancia Mınima

Segundo este metodo, cada classe de padroes e representada por um vetor prototipo (oumedio), dado por:

mj =1

Nj

∑x∈wj

x (5.3)

onde Nj e a quantidade de vetores de padroes da classe wj e a soma e feita sobre estes vetores,e j = 1, 2, ...,M . Utilizando a Distancia Euclidiana, apresentada na equacao 5.4, pode-sedeterminar a proximidade de um vetor x de padroes desconhecidos a classe de seu prototipomais proximo [Gonzalez and Woods 2000].

Dj(x) =‖ x−mj ‖ (5.4)

em que j = 1, 2, ...,M e ‖ a ‖= (aT a)12 e a norma euclidiana. Portanto, atribui-se o vetor x a

classe wi que apresentar a menor distancia Di(x). Essa formulacao e equivalente a avaliar asfuncoes atraves da equacao 5.5, de acordo com o conceito de funcao de decisao definido pelaequacao 5.2, e atribuir x a classe wi, se di(x) levar ao maior valor numerico.

dj(x) = xT mj −1

2mT

j mj (5.5)

Page 39: Processamento de Imagens no Aux´ılio `a Detec¸c˜ao de ... · Processamento de Imagens no Aux´ılio `a ... por cuidar de mim e por estar sempre ao meu lado.` ... por todo o conhecimento

5.2 Metodos de Decisao Teorica 27

onde j = 1, 2, ...,M . A partir das equacoes 5.2 e 5.5, pode-se definir a fronteira de decisao entreas classes wi e wj para o classificador de distancia mınima da seguinte forma:

dij(x) = di(x)− dj(x) = xT (mi −mj)−1

2(mi −mj)

T (mi −mj) = 0 (5.6)

5.2.2 Classificadores Estatısticos Otimos

Os classificadores estatısticos otimos usam a abordagem probabilıstica para classificar pa-droes. Segundo este metodo, a probabilidade de um padrao x pertencer a classe wi e dadapor p(wi|x). Quando o padrao x pertencer a classe wi e for atribuıdo a uma classe a qual naopertence, por exemplo, a classe wj, ocorre uma perda, denotada por Lij. A partir da perda,pode-se calcular a perda media rj(x) atraves da seguinte equacao [Gonzalez and Woods 2000]:

rj(x) =M∑

k=1

Lkjp(wk/x) (5.7)

Utilizando-se a teoria de probabilidades, na qual p(a/b) = [p(a)p(b/a)]/p(b), a equacaoanterior pode ser reescrita da seguinte forma:

rj(x) =1

p(x)

M∑k=1

Lkjp(x/wk)P (wk) (5.8)

Onde p(x|wk) e a funcao de probabilidade dos padroes da classe wk e P (wk) e a proba-bilidade de ocorrencia da classe wk. Portanto, os classificadores estatısticos otimos calculamr1(x), r2(x), ..., rM(x) (M e o numero de classes de padroes) para cada padrao x e atribui opadrao a classe com menor perda, ou seja, o padrao x e atribuıdo a classe wi se ri(x) < rj(x),para j = 1, 2, ...,M e j 6= i [Gonzalez and Woods 2000]. Com isso, a perda media sera mınimaem relacao a todas as decisoes.

5.2.3 Redes Neurais Artificiais

A criacao das Redes Neurais Artificiais (RNAs) foi inspirada nas redes neurais biologicas,visando refletir o comportamento dos circuitos neuronais. Assim como o cerebro e capaz deaprender e tomar decisoes baseadas na aprendizagem, as RNAs devem fazer o mesmo, o que ealcancado atraves de um conjunto de exemplos (ou padroes de treinamento) pre-estabelecidos,a partir dos quais as redes neurais se adaptam e aprendem a realizar determinadas tarefas(neste caso, a classificacao de padroes) [Haykin 2001].

As RNAs sao compostas por alguns elementos, dentre eles estao: o neuronio artificial,a arquitetura, o algoritmo de aprendizagem e o paradigma de aprendizagem, os quais seraoexplicados detalhadamente no proximo capıtulo. Ja em relacao a classificacao de padroes, asredes neurais sao usadas como base para o desenvolvimento adaptativo dos coeficientes das

Page 40: Processamento de Imagens no Aux´ılio `a Detec¸c˜ao de ... · Processamento de Imagens no Aux´ılio `a ... por cuidar de mim e por estar sempre ao meu lado.` ... por todo o conhecimento

28 Classificacao de Imagens Digitais

funcoes de decisao atraves de apresentacoes sucessivas de conjuntos de padroes de treinamento[Gonzalez and Woods 2000].

Existem diferentes tipos de RNAs devido as diversas arquiteturas e algoritmos de aprendi-zagem, entretanto, as funcoes de decisao sao semelhantes, variando apenas o criterio de decisao,ou melhor, as funcoes de ativacao utilizadas na RNA. Baseando-se no algoritmo de aprendiza-gem do perceptron [Luger 2004], a funcao de decisao d(x) que diferencia duas classes de padroeslinearmente separaveis e dada por:

d(x) =n∑

i=1

wixi + wn+1 (5.9)

Onde xi sao os componentes dos vetores de padroes e wi sao os pesos (i = 1, 2, ..., n, n + 1)que modificam a entrada antes de ser introduzida na funcao de ativacao. A funcao de ativacaoe utilizada para mapear a saıda da soma na saıda final do dispositivo.

O perceptron utiliza a funcao de decisao denominada de funcao de limiar, que atua daseguinte maneira. Se d(x) > 0, a saıda do perceptron sera +1, o qual indicara que o padraox foi reconhecido como pertencente a classe wi e se d(x) < 0, o contrario sera verdadeiro[Gonzalez and Woods 2000]. Ja a fronteira de decisao do perceptron e obtida igualando aequacao 5.9 a zero, como mostrado a seguir:

d(x) =n∑

i=1

wixi + wn+1 = 0 (5.10)

ou

d(x) = w1x1 + w2x2 + ... + wnxn + wn+1 = 0 (5.11)

Ao se utilizar as RNAs para classificar padroes tem-se a vantagem de usar algoritmos deaprendizagem para corrigir os pesos, quando um padrao for classificado erroneamente. Comisso, aumenta as chances de se obter um resultado final satisfatorio, ou seja, o maximo depadroes classificados corretamente. Os diversos algoritmos de aprendizagem serao exploradosno proximo capıtulo.

5.3 Metodos Estruturais

Diferentemente dos metodos de decisao teorica que tratam de padroes quantitativos ebaseiam-se em funcoes de decisao, os metodos estruturais ressaltam as relacoes estruturais ine-rentes a forma dos padroes. Existem diversos metodos estruturais, entretanto, neste capıtuloserao abordados apenas dois metodos: o casamento de numeros de formas e o casamento decadeias.

Page 41: Processamento de Imagens no Aux´ılio `a Detec¸c˜ao de ... · Processamento de Imagens no Aux´ılio `a ... por cuidar de mim e por estar sempre ao meu lado.` ... por todo o conhecimento

5.3 Metodos Estruturais 29

5.3.1 Casamento de Numeros de Formas

Dada duas fronteiras (formas), A e B, de regioes descritas em termos de seus numerosde forma, encontrados em [Gonzalez and Woods 2000], pode-se estabelecer sua similaridadeatraves do calculo da distancia. Primeiramente, defini-se o grau de similaridade k entre duasfronteiras de regioes como a maior ordem na qual seus numeros de forma ainda coincidam.Posteriormente, defini-se a distancia entre duas formas A e B como o inverso de seu grau desimilaridade:

D(A, B) =1

k(5.12)

Portanto, quanto menor a distancia entre duas formas, mais semelhantes elas serao. Casoutilize-se apenas o grau de similaridade, quanto maior for o valor de k, mais similares as formasserao.

5.3.2 Casamento de Cadeias

Dada duas fronteiras, A e B, codificadas respectivamente como as seguintes cadeias a1a2...an

e b1b2...bm. Seja M o numero de casamentos entre duas cadeias, sendo que um casamentoocorre na k-esima posicao se ak = bk, entao o numero de sımbolos, Q, que nao casam e dadopor [Gonzalez and Woods 2000]:

Q = max(|A|, |B|)−M (5.13)

Onde |arg| e o numero de sımbolos na representacao da cadeia dos argumentos. Ja asimilaridade entre as duas cadeias A e B pode ser definida atraves da razao:

R =M

Q=

M

max(|A|, |B|)−M(5.14)

Portanto, quanto maior o valor de R, melhor sera o casamento entre as cadeias. Se R = 0nenhum dos sımbolos em A e B se casaram (M = 0). Ressalta-se que se deve definir oponto inicial de cada fronteira, visto que o casamento e feito sımbolo a sımbolo, para reduzir aquantidade de calculos [Gonzalez and Woods 2000].

Apos estudar alguns Metodos Estruturais e alguns Metodos de Decisao Teorica optou-sepelas Redes Neurais Artificiais para realizar a classificacao dos padroes, devido a sua capacidadede corrigir os pesos atraves de algoritmos de aprendizagem, o que aumenta as chances de umpadrao ser classificado corretamente. O proximo capıtulo explorara detalhadamente as RedesNeurais.

Page 42: Processamento de Imagens no Aux´ılio `a Detec¸c˜ao de ... · Processamento de Imagens no Aux´ılio `a ... por cuidar de mim e por estar sempre ao meu lado.` ... por todo o conhecimento

Capıtulo 6Redes Neurais Artificiais

As Redes Neurais Artificiais possuem raızes em diversas disciplinas: neurociencia, ma-tematica, estatıstica, fısica, ciencia da computacao e engenharia [Haykin 2001] e sua criacaoe inspirada nos neuronios biologicos. E uma area que se encontra em grande expansao e quepossui aplicacoes em diversos campos em virtude de sua principal propriedade: a habilidade deaprender a partir de dados de entrada com ou sem um “professor”.

Este capıtulo fornece uma visao sobre as principais caracterısticas das Redes Neurais, in-cluindo sua inspiracao biologica, o desenvolvimento do neuronio artificial e as principais arqui-teturas de rede existentes. Alem disso, explica-se os processos de aprendizagem, os quais saofundamentais para o desempenho das Redes Neurais.

6.1 Redes Neurais Biologicas

O cerebro humano e considerado um sistema de processamento de informacoes extrema-mente complexo, nao-linear e paralelo, capaz de organizar suas estruturas, conhecidas comoneuronios, para realizar processamentos a uma velocidade tao alta que nenhum computadorexistente consegue alcancar [Haykin 2001]. Devido a complexidade do cerebro e sua habilidadede aprender e se adaptar, estudiosos estao sempre buscando respostas sobre seu funcionamentoe suas estruturas, porem, ate hoje muitas questoes como, por exemplo, “como eu penso?”,“o que e a mente?”, ainda nao foram respondidas satisfatoriamente. Entretanto, uma grandevantagem e que ja se conhece as estruturas que compoem o cerebro e compreende-se algunsaspectos de seu funcionamento.

Existem dois tipos principais de celulas no cerebro: os neuronios e as glias. As glias saoresponsaveis pela sustentacao e nutricao dos neuronios. Estes, por sua vez, estao envolvidosna recepcao, transmissao e processamento de estımulos, permitindo ao organismo responder asalteracoes do meio. Os neuronios sao basicamente constituıdos de dendritos, corpo celular (ousoma) e axonios [Lopes 2000], como e ilustrado na Figura 6.1.

Os dendritos tem a funcao de receber os estımulos (ou sinais de entrada) e conduzi-los aocorpo celular. Este adiciona os sinais de entrada de alguma forma e gera um sinal de ativacao ou

30

Page 43: Processamento de Imagens no Aux´ılio `a Detec¸c˜ao de ... · Processamento de Imagens no Aux´ılio `a ... por cuidar de mim e por estar sempre ao meu lado.` ... por todo o conhecimento

6.2 Redes Neurais Artificiais 31

nao para o neuronio. Alem disso, o corpo celular e responsavel pela manutencao e metabolismodo neuronio, assim como por seu crescimento e reparacao. Ja os axonios sao responsaveis pelatransmissao dos impulsos de saıda gerados por um neuronio.

Figura 6.1: Neuronio biologico.

Os axonios de um neuronio se ligam aos dendritos de outro neuronio atraves das sinapses.As sinapses sao unidades funcionais elementares para a interacao entre os neuronios. Podem serdivididas em inibitorias ou excitatorias. Uma sinapse excitatoria contribuira positivamente paraa ativacao do neuronio receptivo, enquanto uma sinapse inibitoria influenciara na desativacao doneuronio [Martineli 1999]. O conjunto de neuronios conectados atraves de sinapses formam asRedes Neurais Biologicas, as quais sao abstraıdas para desenvolver as Redes Neurais Artificiais.

6.2 Redes Neurais Artificiais

As Redes Neurais Artificiais (RNAs), tambem conhecidas como Redes Conexionistas saoinspiradas na maneira como se organiza e funciona o cerebro humano e visa refletir o compor-tamento dos circuitos neuronais. Assim como o cerebro e capaz de aprender e tomar decisoesbaseadas na aprendizagem, as Redes Neurais Artificiais devem fazer o mesmo. Isso e alcancadoatraves de um conjunto de exemplos pre-estabelecidos, a partir dos quais as redes neurais seadaptam e aprendem a realizar determinadas tarefas.

Segundo Haykin, uma Rede Neural e um “processador paralelamente distribuıdo, compostode unidades de processamento simples, os neuronios, que tem a capacidade de armazenar conhe-cimento experimental e torna-lo disponıvel para uso”. Geralmente as RNAs sao desenvolvidaspara resolver problemas complexos, visto que seu processamento e distribuıdo atraves das ca-madas de neuronios, os quais tem a habilidade de processar suas entradas de forma paralela eindependente, e sua capacidade de aprendizagem resulta em respostas satisfatorias. A aprendi-zagem e a base da inteligencia das Redes Neurais e acontece atraves do treinamento e do ajustedas conexoes entre os neuronios.

A similaridade das RNAs ao cerebro e caracterizada, justamente, pela sua habilidade deadquirir conhecimento atraves de um processo de aprendizagem e armazenar este conhecimentoatraves da conexao entre os neuronios. Alem dessas caracterısticas, existem outras que tornam

Page 44: Processamento de Imagens no Aux´ılio `a Detec¸c˜ao de ... · Processamento de Imagens no Aux´ılio `a ... por cuidar de mim e por estar sempre ao meu lado.` ... por todo o conhecimento

32 Redes Neurais Artificiais

as Redes Neurais Artificiais bastante uteis para a resolucao de problemas, dentre elas as maisimportantes sao [Martineli 1999]:

1. Nao-Linearidade: os neuronios podem ser nao-lineares, fazendo com que toda a redetambem seja.

2. Mapeamento de Entrada-Saıda: capacidade da rede de aprender ao mapear um conjuntode entradas em um conjunto de saıdas.

3. Adaptabilidade: uma RNA treinada para atuar em um ambiente pode ser adaptada parasuportar modificacoes no ambiente.

4. Tolerancia a Falhas: uma RNA e capaz de fornecer respostas adequadas por um bomtempo mesmo se algum neuronio ou conexao for danificado.

As RNAs sao bastante utilizadas em tarefas que incluem Classificacao (decidir a qual grupopertence uma determinada entrada), Reconhecimento de Padroes (identificar padroes em en-tradas), Predicao (predizer algo a partir de certas caracterısticas como, por exemplo, identificardoencas a partir de sintomas, causas a partir de efeitos), Otimizacao (buscar o melhor resul-tado) e Filtragem de Ruıdo (separar partes irrelevantes de um sinal) [Luger 2004], mas, paraque se tenha respostas satisfatorias ao problema deve-se definir adequadamente os elementosque irao compor a RNA, dentre eles estao: o neuronio artificial, a arquitetura, o algoritmo deaprendizagem e o paradigma de aprendizagem.

6.2.1 Neuronio Artificial

Assim como o cerebro humano e composto por diversos neuronios, a RNA e compostapor unidades que simulam o funcionamento dos neuronios. Estas unidades sao chamadas deNeuronios Artificiais.

O primeiro modelo matematico de um neuronio artificial foi abstraido das propriedadesfisiologicas dos neuronios biologicos e de suas conexoes. Este modelo foi proposto por McCulloche Pitts em 1943 e interpreta o neuronio como sendo um circuito binario, como e apresentadona Figura 6.2.

Figura 6.2: Modelo de McCulloch e Pitts.

Page 45: Processamento de Imagens no Aux´ılio `a Detec¸c˜ao de ... · Processamento de Imagens no Aux´ılio `a ... por cuidar de mim e por estar sempre ao meu lado.` ... por todo o conhecimento

6.2 Redes Neurais Artificiais 33

Neste modelo as entradas xm do neuronio k, que tambem sao binarias, sao combinadascom os respectivos pesos wkm, atraves de uma soma ponderada Σwkmxm para gerar a entradada Funcao de Limiar. Se a soma ponderada das entradas de um neuronio ultrapassar umdeterminado limite de disparo, entao a saıda toma valor um, se nao ultrapassar, toma valorzero [McCulloch and Pitts 1943]. O modelo de McCulloch e Pitts foi generalizado, resultandono modelo apresentado na Figura 6.3.

Figura 6.3: Neuronio artificial.

O modelo generalizado do neuronio e composto por quatro unidades basicas: os Sinais deEntrada xm, ou seja, dados vindos do ambiente ou de outros neuronios, um Conjunto de Sinap-ses, cada uma caracterizada por um peso wkm proprio que representa o conhecimento adquiridopela RNA, uma Juncao Aditiva utilizada para calcular o nıvel de ativacao dos neuronios atravesdas somas ponderadas das entradas e uma Funcao de Ativacao f que limita a saıda de neuroniopara um intervalo finito. Neste modelo e incluıda uma entrada especial denominada de Bias(bk), que e usada para aumentar (se o valor for positivo) ou diminuir (se o valor for negativo) aentrada da funcao de ativacao causando um deslocamento no potencial de ativacao do neuronio.O neuronio k do modelo generalizado pode ser descrito matematicamente pelas equacoes 6.1,6.2 e 6.3.

uk =m∑

j=1

wkjxj (6.1)

vk = uk + bk (6.2)

yk = f(vk) (6.3)

Um neuronio artificial pode utilizar diferentes tipos de funcoes de ativacao, dentre elas asmais basicas sao: Funcao de Limiar, Funcao Linear por Partes e Funcao Sigmoide [Haykin 2001].

Page 46: Processamento de Imagens no Aux´ılio `a Detec¸c˜ao de ... · Processamento de Imagens no Aux´ılio `a ... por cuidar de mim e por estar sempre ao meu lado.` ... por todo o conhecimento

34 Redes Neurais Artificiais

A Funcao de Limiar, representada pela equacao 6.4, e usada no modelo de McCulloch e Pittse descreve a propriedade “tudo ou nada” deste neuronio. De acordo com essa funcao, a saıdayk do neuronio sera igual a 1 se o valor de ativacao v for maior ou igual a 0, e sera 0 casocontrario. A Figura 6.4 representa o grafico desta funcao.

f(v) =

{1 se v ≥ 00 se v < 0

(6.4)

Figura 6.4: Grafico da Funcao de Limiar.

Ja na Funcao Linear por Partes, a saıda do neuronio sera igual ao valor de ativacao v seeste estiver dentro de um certo intervalo, mas, se v for maior ou igual ao valor maximo dointervalo a saıda sera 1 e se for menor ou igual ao valor mınimo do intervalo a saıda sera 0. Aequacao 6.5 e um exemplo de Funcao Linear por Partes, sendo que a Figura 6.5 representa ografico desta equacao.

f(v) =

1 se v ≥ +1

2

v + 12, se − 1

2< v < 1

2

0 se v ≤ −12

(6.5)

Figura 6.5: Grafico da Funcao Linear por Partes.

O neuronio que usar a Funcao Sigmoide, cujo grafico tem a forma de um S, admitira valoresde saıda entre 0 e 1. Um exemplo de funcao Sigmoide e a a Funcao Logıstica, definida pelaequacao 6.6 e cujo grafico e apresentado na Figura 6.6. Na Funcao Logıstica a variavel a,

Page 47: Processamento de Imagens no Aux´ılio `a Detec¸c˜ao de ... · Processamento de Imagens no Aux´ılio `a ... por cuidar de mim e por estar sempre ao meu lado.` ... por todo o conhecimento

6.3 Arquitetura das Redes Neurais 35

conhecida como “parametro de achatamento”, determina a inclinacao da funcao, podendo serpositiva ou negativa [Haykin 2001].

f(v) =1

1 + e−av(6.6)

Figura 6.6: Grafico da Funcao Sigmoide com parametro de inclinacao variavel.

Deve-se escolher a Funcao de Ativacao de acordo com a acao que a RNA executara, visto queo neuronio e a unidade basica do processamento da rede e deve ser modelado para atender aosrequisitos da aplicacao. Alem disso, as Redes Neurais possuem mais de um neuronio, os quaisdevem ser conectados de forma a garantir um bom desempenho a rede. A forma de conexaoentre os neuronios e definida pela arquitetura da rede, que e um dos elementos principais paraa criacao de uma RNA eficiente.

6.3 Arquitetura das Redes Neurais

A arquitetura ou topologia de uma Rede Neural determina o modo como os neuronios estaoorganizados. Esta associada com o algoritmo de aprendizagem usado para treinar a rede, comsua aplicacao e com o seu desempenho. Pode ser diferenciada de acordo com o numero decamadas e a disposicao das conexoes.

Geralmente, as RNAs possuem uma camada de entrada, usada para receber os estımulosexternos, zero ou mais camadas intermediarias e uma camada de saıda responsavel por emitiruma resposta a partir de uma dada entrada. Tem-se como principais exemplos de RNAs semcamada intermediaria a rede Elemento Linear Adaptativo (Adaline) e a Perceptron de CamadaUnica exemplificada na Figura 6.7. Ja a Perceptron Multicamada (MLP) apresentada na Figura6.8 e o principal exemplo de RNA com camada intermediaria [Martineli 1999].

De acordo com a forma das conexoes, as RNAs podem ser denominadas de CompletamenteConectadas, ou seja, quando cada neuronio de uma camada se conecta com todos os neuroniosda camada subsequente ou Parcialmente Conectadas, quando nem todos os neuronios da redeestao conectados [Martineli 1999]. Tambem se pode encontrar em Redes Neurais conexoes emforma de loops e conexoes entre os neuronios da mesma camada.

De acordo com o tipo de conexao as RNAs podem ser classificadas em Redes Alimenta-das Adiante e Redes Recorrentes. Nas Redes Alimentadas Adiante, cada neuronio de uma

Page 48: Processamento de Imagens no Aux´ılio `a Detec¸c˜ao de ... · Processamento de Imagens no Aux´ılio `a ... por cuidar de mim e por estar sempre ao meu lado.` ... por todo o conhecimento

36 Redes Neurais Artificiais

Figura 6.7: Rede com camada unica.

Figura 6.8: Rede Completamente Conectada com uma camada oculta.

camada recebe suas entradas da camada anterior e envia seus sinais de saıda para os neuroniosda camada posterior. Nas Redes Recorrentes um neuronio pode enviar seus sinais de saıdapara outro neuronio que se encontra na mesma camada ou em uma camada anterior a sua[Osorio and Vieira 1999], como pode ser observado na Figura 6.9.

Figura 6.9: Rede Recorrente.

A arquitetura de uma rede tambem pode ser classificada de acordo com a sua evolucao

Page 49: Processamento de Imagens no Aux´ılio `a Detec¸c˜ao de ... · Processamento de Imagens no Aux´ılio `a ... por cuidar de mim e por estar sempre ao meu lado.` ... por todo o conhecimento

6.4 Processos de Aprendizagem 37

no decorrer de sua utilizacao e do seu aprendizado. Baseado nestes criterios tem-se as RedesEstaticas e as Redes Dinamicas [Osorio and Vieira 1999]. Nas Redes Estaticas a quantidade deneuronios e as formas de conexao nao se alteram durante o aprendizado da rede, as unicas mu-dancas que ocorrem sao os ajustes dos pesos sinapticos. Ja nas Redes Dinamicas a quantidadede neuronios e conexoes pode variar no decorrer do aprendizado da rede. Essa variacao podeser do tipo generativa (criacao de novas conexoes) ou destrutiva (eliminacao de conexoes).

A arquitetura escolhida para a implementacao da Rede Neural deve ter como objetivofacilitar o processo de aprendizagem, visto que este e a base para a obtencao de respostassatisfatorias ao problema.

6.4 Processos de Aprendizagem

Uma das principais caracterısticas das Redes Neurais e sua capacidade de aprender e melho-rar seu desempenho gradativamente a partir da aprendizagem. A aprendizagem ocorre duranteo processo de treinamento da rede, no qual os pesos sinapticos e bias sao ajustados a cadaiteracao. Esse ajuste e realizado atraves de um algoritmo de aprendizagem seguindo algumparadigma de aprendizagem.

Nas proximas subsecoes serao apresentados alguns algoritmos de aprendizagem, os para-digmas de aprendizagem e por fim, ressalta-se o algoritmo de aprendizado supervisionado doPerceptron, visto que este sera utilizado para a implementacao do modelo proposto por estetrabalho. Ressalta-se que a escolha deste algoritmo foi baseada na sua simplicidade e facili-dade de implementacao. Alem disso, ele apresentou resultados promissores para a aplicacaoem questao.

6.4.1 Algoritmos de Aprendizagem

Algoritmo de aprendizagem e um conjunto de regras definidas para resolver algum problemade aprendizagem. Existem diferentes tipos que se distinguem pela maneira como e feito o ajustedo peso sinaptico de um neuronio [Haykin 2001]. Podem ser divididos em:

� Aprendizagem por Correcao de Erro: Neste algoritmo o ajuste dos pesos sinapticos saoefetuados de maneira a obter um erro mınimo. O erro (ek) em uma RNA e calculadoatraves da diferenca entre a saıda obtida (yk) pela rede e a saıda desejada (dk), comoapresentado na Equacao 6.7.

ek(n) = dk(n)− yk(n) (6.7)

No decorrer do aprendizado os erros sao calculados iterativamente ate a rede alcancarum estado onde os pesos sinapticos estao estabilizados de acordo com um valor pre-definido. Os pesos sao ajustados visando aproximar o valor de saıda obtido pela rede aovalor desejado [Mendes and Oliveira 2006]. Isto e alcancado atraves da minimizacao daFuncao de Custo E(n), definida por:

Page 50: Processamento de Imagens no Aux´ılio `a Detec¸c˜ao de ... · Processamento de Imagens no Aux´ılio `a ... por cuidar de mim e por estar sempre ao meu lado.` ... por todo o conhecimento

38 Redes Neurais Artificiais

E(n) =1

2e2

k(n) (6.8)

A minimizacao da Funcao de Custo resulta na regra de aprendizagem conhecida comoRegra Delta, a qual determina o ajuste (∆wkj(n)) dos pesos sinapticos. Este ajusteaplicado a um peso wkj de um neuronio k, excitado por uma entrada xj no tempo n podeser descrito por [Haykin 2001]:

∆wkj(n) = ηek(n)xj(n) (6.9)

onde η e a taxa de aprendizagem. Apos calcular o ajuste, o novo valor do peso sinapticowkj sera:

wkj(n + 1) = wkj(n) + ∆wkj(n) (6.10)

� Aprendizagem Baseada em Memoria: Neste algoritmo, as experiencias sao armazena-das em uma memoria de exemplos de entrada-saıda pre-classificada corretamente. Estamemoria e representada da seguinte forma: {(xi, di)}N

i=1, onde xi representa o vetor deentrada e di representa a resposta desejada [Haykin 2001].

Quando se quer classificar um vetor de entrada novo, chamado de xteste, repassa-o a redee o algoritmo ira analisar os dados de treinamento de uma “vizinhanca local” de xteste

em busca de um padrao semelhante. Existem diversos algoritmos baseados em memoriaque diferem entre si pelo criterio usado para definir a vizinhanca local de um vetor deteste e pela regra de aprendizagem usada no treinamento dos dados da vizinhanca local[Haykin 2001].

O tipo mais simples de algoritmo baseado em memoria e conhecido como regra do vizinhomais proximo. Segundo este algoritmo, a vizinhanca local sera os dados de treinamentoque se encontram na vizinhanca proxima do vetor xteste. Com isso, o vetor x′N sera ovizinho mais proximo de xteste se:

min d(xi, xteste) = d(x′N , xteste) (6.11)

onde d(xi, xteste) e a distancia euclidiana entre os vetores xi e xteste. Por fim, o vetor x′Nencontrado sera a classificacao para xteste, ou seja, a classe com menor distancia.

� Aprendizagem Hebbiana: Segundo a teoria de Hebb, quando um neuronio contribui parao disparo de outro, a conexao entre eles e reforcada [Luger 2004]. Baseado nesta teoria,

Page 51: Processamento de Imagens no Aux´ılio `a Detec¸c˜ao de ... · Processamento de Imagens no Aux´ılio `a ... por cuidar de mim e por estar sempre ao meu lado.` ... por todo o conhecimento

6.4 Processos de Aprendizagem 39

o algoritmo de aprendizagem hebbiana so permite a alteracao dos pesos sinapticos da co-nexao entre dois neuronios quando ambos estiverem ativos, pois assim a forca da conexaoentre eles aumentara. O ajuste ∆wkj(n) dos pesos sinapticos do neuronio k aplicado aopeso wkj no tempo n e definido como [Haykin 2001]:

∆wkj(n) = ηyk(n)xj(n) (6.12)

onde η e a taxa de aprendizagem, xj e o sinal pre-sinaptico do neuronio k e yk e o sinalpos-sinaptico do neuronio k. Quando os sinais pre-sinapticos e pos-sinapticos possuemsinais similares o ajuste dos pesos tera o efeito de reforcar a conexao entre os neuronios,caso contrario, ira inibi-la.

� Aprendizagem Competitiva: Neste algoritmo os neuronios de saıda da rede competementre si para se tornar ativos, visto que apenas um estara ativo em um determinadomomento. O neuronio vencedor sera chamado de neuronio vencedor leva tudo. De acordocom a regra de aprendizagem competitiva padrao, o ajuste ∆wkj aplicado ao peso wkj edefinido por [Haykin 2001]:

∆wkj =

{η(xj − wkj), se o neuronio k vencer a competicao0, se o neuronio k perder a competicao

(6.13)

onde η e a taxa de aprendizagem. Com esta regra as entradas do neuronio vencedorliberam um pouco de seu peso, o qual sera distribuıdo uniformemente entre as entradasinativas com o objetivo de mover o peso sinaptico do neuronio vencedor em direcao aopadrao de entrada.

� Aprendizagem de Boltzmann: Este e um algoritmo estocastico baseado na mecanicaestatıstica. As RNAs que utilizam este algoritmo possuem neuronios que funcionambinariamente, ou seja, eles possuem apenas dois estados: ligados (+1) ou desligados (-1). O ajuste (∆wkj) dos pesos sinapticos aplicado a um peso wkj do neuronio j para oneuronio k sera determinado pela equacao seguinte [Haykin 2001]:

∆wkj = η(ρ+kj − ρ−kj), j 6= k (6.14)

onde η e a taxa de aprendizagem, ρ+kj e a correlacao entre os neuronios j e k com a

rede na condicao presa (os neuronios visıveis estao presos a estados especıficos) e ρ−kj ea correlacao entre os neuronios j e k com a rede na condicao livre (todos os neuroniosoperam livremente).

Cada um dos algoritmos apresentados fornece vantagens especıficas que devem ser avaliadasde acordo com a aplicacao. Alem disso, a principal caracterıstica da RNA e sua capacidade

Page 52: Processamento de Imagens no Aux´ılio `a Detec¸c˜ao de ... · Processamento de Imagens no Aux´ılio `a ... por cuidar de mim e por estar sempre ao meu lado.` ... por todo o conhecimento

40 Redes Neurais Artificiais

de aprender e se adaptar, a qual esta diretamente relacionada com o algoritmo selecionado,tornando sua escolha crucial para o desempenho da rede. Do mesmo modo, deve-se considerara forma como as RNAs interagem com o ambiente e utilizar o algoritmo de aprendizagemseguindo um paradigma de aprendizagem adequado.

6.4.2 Paradigmas de Aprendizagem

O Paradigma de Aprendizagem define a forma como a Rede Neural se relaciona com oambiente e se divide em tres grupos principais: Aprendizagem Supervisionada, Aprendizagempor Reforco e Aprendizagem Nao-Supervisionada. Na Aprendizagem Supervisionada, tambemconhecida como Aprendizagem com um Professor, a rede e treinada com um conjunto de exem-plos de entrada-saıda retirados do ambiente. Sendo assim, a rede deve ter a capacidade de mediro seu comportamento atual e seu comportamento de referencia, realizando os ajustes dos pesossinapticos com o intuito de minimizar o erro [Osorio and Vieira 1999]. O erro e a diferencaentre a saıda obtida pela rede e a saıda desejada e e calculado passo a passo, interativamente,ate obter um valor satisfatorio. Com isso, o conhecimento do ambiente vai sendo transferidopara a rede, de forma gradual, atraves do treinamento.

Na Aprendizagem por Reforco existe apenas indicacoes imprecisas sobre o resultado de-sejado da rede, ou seja, neste tipo de aprendizagem, o mapeamento de entrada-saıda e feitogradativamente atraves da interacao com o ambiente, dispondo apenas de uma avaliacao quali-tativa do comportamento do sistema sem, no entanto, poder medir o erro. Ja na AprendizagemNao-Supervisionada, tambem chamada de Aprendizagem sem um Professor, nao se usa exem-plos de entrada-saıda para treinar a rede. Esta aprende sozinha, sem um supervisor externopara indicar os erros. Este tipo de rede desenvolve a habilidade de extrair caracterısticas rele-vantes, a partir das entradas fornecidas, e formar representacoes internas que codifiquem essascaracterısticas, criando assim, novas classes automaticamente [Osorio and Vieira 1999].

Apos definir o paradigma de aprendizagem e todos os outros elementos citados anterior-mente, a Rede Neural esta pronta para ser implementada. Sabe-se que com a introducao dasRNAs, muitas areas da computacao se desenvolveram, visto que problemas que antes eramconsiderados computacionalmente difıceis de serem resolvidos, agora podem ser resolvidos commaior facilidade e melhor desempenho. Em seguida, apresenta-se o algoritmo de aprendizadosupervisionado do Perceptron, visto que este sera utilizado para a resolucao do problema pro-posto neste trabalho.

6.4.3 Algoritmo de Aprendizado Supervisionado do Perceptron

O algoritmo de aprendizado supervisionado do Perceptron foi desenvolvido por Rosenblatt,por volta do final dos anos 1950 e inıcio dos anos 1960, causando grande excitacao entre ospesquisadores da epoca devido ao fato dos perceptrons convergirem para uma solucao em umnumero finito de passos, se treinados com um conjunto de treinamento linearmente separaveis[Gonzalez and Woods 2000].

Ressalta-se que um conjunto de treinamento e linearmente separavel quando um hiperplano(subespaco linear, afim ou projetivo de codimensao 1) separa completamente elementos de clas-ses diferentes, ou seja, elementos de classes distintas ficam em lados opostos do hiperplano. Em

Page 53: Processamento de Imagens no Aux´ılio `a Detec¸c˜ao de ... · Processamento de Imagens no Aux´ılio `a ... por cuidar de mim e por estar sempre ao meu lado.` ... por todo o conhecimento

6.4 Processos de Aprendizagem 41

geometria, o hiperplano em um espaco bidimensional e uma reta e em um espaco tridimensionale o plano habitual.

O Perceptron de Rosenblatt e composto por um conjunto de entradas x1, x2, ..., xm, umconjunto de pesos w1, w2, ..., wm e um bias aplicado externamente, representado por b. Comisso, a entrada v do limitador abrupto (ou funcao Limiar) do neuronio e dada por [Haykin 2001]:

v =m∑

i=1

wixi + b (6.15)

Assim, o perceptron retornara 1 se a entrada estiver em um lado do hiperplano (atribuindoa entrada a classe C1) e retornara -1 se a entrada estiver do outro lado do plano (atribuindoa entrada a classe C2). Portanto, se o conjunto for linearmente separavel, o algoritmo deaprendizado do Perceptron sera adequado para a aplicacao.

Segundo o algoritmo de aprendizado do Perceptron, quando uma entrada e classificadaerroneamente durante o processo de treinamento, os pesos devem ser adaptados atraves de umaregra de correcao de erro conhecida como Regra Delta. Essa regra diz que apos a tentativa deresolver uma ocorrencia do problema, um “professor” fornece o resultado correto ao Perceptron,possibilitando o ajuste dos pesos atraves da equacao 6.16:

∆wi = c(d− sinal(m∑

i=1

wixi + b))xi (6.16)

Onde ∆wi e o ajuste dos pesos para a i-esima componente do vetor de entrada, c a constantede aprendizagem, d e o resultado desejado e o valor sinal(

∑mi=1 wixi+b) e a saıda do perceptron,

a qual pode ser +1 ou -1 [Luger 2004].Com isso, os pesos aumentam ou diminuem de acordo com o valor desejado e o valor de saıda.

Este processo e repetido baseado em um criterio de parada, o qual, geralmente, corresponde aigualdade dos valores desejados e reais. No final do processo, se existir um conjunto de pesosque forneca uma saıda ajustada para todos os componentes do conjunto de treinamento, oalgoritmo do Perceptron ira aprende-lo [Luger 2004].

Baseado neste algoritmo, foi proposto um modelo com o intuito de classificar imagensdigitais. Neste trabalho busca-se classificar imagens de cancer de pele do tipo Melanoma, maisprecisamente, classifica-se as imagens em: imagens de lesoes Melanoma e imagens de lesoes naoMelanoma. Este modelo de classificacao e apresentado no proximo capıtulo.

Page 54: Processamento de Imagens no Aux´ılio `a Detec¸c˜ao de ... · Processamento de Imagens no Aux´ılio `a ... por cuidar de mim e por estar sempre ao meu lado.` ... por todo o conhecimento

Capıtulo 7Modelo Proposto

Os estudos realizados sobre cancer de pele, caracterizacao de imagens e redes neurais arti-ficiais durante o desenvolvimento deste trabalho possibilitaram a elaboracao de um modelo declassificacao de imagens que busca diferenciar imagens de lesoes Melanoma e imagens de lesoesnao Melanoma, as quais sao compostas por imagens de doencas de pele ou, simplesmente denevos, que muitas vezes sao confundidos com o Melanoma devido a expressiva semelhanca.

O primeiro passo deste trabalho foi a concepcao do modelo de classificacao de imagens.Este modelo pode ser dividido em tres fases principais: a caracterizacao das imagens digitais,o treinamento da rede neural e o processo de classificacao. A fase de caracterizacao consisteem extrair as caracterısticas (cor, forma ou textura) das imagens, as quais serao a base para aimplementacao e treinamento da rede neural. A fase de treinamento e realizada com o objetivode compor o vetor de pesos usados no processo de classificacao. Por fim, apos o treinamento,a rede esta pronta para ser usada para classificar as imagens.

7.1 Caracterizacao das Imagens Digitais

A caracterizacao das imagens digitais consiste em extrair informacoes que as identifiquem.Geralmente, as informacoes mais utilizadas para identificar uma imagem sao as cores, a formae a textura. Neste trabalho foi utilizada a cor para caracterizar as imagens de lesoes Melanomae de lesoes nao Melanoma, as quais compoem o banco de imagens de treinamento e o banco deimagens de teste.

7.1.1 Selecao do Banco de Imagens de Treinamento

A principal caracterıstica das redes neurais artificiais e sua capacidade de representar conhe-cimento atraves de exemplos pre-estabelecidos. Dessa forma, na fase de treinamento, selecionou-se imagens de lesoes Melanoma e imagens de lesoes nao Melanoma para compor o banco detreinamento. A Figura 7.1 apresenta uma pequena amostra das imagens utilizadas no bancode treinamento.

Essas imagens foram rotuladas a uma saıda alvo, como apresentado na Figura 7.2, o quepermite o processo de aprendizagem da rede. Em seguida, extraiu-se as caracterısticas das

42

Page 55: Processamento de Imagens no Aux´ılio `a Detec¸c˜ao de ... · Processamento de Imagens no Aux´ılio `a ... por cuidar de mim e por estar sempre ao meu lado.` ... por todo o conhecimento

7.1 Caracterizacao das Imagens Digitais 43

imagens atraves da obtencao do Histograma em Tons de Cinza e armazenou-as em vetores.

Figura 7.1: Pequena amostra das imagens usadas no banco de treinamento.

Figura 7.2: Exemplo da rotulacao das imagens a uma saıda alvo.

7.1.2 Formacao do Vetor de Caracterısticas

Como falado anteriormente, apos a selecao das imagens que formarao o banco de treina-mento, deve-se extrair as caracterısticas (cor, forma ou textura) que servirao como entradapara a rede neural. Estas caracterısticas podem ser extraıdas atraves de diversas tecnicas earmazenadas em vetores.

No modelo proposto, todas as caracterısticas podem ser armazenadas em um unico vetorde entrada. Por exemplo, dado um vetor C ∈ R, este pode ser formado por c1, c2, ..., cm querepresenta caracterısticas das cores, cm+1, cm+2, ..., cm+n que representa caracterısticas da formae cm+n+1, cm+n+2, ..., cm+n+o que representa caracterısticas da textura [Huang et al. 1998], comoapresentado na Figura 7.3. Com isso, a dimensao do vetor sera m+n+ o e, consequentemente,a rede tera este mesmo numero de entradas.

Ressalta-se que o vetor de caracterısticas e utilizado apenas como entrada da rede neural,ou seja, apos o treinamento da rede e a formacao dos pesos que serao usados no processo declassificacao, este pode ser descartado.

Page 56: Processamento de Imagens no Aux´ılio `a Detec¸c˜ao de ... · Processamento de Imagens no Aux´ılio `a ... por cuidar de mim e por estar sempre ao meu lado.` ... por todo o conhecimento

44 Modelo Proposto

Figura 7.3: Exemplo de extracao de caracterısticas para a formacao do vetor.

7.2 Implementacao da Rede Neural Artificial

A rede neural implementada e a Perceptron de Camada Unica. Este trabalho utiliza doisneuronios, um excitado por imagens de lesoes Melanoma e o outro excitado por imagens delesoes nao Melanoma e todas as entradas da rede originam-se do vetor de caracterısticas obtidodas imagens de treinamento. Ressalta-se que o vetor de caracterısticas de cada imagem ecomposto pelos seu histograma de tons de cinza. Este vetor possui 257 posicoes, sendo quea ultima posicao contem o valor do Bias (fixado como 1) e as outras posicoes armazenam ohistograma, o qual possui 256 posicoes referentes as intensidades de cinza.

Posteriormente, criou-se um vetor de pesos para cada neuronio, tambem com 257 posicoes.Inicialmente, os pesos sao inicializados com um valor aleatorio. Eles sao ajustados atraves de umalgoritmo de aprendizagem ate a saıda do perceptron alcancar um valor satisfatorio de acertosem relacao aos rotulos dados as imagens de treinamento. Apos o termino da implementacaoda rede, iniciou-se o treinamento.

7.3 Treinamento da Rede Neural Artificial

Apos a formacao do vetor de entradas, da inicializacao dos pesos com valores aleatoriose da atribuicao do valor 1 ao Bias, a rede neural esta pronta para iniciar o seu processode aprendizagem. Como foi implementada uma rede Perceptron, utiliza-se o algoritmo deaprendizado supervisionado conhecido como Regra Delta.

Segundo este algoritmo, os pesos sao ajustados de forma a minimizar o erro no conjunto detreinamento [Luger 2004], ou seja, a cada iteracao verifica-se se a saıda da rede esta de acordocom a saıda desejada, se nao estiver, os pesos sao ajustados atraves da Regra Delta e inicia-se

Page 57: Processamento de Imagens no Aux´ılio `a Detec¸c˜ao de ... · Processamento de Imagens no Aux´ılio `a ... por cuidar de mim e por estar sempre ao meu lado.` ... por todo o conhecimento

7.4 Processo de Classificacao de Imagens 45

uma nova iteracao.O processo de aprendizagem termina somente quando todas as saıdas da rede estao de acordo

com a saıda desejada. Quando isso acontece, armazena-se os pesos finais de cada neuronio paraserem usados no processo de classificacao das imagens. A Figura 7.4 apresenta todo o processo,desde a selecao do banco de imagens de treinamento ate o ajuste dos pesos dos dois neuronios.

Figura 7.4: Treinamento da rede neural proposta.

7.4 Processo de Classificacao de Imagens

Apos o treinamento da rede neural, o sistema para classificacao de imagens em Melanomae nao Melanoma esta pronto para ser utilizado. Com isso, o usuario ira inserir no sistema umaimagem de consulta, a qual passara por um extrator de caracterısticas, ou seja, sera extraıdoo seu histograma em tons de cinza, que sera armazenado em um vetor.

Em seguida, o vetor de caracterısticas da imagem de consulta e os pesos finais obtidosna fase de treinamento servirao como entrada para a rede neural que realizara a classificacaoda imagem. Esta rede neural processara os dados e retornara um valor capaz de ativar umdos neuronios, de acordo com um limiar pre-definido. Com isso, originara a classificacao daimagem.

Este modelo de classificacao pode ser facilmente modificado para receber qualquer tipode caracterıstica e tambem um numero maior de entradas. O proximo capıtulo mostrara, napratica, o funcionamento deste modelo, explicara como foram feitos os testes e apresentara osresultados obtidos.

Page 58: Processamento de Imagens no Aux´ılio `a Detec¸c˜ao de ... · Processamento de Imagens no Aux´ılio `a ... por cuidar de mim e por estar sempre ao meu lado.` ... por todo o conhecimento

Capıtulo 8Testes e Resultados Experimentais

Apos o desenvolvimento do modelo proposto para a classificacao das imagens em lesoesMelanoma e lesoes nao Melanoma e, a subsequente implementacao do modelo, foram realizadosdiversos testes com variadas imagens com o intuito de estabelecer resultados consistentes. Emseguida, explica-se como foram realizados os testes e expoe detalhadamente o treinamento darede, a caracterizacao das imagens e o processo de classificacao. Alem disso, apresenta-se osresultados obtidos.

8.1 Aquisicao das Imagens

O primeiro passo para o desenvolvimento do sistema proposto foi a selecao das imagens.Foram utilizadas 68 imagens para compor o banco de treinamento, sendo 34 imagens de lesoesnao Melanoma e 34 imagens de lesoes Melanoma. Tambem se escolheu mais 10 imagens paracompor o banco de testes, sendo 5 de lesoes Melanoma e 5 de lesoes nao Melanoma. Todasestas imagens foram obtidas de [Ray ], [Melton and Swanson ] e [Cohen and Lehmann ]. Emseguida, a rede neural foi implementada na linguagem de programacao JAVA.

8.2 Implementacao das Caracterısticas de Cores das Ima-

gens

Apos a selecao das imagens que compoe o banco de treinamento, estas foram transformadasem imagens monocromaticas (compostas por diferentes tons de cinza) e iniciou-se o processode extracao de caracterısticas.

Os tons de cinza de cada imagem foram extraıdos, atraves da tecnica conhecida comoHistograma, e armazenados em um vetor contendo 257 posicoes, sendo que a ultima posicaocontinha o valor do Bias (fixado como 1) e as outras posicoes continham o histograma, o qualpossui 256 posicoes referentes as intensidades de cinza. A Figura 8.1 apresenta uma lesaoMelanoma com seu histograma e a Figura 8.2 apresenta uma lesao nao Melanoma com seuhistograma.

46

Page 59: Processamento de Imagens no Aux´ılio `a Detec¸c˜ao de ... · Processamento de Imagens no Aux´ılio `a ... por cuidar de mim e por estar sempre ao meu lado.` ... por todo o conhecimento

8.3 Implementacao da Rede Neural 47

Figura 8.1: Imagem de lesao melanoma com seu histograma.

Figura 8.2: Imagem de lesao nao melanoma com seu histograma.

Como falado anteriormente, o banco de treinamento e composto por 68 imagens. Portanto,criou-se uma matriz com 68× 267 posicoes para armazenar as caracterısticas de cores de todasas imagens do banco de treinamento. Esta matriz serviu como entrada para a rede neuralartificial, sendo utilizada durante o treinamento.

8.3 Implementacao da Rede Neural

Apos extrair o histograma de cada imagem de treinamento, implementou-se uma rede neuralartificial de camada unica baseada no algoritmo de aprendizado do Perceptron. Foram criadosdois neuronios, um excitado por imagens de lesoes Melanoma e o outro excitado por imagensde lesoes nao Melanoma. A entrada de cada neuronio foi a matriz contendo os histogramas dasimagens.

Criou-se tambem uma matriz de 2× 257 posicoes (2 neuronios e 256 posicoes referentes aostons de cinza mais o Bias para representar cada imagem) para conter os pesos. Inicialmenteos pesos foram inicializados com um valor aleatorio e a constante de aprendizagem recebeu ovalor 0.2. Com isso, iniciou-se o treinamento da rede.

O treinamento da rede neural terminou somente quando todas as saıdas da rede estavamde acordo com a saıda desejada. Quando isso aconteceu, armazenou-se a matriz que continhaos pesos finais de cada neuronio, os quais foram usados na fase de testes da rede neural.

8.4 Fase de Testes da Rede Neural

Apos o termino do treinamento da rede neural, iniciou-se a fase de teste. Foram selecionadas10 imagens, sendo 5 de lesoes Melanoma e 5 de lesoes nao Melanoma, para compor o banco detestes. Ressalta-se que as imagens utilizadas no teste nao fazem parte do banco de treinamento.

Estas imagens foram caracterizadas (obtendo o Histograma de tons de cinza) e usadas como

Page 60: Processamento de Imagens no Aux´ılio `a Detec¸c˜ao de ... · Processamento de Imagens no Aux´ılio `a ... por cuidar de mim e por estar sempre ao meu lado.` ... por todo o conhecimento

48 Testes e Resultados Experimentais

entrada da rede neural, que classificara as imagens. Esta rede neural e semelhante a usada notreinamento, a unica diferenca e que nao possui processo de aprendizagem. Ocorre apenas asoma ponderada das entradas (as entradas sao ponderadas em relacao aos pesos finais obtidosna fase de treinamento) e, de acordo com um limiar pre-estabelecido, obtem-se o resultadofinal, ou seja, a classificacao da imagem em lesao Melanoma ou lesao nao Melanoma.

Todo o procedimento, desde a selecao do banco de treinamento ate a selecao do banco detestes foi repetido diversas vezes, variando as imagens, ou seja, a rede foi treinada e testadacom praticamente todas as imagens. Ressaltando que as imagens usadas no teste nao fazemparte do banco de treinamento.

Esse processo foi executado com o intuito de estabelecer uma media em relacao aos resul-tados da rede. No final dos diversos testes, a media total de acertos da rede neural atingiuuma taxa de 69%. Os seguintes graficos apresentam os resultados obtidos, ressaltando que asindecisoes da rede estao incluıdas nos erros.

Figura 8.3: Resultados obtidos para imagens de lesoes Melanoma.

Figura 8.4: Resultados obtidos para imagens de lesoes nao Melanoma.

Com os resultados obtidos podemos perceber que o trabalho esta no caminho certo, visto queforam classificadas corretamente um maior numero de imagens de lesoes Melanoma, obtendoassim uma taxa de apenas 29% de falsos negativos (lesoes Melanoma classificadas erroneamente

Page 61: Processamento de Imagens no Aux´ılio `a Detec¸c˜ao de ... · Processamento de Imagens no Aux´ılio `a ... por cuidar de mim e por estar sempre ao meu lado.` ... por todo o conhecimento

8.4 Fase de Testes da Rede Neural 49

como nao Melanoma). Isso e muito bom, pois o objetivo do trabalho e indicar precocementelesoes Melanoma possibilitando maiores chances de cura aos pacientes. As Figuras 8.5, 8.6, 8.7e 8.8 apresentam algumas imagens com seus respectivos resultados.

Figura 8.5: Imagens Melanoma - Resultado: verdadeiro positivo.

Figura 8.6: Imagens nao Melanoma - Resultado: verdadeiro negativo.

Figura 8.7: Imagens Melanoma - Resultado: falso negativo

Figura 8.8: Imagens nao Melanoma - Resultado: falso positivo.

Page 62: Processamento de Imagens no Aux´ılio `a Detec¸c˜ao de ... · Processamento de Imagens no Aux´ılio `a ... por cuidar de mim e por estar sempre ao meu lado.` ... por todo o conhecimento

Capıtulo 9Conclusoes

O diagnostico de doencas atraves da utilizacao de imagens vem adquirindo grande im-portancia devido a obtencao de resultados significativos, o que auxilia satisfatoriamente profis-sionais da area da saude e proporciona maiores chances e qualidade de vida aos pacientes. Porisso, a criacao de sistemas capazes de “classificar” doencas vem se destacando na computacao.

A classificacao de cancer de pele atraves de imagens nao e tema muito estudado e desen-volvido no Brasil. Por isso, neste trabalhou realizou-se um estudo sobre as caracterısticas docancer de pele com o intuito de obter informacoes que diferenciem as imagens. Alem disso,estudou-se tecnicas de extracao de caracterısticas baseadas em cor, forma e textura com oobjetivo de verificar qual delas melhor resolveria o problema proposto.

Por fim, buscando uma boa abordagem para a classificacao de imagens de cancer de pelepropos-se o uso das redes neurais artificiais para obter um “modelo” que rotule as imagens emlesoes de pele Melanoma e lesoes de pele nao Melanoma, utilizando a cor como caracterısticaprincipal. Para tanto, optou-se por utilizar uma rede neural do tipo Perceptron de CamadaUnica para a tarefa de classificacao.

Ao se realizar os experimentos conclui-se que a caracterizacao de imagens digitais aliadaao aprendizado das redes neurais artificiais pode ser considerada uma solucao robusta paraa aplicacao em questao. Alem disso, notou-se que, mesmo utilizando uma das tecnicas maissimples de caracterizacao de imagens, ou seja, o histograma em tons de cinza, e um dos pri-meiros algoritmos de aprendizagem desenvolvidos, a rede neural obteve resultados promissores,atingindo uma taxa de 69 % de acertos.

Entretanto, ressalta-se que ainda e necessario mais estudos a fim de averiguar as causas epropor solucoes para os casos nos quais a rede neural nao apresentou resultados satisfatorios.Alem disso, pretende-se reformular a rede neural para consolidar os resultados. Enfim, por seruma aplicacao complexa, ainda existe muitos pontos a serem explorados em trabalhos futuros.

9.1 Trabalhos Futuros

Acredita-se que este trabalho contribuiu satisfatoriamente, tanto no campo teorico quantopratico, para a utilizacao de tecnicas de processamento de imagens (mais especificamente deanalise de imagens) em conjunto com as redes neurais artificiais na classificacao de imagens

50

Page 63: Processamento de Imagens no Aux´ılio `a Detec¸c˜ao de ... · Processamento de Imagens no Aux´ılio `a ... por cuidar de mim e por estar sempre ao meu lado.` ... por todo o conhecimento

9.1 Trabalhos Futuros 51

em Melanoma e nao Melanoma. Entretanto, devido ao tempo e a complexidade da aplicacao,alguns pontos nao foram explorados. Por isso, ressalta-se alguns pontos que serao estudados eaprofundados em trabalhos futuros:

� Aumentar o banco de imagens de treinamento e o banco de imagens de teste;

� Criar um banco de imagens em convenio com hospitais;

� Reformular a Rede Neural;

� Implementar um sistema de probabilidades capaz de estimar as chances de uma lesao serMelanoma ou nao Melanoma;

� Aumentar a quantidade de classes, ou seja, dividir as imagens em diversos tipos de doencasde pele (cancerosas ou nao);

� Incluir caracterısticas de forma no modelo proposto. Neste processo, pretende-se extrairapenas as bordas das lesoes, com o intuito de analisar uma das caracterısticas maisimportantes do cancer Melanoma, ou seja, a irregularidade de suas bordas;

� Incluir caracterısticas de textura no modelo proposto;

� Implementar outros tipos de Redes Neurais Artificiais;

� Criar uma interface mais amigavel ao usuario;

Page 64: Processamento de Imagens no Aux´ılio `a Detec¸c˜ao de ... · Processamento de Imagens no Aux´ılio `a ... por cuidar de mim e por estar sempre ao meu lado.` ... por todo o conhecimento

Referencias Bibliograficas

[Alves et al. 2006] Alves, W., Araujo, S., and Librantz, A. F. (2006). Reconhecimento dePadroes de Texturas em Imagens Digitais Usando uma Rede Neural Artificial Hıbrida. Anaisdo II Congresso Sul Catarinense de Computacao.

[Azevedo and Conci 2003] Azevedo, E. and Conci, A. (2003). Computacao Grafica - Teoria ePratica. Editora Campus, Rio de Janeiro.

[Bender 2003] Bender, T. (2003). Classificacao e Recuperacao de Imagens por Cor utilizandoTecnicas de Inteligencia Artificial. Dissertacao de mestrado, Universidade do Vale do Riodos Sinos, Sao Leopoldo.

[Cohen and Lehmann ] Cohen, B. and Lehmann, C. Dermatology Image Atlas. Johns HopkinsUniversity, http://dermatlas.med.jhmi.edu/derm/. acessado em marco de 2007.

[da Saude 2005] da Saude, M. (2005). Estimativa 2006: Incidencia de Cancer no Brasil. Insti-tuto Nacional do Cancer, www.inca.org.br. acessado em janeiro de 2007.

[Gonzalez and Woods 2000] Gonzalez, R. and Woods, R. (2000). Processamento de ImagensDigitais. Editora Edgard Blucher, Sao Paulo.

[Haykin 2001] Haykin, S. (2001). Redes Neurais: Prncıpios e Praticas. Editora Bookman,Porto Alegre.

[Herzberg and Ferrari 2006] Herzberg, V. and Ferrari, C. (2006). Tenho cancer. E agora? -Enfrentando o cancer sem medos e fantasias. Associacao Brasileira do Cancer.

[Huang et al. 1998] Huang, T., Rui, Y., and Mehrotra, S. (1998). Relevance Feedback Tech-niques in Interactive Content-Based Image Retrieval. Storage and Retrieval for Image andVideo Databases VI, pages 25–36.

[Linhares and Gewandsznajder 1998] Linhares, S. and Gewandsznajder, F. (1998). BiologiaHoje - Citologia, Histologia e Origem da Vida, volume 1. Editora Atica, Sao Paulo.

[Lopes 2000] Lopes, S. (2000). Biologia: Completo e Atualizado, volume Unico. Editora Sa-raiva, Sao Paulo.

52

Page 65: Processamento de Imagens no Aux´ılio `a Detec¸c˜ao de ... · Processamento de Imagens no Aux´ılio `a ... por cuidar de mim e por estar sempre ao meu lado.` ... por todo o conhecimento

REFERENCIAS BIBLIOGRAFICAS 53

[Luger 2004] Luger, G. (2004). Inteligencia Artificial: Estruturas e Estrategias para a Solucaode Problemas Complexos. Editora Bookman, Porto Alegre.

[Mantese et al. 2006] Mantese, S., Berbert, A., Gomides, M., and Rocha, A. (2006). CarcinomaBasocelular - Analise de 300 casos observados em Uberlandia - MG. Anais Brasileiros deDermatologia, 81(2):136–142.

[Martineli 1999] Martineli, E. (1999). Extracao de Conhecimento de Redes Neurais Artificiais.Dissertacao de mestrado, Instituto de Ciencias Matematicas e de Computacao, Universidadede Sao Paulo, Sao Carlos.

[Martinez et al. 2006] Martinez, M., Francisco, G., Cabral, L., Ruiz, I., and Neto, C. (2006).Genetica molecular aplicada ao cancer cutaneo nao melanoma. Anais Brasileiro de Derma-tologia, 81(5):405–419.

[McCulloch and Pitts 1943] McCulloch, W. S. and Pitts, W. (1943). A Logical Calculus of theIdeas Imminent in Nervous Activity. Bulletin of Mathematical Biophysics 5, pages 115–133.

[Melton and Swanson ] Melton, J. and Swanson, J. Medical Educa-tion Website. School of Medicine - Loyola University Dermatology,http://www.meddean.luc.edu/lumen/MedEd/medicine/dermatology/melton/content1.htm.acessado em marco de 2007.

[Mendes and Oliveira 2006] Mendes, D. and Oliveira, M. (2006). Redes Neurais com Aplicacoesem Bioinformatica. Laboratorio Nacional de Computacao Cientıfica, www.lncc.org. acessadoem dezembro de 2006.

[Mendonca and Azevedo 1992] Mendonca, S. and Azevedo, G. (1992). Risco crescente de me-lanoma de pele no Brasil. Revista Saude Publica, 26(4).

[Nasser 2004] Nasser, N. (2004). Epidemiologia dos canceres espinocelulares - Blumenau (SC)- Brasil, de 1980 a 1999. Anais Brasileiros de Dermatologia, 79(6).

[Osorio and Vieira 1999] Osorio, F. and Vieira, R. (1999). Sistemas Hıbridos Inteligentes. XIXCongresso da Sociedade Brasileira de Computacao, Rio de Janeiro. Encontro Nacional deInteligencia Artificial.

[Pratt 2001] Pratt, W. (2001). Digital Image Processing. Editora John Wiley & Sons, NovaYork.

[Queiroz and Gomes 2006] Queiroz, J. E. R. and Gomes, H. M. (2006). Introducao ao Proces-samento Digital de Imagens. SIBGRAPI, Manaus.

[Rafiei and Mendelzon 2002] Rafiei, D. and Mendelzon, A. O. (2002). Efficient Retrieval ofSimilar Shapes. The VLDB Journal, 11:17–27.

[Ray ] Ray, T. Dermatologic Image Database. Department of Dermatology - University ofIowa, http://tray.dermatology.uiowa.edu/DermImag.htm. acessado em marco de 2007.

Page 66: Processamento de Imagens no Aux´ılio `a Detec¸c˜ao de ... · Processamento de Imagens no Aux´ılio `a ... por cuidar de mim e por estar sempre ao meu lado.` ... por todo o conhecimento

54 REFERENCIAS BIBLIOGRAFICAS

[Rui et al. 1997] Rui, Y., Huang, T., and Chang, S. (1997). Image Retrieval: Past, Present eFuture. International Symposium on Multimedia Information Processing.