segmentaÇÃo de vasos sanguÍneos em imagens de fundo de olho · 2018. 4. 5. · sinais que...

ANDRÉ LUIZ ALMEIDA SILVA

SEGMENTAÇÃO DE VASOS SANGUÍNEOS

EM IMAGENS DE FUNDO DE OLHO

UBERLÂNDIA

2017

ANDRÉ LUIZ ALMEIDA SILVA

SEGMENTAÇÃO DE VASOS SANGUÍNEOS EM

IMAGENS DE FUNDO DE OLHO

Trabalho apresentado na Universidade Fede-ral de Uberlândia como requisito para conclu-são do curso de Engenharia Eletrônica e deTelecomunicações.

Orientador: Prof.a Dr.a Milena Bueno Pereira Carneiro

UBERLÂNDIA

2017

Este trabalho é dedicado a minha avó Maria Lúcia (in memoriam) e ao meu avô Edvaldo

que sempre me incentivaram a acreditar em meus sonhos.

Agradecimentos

Quero agradecer primeiramente a Deus, que me deu forças e saúde para vencer

dia após dia de luta durante a graduação. Foi meu refúgio e minha força em momentos

difíceis.

Quero agradecer aos meus avós Edvaldo e Maria Lúcia (in memoriam), pela minha

criação e aos bons ensinamentos. Agradeço aos dois por tudo, pois acreditaram no meu

potencial e me incentivaram a querer algo melhor e a acreditar no meu sonho de cursar

engenharia.

Agradeço a minha madrinha Cárita pelo carinho e dedicação comigo. Quero agra-

decer meu primo Otávio Augusto pelo companheirismo

Quero Agradecer minha mãe Kelly Cristina pela ajuda durante estes anos de

graduação e aos bons conselhos. Ao meu pai Reginaldo Américo agradeço ao incentivo e a

admiração que tem por mim.

Agradeço também minha vó Márcia (in memoriam) que sempre se preocupou

comigo, mesmo morando em outra cidade, ligava constantemente para saber como eu

estava.

Agradeço aos grandes e bons amigos que tenho. Amigos da graduação, do ônibus

de estudantes, e amigos de anteriores a graduação.

Agradeço a minha orientadora Milena, por me incentivar no desenvolvimento deste

trabalho, por entender minhas dificuldades. Agradeço também a Cristiane, por permitir

utilizar o trabalho de doutorado dela como base para o desenvolvimento deste trabalho.

Agradeço aos professores que me forneceram conhecimento necessário para minha

formação como engenheiro. Agradeço aos técnicos da FEELT, que sempre fizeram o possível

para ajudar de uma forma ou de outra na obtenção de materiais para o desenvolvimento

dos projetos durante a graduação.

“A felicidade não se resume na ausência de problemas,

mas sim na sua capacidade de lidar com eles.”

Albert Einstein

Resumo

A retinopatia diabética é uma das principais doenças que ocorrem na retina e é causada por

outra doença chamada diabetes Mellitus. A retinopatia apresenta sinais por meio da retina,

sinais que auxiliam o médico oftalmologista diagnosticar se o paciente tem ou não diabetes

Mellitus, analisando apenas as imagens de fundo de olho tiradas do paciente. Os sinais

se apresentam em forma de aparecimento de microaneurismas, exsudatos, haemorragias,

neovascularizações e alterações nos vasos sanguíneos.

Este trabalho foi desenvolvido para estudar e implementar um método de segmentação

de vasos sanguíneos da retina utilizando processamento de imagens. O objetivo é isolar

os vasos sanguíneos para facilitar a análise do médico tanto dos vasos sanguíneos onde

a retinopatia diabética também causa alterações, quanto do fundo da retina onde se

apresentam os outros sinais desta doença. A análise manual das imagens de fundo de olho

é muito criteriosa, pois os objetos presentes e os sinais da doença apresentam-se com um

baixo contraste demandando um grande esforço visual do médico e contribuindo para a

ocorrência de erros durante a análise.

O método implementado foi testado nas bases de imagens de fundo de olho públicas

DRIVE e STARE, disponibilizadas via internet. O método obteve uma precisão de 95.668

% na base DRIVE, e 94.352 % na STARE.

A detecção dos vasos sanguíneos pode ser utilizada como método de pré-processamento

em trabalhos cujo objetivo seja detectar os outros sinais da retinopatia diabética, como a

detecção de microaneurisma e exsudatos. Utilizando a detecção dos vasos como forma de pré-

processamento, reduziram a taxa de erro, principalmente na detecção de microaneurismas,

onde estes podem ser confundidos com os neovasos.

Palavras-chave: Imagem de Fundo de Olho, Detecção, Vasos Sanguíneos, Retinopatia

Diabética.

Abstract

Diabetic retinopathy is one of the major diseases that occur in the retina and is caused

by another condition called diabetes Mellitus. Retinopathy shows signs through of the

retina, signs that aid the ophthalmologist diagnose whether or not the patient has diabetes

Mellitus, analyzing only the eye fundus images of the eye taken from the patient. The

signs are presented in the form of appearance of microaneurysms, exudates, haemorrhages,

neovascularizations and alterations in the blood vessels.

This work was developed to study and implement a method of segmentation of retinal

blood vessels using image processing. The goal is to isolate blood vessels to facilitate

medical analysis of both the blood vessels where diabetic retinopathy also causes changes

as well as the fundus of the retina where other signs of this disease are present. The manual

analysis of the eye fundus images is very careful, since the objects present and the signs of

the disease present themselves with a low contrast requiring a great visual effort of the

doctor and contributing to the occurrence of errors during the analysis.

The implemented method was tested in the databases of public eye fundus images DRIVE

and STARE, available through the internet. The method obtained an accuracy of 95.668

% in the DRIVE base, and 94.352 % in the STARE.

The detection of blood vessels can be used as a pre-processing method in studies aimed at

detecting other signs of diabetic retinopathy, such as the detection of microaneurysms and

exudates. Using the vessel detection of vessels as a form of pre-processing, they reduced

the error rate, mainly in the detection of microaneurysms, where they can be confused

with the neovessels.

Keywords: Eye Fundus Image, Detection, Blood Vessels, Diabetic Retinopathy.

Lista de ilustrações

Figura 1 – Olho Humano. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

Figura 2 – Formação da imagem no olho humano. . . . . . . . . . . . . . . . . . . 24

Figura 3 – Imagem de fundo de olho saudável. . . . . . . . . . . . . . . . . . . . . 25

Figura 4 – Angiografia fluoresceínica. . . . . . . . . . . . . . . . . . . . . . . . . . 26

Figura 5 – Fotografia red free do fundo de olho com retinopatia diabética. . . . . . 26

Figura 6 – Fotografia colorida- RGB do fundo olho normal. . . . . . . . . . . . . . 26

Figura 7 – Retinógrafo digital. TOPCON, modelo: TRC-NW8 Non-Mydriatic Re-

tinal Camera. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

Figura 8 – Microaneurisma. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

Figura 9 – Sinais da Retinopatia diabética. . . . . . . . . . . . . . . . . . . . . . . 29

Figura 10 – Etapas para a realização do processamento de imagens. . . . . . . . . . 31

Figura 11 – Sistema de cores Aditivo. . . . . . . . . . . . . . . . . . . . . . . . . . 33

Figura 12 – Cubo RGB. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

Figura 13 – Formação de uma Imagem RGB em um monitor colorido. . . . . . . . 34

Figura 14 – Sistema de cores Subtrativo. . . . . . . . . . . . . . . . . . . . . . . . . 34

Figura 15 – Modelo de cores HSI. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

Figura 16 – Exemplos de imagens do banco DRIVE. . . . . . . . . . . . . . . . . . 38

Figura 17 – Exemplo de imagens do banco STARE. . . . . . . . . . . . . . . . . . . 39

Figura 18 – Diagrama do método. . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

Figura 19 – Retinografia RGB. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42

Figura 20 – Canal Verde. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43

Figura 21 – Complemento do Canal Verde. . . . . . . . . . . . . . . . . . . . . . . 43

Figura 22 – Resultado da aplicação do CLAHE no complemento do Canal Verde. . 44

Figura 23 – Exemplo de Elementos Estruturantes. . . . . . . . . . . . . . . . . . . 45

Figura 24 – Imagem resultante da Abertura Morfológica. . . . . . . . . . . . . . . . 46

Figura 25 – Imagem resultante após a remoção do Disco Óptico. . . . . . . . . . . 47

Figura 26 – Resultado após aplicação do Filtro Mediana. . . . . . . . . . . . . . . . 47

Figura 27 – Background. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48

Figura 28 – Resultado da remoção do Background. . . . . . . . . . . . . . . . . . . 49

Figura 29 – Ajuste de contraste da imagem. . . . . . . . . . . . . . . . . . . . . . . 49

Figura 30 – Imagem Binária dos Vasos Sanguíneos. . . . . . . . . . . . . . . . . . . 50

Figura 31 – Imagem após a remoção de objetos espúrios. . . . . . . . . . . . . . . . 51

Figura 32 – Resultado da detecção dos vasos sanguíneos. . . . . . . . . . . . . . . . 51

Figura 33 – Segmentação dos vasos sanguíneos de uma imagem da base DRIVE. . . 53

Figura 34 – Amostra de imagens da base DRIVE . . . . . . . . . . . . . . . . . . . 54

Figura 35 – Gráfico dos resultados da tabela 2. . . . . . . . . . . . . . . . . . . . . 56



Figura 38 – Segmentação dos vasos sanguíneos de uma imagem da base STARE. . . 60

Figura 39 – Imagens segmentadas - STARE. . . . . . . . . . . . . . . . . . . . . . . 61



Lista de tabelas

Tabela 1 – Avaliação para o conjunto de pixels segmentados. . . . . . . . . . . . . 36

Tabela 2 – Resultado da segmentação das 20 imagens da base DRIVE. . . . . . . 55

Tabela 3 – Resultado da segmentação das 20 imagens da base, utilizando a seg-

mentação do segundo observador. . . . . . . . . . . . . . . . . . . . . . 57

Tabela 4 – Comparação de performance com outros métodos de segmentação de

vasos sanguíneos - DRIVE. . . . . . . . . . . . . . . . . . . . . . . . . 58

Tabela 5 – Resultado da segmentação das 20 imagens de treinamento da base DRIVE. 59

Tabela 6 – Resultado do teste nas 20 imagens da base STARE - ground truth. . . 62

Tabela 7 – Resultado do teste nas 20 imagens da base STARE - Valentina Kouz-

netsova. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64

Tabela 8 – Comparação de performance com métodos de segmentação de vasos

sanguíneos - STARE . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65

Lista de abreviaturas e siglas

Acc Accuracy. Pg. 36

CAD Computer Aided Diagnosis. Pg. 15

CLAHE Contrast-Limited Adaptive Histogram Equalization. Pg. 41

CMY Cyan, Magenta, Yellow. Pg. 31

CMYK Cyan, Magenta, Yellow, Black. Pg. 31

DRIVE Digital Retinal Images for Vessel Extraction. Pg. 17

DM Diabetes Mellitus. Pg. 15

DO Disco Óptico. Pg. 23

ES Elemento Estruturante. Pg. 42

FN False Negative. Pg. 35

FOV Field of View. Pg. 37

FP False Positive. Pg. 35

FPR False Positive Rate. Pg. 35

H Hemorragias. Pg. 27

HSI Hue, Saturation, Intensity. Pg. 31

MA Microaneurisma. Pg. 15

NV Neovascularização. Pg. 27

PPV Positive Predictive Value. Pg. 36

RD Retinopatia Diabética. Pg. 26

RDNP Retinopatia Diabética não Proliferativa. Pg. 27

RDP Retinopatia Diabética Proliferativa. Pg. 27

RGB Red, Green, Blue. Pg. 31

ROP Retinopatia da Prematuridade. Pg. 27

SN Sensitivity. Pg. 36

SP Especificity. Pg. 36

STARE STructured Analysis of the Retina. Pg. 17

TN True Negative. Pg. 35

TP True Positive. Pg. 35

TPR True Positive Rate. Pg. 35

WHO World Health Organization. Pg. 35

Lista de símbolos

◦ Abertura Morfológica.

⊕ Dilatação.

⊖ Erosão.

R© Marca Registrada.

Sumário

1 INTRODUÇÃO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

1.1 Justificativa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

1.2 Objetivo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

1.2.1 Objetivos Específicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

1.3 Estrutura do Trabalho . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

2 ESTADO DA ARTE . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

2.1 Trabalhos sobre detecção de vasos sanguíneos . . . . . . . . . . . . . 20

2.1.1 Método de DUA; KANDIRAJU; THOMPSON (2005) . . . . . . . . . . . . 20

2.1.2 Método de MENDONÇA; CAMPILHO (2006) . . . . . . . . . . . . . . . . 20

2.1.3 Método de SOARES et al. (2006) . . . . . . . . . . . . . . . . . . . . . . 20

2.1.4 Método de AKRAM; KHAN (2013) . . . . . . . . . . . . . . . . . . . . . 21

2.1.5 Método de TAGORE et al. (2013) . . . . . . . . . . . . . . . . . . . . . . 21

2.1.6 Método de FRANKLIN; RAJAN (2014) . . . . . . . . . . . . . . . . . . . 21

2.1.7 Método de ASLANI; SARNEL (2016) . . . . . . . . . . . . . . . . . . . . 21

2.1.8 Método de SHAH et al. (2017) . . . . . . . . . . . . . . . . . . . . . . . . 22

3 CONCEITOS DE OFTALMOLOGIA . . . . . . . . . . . . . . . . . . 23

3.1 Estruturas do Olho Humano . . . . . . . . . . . . . . . . . . . . . . . 23

3.2 Exame de Fundo de Olho . . . . . . . . . . . . . . . . . . . . . . . . . 25

3.3 Retinopatia Diabética . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

4 CONCEITOS TEÓRICOS GERAIS . . . . . . . . . . . . . . . . . . . 30

4.1 Conceitos de Processamento Digital de Imagens . . . . . . . . . . . 30

4.2 Modelos de Cores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32

4.2.1 Modelo de cores RGB . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32

4.2.2 Modelo de cores CMY e CMYK . . . . . . . . . . . . . . . . . . . . . . . 34

4.2.3 Modelo de cores HSI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

4.3 Métricas de Avaliação do Algoritmo de Segmentação de Imagens . 35

4.3.1 Métricas de Avaliação . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

5 MATERIAIS E MÉTODOS . . . . . . . . . . . . . . . . . . . . . . . 38

5.1 Bases de Imagens . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

5.1.1 DRIVE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

5.1.2 STARE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39

5.2 Método de Segmentação dos Vasos Sanguíneos . . . . . . . . . . . . 40

6 DISCUSSÃO E RESULTADOS . . . . . . . . . . . . . . . . . . . . . 52

6.1 Discussão e resultados - DRIVE . . . . . . . . . . . . . . . . . . . . . 52

6.2 Discussão e resultados - STARE . . . . . . . . . . . . . . . . . . . . . 60

7 CONCLUSÃO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66

7.1 Sugestão de Trabalhos Futuros . . . . . . . . . . . . . . . . . . . . . . 66

7.2 Publicações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67

REFERÊNCIAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68

16

1 INTRODUÇÃO

Com o avanço da tecnologia, houve uma melhoria na aquisição e no processamento

de imagens digitais, possibilitando a extração de informação a partir de imagens médicas

que antes não era possível. Isso motivou a pesquisa e o desenvolvimento de sistemas de

Diagnostico Auxiliado por Computador (CAD-Computer Aided Diagnosis), que auxiliam

os médicos no tratamento de doenças. Este auxílio se dá através da medição de estruturas,

fazendo comparação sequencial de imagens, e prevenindo erros cometidos por trabalho

humano repetitivo, fazendo com que o médico diagnostique alguma doença com maior

precisão, planejando com maior eficiência o tratamento do paciente (MELO, 2014).

Na oftalmologia, as retinografias digitais podem fornecer informações sobre algumas

doenças oculares, estas podem ser apenas doenças locais, ou podem ser indícios de doenças

sistemáticas como a hipertensão ou Diabetes Mellitus (DM). Cada vez mais se utiliza

técnicas de processamento de imagens, como a segmentação de estruturas da retina para

detecção de Retinopatia Diabética (RD). A RD é uma complicação do DM, que é a maior

causadora de redução de visão, ou até mesmo cegueira em diabéticos. Trata-se de uma

doença assintomática que durante a fase inicial é de difícil identificação, provoca alterações

nos vasos sanguíneos da retina e causa inchaços nos capilares, inchaço denominado de

microaneurisma (MA) (MELO, 2014).

Detectando-se a RD em sua fase inicial e executando um tratamento precoce,

menores serão as chances do paciente diabético reduzir ou perder a visão completamente.

O diagnóstico é feito por um médico oftalmologista, por meio de exame visual clínico. A

precisão do diagnóstico depende de vários fatores, principalmente tais como: a qualidade

da retinografia, a habilidade e experiência do médico que realiza o exame (MELO, 2014).

Os sistemas CAD contribuirão para uma maior precisão de diagnóstico, reduzindo erros

humanos, e detectando os possíveis indícios de RD.

O processo de segmentação subdivide a imagem em partes de interesse, podendo ser

objetos ou regiões que compõem a imagem. Ou seja, a segmentação consiste em segmentar,

parcelar a imagem até o momento em que o objeto ou região de interesse seja localizado,

satisfazendo o critério determinado pela aplicação. A segmentação se torna mais complexa

a partir do momento que necessita-se de maior precisão. A maioria dos algoritmos de

segmentação se baseiam em valores de intensidade, e são divididos em duas categorias: na

primeira os algoritmos segmentam a partir da detecção de descontinuidades, mudanças

bruscas de intensidade, e na segunda categoria segmentam imagens em regiões a partir de

critérios de similaridade predefinidos (GONZALEZ; WOODS, 2010).

Capítulo 1. INTRODUÇÃO 17

1.1 Justificativa

A World Health Organization (WHO) - Organização Mundial da Saúde, classifica a

função visual em quatro níveis sendo: visão normal, deficiência visual moderada, deficiência

visual grave e cegueira. A deficiência visual moderada, com a deficiência visual grave

agrupadas, são denominadas pelo termo baixa visão. Todas as deficiências visuais são

representadas pela baixa visão e a cegueira. Estima-se que existem 285 milhões de pessoas

com deficiência visual em todo mundo, uma parcela de 39 milhões do total são cegos, e

outra parcela de 246 milhões têm baixa visão. Sendo que, 80% das deficiências visuais

podem ser evitadas ou curadas (WHO, 2014).

Uma solução viável e de baixo custo para o tratamento destes pacientes é o

diagnóstico realizado utilizando processamento digital de imagens, que pode ser executado

com eficiência e precisão. Utilizando processamento de imagens, são feitas uma série de

operações com a imagem, que são dividas em etapas, sendo que a principal etapa é a

segmentação da imagem que, como foi dito anteriormente, consiste em dividir a imagem

até localizar a região ou objeto de interesse. Diversas doenças em oftalmologia podem

ser segmentadas, podendo ser feito um diagnóstico automático ou semiautomático (que

exige a validação de um especialista em oftalmologia). Alguns exemplos destas doenças

são: degeneração macular relacionada a idade, glaucoma, retinopatia diabética, retinopatia

da prematuridade, e catarata (GUO et al., 2015).

Pacientes com diabetes requerem uma maior atenção, pois uma das suas principais

complicações é a RD, podendo causar cegueira caso não seja realizado um tratamento

adequado. Após os 20 anos de idade, 99% dos pacientes que possuem diabetes tipo 1, e

60% dos pacientes que possuem diabetes do tipo 2, possuem algum grau de retinopatia

diabética (HENDRICK; GIBSON; KULSHRESHTHA, 2015). Assim, é recomendado a

estes pacientes que realizem exames de fundo de olho pelo menos uma vez ao ano. Devido

a isso, e ao fato de que a quantidade de pessoas com diabetes cresce vertiginosamente, a

demanda por este exame de fundo de olho é crescente (KÖSE et al., 2012). Em grande

parte dos países os exames realizados para diagnosticar RD, são feitos de forma manual

(ZAKI et al., 2016). Uma vez detectada a RD, o tratamento é feito com laser ou injeção de

medicamentos no olho afetado, sendo que estes tratamentos não deixam nenhuma sequela.

É importante ressaltar que, além da diabetes, outras doenças necessitam acom-

panhamento por meio de retinografias. A análise manual das retinografias, requer um

especialista em oftalmologia treinado para analisar um grande número de retinografia. O

baixo contraste dos sinais causados pelas doenças dificulta a diferenciação entre objetos na

imagem e os sinais da doença. Isto compromete a eficiência da segmentação manual feita

por especialista e provoca erros durante a operação (KÖSE et al., 2012). Devido a isto,

utilizar às técnicas de processamento de imagens para criação um processo automático ou

semiautomático de análise, pode ser uma alternativa com maior confiabilidade em relação


à análise manual.

1.2 Objetivo

Os vasos sanguíneos presentes na retina são uma das estruturas mais importantes,

pois fornecem sangue para a retina além de transmitirem sinais da retina para o cérebro

(FRANKLIN; RAJAN, 2014).

Mudanças causadas nestes vasos sanguíneos servem como marcadores biológicos,

que podem ser utilizados para detectar algum tipo de doença como a retinopatia diabética.

As mudanças nos vasos podem ser: no formato, largura, tortuosidade, padrão de ramificação

(FRANKLIN; RAJAN, 2014).

Uma vez que a retinopatia diabética se manifesta de forma a provocar alterações

nos vasos sanguíneos, para se criar um método automático de detecção de retinopatia faz

se necessário a detecção automática dos vasos sanguíneos como forma de pré-processar

a imagem de fundo de olho antes de realizar a detecção automática de microaneurisma

e hemorragias causadas pela retinopatia diabética. Conhecendo a localização dos vasos,

estas localizações podem ser usadas para diminuir a taxa de falso positivos em relação a

detecção de microaneurismas e hemorragias (AQUINO, 2011).

A detecção dos vasos sanguíneos pode ser útil para outros fins clínicos como:

avaliação da retinopatia da prematuridade (HENEGHAN et al., 2002), estreitamento

arteriolar (HATANAKA et al., 2004), tortuosidade dos vasos para caracterização da

retinopatia hipertensiva (FORACCHIA; GRISAN; RUGGERI, 2001), medição do diâmetro

dos vasos sanguíneos para diagnosticar hipertensão e doenças cardiovasculares (LOWELL

et al., 2004),e cirurgia a laser assistida por computador (BACKER et al., 1998).

Portanto, o objetivo geral desse trabalho é estudar e implementar técnicas de

segmentação de vasos sanguíneos em imagem de fundo de olho presentes na literatura,

utilizando os banco públicos de imagens: Digital Retinal Images for Vessel Extraction

(DRIVE) (STAAL et al., 2004) e STructured Analysis of the Retina (STARE) (HOOVER,

2000). Visa-se automatizar a detecção dos vasos sanguíneos, podendo ser utilizado em

aplicações futuras para auxiliar a detecção automática da RD.

1.2.1 Objetivos Específicos

Para cumprir o objetivo desse trabalho algumas tarefas devem ser realizadas:

• Obter as imagens das bases públicas DRIVE e STARE .

• Compreender e descrever as características das imagens de fundo de olho.


• Estudar e implementar técnicas de pré-processamento das imagens de fundo de olho

visando melhorar a eficiência da detecção dos vasos sanguíneos.

• Estudar técnicas para a segmentação de vasos sanguíneos em imagens de fundo de

olho;

• Testar e garantir a confiabilidade do algoritmo implementado, utilizando métricas

que atestam a qualidade do método de segmentação aplicado pelo algoritmo.

• Comparar os resultados de performance do algoritmo com outros trabalhos publica-

dos.

1.3 Estrutura do Trabalho

Este trabalho foi dividido em cinco capítulos, os próximos quatro capítulos são

descritos abaixo:

Capítulo 2 Aborda alguns trabalhos feitos sobre métodos de segmentação de vasos

sanguíneos.

Capítulo 3 Fornece o conhecimento básico necessário sobre oftalmologia, para que o

leitor possa entender o trabalho com clareza.

Capítulo 4 Aborda conceitos básicos sobre processamento digital de imagens, e métricas

usadas para avaliar métodos de segmentação utilizados em algoritmos.

Capítulo 5 Descreve as bases públicas de imagens de fundo de olho utilizadas, e explica

o algoritmo de segmentação implementado e aplicado nas bases de imagens.

Capítulo 6 Mostra os resultados da performance do algoritmo de segmentação ao aplicá-lo

nas duas bases de imagens.

Capítulo 7 Conclusão do trabalho.

20

2 ESTADO DA ARTE

2.1 Trabalhos sobre detecção de vasos sanguíneos

Neste capítulo será abordado trabalhos desenvolvidos com o objetivo de realizar a

detecção dos vasos sanguíneos presentes em imagens da retina.

2.1.1 Método de DUA; KANDIRAJU; THOMPSON (2005)

DUA; KANDIRAJU; THOMPSON (2005) desenvolveram uma técnica para a

detecção de vasos sanguíneos, que se baseia em uma decomposição recursiva de regiões

utilizando Quadtrees que são estruturas de dados espaciais usada para representar uma

região e posteriormente uma filtragem de bordas. A técnica criada pelos autores fornece

informações sobre os vasos sanguíneos da retina, informações que são úteis para a detecção

de anomalias nos vasos sanguíneos e assim detectar precocemente Retinopatia Diabética.

2.1.2 Método de MENDONÇA; CAMPILHO (2006)

MENDONÇA; CAMPILHO (2006), o algoritmo desenvolvido inicia os passos de

segmentação dos vasos sanguíneos extraindo as linhas centrais dos vasos, esta linhas

são utilizadas com linhas guias para completar as fases dos vasos. As saídas de quatro

operadores diferenciais direcionais são processadas para selecionar conjuntos de pontos

candidatos conectados e assim serem classificados como pixels de linha central usando

recursos provenientes das características dos vasos. A segmentação dos vasos ocorre

utilizando uma método iterativo de região de crescimento que integra o conteúdo de várias

imagens binárias resultantes de filtros morfológicos que dependem da largura do vasos

sanguíneos. O algoritmo foi testado em ambas base públicas de imagens DRIVE e STARE

e obteve-se bons resultados.

2.1.3 Método de SOARES et al. (2006)

SOARES et al. (2006) criaram um método que classificam os pixels da imagem de

fundo de olho como sendo ou não vasos sanguíneos, esta classificação é baseada em um

vetores de características. Os vetores de características são composto pelas intensidade

dos pixels e pela repostas bidimensionais criadas a partir transformadas wavelet de Gabor

aplicando múltiplas escalas. A utilização da transformada de wavelet de Gabor permite

detectar frequências específicas, filtra-las, e melhorar o contraste dos vasos sanguíneos. Os

autores utilizaram um classificador Bayesiano com funções de densidade de probabilidade

Capítulo 2. ESTADO DA ARTE 21

condicionais de classe que produz uma classificação rápida, estas distribuições de probabi-

lidade são estimadas a partir dos pixels marcados na segmentação manual das bases de

imagens.

2.1.4 Método de AKRAM; KHAN (2013)

AKRAM; KHAN (2013) propuseram um metodo que utiliza Gabor Wavelet 2D,

pois melhora o contraste de estruturas direcionais e aplica uma técnica de limiar multi-

camada que aumenta a precisão na segmentação dos vasos sanguíneos. A técnica proposta

pelos autores funciona muito bem, mesmo se imagem apresentar grandes variações de

iluminação, o método segmenta até os vasos sanguíneos mais finos. O método foi testado

em duas bases de imagens de fundo de olho públicas sendo elas, DRIVE e STARE.

2.1.5 Método de TAGORE et al. (2013)

TAGORE et al. (2013) desenvolveram um método automático de segmentação que

o utiliza os canais vermelho e verde da mesma imagem do fundo de olho para corrigir

a não-uniformidade da iluminação da imagem de fundo de olho. Feito isto utilizaram

Phase Congruency para melhorar o contraste dos vasos sanguíneos. Após o aumento de

contraste dos vasos sanguíneos, estes são segmentados utlizando Hierarchical Clustering

que se baseia em um Histogram Thresholding.

2.1.6 Método de FRANKLIN; RAJAN (2014)

FRANKLIN; RAJAN (2014) desenvolveram um método que classifica os pixels da

imagem de fundo de olho como sendo vasos sanguíneos ou não vasos, e assim segmenta

os vasos sanguíneos na retina. A tarefa de classificar como vasos ou não vasos feito por

uma rede neural Multilayer perceptron as entradas desta rede neural são derivadas das três

camadas RGB, vermelho, verde e azul. O algoritmo Back propagation empregado, pois

fornece uma técnica eficiente de mudança de pesos na rede neural utilizando realimentação.

2.1.7 Método de ASLANI; SARNEL (2016)

ASLANI; SARNEL (2016) propuseram um método de segmentação de vasos san-

guíneos que combina um conjunto robusto de características provenientes de diferentes

algoritmos em um vetor hibrido que possui características utilizadas para a caracterização

de pixels. Este vetor de características é resultado da reposta de 13 filtros Gabor com

diferentes configurações, como intensidade de aumento de contraste, intensidade transfor-

mada Top-Hat, medidas de vasos sanguíneos da retina, e a reposta do filtro B- COSFIRE.

Escolheram um classificador chamado de Random Forest, que foi treinado com o vetor de

características híbrido. Este classificador foi escolhido devido sua simplicidade, velocidade

Capítulo 2. ESTADO DA ARTE 22

de execução e capacidade de fusão de informações. A combinação escolhida dos diferentes

tipos de características resulta em informações que permite melhor discriminação para

pixels de vasos e não-vasos em imagens retina.

2.1.8 Método de SHAH et al. (2017)

SHAH et al. (2017) propuseram um método para segmentação de vasos sanguíneos

baseado em um detector de características Hessiano. A partir de uma base pública de

imagens de fundo de olho RGB (DRIVE). A partir da imagens de fundo de RGB, o método

proposto converte esta para escala de cinza, para melhorar o contraste dos objetos escuros

na imagem como os vasos sanguíneos, realiza-se um produto ponto-a-ponto entre a imagem

em escala de cinza e ela mesma e para retificar o contraste dos objetos escuros utilizou-se um

filtro janela 5x5 para cada pixel. Este método extrair um total de 24 características baseado

em 5 regiões de características, uma de intensidade e duas características Hessian por

escala, onde se utiliza 9 escalas. Um Linear Minimum Squared Error (LMSE) foi utilizado

para classificar os pixels como vasos sanguíneos e em não vasos, as 20 imagens especificas

para treinamento do banco de imagens DRIVE foram utilizadas para o treinamento do

LMSE, e o restante das imagens foram utilizadas para teste.

23

3 CONCEITOS DE OFTALMOLOGIA

3.1 Estruturas do Olho Humano

O olho humano possui um sistema muito sofisticado que se adapta conforme a

luminosidade do ambiente e conforme o foco, podendo privilegiar o ambiente como um

todo ou focar em um objeto de interesse. As principais estruturas do olho são: a córnea, o

cristalino, a íris, a pupila, a retina, a fóvea, o disco óptico, os vasos sanguíneos e o nervo

óptico. Estas estruturas são mostradas na figura 1.

Figura 1 – Olho Humano.

Fonte: Adaptado de Bionic Vision1

Na parte externa do olho encontram-se: a córnea, parte branca do olho, e a esclera

que é a camada transparente que recobre a íris. O coróide é localizado em uma parte

intermediária, e tem a função de realizar a nutrição do olho, o corpo ciliar é responsável por

produzir humor vítreo que é o gel que preenche a cavidade interna do olho, e é responsável

também por regular a convexidade do cristalino, a íris tem função de proteger a retina e

dar cor aos olhos (DORION, 2002). A pupila localiza-se na íris, e tem função semelhante

a um diafragma abrindo e fechando dependendo da luminosidade do ambiente. O humor

aquoso fica armazenado entre a córnea e o cristalino, e se renova constantemente.

A formação da imagem no olho é um pouco diferente da formação de uma imagem

em uma câmera fotográfica comum. Na câmera a distância focal é fixa, e a focalização do

objeto é obtida variando a distância entre a lente e o plano-imagem, como um chip de

captura de imagem que é o caso de uma câmera digital. No olho a formação de imagem1 Disponível em: acessado em jun. 2017.

Capítulo 3. CONCEITOS DE OFTALMOLOGIA 24

ocorre de forma oposta: a distância entre a lente e o plano-imagem, respectivamente

cristalino e retina, é fixa, a distância focal adequada para focalizar o objeto é obtida

variando o cristalino, que funciona semelhante a uma lente flexível. Esta variação do

cristalino é promovida por fibras zonulares, que achatam o cristalino para focalizar objetos

distantes, ou alongam este para focalizar objetos próximos. A distância ao longo do eixo

visual entre o centro do cristalino e a retina é aproximadamente 17 mm, já a distância

focal varia de 14 mm a 17 mm, a distância focal de 17 mm ocorre quando o olho está

relaxado e focado em distâncias maiores do que cerca 3 m (GONZALEZ; WOODS, 2010).

A imagem produzida sobre a retina é focalizada principalmente na área da fóvea, a

percepção, ocorre pela excitação dos receptores de luz, que transformam a energia radiante

em impulsos elétricos, os quais posteriormente são decodificados pelo cérebro (GONZALEZ;

WOODS, 2010). A figura 2 exemplifica a formação da imagem no olho humano.

Figura 2 – Formação da imagem no olho humano.

Fonte: Bionic Vision2

A figura 3 mostra uma imagem de fundo de olho, onde pode-se identificar algumas

estruturas importantes como:

• Disco óptico (DO): é a parte do nervo óptico vista no fundo dos olhos, tem uma

estrutura circular de diâmetro médio 1,5 mm, com tonalidade esbranquiçada e bordas

bem definidas. Como o disco óptico não possui células sensíveis à luz, ele corresponde

ao ponto cego da visão humana, é imperceptível ao ser humano, pois o cérebro utiliza

a informação do outro para cobrir este ponto cego (MELO, 2014).

• Mácula: é uma área circular da retina com diâmetro de 0,22 mm, apresenta uma

área com tonalidade mais escura se comparado com o restante do fundo ocular.

A mácula é a parte de maior importância do fundo ocular, pois é área de maior

sensibilidade visual para percepção de detalhes (MELO, 2014).2 Disponível em: acessado em jun. 2017.


• Fóvea: é uma depressão com aproximadamente 0.10 mm de diâmetro e está localizada

no centro da mácula, concentra grande parte das células fotorreceptoras (MELO,

2014).

• Vasos Sanguíneos: Os vasos sanguíneos presente na retina ramificam do disco

óptico para a periferia. A artéria central da retina penetra no globo ocular através

do disco óptico, esta artéria tem um diâmetro pequeno de 0.1 mm. As artérias se

apresentam com um vermelho mais intenso e com um diâmetro menor em relação às

veias, enquanto as veias se apresentam com um vermelho escuro (MELO, 2014).

Figura 3 – Imagem de fundo de olho saudável.

Fonte: Adaptado por (MELO, 2014) de (STAAL et al., 2004).

3.2 Exame de Fundo de Olho

O exame do fundo de olho é uma prática muito importante feita em consultório

médico oftalmologista, um vez que existe várias doenças que causam problemas na retina.

Um dos métodos para realizar este exame é a oftalmoscopia direta, o especialista utiliza

um oftalmoscópio3para examinar, e assim avaliar o disco óptico, os vasos sanguíneos e

as outras estruturas no fundo ocular. Para realizar este tipo de exame, o ambiente deve

ter baixa iluminação, e tem a necessidade de dilatar a pupila do paciente com colírios

específicos (DORION, 2002), (CARDOSO, 2016).

Para análises mais criteriosas da retina é necessário utilizar métodos mais precisos

que a oftalmoscopia direta, os seguintes métodos podem ser utilizados: a angiografia

fluoresceínica, que é obtida por meio da aplicação de uma substância de contraste, a3 Aparelho criado por Hermann von Helmholtz em 1850 constituído-se de uma fonte de luz, e um espelho

que projeta a luz no olho do paciente.


Fluoresceína, na corrente sanguínea do paciente, figura 4; ou a fotografia red free do fundo

de olho. Esta fotografia exclui as ondas de espectro referente ao vermelho, figura 5; ou

então a fotografia colorida- RGB do fundo de olho que capta os espectros vermelho, verde

e azul, figura 6 (MOOKIAH et al., 2013).

Figura 4 – Angiografia fluoresceínica.

Fonte: Adaptado de Instituto de Microcirurgia Ocular4.

Figura 5 – Fotografia red free do fundo de olho com retinopatia diabética.

Fonte: Ophthalmic Photographer’s Society5.

Figura 6 – Fotografia colorida- RGB do fundo olho normal.

Fonte: Fine Eyewear6.

4 Disponível em: acessado em jun. 2017.5 Disponível em: acessado em jun. 2017.


A fotografia de fundo de olho ou também chamada de retinografia digital, é feita

utilizando um aparelho chamado de retinógrafo digital. O procedimento pode ser realizado

com dilatação da pupila (midriática), ou sem dilatação da pupila (não-midriática). A

retinografia possui uma boa resolução, rapidez no foco e na captura da imagem, realiza

controle de iluminação, e utiliza filtros para remoção de algum espectro (por exemplo:

do vermelho), realiza angulação correta que varia de 30◦ a 45◦, e o aparelho tem uma

boa operabilidade (CARDOSO, 2016). Exemplo de um retinógrafo digital: TOPCON

TRC-NW8 Non-Mydriatic Retinal Câmera, este modelo possui uma câmera traseira com

resolução de 16.2 Megapixel com um campo de visão de 45◦, figura 7.

Figura 7 – Retinógrafo digital. TOPCON, modelo: TRC-NW8 Non-Mydriatic RetinalCamera.

Fonte: TOPCON 7.

3.3 Retinopatia Diabética

A Retinopatia Diabética (RD) é uma doença resultante de lesões na retina causadas

pela doença Diabetes Mellitus, a RD nas fases iniciais é assintomática, tem por característica

a presença de microaneurismas (DORION, 2002), que são alterações vasculares na retina

resultante de inchaços dos capilares, causados geralmente pela neovascularização, que em

imagens de fundo de olho são visto como pequenos pontos vermelhos, figura 8 (CARDOSO,

2016)(MELO, 2014).6 Disponível em: acessado em jun. 2017.7 Disponível em: acessado em jun. 2017.


Figura 8 – Microaneurisma.

Fonte: Adaptado de (MOOKIAH et al., 2013).

A neovascularização (NV) produz sintomas como visão turva, distorção de linhas

retas e extremidades de objeto, e pontos difusos, devido o desenvolvimento de novos

vasos em alguns lugares da retina, exceto no disco óptico. A NV não é causada somente

pela RD, outras doenças também causam este tipo de problema como: retinopatia da

prematuridade (ROP)8, anemia da célula falciforme, hemoglobinopatias, beta-talassemia,

doença de Eales, síndromes de hiperviscosidade, leucemia, degeneração macular disciforme,

vitreorretinopatia familiar exsudativa, toxoplasmose, sarcoidose, histoplasmose, miopia,

estrias angióides, melanoma coróide, ruptura coróide, toxemia da gravidez, esclerose

múltipla, e também em algumas condições como o uso de drogas IV, ou a complicação de

fotocoagulação a laser e fatores angiogênicos também podem causar NV (DORION, 2002).

O surgimento de pontos com NV pode ocorre na superfície da retina, abaixo da

retina, ou na coróide. Quando a neovascularização ocorre na superfície e abaixo retina, o

paciente desenvolveu a Retinopatia Diabética não Proliferativa (RDNP), quando ocorre

na coróide o caso é de Retinopatia Diabética Proliferativa (RDP) (CARDOSO, 2016).

A evolução da DR passa por diferentes estágios, inicialmente o paciente não tem

nenhuma alteração na qualidade visual, do mesmo modo, a imagem do fundo de olho sofre

poucas alterações, com o tempo surgem outros sinais como: a neovascularização, os MAs,

as hemorragias (H) aumentam e surgem os exsudatos moles que se solidificam e ficam

duros, estes sinais são mostrados na figura 9. O paciente com DR, aos pouco observará

pioras na qualidade da visão, podendo ter melhoras caso haja absorção dos exsudatos e

hemorragias (HENDRICK; GIBSON; KULSHRESHTHA, 2015).

8 É alteração no crescimento da retina, que está indiretamente ligada à idade gestacional e ao peso doprematuro (OFTALMOPEDIATRIA, 2017).


Figura 9 – Sinais da Retinopatia diabética.

Fonte: Adaptado de (ZAKI et al., 2016).

As hemorragias podem ser: pré-retinianas, normalmente volumosas com formato

arredondado e não provenientes da RD; intra-retinianas são lesões que variam a cor do

vermelho ao cinza escuro e são originadas de vazamentos dos vasos capilares, possuem

formato irregular com margem definida; vítreas, ocorrem na cavidade vítrea e obscurecem

a visão, estas hemorragias desaparecem em torno de 3 a 4 meses. Os exsudatos duros são

depósitos lipoprotéicos com coloração amarela-esbranquiçada, possuem aspecto brilhante

com margens bem delimitadas, e se localizam no polo posterior, próximo ou em volta da

mácula, alguns exsudatos dispersam em de 3 a 4 meses, outros permanecem durante muitos

anos (DORION, 2002), (CARDOSO, 2016) e (HENDRICK; GIBSON; KULSHRESHTHA,

2015).

30

4 CONCEITOS TEÓRICOS GERAIS

4.1 Conceitos de Processamento Digital de Imagens

O processamento digital de imagens consiste em manipular imagens digitais, imagens

que possuem valores de intensidade finitos, em um hardware digital como por exemplo um

computador. A imagem digital é uma função bidimensional representada por f(x, y) onde

x e y são coordenadas espaciais em um plano, f é a amplitude ou também chamada de

intensidade de cinza ou nível de cinza, em um ponto da imagem. Este ponto é localizado

no plano pelas coordenadas (x, y), devido ao fato que a intensidade assume valores finitos,

como falado anteriormente, a imagem então é caracterizada como sendo uma imagem

digital (GONZALEZ; WOODS, 2010).

Alguns passos são seguidos para se realizar o processamento de uma imagem digital

como a aquisição, pré-processamento, segmentação, obtenção de características, e por fim

o reconhecimento, estes passos são representados na figura 10 . A aquisição da imagem

é realizada por dispositivos que são vinculados a alguma aplicação como por exemplo:

câmera digital, digitalizador de imagens ou um retinógrafo digital (GONZALEZ; WOODS,

2010).

Na etapa pré-processamento da imagem, normalmente são aplicadas técnicas

como: filtragem para remoção de ruídos, realce que consiste em manipular de forma

subjetiva a imagem partindo da preferência humana, restauração que é uma manipulação

objetiva da imagem aplicando técnicas que se baseiam em modelos matemáticos. Já a

etapa de segmentação consiste em dividir a imagem nos objetos que a constituem. A

etapa da obtenção de características consiste na adoção de um sistema que represente

às características que se deseja buscar e descreva suas informações. A etapa final do

processamento digital de imagens, o reconhecimento é um processo que consiste em

atribuir rótulo a um determinado objeto com base na descrição dele, por exemplo: é

reconhecido como microaneurisma, pois tem formato circular são vermelhos e aparecem

isolados na imagem (GONZALEZ; WOODS, 2010).

Capítulo 4. CONCEITOS TEÓRICOS GERAIS 31

Figura 10 – Etapas para a realização do processamento de imagens.

Fonte: Adaptado de (GONZALEZ; WOODS, 2010).

Os sistemas utilizados para o processamento digital de imagens, se dividem basica-

mente em, (GONZALEZ; WOODS, 2010):

• sistemas de sensoriamento, cuja a função é a aquisição da imagem digital;

• hardware especializado em realizar operações lógicas e aritméticas em paralelo, é

utilizado para realizar operações matemáticas, a característica deste hardware é

realizar cálculos em alta velocidade;

• software de processamento de imagens consiste em módulos especializados em realizar

determinadas funções no processamento da imagem;

• sistema de armazenamento, este sistema é fundamental para o armazenamento das

imagens antes e depois de serem processadas;

• sistema de vídeo, que são monitores à cores que em conjunto das placas de vídeo

são utilizados para apresentar ao usuário do sistema de processamento às imagens

adquiridas e processadas, em alguns casos substitui o monitor e se utiliza um capacete

que possibilita a visualização estereoscópica (3-D) de algumas imagens, ele possui

dois pequenos monitores acoplados a um óculos;


• sistemas de registo de imagens como impressoras, filmes fotográficos e mídias digitais.

4.2 Modelos de Cores

A técnicas de processamento digital de imagens são aplicadas em imagens com

escala de cinza ou em imagens coloridas, estas imagens são tratadas como matrizes. Para

as imagens coloridas existem alguns modelos principais de cores como: RGB (red, green,

blue), CMY (cyan, magenta, yellow), CMYK (cyan, magenta, yellow, black) e o HSI ( hue,

saturation, intensity). Modelo de cores pode ser definido como sendo "uma especificação

de um sistema de coordenadas e um subespaço dentro desse sistema no qual cada cor é

representada por um único ponto "(GONZALEZ; WOODS, 2010, p. 264).

Cada modelo citado no paragrafo acima é utilizado para um tipo de aplicação com

exceção do modelo HSI. O modelo RGB é utilizado em monitores coloridos e câmeras

de vídeo, os modelos CMY e CMYK são aplicados em impressoras que fazem impressão

colorida, já o HSI é um modelo que representa a forma como os humanos realizam a

descrição e interpretação das cores, este modelo tem a vantagem de separar as informações

referentes a cor das informações de escala de cinza (GONZALEZ; WOODS, 2010).

4.2.1 Modelo de cores RGB

No modelo RGB, figura 11, também chamado de sistema de cores aditivo, é formado

pela junção das cores primárias vermelho, verde e azul decompostas a partir da luz branca.

Este modelo tem como base um sistema de coordenadas cartesiana, possuindo um cubo

como subespaço, como mostrado na figura 12. As cores primárias vermelho, verde e azul

estão localizados sobre três vértices, e as cores secundárias que se localizam no vértice

oposto a elas são respectivamente ciano, magenta e amarelo, o preto se localiza no origem

do cubo que também é a origem do plano cartesiano, o branco esta localizado no vértice

oposto a origem, o segmento de reta que vai da cor preta até a cor branca, este segmento e

denominado escala de cinza, sobre ele os valores de R, G e B são iguais (ILUMINCAçãO,

2004) (GONZALEZ; WOODS, 2010).


Figura 11 – Sistema de cores Aditivo.

Fonte: Adaptado de Developer Apple1.

Figura 12 – Cubo RGB.

Fonte: Digital Image Fundamentals2.

Imagens que utilizam o modelo de cores RGB possuem três canais, que são três

imagens, sendo que é um canal ou imagem para cada cor primária, estas imagens quando

projetadas em um monitor se juntam para formar uma única imagem de cores compostas,

como é exemplificado na figura 13 (GONZALEZ; WOODS, 2010).1 Disponível em: acessado em jul. 2017.2 Disponível em: aces-

sado em jul. 2017.


Figura 13 – Formação de uma Imagem RGB em um monitor colorido.

Fonte: (GONZALEZ; WOODS, 2010).

4.2.2 Modelo de cores CMY e CMYK

O modelo de cores CMY, figura 14, é formado pelas cores secundárias ciano,

magenta e amarelo do modelo RGB. O modelo CMY também é chamado de sistema

subtrativo, pois a mistura das cores deste modelo tendem a cor preta (ILUMINCAçãO,

2004). É utilizado por dispositivos que realizam pigmentação sobre papel como impressoras

coloridas. Já o modelo CMYK surgiu quando se observou que ao somar todas cores base

do modelo CMY, o resultado não gerava realmente a cor preta, assim teve a necessidade

de adicionar uma quarta cor, a cor preta ao modelo CMY (GONZALEZ; WOODS, 2010).

Figura 14 – Sistema de cores Subtrativo.

Fonte: Adaptado de Developer Apple3.


4.2.3 Modelo de cores HSI

Como foi falado anteriormente o modelo de cores HSI, figura 15, descreve como os

seres humanos interpretam as cores, decompondo-as em matiz-hue, saturação e intensidade-

brilho, e não em níveis de cores primárias como é feito no RGB e CYMK. A matiz descreve

a cor pura, por exemplo: amarelo, vermelho; saturação fornece a medida do grau de diluição

na presença de luz branca, por exemplo: vermelho escuro, azul claro; e o brilho não e

possível mensurar, mas incorpora a noção de acromática da intensidade, que possibilita

descrever a sensação de cores.

Figura 15 – Modelo de cores HSI.

a) b) c) d)

a) RGB. b) Matiz. c) Saturação. d) Intensidade. Fonte: Adaptado de Wikipedia4.

4.3 Métricas de Avaliação do Algoritmo de Segmentação de Ima-

gens

Os métricas de avaliação são utilizadas para avaliar a qualidade técnica aplicada no

algoritmo que realiza segmentação. A melhor maneira de avaliar o algoritmo é comparar os

resultados da segmentação realizada por este, com os resultados da segmentação realizada

por especialistas (MARTIN et al., 2001).

A algumas bases de imagens de fundo de olho fornecem uma máscara com a

segmentação realizada por especialistas. Esta segmentação feita por especialistas em

oftalmologia, utilizada para avaliar a qualidade da segmentação realizada pelo algoritmo é

denominada de ground truth, se for feita por mais de um especialista pode ser denominada

também de "padrão ouro "(CARDOSO, 2016). Tanto a base de imagens DRIVE quanto

a STARE, que serão utilizadas no trabalho fornecem ground truth dos vasos sanguíneos

presentes nas imagens de fundo de olho.3 Disponível em: acessado em jul. 2017.4 Disponível em: acessado em jul. 2017.


4.3.1 Métricas de Avaliação

Após a realização da segmentação da imagem, algumas métricas podem ser de-

finidas para avaliar a qualidade da segmentação, métricas como: precisão, sensibilidade,

especificidade, entre outras. Tais métricas de avaliação são próprias para realizar avalia-

ções sobre a segmentação feita pelo algoritmo, estas métricas produzem resultados que

quantificam a performance do método aplicado no algoritmo. A segmentação gerada pelo

algoritmo deve ser tão boa quanto as segmentações manuais feitas pelos especialistas, as

quais são consideradas como "corretas"(CARDOSO, 2016).

Na tabela 1, SALEH; ESWARAN; MUEEN (2011), PURUSHARTHI; KURHADE

(2014) e MITTAPALLI; KANDE (2016) definem avaliações para o conjunto de pixels

segmentados que possivelmente pertence ao objeto alvo, no caso deste trabalho, os vasos

sanguíneos.

Tabela 1 – Avaliação para o conjunto de pixels segmentados.

Classificação Descrição

TP (True Positive)Conjunto de pixels identificados corretamente como o objeto alvo,tanto na imagem segmentada quanto no ground truth.

TN (True Negative)Conjunto de pixels identificado como não sendo o objeto alvo, tantona imagem segmentada quanto no ground truth.

FP (False Positive)Conjunto de pixels identificado como sendo o objeto alvo na imagemsegmentada, mas no ground truth este conjunto de pixels nãorepresenta o objeto alvo.

FN (False Negative)Conjunto de pixels identificado como não sendo o objeto alvo naimagem segmentada, mas no ground truth este conjunto de pixelsrepresenta o objeto alvo.

Dois conjuntos são definidos a partir da segmentação manual feito pelos especialistas,

ground truth, o conjunto A reúne todos os pixels pertencentes ao objeto alvo, enquanto

conjunto B reúne os pixels não pertencentes ao objeto alvo. PURUSHARTHI; KURHADE

(2014), WANG et al. (2015), MITTAPALLI; KANDE (2016) e FRANKLIN; RAJAN

(2014) propuseram as seguintes métricas para avaliação da qualidade do resultado da

segmentação:

True Positive Rate (TPR) - Taxa de verdadeiros positivos: É a fração de pixels identi-

ficados corretamente, pertencentes ao objeto alvo.

TPR =TP

A(4.1)

False Positive Rate (FPR) - Taxa de falsos positivos: É a fração de pixels identificados

erroneamente como pertencentes ao objeto alvo.


FPR =FP

B(4.2)

Sensitivity (SN) - Sensibilidade: Quantifica a capacidade do método utilizado pelo

algoritmo em identificar corretamente o objeto alvo. O cálculo pode ser feito de duas

maneiras:

SN = TPR (4.3)

ou

SN =TP

TP + FN(4.4)

Especificity (SP) - Especificidade: Quantifica a capacidade do método utilizado pelo

algoritmo em identificar os pixels não pertencentes ao objeto alvo.

SP = 1 − FPR (4.5)

ou

SP =TN

TN + FP(4.6)

Accuracy (Acc) - Precisão: É a taxa de acertos (TP e TN) do método, em relação ao

total de pixels.

Acc =TP + TN

TP + FP + FN + TN(4.7)

Positive Predictive Value (PPV) - Valor Preditivo Positivo: Representa a probabili-

dade do pixel classificado como o objeto alvo ser realmente ele mesmo.

PPV =TP

TP + FP(4.8)

38

5 MATERIAIS E MÉTODOS

Este capítulo tem o objetivo de especificar as base públicas de imagens utilizadas no

trabalho, assim como, o método implementado para a segmentação dos vasos sanguíneos

encontrado na literatura.

5.1 Bases de Imagens

5.1.1 DRIVE

A base pública de imagens de fundo olho DRIVE (STAAL et al., 2004) foi criada

para permitir a comparação dos trabalhos sobre segmentação de vasos sanguíneos da retina.

Esta base possui 40 imagens de fundo de olho que foram obtidas aleatoriamente entre 400

imagens tiradas em um programa sobre retinopatia diabética, as imagens foram tiradas de

pessoas com idade entre 25 e 90 anos. Do total de 40 imagens, 33 não possuem nenhum

sinal de RD, e as outras 7 mostram sinais de RD. A figura 16 mostra algumas imagens

pertencentes a base.

Figura 16 – Exemplos de imagens do banco DRIVE.

(a) 03_test (b) 05_test (c) 08_test (d) 19_test

Fonte: do próprio autor.

As imagens foram capturadas usando uma câmera Canon CR5 não midriática CCD

com 45◦ campo de visão ou Field Of View (FOV). Cada imagem capturada utiliza uma

compressão JPEG , utilizando 8 bits por plano de cor, e a dimensão das imagens é 768x584

pixels.

As 40 imagens foram dividas pela metade, uma metade é classificada como imagens

de teste e as outras 20 restantes são classificadas como imagens de treinamento. As imagens

de teste possuem dois manuais de segmentação de vasos sanguíneos, um deles é usado

como "padrão ouro"ou também chamando de ground truth, o outro pode ser usado para

Capítulo 5. MATERIAIS E MÉTODOS 39

comparar segmentações geradas por computador com a segmentação de um observador

humano qualquer, chamado de segundo observador. Para as imagens de treinamento existe

um manual de segmentação dos vasos sanguíneos. Todos os manuais de segmentação desta

base foram criados por um oftalmologistas experientes e treinados, todos marcaram com

no mínimo de 70% de certeza de ser um vaso sanguíneo.

5.1.2 STARE

STARE (HOOVER, 2000) foi um projeto iniciado em 1975 pelo Dr. Michael

Goldbaum, na Universidade da California, este projeto foi financiado pelos Institutos

Nacionais de Saúde dos EUA. As imagens e os dados clínicos foram fornecidos pelo Shiley

Eye Center da Universidade da Califórnia, e pelo Veterans Administration Medical Center

em San Diego.

O banco de imagens contém 20 imagens da retina coloridas, com 700x605 pixels e 8

bits por canal RGB, capturado por uma câmera TopCon TRV-50 a 35◦ FOV. Possui dois

manuais de segmentação de Adam Hoover e Valentina Kouznetsova. A figura 17 mostra

imagens pertencentes a base.

Figura 17 – Exemplo de imagens do banco STARE.

(a) image 0004 (b) image 0082 (c) image 0255 (d) image 0324


Adam Hoover marcou 10,4% de pixels como vaso, Valentina Kouznetsova 14,9%.

O desempenho dos algoritmos são calculados com as segmentações do Adam Hoover,

pois as segmentações dele são consideradas como o ground truth da base de imagens.

A comparação da segmentação da Valentina Kouznetsova com o ground truth dá uma

medida de desempenho de detecção que é considerada como um nível de desempenho a

ser alcançado, um nível alto de desempenho, pois a marcação dela é mais detalhada.


5.2 Método de Segmentação dos Vasos Sanguíneos

Nesta seção é explicado o método de segmentação de vasos sanguíneos que foi

implementado. Este método foi proposto por PATWARI et al. (2014) e, neste trabalho, ele

foi adaptado e aplicado nas bases de imagens DRIVE e STARE. Também serão explicados

os conceitos de processamento de imagens que não foram abordados no capítulo 4, mas

que foram empregados no método implementado.

Na figura 18 é apresentado o diagrama de blocos do método, mostrando o passo-

a-passo do método implementado no algoritmo que realiza a segmentação dos vasos

sanguíneos. O método foi dividido em doze passos que vão desde a leitura da imagem de

fundo de olho até concluir a segmentação dos vasos sanguíneos, em que o algoritmo gera a

imagem de fundo olho segmentada, apresentando os vasos sanguíneos marcados.

No método implementado a fase de pré-processamento da imagem inicia-se na etapa

2 e vai até a etapa 6 do diagrama de blocos, passando pelas seguintes etapas: Remoção do

canal verde, Complemento do canal verde, CLAHE, Abertura morfológica e Remoção do

disco óptico.

A seguir, cada etapa do diagrama de blocos será detalhada e a imagem resultante de

cada umas delas será apresentada. Conceitos novos que não foram abordados anteriormente

no trabalho serão explicados, assim que eles forem surgindo, para que o leitor tenha o

embasamento teórico para entender cada etapa do método de forma clara e simples.

O algoritmo foi implementado no software MATLAB R© que, por possuir o toolbox

de processamento de imagens, facilita o desenvolvimento de algoritmos.


Figura 18 – Diagrama do método.

1- Leitura da

Imagem RGB

2- Extração do Canal

Verde (Imagem)

3- Complemento

do Canal Verde

4- CLAHE

5- Abertura

Morfológica

6- Remoção do

Disco óptico

7- Filtro mediana

8- Remoção do

Background

9- Ajuste de contraste

10- Binarização

11- Remoção de

Objetos Espúrios

12- Detec-

ção de Bordas

13- Imagem de Saída



1. Imagem de Entrada RGB

Esta etapa é a parte inicial, o algoritmo realiza a leitura da imagem, figura 19, e

armazena em forma de matriz para que nos passos seguintes realize o processamento

da imagem. As imagens da base de imagens utilizada possuem três canais, onde cada

canal possui 8 bits por pixel.

Figura 19 – Retinografia RGB.

Fonte: (STAAL et al., 2004)

2. Extração do Canal Verde da Imagem RGB

A partir da imagem RGB armazenada na memória, neste passo realiza-se a extração

do canal verde (G) da imagem. Isto se deve ao fato de que os objetos de aspecto

avermelhado como vasos sanguíneos, hemorragias e microaneurismas se apresentam

com maior contraste no canal verde (G), se comparado com os outros dois canais da

imagem: vermelho (R) e azul (B). A imagem resultante da extração do canal verde é

apresentada na figura 20.


Figura 20 – Canal Verde.


3. Complemento do Canal Verde

Nesta etapa cria-se o complemento do canal verde, para transformar os objetos

escuros da imagem (vasos sanguíneos) em objetos claros. Esta operação foi realizada

para deixar os vasos sanguíneos mais claros e mais visíveis na imagem. O complemento

de imagem do canal verde é apresentado na figura 21.

Figura 21 – Complemento do Canal Verde.



4. CLAHE (Contrasted Limited Adaptative Histogram Equalization)

O CLAHE é um algoritmo que foi desenvolvido para realce de imagens com baixo

contraste (imagens médicas). Ele divide a imagem em pequenas regiões chamadas de

tiles e, em cada uma dessas regiões, é aplicado equalização de histograma. Feito esta

operação, um limiar de nível de cinza é criado pelo usuário, os pixels com nível de

cinza acima deste limiar são redistribuídos entre as regiões da imagem que contém

pixels com nível de cinza abaixo deste limiar, (PIZER et al., 1990). Este limiar, é

responsável por limitar a amplificação do ruído na imagem.

Nesta etapa o CLAHE foi utilizado para realçar os vasos sanguíneos presentes na

imagem complemento do canal verde. Como se pode ver na figura 22, o algoritmo

realçou os vasos sanguíneos, assim como o resto da imagem.

Figura 22 – Resultado da aplicação do CLAHE no complemento do Canal Verde.


5. Abertura Morfológica

A morfologia matemática é uma ferramenta utilizada para extrair objetos em uma

imagem, que são tratados como conjuntos. São úteis para representar ou descrever

uma dada região (GONZALEZ; WOODS, 2010).

A abertura morfológica da imagem é dada pela seguinte expressão (GONZALEZ;

WOODS, 2010):


f ◦ b = (f ⊖ b) ⊕ b (5.1)

f : Imagem.

b : Elemento Estruturante (ES).

Os elementos estruturantes são pequenas imagens, ou seja, pequenos conjuntos,

que são utilizados como "sondas"para examinar uma determinada imagem

procurando propriedades de interesse. Os elementos estruturantes em níveis

de cinza podem ser: planos, e não-planos. Os não-planos podem ser um ES

em formato de hemisfério como mostrado na figura 23a, que tem um perfil de

intensidade mostrado na figura 23c. Os planos podem ser um ES em formato de

disco figura 23b, a comprovação que este ES é plano pode ser visto pelo perfil

de intensidade na figura 23d.

Figura 23 – Exemplo de Elementos Estruturantes.

Fonte: (GONZALEZ; WOODS, 2010)

⊖ - Erosão : A erosão da imagem f por um elemento estruturante b em qualquer

posição da imagem (x, y), é calculada como sendo o valor mínimo da região

imagem que coincide com a região de b, quando a origem de b esta em (x, y). A

operação de erosão, assim como a operação de dilatação que será explicada a

seguir, é realizada de forma semelhante a operação de correlação, pois o ES faz

uma varredura na imagem. Portanto para calcular a erosão f por b, coloca-se a

origem do ES em todas as posições dos pixels da imagem. Após a operação de

erosão a imagem fica um pouco mais escura, os objetos escuros desta imagem

aumentam um pouco de tamanho, e os objetos mais claros reduzem de tamanho.

⊕ - Dilatação : A operação de dilatação é semelhante ao processo de erosão, mas

ao invés de calcular o valor minimo, calcula-se o valor máximo da região imagem

que coincide com a região de b, quando a origem de b esta em (x, y). O resultado


da dilatação é oposto ao resultado da erosão, os objetos mais claros aumentam

de tamanho, ou seja, ficam mais espessos, e os objetos mais escuros ficam com

tamanho reduzido, com detalhes mais escuros.

Após explicado os termos da expressão de abertura morfológica, pode-se ver que a

operação de abertura se resume em uma operação de erosão da imagem com o ES,

seguido por uma dilatação do resultado desta operação com o ES.

A abertura morfológica que geralmente suaviza o contorno de uma imagem, remove

pequenos detalhes claros, enquanto não alteram os níveis de cinza globais da imagem

nem os grandes objetos claros.

O objetivo de aplicar abertura morfológica nesta etapa foi eliminar os vasos sanguíneos

(apresentam-se como detalhes claros na imagem) restando o disco óptico, como objeto

principal na imagem de fundo de olho. A imagem resultante, figura 24, será utilizada

no passo seguinte para remoção do disco óptico.

Figura 24 – Imagem resultante da Abertura Morfológica.


6. Remoção do Disco Óptico

Este passo no algoritmo tem por objetivo, remover o disco óptico da imagem de fundo

de olho, restando os objetos claros, os vasos sanguíneos e outros objetos espúrios.

A remoção do disco óptico é realizada da seguinte maneira: imagem de saída do

passo 4 é subtraída pela imagem de saída do passo 5. A imagem resultante desta

subtração, sem o disco óptico, é apresentada na figura 25.


Figura 25 – Imagem resultante após a remoção do Disco Óptico.


7. Filtro Mediana

O filtro mediana é utilizado para remover ruído impulsivo da imagem. Este filtro

preserva as bordas (descontinuidade de intensidade) da imagem. A preservação destas

bordas será útil, para realizar a marcação dos vasos sanguíneos na imagem original. A

figura 26 apresenta a imagem resultante da filtragem do resultado do passo anterior,

utilizando um filtro mediana.

Figura 26 – Resultado após aplicação do Filtro Mediana.



8. Remoção do Background

Nesta etapa a extração o background da imagem resultante do passo anterior, é

realizada para evidenciar ainda mais os objetos claros em relação a imagem de fundo,

com maior riqueza de detalhes, com o objetivo principal de evidenciar os vasos

sanguíneos.

A remoção do background é realizado da seguinte maneira: aplica-se abertura mor-

fológica na imagem resultante da filtragem pelo filtro mediana, gerando assim o

background, apresentado na figura 27a ( o gráfico de intensidade de cinza é mostrado

na figura 27b). Após isto, realiza-se a subtração da imagem filtrada pelo background,

gerando assim a imagem apresenta na figura 28.

Na figura 28 percebe-se a melhoria de detalhes dos vasos sanguíneos se comparado

com a figura 26, após remover o background.

Figura 27 – Background.

(a) Background. (b) Intensidade de Cinza do Background.



Figura 28 – Resultado da remoção do Background.


9. Ajuste de Contraste

Ajuste do contrate é aplicado nesta etapa, para aumentar o contrate dos vasos

sanguíneos em relação ao resto da imagem, deixando-os mais evidentes e melhorando,

assim, a riqueza de detalhes. A imagem produzida após o ajuste de contraste é

mostrado na figura 29.

Figura 29 – Ajuste de contraste da imagem.



10. Binarização

A partir da imagem resultante do ajuste de contraste, figura 29, utiliza-se o método

de OTSU (1979) para localizar o limiar ótimo para realizar a binarização da imagem.

A ideia do método de OTSU (1979) é aproximar o histograma de uma imagem por

duas funções Gaussianas, escolhendo um limiar de forma a minimizar a variância

intra-classes, onde cada classe possui sua própria média e desvio-padrão.

A binarização é importante para definir bem os vasos (bordas) e eliminar objetos

espúrios, mas por consequência elimina também pequenos vasos, cujos os níveis de

cinza estão abaixo do limiar. A imagem resultante do processo de binarização é

mostrada na figura 30.

Figura 30 – Imagem Binária dos Vasos Sanguíneos.


11. Remoção de Objetos Espúrios

Para remoção dos objetos espúrios o algoritmo utiliza a função bwareaopen, (GONZA-

LEZ; WOODS; EDDINS, 2004). Esta função remove objetos em uma imagem binária,

sendo que, inicialmente, define o tamanho do objeto na função pela quantidade pixels.

A função varre a imagem binária e, se um objeto é localizado na imagem, e este

possui uma menor quantidade de pixels que o objeto declarado na função, então este

objeto é removido. A figura 31 mostra a imagem binária após a remoção dos objetos

espúrios.


Figura 31 – Imagem após a remoção de objetos espúrios.


12. Detecção de Bordas

A partir da imagem binária, figura 31, para realizar a marcação dos vasos na imagem

de saída o algoritmo utiliza a função bwboundaries, (GONZALEZ; WOODS;

EDDINS, 2004). Esta função detecta as bordas dos vasos sanguíneos e cria um vetor

com as localizações das bordas, para que este seja utilizado na marcação destes vasos

na imagem de saída.

13. Imagem de Saída

A figura 32 mostra a detecção dos vasos sanguíneos. A marcação dos vasos foi feita

a partir do vetor de localizações criado pela função bwboundaries.

Figura 32 – Resultado da detecção dos vasos sanguíneos.


52

6 DISCUSSÃO E RESULTADOS

Neste capítulo apresenta os resultados obtidos com o algoritmo após testá-los nas

bases de imagens DRIVE e STARE. Cada base terá uma seção própria, onde serão expostos

os resultados.

Para facilitar o entendimento dos resultados presentes em cada coluna das tabelas,

um resumo das métricas apresentados no Capítulo 4 é feito a seguir:

• (Acc) - Precisão: É a taxa de acerto do método.

• (SN) - Sensibilidade: Quantifica a capacidade do método utilizado pelo algoritmo

em identificar corretamente o objeto alvo, possui o mesmo "significado"de (TPR) -

Taxa de verdadeiros positivos.

• (FPR) - Taxa de falsos positivos: É a fração de pixels identificados erroneamente

como pertencentes ao objeto alvo.

• (SP) - Especificidade: Quantifica a capacidade do método utilizado pelo algoritmo

em identificar os pixels não pertencentes ao objeto alvo.

• (PPV) - Valor Preditivo Positivo: Representa a probabilidade do pixel classificado

como o objeto alvo ser realmente ele mesmo.

6.1 Discussão e resultados - DRIVE

A discussão dos resultados desta seção abordará os resultados obtidos com a

segmentação dos vasos sanguíneos, utilizando as imagens da base DRIVE.

A figura 33 demonstra a segmentação dos vasos sanguíneos, utilizando uma imagem

da base. A figura 33a mostra a imagem original e a 33c mostra o ground truth, que

representa a marcação dos vasos sanguíneos por especialistas, ou também chamada por

muitos autores de vessel tree. A figura 33b apresenta os vasos sanguíneos marcados a partir

da segmentação gerada pelo método, esta segmentação é mostrada na figura 33d.

Visualmente a figura 33d apresenta um boa aproximação se comparada com a

figura 33c, (ground truth) que possui uma precisão muita alta da localização dos vasos. A

qualidade das imagens desta base ajuda o algoritmo a gerar resultados com alta precisão

na detecção dos vasos.

Capítulo 6. DISCUSSÃO E RESULTADOS 53

Figura 33 – Segmentação dos vasos sanguíneos de uma imagem da base DRIVE.

(a) Imagem Original. (b) Imagem Marcada.

(c) Ground truth. (d) Vasos sanguineos segmentados.


Na figura 34, foram selecionadas aleatoriamente quatro imagens da base para

demonstrar a segmentação feita pelo algoritmo e compará-las visualmente com o ground

truth, e com a segmentação feita por um segundo observador. As imagens selecionadas

foram: 01_test, 04_test, 13_test e 18_test. Na figura 34, foi estruturada uma matriz de

imagens em que cada coluna é referente a uma das imagens usadas para teste. A primeira

linha da matriz apresenta as imagens originais; a segunda linha apresenta as imagens com

os vasos sanguíneos marcados pelo algoritmo; a terceira linha apresenta as segmentações

dos vasos sanguíneos de cada uma das imagens; a quarta linha apresenta o ground truth; e,

finalmente, a quinta linha apresenta a segmentação feita por um segundo observador.


Figura 34 – Amostra de imagens da base DRIVE .

(a) 01_test (b) 04_test (c) 13_test (d) 18_test

(e) (f) (g) (h)

(i) (j) (k) (l)

(m) (n) (o) (p)

(q) (r) (s) (t)



A tabela 2 apresenta a avaliação de performance do método quando aplicado a cada

uma das 20 imagens de teste. Lembrando que esta base possui um total de 40 imagens,

porém, apenas 20 imagens são para teste enquanto as outras vinte são utilizadas em

métodos que necessitam de treinamento para a realização da segmentação, como métodos

que utilizam redes neurais.

Utilizando o ground truth para comparar com a segmentação do algoritmo, a melhor

precisão obtida por este, foi na imagem que possui o nome de 19_test, em que obteve-se

uma precisão de 97.108 %, e a pior precisão foi de 94.366 % obtida na imagem 08_test.

Tabela 2 – Resultado da segmentação das 20 imagens da base DRIVE.

Imagens Acc (%) SN, TPR (%) FPR (%) SP (%) PPV (%)01_test 96.19 71.192 1.361 98.639 83.67202_test 96.09 67.866 0.68981 99.31 91.803_test 94.813 69.82 2.4193 97.581 76.16504_test 95.575 55.347 0.34913 99.651 94.13905_test 95.662 59.608 0.61094 99.389 90.97906_test 95.438 61.62 0.91592 99.084 87.88507_test 95.111 64.576 1.8178 98.182 78.13108_test 94.366 71.19 3.4526 96.547 65.99809_test 95.445 67.683 2.1064 97.894 73.91610_test 96.073 59.865 0.68031 99.32 88.75411_test 95.125 62.321 1.65 98.35 78.78512_test 95.916 72.59 1.8795 98.121 78.49513_test 95.269 56.598 0.54048 99.46 91.90114_test 95.86 74.986 2.3035 97.697 74.11615_test 95.882 70.119 2.1322 97.868 71.71116_test 95.874 64.55 1.0168 98.983 86.30317_test 95.202 70.088 2.4832 97.517 72.23818_test 96.103 69.714 1.626 98.374 78.67619_test 97.108 75.032 0.89494 99.105 88.3520_test 96.251 71.214 1.7619 98.238 76.238

Média 95.668 66.799 1.5346 98.465 81.414

O método implementado obteve as seguintes médias: precisão 95.668 %, sensibilidade

66.799 %, taxa de falso positivo 1.5346 %, especificidade 98.465 % e valor preditivo positivo

81.414 %. Os valores da tabela 2 são plotados no gráfico da figura 35, para permitir

uma avaliação visual do desempenho do método a partir do resultado de cada imagem

segmentada apresentada na tabela 2.


Figura 35 – Gráfico dos resultados da tabela 2.


A tabela 3 foi criada para mostrar os resultados da segmentação do método, com

relação a segmentação do segundo observador. A melhor precisão foi de 96.974 % obtida na

imagem 08_test, e a pior foi de 94.823 %. Os valores de precisão melhor e pior mudaram,

se comparado com a tabela 2, pois a marcação do segundo observador possui algumas

pequenas divergências em relação às marcações dos vasos. Isto altera os resultados das

métricas uma vez que elas levam em conta a segmentação do especialista para avaliar a

segmentação do método.

Mas os valores que mostram a eficiência do método, são aqueles valores obtidos

comparando a segmentação do método com a segmentação fornecida no ground truth.

Todos os autores que utilizam esta base de imagens para avaliar a eficiências dos métodos

desenvolvidos por eles, utilizam o ground truth como parâmetro de avaliação. Pois padro-

niza a forma como os resultados são obtidos, e assim pode-se comparar cada trabalho

desenvolvido que utiliza esta base de imagens para segmentar vasos sanguíneos.

A figura 36 possui o gráfico da tabela 3, onde mostra de forma visual os resultados

obtidos de segmentação, utilizando a segmentação do segundo observador como método

de comparação.


Tabela 3 – Resultado da segmentação das 20 imagens da base, utilizando a segmentaçãodo segundo observador.

Imagens Acc (%) SN, TPR (%) FPR (%) SP (%) PPV (%)01_test 96.363 72.615 1.362 98.638 83.62802_test 96.485 70.122 0.56114 99.439 93.33303_test 95.343 75.183 2.6879 97.312 73.20304_test 95.968 57.858 0.37236 99.628 93.71805_test 96.974 69.144 0.56344 99.437 91.56706_test 95.771 63.932 0.95881 99.041 87.25907_test 96.027 74.994 2.3504 97.65 71.10908_test 94.823 80.797 4.1763 95.824 57.99809_test 95.521 68.207 2.0791 97.921 74.24710_test 96.835 66.63 0.83091 99.169 86.10611_test 95.8 67.319 1.6155 98.385 79.08512_test 96.358 77.039 1.9545 98.046 77.48913_test 95.038 55.235 0.48016 99.52 92.83214_test 96.207 79.368 2.4332 97.567 72.47515_test 95.372 65.88 2.2509 97.749 70.23416_test 96.77 70.694 0.80398 99.196 89.10817_test 96.046 78.652 2.5654 97.435 70.99118_test 96.454 68.909 0.75825 99.242 90.19319_test 95.991 65.294 0.62749 99.373 91.97720_test 95.656 63.636 1.0761 98.924 85.785

Média 95.99 69.575 1.5254 98.475 81.617




Na tabela 4 apresenta a comparação da performance do método implementado com

outro métodos. Pode-se observar que o método implementado tem uma eficiência muito

boa pois possui uma precisão alta. O resultado de precisão do método implementado fica

abaixo apenas, do resultado levando em conta o segundo observador e abaixo também dos

próprios criadores do método de PATWARI et al., que conseguiram uma precisão de 98,02

% utilizando a mesma base de imagens (DRIVE).

A diferença de resultado da precisão obtida na implementação e o resultado obtido

no trabalho de PATWARI et al., pode ter sido causada por ajustes feitos pelos autores,

mas que não foram publicados, impossibilitando chegar a este resultado de precisão, ao

implementar o método criado por eles.

Tabela 4 – Comparação de performance com outros métodos de segmentação de vasossanguíneos - DRIVE.

Método Acc (%) SN, TPR (%) FPR (%) SP (%)

Método Implementado 95.668 66.799 1.5346 98.465Segundo Observador 95.99 69.575 1.5254 98.475

PATWARI et al. 98.02 98 0 0TAGORE et al. 95.31 - - -ASLANI; SARNEL 95.13 75.45 - 98.01FRANKLIN; RAJAN 95.03 68.67 - 98.24SHAH et al. 94.79 72.05 0.0186 -AKRAM; KHAN 94.69 - - -SOARES et al. 94.66 72.85 2.13 97.86MENDONÇA; CAMPILHO 94.52 73.44 2.36 97.64MARíN et al. 94.52 70.67 - 98.01STAAL et al. 94.41 73.45 - -FRAZ et al. 94.30 71.52 2.31 97.68

Apesar das imagens 20 imagens de treinamento não serem utilizadas para testar a

performance do método, tomou-se a liberdade de avaliar a segmentação do método para

estas 20 imagens. Na tabela 5 estão os resultados de segmentação para cada uma das

imagens de treinamento, todos os resultados foram obtidos comparando com o ground

truth. Esta tabela também pode ser vista em forma de gráfico na figura 37.

Os valores médios de precisão, sensibilidade, taxa de falso positivo, especificidade

e valor preditivo positivo foram respectivamente: 94.8 %, 67.004 %, 2.498 %, 97.502 %,

76.841 %.


Tabela 5 – Resultado da segmentação das 20 imagens de treinamento da base DRIVE.

Imagens Acc (%) SN, TPR (%) FPR (%) SP (%) PPV (%)21_training 96.742 67.236 0.87454 99.125 86.12922_training 95.77 59.489 0.62635 99.374 90.41523_training 85.863 79.925 13.718 86.282 29.10824_training 94.594 57.205 0.50595 99.494 93.67725_training 94.838 59.168 1.3745 98.626 82.04726_training 94.961 69.318 2.7005 97.299 70.06527_training 95.889 64.008 1.031 98.969 85.71228_training 95.459 61.648 0.88099 99.119 88.33829_training 96.096 64.47 1.0003 99 85.54630_training 95.446 68.139 2.23 97.77 72.2331_training 93.505 75.998 5.3715 94.628 47.58832_training 96.547 68.063 0.91624 99.084 86.8733_training 96.515 70.445 1.1907 98.809 83.88734_training 89.851 74.225 8.4536 91.546 48.7835_training 96.148 64.983 0.89299 99.107 87.35736_training 94.758 62.671 1.3272 98.673 85.21137_training 95.275 61.451 1.4855 98.515 79.84838_training 95.715 68.645 1.7281 98.272 78.95639_training 95.577 69.889 2.0082 97.992 76.58640_training 96.444 73.109 1.6435 98.357 78.48

Média 94.8 67.004 2.498 97.502 76.841




6.2 Discussão e resultados - STARE

Nesta seção apresenta os resultados obtidos com a segmentação dos vasos sanguíneos,

utilizando as imagens da base STARE. Esta base possui dois manuais de segmentação, um

feito por Adam Hoover, que é utilizado como ground truth e o outro feito por Valentina

Kouznetsova (segundo observador).

A figura 38 mostra quatro imagens, duas obtidas após a aplicação do método de

segmentação e as outras duas obtidas diretamente da base. A imagem 38a é uma imagem

da base STARE, a figura 38c é o ground truth desta imagem, estas duas foram obtidas no

banco de imagens. A figura 38b é o resultado da segmentação (figura 38d) marcada na

imagem original, estas duas imagens são geradas como resultado de saída do algoritmo.

Comparando a figura 38c com a figura 38d, pode-se perceber que o método produz uma

boa segmentação.

Figura 38 – Segmentação dos vasos sanguíneos de uma imagem da base STARE.

(a) Imagem Original. (b) Imagem marcada.

(c) Ground truth. (d) Vasos sanguíneos segmentados.



Na figura 39 foi montada uma matriz de imagens utilizando as seguintes imagens:

image0077, image0081, image0162 e image0163 da base STARE, onde cada coluna repre-

senta uma imagem. Na primeira linha são dispostas as imagens originais, na segunda linha

as imagens marcadas a partir da segmentação feita pelo método implementado, na terceira

tem-se o ground truth, e na quarta a marcação dos vasos feita pelo segundo observador.

Figura 39 – Imagens segmentadas - STARE.

(a) image0077 (b) image0081 (c) image0162 (d) image0163

(e) (f) (g) (h)

(i) (j) (k) (l)

(m) (n) (o) (p)

(q) (r) (s) (t)



A tabela 6 apresenta os resultados obtidos na segmentação das vinte imagens do

banco STARE. Estes resultados foram obtidos utilizando o ground truth como base de

comparaç

segmentaÇÃo de vasos sanguÍneos em imagens de fundo de olho · 2018. 4. 5. · sinais que...

Documents