segmentaÇÃo de vasos sanguÍneos em imagens de fundo de olho · 2018. 4. 5. · sinais que...
TRANSCRIPT
-
ANDRÉ LUIZ ALMEIDA SILVA
SEGMENTAÇÃO DE VASOS SANGUÍNEOS
EM IMAGENS DE FUNDO DE OLHO
UBERLÂNDIA
2017
-
ANDRÉ LUIZ ALMEIDA SILVA
SEGMENTAÇÃO DE VASOS SANGUÍNEOS EM
IMAGENS DE FUNDO DE OLHO
Trabalho apresentado na Universidade Fede-ral de Uberlândia como requisito para conclu-são do curso de Engenharia Eletrônica e deTelecomunicações.
Orientador: Prof.a Dr.a Milena Bueno Pereira Carneiro
UBERLÂNDIA
2017
-
Este trabalho é dedicado a minha avó Maria Lúcia (in memoriam) e ao meu avô Edvaldo
que sempre me incentivaram a acreditar em meus sonhos.
-
Agradecimentos
Quero agradecer primeiramente a Deus, que me deu forças e saúde para vencer
dia após dia de luta durante a graduação. Foi meu refúgio e minha força em momentos
difíceis.
Quero agradecer aos meus avós Edvaldo e Maria Lúcia (in memoriam), pela minha
criação e aos bons ensinamentos. Agradeço aos dois por tudo, pois acreditaram no meu
potencial e me incentivaram a querer algo melhor e a acreditar no meu sonho de cursar
engenharia.
Agradeço a minha madrinha Cárita pelo carinho e dedicação comigo. Quero agra-
decer meu primo Otávio Augusto pelo companheirismo
Quero Agradecer minha mãe Kelly Cristina pela ajuda durante estes anos de
graduação e aos bons conselhos. Ao meu pai Reginaldo Américo agradeço ao incentivo e a
admiração que tem por mim.
Agradeço também minha vó Márcia (in memoriam) que sempre se preocupou
comigo, mesmo morando em outra cidade, ligava constantemente para saber como eu
estava.
Agradeço aos grandes e bons amigos que tenho. Amigos da graduação, do ônibus
de estudantes, e amigos de anteriores a graduação.
Agradeço a minha orientadora Milena, por me incentivar no desenvolvimento deste
trabalho, por entender minhas dificuldades. Agradeço também a Cristiane, por permitir
utilizar o trabalho de doutorado dela como base para o desenvolvimento deste trabalho.
Agradeço aos professores que me forneceram conhecimento necessário para minha
formação como engenheiro. Agradeço aos técnicos da FEELT, que sempre fizeram o possível
para ajudar de uma forma ou de outra na obtenção de materiais para o desenvolvimento
dos projetos durante a graduação.
-
“A felicidade não se resume na ausência de problemas,
mas sim na sua capacidade de lidar com eles.”
Albert Einstein
-
Resumo
A retinopatia diabética é uma das principais doenças que ocorrem na retina e é causada por
outra doença chamada diabetes Mellitus. A retinopatia apresenta sinais por meio da retina,
sinais que auxiliam o médico oftalmologista diagnosticar se o paciente tem ou não diabetes
Mellitus, analisando apenas as imagens de fundo de olho tiradas do paciente. Os sinais
se apresentam em forma de aparecimento de microaneurismas, exsudatos, haemorragias,
neovascularizações e alterações nos vasos sanguíneos.
Este trabalho foi desenvolvido para estudar e implementar um método de segmentação
de vasos sanguíneos da retina utilizando processamento de imagens. O objetivo é isolar
os vasos sanguíneos para facilitar a análise do médico tanto dos vasos sanguíneos onde
a retinopatia diabética também causa alterações, quanto do fundo da retina onde se
apresentam os outros sinais desta doença. A análise manual das imagens de fundo de olho
é muito criteriosa, pois os objetos presentes e os sinais da doença apresentam-se com um
baixo contraste demandando um grande esforço visual do médico e contribuindo para a
ocorrência de erros durante a análise.
O método implementado foi testado nas bases de imagens de fundo de olho públicas
DRIVE e STARE, disponibilizadas via internet. O método obteve uma precisão de 95.668
% na base DRIVE, e 94.352 % na STARE.
A detecção dos vasos sanguíneos pode ser utilizada como método de pré-processamento
em trabalhos cujo objetivo seja detectar os outros sinais da retinopatia diabética, como a
detecção de microaneurisma e exsudatos. Utilizando a detecção dos vasos como forma de pré-
processamento, reduziram a taxa de erro, principalmente na detecção de microaneurismas,
onde estes podem ser confundidos com os neovasos.
Palavras-chave: Imagem de Fundo de Olho, Detecção, Vasos Sanguíneos, Retinopatia
Diabética.
-
Abstract
Diabetic retinopathy is one of the major diseases that occur in the retina and is caused
by another condition called diabetes Mellitus. Retinopathy shows signs through of the
retina, signs that aid the ophthalmologist diagnose whether or not the patient has diabetes
Mellitus, analyzing only the eye fundus images of the eye taken from the patient. The
signs are presented in the form of appearance of microaneurysms, exudates, haemorrhages,
neovascularizations and alterations in the blood vessels.
This work was developed to study and implement a method of segmentation of retinal
blood vessels using image processing. The goal is to isolate blood vessels to facilitate
medical analysis of both the blood vessels where diabetic retinopathy also causes changes
as well as the fundus of the retina where other signs of this disease are present. The manual
analysis of the eye fundus images is very careful, since the objects present and the signs of
the disease present themselves with a low contrast requiring a great visual effort of the
doctor and contributing to the occurrence of errors during the analysis.
The implemented method was tested in the databases of public eye fundus images DRIVE
and STARE, available through the internet. The method obtained an accuracy of 95.668
% in the DRIVE base, and 94.352 % in the STARE.
The detection of blood vessels can be used as a pre-processing method in studies aimed at
detecting other signs of diabetic retinopathy, such as the detection of microaneurysms and
exudates. Using the vessel detection of vessels as a form of pre-processing, they reduced
the error rate, mainly in the detection of microaneurysms, where they can be confused
with the neovessels.
Keywords: Eye Fundus Image, Detection, Blood Vessels, Diabetic Retinopathy.
-
Lista de ilustrações
Figura 1 – Olho Humano. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
Figura 2 – Formação da imagem no olho humano. . . . . . . . . . . . . . . . . . . 24
Figura 3 – Imagem de fundo de olho saudável. . . . . . . . . . . . . . . . . . . . . 25
Figura 4 – Angiografia fluoresceínica. . . . . . . . . . . . . . . . . . . . . . . . . . 26
Figura 5 – Fotografia red free do fundo de olho com retinopatia diabética. . . . . . 26
Figura 6 – Fotografia colorida- RGB do fundo olho normal. . . . . . . . . . . . . . 26
Figura 7 – Retinógrafo digital. TOPCON, modelo: TRC-NW8 Non-Mydriatic Re-
tinal Camera. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
Figura 8 – Microaneurisma. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
Figura 9 – Sinais da Retinopatia diabética. . . . . . . . . . . . . . . . . . . . . . . 29
Figura 10 – Etapas para a realização do processamento de imagens. . . . . . . . . . 31
Figura 11 – Sistema de cores Aditivo. . . . . . . . . . . . . . . . . . . . . . . . . . 33
Figura 12 – Cubo RGB. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
Figura 13 – Formação de uma Imagem RGB em um monitor colorido. . . . . . . . 34
Figura 14 – Sistema de cores Subtrativo. . . . . . . . . . . . . . . . . . . . . . . . . 34
Figura 15 – Modelo de cores HSI. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
Figura 16 – Exemplos de imagens do banco DRIVE. . . . . . . . . . . . . . . . . . 38
Figura 17 – Exemplo de imagens do banco STARE. . . . . . . . . . . . . . . . . . . 39
Figura 18 – Diagrama do método. . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
Figura 19 – Retinografia RGB. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
Figura 20 – Canal Verde. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
Figura 21 – Complemento do Canal Verde. . . . . . . . . . . . . . . . . . . . . . . 43
Figura 22 – Resultado da aplicação do CLAHE no complemento do Canal Verde. . 44
Figura 23 – Exemplo de Elementos Estruturantes. . . . . . . . . . . . . . . . . . . 45
Figura 24 – Imagem resultante da Abertura Morfológica. . . . . . . . . . . . . . . . 46
Figura 25 – Imagem resultante após a remoção do Disco Óptico. . . . . . . . . . . 47
Figura 26 – Resultado após aplicação do Filtro Mediana. . . . . . . . . . . . . . . . 47
Figura 27 – Background. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
Figura 28 – Resultado da remoção do Background. . . . . . . . . . . . . . . . . . . 49
Figura 29 – Ajuste de contraste da imagem. . . . . . . . . . . . . . . . . . . . . . . 49
Figura 30 – Imagem Binária dos Vasos Sanguíneos. . . . . . . . . . . . . . . . . . . 50
Figura 31 – Imagem após a remoção de objetos espúrios. . . . . . . . . . . . . . . . 51
Figura 32 – Resultado da detecção dos vasos sanguíneos. . . . . . . . . . . . . . . . 51
Figura 33 – Segmentação dos vasos sanguíneos de uma imagem da base DRIVE. . . 53
Figura 34 – Amostra de imagens da base DRIVE . . . . . . . . . . . . . . . . . . . 54
Figura 35 – Gráfico dos resultados da tabela 2. . . . . . . . . . . . . . . . . . . . . 56
-
Figura 36 – Gráfico dos resultados da tabela 3. . . . . . . . . . . . . . . . . . . . . 57
Figura 37 – Gráfico dos resultados da tabela 5. . . . . . . . . . . . . . . . . . . . . 59
Figura 38 – Segmentação dos vasos sanguíneos de uma imagem da base STARE. . . 60
Figura 39 – Imagens segmentadas - STARE. . . . . . . . . . . . . . . . . . . . . . . 61
Figura 40 – Gráfico dos resultados da tabela 6. . . . . . . . . . . . . . . . . . . . . 63
Figura 41 – Gráfico dos resultados da tabela 7. . . . . . . . . . . . . . . . . . . . . 64
-
Lista de tabelas
Tabela 1 – Avaliação para o conjunto de pixels segmentados. . . . . . . . . . . . . 36
Tabela 2 – Resultado da segmentação das 20 imagens da base DRIVE. . . . . . . 55
Tabela 3 – Resultado da segmentação das 20 imagens da base, utilizando a seg-
mentação do segundo observador. . . . . . . . . . . . . . . . . . . . . . 57
Tabela 4 – Comparação de performance com outros métodos de segmentação de
vasos sanguíneos - DRIVE. . . . . . . . . . . . . . . . . . . . . . . . . 58
Tabela 5 – Resultado da segmentação das 20 imagens de treinamento da base DRIVE. 59
Tabela 6 – Resultado do teste nas 20 imagens da base STARE - ground truth. . . 62
Tabela 7 – Resultado do teste nas 20 imagens da base STARE - Valentina Kouz-
netsova. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
Tabela 8 – Comparação de performance com métodos de segmentação de vasos
sanguíneos - STARE . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
-
Lista de abreviaturas e siglas
Acc Accuracy. Pg. 36
CAD Computer Aided Diagnosis. Pg. 15
CLAHE Contrast-Limited Adaptive Histogram Equalization. Pg. 41
CMY Cyan, Magenta, Yellow. Pg. 31
CMYK Cyan, Magenta, Yellow, Black. Pg. 31
DRIVE Digital Retinal Images for Vessel Extraction. Pg. 17
DM Diabetes Mellitus. Pg. 15
DO Disco Óptico. Pg. 23
ES Elemento Estruturante. Pg. 42
FN False Negative. Pg. 35
FOV Field of View. Pg. 37
FP False Positive. Pg. 35
FPR False Positive Rate. Pg. 35
H Hemorragias. Pg. 27
HSI Hue, Saturation, Intensity. Pg. 31
MA Microaneurisma. Pg. 15
NV Neovascularização. Pg. 27
PPV Positive Predictive Value. Pg. 36
RD Retinopatia Diabética. Pg. 26
RDNP Retinopatia Diabética não Proliferativa. Pg. 27
RDP Retinopatia Diabética Proliferativa. Pg. 27
RGB Red, Green, Blue. Pg. 31
ROP Retinopatia da Prematuridade. Pg. 27
-
SN Sensitivity. Pg. 36
SP Especificity. Pg. 36
STARE STructured Analysis of the Retina. Pg. 17
TN True Negative. Pg. 35
TP True Positive. Pg. 35
TPR True Positive Rate. Pg. 35
WHO World Health Organization. Pg. 35
-
Lista de símbolos
◦ Abertura Morfológica.
⊕ Dilatação.
⊖ Erosão.
R© Marca Registrada.
-
Sumário
1 INTRODUÇÃO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.1 Justificativa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.2 Objetivo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
1.2.1 Objetivos Específicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
1.3 Estrutura do Trabalho . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2 ESTADO DA ARTE . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.1 Trabalhos sobre detecção de vasos sanguíneos . . . . . . . . . . . . . 20
2.1.1 Método de DUA; KANDIRAJU; THOMPSON (2005) . . . . . . . . . . . . 20
2.1.2 Método de MENDONÇA; CAMPILHO (2006) . . . . . . . . . . . . . . . . 20
2.1.3 Método de SOARES et al. (2006) . . . . . . . . . . . . . . . . . . . . . . 20
2.1.4 Método de AKRAM; KHAN (2013) . . . . . . . . . . . . . . . . . . . . . 21
2.1.5 Método de TAGORE et al. (2013) . . . . . . . . . . . . . . . . . . . . . . 21
2.1.6 Método de FRANKLIN; RAJAN (2014) . . . . . . . . . . . . . . . . . . . 21
2.1.7 Método de ASLANI; SARNEL (2016) . . . . . . . . . . . . . . . . . . . . 21
2.1.8 Método de SHAH et al. (2017) . . . . . . . . . . . . . . . . . . . . . . . . 22
3 CONCEITOS DE OFTALMOLOGIA . . . . . . . . . . . . . . . . . . 23
3.1 Estruturas do Olho Humano . . . . . . . . . . . . . . . . . . . . . . . 23
3.2 Exame de Fundo de Olho . . . . . . . . . . . . . . . . . . . . . . . . . 25
3.3 Retinopatia Diabética . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
4 CONCEITOS TEÓRICOS GERAIS . . . . . . . . . . . . . . . . . . . 30
4.1 Conceitos de Processamento Digital de Imagens . . . . . . . . . . . 30
4.2 Modelos de Cores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
4.2.1 Modelo de cores RGB . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
4.2.2 Modelo de cores CMY e CMYK . . . . . . . . . . . . . . . . . . . . . . . 34
4.2.3 Modelo de cores HSI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
4.3 Métricas de Avaliação do Algoritmo de Segmentação de Imagens . 35
4.3.1 Métricas de Avaliação . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
5 MATERIAIS E MÉTODOS . . . . . . . . . . . . . . . . . . . . . . . 38
5.1 Bases de Imagens . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
5.1.1 DRIVE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
5.1.2 STARE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
5.2 Método de Segmentação dos Vasos Sanguíneos . . . . . . . . . . . . 40
-
6 DISCUSSÃO E RESULTADOS . . . . . . . . . . . . . . . . . . . . . 52
6.1 Discussão e resultados - DRIVE . . . . . . . . . . . . . . . . . . . . . 52
6.2 Discussão e resultados - STARE . . . . . . . . . . . . . . . . . . . . . 60
7 CONCLUSÃO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
7.1 Sugestão de Trabalhos Futuros . . . . . . . . . . . . . . . . . . . . . . 66
7.2 Publicações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
REFERÊNCIAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
-
16
1 INTRODUÇÃO
Com o avanço da tecnologia, houve uma melhoria na aquisição e no processamento
de imagens digitais, possibilitando a extração de informação a partir de imagens médicas
que antes não era possível. Isso motivou a pesquisa e o desenvolvimento de sistemas de
Diagnostico Auxiliado por Computador (CAD-Computer Aided Diagnosis), que auxiliam
os médicos no tratamento de doenças. Este auxílio se dá através da medição de estruturas,
fazendo comparação sequencial de imagens, e prevenindo erros cometidos por trabalho
humano repetitivo, fazendo com que o médico diagnostique alguma doença com maior
precisão, planejando com maior eficiência o tratamento do paciente (MELO, 2014).
Na oftalmologia, as retinografias digitais podem fornecer informações sobre algumas
doenças oculares, estas podem ser apenas doenças locais, ou podem ser indícios de doenças
sistemáticas como a hipertensão ou Diabetes Mellitus (DM). Cada vez mais se utiliza
técnicas de processamento de imagens, como a segmentação de estruturas da retina para
detecção de Retinopatia Diabética (RD). A RD é uma complicação do DM, que é a maior
causadora de redução de visão, ou até mesmo cegueira em diabéticos. Trata-se de uma
doença assintomática que durante a fase inicial é de difícil identificação, provoca alterações
nos vasos sanguíneos da retina e causa inchaços nos capilares, inchaço denominado de
microaneurisma (MA) (MELO, 2014).
Detectando-se a RD em sua fase inicial e executando um tratamento precoce,
menores serão as chances do paciente diabético reduzir ou perder a visão completamente.
O diagnóstico é feito por um médico oftalmologista, por meio de exame visual clínico. A
precisão do diagnóstico depende de vários fatores, principalmente tais como: a qualidade
da retinografia, a habilidade e experiência do médico que realiza o exame (MELO, 2014).
Os sistemas CAD contribuirão para uma maior precisão de diagnóstico, reduzindo erros
humanos, e detectando os possíveis indícios de RD.
O processo de segmentação subdivide a imagem em partes de interesse, podendo ser
objetos ou regiões que compõem a imagem. Ou seja, a segmentação consiste em segmentar,
parcelar a imagem até o momento em que o objeto ou região de interesse seja localizado,
satisfazendo o critério determinado pela aplicação. A segmentação se torna mais complexa
a partir do momento que necessita-se de maior precisão. A maioria dos algoritmos de
segmentação se baseiam em valores de intensidade, e são divididos em duas categorias: na
primeira os algoritmos segmentam a partir da detecção de descontinuidades, mudanças
bruscas de intensidade, e na segunda categoria segmentam imagens em regiões a partir de
critérios de similaridade predefinidos (GONZALEZ; WOODS, 2010).
-
Capítulo 1. INTRODUÇÃO 17
1.1 Justificativa
A World Health Organization (WHO) - Organização Mundial da Saúde, classifica a
função visual em quatro níveis sendo: visão normal, deficiência visual moderada, deficiência
visual grave e cegueira. A deficiência visual moderada, com a deficiência visual grave
agrupadas, são denominadas pelo termo baixa visão. Todas as deficiências visuais são
representadas pela baixa visão e a cegueira. Estima-se que existem 285 milhões de pessoas
com deficiência visual em todo mundo, uma parcela de 39 milhões do total são cegos, e
outra parcela de 246 milhões têm baixa visão. Sendo que, 80% das deficiências visuais
podem ser evitadas ou curadas (WHO, 2014).
Uma solução viável e de baixo custo para o tratamento destes pacientes é o
diagnóstico realizado utilizando processamento digital de imagens, que pode ser executado
com eficiência e precisão. Utilizando processamento de imagens, são feitas uma série de
operações com a imagem, que são dividas em etapas, sendo que a principal etapa é a
segmentação da imagem que, como foi dito anteriormente, consiste em dividir a imagem
até localizar a região ou objeto de interesse. Diversas doenças em oftalmologia podem
ser segmentadas, podendo ser feito um diagnóstico automático ou semiautomático (que
exige a validação de um especialista em oftalmologia). Alguns exemplos destas doenças
são: degeneração macular relacionada a idade, glaucoma, retinopatia diabética, retinopatia
da prematuridade, e catarata (GUO et al., 2015).
Pacientes com diabetes requerem uma maior atenção, pois uma das suas principais
complicações é a RD, podendo causar cegueira caso não seja realizado um tratamento
adequado. Após os 20 anos de idade, 99% dos pacientes que possuem diabetes tipo 1, e
60% dos pacientes que possuem diabetes do tipo 2, possuem algum grau de retinopatia
diabética (HENDRICK; GIBSON; KULSHRESHTHA, 2015). Assim, é recomendado a
estes pacientes que realizem exames de fundo de olho pelo menos uma vez ao ano. Devido
a isso, e ao fato de que a quantidade de pessoas com diabetes cresce vertiginosamente, a
demanda por este exame de fundo de olho é crescente (KÖSE et al., 2012). Em grande
parte dos países os exames realizados para diagnosticar RD, são feitos de forma manual
(ZAKI et al., 2016). Uma vez detectada a RD, o tratamento é feito com laser ou injeção de
medicamentos no olho afetado, sendo que estes tratamentos não deixam nenhuma sequela.
É importante ressaltar que, além da diabetes, outras doenças necessitam acom-
panhamento por meio de retinografias. A análise manual das retinografias, requer um
especialista em oftalmologia treinado para analisar um grande número de retinografia. O
baixo contraste dos sinais causados pelas doenças dificulta a diferenciação entre objetos na
imagem e os sinais da doença. Isto compromete a eficiência da segmentação manual feita
por especialista e provoca erros durante a operação (KÖSE et al., 2012). Devido a isto,
utilizar às técnicas de processamento de imagens para criação um processo automático ou
semiautomático de análise, pode ser uma alternativa com maior confiabilidade em relação
-
Capítulo 1. INTRODUÇÃO 18
à análise manual.
1.2 Objetivo
Os vasos sanguíneos presentes na retina são uma das estruturas mais importantes,
pois fornecem sangue para a retina além de transmitirem sinais da retina para o cérebro
(FRANKLIN; RAJAN, 2014).
Mudanças causadas nestes vasos sanguíneos servem como marcadores biológicos,
que podem ser utilizados para detectar algum tipo de doença como a retinopatia diabética.
As mudanças nos vasos podem ser: no formato, largura, tortuosidade, padrão de ramificação
(FRANKLIN; RAJAN, 2014).
Uma vez que a retinopatia diabética se manifesta de forma a provocar alterações
nos vasos sanguíneos, para se criar um método automático de detecção de retinopatia faz
se necessário a detecção automática dos vasos sanguíneos como forma de pré-processar
a imagem de fundo de olho antes de realizar a detecção automática de microaneurisma
e hemorragias causadas pela retinopatia diabética. Conhecendo a localização dos vasos,
estas localizações podem ser usadas para diminuir a taxa de falso positivos em relação a
detecção de microaneurismas e hemorragias (AQUINO, 2011).
A detecção dos vasos sanguíneos pode ser útil para outros fins clínicos como:
avaliação da retinopatia da prematuridade (HENEGHAN et al., 2002), estreitamento
arteriolar (HATANAKA et al., 2004), tortuosidade dos vasos para caracterização da
retinopatia hipertensiva (FORACCHIA; GRISAN; RUGGERI, 2001), medição do diâmetro
dos vasos sanguíneos para diagnosticar hipertensão e doenças cardiovasculares (LOWELL
et al., 2004),e cirurgia a laser assistida por computador (BACKER et al., 1998).
Portanto, o objetivo geral desse trabalho é estudar e implementar técnicas de
segmentação de vasos sanguíneos em imagem de fundo de olho presentes na literatura,
utilizando os banco públicos de imagens: Digital Retinal Images for Vessel Extraction
(DRIVE) (STAAL et al., 2004) e STructured Analysis of the Retina (STARE) (HOOVER,
2000). Visa-se automatizar a detecção dos vasos sanguíneos, podendo ser utilizado em
aplicações futuras para auxiliar a detecção automática da RD.
1.2.1 Objetivos Específicos
Para cumprir o objetivo desse trabalho algumas tarefas devem ser realizadas:
• Obter as imagens das bases públicas DRIVE e STARE .
• Compreender e descrever as características das imagens de fundo de olho.
-
Capítulo 1. INTRODUÇÃO 19
• Estudar e implementar técnicas de pré-processamento das imagens de fundo de olho
visando melhorar a eficiência da detecção dos vasos sanguíneos.
• Estudar técnicas para a segmentação de vasos sanguíneos em imagens de fundo de
olho;
• Testar e garantir a confiabilidade do algoritmo implementado, utilizando métricas
que atestam a qualidade do método de segmentação aplicado pelo algoritmo.
• Comparar os resultados de performance do algoritmo com outros trabalhos publica-
dos.
1.3 Estrutura do Trabalho
Este trabalho foi dividido em cinco capítulos, os próximos quatro capítulos são
descritos abaixo:
Capítulo 2 Aborda alguns trabalhos feitos sobre métodos de segmentação de vasos
sanguíneos.
Capítulo 3 Fornece o conhecimento básico necessário sobre oftalmologia, para que o
leitor possa entender o trabalho com clareza.
Capítulo 4 Aborda conceitos básicos sobre processamento digital de imagens, e métricas
usadas para avaliar métodos de segmentação utilizados em algoritmos.
Capítulo 5 Descreve as bases públicas de imagens de fundo de olho utilizadas, e explica
o algoritmo de segmentação implementado e aplicado nas bases de imagens.
Capítulo 6 Mostra os resultados da performance do algoritmo de segmentação ao aplicá-lo
nas duas bases de imagens.
Capítulo 7 Conclusão do trabalho.
-
20
2 ESTADO DA ARTE
2.1 Trabalhos sobre detecção de vasos sanguíneos
Neste capítulo será abordado trabalhos desenvolvidos com o objetivo de realizar a
detecção dos vasos sanguíneos presentes em imagens da retina.
2.1.1 Método de DUA; KANDIRAJU; THOMPSON (2005)
DUA; KANDIRAJU; THOMPSON (2005) desenvolveram uma técnica para a
detecção de vasos sanguíneos, que se baseia em uma decomposição recursiva de regiões
utilizando Quadtrees que são estruturas de dados espaciais usada para representar uma
região e posteriormente uma filtragem de bordas. A técnica criada pelos autores fornece
informações sobre os vasos sanguíneos da retina, informações que são úteis para a detecção
de anomalias nos vasos sanguíneos e assim detectar precocemente Retinopatia Diabética.
2.1.2 Método de MENDONÇA; CAMPILHO (2006)
MENDONÇA; CAMPILHO (2006), o algoritmo desenvolvido inicia os passos de
segmentação dos vasos sanguíneos extraindo as linhas centrais dos vasos, esta linhas
são utilizadas com linhas guias para completar as fases dos vasos. As saídas de quatro
operadores diferenciais direcionais são processadas para selecionar conjuntos de pontos
candidatos conectados e assim serem classificados como pixels de linha central usando
recursos provenientes das características dos vasos. A segmentação dos vasos ocorre
utilizando uma método iterativo de região de crescimento que integra o conteúdo de várias
imagens binárias resultantes de filtros morfológicos que dependem da largura do vasos
sanguíneos. O algoritmo foi testado em ambas base públicas de imagens DRIVE e STARE
e obteve-se bons resultados.
2.1.3 Método de SOARES et al. (2006)
SOARES et al. (2006) criaram um método que classificam os pixels da imagem de
fundo de olho como sendo ou não vasos sanguíneos, esta classificação é baseada em um
vetores de características. Os vetores de características são composto pelas intensidade
dos pixels e pela repostas bidimensionais criadas a partir transformadas wavelet de Gabor
aplicando múltiplas escalas. A utilização da transformada de wavelet de Gabor permite
detectar frequências específicas, filtra-las, e melhorar o contraste dos vasos sanguíneos. Os
autores utilizaram um classificador Bayesiano com funções de densidade de probabilidade
-
Capítulo 2. ESTADO DA ARTE 21
condicionais de classe que produz uma classificação rápida, estas distribuições de probabi-
lidade são estimadas a partir dos pixels marcados na segmentação manual das bases de
imagens.
2.1.4 Método de AKRAM; KHAN (2013)
AKRAM; KHAN (2013) propuseram um metodo que utiliza Gabor Wavelet 2D,
pois melhora o contraste de estruturas direcionais e aplica uma técnica de limiar multi-
camada que aumenta a precisão na segmentação dos vasos sanguíneos. A técnica proposta
pelos autores funciona muito bem, mesmo se imagem apresentar grandes variações de
iluminação, o método segmenta até os vasos sanguíneos mais finos. O método foi testado
em duas bases de imagens de fundo de olho públicas sendo elas, DRIVE e STARE.
2.1.5 Método de TAGORE et al. (2013)
TAGORE et al. (2013) desenvolveram um método automático de segmentação que
o utiliza os canais vermelho e verde da mesma imagem do fundo de olho para corrigir
a não-uniformidade da iluminação da imagem de fundo de olho. Feito isto utilizaram
Phase Congruency para melhorar o contraste dos vasos sanguíneos. Após o aumento de
contraste dos vasos sanguíneos, estes são segmentados utlizando Hierarchical Clustering
que se baseia em um Histogram Thresholding.
2.1.6 Método de FRANKLIN; RAJAN (2014)
FRANKLIN; RAJAN (2014) desenvolveram um método que classifica os pixels da
imagem de fundo de olho como sendo vasos sanguíneos ou não vasos, e assim segmenta
os vasos sanguíneos na retina. A tarefa de classificar como vasos ou não vasos feito por
uma rede neural Multilayer perceptron as entradas desta rede neural são derivadas das três
camadas RGB, vermelho, verde e azul. O algoritmo Back propagation empregado, pois
fornece uma técnica eficiente de mudança de pesos na rede neural utilizando realimentação.
2.1.7 Método de ASLANI; SARNEL (2016)
ASLANI; SARNEL (2016) propuseram um método de segmentação de vasos san-
guíneos que combina um conjunto robusto de características provenientes de diferentes
algoritmos em um vetor hibrido que possui características utilizadas para a caracterização
de pixels. Este vetor de características é resultado da reposta de 13 filtros Gabor com
diferentes configurações, como intensidade de aumento de contraste, intensidade transfor-
mada Top-Hat, medidas de vasos sanguíneos da retina, e a reposta do filtro B- COSFIRE.
Escolheram um classificador chamado de Random Forest, que foi treinado com o vetor de
características híbrido. Este classificador foi escolhido devido sua simplicidade, velocidade
-
Capítulo 2. ESTADO DA ARTE 22
de execução e capacidade de fusão de informações. A combinação escolhida dos diferentes
tipos de características resulta em informações que permite melhor discriminação para
pixels de vasos e não-vasos em imagens retina.
2.1.8 Método de SHAH et al. (2017)
SHAH et al. (2017) propuseram um método para segmentação de vasos sanguíneos
baseado em um detector de características Hessiano. A partir de uma base pública de
imagens de fundo de olho RGB (DRIVE). A partir da imagens de fundo de RGB, o método
proposto converte esta para escala de cinza, para melhorar o contraste dos objetos escuros
na imagem como os vasos sanguíneos, realiza-se um produto ponto-a-ponto entre a imagem
em escala de cinza e ela mesma e para retificar o contraste dos objetos escuros utilizou-se um
filtro janela 5x5 para cada pixel. Este método extrair um total de 24 características baseado
em 5 regiões de características, uma de intensidade e duas características Hessian por
escala, onde se utiliza 9 escalas. Um Linear Minimum Squared Error (LMSE) foi utilizado
para classificar os pixels como vasos sanguíneos e em não vasos, as 20 imagens especificas
para treinamento do banco de imagens DRIVE foram utilizadas para o treinamento do
LMSE, e o restante das imagens foram utilizadas para teste.
-
23
3 CONCEITOS DE OFTALMOLOGIA
3.1 Estruturas do Olho Humano
O olho humano possui um sistema muito sofisticado que se adapta conforme a
luminosidade do ambiente e conforme o foco, podendo privilegiar o ambiente como um
todo ou focar em um objeto de interesse. As principais estruturas do olho são: a córnea, o
cristalino, a íris, a pupila, a retina, a fóvea, o disco óptico, os vasos sanguíneos e o nervo
óptico. Estas estruturas são mostradas na figura 1.
Figura 1 – Olho Humano.
Fonte: Adaptado de Bionic Vision1
Na parte externa do olho encontram-se: a córnea, parte branca do olho, e a esclera
que é a camada transparente que recobre a íris. O coróide é localizado em uma parte
intermediária, e tem a função de realizar a nutrição do olho, o corpo ciliar é responsável por
produzir humor vítreo que é o gel que preenche a cavidade interna do olho, e é responsável
também por regular a convexidade do cristalino, a íris tem função de proteger a retina e
dar cor aos olhos (DORION, 2002). A pupila localiza-se na íris, e tem função semelhante
a um diafragma abrindo e fechando dependendo da luminosidade do ambiente. O humor
aquoso fica armazenado entre a córnea e o cristalino, e se renova constantemente.
A formação da imagem no olho é um pouco diferente da formação de uma imagem
em uma câmera fotográfica comum. Na câmera a distância focal é fixa, e a focalização do
objeto é obtida variando a distância entre a lente e o plano-imagem, como um chip de
captura de imagem que é o caso de uma câmera digital. No olho a formação de imagem1 Disponível em: acessado em jun. 2017.
-
Capítulo 3. CONCEITOS DE OFTALMOLOGIA 24
ocorre de forma oposta: a distância entre a lente e o plano-imagem, respectivamente
cristalino e retina, é fixa, a distância focal adequada para focalizar o objeto é obtida
variando o cristalino, que funciona semelhante a uma lente flexível. Esta variação do
cristalino é promovida por fibras zonulares, que achatam o cristalino para focalizar objetos
distantes, ou alongam este para focalizar objetos próximos. A distância ao longo do eixo
visual entre o centro do cristalino e a retina é aproximadamente 17 mm, já a distância
focal varia de 14 mm a 17 mm, a distância focal de 17 mm ocorre quando o olho está
relaxado e focado em distâncias maiores do que cerca 3 m (GONZALEZ; WOODS, 2010).
A imagem produzida sobre a retina é focalizada principalmente na área da fóvea, a
percepção, ocorre pela excitação dos receptores de luz, que transformam a energia radiante
em impulsos elétricos, os quais posteriormente são decodificados pelo cérebro (GONZALEZ;
WOODS, 2010). A figura 2 exemplifica a formação da imagem no olho humano.
Figura 2 – Formação da imagem no olho humano.
Fonte: Bionic Vision2
A figura 3 mostra uma imagem de fundo de olho, onde pode-se identificar algumas
estruturas importantes como:
• Disco óptico (DO): é a parte do nervo óptico vista no fundo dos olhos, tem uma
estrutura circular de diâmetro médio 1,5 mm, com tonalidade esbranquiçada e bordas
bem definidas. Como o disco óptico não possui células sensíveis à luz, ele corresponde
ao ponto cego da visão humana, é imperceptível ao ser humano, pois o cérebro utiliza
a informação do outro para cobrir este ponto cego (MELO, 2014).
• Mácula: é uma área circular da retina com diâmetro de 0,22 mm, apresenta uma
área com tonalidade mais escura se comparado com o restante do fundo ocular.
A mácula é a parte de maior importância do fundo ocular, pois é área de maior
sensibilidade visual para percepção de detalhes (MELO, 2014).2 Disponível em: acessado em jun. 2017.
-
Capítulo 3. CONCEITOS DE OFTALMOLOGIA 25
• Fóvea: é uma depressão com aproximadamente 0.10 mm de diâmetro e está localizada
no centro da mácula, concentra grande parte das células fotorreceptoras (MELO,
2014).
• Vasos Sanguíneos: Os vasos sanguíneos presente na retina ramificam do disco
óptico para a periferia. A artéria central da retina penetra no globo ocular através
do disco óptico, esta artéria tem um diâmetro pequeno de 0.1 mm. As artérias se
apresentam com um vermelho mais intenso e com um diâmetro menor em relação às
veias, enquanto as veias se apresentam com um vermelho escuro (MELO, 2014).
Figura 3 – Imagem de fundo de olho saudável.
Fonte: Adaptado por (MELO, 2014) de (STAAL et al., 2004).
3.2 Exame de Fundo de Olho
O exame do fundo de olho é uma prática muito importante feita em consultório
médico oftalmologista, um vez que existe várias doenças que causam problemas na retina.
Um dos métodos para realizar este exame é a oftalmoscopia direta, o especialista utiliza
um oftalmoscópio3para examinar, e assim avaliar o disco óptico, os vasos sanguíneos e
as outras estruturas no fundo ocular. Para realizar este tipo de exame, o ambiente deve
ter baixa iluminação, e tem a necessidade de dilatar a pupila do paciente com colírios
específicos (DORION, 2002), (CARDOSO, 2016).
Para análises mais criteriosas da retina é necessário utilizar métodos mais precisos
que a oftalmoscopia direta, os seguintes métodos podem ser utilizados: a angiografia
fluoresceínica, que é obtida por meio da aplicação de uma substância de contraste, a3 Aparelho criado por Hermann von Helmholtz em 1850 constituído-se de uma fonte de luz, e um espelho
que projeta a luz no olho do paciente.
-
Capítulo 3. CONCEITOS DE OFTALMOLOGIA 26
Fluoresceína, na corrente sanguínea do paciente, figura 4; ou a fotografia red free do fundo
de olho. Esta fotografia exclui as ondas de espectro referente ao vermelho, figura 5; ou
então a fotografia colorida- RGB do fundo de olho que capta os espectros vermelho, verde
e azul, figura 6 (MOOKIAH et al., 2013).
Figura 4 – Angiografia fluoresceínica.
Fonte: Adaptado de Instituto de Microcirurgia Ocular4.
Figura 5 – Fotografia red free do fundo de olho com retinopatia diabética.
Fonte: Ophthalmic Photographer’s Society5.
Figura 6 – Fotografia colorida- RGB do fundo olho normal.
Fonte: Fine Eyewear6.
4 Disponível em: acessado em jun. 2017.5 Disponível em: acessado em jun. 2017.
-
Capítulo 3. CONCEITOS DE OFTALMOLOGIA 27
A fotografia de fundo de olho ou também chamada de retinografia digital, é feita
utilizando um aparelho chamado de retinógrafo digital. O procedimento pode ser realizado
com dilatação da pupila (midriática), ou sem dilatação da pupila (não-midriática). A
retinografia possui uma boa resolução, rapidez no foco e na captura da imagem, realiza
controle de iluminação, e utiliza filtros para remoção de algum espectro (por exemplo:
do vermelho), realiza angulação correta que varia de 30◦ a 45◦, e o aparelho tem uma
boa operabilidade (CARDOSO, 2016). Exemplo de um retinógrafo digital: TOPCON
TRC-NW8 Non-Mydriatic Retinal Câmera, este modelo possui uma câmera traseira com
resolução de 16.2 Megapixel com um campo de visão de 45◦, figura 7.
Figura 7 – Retinógrafo digital. TOPCON, modelo: TRC-NW8 Non-Mydriatic RetinalCamera.
Fonte: TOPCON 7.
3.3 Retinopatia Diabética
A Retinopatia Diabética (RD) é uma doença resultante de lesões na retina causadas
pela doença Diabetes Mellitus, a RD nas fases iniciais é assintomática, tem por característica
a presença de microaneurismas (DORION, 2002), que são alterações vasculares na retina
resultante de inchaços dos capilares, causados geralmente pela neovascularização, que em
imagens de fundo de olho são visto como pequenos pontos vermelhos, figura 8 (CARDOSO,
2016)(MELO, 2014).6 Disponível em: acessado em jun. 2017.7 Disponível em: acessado em jun. 2017.
-
Capítulo 3. CONCEITOS DE OFTALMOLOGIA 28
Figura 8 – Microaneurisma.
Fonte: Adaptado de (MOOKIAH et al., 2013).
A neovascularização (NV) produz sintomas como visão turva, distorção de linhas
retas e extremidades de objeto, e pontos difusos, devido o desenvolvimento de novos
vasos em alguns lugares da retina, exceto no disco óptico. A NV não é causada somente
pela RD, outras doenças também causam este tipo de problema como: retinopatia da
prematuridade (ROP)8, anemia da célula falciforme, hemoglobinopatias, beta-talassemia,
doença de Eales, síndromes de hiperviscosidade, leucemia, degeneração macular disciforme,
vitreorretinopatia familiar exsudativa, toxoplasmose, sarcoidose, histoplasmose, miopia,
estrias angióides, melanoma coróide, ruptura coróide, toxemia da gravidez, esclerose
múltipla, e também em algumas condições como o uso de drogas IV, ou a complicação de
fotocoagulação a laser e fatores angiogênicos também podem causar NV (DORION, 2002).
O surgimento de pontos com NV pode ocorre na superfície da retina, abaixo da
retina, ou na coróide. Quando a neovascularização ocorre na superfície e abaixo retina, o
paciente desenvolveu a Retinopatia Diabética não Proliferativa (RDNP), quando ocorre
na coróide o caso é de Retinopatia Diabética Proliferativa (RDP) (CARDOSO, 2016).
A evolução da DR passa por diferentes estágios, inicialmente o paciente não tem
nenhuma alteração na qualidade visual, do mesmo modo, a imagem do fundo de olho sofre
poucas alterações, com o tempo surgem outros sinais como: a neovascularização, os MAs,
as hemorragias (H) aumentam e surgem os exsudatos moles que se solidificam e ficam
duros, estes sinais são mostrados na figura 9. O paciente com DR, aos pouco observará
pioras na qualidade da visão, podendo ter melhoras caso haja absorção dos exsudatos e
hemorragias (HENDRICK; GIBSON; KULSHRESHTHA, 2015).
8 É alteração no crescimento da retina, que está indiretamente ligada à idade gestacional e ao peso doprematuro (OFTALMOPEDIATRIA, 2017).
-
Capítulo 3. CONCEITOS DE OFTALMOLOGIA 29
Figura 9 – Sinais da Retinopatia diabética.
Fonte: Adaptado de (ZAKI et al., 2016).
As hemorragias podem ser: pré-retinianas, normalmente volumosas com formato
arredondado e não provenientes da RD; intra-retinianas são lesões que variam a cor do
vermelho ao cinza escuro e são originadas de vazamentos dos vasos capilares, possuem
formato irregular com margem definida; vítreas, ocorrem na cavidade vítrea e obscurecem
a visão, estas hemorragias desaparecem em torno de 3 a 4 meses. Os exsudatos duros são
depósitos lipoprotéicos com coloração amarela-esbranquiçada, possuem aspecto brilhante
com margens bem delimitadas, e se localizam no polo posterior, próximo ou em volta da
mácula, alguns exsudatos dispersam em de 3 a 4 meses, outros permanecem durante muitos
anos (DORION, 2002), (CARDOSO, 2016) e (HENDRICK; GIBSON; KULSHRESHTHA,
2015).
-
30
4 CONCEITOS TEÓRICOS GERAIS
4.1 Conceitos de Processamento Digital de Imagens
O processamento digital de imagens consiste em manipular imagens digitais, imagens
que possuem valores de intensidade finitos, em um hardware digital como por exemplo um
computador. A imagem digital é uma função bidimensional representada por f(x, y) onde
x e y são coordenadas espaciais em um plano, f é a amplitude ou também chamada de
intensidade de cinza ou nível de cinza, em um ponto da imagem. Este ponto é localizado
no plano pelas coordenadas (x, y), devido ao fato que a intensidade assume valores finitos,
como falado anteriormente, a imagem então é caracterizada como sendo uma imagem
digital (GONZALEZ; WOODS, 2010).
Alguns passos são seguidos para se realizar o processamento de uma imagem digital
como a aquisição, pré-processamento, segmentação, obtenção de características, e por fim
o reconhecimento, estes passos são representados na figura 10 . A aquisição da imagem
é realizada por dispositivos que são vinculados a alguma aplicação como por exemplo:
câmera digital, digitalizador de imagens ou um retinógrafo digital (GONZALEZ; WOODS,
2010).
Na etapa pré-processamento da imagem, normalmente são aplicadas técnicas
como: filtragem para remoção de ruídos, realce que consiste em manipular de forma
subjetiva a imagem partindo da preferência humana, restauração que é uma manipulação
objetiva da imagem aplicando técnicas que se baseiam em modelos matemáticos. Já a
etapa de segmentação consiste em dividir a imagem nos objetos que a constituem. A
etapa da obtenção de características consiste na adoção de um sistema que represente
às características que se deseja buscar e descreva suas informações. A etapa final do
processamento digital de imagens, o reconhecimento é um processo que consiste em
atribuir rótulo a um determinado objeto com base na descrição dele, por exemplo: é
reconhecido como microaneurisma, pois tem formato circular são vermelhos e aparecem
isolados na imagem (GONZALEZ; WOODS, 2010).
-
Capítulo 4. CONCEITOS TEÓRICOS GERAIS 31
Figura 10 – Etapas para a realização do processamento de imagens.
Fonte: Adaptado de (GONZALEZ; WOODS, 2010).
Os sistemas utilizados para o processamento digital de imagens, se dividem basica-
mente em, (GONZALEZ; WOODS, 2010):
• sistemas de sensoriamento, cuja a função é a aquisição da imagem digital;
• hardware especializado em realizar operações lógicas e aritméticas em paralelo, é
utilizado para realizar operações matemáticas, a característica deste hardware é
realizar cálculos em alta velocidade;
• software de processamento de imagens consiste em módulos especializados em realizar
determinadas funções no processamento da imagem;
• sistema de armazenamento, este sistema é fundamental para o armazenamento das
imagens antes e depois de serem processadas;
• sistema de vídeo, que são monitores à cores que em conjunto das placas de vídeo
são utilizados para apresentar ao usuário do sistema de processamento às imagens
adquiridas e processadas, em alguns casos substitui o monitor e se utiliza um capacete
que possibilita a visualização estereoscópica (3-D) de algumas imagens, ele possui
dois pequenos monitores acoplados a um óculos;
-
Capítulo 4. CONCEITOS TEÓRICOS GERAIS 32
• sistemas de registo de imagens como impressoras, filmes fotográficos e mídias digitais.
4.2 Modelos de Cores
A técnicas de processamento digital de imagens são aplicadas em imagens com
escala de cinza ou em imagens coloridas, estas imagens são tratadas como matrizes. Para
as imagens coloridas existem alguns modelos principais de cores como: RGB (red, green,
blue), CMY (cyan, magenta, yellow), CMYK (cyan, magenta, yellow, black) e o HSI ( hue,
saturation, intensity). Modelo de cores pode ser definido como sendo "uma especificação
de um sistema de coordenadas e um subespaço dentro desse sistema no qual cada cor é
representada por um único ponto "(GONZALEZ; WOODS, 2010, p. 264).
Cada modelo citado no paragrafo acima é utilizado para um tipo de aplicação com
exceção do modelo HSI. O modelo RGB é utilizado em monitores coloridos e câmeras
de vídeo, os modelos CMY e CMYK são aplicados em impressoras que fazem impressão
colorida, já o HSI é um modelo que representa a forma como os humanos realizam a
descrição e interpretação das cores, este modelo tem a vantagem de separar as informações
referentes a cor das informações de escala de cinza (GONZALEZ; WOODS, 2010).
4.2.1 Modelo de cores RGB
No modelo RGB, figura 11, também chamado de sistema de cores aditivo, é formado
pela junção das cores primárias vermelho, verde e azul decompostas a partir da luz branca.
Este modelo tem como base um sistema de coordenadas cartesiana, possuindo um cubo
como subespaço, como mostrado na figura 12. As cores primárias vermelho, verde e azul
estão localizados sobre três vértices, e as cores secundárias que se localizam no vértice
oposto a elas são respectivamente ciano, magenta e amarelo, o preto se localiza no origem
do cubo que também é a origem do plano cartesiano, o branco esta localizado no vértice
oposto a origem, o segmento de reta que vai da cor preta até a cor branca, este segmento e
denominado escala de cinza, sobre ele os valores de R, G e B são iguais (ILUMINCAçãO,
2004) (GONZALEZ; WOODS, 2010).
-
Capítulo 4. CONCEITOS TEÓRICOS GERAIS 33
Figura 11 – Sistema de cores Aditivo.
Fonte: Adaptado de Developer Apple1.
Figura 12 – Cubo RGB.
Fonte: Digital Image Fundamentals2.
Imagens que utilizam o modelo de cores RGB possuem três canais, que são três
imagens, sendo que é um canal ou imagem para cada cor primária, estas imagens quando
projetadas em um monitor se juntam para formar uma única imagem de cores compostas,
como é exemplificado na figura 13 (GONZALEZ; WOODS, 2010).1 Disponível em: acessado em jul. 2017.2 Disponível em: aces-
sado em jul. 2017.
-
Capítulo 4. CONCEITOS TEÓRICOS GERAIS 34
Figura 13 – Formação de uma Imagem RGB em um monitor colorido.
Fonte: (GONZALEZ; WOODS, 2010).
4.2.2 Modelo de cores CMY e CMYK
O modelo de cores CMY, figura 14, é formado pelas cores secundárias ciano,
magenta e amarelo do modelo RGB. O modelo CMY também é chamado de sistema
subtrativo, pois a mistura das cores deste modelo tendem a cor preta (ILUMINCAçãO,
2004). É utilizado por dispositivos que realizam pigmentação sobre papel como impressoras
coloridas. Já o modelo CMYK surgiu quando se observou que ao somar todas cores base
do modelo CMY, o resultado não gerava realmente a cor preta, assim teve a necessidade
de adicionar uma quarta cor, a cor preta ao modelo CMY (GONZALEZ; WOODS, 2010).
Figura 14 – Sistema de cores Subtrativo.
Fonte: Adaptado de Developer Apple3.
-
Capítulo 4. CONCEITOS TEÓRICOS GERAIS 35
4.2.3 Modelo de cores HSI
Como foi falado anteriormente o modelo de cores HSI, figura 15, descreve como os
seres humanos interpretam as cores, decompondo-as em matiz-hue, saturação e intensidade-
brilho, e não em níveis de cores primárias como é feito no RGB e CYMK. A matiz descreve
a cor pura, por exemplo: amarelo, vermelho; saturação fornece a medida do grau de diluição
na presença de luz branca, por exemplo: vermelho escuro, azul claro; e o brilho não e
possível mensurar, mas incorpora a noção de acromática da intensidade, que possibilita
descrever a sensação de cores.
Figura 15 – Modelo de cores HSI.
a) b) c) d)
a) RGB. b) Matiz. c) Saturação. d) Intensidade. Fonte: Adaptado de Wikipedia4.
4.3 Métricas de Avaliação do Algoritmo de Segmentação de Ima-
gens
Os métricas de avaliação são utilizadas para avaliar a qualidade técnica aplicada no
algoritmo que realiza segmentação. A melhor maneira de avaliar o algoritmo é comparar os
resultados da segmentação realizada por este, com os resultados da segmentação realizada
por especialistas (MARTIN et al., 2001).
A algumas bases de imagens de fundo de olho fornecem uma máscara com a
segmentação realizada por especialistas. Esta segmentação feita por especialistas em
oftalmologia, utilizada para avaliar a qualidade da segmentação realizada pelo algoritmo é
denominada de ground truth, se for feita por mais de um especialista pode ser denominada
também de "padrão ouro "(CARDOSO, 2016). Tanto a base de imagens DRIVE quanto
a STARE, que serão utilizadas no trabalho fornecem ground truth dos vasos sanguíneos
presentes nas imagens de fundo de olho.3 Disponível em: acessado em jul. 2017.4 Disponível em: acessado em jul. 2017.
-
Capítulo 4. CONCEITOS TEÓRICOS GERAIS 36
4.3.1 Métricas de Avaliação
Após a realização da segmentação da imagem, algumas métricas podem ser de-
finidas para avaliar a qualidade da segmentação, métricas como: precisão, sensibilidade,
especificidade, entre outras. Tais métricas de avaliação são próprias para realizar avalia-
ções sobre a segmentação feita pelo algoritmo, estas métricas produzem resultados que
quantificam a performance do método aplicado no algoritmo. A segmentação gerada pelo
algoritmo deve ser tão boa quanto as segmentações manuais feitas pelos especialistas, as
quais são consideradas como "corretas"(CARDOSO, 2016).
Na tabela 1, SALEH; ESWARAN; MUEEN (2011), PURUSHARTHI; KURHADE
(2014) e MITTAPALLI; KANDE (2016) definem avaliações para o conjunto de pixels
segmentados que possivelmente pertence ao objeto alvo, no caso deste trabalho, os vasos
sanguíneos.
Tabela 1 – Avaliação para o conjunto de pixels segmentados.
Classificação Descrição
TP (True Positive)Conjunto de pixels identificados corretamente como o objeto alvo,tanto na imagem segmentada quanto no ground truth.
TN (True Negative)Conjunto de pixels identificado como não sendo o objeto alvo, tantona imagem segmentada quanto no ground truth.
FP (False Positive)Conjunto de pixels identificado como sendo o objeto alvo na imagemsegmentada, mas no ground truth este conjunto de pixels nãorepresenta o objeto alvo.
FN (False Negative)Conjunto de pixels identificado como não sendo o objeto alvo naimagem segmentada, mas no ground truth este conjunto de pixelsrepresenta o objeto alvo.
Dois conjuntos são definidos a partir da segmentação manual feito pelos especialistas,
ground truth, o conjunto A reúne todos os pixels pertencentes ao objeto alvo, enquanto
conjunto B reúne os pixels não pertencentes ao objeto alvo. PURUSHARTHI; KURHADE
(2014), WANG et al. (2015), MITTAPALLI; KANDE (2016) e FRANKLIN; RAJAN
(2014) propuseram as seguintes métricas para avaliação da qualidade do resultado da
segmentação:
True Positive Rate (TPR) - Taxa de verdadeiros positivos: É a fração de pixels identi-
ficados corretamente, pertencentes ao objeto alvo.
TPR =TP
A(4.1)
False Positive Rate (FPR) - Taxa de falsos positivos: É a fração de pixels identificados
erroneamente como pertencentes ao objeto alvo.
-
Capítulo 4. CONCEITOS TEÓRICOS GERAIS 37
FPR =FP
B(4.2)
Sensitivity (SN) - Sensibilidade: Quantifica a capacidade do método utilizado pelo
algoritmo em identificar corretamente o objeto alvo. O cálculo pode ser feito de duas
maneiras:
SN = TPR (4.3)
ou
SN =TP
TP + FN(4.4)
Especificity (SP) - Especificidade: Quantifica a capacidade do método utilizado pelo
algoritmo em identificar os pixels não pertencentes ao objeto alvo.
SP = 1 − FPR (4.5)
ou
SP =TN
TN + FP(4.6)
Accuracy (Acc) - Precisão: É a taxa de acertos (TP e TN) do método, em relação ao
total de pixels.
Acc =TP + TN
TP + FP + FN + TN(4.7)
Positive Predictive Value (PPV) - Valor Preditivo Positivo: Representa a probabili-
dade do pixel classificado como o objeto alvo ser realmente ele mesmo.
PPV =TP
TP + FP(4.8)
-
38
5 MATERIAIS E MÉTODOS
Este capítulo tem o objetivo de especificar as base públicas de imagens utilizadas no
trabalho, assim como, o método implementado para a segmentação dos vasos sanguíneos
encontrado na literatura.
5.1 Bases de Imagens
5.1.1 DRIVE
A base pública de imagens de fundo olho DRIVE (STAAL et al., 2004) foi criada
para permitir a comparação dos trabalhos sobre segmentação de vasos sanguíneos da retina.
Esta base possui 40 imagens de fundo de olho que foram obtidas aleatoriamente entre 400
imagens tiradas em um programa sobre retinopatia diabética, as imagens foram tiradas de
pessoas com idade entre 25 e 90 anos. Do total de 40 imagens, 33 não possuem nenhum
sinal de RD, e as outras 7 mostram sinais de RD. A figura 16 mostra algumas imagens
pertencentes a base.
Figura 16 – Exemplos de imagens do banco DRIVE.
(a) 03_test (b) 05_test (c) 08_test (d) 19_test
Fonte: do próprio autor.
As imagens foram capturadas usando uma câmera Canon CR5 não midriática CCD
com 45◦ campo de visão ou Field Of View (FOV). Cada imagem capturada utiliza uma
compressão JPEG , utilizando 8 bits por plano de cor, e a dimensão das imagens é 768x584
pixels.
As 40 imagens foram dividas pela metade, uma metade é classificada como imagens
de teste e as outras 20 restantes são classificadas como imagens de treinamento. As imagens
de teste possuem dois manuais de segmentação de vasos sanguíneos, um deles é usado
como "padrão ouro"ou também chamando de ground truth, o outro pode ser usado para
-
Capítulo 5. MATERIAIS E MÉTODOS 39
comparar segmentações geradas por computador com a segmentação de um observador
humano qualquer, chamado de segundo observador. Para as imagens de treinamento existe
um manual de segmentação dos vasos sanguíneos. Todos os manuais de segmentação desta
base foram criados por um oftalmologistas experientes e treinados, todos marcaram com
no mínimo de 70% de certeza de ser um vaso sanguíneo.
5.1.2 STARE
STARE (HOOVER, 2000) foi um projeto iniciado em 1975 pelo Dr. Michael
Goldbaum, na Universidade da California, este projeto foi financiado pelos Institutos
Nacionais de Saúde dos EUA. As imagens e os dados clínicos foram fornecidos pelo Shiley
Eye Center da Universidade da Califórnia, e pelo Veterans Administration Medical Center
em San Diego.
O banco de imagens contém 20 imagens da retina coloridas, com 700x605 pixels e 8
bits por canal RGB, capturado por uma câmera TopCon TRV-50 a 35◦ FOV. Possui dois
manuais de segmentação de Adam Hoover e Valentina Kouznetsova. A figura 17 mostra
imagens pertencentes a base.
Figura 17 – Exemplo de imagens do banco STARE.
(a) image 0004 (b) image 0082 (c) image 0255 (d) image 0324
Fonte: do próprio autor.
Adam Hoover marcou 10,4% de pixels como vaso, Valentina Kouznetsova 14,9%.
O desempenho dos algoritmos são calculados com as segmentações do Adam Hoover,
pois as segmentações dele são consideradas como o ground truth da base de imagens.
A comparação da segmentação da Valentina Kouznetsova com o ground truth dá uma
medida de desempenho de detecção que é considerada como um nível de desempenho a
ser alcançado, um nível alto de desempenho, pois a marcação dela é mais detalhada.
-
Capítulo 5. MATERIAIS E MÉTODOS 40
5.2 Método de Segmentação dos Vasos Sanguíneos
Nesta seção é explicado o método de segmentação de vasos sanguíneos que foi
implementado. Este método foi proposto por PATWARI et al. (2014) e, neste trabalho, ele
foi adaptado e aplicado nas bases de imagens DRIVE e STARE. Também serão explicados
os conceitos de processamento de imagens que não foram abordados no capítulo 4, mas
que foram empregados no método implementado.
Na figura 18 é apresentado o diagrama de blocos do método, mostrando o passo-
a-passo do método implementado no algoritmo que realiza a segmentação dos vasos
sanguíneos. O método foi dividido em doze passos que vão desde a leitura da imagem de
fundo de olho até concluir a segmentação dos vasos sanguíneos, em que o algoritmo gera a
imagem de fundo olho segmentada, apresentando os vasos sanguíneos marcados.
No método implementado a fase de pré-processamento da imagem inicia-se na etapa
2 e vai até a etapa 6 do diagrama de blocos, passando pelas seguintes etapas: Remoção do
canal verde, Complemento do canal verde, CLAHE, Abertura morfológica e Remoção do
disco óptico.
A seguir, cada etapa do diagrama de blocos será detalhada e a imagem resultante de
cada umas delas será apresentada. Conceitos novos que não foram abordados anteriormente
no trabalho serão explicados, assim que eles forem surgindo, para que o leitor tenha o
embasamento teórico para entender cada etapa do método de forma clara e simples.
O algoritmo foi implementado no software MATLAB R© que, por possuir o toolbox
de processamento de imagens, facilita o desenvolvimento de algoritmos.
-
Capítulo 5. MATERIAIS E MÉTODOS 41
Figura 18 – Diagrama do método.
1- Leitura da
Imagem RGB
2- Extração do Canal
Verde (Imagem)
3- Complemento
do Canal Verde
4- CLAHE
5- Abertura
Morfológica
6- Remoção do
Disco óptico
7- Filtro mediana
8- Remoção do
Background
9- Ajuste de contraste
10- Binarização
11- Remoção de
Objetos Espúrios
12- Detec-
ção de Bordas
13- Imagem de Saída
Fonte: do próprio autor.
-
Capítulo 5. MATERIAIS E MÉTODOS 42
1. Imagem de Entrada RGB
Esta etapa é a parte inicial, o algoritmo realiza a leitura da imagem, figura 19, e
armazena em forma de matriz para que nos passos seguintes realize o processamento
da imagem. As imagens da base de imagens utilizada possuem três canais, onde cada
canal possui 8 bits por pixel.
Figura 19 – Retinografia RGB.
Fonte: (STAAL et al., 2004)
2. Extração do Canal Verde da Imagem RGB
A partir da imagem RGB armazenada na memória, neste passo realiza-se a extração
do canal verde (G) da imagem. Isto se deve ao fato de que os objetos de aspecto
avermelhado como vasos sanguíneos, hemorragias e microaneurismas se apresentam
com maior contraste no canal verde (G), se comparado com os outros dois canais da
imagem: vermelho (R) e azul (B). A imagem resultante da extração do canal verde é
apresentada na figura 20.
-
Capítulo 5. MATERIAIS E MÉTODOS 43
Figura 20 – Canal Verde.
Fonte: do próprio autor.
3. Complemento do Canal Verde
Nesta etapa cria-se o complemento do canal verde, para transformar os objetos
escuros da imagem (vasos sanguíneos) em objetos claros. Esta operação foi realizada
para deixar os vasos sanguíneos mais claros e mais visíveis na imagem. O complemento
de imagem do canal verde é apresentado na figura 21.
Figura 21 – Complemento do Canal Verde.
Fonte: do próprio autor.
-
Capítulo 5. MATERIAIS E MÉTODOS 44
4. CLAHE (Contrasted Limited Adaptative Histogram Equalization)
O CLAHE é um algoritmo que foi desenvolvido para realce de imagens com baixo
contraste (imagens médicas). Ele divide a imagem em pequenas regiões chamadas de
tiles e, em cada uma dessas regiões, é aplicado equalização de histograma. Feito esta
operação, um limiar de nível de cinza é criado pelo usuário, os pixels com nível de
cinza acima deste limiar são redistribuídos entre as regiões da imagem que contém
pixels com nível de cinza abaixo deste limiar, (PIZER et al., 1990). Este limiar, é
responsável por limitar a amplificação do ruído na imagem.
Nesta etapa o CLAHE foi utilizado para realçar os vasos sanguíneos presentes na
imagem complemento do canal verde. Como se pode ver na figura 22, o algoritmo
realçou os vasos sanguíneos, assim como o resto da imagem.
Figura 22 – Resultado da aplicação do CLAHE no complemento do Canal Verde.
Fonte: do próprio autor.
5. Abertura Morfológica
A morfologia matemática é uma ferramenta utilizada para extrair objetos em uma
imagem, que são tratados como conjuntos. São úteis para representar ou descrever
uma dada região (GONZALEZ; WOODS, 2010).
A abertura morfológica da imagem é dada pela seguinte expressão (GONZALEZ;
WOODS, 2010):
-
Capítulo 5. MATERIAIS E MÉTODOS 45
f ◦ b = (f ⊖ b) ⊕ b (5.1)
f : Imagem.
b : Elemento Estruturante (ES).
Os elementos estruturantes são pequenas imagens, ou seja, pequenos conjuntos,
que são utilizados como "sondas"para examinar uma determinada imagem
procurando propriedades de interesse. Os elementos estruturantes em níveis
de cinza podem ser: planos, e não-planos. Os não-planos podem ser um ES
em formato de hemisfério como mostrado na figura 23a, que tem um perfil de
intensidade mostrado na figura 23c. Os planos podem ser um ES em formato de
disco figura 23b, a comprovação que este ES é plano pode ser visto pelo perfil
de intensidade na figura 23d.
Figura 23 – Exemplo de Elementos Estruturantes.
Fonte: (GONZALEZ; WOODS, 2010)
⊖ - Erosão : A erosão da imagem f por um elemento estruturante b em qualquer
posição da imagem (x, y), é calculada como sendo o valor mínimo da região
imagem que coincide com a região de b, quando a origem de b esta em (x, y). A
operação de erosão, assim como a operação de dilatação que será explicada a
seguir, é realizada de forma semelhante a operação de correlação, pois o ES faz
uma varredura na imagem. Portanto para calcular a erosão f por b, coloca-se a
origem do ES em todas as posições dos pixels da imagem. Após a operação de
erosão a imagem fica um pouco mais escura, os objetos escuros desta imagem
aumentam um pouco de tamanho, e os objetos mais claros reduzem de tamanho.
⊕ - Dilatação : A operação de dilatação é semelhante ao processo de erosão, mas
ao invés de calcular o valor minimo, calcula-se o valor máximo da região imagem
que coincide com a região de b, quando a origem de b esta em (x, y). O resultado
-
Capítulo 5. MATERIAIS E MÉTODOS 46
da dilatação é oposto ao resultado da erosão, os objetos mais claros aumentam
de tamanho, ou seja, ficam mais espessos, e os objetos mais escuros ficam com
tamanho reduzido, com detalhes mais escuros.
Após explicado os termos da expressão de abertura morfológica, pode-se ver que a
operação de abertura se resume em uma operação de erosão da imagem com o ES,
seguido por uma dilatação do resultado desta operação com o ES.
A abertura morfológica que geralmente suaviza o contorno de uma imagem, remove
pequenos detalhes claros, enquanto não alteram os níveis de cinza globais da imagem
nem os grandes objetos claros.
O objetivo de aplicar abertura morfológica nesta etapa foi eliminar os vasos sanguíneos
(apresentam-se como detalhes claros na imagem) restando o disco óptico, como objeto
principal na imagem de fundo de olho. A imagem resultante, figura 24, será utilizada
no passo seguinte para remoção do disco óptico.
Figura 24 – Imagem resultante da Abertura Morfológica.
Fonte: do próprio autor.
6. Remoção do Disco Óptico
Este passo no algoritmo tem por objetivo, remover o disco óptico da imagem de fundo
de olho, restando os objetos claros, os vasos sanguíneos e outros objetos espúrios.
A remoção do disco óptico é realizada da seguinte maneira: imagem de saída do
passo 4 é subtraída pela imagem de saída do passo 5. A imagem resultante desta
subtração, sem o disco óptico, é apresentada na figura 25.
-
Capítulo 5. MATERIAIS E MÉTODOS 47
Figura 25 – Imagem resultante após a remoção do Disco Óptico.
Fonte: do próprio autor.
7. Filtro Mediana
O filtro mediana é utilizado para remover ruído impulsivo da imagem. Este filtro
preserva as bordas (descontinuidade de intensidade) da imagem. A preservação destas
bordas será útil, para realizar a marcação dos vasos sanguíneos na imagem original. A
figura 26 apresenta a imagem resultante da filtragem do resultado do passo anterior,
utilizando um filtro mediana.
Figura 26 – Resultado após aplicação do Filtro Mediana.
Fonte: do próprio autor.
-
Capítulo 5. MATERIAIS E MÉTODOS 48
8. Remoção do Background
Nesta etapa a extração o background da imagem resultante do passo anterior, é
realizada para evidenciar ainda mais os objetos claros em relação a imagem de fundo,
com maior riqueza de detalhes, com o objetivo principal de evidenciar os vasos
sanguíneos.
A remoção do background é realizado da seguinte maneira: aplica-se abertura mor-
fológica na imagem resultante da filtragem pelo filtro mediana, gerando assim o
background, apresentado na figura 27a ( o gráfico de intensidade de cinza é mostrado
na figura 27b). Após isto, realiza-se a subtração da imagem filtrada pelo background,
gerando assim a imagem apresenta na figura 28.
Na figura 28 percebe-se a melhoria de detalhes dos vasos sanguíneos se comparado
com a figura 26, após remover o background.
Figura 27 – Background.
(a) Background. (b) Intensidade de Cinza do Background.
Fonte: do próprio autor.
-
Capítulo 5. MATERIAIS E MÉTODOS 49
Figura 28 – Resultado da remoção do Background.
Fonte: do próprio autor.
9. Ajuste de Contraste
Ajuste do contrate é aplicado nesta etapa, para aumentar o contrate dos vasos
sanguíneos em relação ao resto da imagem, deixando-os mais evidentes e melhorando,
assim, a riqueza de detalhes. A imagem produzida após o ajuste de contraste é
mostrado na figura 29.
Figura 29 – Ajuste de contraste da imagem.
Fonte: do próprio autor.
-
Capítulo 5. MATERIAIS E MÉTODOS 50
10. Binarização
A partir da imagem resultante do ajuste de contraste, figura 29, utiliza-se o método
de OTSU (1979) para localizar o limiar ótimo para realizar a binarização da imagem.
A ideia do método de OTSU (1979) é aproximar o histograma de uma imagem por
duas funções Gaussianas, escolhendo um limiar de forma a minimizar a variância
intra-classes, onde cada classe possui sua própria média e desvio-padrão.
A binarização é importante para definir bem os vasos (bordas) e eliminar objetos
espúrios, mas por consequência elimina também pequenos vasos, cujos os níveis de
cinza estão abaixo do limiar. A imagem resultante do processo de binarização é
mostrada na figura 30.
Figura 30 – Imagem Binária dos Vasos Sanguíneos.
Fonte: do próprio autor.
11. Remoção de Objetos Espúrios
Para remoção dos objetos espúrios o algoritmo utiliza a função bwareaopen, (GONZA-
LEZ; WOODS; EDDINS, 2004). Esta função remove objetos em uma imagem binária,
sendo que, inicialmente, define o tamanho do objeto na função pela quantidade pixels.
A função varre a imagem binária e, se um objeto é localizado na imagem, e este
possui uma menor quantidade de pixels que o objeto declarado na função, então este
objeto é removido. A figura 31 mostra a imagem binária após a remoção dos objetos
espúrios.
-
Capítulo 5. MATERIAIS E MÉTODOS 51
Figura 31 – Imagem após a remoção de objetos espúrios.
Fonte: do próprio autor.
12. Detecção de Bordas
A partir da imagem binária, figura 31, para realizar a marcação dos vasos na imagem
de saída o algoritmo utiliza a função bwboundaries, (GONZALEZ; WOODS;
EDDINS, 2004). Esta função detecta as bordas dos vasos sanguíneos e cria um vetor
com as localizações das bordas, para que este seja utilizado na marcação destes vasos
na imagem de saída.
13. Imagem de Saída
A figura 32 mostra a detecção dos vasos sanguíneos. A marcação dos vasos foi feita
a partir do vetor de localizações criado pela função bwboundaries.
Figura 32 – Resultado da detecção dos vasos sanguíneos.
Fonte: do próprio autor.
-
52
6 DISCUSSÃO E RESULTADOS
Neste capítulo apresenta os resultados obtidos com o algoritmo após testá-los nas
bases de imagens DRIVE e STARE. Cada base terá uma seção própria, onde serão expostos
os resultados.
Para facilitar o entendimento dos resultados presentes em cada coluna das tabelas,
um resumo das métricas apresentados no Capítulo 4 é feito a seguir:
• (Acc) - Precisão: É a taxa de acerto do método.
• (SN) - Sensibilidade: Quantifica a capacidade do método utilizado pelo algoritmo
em identificar corretamente o objeto alvo, possui o mesmo "significado"de (TPR) -
Taxa de verdadeiros positivos.
• (FPR) - Taxa de falsos positivos: É a fração de pixels identificados erroneamente
como pertencentes ao objeto alvo.
• (SP) - Especificidade: Quantifica a capacidade do método utilizado pelo algoritmo
em identificar os pixels não pertencentes ao objeto alvo.
• (PPV) - Valor Preditivo Positivo: Representa a probabilidade do pixel classificado
como o objeto alvo ser realmente ele mesmo.
6.1 Discussão e resultados - DRIVE
A discussão dos resultados desta seção abordará os resultados obtidos com a
segmentação dos vasos sanguíneos, utilizando as imagens da base DRIVE.
A figura 33 demonstra a segmentação dos vasos sanguíneos, utilizando uma imagem
da base. A figura 33a mostra a imagem original e a 33c mostra o ground truth, que
representa a marcação dos vasos sanguíneos por especialistas, ou também chamada por
muitos autores de vessel tree. A figura 33b apresenta os vasos sanguíneos marcados a partir
da segmentação gerada pelo método, esta segmentação é mostrada na figura 33d.
Visualmente a figura 33d apresenta um boa aproximação se comparada com a
figura 33c, (ground truth) que possui uma precisão muita alta da localização dos vasos. A
qualidade das imagens desta base ajuda o algoritmo a gerar resultados com alta precisão
na detecção dos vasos.
-
Capítulo 6. DISCUSSÃO E RESULTADOS 53
Figura 33 – Segmentação dos vasos sanguíneos de uma imagem da base DRIVE.
(a) Imagem Original. (b) Imagem Marcada.
(c) Ground truth. (d) Vasos sanguineos segmentados.
Fonte: do próprio autor.
Na figura 34, foram selecionadas aleatoriamente quatro imagens da base para
demonstrar a segmentação feita pelo algoritmo e compará-las visualmente com o ground
truth, e com a segmentação feita por um segundo observador. As imagens selecionadas
foram: 01_test, 04_test, 13_test e 18_test. Na figura 34, foi estruturada uma matriz de
imagens em que cada coluna é referente a uma das imagens usadas para teste. A primeira
linha da matriz apresenta as imagens originais; a segunda linha apresenta as imagens com
os vasos sanguíneos marcados pelo algoritmo; a terceira linha apresenta as segmentações
dos vasos sanguíneos de cada uma das imagens; a quarta linha apresenta o ground truth; e,
finalmente, a quinta linha apresenta a segmentação feita por um segundo observador.
-
Capítulo 6. DISCUSSÃO E RESULTADOS 54
Figura 34 – Amostra de imagens da base DRIVE .
(a) 01_test (b) 04_test (c) 13_test (d) 18_test
(e) (f) (g) (h)
(i) (j) (k) (l)
(m) (n) (o) (p)
(q) (r) (s) (t)
Fonte: do próprio autor.
-
Capítulo 6. DISCUSSÃO E RESULTADOS 55
A tabela 2 apresenta a avaliação de performance do método quando aplicado a cada
uma das 20 imagens de teste. Lembrando que esta base possui um total de 40 imagens,
porém, apenas 20 imagens são para teste enquanto as outras vinte são utilizadas em
métodos que necessitam de treinamento para a realização da segmentação, como métodos
que utilizam redes neurais.
Utilizando o ground truth para comparar com a segmentação do algoritmo, a melhor
precisão obtida por este, foi na imagem que possui o nome de 19_test, em que obteve-se
uma precisão de 97.108 %, e a pior precisão foi de 94.366 % obtida na imagem 08_test.
Tabela 2 – Resultado da segmentação das 20 imagens da base DRIVE.
Imagens Acc (%) SN, TPR (%) FPR (%) SP (%) PPV (%)01_test 96.19 71.192 1.361 98.639 83.67202_test 96.09 67.866 0.68981 99.31 91.803_test 94.813 69.82 2.4193 97.581 76.16504_test 95.575 55.347 0.34913 99.651 94.13905_test 95.662 59.608 0.61094 99.389 90.97906_test 95.438 61.62 0.91592 99.084 87.88507_test 95.111 64.576 1.8178 98.182 78.13108_test 94.366 71.19 3.4526 96.547 65.99809_test 95.445 67.683 2.1064 97.894 73.91610_test 96.073 59.865 0.68031 99.32 88.75411_test 95.125 62.321 1.65 98.35 78.78512_test 95.916 72.59 1.8795 98.121 78.49513_test 95.269 56.598 0.54048 99.46 91.90114_test 95.86 74.986 2.3035 97.697 74.11615_test 95.882 70.119 2.1322 97.868 71.71116_test 95.874 64.55 1.0168 98.983 86.30317_test 95.202 70.088 2.4832 97.517 72.23818_test 96.103 69.714 1.626 98.374 78.67619_test 97.108 75.032 0.89494 99.105 88.3520_test 96.251 71.214 1.7619 98.238 76.238
Média 95.668 66.799 1.5346 98.465 81.414
O método implementado obteve as seguintes médias: precisão 95.668 %, sensibilidade
66.799 %, taxa de falso positivo 1.5346 %, especificidade 98.465 % e valor preditivo positivo
81.414 %. Os valores da tabela 2 são plotados no gráfico da figura 35, para permitir
uma avaliação visual do desempenho do método a partir do resultado de cada imagem
segmentada apresentada na tabela 2.
-
Capítulo 6. DISCUSSÃO E RESULTADOS 56
Figura 35 – Gráfico dos resultados da tabela 2.
Fonte: do próprio autor.
A tabela 3 foi criada para mostrar os resultados da segmentação do método, com
relação a segmentação do segundo observador. A melhor precisão foi de 96.974 % obtida na
imagem 08_test, e a pior foi de 94.823 %. Os valores de precisão melhor e pior mudaram,
se comparado com a tabela 2, pois a marcação do segundo observador possui algumas
pequenas divergências em relação às marcações dos vasos. Isto altera os resultados das
métricas uma vez que elas levam em conta a segmentação do especialista para avaliar a
segmentação do método.
Mas os valores que mostram a eficiência do método, são aqueles valores obtidos
comparando a segmentação do método com a segmentação fornecida no ground truth.
Todos os autores que utilizam esta base de imagens para avaliar a eficiências dos métodos
desenvolvidos por eles, utilizam o ground truth como parâmetro de avaliação. Pois padro-
niza a forma como os resultados são obtidos, e assim pode-se comparar cada trabalho
desenvolvido que utiliza esta base de imagens para segmentar vasos sanguíneos.
A figura 36 possui o gráfico da tabela 3, onde mostra de forma visual os resultados
obtidos de segmentação, utilizando a segmentação do segundo observador como método
de comparação.
-
Capítulo 6. DISCUSSÃO E RESULTADOS 57
Tabela 3 – Resultado da segmentação das 20 imagens da base, utilizando a segmentaçãodo segundo observador.
Imagens Acc (%) SN, TPR (%) FPR (%) SP (%) PPV (%)01_test 96.363 72.615 1.362 98.638 83.62802_test 96.485 70.122 0.56114 99.439 93.33303_test 95.343 75.183 2.6879 97.312 73.20304_test 95.968 57.858 0.37236 99.628 93.71805_test 96.974 69.144 0.56344 99.437 91.56706_test 95.771 63.932 0.95881 99.041 87.25907_test 96.027 74.994 2.3504 97.65 71.10908_test 94.823 80.797 4.1763 95.824 57.99809_test 95.521 68.207 2.0791 97.921 74.24710_test 96.835 66.63 0.83091 99.169 86.10611_test 95.8 67.319 1.6155 98.385 79.08512_test 96.358 77.039 1.9545 98.046 77.48913_test 95.038 55.235 0.48016 99.52 92.83214_test 96.207 79.368 2.4332 97.567 72.47515_test 95.372 65.88 2.2509 97.749 70.23416_test 96.77 70.694 0.80398 99.196 89.10817_test 96.046 78.652 2.5654 97.435 70.99118_test 96.454 68.909 0.75825 99.242 90.19319_test 95.991 65.294 0.62749 99.373 91.97720_test 95.656 63.636 1.0761 98.924 85.785
Média 95.99 69.575 1.5254 98.475 81.617
Figura 36 – Gráfico dos resultados da tabela 3.
Fonte: do próprio autor.
-
Capítulo 6. DISCUSSÃO E RESULTADOS 58
Na tabela 4 apresenta a comparação da performance do método implementado com
outro métodos. Pode-se observar que o método implementado tem uma eficiência muito
boa pois possui uma precisão alta. O resultado de precisão do método implementado fica
abaixo apenas, do resultado levando em conta o segundo observador e abaixo também dos
próprios criadores do método de PATWARI et al., que conseguiram uma precisão de 98,02
% utilizando a mesma base de imagens (DRIVE).
A diferença de resultado da precisão obtida na implementação e o resultado obtido
no trabalho de PATWARI et al., pode ter sido causada por ajustes feitos pelos autores,
mas que não foram publicados, impossibilitando chegar a este resultado de precisão, ao
implementar o método criado por eles.
Tabela 4 – Comparação de performance com outros métodos de segmentação de vasossanguíneos - DRIVE.
Método Acc (%) SN, TPR (%) FPR (%) SP (%)
Método Implementado 95.668 66.799 1.5346 98.465Segundo Observador 95.99 69.575 1.5254 98.475
PATWARI et al. 98.02 98 0 0TAGORE et al. 95.31 - - -ASLANI; SARNEL 95.13 75.45 - 98.01FRANKLIN; RAJAN 95.03 68.67 - 98.24SHAH et al. 94.79 72.05 0.0186 -AKRAM; KHAN 94.69 - - -SOARES et al. 94.66 72.85 2.13 97.86MENDONÇA; CAMPILHO 94.52 73.44 2.36 97.64MARíN et al. 94.52 70.67 - 98.01STAAL et al. 94.41 73.45 - -FRAZ et al. 94.30 71.52 2.31 97.68
Apesar das imagens 20 imagens de treinamento não serem utilizadas para testar a
performance do método, tomou-se a liberdade de avaliar a segmentação do método para
estas 20 imagens. Na tabela 5 estão os resultados de segmentação para cada uma das
imagens de treinamento, todos os resultados foram obtidos comparando com o ground
truth. Esta tabela também pode ser vista em forma de gráfico na figura 37.
Os valores médios de precisão, sensibilidade, taxa de falso positivo, especificidade
e valor preditivo positivo foram respectivamente: 94.8 %, 67.004 %, 2.498 %, 97.502 %,
76.841 %.
-
Capítulo 6. DISCUSSÃO E RESULTADOS 59
Tabela 5 – Resultado da segmentação das 20 imagens de treinamento da base DRIVE.
Imagens Acc (%) SN, TPR (%) FPR (%) SP (%) PPV (%)21_training 96.742 67.236 0.87454 99.125 86.12922_training 95.77 59.489 0.62635 99.374 90.41523_training 85.863 79.925 13.718 86.282 29.10824_training 94.594 57.205 0.50595 99.494 93.67725_training 94.838 59.168 1.3745 98.626 82.04726_training 94.961 69.318 2.7005 97.299 70.06527_training 95.889 64.008 1.031 98.969 85.71228_training 95.459 61.648 0.88099 99.119 88.33829_training 96.096 64.47 1.0003 99 85.54630_training 95.446 68.139 2.23 97.77 72.2331_training 93.505 75.998 5.3715 94.628 47.58832_training 96.547 68.063 0.91624 99.084 86.8733_training 96.515 70.445 1.1907 98.809 83.88734_training 89.851 74.225 8.4536 91.546 48.7835_training 96.148 64.983 0.89299 99.107 87.35736_training 94.758 62.671 1.3272 98.673 85.21137_training 95.275 61.451 1.4855 98.515 79.84838_training 95.715 68.645 1.7281 98.272 78.95639_training 95.577 69.889 2.0082 97.992 76.58640_training 96.444 73.109 1.6435 98.357 78.48
Média 94.8 67.004 2.498 97.502 76.841
Figura 37 – Gráfico dos resultados da tabela 5.
Fonte: do próprio autor.
-
Capítulo 6. DISCUSSÃO E RESULTADOS 60
6.2 Discussão e resultados - STARE
Nesta seção apresenta os resultados obtidos com a segmentação dos vasos sanguíneos,
utilizando as imagens da base STARE. Esta base possui dois manuais de segmentação, um
feito por Adam Hoover, que é utilizado como ground truth e o outro feito por Valentina
Kouznetsova (segundo observador).
A figura 38 mostra quatro imagens, duas obtidas após a aplicação do método de
segmentação e as outras duas obtidas diretamente da base. A imagem 38a é uma imagem
da base STARE, a figura 38c é o ground truth desta imagem, estas duas foram obtidas no
banco de imagens. A figura 38b é o resultado da segmentação (figura 38d) marcada na
imagem original, estas duas imagens são geradas como resultado de saída do algoritmo.
Comparando a figura 38c com a figura 38d, pode-se perceber que o método produz uma
boa segmentação.
Figura 38 – Segmentação dos vasos sanguíneos de uma imagem da base STARE.
(a) Imagem Original. (b) Imagem marcada.
(c) Ground truth. (d) Vasos sanguíneos segmentados.
Fonte: do próprio autor.
-
Capítulo 6. DISCUSSÃO E RESULTADOS 61
Na figura 39 foi montada uma matriz de imagens utilizando as seguintes imagens:
image0077, image0081, image0162 e image0163 da base STARE, onde cada coluna repre-
senta uma imagem. Na primeira linha são dispostas as imagens originais, na segunda linha
as imagens marcadas a partir da segmentação feita pelo método implementado, na terceira
tem-se o ground truth, e na quarta a marcação dos vasos feita pelo segundo observador.
Figura 39 – Imagens segmentadas - STARE.
(a) image0077 (b) image0081 (c) image0162 (d) image0163
(e) (f) (g) (h)
(i) (j) (k) (l)
(m) (n) (o) (p)
(q) (r) (s) (t)
Fonte: do próprio autor.
-
Capítulo 6. DISCUSSÃO E RESULTADOS 62
A tabela 6 apresenta os resultados obtidos na segmentação das vinte imagens do
banco STARE. Estes resultados foram obtidos utilizando o ground truth como base de
comparaç