segmentaÇÃo de vasos sanguÍneos em imagens de fundo de olho · 2018. 4. 5. · sinais que...

72
ANDRÉ LUIZ ALMEIDA SILVA SEGMENTAÇÃO DE VASOS SANGUÍNEOS EM IMAGENS DE FUNDO DE OLHO UBERLÂNDIA 2017

Upload: others

Post on 31-Jan-2021

2 views

Category:

Documents


0 download

TRANSCRIPT

  • ANDRÉ LUIZ ALMEIDA SILVA

    SEGMENTAÇÃO DE VASOS SANGUÍNEOS

    EM IMAGENS DE FUNDO DE OLHO

    UBERLÂNDIA

    2017

  • ANDRÉ LUIZ ALMEIDA SILVA

    SEGMENTAÇÃO DE VASOS SANGUÍNEOS EM

    IMAGENS DE FUNDO DE OLHO

    Trabalho apresentado na Universidade Fede-ral de Uberlândia como requisito para conclu-são do curso de Engenharia Eletrônica e deTelecomunicações.

    Orientador: Prof.a Dr.a Milena Bueno Pereira Carneiro

    UBERLÂNDIA

    2017

  • Este trabalho é dedicado a minha avó Maria Lúcia (in memoriam) e ao meu avô Edvaldo

    que sempre me incentivaram a acreditar em meus sonhos.

  • Agradecimentos

    Quero agradecer primeiramente a Deus, que me deu forças e saúde para vencer

    dia após dia de luta durante a graduação. Foi meu refúgio e minha força em momentos

    difíceis.

    Quero agradecer aos meus avós Edvaldo e Maria Lúcia (in memoriam), pela minha

    criação e aos bons ensinamentos. Agradeço aos dois por tudo, pois acreditaram no meu

    potencial e me incentivaram a querer algo melhor e a acreditar no meu sonho de cursar

    engenharia.

    Agradeço a minha madrinha Cárita pelo carinho e dedicação comigo. Quero agra-

    decer meu primo Otávio Augusto pelo companheirismo

    Quero Agradecer minha mãe Kelly Cristina pela ajuda durante estes anos de

    graduação e aos bons conselhos. Ao meu pai Reginaldo Américo agradeço ao incentivo e a

    admiração que tem por mim.

    Agradeço também minha vó Márcia (in memoriam) que sempre se preocupou

    comigo, mesmo morando em outra cidade, ligava constantemente para saber como eu

    estava.

    Agradeço aos grandes e bons amigos que tenho. Amigos da graduação, do ônibus

    de estudantes, e amigos de anteriores a graduação.

    Agradeço a minha orientadora Milena, por me incentivar no desenvolvimento deste

    trabalho, por entender minhas dificuldades. Agradeço também a Cristiane, por permitir

    utilizar o trabalho de doutorado dela como base para o desenvolvimento deste trabalho.

    Agradeço aos professores que me forneceram conhecimento necessário para minha

    formação como engenheiro. Agradeço aos técnicos da FEELT, que sempre fizeram o possível

    para ajudar de uma forma ou de outra na obtenção de materiais para o desenvolvimento

    dos projetos durante a graduação.

  • “A felicidade não se resume na ausência de problemas,

    mas sim na sua capacidade de lidar com eles.”

    Albert Einstein

  • Resumo

    A retinopatia diabética é uma das principais doenças que ocorrem na retina e é causada por

    outra doença chamada diabetes Mellitus. A retinopatia apresenta sinais por meio da retina,

    sinais que auxiliam o médico oftalmologista diagnosticar se o paciente tem ou não diabetes

    Mellitus, analisando apenas as imagens de fundo de olho tiradas do paciente. Os sinais

    se apresentam em forma de aparecimento de microaneurismas, exsudatos, haemorragias,

    neovascularizações e alterações nos vasos sanguíneos.

    Este trabalho foi desenvolvido para estudar e implementar um método de segmentação

    de vasos sanguíneos da retina utilizando processamento de imagens. O objetivo é isolar

    os vasos sanguíneos para facilitar a análise do médico tanto dos vasos sanguíneos onde

    a retinopatia diabética também causa alterações, quanto do fundo da retina onde se

    apresentam os outros sinais desta doença. A análise manual das imagens de fundo de olho

    é muito criteriosa, pois os objetos presentes e os sinais da doença apresentam-se com um

    baixo contraste demandando um grande esforço visual do médico e contribuindo para a

    ocorrência de erros durante a análise.

    O método implementado foi testado nas bases de imagens de fundo de olho públicas

    DRIVE e STARE, disponibilizadas via internet. O método obteve uma precisão de 95.668

    % na base DRIVE, e 94.352 % na STARE.

    A detecção dos vasos sanguíneos pode ser utilizada como método de pré-processamento

    em trabalhos cujo objetivo seja detectar os outros sinais da retinopatia diabética, como a

    detecção de microaneurisma e exsudatos. Utilizando a detecção dos vasos como forma de pré-

    processamento, reduziram a taxa de erro, principalmente na detecção de microaneurismas,

    onde estes podem ser confundidos com os neovasos.

    Palavras-chave: Imagem de Fundo de Olho, Detecção, Vasos Sanguíneos, Retinopatia

    Diabética.

  • Abstract

    Diabetic retinopathy is one of the major diseases that occur in the retina and is caused

    by another condition called diabetes Mellitus. Retinopathy shows signs through of the

    retina, signs that aid the ophthalmologist diagnose whether or not the patient has diabetes

    Mellitus, analyzing only the eye fundus images of the eye taken from the patient. The

    signs are presented in the form of appearance of microaneurysms, exudates, haemorrhages,

    neovascularizations and alterations in the blood vessels.

    This work was developed to study and implement a method of segmentation of retinal

    blood vessels using image processing. The goal is to isolate blood vessels to facilitate

    medical analysis of both the blood vessels where diabetic retinopathy also causes changes

    as well as the fundus of the retina where other signs of this disease are present. The manual

    analysis of the eye fundus images is very careful, since the objects present and the signs of

    the disease present themselves with a low contrast requiring a great visual effort of the

    doctor and contributing to the occurrence of errors during the analysis.

    The implemented method was tested in the databases of public eye fundus images DRIVE

    and STARE, available through the internet. The method obtained an accuracy of 95.668

    % in the DRIVE base, and 94.352 % in the STARE.

    The detection of blood vessels can be used as a pre-processing method in studies aimed at

    detecting other signs of diabetic retinopathy, such as the detection of microaneurysms and

    exudates. Using the vessel detection of vessels as a form of pre-processing, they reduced

    the error rate, mainly in the detection of microaneurysms, where they can be confused

    with the neovessels.

    Keywords: Eye Fundus Image, Detection, Blood Vessels, Diabetic Retinopathy.

  • Lista de ilustrações

    Figura 1 – Olho Humano. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

    Figura 2 – Formação da imagem no olho humano. . . . . . . . . . . . . . . . . . . 24

    Figura 3 – Imagem de fundo de olho saudável. . . . . . . . . . . . . . . . . . . . . 25

    Figura 4 – Angiografia fluoresceínica. . . . . . . . . . . . . . . . . . . . . . . . . . 26

    Figura 5 – Fotografia red free do fundo de olho com retinopatia diabética. . . . . . 26

    Figura 6 – Fotografia colorida- RGB do fundo olho normal. . . . . . . . . . . . . . 26

    Figura 7 – Retinógrafo digital. TOPCON, modelo: TRC-NW8 Non-Mydriatic Re-

    tinal Camera. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

    Figura 8 – Microaneurisma. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

    Figura 9 – Sinais da Retinopatia diabética. . . . . . . . . . . . . . . . . . . . . . . 29

    Figura 10 – Etapas para a realização do processamento de imagens. . . . . . . . . . 31

    Figura 11 – Sistema de cores Aditivo. . . . . . . . . . . . . . . . . . . . . . . . . . 33

    Figura 12 – Cubo RGB. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

    Figura 13 – Formação de uma Imagem RGB em um monitor colorido. . . . . . . . 34

    Figura 14 – Sistema de cores Subtrativo. . . . . . . . . . . . . . . . . . . . . . . . . 34

    Figura 15 – Modelo de cores HSI. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

    Figura 16 – Exemplos de imagens do banco DRIVE. . . . . . . . . . . . . . . . . . 38

    Figura 17 – Exemplo de imagens do banco STARE. . . . . . . . . . . . . . . . . . . 39

    Figura 18 – Diagrama do método. . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

    Figura 19 – Retinografia RGB. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42

    Figura 20 – Canal Verde. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43

    Figura 21 – Complemento do Canal Verde. . . . . . . . . . . . . . . . . . . . . . . 43

    Figura 22 – Resultado da aplicação do CLAHE no complemento do Canal Verde. . 44

    Figura 23 – Exemplo de Elementos Estruturantes. . . . . . . . . . . . . . . . . . . 45

    Figura 24 – Imagem resultante da Abertura Morfológica. . . . . . . . . . . . . . . . 46

    Figura 25 – Imagem resultante após a remoção do Disco Óptico. . . . . . . . . . . 47

    Figura 26 – Resultado após aplicação do Filtro Mediana. . . . . . . . . . . . . . . . 47

    Figura 27 – Background. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48

    Figura 28 – Resultado da remoção do Background. . . . . . . . . . . . . . . . . . . 49

    Figura 29 – Ajuste de contraste da imagem. . . . . . . . . . . . . . . . . . . . . . . 49

    Figura 30 – Imagem Binária dos Vasos Sanguíneos. . . . . . . . . . . . . . . . . . . 50

    Figura 31 – Imagem após a remoção de objetos espúrios. . . . . . . . . . . . . . . . 51

    Figura 32 – Resultado da detecção dos vasos sanguíneos. . . . . . . . . . . . . . . . 51

    Figura 33 – Segmentação dos vasos sanguíneos de uma imagem da base DRIVE. . . 53

    Figura 34 – Amostra de imagens da base DRIVE . . . . . . . . . . . . . . . . . . . 54

    Figura 35 – Gráfico dos resultados da tabela 2. . . . . . . . . . . . . . . . . . . . . 56

  • Figura 36 – Gráfico dos resultados da tabela 3. . . . . . . . . . . . . . . . . . . . . 57

    Figura 37 – Gráfico dos resultados da tabela 5. . . . . . . . . . . . . . . . . . . . . 59

    Figura 38 – Segmentação dos vasos sanguíneos de uma imagem da base STARE. . . 60

    Figura 39 – Imagens segmentadas - STARE. . . . . . . . . . . . . . . . . . . . . . . 61

    Figura 40 – Gráfico dos resultados da tabela 6. . . . . . . . . . . . . . . . . . . . . 63

    Figura 41 – Gráfico dos resultados da tabela 7. . . . . . . . . . . . . . . . . . . . . 64

  • Lista de tabelas

    Tabela 1 – Avaliação para o conjunto de pixels segmentados. . . . . . . . . . . . . 36

    Tabela 2 – Resultado da segmentação das 20 imagens da base DRIVE. . . . . . . 55

    Tabela 3 – Resultado da segmentação das 20 imagens da base, utilizando a seg-

    mentação do segundo observador. . . . . . . . . . . . . . . . . . . . . . 57

    Tabela 4 – Comparação de performance com outros métodos de segmentação de

    vasos sanguíneos - DRIVE. . . . . . . . . . . . . . . . . . . . . . . . . 58

    Tabela 5 – Resultado da segmentação das 20 imagens de treinamento da base DRIVE. 59

    Tabela 6 – Resultado do teste nas 20 imagens da base STARE - ground truth. . . 62

    Tabela 7 – Resultado do teste nas 20 imagens da base STARE - Valentina Kouz-

    netsova. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64

    Tabela 8 – Comparação de performance com métodos de segmentação de vasos

    sanguíneos - STARE . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65

  • Lista de abreviaturas e siglas

    Acc Accuracy. Pg. 36

    CAD Computer Aided Diagnosis. Pg. 15

    CLAHE Contrast-Limited Adaptive Histogram Equalization. Pg. 41

    CMY Cyan, Magenta, Yellow. Pg. 31

    CMYK Cyan, Magenta, Yellow, Black. Pg. 31

    DRIVE Digital Retinal Images for Vessel Extraction. Pg. 17

    DM Diabetes Mellitus. Pg. 15

    DO Disco Óptico. Pg. 23

    ES Elemento Estruturante. Pg. 42

    FN False Negative. Pg. 35

    FOV Field of View. Pg. 37

    FP False Positive. Pg. 35

    FPR False Positive Rate. Pg. 35

    H Hemorragias. Pg. 27

    HSI Hue, Saturation, Intensity. Pg. 31

    MA Microaneurisma. Pg. 15

    NV Neovascularização. Pg. 27

    PPV Positive Predictive Value. Pg. 36

    RD Retinopatia Diabética. Pg. 26

    RDNP Retinopatia Diabética não Proliferativa. Pg. 27

    RDP Retinopatia Diabética Proliferativa. Pg. 27

    RGB Red, Green, Blue. Pg. 31

    ROP Retinopatia da Prematuridade. Pg. 27

  • SN Sensitivity. Pg. 36

    SP Especificity. Pg. 36

    STARE STructured Analysis of the Retina. Pg. 17

    TN True Negative. Pg. 35

    TP True Positive. Pg. 35

    TPR True Positive Rate. Pg. 35

    WHO World Health Organization. Pg. 35

  • Lista de símbolos

    ◦ Abertura Morfológica.

    ⊕ Dilatação.

    ⊖ Erosão.

    R© Marca Registrada.

  • Sumário

    1 INTRODUÇÃO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

    1.1 Justificativa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

    1.2 Objetivo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

    1.2.1 Objetivos Específicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

    1.3 Estrutura do Trabalho . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

    2 ESTADO DA ARTE . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

    2.1 Trabalhos sobre detecção de vasos sanguíneos . . . . . . . . . . . . . 20

    2.1.1 Método de DUA; KANDIRAJU; THOMPSON (2005) . . . . . . . . . . . . 20

    2.1.2 Método de MENDONÇA; CAMPILHO (2006) . . . . . . . . . . . . . . . . 20

    2.1.3 Método de SOARES et al. (2006) . . . . . . . . . . . . . . . . . . . . . . 20

    2.1.4 Método de AKRAM; KHAN (2013) . . . . . . . . . . . . . . . . . . . . . 21

    2.1.5 Método de TAGORE et al. (2013) . . . . . . . . . . . . . . . . . . . . . . 21

    2.1.6 Método de FRANKLIN; RAJAN (2014) . . . . . . . . . . . . . . . . . . . 21

    2.1.7 Método de ASLANI; SARNEL (2016) . . . . . . . . . . . . . . . . . . . . 21

    2.1.8 Método de SHAH et al. (2017) . . . . . . . . . . . . . . . . . . . . . . . . 22

    3 CONCEITOS DE OFTALMOLOGIA . . . . . . . . . . . . . . . . . . 23

    3.1 Estruturas do Olho Humano . . . . . . . . . . . . . . . . . . . . . . . 23

    3.2 Exame de Fundo de Olho . . . . . . . . . . . . . . . . . . . . . . . . . 25

    3.3 Retinopatia Diabética . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

    4 CONCEITOS TEÓRICOS GERAIS . . . . . . . . . . . . . . . . . . . 30

    4.1 Conceitos de Processamento Digital de Imagens . . . . . . . . . . . 30

    4.2 Modelos de Cores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32

    4.2.1 Modelo de cores RGB . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32

    4.2.2 Modelo de cores CMY e CMYK . . . . . . . . . . . . . . . . . . . . . . . 34

    4.2.3 Modelo de cores HSI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

    4.3 Métricas de Avaliação do Algoritmo de Segmentação de Imagens . 35

    4.3.1 Métricas de Avaliação . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

    5 MATERIAIS E MÉTODOS . . . . . . . . . . . . . . . . . . . . . . . 38

    5.1 Bases de Imagens . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

    5.1.1 DRIVE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

    5.1.2 STARE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39

    5.2 Método de Segmentação dos Vasos Sanguíneos . . . . . . . . . . . . 40

  • 6 DISCUSSÃO E RESULTADOS . . . . . . . . . . . . . . . . . . . . . 52

    6.1 Discussão e resultados - DRIVE . . . . . . . . . . . . . . . . . . . . . 52

    6.2 Discussão e resultados - STARE . . . . . . . . . . . . . . . . . . . . . 60

    7 CONCLUSÃO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66

    7.1 Sugestão de Trabalhos Futuros . . . . . . . . . . . . . . . . . . . . . . 66

    7.2 Publicações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67

    REFERÊNCIAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68

  • 16

    1 INTRODUÇÃO

    Com o avanço da tecnologia, houve uma melhoria na aquisição e no processamento

    de imagens digitais, possibilitando a extração de informação a partir de imagens médicas

    que antes não era possível. Isso motivou a pesquisa e o desenvolvimento de sistemas de

    Diagnostico Auxiliado por Computador (CAD-Computer Aided Diagnosis), que auxiliam

    os médicos no tratamento de doenças. Este auxílio se dá através da medição de estruturas,

    fazendo comparação sequencial de imagens, e prevenindo erros cometidos por trabalho

    humano repetitivo, fazendo com que o médico diagnostique alguma doença com maior

    precisão, planejando com maior eficiência o tratamento do paciente (MELO, 2014).

    Na oftalmologia, as retinografias digitais podem fornecer informações sobre algumas

    doenças oculares, estas podem ser apenas doenças locais, ou podem ser indícios de doenças

    sistemáticas como a hipertensão ou Diabetes Mellitus (DM). Cada vez mais se utiliza

    técnicas de processamento de imagens, como a segmentação de estruturas da retina para

    detecção de Retinopatia Diabética (RD). A RD é uma complicação do DM, que é a maior

    causadora de redução de visão, ou até mesmo cegueira em diabéticos. Trata-se de uma

    doença assintomática que durante a fase inicial é de difícil identificação, provoca alterações

    nos vasos sanguíneos da retina e causa inchaços nos capilares, inchaço denominado de

    microaneurisma (MA) (MELO, 2014).

    Detectando-se a RD em sua fase inicial e executando um tratamento precoce,

    menores serão as chances do paciente diabético reduzir ou perder a visão completamente.

    O diagnóstico é feito por um médico oftalmologista, por meio de exame visual clínico. A

    precisão do diagnóstico depende de vários fatores, principalmente tais como: a qualidade

    da retinografia, a habilidade e experiência do médico que realiza o exame (MELO, 2014).

    Os sistemas CAD contribuirão para uma maior precisão de diagnóstico, reduzindo erros

    humanos, e detectando os possíveis indícios de RD.

    O processo de segmentação subdivide a imagem em partes de interesse, podendo ser

    objetos ou regiões que compõem a imagem. Ou seja, a segmentação consiste em segmentar,

    parcelar a imagem até o momento em que o objeto ou região de interesse seja localizado,

    satisfazendo o critério determinado pela aplicação. A segmentação se torna mais complexa

    a partir do momento que necessita-se de maior precisão. A maioria dos algoritmos de

    segmentação se baseiam em valores de intensidade, e são divididos em duas categorias: na

    primeira os algoritmos segmentam a partir da detecção de descontinuidades, mudanças

    bruscas de intensidade, e na segunda categoria segmentam imagens em regiões a partir de

    critérios de similaridade predefinidos (GONZALEZ; WOODS, 2010).

  • Capítulo 1. INTRODUÇÃO 17

    1.1 Justificativa

    A World Health Organization (WHO) - Organização Mundial da Saúde, classifica a

    função visual em quatro níveis sendo: visão normal, deficiência visual moderada, deficiência

    visual grave e cegueira. A deficiência visual moderada, com a deficiência visual grave

    agrupadas, são denominadas pelo termo baixa visão. Todas as deficiências visuais são

    representadas pela baixa visão e a cegueira. Estima-se que existem 285 milhões de pessoas

    com deficiência visual em todo mundo, uma parcela de 39 milhões do total são cegos, e

    outra parcela de 246 milhões têm baixa visão. Sendo que, 80% das deficiências visuais

    podem ser evitadas ou curadas (WHO, 2014).

    Uma solução viável e de baixo custo para o tratamento destes pacientes é o

    diagnóstico realizado utilizando processamento digital de imagens, que pode ser executado

    com eficiência e precisão. Utilizando processamento de imagens, são feitas uma série de

    operações com a imagem, que são dividas em etapas, sendo que a principal etapa é a

    segmentação da imagem que, como foi dito anteriormente, consiste em dividir a imagem

    até localizar a região ou objeto de interesse. Diversas doenças em oftalmologia podem

    ser segmentadas, podendo ser feito um diagnóstico automático ou semiautomático (que

    exige a validação de um especialista em oftalmologia). Alguns exemplos destas doenças

    são: degeneração macular relacionada a idade, glaucoma, retinopatia diabética, retinopatia

    da prematuridade, e catarata (GUO et al., 2015).

    Pacientes com diabetes requerem uma maior atenção, pois uma das suas principais

    complicações é a RD, podendo causar cegueira caso não seja realizado um tratamento

    adequado. Após os 20 anos de idade, 99% dos pacientes que possuem diabetes tipo 1, e

    60% dos pacientes que possuem diabetes do tipo 2, possuem algum grau de retinopatia

    diabética (HENDRICK; GIBSON; KULSHRESHTHA, 2015). Assim, é recomendado a

    estes pacientes que realizem exames de fundo de olho pelo menos uma vez ao ano. Devido

    a isso, e ao fato de que a quantidade de pessoas com diabetes cresce vertiginosamente, a

    demanda por este exame de fundo de olho é crescente (KÖSE et al., 2012). Em grande

    parte dos países os exames realizados para diagnosticar RD, são feitos de forma manual

    (ZAKI et al., 2016). Uma vez detectada a RD, o tratamento é feito com laser ou injeção de

    medicamentos no olho afetado, sendo que estes tratamentos não deixam nenhuma sequela.

    É importante ressaltar que, além da diabetes, outras doenças necessitam acom-

    panhamento por meio de retinografias. A análise manual das retinografias, requer um

    especialista em oftalmologia treinado para analisar um grande número de retinografia. O

    baixo contraste dos sinais causados pelas doenças dificulta a diferenciação entre objetos na

    imagem e os sinais da doença. Isto compromete a eficiência da segmentação manual feita

    por especialista e provoca erros durante a operação (KÖSE et al., 2012). Devido a isto,

    utilizar às técnicas de processamento de imagens para criação um processo automático ou

    semiautomático de análise, pode ser uma alternativa com maior confiabilidade em relação

  • Capítulo 1. INTRODUÇÃO 18

    à análise manual.

    1.2 Objetivo

    Os vasos sanguíneos presentes na retina são uma das estruturas mais importantes,

    pois fornecem sangue para a retina além de transmitirem sinais da retina para o cérebro

    (FRANKLIN; RAJAN, 2014).

    Mudanças causadas nestes vasos sanguíneos servem como marcadores biológicos,

    que podem ser utilizados para detectar algum tipo de doença como a retinopatia diabética.

    As mudanças nos vasos podem ser: no formato, largura, tortuosidade, padrão de ramificação

    (FRANKLIN; RAJAN, 2014).

    Uma vez que a retinopatia diabética se manifesta de forma a provocar alterações

    nos vasos sanguíneos, para se criar um método automático de detecção de retinopatia faz

    se necessário a detecção automática dos vasos sanguíneos como forma de pré-processar

    a imagem de fundo de olho antes de realizar a detecção automática de microaneurisma

    e hemorragias causadas pela retinopatia diabética. Conhecendo a localização dos vasos,

    estas localizações podem ser usadas para diminuir a taxa de falso positivos em relação a

    detecção de microaneurismas e hemorragias (AQUINO, 2011).

    A detecção dos vasos sanguíneos pode ser útil para outros fins clínicos como:

    avaliação da retinopatia da prematuridade (HENEGHAN et al., 2002), estreitamento

    arteriolar (HATANAKA et al., 2004), tortuosidade dos vasos para caracterização da

    retinopatia hipertensiva (FORACCHIA; GRISAN; RUGGERI, 2001), medição do diâmetro

    dos vasos sanguíneos para diagnosticar hipertensão e doenças cardiovasculares (LOWELL

    et al., 2004),e cirurgia a laser assistida por computador (BACKER et al., 1998).

    Portanto, o objetivo geral desse trabalho é estudar e implementar técnicas de

    segmentação de vasos sanguíneos em imagem de fundo de olho presentes na literatura,

    utilizando os banco públicos de imagens: Digital Retinal Images for Vessel Extraction

    (DRIVE) (STAAL et al., 2004) e STructured Analysis of the Retina (STARE) (HOOVER,

    2000). Visa-se automatizar a detecção dos vasos sanguíneos, podendo ser utilizado em

    aplicações futuras para auxiliar a detecção automática da RD.

    1.2.1 Objetivos Específicos

    Para cumprir o objetivo desse trabalho algumas tarefas devem ser realizadas:

    • Obter as imagens das bases públicas DRIVE e STARE .

    • Compreender e descrever as características das imagens de fundo de olho.

  • Capítulo 1. INTRODUÇÃO 19

    • Estudar e implementar técnicas de pré-processamento das imagens de fundo de olho

    visando melhorar a eficiência da detecção dos vasos sanguíneos.

    • Estudar técnicas para a segmentação de vasos sanguíneos em imagens de fundo de

    olho;

    • Testar e garantir a confiabilidade do algoritmo implementado, utilizando métricas

    que atestam a qualidade do método de segmentação aplicado pelo algoritmo.

    • Comparar os resultados de performance do algoritmo com outros trabalhos publica-

    dos.

    1.3 Estrutura do Trabalho

    Este trabalho foi dividido em cinco capítulos, os próximos quatro capítulos são

    descritos abaixo:

    Capítulo 2 Aborda alguns trabalhos feitos sobre métodos de segmentação de vasos

    sanguíneos.

    Capítulo 3 Fornece o conhecimento básico necessário sobre oftalmologia, para que o

    leitor possa entender o trabalho com clareza.

    Capítulo 4 Aborda conceitos básicos sobre processamento digital de imagens, e métricas

    usadas para avaliar métodos de segmentação utilizados em algoritmos.

    Capítulo 5 Descreve as bases públicas de imagens de fundo de olho utilizadas, e explica

    o algoritmo de segmentação implementado e aplicado nas bases de imagens.

    Capítulo 6 Mostra os resultados da performance do algoritmo de segmentação ao aplicá-lo

    nas duas bases de imagens.

    Capítulo 7 Conclusão do trabalho.

  • 20

    2 ESTADO DA ARTE

    2.1 Trabalhos sobre detecção de vasos sanguíneos

    Neste capítulo será abordado trabalhos desenvolvidos com o objetivo de realizar a

    detecção dos vasos sanguíneos presentes em imagens da retina.

    2.1.1 Método de DUA; KANDIRAJU; THOMPSON (2005)

    DUA; KANDIRAJU; THOMPSON (2005) desenvolveram uma técnica para a

    detecção de vasos sanguíneos, que se baseia em uma decomposição recursiva de regiões

    utilizando Quadtrees que são estruturas de dados espaciais usada para representar uma

    região e posteriormente uma filtragem de bordas. A técnica criada pelos autores fornece

    informações sobre os vasos sanguíneos da retina, informações que são úteis para a detecção

    de anomalias nos vasos sanguíneos e assim detectar precocemente Retinopatia Diabética.

    2.1.2 Método de MENDONÇA; CAMPILHO (2006)

    MENDONÇA; CAMPILHO (2006), o algoritmo desenvolvido inicia os passos de

    segmentação dos vasos sanguíneos extraindo as linhas centrais dos vasos, esta linhas

    são utilizadas com linhas guias para completar as fases dos vasos. As saídas de quatro

    operadores diferenciais direcionais são processadas para selecionar conjuntos de pontos

    candidatos conectados e assim serem classificados como pixels de linha central usando

    recursos provenientes das características dos vasos. A segmentação dos vasos ocorre

    utilizando uma método iterativo de região de crescimento que integra o conteúdo de várias

    imagens binárias resultantes de filtros morfológicos que dependem da largura do vasos

    sanguíneos. O algoritmo foi testado em ambas base públicas de imagens DRIVE e STARE

    e obteve-se bons resultados.

    2.1.3 Método de SOARES et al. (2006)

    SOARES et al. (2006) criaram um método que classificam os pixels da imagem de

    fundo de olho como sendo ou não vasos sanguíneos, esta classificação é baseada em um

    vetores de características. Os vetores de características são composto pelas intensidade

    dos pixels e pela repostas bidimensionais criadas a partir transformadas wavelet de Gabor

    aplicando múltiplas escalas. A utilização da transformada de wavelet de Gabor permite

    detectar frequências específicas, filtra-las, e melhorar o contraste dos vasos sanguíneos. Os

    autores utilizaram um classificador Bayesiano com funções de densidade de probabilidade

  • Capítulo 2. ESTADO DA ARTE 21

    condicionais de classe que produz uma classificação rápida, estas distribuições de probabi-

    lidade são estimadas a partir dos pixels marcados na segmentação manual das bases de

    imagens.

    2.1.4 Método de AKRAM; KHAN (2013)

    AKRAM; KHAN (2013) propuseram um metodo que utiliza Gabor Wavelet 2D,

    pois melhora o contraste de estruturas direcionais e aplica uma técnica de limiar multi-

    camada que aumenta a precisão na segmentação dos vasos sanguíneos. A técnica proposta

    pelos autores funciona muito bem, mesmo se imagem apresentar grandes variações de

    iluminação, o método segmenta até os vasos sanguíneos mais finos. O método foi testado

    em duas bases de imagens de fundo de olho públicas sendo elas, DRIVE e STARE.

    2.1.5 Método de TAGORE et al. (2013)

    TAGORE et al. (2013) desenvolveram um método automático de segmentação que

    o utiliza os canais vermelho e verde da mesma imagem do fundo de olho para corrigir

    a não-uniformidade da iluminação da imagem de fundo de olho. Feito isto utilizaram

    Phase Congruency para melhorar o contraste dos vasos sanguíneos. Após o aumento de

    contraste dos vasos sanguíneos, estes são segmentados utlizando Hierarchical Clustering

    que se baseia em um Histogram Thresholding.

    2.1.6 Método de FRANKLIN; RAJAN (2014)

    FRANKLIN; RAJAN (2014) desenvolveram um método que classifica os pixels da

    imagem de fundo de olho como sendo vasos sanguíneos ou não vasos, e assim segmenta

    os vasos sanguíneos na retina. A tarefa de classificar como vasos ou não vasos feito por

    uma rede neural Multilayer perceptron as entradas desta rede neural são derivadas das três

    camadas RGB, vermelho, verde e azul. O algoritmo Back propagation empregado, pois

    fornece uma técnica eficiente de mudança de pesos na rede neural utilizando realimentação.

    2.1.7 Método de ASLANI; SARNEL (2016)

    ASLANI; SARNEL (2016) propuseram um método de segmentação de vasos san-

    guíneos que combina um conjunto robusto de características provenientes de diferentes

    algoritmos em um vetor hibrido que possui características utilizadas para a caracterização

    de pixels. Este vetor de características é resultado da reposta de 13 filtros Gabor com

    diferentes configurações, como intensidade de aumento de contraste, intensidade transfor-

    mada Top-Hat, medidas de vasos sanguíneos da retina, e a reposta do filtro B- COSFIRE.

    Escolheram um classificador chamado de Random Forest, que foi treinado com o vetor de

    características híbrido. Este classificador foi escolhido devido sua simplicidade, velocidade

  • Capítulo 2. ESTADO DA ARTE 22

    de execução e capacidade de fusão de informações. A combinação escolhida dos diferentes

    tipos de características resulta em informações que permite melhor discriminação para

    pixels de vasos e não-vasos em imagens retina.

    2.1.8 Método de SHAH et al. (2017)

    SHAH et al. (2017) propuseram um método para segmentação de vasos sanguíneos

    baseado em um detector de características Hessiano. A partir de uma base pública de

    imagens de fundo de olho RGB (DRIVE). A partir da imagens de fundo de RGB, o método

    proposto converte esta para escala de cinza, para melhorar o contraste dos objetos escuros

    na imagem como os vasos sanguíneos, realiza-se um produto ponto-a-ponto entre a imagem

    em escala de cinza e ela mesma e para retificar o contraste dos objetos escuros utilizou-se um

    filtro janela 5x5 para cada pixel. Este método extrair um total de 24 características baseado

    em 5 regiões de características, uma de intensidade e duas características Hessian por

    escala, onde se utiliza 9 escalas. Um Linear Minimum Squared Error (LMSE) foi utilizado

    para classificar os pixels como vasos sanguíneos e em não vasos, as 20 imagens especificas

    para treinamento do banco de imagens DRIVE foram utilizadas para o treinamento do

    LMSE, e o restante das imagens foram utilizadas para teste.

  • 23

    3 CONCEITOS DE OFTALMOLOGIA

    3.1 Estruturas do Olho Humano

    O olho humano possui um sistema muito sofisticado que se adapta conforme a

    luminosidade do ambiente e conforme o foco, podendo privilegiar o ambiente como um

    todo ou focar em um objeto de interesse. As principais estruturas do olho são: a córnea, o

    cristalino, a íris, a pupila, a retina, a fóvea, o disco óptico, os vasos sanguíneos e o nervo

    óptico. Estas estruturas são mostradas na figura 1.

    Figura 1 – Olho Humano.

    Fonte: Adaptado de Bionic Vision1

    Na parte externa do olho encontram-se: a córnea, parte branca do olho, e a esclera

    que é a camada transparente que recobre a íris. O coróide é localizado em uma parte

    intermediária, e tem a função de realizar a nutrição do olho, o corpo ciliar é responsável por

    produzir humor vítreo que é o gel que preenche a cavidade interna do olho, e é responsável

    também por regular a convexidade do cristalino, a íris tem função de proteger a retina e

    dar cor aos olhos (DORION, 2002). A pupila localiza-se na íris, e tem função semelhante

    a um diafragma abrindo e fechando dependendo da luminosidade do ambiente. O humor

    aquoso fica armazenado entre a córnea e o cristalino, e se renova constantemente.

    A formação da imagem no olho é um pouco diferente da formação de uma imagem

    em uma câmera fotográfica comum. Na câmera a distância focal é fixa, e a focalização do

    objeto é obtida variando a distância entre a lente e o plano-imagem, como um chip de

    captura de imagem que é o caso de uma câmera digital. No olho a formação de imagem1 Disponível em: acessado em jun. 2017.

  • Capítulo 3. CONCEITOS DE OFTALMOLOGIA 24

    ocorre de forma oposta: a distância entre a lente e o plano-imagem, respectivamente

    cristalino e retina, é fixa, a distância focal adequada para focalizar o objeto é obtida

    variando o cristalino, que funciona semelhante a uma lente flexível. Esta variação do

    cristalino é promovida por fibras zonulares, que achatam o cristalino para focalizar objetos

    distantes, ou alongam este para focalizar objetos próximos. A distância ao longo do eixo

    visual entre o centro do cristalino e a retina é aproximadamente 17 mm, já a distância

    focal varia de 14 mm a 17 mm, a distância focal de 17 mm ocorre quando o olho está

    relaxado e focado em distâncias maiores do que cerca 3 m (GONZALEZ; WOODS, 2010).

    A imagem produzida sobre a retina é focalizada principalmente na área da fóvea, a

    percepção, ocorre pela excitação dos receptores de luz, que transformam a energia radiante

    em impulsos elétricos, os quais posteriormente são decodificados pelo cérebro (GONZALEZ;

    WOODS, 2010). A figura 2 exemplifica a formação da imagem no olho humano.

    Figura 2 – Formação da imagem no olho humano.

    Fonte: Bionic Vision2

    A figura 3 mostra uma imagem de fundo de olho, onde pode-se identificar algumas

    estruturas importantes como:

    • Disco óptico (DO): é a parte do nervo óptico vista no fundo dos olhos, tem uma

    estrutura circular de diâmetro médio 1,5 mm, com tonalidade esbranquiçada e bordas

    bem definidas. Como o disco óptico não possui células sensíveis à luz, ele corresponde

    ao ponto cego da visão humana, é imperceptível ao ser humano, pois o cérebro utiliza

    a informação do outro para cobrir este ponto cego (MELO, 2014).

    • Mácula: é uma área circular da retina com diâmetro de 0,22 mm, apresenta uma

    área com tonalidade mais escura se comparado com o restante do fundo ocular.

    A mácula é a parte de maior importância do fundo ocular, pois é área de maior

    sensibilidade visual para percepção de detalhes (MELO, 2014).2 Disponível em: acessado em jun. 2017.

  • Capítulo 3. CONCEITOS DE OFTALMOLOGIA 25

    • Fóvea: é uma depressão com aproximadamente 0.10 mm de diâmetro e está localizada

    no centro da mácula, concentra grande parte das células fotorreceptoras (MELO,

    2014).

    • Vasos Sanguíneos: Os vasos sanguíneos presente na retina ramificam do disco

    óptico para a periferia. A artéria central da retina penetra no globo ocular através

    do disco óptico, esta artéria tem um diâmetro pequeno de 0.1 mm. As artérias se

    apresentam com um vermelho mais intenso e com um diâmetro menor em relação às

    veias, enquanto as veias se apresentam com um vermelho escuro (MELO, 2014).

    Figura 3 – Imagem de fundo de olho saudável.

    Fonte: Adaptado por (MELO, 2014) de (STAAL et al., 2004).

    3.2 Exame de Fundo de Olho

    O exame do fundo de olho é uma prática muito importante feita em consultório

    médico oftalmologista, um vez que existe várias doenças que causam problemas na retina.

    Um dos métodos para realizar este exame é a oftalmoscopia direta, o especialista utiliza

    um oftalmoscópio3para examinar, e assim avaliar o disco óptico, os vasos sanguíneos e

    as outras estruturas no fundo ocular. Para realizar este tipo de exame, o ambiente deve

    ter baixa iluminação, e tem a necessidade de dilatar a pupila do paciente com colírios

    específicos (DORION, 2002), (CARDOSO, 2016).

    Para análises mais criteriosas da retina é necessário utilizar métodos mais precisos

    que a oftalmoscopia direta, os seguintes métodos podem ser utilizados: a angiografia

    fluoresceínica, que é obtida por meio da aplicação de uma substância de contraste, a3 Aparelho criado por Hermann von Helmholtz em 1850 constituído-se de uma fonte de luz, e um espelho

    que projeta a luz no olho do paciente.

  • Capítulo 3. CONCEITOS DE OFTALMOLOGIA 26

    Fluoresceína, na corrente sanguínea do paciente, figura 4; ou a fotografia red free do fundo

    de olho. Esta fotografia exclui as ondas de espectro referente ao vermelho, figura 5; ou

    então a fotografia colorida- RGB do fundo de olho que capta os espectros vermelho, verde

    e azul, figura 6 (MOOKIAH et al., 2013).

    Figura 4 – Angiografia fluoresceínica.

    Fonte: Adaptado de Instituto de Microcirurgia Ocular4.

    Figura 5 – Fotografia red free do fundo de olho com retinopatia diabética.

    Fonte: Ophthalmic Photographer’s Society5.

    Figura 6 – Fotografia colorida- RGB do fundo olho normal.

    Fonte: Fine Eyewear6.

    4 Disponível em: acessado em jun. 2017.5 Disponível em: acessado em jun. 2017.

  • Capítulo 3. CONCEITOS DE OFTALMOLOGIA 27

    A fotografia de fundo de olho ou também chamada de retinografia digital, é feita

    utilizando um aparelho chamado de retinógrafo digital. O procedimento pode ser realizado

    com dilatação da pupila (midriática), ou sem dilatação da pupila (não-midriática). A

    retinografia possui uma boa resolução, rapidez no foco e na captura da imagem, realiza

    controle de iluminação, e utiliza filtros para remoção de algum espectro (por exemplo:

    do vermelho), realiza angulação correta que varia de 30◦ a 45◦, e o aparelho tem uma

    boa operabilidade (CARDOSO, 2016). Exemplo de um retinógrafo digital: TOPCON

    TRC-NW8 Non-Mydriatic Retinal Câmera, este modelo possui uma câmera traseira com

    resolução de 16.2 Megapixel com um campo de visão de 45◦, figura 7.

    Figura 7 – Retinógrafo digital. TOPCON, modelo: TRC-NW8 Non-Mydriatic RetinalCamera.

    Fonte: TOPCON 7.

    3.3 Retinopatia Diabética

    A Retinopatia Diabética (RD) é uma doença resultante de lesões na retina causadas

    pela doença Diabetes Mellitus, a RD nas fases iniciais é assintomática, tem por característica

    a presença de microaneurismas (DORION, 2002), que são alterações vasculares na retina

    resultante de inchaços dos capilares, causados geralmente pela neovascularização, que em

    imagens de fundo de olho são visto como pequenos pontos vermelhos, figura 8 (CARDOSO,

    2016)(MELO, 2014).6 Disponível em: acessado em jun. 2017.7 Disponível em: acessado em jun. 2017.

  • Capítulo 3. CONCEITOS DE OFTALMOLOGIA 28

    Figura 8 – Microaneurisma.

    Fonte: Adaptado de (MOOKIAH et al., 2013).

    A neovascularização (NV) produz sintomas como visão turva, distorção de linhas

    retas e extremidades de objeto, e pontos difusos, devido o desenvolvimento de novos

    vasos em alguns lugares da retina, exceto no disco óptico. A NV não é causada somente

    pela RD, outras doenças também causam este tipo de problema como: retinopatia da

    prematuridade (ROP)8, anemia da célula falciforme, hemoglobinopatias, beta-talassemia,

    doença de Eales, síndromes de hiperviscosidade, leucemia, degeneração macular disciforme,

    vitreorretinopatia familiar exsudativa, toxoplasmose, sarcoidose, histoplasmose, miopia,

    estrias angióides, melanoma coróide, ruptura coróide, toxemia da gravidez, esclerose

    múltipla, e também em algumas condições como o uso de drogas IV, ou a complicação de

    fotocoagulação a laser e fatores angiogênicos também podem causar NV (DORION, 2002).

    O surgimento de pontos com NV pode ocorre na superfície da retina, abaixo da

    retina, ou na coróide. Quando a neovascularização ocorre na superfície e abaixo retina, o

    paciente desenvolveu a Retinopatia Diabética não Proliferativa (RDNP), quando ocorre

    na coróide o caso é de Retinopatia Diabética Proliferativa (RDP) (CARDOSO, 2016).

    A evolução da DR passa por diferentes estágios, inicialmente o paciente não tem

    nenhuma alteração na qualidade visual, do mesmo modo, a imagem do fundo de olho sofre

    poucas alterações, com o tempo surgem outros sinais como: a neovascularização, os MAs,

    as hemorragias (H) aumentam e surgem os exsudatos moles que se solidificam e ficam

    duros, estes sinais são mostrados na figura 9. O paciente com DR, aos pouco observará

    pioras na qualidade da visão, podendo ter melhoras caso haja absorção dos exsudatos e

    hemorragias (HENDRICK; GIBSON; KULSHRESHTHA, 2015).

    8 É alteração no crescimento da retina, que está indiretamente ligada à idade gestacional e ao peso doprematuro (OFTALMOPEDIATRIA, 2017).

  • Capítulo 3. CONCEITOS DE OFTALMOLOGIA 29

    Figura 9 – Sinais da Retinopatia diabética.

    Fonte: Adaptado de (ZAKI et al., 2016).

    As hemorragias podem ser: pré-retinianas, normalmente volumosas com formato

    arredondado e não provenientes da RD; intra-retinianas são lesões que variam a cor do

    vermelho ao cinza escuro e são originadas de vazamentos dos vasos capilares, possuem

    formato irregular com margem definida; vítreas, ocorrem na cavidade vítrea e obscurecem

    a visão, estas hemorragias desaparecem em torno de 3 a 4 meses. Os exsudatos duros são

    depósitos lipoprotéicos com coloração amarela-esbranquiçada, possuem aspecto brilhante

    com margens bem delimitadas, e se localizam no polo posterior, próximo ou em volta da

    mácula, alguns exsudatos dispersam em de 3 a 4 meses, outros permanecem durante muitos

    anos (DORION, 2002), (CARDOSO, 2016) e (HENDRICK; GIBSON; KULSHRESHTHA,

    2015).

  • 30

    4 CONCEITOS TEÓRICOS GERAIS

    4.1 Conceitos de Processamento Digital de Imagens

    O processamento digital de imagens consiste em manipular imagens digitais, imagens

    que possuem valores de intensidade finitos, em um hardware digital como por exemplo um

    computador. A imagem digital é uma função bidimensional representada por f(x, y) onde

    x e y são coordenadas espaciais em um plano, f é a amplitude ou também chamada de

    intensidade de cinza ou nível de cinza, em um ponto da imagem. Este ponto é localizado

    no plano pelas coordenadas (x, y), devido ao fato que a intensidade assume valores finitos,

    como falado anteriormente, a imagem então é caracterizada como sendo uma imagem

    digital (GONZALEZ; WOODS, 2010).

    Alguns passos são seguidos para se realizar o processamento de uma imagem digital

    como a aquisição, pré-processamento, segmentação, obtenção de características, e por fim

    o reconhecimento, estes passos são representados na figura 10 . A aquisição da imagem

    é realizada por dispositivos que são vinculados a alguma aplicação como por exemplo:

    câmera digital, digitalizador de imagens ou um retinógrafo digital (GONZALEZ; WOODS,

    2010).

    Na etapa pré-processamento da imagem, normalmente são aplicadas técnicas

    como: filtragem para remoção de ruídos, realce que consiste em manipular de forma

    subjetiva a imagem partindo da preferência humana, restauração que é uma manipulação

    objetiva da imagem aplicando técnicas que se baseiam em modelos matemáticos. Já a

    etapa de segmentação consiste em dividir a imagem nos objetos que a constituem. A

    etapa da obtenção de características consiste na adoção de um sistema que represente

    às características que se deseja buscar e descreva suas informações. A etapa final do

    processamento digital de imagens, o reconhecimento é um processo que consiste em

    atribuir rótulo a um determinado objeto com base na descrição dele, por exemplo: é

    reconhecido como microaneurisma, pois tem formato circular são vermelhos e aparecem

    isolados na imagem (GONZALEZ; WOODS, 2010).

  • Capítulo 4. CONCEITOS TEÓRICOS GERAIS 31

    Figura 10 – Etapas para a realização do processamento de imagens.

    Fonte: Adaptado de (GONZALEZ; WOODS, 2010).

    Os sistemas utilizados para o processamento digital de imagens, se dividem basica-

    mente em, (GONZALEZ; WOODS, 2010):

    • sistemas de sensoriamento, cuja a função é a aquisição da imagem digital;

    • hardware especializado em realizar operações lógicas e aritméticas em paralelo, é

    utilizado para realizar operações matemáticas, a característica deste hardware é

    realizar cálculos em alta velocidade;

    • software de processamento de imagens consiste em módulos especializados em realizar

    determinadas funções no processamento da imagem;

    • sistema de armazenamento, este sistema é fundamental para o armazenamento das

    imagens antes e depois de serem processadas;

    • sistema de vídeo, que são monitores à cores que em conjunto das placas de vídeo

    são utilizados para apresentar ao usuário do sistema de processamento às imagens

    adquiridas e processadas, em alguns casos substitui o monitor e se utiliza um capacete

    que possibilita a visualização estereoscópica (3-D) de algumas imagens, ele possui

    dois pequenos monitores acoplados a um óculos;

  • Capítulo 4. CONCEITOS TEÓRICOS GERAIS 32

    • sistemas de registo de imagens como impressoras, filmes fotográficos e mídias digitais.

    4.2 Modelos de Cores

    A técnicas de processamento digital de imagens são aplicadas em imagens com

    escala de cinza ou em imagens coloridas, estas imagens são tratadas como matrizes. Para

    as imagens coloridas existem alguns modelos principais de cores como: RGB (red, green,

    blue), CMY (cyan, magenta, yellow), CMYK (cyan, magenta, yellow, black) e o HSI ( hue,

    saturation, intensity). Modelo de cores pode ser definido como sendo "uma especificação

    de um sistema de coordenadas e um subespaço dentro desse sistema no qual cada cor é

    representada por um único ponto "(GONZALEZ; WOODS, 2010, p. 264).

    Cada modelo citado no paragrafo acima é utilizado para um tipo de aplicação com

    exceção do modelo HSI. O modelo RGB é utilizado em monitores coloridos e câmeras

    de vídeo, os modelos CMY e CMYK são aplicados em impressoras que fazem impressão

    colorida, já o HSI é um modelo que representa a forma como os humanos realizam a

    descrição e interpretação das cores, este modelo tem a vantagem de separar as informações

    referentes a cor das informações de escala de cinza (GONZALEZ; WOODS, 2010).

    4.2.1 Modelo de cores RGB

    No modelo RGB, figura 11, também chamado de sistema de cores aditivo, é formado

    pela junção das cores primárias vermelho, verde e azul decompostas a partir da luz branca.

    Este modelo tem como base um sistema de coordenadas cartesiana, possuindo um cubo

    como subespaço, como mostrado na figura 12. As cores primárias vermelho, verde e azul

    estão localizados sobre três vértices, e as cores secundárias que se localizam no vértice

    oposto a elas são respectivamente ciano, magenta e amarelo, o preto se localiza no origem

    do cubo que também é a origem do plano cartesiano, o branco esta localizado no vértice

    oposto a origem, o segmento de reta que vai da cor preta até a cor branca, este segmento e

    denominado escala de cinza, sobre ele os valores de R, G e B são iguais (ILUMINCAçãO,

    2004) (GONZALEZ; WOODS, 2010).

  • Capítulo 4. CONCEITOS TEÓRICOS GERAIS 33

    Figura 11 – Sistema de cores Aditivo.

    Fonte: Adaptado de Developer Apple1.

    Figura 12 – Cubo RGB.

    Fonte: Digital Image Fundamentals2.

    Imagens que utilizam o modelo de cores RGB possuem três canais, que são três

    imagens, sendo que é um canal ou imagem para cada cor primária, estas imagens quando

    projetadas em um monitor se juntam para formar uma única imagem de cores compostas,

    como é exemplificado na figura 13 (GONZALEZ; WOODS, 2010).1 Disponível em: acessado em jul. 2017.2 Disponível em: aces-

    sado em jul. 2017.

  • Capítulo 4. CONCEITOS TEÓRICOS GERAIS 34

    Figura 13 – Formação de uma Imagem RGB em um monitor colorido.

    Fonte: (GONZALEZ; WOODS, 2010).

    4.2.2 Modelo de cores CMY e CMYK

    O modelo de cores CMY, figura 14, é formado pelas cores secundárias ciano,

    magenta e amarelo do modelo RGB. O modelo CMY também é chamado de sistema

    subtrativo, pois a mistura das cores deste modelo tendem a cor preta (ILUMINCAçãO,

    2004). É utilizado por dispositivos que realizam pigmentação sobre papel como impressoras

    coloridas. Já o modelo CMYK surgiu quando se observou que ao somar todas cores base

    do modelo CMY, o resultado não gerava realmente a cor preta, assim teve a necessidade

    de adicionar uma quarta cor, a cor preta ao modelo CMY (GONZALEZ; WOODS, 2010).

    Figura 14 – Sistema de cores Subtrativo.

    Fonte: Adaptado de Developer Apple3.

  • Capítulo 4. CONCEITOS TEÓRICOS GERAIS 35

    4.2.3 Modelo de cores HSI

    Como foi falado anteriormente o modelo de cores HSI, figura 15, descreve como os

    seres humanos interpretam as cores, decompondo-as em matiz-hue, saturação e intensidade-

    brilho, e não em níveis de cores primárias como é feito no RGB e CYMK. A matiz descreve

    a cor pura, por exemplo: amarelo, vermelho; saturação fornece a medida do grau de diluição

    na presença de luz branca, por exemplo: vermelho escuro, azul claro; e o brilho não e

    possível mensurar, mas incorpora a noção de acromática da intensidade, que possibilita

    descrever a sensação de cores.

    Figura 15 – Modelo de cores HSI.

    a) b) c) d)

    a) RGB. b) Matiz. c) Saturação. d) Intensidade. Fonte: Adaptado de Wikipedia4.

    4.3 Métricas de Avaliação do Algoritmo de Segmentação de Ima-

    gens

    Os métricas de avaliação são utilizadas para avaliar a qualidade técnica aplicada no

    algoritmo que realiza segmentação. A melhor maneira de avaliar o algoritmo é comparar os

    resultados da segmentação realizada por este, com os resultados da segmentação realizada

    por especialistas (MARTIN et al., 2001).

    A algumas bases de imagens de fundo de olho fornecem uma máscara com a

    segmentação realizada por especialistas. Esta segmentação feita por especialistas em

    oftalmologia, utilizada para avaliar a qualidade da segmentação realizada pelo algoritmo é

    denominada de ground truth, se for feita por mais de um especialista pode ser denominada

    também de "padrão ouro "(CARDOSO, 2016). Tanto a base de imagens DRIVE quanto

    a STARE, que serão utilizadas no trabalho fornecem ground truth dos vasos sanguíneos

    presentes nas imagens de fundo de olho.3 Disponível em: acessado em jul. 2017.4 Disponível em: acessado em jul. 2017.

  • Capítulo 4. CONCEITOS TEÓRICOS GERAIS 36

    4.3.1 Métricas de Avaliação

    Após a realização da segmentação da imagem, algumas métricas podem ser de-

    finidas para avaliar a qualidade da segmentação, métricas como: precisão, sensibilidade,

    especificidade, entre outras. Tais métricas de avaliação são próprias para realizar avalia-

    ções sobre a segmentação feita pelo algoritmo, estas métricas produzem resultados que

    quantificam a performance do método aplicado no algoritmo. A segmentação gerada pelo

    algoritmo deve ser tão boa quanto as segmentações manuais feitas pelos especialistas, as

    quais são consideradas como "corretas"(CARDOSO, 2016).

    Na tabela 1, SALEH; ESWARAN; MUEEN (2011), PURUSHARTHI; KURHADE

    (2014) e MITTAPALLI; KANDE (2016) definem avaliações para o conjunto de pixels

    segmentados que possivelmente pertence ao objeto alvo, no caso deste trabalho, os vasos

    sanguíneos.

    Tabela 1 – Avaliação para o conjunto de pixels segmentados.

    Classificação Descrição

    TP (True Positive)Conjunto de pixels identificados corretamente como o objeto alvo,tanto na imagem segmentada quanto no ground truth.

    TN (True Negative)Conjunto de pixels identificado como não sendo o objeto alvo, tantona imagem segmentada quanto no ground truth.

    FP (False Positive)Conjunto de pixels identificado como sendo o objeto alvo na imagemsegmentada, mas no ground truth este conjunto de pixels nãorepresenta o objeto alvo.

    FN (False Negative)Conjunto de pixels identificado como não sendo o objeto alvo naimagem segmentada, mas no ground truth este conjunto de pixelsrepresenta o objeto alvo.

    Dois conjuntos são definidos a partir da segmentação manual feito pelos especialistas,

    ground truth, o conjunto A reúne todos os pixels pertencentes ao objeto alvo, enquanto

    conjunto B reúne os pixels não pertencentes ao objeto alvo. PURUSHARTHI; KURHADE

    (2014), WANG et al. (2015), MITTAPALLI; KANDE (2016) e FRANKLIN; RAJAN

    (2014) propuseram as seguintes métricas para avaliação da qualidade do resultado da

    segmentação:

    True Positive Rate (TPR) - Taxa de verdadeiros positivos: É a fração de pixels identi-

    ficados corretamente, pertencentes ao objeto alvo.

    TPR =TP

    A(4.1)

    False Positive Rate (FPR) - Taxa de falsos positivos: É a fração de pixels identificados

    erroneamente como pertencentes ao objeto alvo.

  • Capítulo 4. CONCEITOS TEÓRICOS GERAIS 37

    FPR =FP

    B(4.2)

    Sensitivity (SN) - Sensibilidade: Quantifica a capacidade do método utilizado pelo

    algoritmo em identificar corretamente o objeto alvo. O cálculo pode ser feito de duas

    maneiras:

    SN = TPR (4.3)

    ou

    SN =TP

    TP + FN(4.4)

    Especificity (SP) - Especificidade: Quantifica a capacidade do método utilizado pelo

    algoritmo em identificar os pixels não pertencentes ao objeto alvo.

    SP = 1 − FPR (4.5)

    ou

    SP =TN

    TN + FP(4.6)

    Accuracy (Acc) - Precisão: É a taxa de acertos (TP e TN) do método, em relação ao

    total de pixels.

    Acc =TP + TN

    TP + FP + FN + TN(4.7)

    Positive Predictive Value (PPV) - Valor Preditivo Positivo: Representa a probabili-

    dade do pixel classificado como o objeto alvo ser realmente ele mesmo.

    PPV =TP

    TP + FP(4.8)

  • 38

    5 MATERIAIS E MÉTODOS

    Este capítulo tem o objetivo de especificar as base públicas de imagens utilizadas no

    trabalho, assim como, o método implementado para a segmentação dos vasos sanguíneos

    encontrado na literatura.

    5.1 Bases de Imagens

    5.1.1 DRIVE

    A base pública de imagens de fundo olho DRIVE (STAAL et al., 2004) foi criada

    para permitir a comparação dos trabalhos sobre segmentação de vasos sanguíneos da retina.

    Esta base possui 40 imagens de fundo de olho que foram obtidas aleatoriamente entre 400

    imagens tiradas em um programa sobre retinopatia diabética, as imagens foram tiradas de

    pessoas com idade entre 25 e 90 anos. Do total de 40 imagens, 33 não possuem nenhum

    sinal de RD, e as outras 7 mostram sinais de RD. A figura 16 mostra algumas imagens

    pertencentes a base.

    Figura 16 – Exemplos de imagens do banco DRIVE.

    (a) 03_test (b) 05_test (c) 08_test (d) 19_test

    Fonte: do próprio autor.

    As imagens foram capturadas usando uma câmera Canon CR5 não midriática CCD

    com 45◦ campo de visão ou Field Of View (FOV). Cada imagem capturada utiliza uma

    compressão JPEG , utilizando 8 bits por plano de cor, e a dimensão das imagens é 768x584

    pixels.

    As 40 imagens foram dividas pela metade, uma metade é classificada como imagens

    de teste e as outras 20 restantes são classificadas como imagens de treinamento. As imagens

    de teste possuem dois manuais de segmentação de vasos sanguíneos, um deles é usado

    como "padrão ouro"ou também chamando de ground truth, o outro pode ser usado para

  • Capítulo 5. MATERIAIS E MÉTODOS 39

    comparar segmentações geradas por computador com a segmentação de um observador

    humano qualquer, chamado de segundo observador. Para as imagens de treinamento existe

    um manual de segmentação dos vasos sanguíneos. Todos os manuais de segmentação desta

    base foram criados por um oftalmologistas experientes e treinados, todos marcaram com

    no mínimo de 70% de certeza de ser um vaso sanguíneo.

    5.1.2 STARE

    STARE (HOOVER, 2000) foi um projeto iniciado em 1975 pelo Dr. Michael

    Goldbaum, na Universidade da California, este projeto foi financiado pelos Institutos

    Nacionais de Saúde dos EUA. As imagens e os dados clínicos foram fornecidos pelo Shiley

    Eye Center da Universidade da Califórnia, e pelo Veterans Administration Medical Center

    em San Diego.

    O banco de imagens contém 20 imagens da retina coloridas, com 700x605 pixels e 8

    bits por canal RGB, capturado por uma câmera TopCon TRV-50 a 35◦ FOV. Possui dois

    manuais de segmentação de Adam Hoover e Valentina Kouznetsova. A figura 17 mostra

    imagens pertencentes a base.

    Figura 17 – Exemplo de imagens do banco STARE.

    (a) image 0004 (b) image 0082 (c) image 0255 (d) image 0324

    Fonte: do próprio autor.

    Adam Hoover marcou 10,4% de pixels como vaso, Valentina Kouznetsova 14,9%.

    O desempenho dos algoritmos são calculados com as segmentações do Adam Hoover,

    pois as segmentações dele são consideradas como o ground truth da base de imagens.

    A comparação da segmentação da Valentina Kouznetsova com o ground truth dá uma

    medida de desempenho de detecção que é considerada como um nível de desempenho a

    ser alcançado, um nível alto de desempenho, pois a marcação dela é mais detalhada.

  • Capítulo 5. MATERIAIS E MÉTODOS 40

    5.2 Método de Segmentação dos Vasos Sanguíneos

    Nesta seção é explicado o método de segmentação de vasos sanguíneos que foi

    implementado. Este método foi proposto por PATWARI et al. (2014) e, neste trabalho, ele

    foi adaptado e aplicado nas bases de imagens DRIVE e STARE. Também serão explicados

    os conceitos de processamento de imagens que não foram abordados no capítulo 4, mas

    que foram empregados no método implementado.

    Na figura 18 é apresentado o diagrama de blocos do método, mostrando o passo-

    a-passo do método implementado no algoritmo que realiza a segmentação dos vasos

    sanguíneos. O método foi dividido em doze passos que vão desde a leitura da imagem de

    fundo de olho até concluir a segmentação dos vasos sanguíneos, em que o algoritmo gera a

    imagem de fundo olho segmentada, apresentando os vasos sanguíneos marcados.

    No método implementado a fase de pré-processamento da imagem inicia-se na etapa

    2 e vai até a etapa 6 do diagrama de blocos, passando pelas seguintes etapas: Remoção do

    canal verde, Complemento do canal verde, CLAHE, Abertura morfológica e Remoção do

    disco óptico.

    A seguir, cada etapa do diagrama de blocos será detalhada e a imagem resultante de

    cada umas delas será apresentada. Conceitos novos que não foram abordados anteriormente

    no trabalho serão explicados, assim que eles forem surgindo, para que o leitor tenha o

    embasamento teórico para entender cada etapa do método de forma clara e simples.

    O algoritmo foi implementado no software MATLAB R© que, por possuir o toolbox

    de processamento de imagens, facilita o desenvolvimento de algoritmos.

  • Capítulo 5. MATERIAIS E MÉTODOS 41

    Figura 18 – Diagrama do método.

    1- Leitura da

    Imagem RGB

    2- Extração do Canal

    Verde (Imagem)

    3- Complemento

    do Canal Verde

    4- CLAHE

    5- Abertura

    Morfológica

    6- Remoção do

    Disco óptico

    7- Filtro mediana

    8- Remoção do

    Background

    9- Ajuste de contraste

    10- Binarização

    11- Remoção de

    Objetos Espúrios

    12- Detec-

    ção de Bordas

    13- Imagem de Saída

    Fonte: do próprio autor.

  • Capítulo 5. MATERIAIS E MÉTODOS 42

    1. Imagem de Entrada RGB

    Esta etapa é a parte inicial, o algoritmo realiza a leitura da imagem, figura 19, e

    armazena em forma de matriz para que nos passos seguintes realize o processamento

    da imagem. As imagens da base de imagens utilizada possuem três canais, onde cada

    canal possui 8 bits por pixel.

    Figura 19 – Retinografia RGB.

    Fonte: (STAAL et al., 2004)

    2. Extração do Canal Verde da Imagem RGB

    A partir da imagem RGB armazenada na memória, neste passo realiza-se a extração

    do canal verde (G) da imagem. Isto se deve ao fato de que os objetos de aspecto

    avermelhado como vasos sanguíneos, hemorragias e microaneurismas se apresentam

    com maior contraste no canal verde (G), se comparado com os outros dois canais da

    imagem: vermelho (R) e azul (B). A imagem resultante da extração do canal verde é

    apresentada na figura 20.

  • Capítulo 5. MATERIAIS E MÉTODOS 43

    Figura 20 – Canal Verde.

    Fonte: do próprio autor.

    3. Complemento do Canal Verde

    Nesta etapa cria-se o complemento do canal verde, para transformar os objetos

    escuros da imagem (vasos sanguíneos) em objetos claros. Esta operação foi realizada

    para deixar os vasos sanguíneos mais claros e mais visíveis na imagem. O complemento

    de imagem do canal verde é apresentado na figura 21.

    Figura 21 – Complemento do Canal Verde.

    Fonte: do próprio autor.

  • Capítulo 5. MATERIAIS E MÉTODOS 44

    4. CLAHE (Contrasted Limited Adaptative Histogram Equalization)

    O CLAHE é um algoritmo que foi desenvolvido para realce de imagens com baixo

    contraste (imagens médicas). Ele divide a imagem em pequenas regiões chamadas de

    tiles e, em cada uma dessas regiões, é aplicado equalização de histograma. Feito esta

    operação, um limiar de nível de cinza é criado pelo usuário, os pixels com nível de

    cinza acima deste limiar são redistribuídos entre as regiões da imagem que contém

    pixels com nível de cinza abaixo deste limiar, (PIZER et al., 1990). Este limiar, é

    responsável por limitar a amplificação do ruído na imagem.

    Nesta etapa o CLAHE foi utilizado para realçar os vasos sanguíneos presentes na

    imagem complemento do canal verde. Como se pode ver na figura 22, o algoritmo

    realçou os vasos sanguíneos, assim como o resto da imagem.

    Figura 22 – Resultado da aplicação do CLAHE no complemento do Canal Verde.

    Fonte: do próprio autor.

    5. Abertura Morfológica

    A morfologia matemática é uma ferramenta utilizada para extrair objetos em uma

    imagem, que são tratados como conjuntos. São úteis para representar ou descrever

    uma dada região (GONZALEZ; WOODS, 2010).

    A abertura morfológica da imagem é dada pela seguinte expressão (GONZALEZ;

    WOODS, 2010):

  • Capítulo 5. MATERIAIS E MÉTODOS 45

    f ◦ b = (f ⊖ b) ⊕ b (5.1)

    f : Imagem.

    b : Elemento Estruturante (ES).

    Os elementos estruturantes são pequenas imagens, ou seja, pequenos conjuntos,

    que são utilizados como "sondas"para examinar uma determinada imagem

    procurando propriedades de interesse. Os elementos estruturantes em níveis

    de cinza podem ser: planos, e não-planos. Os não-planos podem ser um ES

    em formato de hemisfério como mostrado na figura 23a, que tem um perfil de

    intensidade mostrado na figura 23c. Os planos podem ser um ES em formato de

    disco figura 23b, a comprovação que este ES é plano pode ser visto pelo perfil

    de intensidade na figura 23d.

    Figura 23 – Exemplo de Elementos Estruturantes.

    Fonte: (GONZALEZ; WOODS, 2010)

    ⊖ - Erosão : A erosão da imagem f por um elemento estruturante b em qualquer

    posição da imagem (x, y), é calculada como sendo o valor mínimo da região

    imagem que coincide com a região de b, quando a origem de b esta em (x, y). A

    operação de erosão, assim como a operação de dilatação que será explicada a

    seguir, é realizada de forma semelhante a operação de correlação, pois o ES faz

    uma varredura na imagem. Portanto para calcular a erosão f por b, coloca-se a

    origem do ES em todas as posições dos pixels da imagem. Após a operação de

    erosão a imagem fica um pouco mais escura, os objetos escuros desta imagem

    aumentam um pouco de tamanho, e os objetos mais claros reduzem de tamanho.

    ⊕ - Dilatação : A operação de dilatação é semelhante ao processo de erosão, mas

    ao invés de calcular o valor minimo, calcula-se o valor máximo da região imagem

    que coincide com a região de b, quando a origem de b esta em (x, y). O resultado

  • Capítulo 5. MATERIAIS E MÉTODOS 46

    da dilatação é oposto ao resultado da erosão, os objetos mais claros aumentam

    de tamanho, ou seja, ficam mais espessos, e os objetos mais escuros ficam com

    tamanho reduzido, com detalhes mais escuros.

    Após explicado os termos da expressão de abertura morfológica, pode-se ver que a

    operação de abertura se resume em uma operação de erosão da imagem com o ES,

    seguido por uma dilatação do resultado desta operação com o ES.

    A abertura morfológica que geralmente suaviza o contorno de uma imagem, remove

    pequenos detalhes claros, enquanto não alteram os níveis de cinza globais da imagem

    nem os grandes objetos claros.

    O objetivo de aplicar abertura morfológica nesta etapa foi eliminar os vasos sanguíneos

    (apresentam-se como detalhes claros na imagem) restando o disco óptico, como objeto

    principal na imagem de fundo de olho. A imagem resultante, figura 24, será utilizada

    no passo seguinte para remoção do disco óptico.

    Figura 24 – Imagem resultante da Abertura Morfológica.

    Fonte: do próprio autor.

    6. Remoção do Disco Óptico

    Este passo no algoritmo tem por objetivo, remover o disco óptico da imagem de fundo

    de olho, restando os objetos claros, os vasos sanguíneos e outros objetos espúrios.

    A remoção do disco óptico é realizada da seguinte maneira: imagem de saída do

    passo 4 é subtraída pela imagem de saída do passo 5. A imagem resultante desta

    subtração, sem o disco óptico, é apresentada na figura 25.

  • Capítulo 5. MATERIAIS E MÉTODOS 47

    Figura 25 – Imagem resultante após a remoção do Disco Óptico.

    Fonte: do próprio autor.

    7. Filtro Mediana

    O filtro mediana é utilizado para remover ruído impulsivo da imagem. Este filtro

    preserva as bordas (descontinuidade de intensidade) da imagem. A preservação destas

    bordas será útil, para realizar a marcação dos vasos sanguíneos na imagem original. A

    figura 26 apresenta a imagem resultante da filtragem do resultado do passo anterior,

    utilizando um filtro mediana.

    Figura 26 – Resultado após aplicação do Filtro Mediana.

    Fonte: do próprio autor.

  • Capítulo 5. MATERIAIS E MÉTODOS 48

    8. Remoção do Background

    Nesta etapa a extração o background da imagem resultante do passo anterior, é

    realizada para evidenciar ainda mais os objetos claros em relação a imagem de fundo,

    com maior riqueza de detalhes, com o objetivo principal de evidenciar os vasos

    sanguíneos.

    A remoção do background é realizado da seguinte maneira: aplica-se abertura mor-

    fológica na imagem resultante da filtragem pelo filtro mediana, gerando assim o

    background, apresentado na figura 27a ( o gráfico de intensidade de cinza é mostrado

    na figura 27b). Após isto, realiza-se a subtração da imagem filtrada pelo background,

    gerando assim a imagem apresenta na figura 28.

    Na figura 28 percebe-se a melhoria de detalhes dos vasos sanguíneos se comparado

    com a figura 26, após remover o background.

    Figura 27 – Background.

    (a) Background. (b) Intensidade de Cinza do Background.

    Fonte: do próprio autor.

  • Capítulo 5. MATERIAIS E MÉTODOS 49

    Figura 28 – Resultado da remoção do Background.

    Fonte: do próprio autor.

    9. Ajuste de Contraste

    Ajuste do contrate é aplicado nesta etapa, para aumentar o contrate dos vasos

    sanguíneos em relação ao resto da imagem, deixando-os mais evidentes e melhorando,

    assim, a riqueza de detalhes. A imagem produzida após o ajuste de contraste é

    mostrado na figura 29.

    Figura 29 – Ajuste de contraste da imagem.

    Fonte: do próprio autor.

  • Capítulo 5. MATERIAIS E MÉTODOS 50

    10. Binarização

    A partir da imagem resultante do ajuste de contraste, figura 29, utiliza-se o método

    de OTSU (1979) para localizar o limiar ótimo para realizar a binarização da imagem.

    A ideia do método de OTSU (1979) é aproximar o histograma de uma imagem por

    duas funções Gaussianas, escolhendo um limiar de forma a minimizar a variância

    intra-classes, onde cada classe possui sua própria média e desvio-padrão.

    A binarização é importante para definir bem os vasos (bordas) e eliminar objetos

    espúrios, mas por consequência elimina também pequenos vasos, cujos os níveis de

    cinza estão abaixo do limiar. A imagem resultante do processo de binarização é

    mostrada na figura 30.

    Figura 30 – Imagem Binária dos Vasos Sanguíneos.

    Fonte: do próprio autor.

    11. Remoção de Objetos Espúrios

    Para remoção dos objetos espúrios o algoritmo utiliza a função bwareaopen, (GONZA-

    LEZ; WOODS; EDDINS, 2004). Esta função remove objetos em uma imagem binária,

    sendo que, inicialmente, define o tamanho do objeto na função pela quantidade pixels.

    A função varre a imagem binária e, se um objeto é localizado na imagem, e este

    possui uma menor quantidade de pixels que o objeto declarado na função, então este

    objeto é removido. A figura 31 mostra a imagem binária após a remoção dos objetos

    espúrios.

  • Capítulo 5. MATERIAIS E MÉTODOS 51

    Figura 31 – Imagem após a remoção de objetos espúrios.

    Fonte: do próprio autor.

    12. Detecção de Bordas

    A partir da imagem binária, figura 31, para realizar a marcação dos vasos na imagem

    de saída o algoritmo utiliza a função bwboundaries, (GONZALEZ; WOODS;

    EDDINS, 2004). Esta função detecta as bordas dos vasos sanguíneos e cria um vetor

    com as localizações das bordas, para que este seja utilizado na marcação destes vasos

    na imagem de saída.

    13. Imagem de Saída

    A figura 32 mostra a detecção dos vasos sanguíneos. A marcação dos vasos foi feita

    a partir do vetor de localizações criado pela função bwboundaries.

    Figura 32 – Resultado da detecção dos vasos sanguíneos.

    Fonte: do próprio autor.

  • 52

    6 DISCUSSÃO E RESULTADOS

    Neste capítulo apresenta os resultados obtidos com o algoritmo após testá-los nas

    bases de imagens DRIVE e STARE. Cada base terá uma seção própria, onde serão expostos

    os resultados.

    Para facilitar o entendimento dos resultados presentes em cada coluna das tabelas,

    um resumo das métricas apresentados no Capítulo 4 é feito a seguir:

    • (Acc) - Precisão: É a taxa de acerto do método.

    • (SN) - Sensibilidade: Quantifica a capacidade do método utilizado pelo algoritmo

    em identificar corretamente o objeto alvo, possui o mesmo "significado"de (TPR) -

    Taxa de verdadeiros positivos.

    • (FPR) - Taxa de falsos positivos: É a fração de pixels identificados erroneamente

    como pertencentes ao objeto alvo.

    • (SP) - Especificidade: Quantifica a capacidade do método utilizado pelo algoritmo

    em identificar os pixels não pertencentes ao objeto alvo.

    • (PPV) - Valor Preditivo Positivo: Representa a probabilidade do pixel classificado

    como o objeto alvo ser realmente ele mesmo.

    6.1 Discussão e resultados - DRIVE

    A discussão dos resultados desta seção abordará os resultados obtidos com a

    segmentação dos vasos sanguíneos, utilizando as imagens da base DRIVE.

    A figura 33 demonstra a segmentação dos vasos sanguíneos, utilizando uma imagem

    da base. A figura 33a mostra a imagem original e a 33c mostra o ground truth, que

    representa a marcação dos vasos sanguíneos por especialistas, ou também chamada por

    muitos autores de vessel tree. A figura 33b apresenta os vasos sanguíneos marcados a partir

    da segmentação gerada pelo método, esta segmentação é mostrada na figura 33d.

    Visualmente a figura 33d apresenta um boa aproximação se comparada com a

    figura 33c, (ground truth) que possui uma precisão muita alta da localização dos vasos. A

    qualidade das imagens desta base ajuda o algoritmo a gerar resultados com alta precisão

    na detecção dos vasos.

  • Capítulo 6. DISCUSSÃO E RESULTADOS 53

    Figura 33 – Segmentação dos vasos sanguíneos de uma imagem da base DRIVE.

    (a) Imagem Original. (b) Imagem Marcada.

    (c) Ground truth. (d) Vasos sanguineos segmentados.

    Fonte: do próprio autor.

    Na figura 34, foram selecionadas aleatoriamente quatro imagens da base para

    demonstrar a segmentação feita pelo algoritmo e compará-las visualmente com o ground

    truth, e com a segmentação feita por um segundo observador. As imagens selecionadas

    foram: 01_test, 04_test, 13_test e 18_test. Na figura 34, foi estruturada uma matriz de

    imagens em que cada coluna é referente a uma das imagens usadas para teste. A primeira

    linha da matriz apresenta as imagens originais; a segunda linha apresenta as imagens com

    os vasos sanguíneos marcados pelo algoritmo; a terceira linha apresenta as segmentações

    dos vasos sanguíneos de cada uma das imagens; a quarta linha apresenta o ground truth; e,

    finalmente, a quinta linha apresenta a segmentação feita por um segundo observador.

  • Capítulo 6. DISCUSSÃO E RESULTADOS 54

    Figura 34 – Amostra de imagens da base DRIVE .

    (a) 01_test (b) 04_test (c) 13_test (d) 18_test

    (e) (f) (g) (h)

    (i) (j) (k) (l)

    (m) (n) (o) (p)

    (q) (r) (s) (t)

    Fonte: do próprio autor.

  • Capítulo 6. DISCUSSÃO E RESULTADOS 55

    A tabela 2 apresenta a avaliação de performance do método quando aplicado a cada

    uma das 20 imagens de teste. Lembrando que esta base possui um total de 40 imagens,

    porém, apenas 20 imagens são para teste enquanto as outras vinte são utilizadas em

    métodos que necessitam de treinamento para a realização da segmentação, como métodos

    que utilizam redes neurais.

    Utilizando o ground truth para comparar com a segmentação do algoritmo, a melhor

    precisão obtida por este, foi na imagem que possui o nome de 19_test, em que obteve-se

    uma precisão de 97.108 %, e a pior precisão foi de 94.366 % obtida na imagem 08_test.

    Tabela 2 – Resultado da segmentação das 20 imagens da base DRIVE.

    Imagens Acc (%) SN, TPR (%) FPR (%) SP (%) PPV (%)01_test 96.19 71.192 1.361 98.639 83.67202_test 96.09 67.866 0.68981 99.31 91.803_test 94.813 69.82 2.4193 97.581 76.16504_test 95.575 55.347 0.34913 99.651 94.13905_test 95.662 59.608 0.61094 99.389 90.97906_test 95.438 61.62 0.91592 99.084 87.88507_test 95.111 64.576 1.8178 98.182 78.13108_test 94.366 71.19 3.4526 96.547 65.99809_test 95.445 67.683 2.1064 97.894 73.91610_test 96.073 59.865 0.68031 99.32 88.75411_test 95.125 62.321 1.65 98.35 78.78512_test 95.916 72.59 1.8795 98.121 78.49513_test 95.269 56.598 0.54048 99.46 91.90114_test 95.86 74.986 2.3035 97.697 74.11615_test 95.882 70.119 2.1322 97.868 71.71116_test 95.874 64.55 1.0168 98.983 86.30317_test 95.202 70.088 2.4832 97.517 72.23818_test 96.103 69.714 1.626 98.374 78.67619_test 97.108 75.032 0.89494 99.105 88.3520_test 96.251 71.214 1.7619 98.238 76.238

    Média 95.668 66.799 1.5346 98.465 81.414

    O método implementado obteve as seguintes médias: precisão 95.668 %, sensibilidade

    66.799 %, taxa de falso positivo 1.5346 %, especificidade 98.465 % e valor preditivo positivo

    81.414 %. Os valores da tabela 2 são plotados no gráfico da figura 35, para permitir

    uma avaliação visual do desempenho do método a partir do resultado de cada imagem

    segmentada apresentada na tabela 2.

  • Capítulo 6. DISCUSSÃO E RESULTADOS 56

    Figura 35 – Gráfico dos resultados da tabela 2.

    Fonte: do próprio autor.

    A tabela 3 foi criada para mostrar os resultados da segmentação do método, com

    relação a segmentação do segundo observador. A melhor precisão foi de 96.974 % obtida na

    imagem 08_test, e a pior foi de 94.823 %. Os valores de precisão melhor e pior mudaram,

    se comparado com a tabela 2, pois a marcação do segundo observador possui algumas

    pequenas divergências em relação às marcações dos vasos. Isto altera os resultados das

    métricas uma vez que elas levam em conta a segmentação do especialista para avaliar a

    segmentação do método.

    Mas os valores que mostram a eficiência do método, são aqueles valores obtidos

    comparando a segmentação do método com a segmentação fornecida no ground truth.

    Todos os autores que utilizam esta base de imagens para avaliar a eficiências dos métodos

    desenvolvidos por eles, utilizam o ground truth como parâmetro de avaliação. Pois padro-

    niza a forma como os resultados são obtidos, e assim pode-se comparar cada trabalho

    desenvolvido que utiliza esta base de imagens para segmentar vasos sanguíneos.

    A figura 36 possui o gráfico da tabela 3, onde mostra de forma visual os resultados

    obtidos de segmentação, utilizando a segmentação do segundo observador como método

    de comparação.

  • Capítulo 6. DISCUSSÃO E RESULTADOS 57

    Tabela 3 – Resultado da segmentação das 20 imagens da base, utilizando a segmentaçãodo segundo observador.

    Imagens Acc (%) SN, TPR (%) FPR (%) SP (%) PPV (%)01_test 96.363 72.615 1.362 98.638 83.62802_test 96.485 70.122 0.56114 99.439 93.33303_test 95.343 75.183 2.6879 97.312 73.20304_test 95.968 57.858 0.37236 99.628 93.71805_test 96.974 69.144 0.56344 99.437 91.56706_test 95.771 63.932 0.95881 99.041 87.25907_test 96.027 74.994 2.3504 97.65 71.10908_test 94.823 80.797 4.1763 95.824 57.99809_test 95.521 68.207 2.0791 97.921 74.24710_test 96.835 66.63 0.83091 99.169 86.10611_test 95.8 67.319 1.6155 98.385 79.08512_test 96.358 77.039 1.9545 98.046 77.48913_test 95.038 55.235 0.48016 99.52 92.83214_test 96.207 79.368 2.4332 97.567 72.47515_test 95.372 65.88 2.2509 97.749 70.23416_test 96.77 70.694 0.80398 99.196 89.10817_test 96.046 78.652 2.5654 97.435 70.99118_test 96.454 68.909 0.75825 99.242 90.19319_test 95.991 65.294 0.62749 99.373 91.97720_test 95.656 63.636 1.0761 98.924 85.785

    Média 95.99 69.575 1.5254 98.475 81.617

    Figura 36 – Gráfico dos resultados da tabela 3.

    Fonte: do próprio autor.

  • Capítulo 6. DISCUSSÃO E RESULTADOS 58

    Na tabela 4 apresenta a comparação da performance do método implementado com

    outro métodos. Pode-se observar que o método implementado tem uma eficiência muito

    boa pois possui uma precisão alta. O resultado de precisão do método implementado fica

    abaixo apenas, do resultado levando em conta o segundo observador e abaixo também dos

    próprios criadores do método de PATWARI et al., que conseguiram uma precisão de 98,02

    % utilizando a mesma base de imagens (DRIVE).

    A diferença de resultado da precisão obtida na implementação e o resultado obtido

    no trabalho de PATWARI et al., pode ter sido causada por ajustes feitos pelos autores,

    mas que não foram publicados, impossibilitando chegar a este resultado de precisão, ao

    implementar o método criado por eles.

    Tabela 4 – Comparação de performance com outros métodos de segmentação de vasossanguíneos - DRIVE.

    Método Acc (%) SN, TPR (%) FPR (%) SP (%)

    Método Implementado 95.668 66.799 1.5346 98.465Segundo Observador 95.99 69.575 1.5254 98.475

    PATWARI et al. 98.02 98 0 0TAGORE et al. 95.31 - - -ASLANI; SARNEL 95.13 75.45 - 98.01FRANKLIN; RAJAN 95.03 68.67 - 98.24SHAH et al. 94.79 72.05 0.0186 -AKRAM; KHAN 94.69 - - -SOARES et al. 94.66 72.85 2.13 97.86MENDONÇA; CAMPILHO 94.52 73.44 2.36 97.64MARíN et al. 94.52 70.67 - 98.01STAAL et al. 94.41 73.45 - -FRAZ et al. 94.30 71.52 2.31 97.68

    Apesar das imagens 20 imagens de treinamento não serem utilizadas para testar a

    performance do método, tomou-se a liberdade de avaliar a segmentação do método para

    estas 20 imagens. Na tabela 5 estão os resultados de segmentação para cada uma das

    imagens de treinamento, todos os resultados foram obtidos comparando com o ground

    truth. Esta tabela também pode ser vista em forma de gráfico na figura 37.

    Os valores médios de precisão, sensibilidade, taxa de falso positivo, especificidade

    e valor preditivo positivo foram respectivamente: 94.8 %, 67.004 %, 2.498 %, 97.502 %,

    76.841 %.

  • Capítulo 6. DISCUSSÃO E RESULTADOS 59

    Tabela 5 – Resultado da segmentação das 20 imagens de treinamento da base DRIVE.

    Imagens Acc (%) SN, TPR (%) FPR (%) SP (%) PPV (%)21_training 96.742 67.236 0.87454 99.125 86.12922_training 95.77 59.489 0.62635 99.374 90.41523_training 85.863 79.925 13.718 86.282 29.10824_training 94.594 57.205 0.50595 99.494 93.67725_training 94.838 59.168 1.3745 98.626 82.04726_training 94.961 69.318 2.7005 97.299 70.06527_training 95.889 64.008 1.031 98.969 85.71228_training 95.459 61.648 0.88099 99.119 88.33829_training 96.096 64.47 1.0003 99 85.54630_training 95.446 68.139 2.23 97.77 72.2331_training 93.505 75.998 5.3715 94.628 47.58832_training 96.547 68.063 0.91624 99.084 86.8733_training 96.515 70.445 1.1907 98.809 83.88734_training 89.851 74.225 8.4536 91.546 48.7835_training 96.148 64.983 0.89299 99.107 87.35736_training 94.758 62.671 1.3272 98.673 85.21137_training 95.275 61.451 1.4855 98.515 79.84838_training 95.715 68.645 1.7281 98.272 78.95639_training 95.577 69.889 2.0082 97.992 76.58640_training 96.444 73.109 1.6435 98.357 78.48

    Média 94.8 67.004 2.498 97.502 76.841

    Figura 37 – Gráfico dos resultados da tabela 5.

    Fonte: do próprio autor.

  • Capítulo 6. DISCUSSÃO E RESULTADOS 60

    6.2 Discussão e resultados - STARE

    Nesta seção apresenta os resultados obtidos com a segmentação dos vasos sanguíneos,

    utilizando as imagens da base STARE. Esta base possui dois manuais de segmentação, um

    feito por Adam Hoover, que é utilizado como ground truth e o outro feito por Valentina

    Kouznetsova (segundo observador).

    A figura 38 mostra quatro imagens, duas obtidas após a aplicação do método de

    segmentação e as outras duas obtidas diretamente da base. A imagem 38a é uma imagem

    da base STARE, a figura 38c é o ground truth desta imagem, estas duas foram obtidas no

    banco de imagens. A figura 38b é o resultado da segmentação (figura 38d) marcada na

    imagem original, estas duas imagens são geradas como resultado de saída do algoritmo.

    Comparando a figura 38c com a figura 38d, pode-se perceber que o método produz uma

    boa segmentação.

    Figura 38 – Segmentação dos vasos sanguíneos de uma imagem da base STARE.

    (a) Imagem Original. (b) Imagem marcada.

    (c) Ground truth. (d) Vasos sanguíneos segmentados.

    Fonte: do próprio autor.

  • Capítulo 6. DISCUSSÃO E RESULTADOS 61

    Na figura 39 foi montada uma matriz de imagens utilizando as seguintes imagens:

    image0077, image0081, image0162 e image0163 da base STARE, onde cada coluna repre-

    senta uma imagem. Na primeira linha são dispostas as imagens originais, na segunda linha

    as imagens marcadas a partir da segmentação feita pelo método implementado, na terceira

    tem-se o ground truth, e na quarta a marcação dos vasos feita pelo segundo observador.

    Figura 39 – Imagens segmentadas - STARE.

    (a) image0077 (b) image0081 (c) image0162 (d) image0163

    (e) (f) (g) (h)

    (i) (j) (k) (l)

    (m) (n) (o) (p)

    (q) (r) (s) (t)

    Fonte: do próprio autor.

  • Capítulo 6. DISCUSSÃO E RESULTADOS 62

    A tabela 6 apresenta os resultados obtidos na segmentação das vinte imagens do

    banco STARE. Estes resultados foram obtidos utilizando o ground truth como base de

    comparaç