processamento de imagens térmicas para a avaliação do ... · processamento de imagens térmicas...

172
FACULDADE DE E NGENHARIA DA UNIVERSIDADE DO P ORTO Processamento de imagens térmicas para a avaliação do risco de pé diabético - Backoffice Lúcia Vaz Mestrado Integrado em Engenharia Eletrotécnica e de Computadores Orientador: Prof. Dr. Ricardo Vardasca Coorientador: Prof. Dr. Joaquim Mendes 20 de Julho de 2017

Upload: phamtuyen

Post on 03-Dec-2018

232 views

Category:

Documents


0 download

TRANSCRIPT

  • FACULDADE DE ENGENHARIA DA UNIVERSIDADE DO PORTO

    Processamento de imagens trmicaspara a avaliao do risco de p diabtico

    - Backoffice

    Lcia Vaz

    Mestrado Integrado em Engenharia Eletrotcnica e de Computadores

    Orientador: Prof. Dr. Ricardo Vardasca

    Coorientador: Prof. Dr. Joaquim Mendes

    20 de Julho de 2017

  • c Lcia Vaz, 2017

  • Resumo

    Atualmente, em Portugal, estima-se que mais de um milho de indivduos padeam da do-ena metablica Diabetes Mellitus (DM). Deste conjunto de indivduos, cerca de um quarto podedesenvolver uma complicao dada pelo nome de p diabtico (Diabetic Foot Ulcer - DFU) quese manifesta com o aparecimento de uma ou mais lceras na regio do p. Dependendo da suanatureza (neuroptica, neuroisqumica ou isqumica), estas lceras surgem em zonas onde ocorreuma presso, por o indivduo se movimentar ou pelo uso de calado desadequado. Numa faseinicial, um dos primeiros sinais desta patologia o aumento da temperatura e, sendo a termografiauma tcnica que permite obter imagens com os valores de temperaturas existentes na superfciedos objetos capturados, possvel detetar o desenvolvimento desta patologia atravs de imagenstrmicas infravermelhas do p. Anteriormente, em projetos da FEUP, foram recolhidas imagensde pacientes, indivduos em grande risco e em pessoas saudveis, que comprovaram a utilidade datcnica de termografia.

    A finalidade da presente dissertao criar uma ferramenta mais avanada de anlise e clas-sificao de dados, de forma a reduzir o erro humano e sistematizar o uso desta tcnica. Nestesentido, pretendeu-se adaptar tcnicas utilizadas em anlise inteligente de dados (Data-Mining),mais especificamente mtodos de classificao de dados provenientes da rea de aprendizagemautomtica (Machine Learning). Com o sucesso desta adaptao, possvel identificar, atravs daclassificao, a existncia de lceras nas imagens trmicas do p.

    A ferramenta informtica desenvolvida nesta dissertao constituda pela criao de doisprogramas na linguagem C# e pelo armazenamento, numa base de dados (BD), de anlises einformaes extradas dos ficheiros de imagens trmicas recolhidos em projetos anteriores reali-zados na FEUP. O sistema desenvolvido pode ser dividido em cinco partes principais, sendo elasa localizao e extrao de metadados em ficheiros binrios, processamento de imagens, identifi-cao das regies de interesse (ROI), estruturao e povoamento da base de dados, e por ltimo,desenvolvimento de ferramentas que permitam a classificao. Para que no final fosse realizadauma anlise quanto qualidade dos resultados obtidos nos testes de classificao, foi realizada,em paralelo e com os mesmos dados, classificao com o software Weka.

    Ao longo do desenvolvimento da dissertao, foram abordados vrios mtodos a fim de seremobtidos os melhores resultados. Foram encontrados alguns obstculos que desencadearam abor-dagens alternativas e a implementao de mais mtodos. Os resultados obtidos so satisfatriose cumprem com a finalidade proposta. O melhor resultado obtido com o programa desenvolvidopara a classificao apresenta um valor percentual de exatido arredondado para 93% e foi obtidoutilizando o programa desenvolvido e o classificador KNN (K-Nearest Neighbor).

    O resultado final disponibiliza aplicaes informticas que no futuro podero ser aprofundadaspara apoiar no rastreio e seguimento de pacientes em risco de desenvolver p diabtico.

    Palavras chave: Classificao; P diabtico; Termografia; lceras.

    i

  • ii

  • Abstract

    Currently in Portugal, an estimated one million people are affected by Diabetes Mellitus (DM),a metabolic disorder commonly referred to as diabetes. Of this group of people, nearly 25% ofthem can develop serious skin issues such as diabetic foot ulcers (DFU) in their lifetime. Thiscomplication expresses itself by the appearance of one or multiple ulcers in the foot area. De-pending on its nature (Neuropathic, Neuro-ischemic or Ischemic), these ulcers appear on highpressure zones of the foot, either because of the patients movement or inadequate footwear. Inan initial phase, one of the first symptoms of this pathology is the increase of skin temperature.Thermography is a technique that allows the acquisition of images with the temperature values ofthe surface of the framed objects, which allows the early detection of DFUs trough the analysisof thermal infrared images of the foot. In earlier projects developed at FEUP, a set of images wasgathered from patients, high risk individuals and healthy people which demonstrated the useful-ness of thermography.

    The purpose of this dissertation is to design an advanced tool of analysis and data classificationas a way to reduce human error and standardize the use of this technique. With this aim, it wasintended to adapt intelligent data mining procedures, specifically, data classification methods ori-ginally used in the machine learning field of study. With a successful adaptation of these methods,it is possible to identify the existence of early signs of diabetic foot ulcers in thermal images.

    The computational tool developed in this dissertation is assembled by two programs develo-ped using the C# language and by the storage, in a relational database, of all analysis made andinformation extracted from the thermal images. The developed system can be subdivided into fivemain parts, which are the localization and extraction of metadata from the binary files, the imageprocessing, the identification of the regions of interest (ROI), the database structure definition anddata entry, and the development of the classification tool. In order to evaluate the quality of theresults obtained in the classification tests, another set of tests was carried out in parallel, with thesame data and using the Weka software.

    Throughout the development of the various parts of this work, an additional research work wasperformed about which methods should be used in order to obtain the best possible results. Theappearance of several issues and obstacles led to alternative approaches and the development ofdifferent methods. The final results are satisfactory and achieve the proposed objectives. The bestresults achieved in a classification test, using the KNN classifier, presented an accuracy of 93%.

    Therefore, the final result is a set of tools that, in the future, can be used to support the earlydetection and follow-up of patients in risk of developing diabetic foot ulcers.

    Keywords: Classification; Diabetic foot; Thermography; Ulcers.

    iii

  • iv

  • Agradecimentos

    Para no fugir regra, deixo aqui alguns agradecimentos que no poderia deixar de fazer.

    Em primeiro lugar, s pessoas que mais tiveram influncia no desenvolvimento desta disser-tao, quero agradecer ao Professor Ricardo Vardasca e ao Professor Joaquim Gabriel, por teremproposto um tema de dissertao to desafiante e por terem tido sempre sugestes ou alternativasa dar quando algum obstculos surgia.

    Gostava de demonstrar o apreo, que me foi sugerido, pelo projeto NORTE-01-0145-FEDER-000022 - SciTech - Science and Technology for Competitive and Sustainable Industries, co-financiado pelo Programa Operacional Regional do Norte (NORTE2020), financiado pelo FundoEuropeu de Desenvolvimento Regional (FEDER) e pela FCT Fundao para a Cincia e Tecno-logia sobre o projeto (PEst-OE/EME/LA0022/2013).

    s pessoas do L003 quero agradecer pelo ambiente de trabalho proporcionado. Um obrigadoem especial Joana Tavares, Rita Almeida e a Joana Moreira pelos momentos passados.

    s outras pessoas que de uma forma no direta contriburam para o sucesso desta dissertao,obrigada. Em especial, Ins Teixeira por me ter emprestado um pouco da sua infinita criatividade.Ao Joo Silva, por me fazer ver as coisas de um modo diferente. Daniela Carmo, ngela Torrese ao Srgio Pinto pela pacincia, pelas conversas, disponibilidade, coffee breaks, coisas e tais. Atodos, obrigada por estes anos.

    Aos meus amigos de toda a vida e aos meus quase-mdicos de eleio, obrigada pela amizade,conselhos, orientaes mas tambm pelo bom humor e por todos os momentos partilhados. Mariana Martins um obrigado extra pelo tempo disponibilizado.

    Ao Filipe Monteiro, no existem palavras suficientes para poder agradecer por tanto. Assimsendo, apenas posso dizer obrigada por tudo, por mais alguma coisa, por tudo o resto e pelo queainda no ficou includo.

    minha famlia, um obrigado por tudo o que tm aturado nestes ltimos meses. IsabelVila e Leonor Vila um obrigada extra por conseguirem renovar-me a motivao e mostrarem-mecomo se pode fazer o bem com pouco. Susana Barroso, obrigada pela preocupao e disponibi-lidade mesmo em pocas mais complicadas da vida e a centenas de quilmetros de distncia.

    H pessoas a quem agradecer no suficiente porque, mesmo sem o saberem e sem nunca oterem imaginado, contriburam demasiado para merecerem meros agradecimentos. Aos meus paisdedico esta dissertao.

    A todos, Obrigada!

    Lcia Vaz

    v

  • vi

  • A picture can tell a thousand words,but a few words can change its story.

    Sebastyne Young

    vii

  • viii

  • Contedo

    1 Introduo 11.1 Contexto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.2 Motivao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31.3 Finalidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31.4 Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41.5 Estrutura da dissertao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

    2 Estado da arte 72.1 Fundamentos da termografia . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

    2.1.1 Conceitos fundamentais de energia Trmica . . . . . . . . . . . . . . . . 72.1.2 Evoluo da termografia . . . . . . . . . . . . . . . . . . . . . . . . . . 112.1.3 Aquisio e recolha de termogramas . . . . . . . . . . . . . . . . . . . . 122.1.4 Termografia aplicada ao p diabtico . . . . . . . . . . . . . . . . . . . 13

    2.2 Formatos de imagens trmicas . . . . . . . . . . . . . . . . . . . . . . . . . . . 152.2.1 Formatos dos Ficheiros . . . . . . . . . . . . . . . . . . . . . . . . . . . 152.2.2 Extenses de metadados . . . . . . . . . . . . . . . . . . . . . . . . . . 152.2.3 Aplicao ExifTool . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152.2.4 Frmula de clculo de temperatura em imagens trmicas . . . . . . . . . 16

    2.3 Tcnicas de processamento de imagem . . . . . . . . . . . . . . . . . . . . . . . 162.3.1 Pr-processamento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162.3.2 Segmentao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

    2.4 Regies de interesse para a deteo do p diabtico . . . . . . . . . . . . . . . . 182.5 Sistemas de gesto de base de dados . . . . . . . . . . . . . . . . . . . . . . . . 202.6 Sumrio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

    3 Reviso do uso de classificadores em termografia 233.1 Mtodo para a avaliao de um classificador . . . . . . . . . . . . . . . . . . . 23

    3.1.1 Mtricas para a performance . . . . . . . . . . . . . . . . . . . . . . . . 243.1.2 Receiver operating characteristic(ROC) . . . . . . . . . . . . . . . . . . 24

    3.2 Redes Neuronais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 243.2.1 Definio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 243.2.2 Utilizao na termografia . . . . . . . . . . . . . . . . . . . . . . . . . . 27

    3.3 Redes Bayesianas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 303.4 Support Vector Machine . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

    3.4.1 Definio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 313.4.2 Utilizao na termografia . . . . . . . . . . . . . . . . . . . . . . . . . . 32

    3.5 K-nearest neighbor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 333.6 WEKA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

    ix

  • x CONTEDO

    3.7 Sumrio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

    4 Design e especificaes do sistema 374.1 Requisitos do sistema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 374.2 Arquitetura do sistema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 394.3 Sumrio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

    5 Processamento de informao 435.1 Localizao dos metadados em ficheiros Binrios . . . . . . . . . . . . . . . . . 435.2 Processamento de imagens . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44

    5.2.1 Mtodo 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 445.2.2 Mtodo 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48

    5.3 Identificao de ROIs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 485.3.1 Determinao da localizao de cada ROI . . . . . . . . . . . . . . . . . 485.3.2 Determinao de valores de temperatura . . . . . . . . . . . . . . . . . . 49

    5.4 Sumrio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50

    6 Gesto da base de dados e classificao 516.1 Estrutura da base de dados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 516.2 Classifiao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52

    6.2.1 Programa desenvolvido para a classificao . . . . . . . . . . . . . . . . 526.3 Sumrio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

    7 Resultados 557.1 Localizao dos metadados e leitura binria dos ficheiros . . . . . . . . . . . . . 55

    7.1.1 Ficheiros com o formato .img . . . . . . . . . . . . . . . . . . . . . . . 557.2 Processamento de imagem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59

    7.2.1 Mtodo de segmentao . . . . . . . . . . . . . . . . . . . . . . . . . . 597.3 Identificao de ROIs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 627.4 Base de dados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 637.5 Classificao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64

    7.5.1 Representao bi-dimensional dos dados . . . . . . . . . . . . . . . . . 647.5.2 Resultados da classificao . . . . . . . . . . . . . . . . . . . . . . . . . 65

    7.6 Imagens dos programas desenvolvidos em C# . . . . . . . . . . . . . . . . . . . 667.6.1 Programa 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 667.6.2 Programa 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68

    7.7 Sumrio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68

    8 Discusso 698.1 Localizao dos metadados e leitura binria dos ficheiros . . . . . . . . . . . . . 69

    8.1.1 Em ficheiros com o formato .img . . . . . . . . . . . . . . . . . . . . . 698.1.2 Em ficheiros com o formato .jpg . . . . . . . . . . . . . . . . . . . . . . 70

    8.2 Processamento de imagem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 708.3 Identificao de ROIs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 718.4 Base de dados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 718.5 Classificao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 728.6 Sumrio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73

    9 Concluso 75

  • CONTEDO xi

    Referncias 77

    A Informaes metadata 83

    B Resultados da ferramenta ExifTools 87B.1 Em ficheiros .img . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87B.2 Em ficheiros .jpg radiomtrico . . . . . . . . . . . . . . . . . . . . . . . . . . . 88

    C Scripts de cdigo SQL da criao das tabelas de base de dados 93

    D Resultados dos dados calculados nas ROIs 97D.1 Em graus Celcius . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97D.2 Em graus radiomtricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115

    E Resultados da classificao obtidos com o programa desenvolvido 135E.1 Primeiro teste de KNN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135E.2 Segundo teste de KNN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138E.3 Terceiro teste de KNN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141

    F Resultados da classificao obtidos com o programa Weka 145F.1 Primeiro teste de KNN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145

  • xii CONTEDO

  • Lista de Figuras

    1.1 Exemplo de imagens trmicas para cada um dos tipos de lcera. Imagem retiradade [1] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2

    2.1 Espectro eletromagntico relacionado com a energia trmica . . . . . . . . . . . 82.2 Representao da distribuio de Planck para os vrios comprimentos de onda,

    adaptado de [2] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92.3 Representao da lei de deslocamento de Wien . . . . . . . . . . . . . . . . . . 102.4 Espectro eletromagntico e sua utilizao, retirado de [2] . . . . . . . . . . . . . 122.5 Exemplo de um histograma bimodal [3] . . . . . . . . . . . . . . . . . . . . . . 182.6 Regies de Interesse utilizadas[4] . . . . . . . . . . . . . . . . . . . . . . . . . 182.7 Regies de Interesse utilizadas para a caracterizao [2] . . . . . . . . . . . . . . 192.8 Distribuio dos tipos de lceras pelas regies de interesse [2] . . . . . . . . . . 19

    3.1 Exemplo de uma curva ROC . . . . . . . . . . . . . . . . . . . . . . . . . . . . 253.2 Arquitetura de uma rede ANN criada[5] . . . . . . . . . . . . . . . . . . . . . . 253.3 Sistema de Previso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 263.4 Exemplo de um grafo orientado e acclico . . . . . . . . . . . . . . . . . . . . . 303.5 Exemplo da representao de um SVM. . . . . . . . . . . . . . . . . . . . . . . 323.6 Representao das concluses na reviso de classificao . . . . . . . . . . . . . 35

    4.1 Arquitetura do sistema implementado . . . . . . . . . . . . . . . . . . . . . . . 40

    5.1 Diagrama de atividade para a leitura de imagens trmicas . . . . . . . . . . . . . 445.2 Diagrama de atividade para o processamento e segmentao de imagens trmicas 455.3 Exemplo de um histograma obtido . . . . . . . . . . . . . . . . . . . . . . . . . 465.4 Offset percentual entre os valores os valores de mnimo e mdia da temperatura . 465.5 Esboo de construo de um p de Albrecht Drer, 1513 [6] . . . . . . . . . . . 475.6 Localizao das ROIs e dos pontos auxiliares . . . . . . . . . . . . . . . . . . . 485.7 Diagrama de atividade para determinao da posio do pxel central de cada ROI 49

    6.1 Modelo relacional para os elementos de treino da classificao . . . . . . . . . . 516.2 Modelo Relacional para os elementos de treino da classificao . . . . . . . . . . 526.3 Diagrama de atividade para a implementao do classificador KNN . . . . . . . 53

    7.1 Contedo dos primeiros 20 bytes dos ficheiros com o formato .img . . . . . . . . 557.2 Primeiro conjunto de tags encontradas . . . . . . . . . . . . . . . . . . . . . . . 567.3 Segundo conjunto de tags encontradas . . . . . . . . . . . . . . . . . . . . . . . 567.4 Terceiro conjunto de tags encontradas . . . . . . . . . . . . . . . . . . . . . . . 567.5 Quarto conjunto de tags encontradas . . . . . . . . . . . . . . . . . . . . . . . . 57

    xiii

  • xiv LISTA DE FIGURAS

    7.6 Quinto conjunto de tags encontradas . . . . . . . . . . . . . . . . . . . . . . . . 577.7 Exemplo da imagem obtida com a leitura dos valores da matriz radiomtrica . . . 577.8 Exemplo de imagens obtidas obtidas a partir da separao no formato .jpg . . . . 587.9 Imagem padro do formato jpg . . . . . . . . . . . . . . . . . . . . . . . . . . . 587.10 Diagrama Deteo Automtica . . . . . . . . . . . . . . . . . . . . . . . . . . . 597.11 Diagrama por Overlay . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 597.12 Histograma da figura 7.12 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 607.13 Resultados obtidos na Binarizao com valores diferentes para o limiar . . . . . . 607.14 Outros resultados obtidos na Binarizao . . . . . . . . . . . . . . . . . . . . . . 617.15 Limites exteriores e em falta no dorso dos ps. . . . . . . . . . . . . . . . . . . . 617.16 rea recuperada e limites de rea em falta . . . . . . . . . . . . . . . . . . . . . 617.17 Algumas representaes bi-dimensionais obtidas . . . . . . . . . . . . . . . . . 647.18 Screenshot do primeiro programa . . . . . . . . . . . . . . . . . . . . . . . . . . 677.19 Screenshot do mtodo de overlay . . . . . . . . . . . . . . . . . . . . . . . . . . 677.20 Screenshot do segundo programa . . . . . . . . . . . . . . . . . . . . . . . . . . 68

  • Lista de Tabelas

    1.1 Classificao de lcera de Meggitt-Wagner. [7] . . . . . . . . . . . . . . . . . . 2

    2.1 Ranking adaptado da atualizao de Junho de 2017[8] . . . . . . . . . . . . . . . 202.2 Detalhes de cada DBMS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

    4.1 Requisitos funcionais do sistema . . . . . . . . . . . . . . . . . . . . . . . . . . 384.2 Requisitos no funcionais do sistema . . . . . . . . . . . . . . . . . . . . . . . . 39

    7.1 Resultados da tabela public.utente presente na base de dados . . . . . . . . . . . 637.2 Numero de elementos inseridos na BD . . . . . . . . . . . . . . . . . . . . . . . 637.3 Resultados para o primeiro teste . . . . . . . . . . . . . . . . . . . . . . . . . . 657.4 Resultados obtidos no programa WEKA . . . . . . . . . . . . . . . . . . . . . . 667.5 Resultados obtidos no programa desenvolvido para o classificador KNN . . . . . 66

    A.1 Informao retirada da extenso .FFF[9] . . . . . . . . . . . . . . . . . . . . . . 83A.2 Informao contida na Tag CameraInfo da extensao .FFF . . . . . . . . . . . . . 84A.3 Informao retirada da extenso .FPF . . . . . . . . . . . . . . . . . . . . . . . 85

    B.1 Resultados obtidos com a aplicao de ExifTool para uma imagem trmica do tipo.img . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87

    B.2 Resultados obtidos com a aplicao de ExifTool para uma imagem trmica do tipo.jpg radiomtrico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88

    xv

  • xvi LISTA DE TABELAS

  • Abreviaturas

    AI Artificial IntelligenceANN Artificial Neural NetworkAUC Area Under the ROC CurveBD Base de DadosBN Bayesian NetworkBP BackPropagationDBMS DataBase Management SystemsDFU Diabetic Foot UlcerDICOM Digital Imaging and Communicatons in MedicineDM Diabetes MellitusDN dynamic neural networkFEUP Faculdade de Engenharia da Universidade do PortoFN Falso NegativoFP Falso PositivoID IDentificationIGR Information Gain RatioIMC ndice de Massa CorporalIR Infrared RadiationIRT InfraRed ThermographyKNN K-Nearest NeighborLDA Linear Discriminant AnalysisMITI Medical Infrared Thermal ImagingNDA Nonparametric discriminant analysisPCA Principal Component AnalysisROC Receiver Operating CharacteristicROI Regions of Interest / Regio de InteresseSI Sistema Internacional de unidadesSVM Support Vector MachineVN Verdadeiro NegativoVP Verdadeiro PositivoWEKA Waikato Environment for Knowledge Analysis

    xvii

  • Captulo 1

    Introduo

    Este capitulo tem o objetivo de introduzir o trabalho realizado no desenvolvimento desta dis-

    sertao do Mestrado Integrado em Engenharia Eletrotcnica e de Computadores.

    1.1 Contexto

    O problema do p diabtico pode ser entendido como uma complicao associada doena

    metablica de Diabetes Mellitus (DM) que se manifesta com o aparecimento de lcera na regio

    do p (DFU - Diabetic Foot Ulcer) que ocorrem normalmente em zonas onde existe uma presso

    aumentada, ou seja, pelo uso de calado desadequado ou reas do p onde se aplica mais fora ao

    andar.

    Segundo o relatrio elaborado pela Sociedade Portuguesa de Diabetologia [10] no ano de 2014

    a prevalncia estimada da doena metablica de Diabetes na populao portuguesa foi de 13,1%, o

    que significa que, mais de 1 milho de portugueses tem DM. Um em cada quatro destes indivduos

    podem desenvolver complicaes associadas a lceras. Este problema assume importncia num

    quadro clinico devido influncia altamente negativa que provoca na qualidade de vida do doente

    e dos seus familiares. Isto acontece devido ao elevado grau de dependncia de terceiros a que os

    doentes ficam sujeitos. Em alguns casos, aps o diagnstico do p diabtico so necessrios meses

    de tratamento e eventualmente a pessoa acabar por sofrer amputao parcial ou total do membro

    afetado no caso mais grave[11].

    Existem trs tipos de lceras no p diabtico: neuropticas, isqumicas e neuroisqumicas.

    No primeiro tipo, ocorreu um aumento prolongado da glicose assim como mudanas sensoriais e

    motoras. Por um lado, a neuropatia sensorial leva perda da sensibilidade no p enquanto que

    a neuropatia motora pode provocar deformidades do p, perda de gordura na regio plantar do

    p, deformao nas articulaes e outros danos associados. Por este motivo, neste tipo de lceras

    existe um aumento da temperatura em relao mdia do p. Por outro lado, nas lceras isqu-

    micas existe uma doena vascular perifrica que provoca uma obstruo ou alterao no normal

    fluxo sanguneo nas extremidades do p, o que leva diminuio da temperatura nas regies onde

    1

  • 2 Introduo

    exista lcera. Contudo, so raros os casos de existncia deste tipo de lceras puramente isqumi-

    cas sendo mais comum a existncia de lceras neuroisqumicas, ou seja, com natureza isqumica

    e neuroptica [12]. A figura 1.1 apresenta atravs de imagens trmicas um caso de cada tipo de

    lcera.

    Figura 1.1: Exemplo de imagens trmicas para cada um dos tipos de lcera. Imagem retirada de[1]

    Estas 3 capturas esto includas num conjunto de imagens recolhidas no decorrer de uma

    dissertao realizada na FEUP pela Ana Rita Soares Marques[1] com o ttuloDiabetic foot ther-

    mophysiology characterization e que teve como objetivo a caracterizao do p diabtico por

    termografia.

    Uma lcera pode ser classificada em seis graus de gravidade consoante o sistema de classi-

    ficao de Meggit-Wagner, representado na tabela 1.1, sendo este sistema utilizado nos servios

    de sade para a classificao, interveno e encaminhamento do utente diagnosticado. Contudo,

    apenas os casos de grau 0 no apresentam sinais visveis da presena de lcera, ou sejas, so casos

    considerados como situaes de risco de inflamao. Por consequente, na maioria das situaes,a

    tcnica de avaliao do risco de ulcerao utilizada atravs de exames fsicos que comprovem a

    perda de sensibilidade[7]. Contudo, este mtodo de avaliao no abrange a totalidade dos casos

    de pr-ulcerao uma vez que a perda da sensibilidade depende da natureza da lcera. Assim

    sendo, atualmente fazem falta, na assistncia mdica, mtodos no evasivos e eficazes para a de-

    teo precoce.

    Tabela 1.1: Classificao de lcera de Meggitt-Wagner. [7]

    Grau Caractersticas da ferida0 Leses pr-ulcerao, lceras cicatrizadas, presena de deformidade ssea.1 lcera superficial sem envolvimento de tecido subcutneo.2 Penetrao atravs de tecido subcutneo; pode expor osso, tendo, ligamento ou cpsula de articulao.3 Ostete, abcesso ou osteomielite.4 Gangrena do dedo.5 Gangrena do p.

  • 1.2 Motivao 3

    1.2 Motivao

    A alterao da temperatura pode ser considerada um sintoma da presena de vrias patologias

    no ser humano e, por este motivo, a monitorizao da temperatura em meios clnicos considerada

    um indicador de diferentes doenas. A termografia mdica um mtodo que possibilita a monito-

    rizao pretendida porque permite analisar a distribuio da temperatura presente na superfcie da

    pele no momento da captura da imagem. Por se tratar de um mtodo no invasivo, no ionizante

    e preciso, possui um elevado potencial de uso para as prticas clinicas tanto em diagnstico como

    em tratamento ou monitorizao. Desta forma a termografia um mtodo complementar e no um

    substituto dos mtodos atualmente existentes. Algumas destas utilizaes encontram-se referidas

    nos artigos de K. Ammer[13][14] no existindo ainda, contudo, um sistema normalizado, prtico

    e adaptado que simplifique o uso desta tcnica.

    Neste sentido, a monitorizao da temperatura torna-se numa alternativa vivel para o deteo

    precoce da patologia do p diabtico uma vez que nem todos os casos de pr-ulcerao levam

    perda de sensibilidade e a alteraes no fluxo sanguneo Por este motivo, recomendado o

    rastreio peridico, contudo, na atualidade, no existe uma ferramenta objetiva de rastreio atravs

    de processamento e captura de imagens trmicas[15].

    Apesar da existncia de uma relevante recolha previamente efetuada, em projetos da FEUP

    durante os ltimos 3 anos , que permite uma boa caracterizao do problema e comprova a pos-

    sibilidade de utilizao de termografia no diagnstico do p diabtico, necessrio criar uma

    ferramenta mais avanada de anlise de dados para permitir o seu uso corrente. Neste sentido,

    pretende-se adaptar tcnicas utilizadas em anlise inteligente de dados (Data-Mining), mais espe-

    cificamente, mtodos de classificao de dados provenientes da rea de aprendizagem automtica

    (Machine Learning). Com esta adaptao, pretende-se que seja possvel identificar, atravs da

    classificao efetuada pelos mtodos aplicados, a existncia de lceras nas imagens trmicas.

    1.3 Finalidade

    Com o trabalho desenvolvido pretende-se que seja possvel identificar, atravs da classificao

    efetuada pelos mtodos adaptados e aplicados, a existncia de lceras nas imagens trmicas. Desta

    forma, o resultado final possibilita uma ferramenta informtica que no futuro poder ser utilizada

    para apoiar o rastreio e seguimento de pacientes em risco de desenvolver p diabtico em Portugal.

    Para que esta finalidade seja alcanada necessrio assegurar duas caratersticas fundamentais:

    eficcia e simplicidade em termos de utilizao.

    Por um lado espera-se que a ferramenta seja de simples utilizao para que possa ser adotada

    tanto pelos meios complementares de diagnstico do Sistema Nacional de Sade (SNS) como

    por outros meios de assistncia na doena disponveis em Portugal. Caso contrrio ser uma

    ferramenta obsoleta.

    Por outro lado, para que o trabalho desenvolvido possa ser utilizado no futuro necessrio

    assegurar a sua complexidade no sentido de ser eficaz em qualquer tipo de dados para que os

  • 4 Introduo

    resultados sejam fiveis. Caso contrrio, a alternativa de identificao prematura do p diabtico

    desenvolvida no servir de garantia se a probabilidade de apresentar resultados incorretos for alta.

    1.4 Objetivos

    Para que a finalidade proposta seja cumprida, necessrio definir quais os objectivo a alcanar

    com esta dissertao:

    1. Estudo dos formatos proprietrios de imagens trmicas mais comuns e disponveis.

    2. Definir um conjunto de dados para armazenar as imagens recolhidas de p diabtico.

    3. Desenvolver uma ferramenta de anlise avanada com mtodos de processamento de ima-

    gem.

    4. Armazenar, numa base de dados, as imagens recolhidas em projetos anteriores da FEUP.

    5. Desenvolver e avaliar a performance dos classificadores de dados correlacionando-os com

    a classificao previamente determinada.

    1.5 Estrutura da dissertao

    Para alm da introduo, esta dissertao contm mais 8 captulos e vrios anexos. Os tpicos

    seguintes indicam o tema do contedo de cada captulo:

    No captulo 2, descrito o estado da arte e so apresentados trabalhos relacionados com atermografia.

    No captulo 3, apresentada uma reviso do uso de ferramentas de classificao em aplica-es clnicos com a termografia.

    No captulo 4, encontra-se as especificaes genricas do projeto desenvolvido, nomeada-mente, a arquitetura e os requisitos do sistema.

    No captulo 5 explicada a metodologia adotada na parte da anlise de imagens trmicasdeste projeto.

    O captulo 6 remete para um esclarecimento da forma como a base de dados foi construdae da metodologia adotada para a aplicao da classificao.

    No captulo 7 so apresentados os resultados obtidos ao longo do desenvolvimento destadissertao.

    No captulo 8 realizada uma anlise dos resultados e apresentada uma resposta a cadaum dos objetivos propostos.

  • 1.5 Estrutura da dissertao 5

    O captulo 9 a parte mais conclusiva deste documento que inclui sugestes de trabalhofuturo.

  • 6 Introduo

  • Captulo 2

    Estado da arte

    Este captulo pretende introduzir os estudos, artigos e as investigaes mais tericas que foram

    efetuadas at ao momento por diferentes entidades e que esto relacionados com o tema desta

    dissertao.

    2.1 Fundamentos da termografia

    2.1.1 Conceitos fundamentais de energia Trmica

    2.1.1.1 Espectro eletromagntico

    Toda a energia existente pode ser expressa no espectro eletromagntico em funo das frequn-

    cias e comprimentos de onda. Numa geral representao do espectro eletromagntico, este encontra-

    se dividido por diferentes regies denominadas por bandas do espectro.

    As diferentes regies podem ser distinguidas por mtodos utilizados para produzir e detetar a

    radiao. No h diferena fundamental entre a radiao nas diferentes bandas do espectro ele-

    tromagntico. Por este motivo, so aplicadas as mesma regras e frmulas de clculo em qualquer

    uma das bandas sendo que o que varia em cada uma delas o comprimento de onda e respetiva

    frequncia.

    Contudo, com as experincias executadas por Herschel, concluiu-se que a energia trmica

    diferente para cada uma das cores da parte da luz visvel sendo que crescente no sentido

    do violeta para o vermelho. Outra concluso foi a existncia de energia trmica na regio dos

    infravermelhos, localizada direita do espectro visvel. Na figura 2.1 podem ser consultadas as

    frequncias que pertencem energia libertada sob a forma de radiao trmica e tambm as partes

    em que se pode decompor a energia infravermelha [16].

    2.1.1.2 Temperatura e radiao

    A Temperatura uma grandeza fundamental inserida no sistema internacional de unidades

    (SI) que apresenta medies relativas a um dado sistema. Esta medida da energia cintica avalia

    o nvel de agitao das molculas que constituem um corpo na medida em que, quanto maior for

    7

  • 8 Estado da arte

    Figura 2.1: Espectro eletromagntico relacionado com a energia trmica

    o movimento das partculas, maior ser a temperatura apresentada e, portanto, mais quente ser

    o corpo. A existncia de corpos num dado sistema com valores de temperatura distintos gera a

    necessidade de transmisso de energia porque todos os sistemas procuram obter um equilbrio

    trmico.

    As ondas eletromagnticas so o resultado do fluxo trmico, ou seja, da transmisso da radia-

    o trmica de um corpo mais quente para um corpo mais frio. Uma vez que o estado de equilbrio

    trmico nunca alcanado, todos os corpos esto em constante transmisso de radiao trmica.

    A forma de radiao que ocorre numa superfcie depende do modo como ocorre a incidncia

    da mesma. As formas de representar a radiao que incide numa superfcie variam consoante a

    origem, trajeto e efeito produzido pela radiao. Algumas representaes conhecidas so: trans-

    misso, reflexo, refrao, difuso, absoro e emisso.

    2.1.1.3 Emissividade e corpo negro

    Entende-se por emisso a radiao que emitida pela superfcie de um corpo para o seu exte-

    rior. Emissividade uma medida para a capacidade que um corpo possui de emitir energia a partir

    do seu interior, comparativamente com a emissividade de um corpo negro. Esta taxa varia entre 0

    a 1, onde 0 atribudo a um corpo que reflete toda a radiao (como por exemplo um espelho) e 1

    significa que absorve toda a energia tratando-se portanto de um corpo negro. Relativamente pele

    do corpo humano internacionalmente aceite que o valor da emissividade seja 0.98.

    O conceito de corpo negro atribudo a um objeto ideal que no existe na realidade. Por

    possuir emissividade 1, este corpo tem a capacidade de absorver toda a radiao que nele incide e

    emitir apenas radiao trmica numa temperatura especfica, emitindo-a para todas as frequncias

    e comprimentos de onda. Apesar de no existir fisicamente um corpo negro, existem equipamentos

    e mecanismos de aproximao que so utilizados na validao de resultados apresentados por

    cmaras termogrficas.

  • 2.1 Fundamentos da termografia 9

    2.1.1.4 Distribuio de Planck, lei de deslocamento de Wien e lei de Stefan-Boltzman

    Embora o corpo negro apenas emita radiao numa dada temperatura, a frequncia e o compri-

    mento de onda relativos temperatura especificada podem variar. Para calcular a intensidade es-

    pectral, mais concretamente, a emitncia produzida por um corpo negro, utiliza-se a lei de Planck.

    Nesta expresso, o valor da radiao obtido em funo do comprimento de onda e da temperatura

    expressos na seguinte frmula[2]:

    E ,b( ,T ) =C1

    5[exp( C2T )1](2.1)

    Onde:

    E ,b = emitncia espectral (intensidade da radiao hemisfrica) [W/m2 m]

    C1 = 3.742108[W m4/m2]

    C2 = 1.4387104[m K]

    = comprimento de onda da radiao [m]

    T = temperatura absoluta [K]

    A distribuio de Planck apresenta a quantidade de radiao emitida por um corpo negro numa

    representao grfica que se pode observar na figura 2.2.

    Figura 2.2: Representao da distribuio de Planck para os vrios comprimentos de onda, adap-tado de [2]

  • 10 Estado da arte

    Derivada da lei de Planck surgiu a lei de deslocamento de Wien. Neste caso, possvel calcular

    o comprimento de onda (max) que corresponde intensidade de radiao mxima para uma dadatemperatura. Este valor obtido com o clculo da expresso 2.2.

    max =bT

    (2.2)

    Onde:

    max = comprimento de onda correspondente intensidade de radiao mxima [m]

    b = 2.8977685103 constante de disperso de Wien [mK]

    T = temperatura absoluta [K]

    A figura 2.3 representa a lei de deslocamento de Wien na distribuio de Planck para os vrios

    comprimentos de onda de um corpo negro. Tal como se pode observar, o aumento da temperatura

    e intensidade da radiao emitida inversamente proporcional ao valor do comprimento de onda.

    Figura 2.3: Representao da lei de deslocamento de Wien

    Dentro do mesmo contexto importante ainda referir a lei de Stefan-Boltzman. Nesta lei,

    a energia total irradiada por um corpo negro diretamente proporcional quarta potncia da

    temperatura, expressa pela expresso 2.3.

    J = T 4 (2.3)

    Onde:

    J = energia total [W/m2]

    = valor da emissividade

  • 2.1 Fundamentos da termografia 11

    = 5,669108[W/m2K4] constante de Stefan-Boltzmann.

    T = temperatura absoluta [K]

    Em suma, todos estes conceitos pertencentes fsica trmica so importantes para esclarecer

    o modo como as cmaras trmicas calculam o valor da temperatura. Este clculo feito utilizando

    a quantidade de energia absorvida pelos sensores da cmara na equao 2.4.

    T = 4

    J

    (2.4)

    Onde:

    T = temperatura absoluta [K]

    J = energia total [W/m2]

    = valor da emissividade

    = 5,669108[W/m2K4] constante de Stefan-Boltzmann.

    2.1.2 Evoluo da termografia

    A temperatura superfcie da pele um indicador fsico relevante para a anlise do normal

    funcionamento do corpo humano. Esta constatao foi inicialmente apoiada por Hipcrates, o

    fsico grego tambm conhecido como pai da medicina moderna, nas suas teorias de que as doenas

    tm causas naturais e no acontecem por causas supersticiosas ou divinas. Para comprovar estes

    ideais na poca, foram registados valores de temperatura utilizando banhos de lama. Com estes

    registos conseguia-se diferenciar as regies mais quentes das mais frias e, com isto, era possvel

    identificar as reas em que haveria mais probabilidade de existirem doenas.[17] .

    Mais tarde, em 1871 foi publicado o trabalho elaborado por Carl Wunderlich que caracterizou a

    temperatura de vrias patologias e introduziu a utilizao de termmetros e grficos de temperatura

    em prticas clnicas[18][19].

    Devido constante evoluo da medicina e da tecnologia, existem atualmente diversos mto-

    dos de captura de imagem utilizados em prticas clnicas. Cada um destes mtodos tem as suas

    caractersticas prprias e utiliza uma banda especfica do espectro eletromagntico. A figura 2.4

    apresenta um resumo sobre em que medida as vrias pores do espectro eletromagntico so

    utilizadas em diferentes prticas incluindo uma caracterizao dos respetivos mtodos[2].

    Relativamente termografia, esta apresenta algumas vantagens conhecidas, como por exem-

    plo, o facto de no expor indivduos a radiao ionizante, de ser um mtodo no invasivo, a exis-

    tncia de equipamentos portteis e o tempo de captura das imagens ser consideravelmente curto.

  • 12 Estado da arte

    Figura 2.4: Espectro eletromagntico e sua utilizao, retirado de [2]

    2.1.3 Aquisio e recolha de termogramas

    Devido ao facto de as imagens trmicas serem sensveis s mudanas das condies ambien-

    tais, como por exemplo s alteraes da humidade relativa do ar, existe a necessidade de se criar

    um protocolo com as normas necessrias para a captura de termogramas [20].

    A aquisio em termografia pode ser dividida nas categorias de esttica ou dinmica, isto ,

    imagens com captura nica ou com vrias capturas ao longo do tempo a fim de estudar o compor-

    tamento verificado como resposta presena de um estmulo, que pode ser trmico, mecnico ou

    qumico. Outra diviso possvel acontece com a repetio da captura que pode ser nica, acompa-

    nhada ou sequencial.

    As cmaras trmicas so equipamentos que nos ltimos anos tm evoludo positivamente per-

    mitindo cada vez mais qualidade e veracidade nas imagens capturadas.

    A FLIR R Systems[21] uma companhia pioneira na rea da captura de imagens trmicasdevido ao seu desenvolvimento tecnolgico e disponibilizao de produtos como cmaras trmicas

    cada vez com mais definio e melhorias nas caractersticas. Este empenho e disponibilidade torna

    esta empresa lder de mercado nesta rea.

  • 2.1 Fundamentos da termografia 13

    2.1.4 Termografia aplicada ao p diabtico

    No sentido de especificar o uso da termografia na problemtica do p diabtico foi recolhida

    e analisada informao relevante e disponvel at data que relacione a imagem trmica com a

    avaliao de lceras em p diabtico. Os assuntos aqui descritos foram baseados na bibliografia

    consultada e apresentada de seguida.

    Primeiramente, no ano de 2007, foi publicado um artigo[22] realizado com o intuito de avaliar

    se a monitorizao de temperatura a partir do lar um mtodo efetivo no rastreio do p diabtico.

    Neste sentido, foi testada a hiptese de que a auto-monitorizao poderia reduzir a taxa de ulce-

    rao no p contribuindo, por isso, para a melhoria da qualidade de vida do doente. Ou seja, esta

    monitorizao tinha como objetivo avaliar o risco de incidncia de lceras em ps de pacientes

    diabticos considerados de alto risco. Foram criados dois grupos de pacientes para a avaliao:

    um com os pacientes com histrico de lceras ou amputaes e outro grupo com os pacientes de

    perda sensorial ou deformidades estruturais no p. Como resultado, esse mesmo estudo apresenta

    gradientes de alta temperatura entre os ps que podem prever o incio do aparecimento de lceras

    e a auto-monitorizao pode reduzir esse mesmo risco.

    Um artigo mais recente[23] contempla uma reviso dos estudos que relacionam a temperatura

    na superfcie do p com a tomografia trmica do p diabtico. Neste estudo, so apresentado o

    potencial e os benefcios da utilizao da termografia infravermelha em problemas do p diab-

    tico e ainda so apresentados os diferentes mtodos de anlise para os termogramas bem como

    as vantagens e as desvantagens de cada um. Dos mtodos de anlise apresentados (temperatura

    independente dos membros, temperatura assimtrica, distribuio da temperatura e, por ltimo,

    anlise da temperatura na presena de um estmulo de stress externo) indicado que as anlises

    mais utilizadas sejam a assimtrica e a de stress externo e, noutro extremo, a menos utilizada a

    distribuio de temperaturas. Com a anlise da temperatura independente dos membros obtm-se

    intervalos de temperatura representativos entre diferentes grupos de estudo, contudo, no poss-

    vel detetar reas especificas relacionadas com o risco elevado de presena de lcera. Na anlise da

    temperatura assimtrica realizada uma comparao entre a temperatura de um ponto num p com

    a temperatura do ponto contralateral respetivo presente no outro p. Com esta comparao pos-

    svel detetar reas de rico elevado de presena de lceras e por isso este mtodo tem apresentado

    bons resultados. Contudo, apresenta tambm limitaes, como por exemplo o facto no funciona

    quando o paciente apresenta complicaes similares nos dois membros ou nos casos em que o

    paciente apresente amputaes e por isso no se pode calcular o valor da diferena de temperatura

    para os pontos em anlise. A anlise da distribuio de temperatura tem como maior vantagem

    no utilizar comparaes e, portanto, no apresenta as mesmas dificuldades que o mtodo ante-

    rior. Apesar disto, um mtodo pouco utilizado e por isso no existe at data um padro para

    representar a distribuio de temperatura num p normal embora tenham sidos reportados padres

    irregulares na distribuio de temperatura de ps diabticos, o que dificulta a classificao destas

    distribuies. Numa anlise de stress externo aplicado um estimulo externo no paciente (por

    exemplo: imerso do membro em gua fria) e analisado o comportamento da temperatura plan-

  • 14 Estado da arte

    tar ao estmulo aplicado. Um dos principais inconvenientes desta anlise o desconforto que pode

    causar nos pacientes.

    No ano de 2015, outro artigo de reviso[24] descreve a abordagem adotada por uma inves-

    tigao em curso. Essa investigao pretende aliar a deteo precoce de complicaes no p

    diabtico com componentes complementadas por um ecossistema computacional. De uma forma

    mais detalhada, o projeto inclui a juno de equipamento fsico com uma aplicao alojada numa

    plataforma web e a metodologia pode ser explicada em cinco partes. No incio, capturada uma

    imagem trmica plantar de um paciente atravs de um scanner trmico. De seguida, o tcnico

    profissional responsvel pela captao confirma se a imagem foi corretamente capturada e a se-

    guir envia a imagem (upload) para a aplicao web desenvolvida. Na terceira parte deste projeto

    a imagem processada pela aplicao. Neste processamento, a imagem segmentada de forma

    a que resulte em dois segmentos (um segmento para cada p). Na quarta parte, cada segmento

    dividido de forma o obterem-se as Regies de interesse (ROI - Regions Of Interest) e avaliado

    o risco da presena de lceras em cada regio de acordo com as assimetrias detetadas nos valores

    da temperatura. Por fim, tanto a imagem inicialmente enviada para a aplicao como os dados

    resultantes da avaliao do risco so encapsulados para o formato DICOM (Digital Imaging and

    Communicatons in Medicine) que um formato standard para imagens mdicas. Em suma, esta

    soluo em desenvolvimento permite registar imagens termogrficas e monitorizar a evoluo de

    casos clnicos ou identificar atempadamente o desenvolvimento de lceras.

    Uma publicao do ano de 2015[25] apresenta a abordagem de uma deteo sustentada por

    um sistema inteligente de telemedicina descrito como vivel e rentvel. Aps a aquisio de

    imagens trmicas procedeu-se segmentao das reas correspondentes planta do p. Devido

    ao facto de existir uma pequena diferena de temperatura entre algumas partes do p importantes

    na segmentao e a temperatura ambiente, foi difcil conseguir um bom resultado da segmentao

    e por isso foram adotadas vrias abordagens nesta etapa. O melhor resultado foi obtido quando se

    segmentaram imagens RGB e se combinaram esse resultados com as capturas trmicas. Depois da

    segmentao estar concluda, a etapa seguinte tinha o objetivo de detetar zonas de risco de presena

    de complicaes associadas patologia do p diabtico. Foi realizada uma anlise assimtrica com

    um critrio de identificao de 2.2oC. Os resultados apresentados foram satisfatrios e demonstram

    como a abordagem promissora embora sejam tambm apresentadas algumas limitaes como o

    caso em que impossvel realizar anlise assimtrica em casos de amputamentos e em casos de

    existir complicaes simtricas nos dois ps. Outra limitao encontrada foi a inexistncia de um

    padro ideal standard para a segmentao e registo do valor de temperatura, sendo complicado

    avaliar os resultados objetivamente.

    Num trabalho de deteo e anlise da hipertermia do p diabtico, os autores de um artigo

    [26] publicado em 2016, criaram um programa que, atravs de capturas trmicas, produz imagens

    com a leitura do valor da diferena de temperatura mdia absoluta de sete regies entre o p

    esquerdo e o p direito (anlise assimtrica). A metodologia adotada pode ser explicada em duas

    etapas: segmentao e avaliao. Na segmentao procurou-se selecionar apenas as partes da

    imagem pertencentes s zonas do p e de seguida dividiram-se essas partes de forma a obterem

  • 2.2 Formatos de imagens trmicas 15

    as ROIs pretendidas. Na avaliao, as 85 imagens de ps diabticos recolhidas foram divididas

    e classificadas consoante o grau de risco da presena de lcera: alto, mdio ou baixo. Como

    resultados genricos, p diabticos com o valor da diferena de temperatura mdia superior a

    2.2oC foram apontados como pacientes que carecem de ateno reforada por parte dos mdicos

    porque existe um grande potencial de desenvolver complicaes como lceras ou infees. Como

    limitao, este estudo apresenta a necessidade de uma cmara trmica para a recolha de imagens

    a fim de facilitar a segmentao e, por consequncia, a leitura dos valores de temperatura.

    2.2 Formatos de imagens trmicas

    2.2.1 Formatos dos Ficheiros

    As cmaras usadas para a captao das imagens infravermelhas (IR - infrared) so do fornece-

    dor FLIR[21], mais concretamente, tratam-se das cmaras FLIR ONE[27], FLIR A325sc e FlIR

    E60sc.

    Destas cmaras consegue-se extrair imagens de diferentes formatos de ficheiro, sendo esses

    tipos o .IMG, o .SEQ e o .JPEG radiomtrico. Para cada formato de imagem a informao que se

    pretende extrair encontra-se estruturada de formas diferentes. Neste sentido, necessrio ter em

    conta o formato de cada um dos diferentes tipos.

    2.2.2 Extenses de metadados

    Metadados so informaes sobre as caraterstas presentes no ficheiro e nos dados nele conti-

    dos. Estes metadados so divididos por extenses e subdivididos por itens (tags). Neste sentido,

    uma tag a unidade bsica de metadado.

    Para alm de existirem diferentes formatos de imagem, existem tambm vrias extenses que

    disponibilizam metadados contidos nos ficheiros das imagens trmicas Das diferentes extenses

    existentes ser dado mais destaque extenso .FFF (Flir System thermal image File Format) e

    .FPF (Flir Public image Format). Embora o contedo presente nestas extenses seja semelhante

    existem algumas diferenas que no podem ser desprezadas.

    No anexo A encontram-se algumas tabelas informativas sobre quais os dados provenientes das

    extenses referidas. Nomeadamente, as tabelas A.1 e A.2 mostram algumas das informaes que

    se podem retirar a partir da extenso .FFF. A tabela A.3 mostra as informaes que se pode retirar

    da extenso .FFF.

    2.2.3 Aplicao ExifTool

    Com o auxlio da ferramenta Exiftool[28], possvel descodificar as informaes metadata

    de vrios tipos de ficheiros. Exiftool uma aplicao que corre na linha de comandos de vrios

    sistema operativos e que possibilita a leitura, escrita e edio de informao do tipo metadata.

    Depois de utilizar esta ferramenta em alguns ficheiros do tipo .img obtiveram-se os valores

    para alguns dados que sero necessrios para o processamento correto das imagens. Estes dados

  • 16 Estado da arte

    esto apresentados mais concretamente na tabela B.1 para as imagens do tipo .img e na tabela B.2

    para as do tipo .jpg.

    2.2.4 Frmula de clculo de temperatura em imagens trmicas

    Tal como se pode verificar pelos resultados do Exiftool, das imagens recolhidas, conseguem-se

    recolher valores para cinco constantes de Planck. Estes dados so cruciais para o clculo correto

    do valor de temperatura.

    A frmula correta para a clculo do valor da temperatura de um objecto capturado depende do

    valor radiomtrico e das cinco constantes de Planck[29] como se pode observar na expresso 2.5:

    T =B

    ln( R1R2(S+O) +F)(2.5)

    Onde:

    T = temperatura do objecto [K]

    S = valor radiomtrico (16 Bit)

    R1 = constante Planck R1

    R2 = constante Planck R2

    B = constante Planck B , valor no intervalo [1300,1600]

    F = constante Planck F , valor no intervalo [0.5,2]

    O = constante Planck O (offset) , valor negativo

    2.3 Tcnicas de processamento de imagem

    2.3.1 Pr-processamento

    O pr-processamento de imagem uma tcnica til para uma melhor leitura e anlise de dados

    importantes em imagens trmicas. Dois fatores a ter em conta so, por exemplo, o contraste com

    o fundo da imagem (background) e a presena de ruido indesejado.

    Numa imagem trmica, a existncia considervel de rudo pode afetar a extrao do objeto de

    interesse e dificultar os valores reais da medio de fraco contraste entre o alvo e o background

    pode afetar a extrao do objeto de interesse e aumentar o tempo perdido na sua anlise. Conforme

    o que foi publicado pelo artigo de Bajwa et al publicado em 2010 [30], os operadores baseados

    em probabilidade produzem o melhor resultado, especialmente aps pr-processamento com um

    filtro de remoo de rudo.

    Quanto ao fator de presena de ruido, outro artigo[31], compara vrias tcnicas de remoo

    de rudo com o intuito de classificar e apurar qual melhor se adapta sem causar uma leitura errada

    dos valores de temperatura. Como resultado final os que melhor se adaptam so os filtros Median,

  • 2.3 Tcnicas de processamento de imagem 17

    Mean e Wiener, contudo, sugerido ainda que a filtragem de rudo s deve ser aplicada quando

    especificamente necessrio.

    Os filtros de mdia (mean) so do tipo de filtros de suavizao lineares, ou seja, processam a

    imagem original com uma mascara convolucional a fim de eliminar o ruido existente. Por outro

    lado, os filtros de mediana (median) e Wiener so filtros no-lineares, ou seja, o resultado no

    obtido atravs da aplicao de uma funo global linear na imagem original mas sim atravs

    de funes locais. No caso do filtro Wiener, com a sua utilizao pretende-se que o resultado

    apresente uma diferena minima relativamente imagem original.

    2.3.2 Segmentao

    No processamento de uma dada imagem, vulgarmente necessrio segmentar certas regies

    nela contidas. Para se atingir este fim existem mtodos de segmentao que se baseam em pro-

    priedades dos pixeis presentes na imagem. Por um lado existem mtodos de segmentao que

    se baseiam em propriedades de semelhana como o tresholding (segmentao baseada em his-

    tograma), clustering (segmentao baseada em agrupamento) e ainda segmentao baseada em

    regies. Por outro lado a segmentao pode ser baseada em propriedades como a diferena ou

    descontinuidade dando origem a mtodos de segmentao baseada em contornos e segmentao

    de pontos, linhas, orlas e cantos[3].

    O mtodo de binarizao tresholding o mais simples de se implementar. Consiste na seleo

    de um valor de limiar a partir do histograma da imagem, ou seja, a partir da representao da dis-

    tribuio de intensidade que medida em cada ponto da imagem, sendo que, no eixo das abcissas

    encontra-se a escala das intensidades possveis (de 0 a 255) e no eixo das ordenadas a quantidade

    de pxeis. Ao selecionar-se um determinado valor de intensidade para o limiar, o resultado de

    uma imagem binarizada apresenta apenas duas classes ou intensidade possveis: 0 ou 255 que

    corresponde, respetivamente, classe cor preta ou classe cor branca. Para esta converso usada

    apenas uma condio: se determinado pxel tem o valor de intensidade igual ou abaixo do valor

    de limiar definido, este pxel passa a ser preto. Caso contrrio, o pxel passa a ser branco. Este

    mtodo de segmentao o mais adequado quando o histograma bimodal. Para que a escolha do

    limiar permita um resultado com classes bem segmentadas, ou seja, foi obtida a melhor separao

    possvel entre as classes, existe o mtodo Otsu em que o valor do limiar escolhido de forma a

    maximizar a varincia inter-classe[32].

    Um histograma bimodal um histograma com duas modas, ou seja, na representao grfica

    possvel identificar dois picos distanciados. Na figura 2.5 encontra-se um exemplo deste tipo

    de histogramas.

    Para histogramas que no sejam bimodais existem algumas dificuldades na aplicao do treshol-

    ding devido ao acrscimo de dificuldade da escolha do limiar timo. Contudo, esta pode ser ul-

    trapassada se for previamente definido um mtodo para o clculo do limiar que funcione para o

    que se pretendia como por exemplo: selecionar apenas determinados pxeis da imagem para a

    determinao do limiar.

  • 18 Estado da arte

    Figura 2.5: Exemplo de um histograma bimodal [3]

    2.4 Regies de interesse para a deteo do p diabtico

    Relativamente problemtica do p diabtico, tal como foi esclarecido em 1.1, a existncia de

    pontos de calor elevado (hotspots) no p podem indicar reas de inflamao antes do aparecimento

    de sinais visuais. Neste sentido, necessrio um estudo sobre quais as regies de interesse (Re-

    gions Of Interest - ROI) existentes na vista plantar do p necessrias para a deteo dos hotspots.

    De seguida encontra-se uma pequena reviso sobre as ROIs definidas em algumas publicaes

    relativas ao tema.

    Figura 2.6: Regies de Interesse utilizadas[4]

    O artigo de Audrey[4] relativo a um novo sistema de cmara trmica ajustado, desenvolvido

    para os ps em risco trmico, descreve o padro trmico e simtrico da distribuio de temperaturas

    obtidas em 103 pares de ps termicamente saudveis. Em anlise so apresentadas quais as ROI

    que foram utilizadas e, como justificao, so descritas so as investigaes que motivaram o uso

    destas regies. A figura 2.6 foi retirada do artigo em questo e pretende mostrar a localizao das

    33 regies de interesse de cada p que foram utilizadas.

    No j referido livro de termografia publicado em 2016[2], apresentada uma caracterizao de

  • 2.4 Regies de interesse para a deteo do p diabtico 19

    lcera do p diabtico com imagem trmica. No procedimento de captura, indicada a necessidade

    da recolha de imagens trmicas ser realizada numa sala com a temperatura controlada, e os ps

    estarem despidos e livres de qualquer ornamento metlico ou outro objecto que possa interferir

    com a captura. Como regies de interesse foram escolhidas as reas onde existe maior incidncia

    de lceras diabticas, estas regies so apresentadas na figura 2.7.

    Figura 2.7: Regies de Interesse utilizadas para a caracterizao [2]

    Figura 2.8: Distribuio dos tipos de lceras pelas regies de interesse [2]

    Como justificao das ROIs indicadas, apresentado um grfico de distribuio dos tipos de

    lceras diabticas pelas regies de interesse. Esta distribuio foi obtida atendendo aos valores de

    simetria trmica existente entre as vrias imagens capturadas, dos vrios tipos de lceras, utilizadas

    para a caracterizao descrita. O grfico da distribuio encontra-se na figura 2.8.

  • 20 Estado da arte

    2.5 Sistemas de gesto de base de dados

    Com o intuito de averiguar quais os sistemas de gesto de base de dados existentes e qual o

    melhor se adapta ao pretendido nesta dissertao foram consultados alguns rankings atualizados

    sobre DBMS (DataBase Management Systems). Na informao pesquisada[33] possvel encon-

    trar rankings de acordo com a popularidade de vrios DBMS e tambm apresentado o mtodo

    utilizado para o clculo da pontuao utilizado para o ranking efetuado. A tabela 2.1 mostra os

    cinco primeiros lugares do ranking consultado.

    Tabela 2.1: Ranking adaptado da atualizao de Junho de 2017[8]

    Posio DBMS Pontuao1 Oracle 1351.762 MySQL 1345.313 Microsoft SQL Server 1198.974 PostgreSQL 368.545 MongoDB 335.54

    De seguida, na tabela 2.2 so apresentadas especificaes mais tcnicas de cada DBMS da

    tabela anterior.

    Tabela 2.2: Detalhes de cada DBMS

    Oracle MySQL Microsoft

    SQL Server

    PostgreSQL MongoDB

    Modelo da

    base de dados

    orientada a

    objectos

    orientada

    a objectos

    orientada a

    objectos

    orientada a objectos orientada a

    documentos

    Desenvolvedor Oracle Oracle Microsoft PostgreSQL Global

    Development Group

    MongoDB,

    Inc

    Licena commercial open

    source

    commercial open source open source

    SQL Sim Sim Sim Sim No

    2.6 Sumrio

    Todos os conceitos relativos energia trmica referidos so necessrios para assegurar e va-

    lidar a correta leitura da temperatura atravs de uma cmara trmica. Contudo, para assegurar a

    correta leitura do valor de temperatura a partir de uma cmara trmica, necessrio ter em conta

    quais os dados possveis de extrair dos ficheiros de formatos proprietrios e de que forma se calcula

    a temperatura com a informao disponvel.

    As diversas aplicaes realizadas at atualidade da termografia em prticas clnicas assegu-

    ram a sua utilidade e provam que a termografia poder ser utilizada como um meio complementar

    para o diagnstico sem substituir ou interferir com nenhuma outra tcnica utilizada. Por outro lado

  • 2.6 Sumrio 21

    importante tambm concluir que para a termografia seja bem analisada necessrio garantir con-

    dies ideais para que a captura seja bem sucedida e mtodos de segmentao que no eliminem

    partes da imagem essenciais para a anlise pretendida.

    Em detalhe, para a problemtica envolvente na patologia do p diabtico, foi necessria uma

    reviso sobre as ROIs definidas noutras publicaes. Desta forma fica fundamentado a escolha das

    ROIs que sero utilizadas no sistema desta dissertao, uma vez que, so estas as ROIs onde h

    maior propenso de ocorrerem lceras do p diabtico.

    A fim de implementar uma base de dados til e que preencha os requisitos determinados para

    esta dissertao foi necessrio uma pesquisa sobre os DBMS existentes no mercado e quais as suas

    especificaes.

    Sendo estas concluses genricas importantes para o tema desta dissertao, falta ainda uma

    reviso e explicao sobre a utilizao de classificadores. Desta forma, o captulo que se segue

    preenche esta lacuna.

  • 22 Estado da arte

  • Captulo 3

    Reviso do uso de classificadores emtermografia

    Em simultneo com o desenvolvimento desta dissertao foi elaborado um captulo inserido

    no livro Classification in BioApps: Automation of Decision Making. Esse captulo, intitulado

    Classification and decision making with medical infrared thermal imaging, foi aceite para pu-

    blicao pela editora Springer.

    O presente captulo desta dissertao pretende apresentar de forma sumarizada a reviso efetu-

    ada para o captulo da publicao que tambm importante para o desenvolvimento deste projeto,

    mais concretamente, encontram-se revistos os mtodos: Redes Neuronais, Redes Baysianas, Sup-

    port Vector Machine e o Algoritmo K-Nearest Neighbor.

    Para que seja possvel a realizao de uma anlise crtica necessria ainda uma reviso sobre

    a avaliao da classificao de dados. Esta anlise torna-se fundamental para o reconhecimento de

    problemas no p diabtico.

    Por ltimo, existe uma ferramenta de livre utilizao intitulada WEKA que permite a apli-

    cao de classificadores em conjuntos de dados e portanto uma ferramenta muito til e pode ser

    utilizada para avaliar a qualidade da aplicao de vrios tipos de classificadores nesses conjuntos

    de dados.

    3.1 Mtodo para a avaliao de um classificador

    Primeiramente, antes de perceber o modo de funcionamento de diversos classificadores,

    necessrio perceber quais so os resultados possveis de uma classificao.

    O resultado da aplicao dos diversos classificadores no problema do p diabtico pode ser

    considerado como uma resposta binria em que existem quatro casos possveis: verdadeiro posi-

    tivo (VP), verdadeiro negativo (VN), falso positivo (FP) e falso negativo (FN). Estes quatro casos

    podem ser divididos como resultados corretos ou incorretos. Nos primeiros dois casos, o resultado

    obtido foi o correto, sendo que no caso VP foi detectado corretamente o problema num p diab-

    tico enquanto que no caso VN no foi detectado o problema num p saudvel. Por outro lado, os

    23

  • 24 Reviso do uso de classificadores em termografia

    outros dois resultados so incorretos j que no caso FP foi detetado o problema num p saudvel

    e no ltimo caso, FN, no foi possvel detectar o problema num p infetado.

    Para alm desta nomenclatura, interessa ainda definir alguns mtodos necessrios para avaliar

    a qualidade nos resultados de um classificao.

    3.1.1 Mtricas para a performance

    No sentido de avaliar a performance de um classificador, existem quatro mtricas importantes:

    exatido, preciso, sensibilidade e especificidade. Para cada uma destas componentes existe uma

    frmula de clculo em que o valor percentual para cada componente depende da quantidade obtida

    de cada tipo de resposta da classificao. As expresses a seguir apresentadas mostram a frmula

    de calcular cada uma das componentes.

    Exatido =VP+VN

    VP+VN+FP+FN(3.1)

    Preciso (de valores positivos) =VP

    VP+FP(3.2)

    Preciso (de valores negativos) =VN

    VN+FN(3.3)

    Sensibilidade =VP

    VP+FN(3.4)

    Especificidade =VN

    VP+FN(3.5)

    3.1.2 Receiver operating characteristic(ROC)

    O conceito de curva de caracterstica de operao do receptor (curva ROC) uma representa-

    o grfica no qual possvel analisar o desempenho do classificador. Neste grfico representado

    no eixo das ordenadas a taxa de verdadeiros positivos (sensibilidade) e no eixo das abcissas a taxa

    de falsos positivos (100-especificidade). Deste modo, cada ponto da curva ROC apresenta os va-

    lores do par sensibilidade/especificidade correspondentes ao limiar de classificao desse ponto.

    A rea por baixo da curva ROC (AUC - Area Under the ROC Curve) serve como medida do quo

    bem um parmetro distinguido entre dois grupos de classificao.

    Na figura 3.1 est indicado, pela linha a vermelho, um exemplo de uma curva ROC.

    3.2 Redes Neuronais

    3.2.1 Definio

    De um modo genrico, o conceito de redes neuronais artificiais (Artificial Neural Networks -

    ANNs) pertence famlia de modelos computacionais aplicados em inteligncia artificial. Na pr-

  • 3.2 Redes Neuronais 25

    Figura 3.1: Exemplo de uma curva ROC

    tica, traduz-se num sistema composto por neurnios interligados capazes de trocar mensagens

    entre eles[34]. Este sistema pode ser composto por uma nica camada de conexes ou por mlti-

    plas camadas permitindo a existncia de um maior nmero de entradas para o sistema. Sendo que,

    a classificao por ANN um mtodo recorrente quando se pretende aplicar um classificador em

    termografia mdica, na maioria das aplicaes revistas so utilizadas pelo menos 3 camadas: en-

    trada (input layer), sada (output layer) e transparente (hiden layer). Na figura 3.2 est apresentada

    um exemplo de uma rede com 3 camadas.

    Figura 3.2: Arquitetura de uma rede ANN criada[5]

    Por outro lado, uma rede neuronal pode ser interpretada como um modelo estatstico bastante

    parametrizado[35]. Esta caracterstica torna este modelo muito flexvel, ou seja, a existncia de

    pequenas irregularidades nos parmetros das funes no causa uma impossibilidade na reprodu-

  • 26 Reviso do uso de classificadores em termografia

    o do modelo. Deste modo, todos os parmetros apresentados so modelados, contudo, este facto

    apresenta um perigo: o overfitting. Este problema ocorre quando o modelo estatstico calculado

    est demasiado ajustado sua amostra, ou seja, ao conjunto de dados que o originou.

    Na figura 3.3 so apresentados dois modelos de previso: um modelo demasiado ajustado

    representado pela linha azul e outro mais regular a vermelho. O problema do modelo azul que,

    ao serem alterados os dados da amostra o nmero de irregularidades que podem ocorrer ser maior

    do que quando aplicado o modelo mais regular. Por isso, o modelo representado a preto acaba por

    ser mais adaptativo realidade do que o modelo por overfitting. Para colmatar este problema foram

    adotadas estratgias que permitiram desenvolver classes de modelos de previso mais funcionais.

    Figura 3.3: Sistema de Previso

    O elemento bsico para a construo de uma rede neuronal artificial trata-se de um elemento

    de processamento. A existncia de algoritmos de construo com diferentes combinaes nos

    elementos de processamento leva a uma grande diversidade de capacidades computacionais para

    as redes neuronais.

    O desenvolvimento de uma rede neuronal pode ser subdividido em duas etapas: construo e

    ativao. Como forma de medida, para a fora na ligao existente entre camadas, definido um

    peso durante a fase de construo. Esta fase remete para o perodo de aprendizagem em que dado

    rede os dados iniciais e as solues respetivas para que consiga construir um modelo de anlise

    para novas representaes. Os resultados desta etapa so solues numricas para o problema

    proposto. Existem trs tipos de aprendizagem: supervisionada, no supervisionada e hbrida. Na

    fase de ativao, a aprendizagem automtica est concluda e a rede est preparada para receber

    novos dados, analis-los e apresentar os seus resultados.

    Como exemplo de um algoritmo de construo aplicados nas redes neuronais existe o algo-

    ritmo backpropagation (BP) tambm designado como (generalized delta rule), que um iterative

    gradient algoritm com o objetivo de minimizar o erro mean square que existe entre o resultado

    atual obtido e o expetvel. Com o uso deste algoritmo, o peso associado em cada camada trans-

    parente pode ser ajustado, sendo deste modo possvel a aprendizagem da rede. Este gnero de

  • 3.2 Redes Neuronais 27

    sistema fcil de ser construdo e bastante usado em reconhecimento de padres e em problemas

    de classificao de imagens, tal como se encontra explicado na prxima seco.

    Uma ANN construda a partir de um algoritmo BP significa que a aprendizagem automtica

    supervisionada foi realizada a partir de feedforward entre multi-camadass. Aprendizagem por fe-

    edforward significa que os elementos de processamento so propagados pela rede desde a camada

    de sada at camada de entrada sem haver interconexo entre os elementos de processamento na

    mesma camada. As sadas so criadas do seguinte modo: dado a cada elemento de processa-

    mento um peso ajustado sua carga, a soma dos pesos de todos os elementos calculada sendo

    este valor total transformado no resultado da sada por uma funo de ativao.

    O padro de ativao que resulta nas unidades de sada, depois da aplicao da funo de

    ativao numa rede de feedforward, codifica a resposta da rede para as unidades de entrada da

    mesma. Inicialmente, define-se o peso para pequenos valores aleatrios e aplicado na rede de

    forma sequencial um conjunto de entradas de construo (training inputs). No procedimento de

    aprendizagem por backpropagation aps a propagao na rede de cada dado de entrada os pesos

    so ajustados de forma a que haja uma reduo na diferena existente entre os valores obtidos

    na sada e os valores de sada que seriam os corretos. Cada iterao denominada de ciclo de

    construo (training cycle), um processo completo de ciclos de construo chamado de poca

    de construo (training epoch) e todo este procedimento do tipo de aprendizagem automtica

    supervisionada. Uma rede ANN com o algoritmo BP (BP-ANN) utiliza aprendizagem automtica

    supervisionada, ou seja, o erro nos resultados de sada determinada e utilizado como um sinal de

    construo/treino (trainning signal) na medida em que utilizado para o ajuste dos pesos na rede.

    Contudo, na aprendizagem automtica no supervisionada no h um ajuste de peso e tem de

    ser a rede a ajustar convenientemente esse valor ao usar (environmental feedback) menos detalhado

    durante a performance.

    RBFN (Radial Basis Functions Network) uma tcnica utilizada para determinar o training

    signal utilizado para ajustar o peso definido para os neurnios numa rede neuronal. Embora o

    resultado de RBFN ser linear, as entradas so no-lineares o que causa uma maior capacidade

    de modelao mais complexa de mapas, aprendizagem, classificao e capacidade de deciso

    comparativamente com uma BP-ANN. Este rede composta por 3 camadas e requer aprendizagem

    automtica supervisionada.

    3.2.2 Utilizao na termografia

    Um artigo de E.Y.-k. Ng. [36] apresenta o uso de redes neuronais na identificao de cancro

    da mama sendo este o primeiro caso do uso de classificadores na termografia mdica (Medical

    Infrared Thermal Imaging - MITI). Mais concretamente, este artigo examina a utilizao de ANN

    para complementar a radiao de calor infravermelho da superfcie do corpo com outros dados

    fisiolgicos. Neste caso, dados fisiolgicos e os termogramas de alguns pacientes foram utilizados

    como elementos bsicos para o processamento de algoritmos de BP numa rede neuronal de quatro

    andares. Os resultados mostram que a ANN criada consegue memorizar e generalizar a relao

  • 28 Reviso do uso de classificadores em termografia

    existente entre os dados de entrada e os dados de sada do sistema, sendo que os melhores resul-

    tados foram obtidos no caso em que os dados de entradas continham mais informaes (dados

    fisiolgicos e dos termogramas) sobre os pacientes. A vantagem obtida foi o reconhecimento de

    padres alcanado com a ANN. Uma desvantagem foi o uso de valores numricos para os dados

    de entrada porque gerou resultados pouco precisos durante a aprendizagem automtica da rede.

    Outra desvantagem foi o tempo necessrio para a aprendizagem automtica da rede estar con-

    cluda contudo, ultrapassada esta fase, apenas foi necessrio um ciclo para detectar uma condio

    especifica ou identificar um estado. No total, o nmero de pessoas que participaram no estudo

    foi de 207 sendo 76 saudveis, 98 pacientes benignos e 33 pacientes malignos. No melhor, foi

    obtida a percentagem de 68,97% para a sensibilidade, 80% para a especificidade e 61.94% para a

    exatido.

    Dois anos mais tarde surgiu outra publicao [5] com os mesmos objetivos. Contudo, neste

    caso, foram usadas e comparadas as tcnicas nonparametric discriminant analysis (NDA), linear

    discriminant analysis (LDA) e principal component analysis (PCA) com o intuito de reduzir as

    variveis utilizadas. Para as variveis bsicas foram implementadas informaes dos histogramas

    das ROI definidas, caractersticas baseadas na matriz de co-ocorrncia, no gradiente e na matriz

    run-length. Todos estes dados foram provenientes de 30 pessoas saudveis e 30 doentes. Vrios

    testes foram efetuados e portanto os resultados variam. No caso em que foram aplicadas apenas

    informaes dos histogramas no foram obtidos resultados conclusivos devido necessidade im-

    plcita da ANN em que a reduo de dados causa reduo da distncia multidimensional entre os

    resultados da sada. Isto significa que a probabilidade de ocorrer erros na normalizao mais alta

    e consequentemente a classificao poder ser incorreta.

    Em 2008, o j referido autor pioneiro na introduo de ANN em MITI, fez nova publicao

    [37] na tentativa de provar a fiabilidade da utilizao de ANN no diagnstico precoce do cancro

    da mama. Neste caso, foram utilizados alguns mtodos bio estatsticos como o modelo mlti-

    plo de regresso linear, radial basis function network (RBFN) e receiver operating characteristic

    (ROC). O primeiro permite a correlao entre as variveis e o estado atual do paciente o que por

    sua vez permite a correta seleo das caractersticas a serem usadas durante a fase de aprendiza-

    gem (training epoch) que, comparativamente com a funo BP, apresenta uma poca mais rpida.

    RBFN foi usado como funo de activao para determinar o resultado da classificao e, compa-

    rativamente com a funo BP. Os resultados apresentam valores de 80.95%, 100% e 70.6% para,

    respectivamente, a exatido, sensibilidade e especificidade. Estes resultados tm percentagens

    mais elevadas do que o intervalo de exatido (de 60% a 70%) que foi obtido pela examinao

    efetuada por radiologistas experientes.

    No mesmo ano, o autor Papez realizou um artigo [38] com o objetivo de apresentar uma

    melhoria no diagnstico de sndrome do tnel crpico (Carpal tunnel syndrome - CTS) com a

    utilizao de redes neuronais artificiais para analisar as imagens termogrficas. No total, foram

    recolhidos 112 termogramas que foram divididos em vrios conjuntos para serem utilizados em

    diferentes combinaes para a fase de construo e fase de testes. Mais concretamente, os dados de

    entrada utilizados na construo da rede foram constitudos por caractersticas numricas (valores

  • 3.2 Redes Neuronais 29

    de mdia da temperatura) e pela classe correspondente. Os resultados da classificao apresentam

    uma taxa de sucesso de aproximadamente 80% sendo ainda indicada a possibilidade de o valor da

    taxa ser superior se a quantidade de imagens utilizadas fosse maior para ampliar as possibilidades

    de deteo da patologia.

    Por este motivo, no ano a seguir, a mesma equipa publicou outro artigo[39], com o mesmo

    problema e a mesma proposta mas, desta vez, foram recolhidas 502 imagens. Contudo os resulta-

    dos obtidos neste caso com a classificao no apresentaram a melhoria esperada. Por outro lado,

    foram identificados segmentos de imagens desnecessrios uma vez que, nos testes em que estes

    eram descartados, a taxa de sucesso da classificao subia consideravelmente. Desta forma, os

    autores concluram que a MITI no pode ser considerada uma ferramenta de deteo adequada

    quando exigido um nvel de diagnstico severo.

    Anos mais tarde, em 2015, no artigo de Koprowski [40], proposto um mtodo de anlise de

    imagem para a avaliao da distribuio de temperatura ao longo das costas dos pacientes em que

    foram recolhidas as imagens. O objetivo principal seria o de detetar anomalias que causam uma

    postura defeituosa. Para a classificao dos parmetros recolhidos foram usados alguns classifi-

    cadores, entre os quais ANN. Os resultados obtidos mostram que para ANN com a utilizao de

    BP, 16 neurnios na camada invisvel e aprendizagem por cross validation obteve-se uma sensibi-

    lidade e especificidade respetivamente de 75% e 89%. Contudo este no foi o classificador com

    mais sucesso na avaliao. O classificador com o valor percentual de sucesso mais elevado nos

    mesmos parmetros foi o SVM com 88% e 90% respetivamente.

    No mesmo ano, um outro estudo[41] relaciona a utilizao de uma rede ANN em imagens

    trmicas com o intuito de identificar pessoas em estado de embriaguez. Para se alcanar o objetivo

    proposto fora adotadas duas abordagens. Na primeira, recorrendo a ANN, foram examinadas as

    temperaturas por localizao em cada uma das diferentes imagens provenientes da mesma face

    para todas as faces recolhidas, com isto, verificou-se que era nas imagens frontais da face onde se

    verificava maior alterao no comportamento trmico com o consumo de lcool. Na segunda abor-

    dagem adotada, uma rede neuronal de estrutura singular foi construda com as variveis bsicas

    de construo provenientes de todas as localizaes da face, verificando-se uma performance al-

    tamente discriminativa quando se aplicou a dados desconhecidos. Contudo, redes neuronais mais

    pequenas apresentaram uma melhor performance generalizada (86% de exatido).

    Por fim, o autor Saniei apresentou no seu artigo de 2016[42], uma nova abordagem para prever

    uma estimativa do tamanho, profundidade e da taxa de gerao de calor metablico num tumor.

    Essa nova abordagem composta por duas etapas: progressiva e inversa. Para a primeira etapa

    foi necessrio criar um modelo de elemento finito e resolver a equao The Pennes bio-heat para

    calcular a distribuio da temperatura na superfcie e em profundidade. Os valores calculados

    obtidos foram aplicados para a construo de uma rede neuronal dinmica (DNN) e, a fim de asse-

    gurar a correta construo da rede, os resultados desta aplicao confirmam os valores do modelo

    de elemento finito. Na segunda etapa, a rede construda foi utilizada para estimar a distribuio

    da temperatura em profundidade a partir do perfil de temperatura superfcie. De forma a evitar

    que a rede criada fosse demasiado ajustada e a fim de se obter um sistema com um nvel de per-

  • 30 Reviso do uso de classificadores em termografia

    formance aceitvel, os autores consideraram como crucial a escolha do nmero de neurnios na

    camada invisvel e das pocas necessrias, sendo que estes valores no eram dependentes entre

    eles mas determinados de forma iterativa. Tendo em conta a relao existente entre as variveis

    utilizadas, foram encontrados os valores de 0.84 e 0.71 para o tamanho e profundidade com o erro

    absoluto de 0.31cm e 0.2cm respetivamente. Em nota final indicada a necessidade de recolha de

    mais imagens para melhorias no sistema.

    3.3 Redes Bayesianas

    Uma rede Bayesiana (BN - Bayesian Network) um modelo de representao causal e proba-

    bilstico e pode ser entendido como um grafo orientado e acclico. Na figura 3.4 est representado

    um exemplo de um grafo com as especificaes referidas pelas redes Bayesianas, ou seja, os vr-

    tices e as arestas representam, respetivamente, as variveis e as relaes de dependncia causal.

    Deste modo, fica assegurado o mapeamento entre causa e efeito atravs de dependncias proba-

    bilsticas. Desta forma, os sistemas baseados em redes Bayesianas tm a capacidade de gerar

    previses automticas no caso de existir falta de informao nos dados existentes e, portanto, no

    preciso um nmero elevado de elementos de construo.

    Figura 3.4: Exemplo de um grafo orientado e acclico

    O algoritmo de Naive Bayes (NB) que tem por base o clculo probabilstico do teorema de

    Bayes com suposies de independncia entre as caractersticas. A frmula expressa pelo teorema

    descrito apresentada na equao 3.6 que significa que a probabilidade da ocorrncia do evento A

    sabendo que aconteceu o evento B corresponde diviso entre a probabilidade da interseco dos

    eventos A e B com a probabilidade do evento B.

    P(A|B) = P(A

    B)P(B)

    (3.6)

  • 3.4 Support Vector Machine 31

    Por outras palavras, o classificador de NB afirma que a presena de uma caracterstica parti-

    cular numa classe no est diretamente relacionada com a presena de outra qualquer caraterstica

    [43]. Uma vantagem deste classificador o facto de necessitar de poucos elementos de construo

    para que seja possvel calcular os parmetros necessrios para a classificao.

    Na prtica existem 3 casos conhecidos de aplicaes do NB em termografia para a classificao

    em cancro da mama. Apesar de a exatido obtida ser mais baixa comparativamente com outros

    classificadores, foi obtido um valor percentual de 71.86% num estudo de 2013[44]. Em outras

    duas publicaes [45] e [43] est indicado que os valores de exatido obtidos com a aplicao de

    NB foram cerca de 3% e 11%, respetivamente, a menos do que foi obtido no caso da aplicao de

    SVM.

    3.4 Support Vector Machine

    3.4.1 Definio

    O conceito de mquina de vectores de suporte (Support Vector Machine - SVM) aplicado a

    um conjunto de mtodos de classificao que analisam dados e reconhecem padres. Este proce-

    dimento de aprendizagem automtica construtiva baseado no princpio de minimizao do risco

    estrutural, ou seja, pretende minimizar os limites de erro criados pela mquina de aprendizagem

    automtica durante a fase de construo.

    De uma forma geral, um classificador SVM produz resultados lineares binrios, ou seja, ana-

    lisa um conjunto de dados iniciais e atribui-os a uma de duas categorias possveis. Normalmente,

    este algoritmo funciona bem quando aplicado a novos dados. Isto acontece porque os dados que

    foram aplicados durante a fase de construo so, de um modo geral, os mais difceis de classi-

    ficar, ou seja, implica que os mtodos que optem por utilizar esta tcnica tenham capacidade de

    superar os mtodos concorrentes em muitas aplicaes.

    Como modelo de representao, o SVM utiliza um mapeamento de pontos no espao, sendo

    que, existe no espao de representao um hiperplano que separa as duas classes. Deste modo

    os pontos so distribudos no espao de acordo com a classe pertencente. Na figura 3.5 pode-se

    visualizar um exemplo.

    Neste exemplo, pode-se visualizar a classificao dos dados, a definio do hiperplano e da

    margem de separao. Os dados iniciais foram divididos em duas classes, sendo que os dados

    foram representados por quadrados e crculos sendo que cada uma destas representaes remete

    para uma classe distinta. O hiperplano criado encontra-se otimizado de modo a que a margem de

    separao resultante seja maximizada.

    Neste sentido, um algoritmo de SVM tem como objetivo definir o hiperplano do modelo de

    representao e pretende maximizar a distncia existente entre os pontos de classes diferentes.

    Para a converso dos dados iniciais input data em pontos no espao normalmente utilizado

    funes do tipo nonlinear kernel. Deste modo, os dados convertidos so apresentados de forma

    mais distante do que se fossem utilizados dados no convertidos.

  • 32 Reviso do uso de classificadores em termografia

    Figura 3.5: Exemplo da representao de um SVM.

    3.4.2 Utilizao na termografia

    Em 2012, na publicao de Archarya e restantes autores[46], o objetivo foi o de avaliar a

    viabilidade do uso da classificao em termografia no diagnstico do cancro da mama. Atravs de

    matrizes run length e co-occurence foram obtidas caractersticas da textura. Aps o processo de

    normalizao pretendia-se realizar a classificao com aplicao do SVM que foi escolhido com a

    justificao de que tinham sido obtida boa performance em estudos anteriores de reconhecimento

    de padres. Na implementao foi adotado o mtodo (Tree-fold stratified cross validation method),

    e por isso, os dados foram divididos em 3 conjuntos. Para a fase de aprendizagem do SVM criado,

    foram criados e utilizados combinaes de dois dos conjuntos de elementos existentes. O conjunto

    restante de cada combinao foi utilizado para teste. Como resultados, nesta publicao foram

    apresentados uma ex