processamento de imagens térmicas para a avaliação do ... · processamento de imagens térmicas...
TRANSCRIPT
-
FACULDADE DE ENGENHARIA DA UNIVERSIDADE DO PORTO
Processamento de imagens trmicaspara a avaliao do risco de p diabtico
- Backoffice
Lcia Vaz
Mestrado Integrado em Engenharia Eletrotcnica e de Computadores
Orientador: Prof. Dr. Ricardo Vardasca
Coorientador: Prof. Dr. Joaquim Mendes
20 de Julho de 2017
-
c Lcia Vaz, 2017
-
Resumo
Atualmente, em Portugal, estima-se que mais de um milho de indivduos padeam da do-ena metablica Diabetes Mellitus (DM). Deste conjunto de indivduos, cerca de um quarto podedesenvolver uma complicao dada pelo nome de p diabtico (Diabetic Foot Ulcer - DFU) quese manifesta com o aparecimento de uma ou mais lceras na regio do p. Dependendo da suanatureza (neuroptica, neuroisqumica ou isqumica), estas lceras surgem em zonas onde ocorreuma presso, por o indivduo se movimentar ou pelo uso de calado desadequado. Numa faseinicial, um dos primeiros sinais desta patologia o aumento da temperatura e, sendo a termografiauma tcnica que permite obter imagens com os valores de temperaturas existentes na superfciedos objetos capturados, possvel detetar o desenvolvimento desta patologia atravs de imagenstrmicas infravermelhas do p. Anteriormente, em projetos da FEUP, foram recolhidas imagensde pacientes, indivduos em grande risco e em pessoas saudveis, que comprovaram a utilidade datcnica de termografia.
A finalidade da presente dissertao criar uma ferramenta mais avanada de anlise e clas-sificao de dados, de forma a reduzir o erro humano e sistematizar o uso desta tcnica. Nestesentido, pretendeu-se adaptar tcnicas utilizadas em anlise inteligente de dados (Data-Mining),mais especificamente mtodos de classificao de dados provenientes da rea de aprendizagemautomtica (Machine Learning). Com o sucesso desta adaptao, possvel identificar, atravs daclassificao, a existncia de lceras nas imagens trmicas do p.
A ferramenta informtica desenvolvida nesta dissertao constituda pela criao de doisprogramas na linguagem C# e pelo armazenamento, numa base de dados (BD), de anlises einformaes extradas dos ficheiros de imagens trmicas recolhidos em projetos anteriores reali-zados na FEUP. O sistema desenvolvido pode ser dividido em cinco partes principais, sendo elasa localizao e extrao de metadados em ficheiros binrios, processamento de imagens, identifi-cao das regies de interesse (ROI), estruturao e povoamento da base de dados, e por ltimo,desenvolvimento de ferramentas que permitam a classificao. Para que no final fosse realizadauma anlise quanto qualidade dos resultados obtidos nos testes de classificao, foi realizada,em paralelo e com os mesmos dados, classificao com o software Weka.
Ao longo do desenvolvimento da dissertao, foram abordados vrios mtodos a fim de seremobtidos os melhores resultados. Foram encontrados alguns obstculos que desencadearam abor-dagens alternativas e a implementao de mais mtodos. Os resultados obtidos so satisfatriose cumprem com a finalidade proposta. O melhor resultado obtido com o programa desenvolvidopara a classificao apresenta um valor percentual de exatido arredondado para 93% e foi obtidoutilizando o programa desenvolvido e o classificador KNN (K-Nearest Neighbor).
O resultado final disponibiliza aplicaes informticas que no futuro podero ser aprofundadaspara apoiar no rastreio e seguimento de pacientes em risco de desenvolver p diabtico.
Palavras chave: Classificao; P diabtico; Termografia; lceras.
i
-
ii
-
Abstract
Currently in Portugal, an estimated one million people are affected by Diabetes Mellitus (DM),a metabolic disorder commonly referred to as diabetes. Of this group of people, nearly 25% ofthem can develop serious skin issues such as diabetic foot ulcers (DFU) in their lifetime. Thiscomplication expresses itself by the appearance of one or multiple ulcers in the foot area. De-pending on its nature (Neuropathic, Neuro-ischemic or Ischemic), these ulcers appear on highpressure zones of the foot, either because of the patients movement or inadequate footwear. Inan initial phase, one of the first symptoms of this pathology is the increase of skin temperature.Thermography is a technique that allows the acquisition of images with the temperature values ofthe surface of the framed objects, which allows the early detection of DFUs trough the analysisof thermal infrared images of the foot. In earlier projects developed at FEUP, a set of images wasgathered from patients, high risk individuals and healthy people which demonstrated the useful-ness of thermography.
The purpose of this dissertation is to design an advanced tool of analysis and data classificationas a way to reduce human error and standardize the use of this technique. With this aim, it wasintended to adapt intelligent data mining procedures, specifically, data classification methods ori-ginally used in the machine learning field of study. With a successful adaptation of these methods,it is possible to identify the existence of early signs of diabetic foot ulcers in thermal images.
The computational tool developed in this dissertation is assembled by two programs develo-ped using the C# language and by the storage, in a relational database, of all analysis made andinformation extracted from the thermal images. The developed system can be subdivided into fivemain parts, which are the localization and extraction of metadata from the binary files, the imageprocessing, the identification of the regions of interest (ROI), the database structure definition anddata entry, and the development of the classification tool. In order to evaluate the quality of theresults obtained in the classification tests, another set of tests was carried out in parallel, with thesame data and using the Weka software.
Throughout the development of the various parts of this work, an additional research work wasperformed about which methods should be used in order to obtain the best possible results. Theappearance of several issues and obstacles led to alternative approaches and the development ofdifferent methods. The final results are satisfactory and achieve the proposed objectives. The bestresults achieved in a classification test, using the KNN classifier, presented an accuracy of 93%.
Therefore, the final result is a set of tools that, in the future, can be used to support the earlydetection and follow-up of patients in risk of developing diabetic foot ulcers.
Keywords: Classification; Diabetic foot; Thermography; Ulcers.
iii
-
iv
-
Agradecimentos
Para no fugir regra, deixo aqui alguns agradecimentos que no poderia deixar de fazer.
Em primeiro lugar, s pessoas que mais tiveram influncia no desenvolvimento desta disser-tao, quero agradecer ao Professor Ricardo Vardasca e ao Professor Joaquim Gabriel, por teremproposto um tema de dissertao to desafiante e por terem tido sempre sugestes ou alternativasa dar quando algum obstculos surgia.
Gostava de demonstrar o apreo, que me foi sugerido, pelo projeto NORTE-01-0145-FEDER-000022 - SciTech - Science and Technology for Competitive and Sustainable Industries, co-financiado pelo Programa Operacional Regional do Norte (NORTE2020), financiado pelo FundoEuropeu de Desenvolvimento Regional (FEDER) e pela FCT Fundao para a Cincia e Tecno-logia sobre o projeto (PEst-OE/EME/LA0022/2013).
s pessoas do L003 quero agradecer pelo ambiente de trabalho proporcionado. Um obrigadoem especial Joana Tavares, Rita Almeida e a Joana Moreira pelos momentos passados.
s outras pessoas que de uma forma no direta contriburam para o sucesso desta dissertao,obrigada. Em especial, Ins Teixeira por me ter emprestado um pouco da sua infinita criatividade.Ao Joo Silva, por me fazer ver as coisas de um modo diferente. Daniela Carmo, ngela Torrese ao Srgio Pinto pela pacincia, pelas conversas, disponibilidade, coffee breaks, coisas e tais. Atodos, obrigada por estes anos.
Aos meus amigos de toda a vida e aos meus quase-mdicos de eleio, obrigada pela amizade,conselhos, orientaes mas tambm pelo bom humor e por todos os momentos partilhados. Mariana Martins um obrigado extra pelo tempo disponibilizado.
Ao Filipe Monteiro, no existem palavras suficientes para poder agradecer por tanto. Assimsendo, apenas posso dizer obrigada por tudo, por mais alguma coisa, por tudo o resto e pelo queainda no ficou includo.
minha famlia, um obrigado por tudo o que tm aturado nestes ltimos meses. IsabelVila e Leonor Vila um obrigada extra por conseguirem renovar-me a motivao e mostrarem-mecomo se pode fazer o bem com pouco. Susana Barroso, obrigada pela preocupao e disponibi-lidade mesmo em pocas mais complicadas da vida e a centenas de quilmetros de distncia.
H pessoas a quem agradecer no suficiente porque, mesmo sem o saberem e sem nunca oterem imaginado, contriburam demasiado para merecerem meros agradecimentos. Aos meus paisdedico esta dissertao.
A todos, Obrigada!
Lcia Vaz
v
-
vi
-
A picture can tell a thousand words,but a few words can change its story.
Sebastyne Young
vii
-
viii
-
Contedo
1 Introduo 11.1 Contexto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.2 Motivao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31.3 Finalidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31.4 Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41.5 Estrutura da dissertao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
2 Estado da arte 72.1 Fundamentos da termografia . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.1.1 Conceitos fundamentais de energia Trmica . . . . . . . . . . . . . . . . 72.1.2 Evoluo da termografia . . . . . . . . . . . . . . . . . . . . . . . . . . 112.1.3 Aquisio e recolha de termogramas . . . . . . . . . . . . . . . . . . . . 122.1.4 Termografia aplicada ao p diabtico . . . . . . . . . . . . . . . . . . . 13
2.2 Formatos de imagens trmicas . . . . . . . . . . . . . . . . . . . . . . . . . . . 152.2.1 Formatos dos Ficheiros . . . . . . . . . . . . . . . . . . . . . . . . . . . 152.2.2 Extenses de metadados . . . . . . . . . . . . . . . . . . . . . . . . . . 152.2.3 Aplicao ExifTool . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152.2.4 Frmula de clculo de temperatura em imagens trmicas . . . . . . . . . 16
2.3 Tcnicas de processamento de imagem . . . . . . . . . . . . . . . . . . . . . . . 162.3.1 Pr-processamento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162.3.2 Segmentao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.4 Regies de interesse para a deteo do p diabtico . . . . . . . . . . . . . . . . 182.5 Sistemas de gesto de base de dados . . . . . . . . . . . . . . . . . . . . . . . . 202.6 Sumrio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
3 Reviso do uso de classificadores em termografia 233.1 Mtodo para a avaliao de um classificador . . . . . . . . . . . . . . . . . . . 23
3.1.1 Mtricas para a performance . . . . . . . . . . . . . . . . . . . . . . . . 243.1.2 Receiver operating characteristic(ROC) . . . . . . . . . . . . . . . . . . 24
3.2 Redes Neuronais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 243.2.1 Definio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 243.2.2 Utilizao na termografia . . . . . . . . . . . . . . . . . . . . . . . . . . 27
3.3 Redes Bayesianas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 303.4 Support Vector Machine . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
3.4.1 Definio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 313.4.2 Utilizao na termografia . . . . . . . . . . . . . . . . . . . . . . . . . . 32
3.5 K-nearest neighbor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 333.6 WEKA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
ix
-
x CONTEDO
3.7 Sumrio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
4 Design e especificaes do sistema 374.1 Requisitos do sistema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 374.2 Arquitetura do sistema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 394.3 Sumrio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
5 Processamento de informao 435.1 Localizao dos metadados em ficheiros Binrios . . . . . . . . . . . . . . . . . 435.2 Processamento de imagens . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
5.2.1 Mtodo 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 445.2.2 Mtodo 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
5.3 Identificao de ROIs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 485.3.1 Determinao da localizao de cada ROI . . . . . . . . . . . . . . . . . 485.3.2 Determinao de valores de temperatura . . . . . . . . . . . . . . . . . . 49
5.4 Sumrio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
6 Gesto da base de dados e classificao 516.1 Estrutura da base de dados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 516.2 Classifiao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
6.2.1 Programa desenvolvido para a classificao . . . . . . . . . . . . . . . . 526.3 Sumrio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
7 Resultados 557.1 Localizao dos metadados e leitura binria dos ficheiros . . . . . . . . . . . . . 55
7.1.1 Ficheiros com o formato .img . . . . . . . . . . . . . . . . . . . . . . . 557.2 Processamento de imagem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
7.2.1 Mtodo de segmentao . . . . . . . . . . . . . . . . . . . . . . . . . . 597.3 Identificao de ROIs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 627.4 Base de dados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 637.5 Classificao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
7.5.1 Representao bi-dimensional dos dados . . . . . . . . . . . . . . . . . 647.5.2 Resultados da classificao . . . . . . . . . . . . . . . . . . . . . . . . . 65
7.6 Imagens dos programas desenvolvidos em C# . . . . . . . . . . . . . . . . . . . 667.6.1 Programa 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 667.6.2 Programa 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
7.7 Sumrio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
8 Discusso 698.1 Localizao dos metadados e leitura binria dos ficheiros . . . . . . . . . . . . . 69
8.1.1 Em ficheiros com o formato .img . . . . . . . . . . . . . . . . . . . . . 698.1.2 Em ficheiros com o formato .jpg . . . . . . . . . . . . . . . . . . . . . . 70
8.2 Processamento de imagem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 708.3 Identificao de ROIs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 718.4 Base de dados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 718.5 Classificao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 728.6 Sumrio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
9 Concluso 75
-
CONTEDO xi
Referncias 77
A Informaes metadata 83
B Resultados da ferramenta ExifTools 87B.1 Em ficheiros .img . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87B.2 Em ficheiros .jpg radiomtrico . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
C Scripts de cdigo SQL da criao das tabelas de base de dados 93
D Resultados dos dados calculados nas ROIs 97D.1 Em graus Celcius . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97D.2 Em graus radiomtricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
E Resultados da classificao obtidos com o programa desenvolvido 135E.1 Primeiro teste de KNN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135E.2 Segundo teste de KNN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138E.3 Terceiro teste de KNN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141
F Resultados da classificao obtidos com o programa Weka 145F.1 Primeiro teste de KNN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145
-
xii CONTEDO
-
Lista de Figuras
1.1 Exemplo de imagens trmicas para cada um dos tipos de lcera. Imagem retiradade [1] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
2.1 Espectro eletromagntico relacionado com a energia trmica . . . . . . . . . . . 82.2 Representao da distribuio de Planck para os vrios comprimentos de onda,
adaptado de [2] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92.3 Representao da lei de deslocamento de Wien . . . . . . . . . . . . . . . . . . 102.4 Espectro eletromagntico e sua utilizao, retirado de [2] . . . . . . . . . . . . . 122.5 Exemplo de um histograma bimodal [3] . . . . . . . . . . . . . . . . . . . . . . 182.6 Regies de Interesse utilizadas[4] . . . . . . . . . . . . . . . . . . . . . . . . . 182.7 Regies de Interesse utilizadas para a caracterizao [2] . . . . . . . . . . . . . . 192.8 Distribuio dos tipos de lceras pelas regies de interesse [2] . . . . . . . . . . 19
3.1 Exemplo de uma curva ROC . . . . . . . . . . . . . . . . . . . . . . . . . . . . 253.2 Arquitetura de uma rede ANN criada[5] . . . . . . . . . . . . . . . . . . . . . . 253.3 Sistema de Previso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 263.4 Exemplo de um grafo orientado e acclico . . . . . . . . . . . . . . . . . . . . . 303.5 Exemplo da representao de um SVM. . . . . . . . . . . . . . . . . . . . . . . 323.6 Representao das concluses na reviso de classificao . . . . . . . . . . . . . 35
4.1 Arquitetura do sistema implementado . . . . . . . . . . . . . . . . . . . . . . . 40
5.1 Diagrama de atividade para a leitura de imagens trmicas . . . . . . . . . . . . . 445.2 Diagrama de atividade para o processamento e segmentao de imagens trmicas 455.3 Exemplo de um histograma obtido . . . . . . . . . . . . . . . . . . . . . . . . . 465.4 Offset percentual entre os valores os valores de mnimo e mdia da temperatura . 465.5 Esboo de construo de um p de Albrecht Drer, 1513 [6] . . . . . . . . . . . 475.6 Localizao das ROIs e dos pontos auxiliares . . . . . . . . . . . . . . . . . . . 485.7 Diagrama de atividade para determinao da posio do pxel central de cada ROI 49
6.1 Modelo relacional para os elementos de treino da classificao . . . . . . . . . . 516.2 Modelo Relacional para os elementos de treino da classificao . . . . . . . . . . 526.3 Diagrama de atividade para a implementao do classificador KNN . . . . . . . 53
7.1 Contedo dos primeiros 20 bytes dos ficheiros com o formato .img . . . . . . . . 557.2 Primeiro conjunto de tags encontradas . . . . . . . . . . . . . . . . . . . . . . . 567.3 Segundo conjunto de tags encontradas . . . . . . . . . . . . . . . . . . . . . . . 567.4 Terceiro conjunto de tags encontradas . . . . . . . . . . . . . . . . . . . . . . . 567.5 Quarto conjunto de tags encontradas . . . . . . . . . . . . . . . . . . . . . . . . 57
xiii
-
xiv LISTA DE FIGURAS
7.6 Quinto conjunto de tags encontradas . . . . . . . . . . . . . . . . . . . . . . . . 577.7 Exemplo da imagem obtida com a leitura dos valores da matriz radiomtrica . . . 577.8 Exemplo de imagens obtidas obtidas a partir da separao no formato .jpg . . . . 587.9 Imagem padro do formato jpg . . . . . . . . . . . . . . . . . . . . . . . . . . . 587.10 Diagrama Deteo Automtica . . . . . . . . . . . . . . . . . . . . . . . . . . . 597.11 Diagrama por Overlay . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 597.12 Histograma da figura 7.12 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 607.13 Resultados obtidos na Binarizao com valores diferentes para o limiar . . . . . . 607.14 Outros resultados obtidos na Binarizao . . . . . . . . . . . . . . . . . . . . . . 617.15 Limites exteriores e em falta no dorso dos ps. . . . . . . . . . . . . . . . . . . . 617.16 rea recuperada e limites de rea em falta . . . . . . . . . . . . . . . . . . . . . 617.17 Algumas representaes bi-dimensionais obtidas . . . . . . . . . . . . . . . . . 647.18 Screenshot do primeiro programa . . . . . . . . . . . . . . . . . . . . . . . . . . 677.19 Screenshot do mtodo de overlay . . . . . . . . . . . . . . . . . . . . . . . . . . 677.20 Screenshot do segundo programa . . . . . . . . . . . . . . . . . . . . . . . . . . 68
-
Lista de Tabelas
1.1 Classificao de lcera de Meggitt-Wagner. [7] . . . . . . . . . . . . . . . . . . 2
2.1 Ranking adaptado da atualizao de Junho de 2017[8] . . . . . . . . . . . . . . . 202.2 Detalhes de cada DBMS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
4.1 Requisitos funcionais do sistema . . . . . . . . . . . . . . . . . . . . . . . . . . 384.2 Requisitos no funcionais do sistema . . . . . . . . . . . . . . . . . . . . . . . . 39
7.1 Resultados da tabela public.utente presente na base de dados . . . . . . . . . . . 637.2 Numero de elementos inseridos na BD . . . . . . . . . . . . . . . . . . . . . . . 637.3 Resultados para o primeiro teste . . . . . . . . . . . . . . . . . . . . . . . . . . 657.4 Resultados obtidos no programa WEKA . . . . . . . . . . . . . . . . . . . . . . 667.5 Resultados obtidos no programa desenvolvido para o classificador KNN . . . . . 66
A.1 Informao retirada da extenso .FFF[9] . . . . . . . . . . . . . . . . . . . . . . 83A.2 Informao contida na Tag CameraInfo da extensao .FFF . . . . . . . . . . . . . 84A.3 Informao retirada da extenso .FPF . . . . . . . . . . . . . . . . . . . . . . . 85
B.1 Resultados obtidos com a aplicao de ExifTool para uma imagem trmica do tipo.img . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
B.2 Resultados obtidos com a aplicao de ExifTool para uma imagem trmica do tipo.jpg radiomtrico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
xv
-
xvi LISTA DE TABELAS
-
Abreviaturas
AI Artificial IntelligenceANN Artificial Neural NetworkAUC Area Under the ROC CurveBD Base de DadosBN Bayesian NetworkBP BackPropagationDBMS DataBase Management SystemsDFU Diabetic Foot UlcerDICOM Digital Imaging and Communicatons in MedicineDM Diabetes MellitusDN dynamic neural networkFEUP Faculdade de Engenharia da Universidade do PortoFN Falso NegativoFP Falso PositivoID IDentificationIGR Information Gain RatioIMC ndice de Massa CorporalIR Infrared RadiationIRT InfraRed ThermographyKNN K-Nearest NeighborLDA Linear Discriminant AnalysisMITI Medical Infrared Thermal ImagingNDA Nonparametric discriminant analysisPCA Principal Component AnalysisROC Receiver Operating CharacteristicROI Regions of Interest / Regio de InteresseSI Sistema Internacional de unidadesSVM Support Vector MachineVN Verdadeiro NegativoVP Verdadeiro PositivoWEKA Waikato Environment for Knowledge Analysis
xvii
-
Captulo 1
Introduo
Este capitulo tem o objetivo de introduzir o trabalho realizado no desenvolvimento desta dis-
sertao do Mestrado Integrado em Engenharia Eletrotcnica e de Computadores.
1.1 Contexto
O problema do p diabtico pode ser entendido como uma complicao associada doena
metablica de Diabetes Mellitus (DM) que se manifesta com o aparecimento de lcera na regio
do p (DFU - Diabetic Foot Ulcer) que ocorrem normalmente em zonas onde existe uma presso
aumentada, ou seja, pelo uso de calado desadequado ou reas do p onde se aplica mais fora ao
andar.
Segundo o relatrio elaborado pela Sociedade Portuguesa de Diabetologia [10] no ano de 2014
a prevalncia estimada da doena metablica de Diabetes na populao portuguesa foi de 13,1%, o
que significa que, mais de 1 milho de portugueses tem DM. Um em cada quatro destes indivduos
podem desenvolver complicaes associadas a lceras. Este problema assume importncia num
quadro clinico devido influncia altamente negativa que provoca na qualidade de vida do doente
e dos seus familiares. Isto acontece devido ao elevado grau de dependncia de terceiros a que os
doentes ficam sujeitos. Em alguns casos, aps o diagnstico do p diabtico so necessrios meses
de tratamento e eventualmente a pessoa acabar por sofrer amputao parcial ou total do membro
afetado no caso mais grave[11].
Existem trs tipos de lceras no p diabtico: neuropticas, isqumicas e neuroisqumicas.
No primeiro tipo, ocorreu um aumento prolongado da glicose assim como mudanas sensoriais e
motoras. Por um lado, a neuropatia sensorial leva perda da sensibilidade no p enquanto que
a neuropatia motora pode provocar deformidades do p, perda de gordura na regio plantar do
p, deformao nas articulaes e outros danos associados. Por este motivo, neste tipo de lceras
existe um aumento da temperatura em relao mdia do p. Por outro lado, nas lceras isqu-
micas existe uma doena vascular perifrica que provoca uma obstruo ou alterao no normal
fluxo sanguneo nas extremidades do p, o que leva diminuio da temperatura nas regies onde
1
-
2 Introduo
exista lcera. Contudo, so raros os casos de existncia deste tipo de lceras puramente isqumi-
cas sendo mais comum a existncia de lceras neuroisqumicas, ou seja, com natureza isqumica
e neuroptica [12]. A figura 1.1 apresenta atravs de imagens trmicas um caso de cada tipo de
lcera.
Figura 1.1: Exemplo de imagens trmicas para cada um dos tipos de lcera. Imagem retirada de[1]
Estas 3 capturas esto includas num conjunto de imagens recolhidas no decorrer de uma
dissertao realizada na FEUP pela Ana Rita Soares Marques[1] com o ttuloDiabetic foot ther-
mophysiology characterization e que teve como objetivo a caracterizao do p diabtico por
termografia.
Uma lcera pode ser classificada em seis graus de gravidade consoante o sistema de classi-
ficao de Meggit-Wagner, representado na tabela 1.1, sendo este sistema utilizado nos servios
de sade para a classificao, interveno e encaminhamento do utente diagnosticado. Contudo,
apenas os casos de grau 0 no apresentam sinais visveis da presena de lcera, ou sejas, so casos
considerados como situaes de risco de inflamao. Por consequente, na maioria das situaes,a
tcnica de avaliao do risco de ulcerao utilizada atravs de exames fsicos que comprovem a
perda de sensibilidade[7]. Contudo, este mtodo de avaliao no abrange a totalidade dos casos
de pr-ulcerao uma vez que a perda da sensibilidade depende da natureza da lcera. Assim
sendo, atualmente fazem falta, na assistncia mdica, mtodos no evasivos e eficazes para a de-
teo precoce.
Tabela 1.1: Classificao de lcera de Meggitt-Wagner. [7]
Grau Caractersticas da ferida0 Leses pr-ulcerao, lceras cicatrizadas, presena de deformidade ssea.1 lcera superficial sem envolvimento de tecido subcutneo.2 Penetrao atravs de tecido subcutneo; pode expor osso, tendo, ligamento ou cpsula de articulao.3 Ostete, abcesso ou osteomielite.4 Gangrena do dedo.5 Gangrena do p.
-
1.2 Motivao 3
1.2 Motivao
A alterao da temperatura pode ser considerada um sintoma da presena de vrias patologias
no ser humano e, por este motivo, a monitorizao da temperatura em meios clnicos considerada
um indicador de diferentes doenas. A termografia mdica um mtodo que possibilita a monito-
rizao pretendida porque permite analisar a distribuio da temperatura presente na superfcie da
pele no momento da captura da imagem. Por se tratar de um mtodo no invasivo, no ionizante
e preciso, possui um elevado potencial de uso para as prticas clinicas tanto em diagnstico como
em tratamento ou monitorizao. Desta forma a termografia um mtodo complementar e no um
substituto dos mtodos atualmente existentes. Algumas destas utilizaes encontram-se referidas
nos artigos de K. Ammer[13][14] no existindo ainda, contudo, um sistema normalizado, prtico
e adaptado que simplifique o uso desta tcnica.
Neste sentido, a monitorizao da temperatura torna-se numa alternativa vivel para o deteo
precoce da patologia do p diabtico uma vez que nem todos os casos de pr-ulcerao levam
perda de sensibilidade e a alteraes no fluxo sanguneo Por este motivo, recomendado o
rastreio peridico, contudo, na atualidade, no existe uma ferramenta objetiva de rastreio atravs
de processamento e captura de imagens trmicas[15].
Apesar da existncia de uma relevante recolha previamente efetuada, em projetos da FEUP
durante os ltimos 3 anos , que permite uma boa caracterizao do problema e comprova a pos-
sibilidade de utilizao de termografia no diagnstico do p diabtico, necessrio criar uma
ferramenta mais avanada de anlise de dados para permitir o seu uso corrente. Neste sentido,
pretende-se adaptar tcnicas utilizadas em anlise inteligente de dados (Data-Mining), mais espe-
cificamente, mtodos de classificao de dados provenientes da rea de aprendizagem automtica
(Machine Learning). Com esta adaptao, pretende-se que seja possvel identificar, atravs da
classificao efetuada pelos mtodos aplicados, a existncia de lceras nas imagens trmicas.
1.3 Finalidade
Com o trabalho desenvolvido pretende-se que seja possvel identificar, atravs da classificao
efetuada pelos mtodos adaptados e aplicados, a existncia de lceras nas imagens trmicas. Desta
forma, o resultado final possibilita uma ferramenta informtica que no futuro poder ser utilizada
para apoiar o rastreio e seguimento de pacientes em risco de desenvolver p diabtico em Portugal.
Para que esta finalidade seja alcanada necessrio assegurar duas caratersticas fundamentais:
eficcia e simplicidade em termos de utilizao.
Por um lado espera-se que a ferramenta seja de simples utilizao para que possa ser adotada
tanto pelos meios complementares de diagnstico do Sistema Nacional de Sade (SNS) como
por outros meios de assistncia na doena disponveis em Portugal. Caso contrrio ser uma
ferramenta obsoleta.
Por outro lado, para que o trabalho desenvolvido possa ser utilizado no futuro necessrio
assegurar a sua complexidade no sentido de ser eficaz em qualquer tipo de dados para que os
-
4 Introduo
resultados sejam fiveis. Caso contrrio, a alternativa de identificao prematura do p diabtico
desenvolvida no servir de garantia se a probabilidade de apresentar resultados incorretos for alta.
1.4 Objetivos
Para que a finalidade proposta seja cumprida, necessrio definir quais os objectivo a alcanar
com esta dissertao:
1. Estudo dos formatos proprietrios de imagens trmicas mais comuns e disponveis.
2. Definir um conjunto de dados para armazenar as imagens recolhidas de p diabtico.
3. Desenvolver uma ferramenta de anlise avanada com mtodos de processamento de ima-
gem.
4. Armazenar, numa base de dados, as imagens recolhidas em projetos anteriores da FEUP.
5. Desenvolver e avaliar a performance dos classificadores de dados correlacionando-os com
a classificao previamente determinada.
1.5 Estrutura da dissertao
Para alm da introduo, esta dissertao contm mais 8 captulos e vrios anexos. Os tpicos
seguintes indicam o tema do contedo de cada captulo:
No captulo 2, descrito o estado da arte e so apresentados trabalhos relacionados com atermografia.
No captulo 3, apresentada uma reviso do uso de ferramentas de classificao em aplica-es clnicos com a termografia.
No captulo 4, encontra-se as especificaes genricas do projeto desenvolvido, nomeada-mente, a arquitetura e os requisitos do sistema.
No captulo 5 explicada a metodologia adotada na parte da anlise de imagens trmicasdeste projeto.
O captulo 6 remete para um esclarecimento da forma como a base de dados foi construdae da metodologia adotada para a aplicao da classificao.
No captulo 7 so apresentados os resultados obtidos ao longo do desenvolvimento destadissertao.
No captulo 8 realizada uma anlise dos resultados e apresentada uma resposta a cadaum dos objetivos propostos.
-
1.5 Estrutura da dissertao 5
O captulo 9 a parte mais conclusiva deste documento que inclui sugestes de trabalhofuturo.
-
6 Introduo
-
Captulo 2
Estado da arte
Este captulo pretende introduzir os estudos, artigos e as investigaes mais tericas que foram
efetuadas at ao momento por diferentes entidades e que esto relacionados com o tema desta
dissertao.
2.1 Fundamentos da termografia
2.1.1 Conceitos fundamentais de energia Trmica
2.1.1.1 Espectro eletromagntico
Toda a energia existente pode ser expressa no espectro eletromagntico em funo das frequn-
cias e comprimentos de onda. Numa geral representao do espectro eletromagntico, este encontra-
se dividido por diferentes regies denominadas por bandas do espectro.
As diferentes regies podem ser distinguidas por mtodos utilizados para produzir e detetar a
radiao. No h diferena fundamental entre a radiao nas diferentes bandas do espectro ele-
tromagntico. Por este motivo, so aplicadas as mesma regras e frmulas de clculo em qualquer
uma das bandas sendo que o que varia em cada uma delas o comprimento de onda e respetiva
frequncia.
Contudo, com as experincias executadas por Herschel, concluiu-se que a energia trmica
diferente para cada uma das cores da parte da luz visvel sendo que crescente no sentido
do violeta para o vermelho. Outra concluso foi a existncia de energia trmica na regio dos
infravermelhos, localizada direita do espectro visvel. Na figura 2.1 podem ser consultadas as
frequncias que pertencem energia libertada sob a forma de radiao trmica e tambm as partes
em que se pode decompor a energia infravermelha [16].
2.1.1.2 Temperatura e radiao
A Temperatura uma grandeza fundamental inserida no sistema internacional de unidades
(SI) que apresenta medies relativas a um dado sistema. Esta medida da energia cintica avalia
o nvel de agitao das molculas que constituem um corpo na medida em que, quanto maior for
7
-
8 Estado da arte
Figura 2.1: Espectro eletromagntico relacionado com a energia trmica
o movimento das partculas, maior ser a temperatura apresentada e, portanto, mais quente ser
o corpo. A existncia de corpos num dado sistema com valores de temperatura distintos gera a
necessidade de transmisso de energia porque todos os sistemas procuram obter um equilbrio
trmico.
As ondas eletromagnticas so o resultado do fluxo trmico, ou seja, da transmisso da radia-
o trmica de um corpo mais quente para um corpo mais frio. Uma vez que o estado de equilbrio
trmico nunca alcanado, todos os corpos esto em constante transmisso de radiao trmica.
A forma de radiao que ocorre numa superfcie depende do modo como ocorre a incidncia
da mesma. As formas de representar a radiao que incide numa superfcie variam consoante a
origem, trajeto e efeito produzido pela radiao. Algumas representaes conhecidas so: trans-
misso, reflexo, refrao, difuso, absoro e emisso.
2.1.1.3 Emissividade e corpo negro
Entende-se por emisso a radiao que emitida pela superfcie de um corpo para o seu exte-
rior. Emissividade uma medida para a capacidade que um corpo possui de emitir energia a partir
do seu interior, comparativamente com a emissividade de um corpo negro. Esta taxa varia entre 0
a 1, onde 0 atribudo a um corpo que reflete toda a radiao (como por exemplo um espelho) e 1
significa que absorve toda a energia tratando-se portanto de um corpo negro. Relativamente pele
do corpo humano internacionalmente aceite que o valor da emissividade seja 0.98.
O conceito de corpo negro atribudo a um objeto ideal que no existe na realidade. Por
possuir emissividade 1, este corpo tem a capacidade de absorver toda a radiao que nele incide e
emitir apenas radiao trmica numa temperatura especfica, emitindo-a para todas as frequncias
e comprimentos de onda. Apesar de no existir fisicamente um corpo negro, existem equipamentos
e mecanismos de aproximao que so utilizados na validao de resultados apresentados por
cmaras termogrficas.
-
2.1 Fundamentos da termografia 9
2.1.1.4 Distribuio de Planck, lei de deslocamento de Wien e lei de Stefan-Boltzman
Embora o corpo negro apenas emita radiao numa dada temperatura, a frequncia e o compri-
mento de onda relativos temperatura especificada podem variar. Para calcular a intensidade es-
pectral, mais concretamente, a emitncia produzida por um corpo negro, utiliza-se a lei de Planck.
Nesta expresso, o valor da radiao obtido em funo do comprimento de onda e da temperatura
expressos na seguinte frmula[2]:
E ,b( ,T ) =C1
5[exp( C2T )1](2.1)
Onde:
E ,b = emitncia espectral (intensidade da radiao hemisfrica) [W/m2 m]
C1 = 3.742108[W m4/m2]
C2 = 1.4387104[m K]
= comprimento de onda da radiao [m]
T = temperatura absoluta [K]
A distribuio de Planck apresenta a quantidade de radiao emitida por um corpo negro numa
representao grfica que se pode observar na figura 2.2.
Figura 2.2: Representao da distribuio de Planck para os vrios comprimentos de onda, adap-tado de [2]
-
10 Estado da arte
Derivada da lei de Planck surgiu a lei de deslocamento de Wien. Neste caso, possvel calcular
o comprimento de onda (max) que corresponde intensidade de radiao mxima para uma dadatemperatura. Este valor obtido com o clculo da expresso 2.2.
max =bT
(2.2)
Onde:
max = comprimento de onda correspondente intensidade de radiao mxima [m]
b = 2.8977685103 constante de disperso de Wien [mK]
T = temperatura absoluta [K]
A figura 2.3 representa a lei de deslocamento de Wien na distribuio de Planck para os vrios
comprimentos de onda de um corpo negro. Tal como se pode observar, o aumento da temperatura
e intensidade da radiao emitida inversamente proporcional ao valor do comprimento de onda.
Figura 2.3: Representao da lei de deslocamento de Wien
Dentro do mesmo contexto importante ainda referir a lei de Stefan-Boltzman. Nesta lei,
a energia total irradiada por um corpo negro diretamente proporcional quarta potncia da
temperatura, expressa pela expresso 2.3.
J = T 4 (2.3)
Onde:
J = energia total [W/m2]
= valor da emissividade
-
2.1 Fundamentos da termografia 11
= 5,669108[W/m2K4] constante de Stefan-Boltzmann.
T = temperatura absoluta [K]
Em suma, todos estes conceitos pertencentes fsica trmica so importantes para esclarecer
o modo como as cmaras trmicas calculam o valor da temperatura. Este clculo feito utilizando
a quantidade de energia absorvida pelos sensores da cmara na equao 2.4.
T = 4
J
(2.4)
Onde:
T = temperatura absoluta [K]
J = energia total [W/m2]
= valor da emissividade
= 5,669108[W/m2K4] constante de Stefan-Boltzmann.
2.1.2 Evoluo da termografia
A temperatura superfcie da pele um indicador fsico relevante para a anlise do normal
funcionamento do corpo humano. Esta constatao foi inicialmente apoiada por Hipcrates, o
fsico grego tambm conhecido como pai da medicina moderna, nas suas teorias de que as doenas
tm causas naturais e no acontecem por causas supersticiosas ou divinas. Para comprovar estes
ideais na poca, foram registados valores de temperatura utilizando banhos de lama. Com estes
registos conseguia-se diferenciar as regies mais quentes das mais frias e, com isto, era possvel
identificar as reas em que haveria mais probabilidade de existirem doenas.[17] .
Mais tarde, em 1871 foi publicado o trabalho elaborado por Carl Wunderlich que caracterizou a
temperatura de vrias patologias e introduziu a utilizao de termmetros e grficos de temperatura
em prticas clnicas[18][19].
Devido constante evoluo da medicina e da tecnologia, existem atualmente diversos mto-
dos de captura de imagem utilizados em prticas clnicas. Cada um destes mtodos tem as suas
caractersticas prprias e utiliza uma banda especfica do espectro eletromagntico. A figura 2.4
apresenta um resumo sobre em que medida as vrias pores do espectro eletromagntico so
utilizadas em diferentes prticas incluindo uma caracterizao dos respetivos mtodos[2].
Relativamente termografia, esta apresenta algumas vantagens conhecidas, como por exem-
plo, o facto de no expor indivduos a radiao ionizante, de ser um mtodo no invasivo, a exis-
tncia de equipamentos portteis e o tempo de captura das imagens ser consideravelmente curto.
-
12 Estado da arte
Figura 2.4: Espectro eletromagntico e sua utilizao, retirado de [2]
2.1.3 Aquisio e recolha de termogramas
Devido ao facto de as imagens trmicas serem sensveis s mudanas das condies ambien-
tais, como por exemplo s alteraes da humidade relativa do ar, existe a necessidade de se criar
um protocolo com as normas necessrias para a captura de termogramas [20].
A aquisio em termografia pode ser dividida nas categorias de esttica ou dinmica, isto ,
imagens com captura nica ou com vrias capturas ao longo do tempo a fim de estudar o compor-
tamento verificado como resposta presena de um estmulo, que pode ser trmico, mecnico ou
qumico. Outra diviso possvel acontece com a repetio da captura que pode ser nica, acompa-
nhada ou sequencial.
As cmaras trmicas so equipamentos que nos ltimos anos tm evoludo positivamente per-
mitindo cada vez mais qualidade e veracidade nas imagens capturadas.
A FLIR R Systems[21] uma companhia pioneira na rea da captura de imagens trmicasdevido ao seu desenvolvimento tecnolgico e disponibilizao de produtos como cmaras trmicas
cada vez com mais definio e melhorias nas caractersticas. Este empenho e disponibilidade torna
esta empresa lder de mercado nesta rea.
-
2.1 Fundamentos da termografia 13
2.1.4 Termografia aplicada ao p diabtico
No sentido de especificar o uso da termografia na problemtica do p diabtico foi recolhida
e analisada informao relevante e disponvel at data que relacione a imagem trmica com a
avaliao de lceras em p diabtico. Os assuntos aqui descritos foram baseados na bibliografia
consultada e apresentada de seguida.
Primeiramente, no ano de 2007, foi publicado um artigo[22] realizado com o intuito de avaliar
se a monitorizao de temperatura a partir do lar um mtodo efetivo no rastreio do p diabtico.
Neste sentido, foi testada a hiptese de que a auto-monitorizao poderia reduzir a taxa de ulce-
rao no p contribuindo, por isso, para a melhoria da qualidade de vida do doente. Ou seja, esta
monitorizao tinha como objetivo avaliar o risco de incidncia de lceras em ps de pacientes
diabticos considerados de alto risco. Foram criados dois grupos de pacientes para a avaliao:
um com os pacientes com histrico de lceras ou amputaes e outro grupo com os pacientes de
perda sensorial ou deformidades estruturais no p. Como resultado, esse mesmo estudo apresenta
gradientes de alta temperatura entre os ps que podem prever o incio do aparecimento de lceras
e a auto-monitorizao pode reduzir esse mesmo risco.
Um artigo mais recente[23] contempla uma reviso dos estudos que relacionam a temperatura
na superfcie do p com a tomografia trmica do p diabtico. Neste estudo, so apresentado o
potencial e os benefcios da utilizao da termografia infravermelha em problemas do p diab-
tico e ainda so apresentados os diferentes mtodos de anlise para os termogramas bem como
as vantagens e as desvantagens de cada um. Dos mtodos de anlise apresentados (temperatura
independente dos membros, temperatura assimtrica, distribuio da temperatura e, por ltimo,
anlise da temperatura na presena de um estmulo de stress externo) indicado que as anlises
mais utilizadas sejam a assimtrica e a de stress externo e, noutro extremo, a menos utilizada a
distribuio de temperaturas. Com a anlise da temperatura independente dos membros obtm-se
intervalos de temperatura representativos entre diferentes grupos de estudo, contudo, no poss-
vel detetar reas especificas relacionadas com o risco elevado de presena de lcera. Na anlise da
temperatura assimtrica realizada uma comparao entre a temperatura de um ponto num p com
a temperatura do ponto contralateral respetivo presente no outro p. Com esta comparao pos-
svel detetar reas de rico elevado de presena de lceras e por isso este mtodo tem apresentado
bons resultados. Contudo, apresenta tambm limitaes, como por exemplo o facto no funciona
quando o paciente apresenta complicaes similares nos dois membros ou nos casos em que o
paciente apresente amputaes e por isso no se pode calcular o valor da diferena de temperatura
para os pontos em anlise. A anlise da distribuio de temperatura tem como maior vantagem
no utilizar comparaes e, portanto, no apresenta as mesmas dificuldades que o mtodo ante-
rior. Apesar disto, um mtodo pouco utilizado e por isso no existe at data um padro para
representar a distribuio de temperatura num p normal embora tenham sidos reportados padres
irregulares na distribuio de temperatura de ps diabticos, o que dificulta a classificao destas
distribuies. Numa anlise de stress externo aplicado um estimulo externo no paciente (por
exemplo: imerso do membro em gua fria) e analisado o comportamento da temperatura plan-
-
14 Estado da arte
tar ao estmulo aplicado. Um dos principais inconvenientes desta anlise o desconforto que pode
causar nos pacientes.
No ano de 2015, outro artigo de reviso[24] descreve a abordagem adotada por uma inves-
tigao em curso. Essa investigao pretende aliar a deteo precoce de complicaes no p
diabtico com componentes complementadas por um ecossistema computacional. De uma forma
mais detalhada, o projeto inclui a juno de equipamento fsico com uma aplicao alojada numa
plataforma web e a metodologia pode ser explicada em cinco partes. No incio, capturada uma
imagem trmica plantar de um paciente atravs de um scanner trmico. De seguida, o tcnico
profissional responsvel pela captao confirma se a imagem foi corretamente capturada e a se-
guir envia a imagem (upload) para a aplicao web desenvolvida. Na terceira parte deste projeto
a imagem processada pela aplicao. Neste processamento, a imagem segmentada de forma
a que resulte em dois segmentos (um segmento para cada p). Na quarta parte, cada segmento
dividido de forma o obterem-se as Regies de interesse (ROI - Regions Of Interest) e avaliado
o risco da presena de lceras em cada regio de acordo com as assimetrias detetadas nos valores
da temperatura. Por fim, tanto a imagem inicialmente enviada para a aplicao como os dados
resultantes da avaliao do risco so encapsulados para o formato DICOM (Digital Imaging and
Communicatons in Medicine) que um formato standard para imagens mdicas. Em suma, esta
soluo em desenvolvimento permite registar imagens termogrficas e monitorizar a evoluo de
casos clnicos ou identificar atempadamente o desenvolvimento de lceras.
Uma publicao do ano de 2015[25] apresenta a abordagem de uma deteo sustentada por
um sistema inteligente de telemedicina descrito como vivel e rentvel. Aps a aquisio de
imagens trmicas procedeu-se segmentao das reas correspondentes planta do p. Devido
ao facto de existir uma pequena diferena de temperatura entre algumas partes do p importantes
na segmentao e a temperatura ambiente, foi difcil conseguir um bom resultado da segmentao
e por isso foram adotadas vrias abordagens nesta etapa. O melhor resultado foi obtido quando se
segmentaram imagens RGB e se combinaram esse resultados com as capturas trmicas. Depois da
segmentao estar concluda, a etapa seguinte tinha o objetivo de detetar zonas de risco de presena
de complicaes associadas patologia do p diabtico. Foi realizada uma anlise assimtrica com
um critrio de identificao de 2.2oC. Os resultados apresentados foram satisfatrios e demonstram
como a abordagem promissora embora sejam tambm apresentadas algumas limitaes como o
caso em que impossvel realizar anlise assimtrica em casos de amputamentos e em casos de
existir complicaes simtricas nos dois ps. Outra limitao encontrada foi a inexistncia de um
padro ideal standard para a segmentao e registo do valor de temperatura, sendo complicado
avaliar os resultados objetivamente.
Num trabalho de deteo e anlise da hipertermia do p diabtico, os autores de um artigo
[26] publicado em 2016, criaram um programa que, atravs de capturas trmicas, produz imagens
com a leitura do valor da diferena de temperatura mdia absoluta de sete regies entre o p
esquerdo e o p direito (anlise assimtrica). A metodologia adotada pode ser explicada em duas
etapas: segmentao e avaliao. Na segmentao procurou-se selecionar apenas as partes da
imagem pertencentes s zonas do p e de seguida dividiram-se essas partes de forma a obterem
-
2.2 Formatos de imagens trmicas 15
as ROIs pretendidas. Na avaliao, as 85 imagens de ps diabticos recolhidas foram divididas
e classificadas consoante o grau de risco da presena de lcera: alto, mdio ou baixo. Como
resultados genricos, p diabticos com o valor da diferena de temperatura mdia superior a
2.2oC foram apontados como pacientes que carecem de ateno reforada por parte dos mdicos
porque existe um grande potencial de desenvolver complicaes como lceras ou infees. Como
limitao, este estudo apresenta a necessidade de uma cmara trmica para a recolha de imagens
a fim de facilitar a segmentao e, por consequncia, a leitura dos valores de temperatura.
2.2 Formatos de imagens trmicas
2.2.1 Formatos dos Ficheiros
As cmaras usadas para a captao das imagens infravermelhas (IR - infrared) so do fornece-
dor FLIR[21], mais concretamente, tratam-se das cmaras FLIR ONE[27], FLIR A325sc e FlIR
E60sc.
Destas cmaras consegue-se extrair imagens de diferentes formatos de ficheiro, sendo esses
tipos o .IMG, o .SEQ e o .JPEG radiomtrico. Para cada formato de imagem a informao que se
pretende extrair encontra-se estruturada de formas diferentes. Neste sentido, necessrio ter em
conta o formato de cada um dos diferentes tipos.
2.2.2 Extenses de metadados
Metadados so informaes sobre as caraterstas presentes no ficheiro e nos dados nele conti-
dos. Estes metadados so divididos por extenses e subdivididos por itens (tags). Neste sentido,
uma tag a unidade bsica de metadado.
Para alm de existirem diferentes formatos de imagem, existem tambm vrias extenses que
disponibilizam metadados contidos nos ficheiros das imagens trmicas Das diferentes extenses
existentes ser dado mais destaque extenso .FFF (Flir System thermal image File Format) e
.FPF (Flir Public image Format). Embora o contedo presente nestas extenses seja semelhante
existem algumas diferenas que no podem ser desprezadas.
No anexo A encontram-se algumas tabelas informativas sobre quais os dados provenientes das
extenses referidas. Nomeadamente, as tabelas A.1 e A.2 mostram algumas das informaes que
se podem retirar a partir da extenso .FFF. A tabela A.3 mostra as informaes que se pode retirar
da extenso .FFF.
2.2.3 Aplicao ExifTool
Com o auxlio da ferramenta Exiftool[28], possvel descodificar as informaes metadata
de vrios tipos de ficheiros. Exiftool uma aplicao que corre na linha de comandos de vrios
sistema operativos e que possibilita a leitura, escrita e edio de informao do tipo metadata.
Depois de utilizar esta ferramenta em alguns ficheiros do tipo .img obtiveram-se os valores
para alguns dados que sero necessrios para o processamento correto das imagens. Estes dados
-
16 Estado da arte
esto apresentados mais concretamente na tabela B.1 para as imagens do tipo .img e na tabela B.2
para as do tipo .jpg.
2.2.4 Frmula de clculo de temperatura em imagens trmicas
Tal como se pode verificar pelos resultados do Exiftool, das imagens recolhidas, conseguem-se
recolher valores para cinco constantes de Planck. Estes dados so cruciais para o clculo correto
do valor de temperatura.
A frmula correta para a clculo do valor da temperatura de um objecto capturado depende do
valor radiomtrico e das cinco constantes de Planck[29] como se pode observar na expresso 2.5:
T =B
ln( R1R2(S+O) +F)(2.5)
Onde:
T = temperatura do objecto [K]
S = valor radiomtrico (16 Bit)
R1 = constante Planck R1
R2 = constante Planck R2
B = constante Planck B , valor no intervalo [1300,1600]
F = constante Planck F , valor no intervalo [0.5,2]
O = constante Planck O (offset) , valor negativo
2.3 Tcnicas de processamento de imagem
2.3.1 Pr-processamento
O pr-processamento de imagem uma tcnica til para uma melhor leitura e anlise de dados
importantes em imagens trmicas. Dois fatores a ter em conta so, por exemplo, o contraste com
o fundo da imagem (background) e a presena de ruido indesejado.
Numa imagem trmica, a existncia considervel de rudo pode afetar a extrao do objeto de
interesse e dificultar os valores reais da medio de fraco contraste entre o alvo e o background
pode afetar a extrao do objeto de interesse e aumentar o tempo perdido na sua anlise. Conforme
o que foi publicado pelo artigo de Bajwa et al publicado em 2010 [30], os operadores baseados
em probabilidade produzem o melhor resultado, especialmente aps pr-processamento com um
filtro de remoo de rudo.
Quanto ao fator de presena de ruido, outro artigo[31], compara vrias tcnicas de remoo
de rudo com o intuito de classificar e apurar qual melhor se adapta sem causar uma leitura errada
dos valores de temperatura. Como resultado final os que melhor se adaptam so os filtros Median,
-
2.3 Tcnicas de processamento de imagem 17
Mean e Wiener, contudo, sugerido ainda que a filtragem de rudo s deve ser aplicada quando
especificamente necessrio.
Os filtros de mdia (mean) so do tipo de filtros de suavizao lineares, ou seja, processam a
imagem original com uma mascara convolucional a fim de eliminar o ruido existente. Por outro
lado, os filtros de mediana (median) e Wiener so filtros no-lineares, ou seja, o resultado no
obtido atravs da aplicao de uma funo global linear na imagem original mas sim atravs
de funes locais. No caso do filtro Wiener, com a sua utilizao pretende-se que o resultado
apresente uma diferena minima relativamente imagem original.
2.3.2 Segmentao
No processamento de uma dada imagem, vulgarmente necessrio segmentar certas regies
nela contidas. Para se atingir este fim existem mtodos de segmentao que se baseam em pro-
priedades dos pixeis presentes na imagem. Por um lado existem mtodos de segmentao que
se baseiam em propriedades de semelhana como o tresholding (segmentao baseada em his-
tograma), clustering (segmentao baseada em agrupamento) e ainda segmentao baseada em
regies. Por outro lado a segmentao pode ser baseada em propriedades como a diferena ou
descontinuidade dando origem a mtodos de segmentao baseada em contornos e segmentao
de pontos, linhas, orlas e cantos[3].
O mtodo de binarizao tresholding o mais simples de se implementar. Consiste na seleo
de um valor de limiar a partir do histograma da imagem, ou seja, a partir da representao da dis-
tribuio de intensidade que medida em cada ponto da imagem, sendo que, no eixo das abcissas
encontra-se a escala das intensidades possveis (de 0 a 255) e no eixo das ordenadas a quantidade
de pxeis. Ao selecionar-se um determinado valor de intensidade para o limiar, o resultado de
uma imagem binarizada apresenta apenas duas classes ou intensidade possveis: 0 ou 255 que
corresponde, respetivamente, classe cor preta ou classe cor branca. Para esta converso usada
apenas uma condio: se determinado pxel tem o valor de intensidade igual ou abaixo do valor
de limiar definido, este pxel passa a ser preto. Caso contrrio, o pxel passa a ser branco. Este
mtodo de segmentao o mais adequado quando o histograma bimodal. Para que a escolha do
limiar permita um resultado com classes bem segmentadas, ou seja, foi obtida a melhor separao
possvel entre as classes, existe o mtodo Otsu em que o valor do limiar escolhido de forma a
maximizar a varincia inter-classe[32].
Um histograma bimodal um histograma com duas modas, ou seja, na representao grfica
possvel identificar dois picos distanciados. Na figura 2.5 encontra-se um exemplo deste tipo
de histogramas.
Para histogramas que no sejam bimodais existem algumas dificuldades na aplicao do treshol-
ding devido ao acrscimo de dificuldade da escolha do limiar timo. Contudo, esta pode ser ul-
trapassada se for previamente definido um mtodo para o clculo do limiar que funcione para o
que se pretendia como por exemplo: selecionar apenas determinados pxeis da imagem para a
determinao do limiar.
-
18 Estado da arte
Figura 2.5: Exemplo de um histograma bimodal [3]
2.4 Regies de interesse para a deteo do p diabtico
Relativamente problemtica do p diabtico, tal como foi esclarecido em 1.1, a existncia de
pontos de calor elevado (hotspots) no p podem indicar reas de inflamao antes do aparecimento
de sinais visuais. Neste sentido, necessrio um estudo sobre quais as regies de interesse (Re-
gions Of Interest - ROI) existentes na vista plantar do p necessrias para a deteo dos hotspots.
De seguida encontra-se uma pequena reviso sobre as ROIs definidas em algumas publicaes
relativas ao tema.
Figura 2.6: Regies de Interesse utilizadas[4]
O artigo de Audrey[4] relativo a um novo sistema de cmara trmica ajustado, desenvolvido
para os ps em risco trmico, descreve o padro trmico e simtrico da distribuio de temperaturas
obtidas em 103 pares de ps termicamente saudveis. Em anlise so apresentadas quais as ROI
que foram utilizadas e, como justificao, so descritas so as investigaes que motivaram o uso
destas regies. A figura 2.6 foi retirada do artigo em questo e pretende mostrar a localizao das
33 regies de interesse de cada p que foram utilizadas.
No j referido livro de termografia publicado em 2016[2], apresentada uma caracterizao de
-
2.4 Regies de interesse para a deteo do p diabtico 19
lcera do p diabtico com imagem trmica. No procedimento de captura, indicada a necessidade
da recolha de imagens trmicas ser realizada numa sala com a temperatura controlada, e os ps
estarem despidos e livres de qualquer ornamento metlico ou outro objecto que possa interferir
com a captura. Como regies de interesse foram escolhidas as reas onde existe maior incidncia
de lceras diabticas, estas regies so apresentadas na figura 2.7.
Figura 2.7: Regies de Interesse utilizadas para a caracterizao [2]
Figura 2.8: Distribuio dos tipos de lceras pelas regies de interesse [2]
Como justificao das ROIs indicadas, apresentado um grfico de distribuio dos tipos de
lceras diabticas pelas regies de interesse. Esta distribuio foi obtida atendendo aos valores de
simetria trmica existente entre as vrias imagens capturadas, dos vrios tipos de lceras, utilizadas
para a caracterizao descrita. O grfico da distribuio encontra-se na figura 2.8.
-
20 Estado da arte
2.5 Sistemas de gesto de base de dados
Com o intuito de averiguar quais os sistemas de gesto de base de dados existentes e qual o
melhor se adapta ao pretendido nesta dissertao foram consultados alguns rankings atualizados
sobre DBMS (DataBase Management Systems). Na informao pesquisada[33] possvel encon-
trar rankings de acordo com a popularidade de vrios DBMS e tambm apresentado o mtodo
utilizado para o clculo da pontuao utilizado para o ranking efetuado. A tabela 2.1 mostra os
cinco primeiros lugares do ranking consultado.
Tabela 2.1: Ranking adaptado da atualizao de Junho de 2017[8]
Posio DBMS Pontuao1 Oracle 1351.762 MySQL 1345.313 Microsoft SQL Server 1198.974 PostgreSQL 368.545 MongoDB 335.54
De seguida, na tabela 2.2 so apresentadas especificaes mais tcnicas de cada DBMS da
tabela anterior.
Tabela 2.2: Detalhes de cada DBMS
Oracle MySQL Microsoft
SQL Server
PostgreSQL MongoDB
Modelo da
base de dados
orientada a
objectos
orientada
a objectos
orientada a
objectos
orientada a objectos orientada a
documentos
Desenvolvedor Oracle Oracle Microsoft PostgreSQL Global
Development Group
MongoDB,
Inc
Licena commercial open
source
commercial open source open source
SQL Sim Sim Sim Sim No
2.6 Sumrio
Todos os conceitos relativos energia trmica referidos so necessrios para assegurar e va-
lidar a correta leitura da temperatura atravs de uma cmara trmica. Contudo, para assegurar a
correta leitura do valor de temperatura a partir de uma cmara trmica, necessrio ter em conta
quais os dados possveis de extrair dos ficheiros de formatos proprietrios e de que forma se calcula
a temperatura com a informao disponvel.
As diversas aplicaes realizadas at atualidade da termografia em prticas clnicas assegu-
ram a sua utilidade e provam que a termografia poder ser utilizada como um meio complementar
para o diagnstico sem substituir ou interferir com nenhuma outra tcnica utilizada. Por outro lado
-
2.6 Sumrio 21
importante tambm concluir que para a termografia seja bem analisada necessrio garantir con-
dies ideais para que a captura seja bem sucedida e mtodos de segmentao que no eliminem
partes da imagem essenciais para a anlise pretendida.
Em detalhe, para a problemtica envolvente na patologia do p diabtico, foi necessria uma
reviso sobre as ROIs definidas noutras publicaes. Desta forma fica fundamentado a escolha das
ROIs que sero utilizadas no sistema desta dissertao, uma vez que, so estas as ROIs onde h
maior propenso de ocorrerem lceras do p diabtico.
A fim de implementar uma base de dados til e que preencha os requisitos determinados para
esta dissertao foi necessrio uma pesquisa sobre os DBMS existentes no mercado e quais as suas
especificaes.
Sendo estas concluses genricas importantes para o tema desta dissertao, falta ainda uma
reviso e explicao sobre a utilizao de classificadores. Desta forma, o captulo que se segue
preenche esta lacuna.
-
22 Estado da arte
-
Captulo 3
Reviso do uso de classificadores emtermografia
Em simultneo com o desenvolvimento desta dissertao foi elaborado um captulo inserido
no livro Classification in BioApps: Automation of Decision Making. Esse captulo, intitulado
Classification and decision making with medical infrared thermal imaging, foi aceite para pu-
blicao pela editora Springer.
O presente captulo desta dissertao pretende apresentar de forma sumarizada a reviso efetu-
ada para o captulo da publicao que tambm importante para o desenvolvimento deste projeto,
mais concretamente, encontram-se revistos os mtodos: Redes Neuronais, Redes Baysianas, Sup-
port Vector Machine e o Algoritmo K-Nearest Neighbor.
Para que seja possvel a realizao de uma anlise crtica necessria ainda uma reviso sobre
a avaliao da classificao de dados. Esta anlise torna-se fundamental para o reconhecimento de
problemas no p diabtico.
Por ltimo, existe uma ferramenta de livre utilizao intitulada WEKA que permite a apli-
cao de classificadores em conjuntos de dados e portanto uma ferramenta muito til e pode ser
utilizada para avaliar a qualidade da aplicao de vrios tipos de classificadores nesses conjuntos
de dados.
3.1 Mtodo para a avaliao de um classificador
Primeiramente, antes de perceber o modo de funcionamento de diversos classificadores,
necessrio perceber quais so os resultados possveis de uma classificao.
O resultado da aplicao dos diversos classificadores no problema do p diabtico pode ser
considerado como uma resposta binria em que existem quatro casos possveis: verdadeiro posi-
tivo (VP), verdadeiro negativo (VN), falso positivo (FP) e falso negativo (FN). Estes quatro casos
podem ser divididos como resultados corretos ou incorretos. Nos primeiros dois casos, o resultado
obtido foi o correto, sendo que no caso VP foi detectado corretamente o problema num p diab-
tico enquanto que no caso VN no foi detectado o problema num p saudvel. Por outro lado, os
23
-
24 Reviso do uso de classificadores em termografia
outros dois resultados so incorretos j que no caso FP foi detetado o problema num p saudvel
e no ltimo caso, FN, no foi possvel detectar o problema num p infetado.
Para alm desta nomenclatura, interessa ainda definir alguns mtodos necessrios para avaliar
a qualidade nos resultados de um classificao.
3.1.1 Mtricas para a performance
No sentido de avaliar a performance de um classificador, existem quatro mtricas importantes:
exatido, preciso, sensibilidade e especificidade. Para cada uma destas componentes existe uma
frmula de clculo em que o valor percentual para cada componente depende da quantidade obtida
de cada tipo de resposta da classificao. As expresses a seguir apresentadas mostram a frmula
de calcular cada uma das componentes.
Exatido =VP+VN
VP+VN+FP+FN(3.1)
Preciso (de valores positivos) =VP
VP+FP(3.2)
Preciso (de valores negativos) =VN
VN+FN(3.3)
Sensibilidade =VP
VP+FN(3.4)
Especificidade =VN
VP+FN(3.5)
3.1.2 Receiver operating characteristic(ROC)
O conceito de curva de caracterstica de operao do receptor (curva ROC) uma representa-
o grfica no qual possvel analisar o desempenho do classificador. Neste grfico representado
no eixo das ordenadas a taxa de verdadeiros positivos (sensibilidade) e no eixo das abcissas a taxa
de falsos positivos (100-especificidade). Deste modo, cada ponto da curva ROC apresenta os va-
lores do par sensibilidade/especificidade correspondentes ao limiar de classificao desse ponto.
A rea por baixo da curva ROC (AUC - Area Under the ROC Curve) serve como medida do quo
bem um parmetro distinguido entre dois grupos de classificao.
Na figura 3.1 est indicado, pela linha a vermelho, um exemplo de uma curva ROC.
3.2 Redes Neuronais
3.2.1 Definio
De um modo genrico, o conceito de redes neuronais artificiais (Artificial Neural Networks -
ANNs) pertence famlia de modelos computacionais aplicados em inteligncia artificial. Na pr-
-
3.2 Redes Neuronais 25
Figura 3.1: Exemplo de uma curva ROC
tica, traduz-se num sistema composto por neurnios interligados capazes de trocar mensagens
entre eles[34]. Este sistema pode ser composto por uma nica camada de conexes ou por mlti-
plas camadas permitindo a existncia de um maior nmero de entradas para o sistema. Sendo que,
a classificao por ANN um mtodo recorrente quando se pretende aplicar um classificador em
termografia mdica, na maioria das aplicaes revistas so utilizadas pelo menos 3 camadas: en-
trada (input layer), sada (output layer) e transparente (hiden layer). Na figura 3.2 est apresentada
um exemplo de uma rede com 3 camadas.
Figura 3.2: Arquitetura de uma rede ANN criada[5]
Por outro lado, uma rede neuronal pode ser interpretada como um modelo estatstico bastante
parametrizado[35]. Esta caracterstica torna este modelo muito flexvel, ou seja, a existncia de
pequenas irregularidades nos parmetros das funes no causa uma impossibilidade na reprodu-
-
26 Reviso do uso de classificadores em termografia
o do modelo. Deste modo, todos os parmetros apresentados so modelados, contudo, este facto
apresenta um perigo: o overfitting. Este problema ocorre quando o modelo estatstico calculado
est demasiado ajustado sua amostra, ou seja, ao conjunto de dados que o originou.
Na figura 3.3 so apresentados dois modelos de previso: um modelo demasiado ajustado
representado pela linha azul e outro mais regular a vermelho. O problema do modelo azul que,
ao serem alterados os dados da amostra o nmero de irregularidades que podem ocorrer ser maior
do que quando aplicado o modelo mais regular. Por isso, o modelo representado a preto acaba por
ser mais adaptativo realidade do que o modelo por overfitting. Para colmatar este problema foram
adotadas estratgias que permitiram desenvolver classes de modelos de previso mais funcionais.
Figura 3.3: Sistema de Previso
O elemento bsico para a construo de uma rede neuronal artificial trata-se de um elemento
de processamento. A existncia de algoritmos de construo com diferentes combinaes nos
elementos de processamento leva a uma grande diversidade de capacidades computacionais para
as redes neuronais.
O desenvolvimento de uma rede neuronal pode ser subdividido em duas etapas: construo e
ativao. Como forma de medida, para a fora na ligao existente entre camadas, definido um
peso durante a fase de construo. Esta fase remete para o perodo de aprendizagem em que dado
rede os dados iniciais e as solues respetivas para que consiga construir um modelo de anlise
para novas representaes. Os resultados desta etapa so solues numricas para o problema
proposto. Existem trs tipos de aprendizagem: supervisionada, no supervisionada e hbrida. Na
fase de ativao, a aprendizagem automtica est concluda e a rede est preparada para receber
novos dados, analis-los e apresentar os seus resultados.
Como exemplo de um algoritmo de construo aplicados nas redes neuronais existe o algo-
ritmo backpropagation (BP) tambm designado como (generalized delta rule), que um iterative
gradient algoritm com o objetivo de minimizar o erro mean square que existe entre o resultado
atual obtido e o expetvel. Com o uso deste algoritmo, o peso associado em cada camada trans-
parente pode ser ajustado, sendo deste modo possvel a aprendizagem da rede. Este gnero de
-
3.2 Redes Neuronais 27
sistema fcil de ser construdo e bastante usado em reconhecimento de padres e em problemas
de classificao de imagens, tal como se encontra explicado na prxima seco.
Uma ANN construda a partir de um algoritmo BP significa que a aprendizagem automtica
supervisionada foi realizada a partir de feedforward entre multi-camadass. Aprendizagem por fe-
edforward significa que os elementos de processamento so propagados pela rede desde a camada
de sada at camada de entrada sem haver interconexo entre os elementos de processamento na
mesma camada. As sadas so criadas do seguinte modo: dado a cada elemento de processa-
mento um peso ajustado sua carga, a soma dos pesos de todos os elementos calculada sendo
este valor total transformado no resultado da sada por uma funo de ativao.
O padro de ativao que resulta nas unidades de sada, depois da aplicao da funo de
ativao numa rede de feedforward, codifica a resposta da rede para as unidades de entrada da
mesma. Inicialmente, define-se o peso para pequenos valores aleatrios e aplicado na rede de
forma sequencial um conjunto de entradas de construo (training inputs). No procedimento de
aprendizagem por backpropagation aps a propagao na rede de cada dado de entrada os pesos
so ajustados de forma a que haja uma reduo na diferena existente entre os valores obtidos
na sada e os valores de sada que seriam os corretos. Cada iterao denominada de ciclo de
construo (training cycle), um processo completo de ciclos de construo chamado de poca
de construo (training epoch) e todo este procedimento do tipo de aprendizagem automtica
supervisionada. Uma rede ANN com o algoritmo BP (BP-ANN) utiliza aprendizagem automtica
supervisionada, ou seja, o erro nos resultados de sada determinada e utilizado como um sinal de
construo/treino (trainning signal) na medida em que utilizado para o ajuste dos pesos na rede.
Contudo, na aprendizagem automtica no supervisionada no h um ajuste de peso e tem de
ser a rede a ajustar convenientemente esse valor ao usar (environmental feedback) menos detalhado
durante a performance.
RBFN (Radial Basis Functions Network) uma tcnica utilizada para determinar o training
signal utilizado para ajustar o peso definido para os neurnios numa rede neuronal. Embora o
resultado de RBFN ser linear, as entradas so no-lineares o que causa uma maior capacidade
de modelao mais complexa de mapas, aprendizagem, classificao e capacidade de deciso
comparativamente com uma BP-ANN. Este rede composta por 3 camadas e requer aprendizagem
automtica supervisionada.
3.2.2 Utilizao na termografia
Um artigo de E.Y.-k. Ng. [36] apresenta o uso de redes neuronais na identificao de cancro
da mama sendo este o primeiro caso do uso de classificadores na termografia mdica (Medical
Infrared Thermal Imaging - MITI). Mais concretamente, este artigo examina a utilizao de ANN
para complementar a radiao de calor infravermelho da superfcie do corpo com outros dados
fisiolgicos. Neste caso, dados fisiolgicos e os termogramas de alguns pacientes foram utilizados
como elementos bsicos para o processamento de algoritmos de BP numa rede neuronal de quatro
andares. Os resultados mostram que a ANN criada consegue memorizar e generalizar a relao
-
28 Reviso do uso de classificadores em termografia
existente entre os dados de entrada e os dados de sada do sistema, sendo que os melhores resul-
tados foram obtidos no caso em que os dados de entradas continham mais informaes (dados
fisiolgicos e dos termogramas) sobre os pacientes. A vantagem obtida foi o reconhecimento de
padres alcanado com a ANN. Uma desvantagem foi o uso de valores numricos para os dados
de entrada porque gerou resultados pouco precisos durante a aprendizagem automtica da rede.
Outra desvantagem foi o tempo necessrio para a aprendizagem automtica da rede estar con-
cluda contudo, ultrapassada esta fase, apenas foi necessrio um ciclo para detectar uma condio
especifica ou identificar um estado. No total, o nmero de pessoas que participaram no estudo
foi de 207 sendo 76 saudveis, 98 pacientes benignos e 33 pacientes malignos. No melhor, foi
obtida a percentagem de 68,97% para a sensibilidade, 80% para a especificidade e 61.94% para a
exatido.
Dois anos mais tarde surgiu outra publicao [5] com os mesmos objetivos. Contudo, neste
caso, foram usadas e comparadas as tcnicas nonparametric discriminant analysis (NDA), linear
discriminant analysis (LDA) e principal component analysis (PCA) com o intuito de reduzir as
variveis utilizadas. Para as variveis bsicas foram implementadas informaes dos histogramas
das ROI definidas, caractersticas baseadas na matriz de co-ocorrncia, no gradiente e na matriz
run-length. Todos estes dados foram provenientes de 30 pessoas saudveis e 30 doentes. Vrios
testes foram efetuados e portanto os resultados variam. No caso em que foram aplicadas apenas
informaes dos histogramas no foram obtidos resultados conclusivos devido necessidade im-
plcita da ANN em que a reduo de dados causa reduo da distncia multidimensional entre os
resultados da sada. Isto significa que a probabilidade de ocorrer erros na normalizao mais alta
e consequentemente a classificao poder ser incorreta.
Em 2008, o j referido autor pioneiro na introduo de ANN em MITI, fez nova publicao
[37] na tentativa de provar a fiabilidade da utilizao de ANN no diagnstico precoce do cancro
da mama. Neste caso, foram utilizados alguns mtodos bio estatsticos como o modelo mlti-
plo de regresso linear, radial basis function network (RBFN) e receiver operating characteristic
(ROC). O primeiro permite a correlao entre as variveis e o estado atual do paciente o que por
sua vez permite a correta seleo das caractersticas a serem usadas durante a fase de aprendiza-
gem (training epoch) que, comparativamente com a funo BP, apresenta uma poca mais rpida.
RBFN foi usado como funo de activao para determinar o resultado da classificao e, compa-
rativamente com a funo BP. Os resultados apresentam valores de 80.95%, 100% e 70.6% para,
respectivamente, a exatido, sensibilidade e especificidade. Estes resultados tm percentagens
mais elevadas do que o intervalo de exatido (de 60% a 70%) que foi obtido pela examinao
efetuada por radiologistas experientes.
No mesmo ano, o autor Papez realizou um artigo [38] com o objetivo de apresentar uma
melhoria no diagnstico de sndrome do tnel crpico (Carpal tunnel syndrome - CTS) com a
utilizao de redes neuronais artificiais para analisar as imagens termogrficas. No total, foram
recolhidos 112 termogramas que foram divididos em vrios conjuntos para serem utilizados em
diferentes combinaes para a fase de construo e fase de testes. Mais concretamente, os dados de
entrada utilizados na construo da rede foram constitudos por caractersticas numricas (valores
-
3.2 Redes Neuronais 29
de mdia da temperatura) e pela classe correspondente. Os resultados da classificao apresentam
uma taxa de sucesso de aproximadamente 80% sendo ainda indicada a possibilidade de o valor da
taxa ser superior se a quantidade de imagens utilizadas fosse maior para ampliar as possibilidades
de deteo da patologia.
Por este motivo, no ano a seguir, a mesma equipa publicou outro artigo[39], com o mesmo
problema e a mesma proposta mas, desta vez, foram recolhidas 502 imagens. Contudo os resulta-
dos obtidos neste caso com a classificao no apresentaram a melhoria esperada. Por outro lado,
foram identificados segmentos de imagens desnecessrios uma vez que, nos testes em que estes
eram descartados, a taxa de sucesso da classificao subia consideravelmente. Desta forma, os
autores concluram que a MITI no pode ser considerada uma ferramenta de deteo adequada
quando exigido um nvel de diagnstico severo.
Anos mais tarde, em 2015, no artigo de Koprowski [40], proposto um mtodo de anlise de
imagem para a avaliao da distribuio de temperatura ao longo das costas dos pacientes em que
foram recolhidas as imagens. O objetivo principal seria o de detetar anomalias que causam uma
postura defeituosa. Para a classificao dos parmetros recolhidos foram usados alguns classifi-
cadores, entre os quais ANN. Os resultados obtidos mostram que para ANN com a utilizao de
BP, 16 neurnios na camada invisvel e aprendizagem por cross validation obteve-se uma sensibi-
lidade e especificidade respetivamente de 75% e 89%. Contudo este no foi o classificador com
mais sucesso na avaliao. O classificador com o valor percentual de sucesso mais elevado nos
mesmos parmetros foi o SVM com 88% e 90% respetivamente.
No mesmo ano, um outro estudo[41] relaciona a utilizao de uma rede ANN em imagens
trmicas com o intuito de identificar pessoas em estado de embriaguez. Para se alcanar o objetivo
proposto fora adotadas duas abordagens. Na primeira, recorrendo a ANN, foram examinadas as
temperaturas por localizao em cada uma das diferentes imagens provenientes da mesma face
para todas as faces recolhidas, com isto, verificou-se que era nas imagens frontais da face onde se
verificava maior alterao no comportamento trmico com o consumo de lcool. Na segunda abor-
dagem adotada, uma rede neuronal de estrutura singular foi construda com as variveis bsicas
de construo provenientes de todas as localizaes da face, verificando-se uma performance al-
tamente discriminativa quando se aplicou a dados desconhecidos. Contudo, redes neuronais mais
pequenas apresentaram uma melhor performance generalizada (86% de exatido).
Por fim, o autor Saniei apresentou no seu artigo de 2016[42], uma nova abordagem para prever
uma estimativa do tamanho, profundidade e da taxa de gerao de calor metablico num tumor.
Essa nova abordagem composta por duas etapas: progressiva e inversa. Para a primeira etapa
foi necessrio criar um modelo de elemento finito e resolver a equao The Pennes bio-heat para
calcular a distribuio da temperatura na superfcie e em profundidade. Os valores calculados
obtidos foram aplicados para a construo de uma rede neuronal dinmica (DNN) e, a fim de asse-
gurar a correta construo da rede, os resultados desta aplicao confirmam os valores do modelo
de elemento finito. Na segunda etapa, a rede construda foi utilizada para estimar a distribuio
da temperatura em profundidade a partir do perfil de temperatura superfcie. De forma a evitar
que a rede criada fosse demasiado ajustada e a fim de se obter um sistema com um nvel de per-
-
30 Reviso do uso de classificadores em termografia
formance aceitvel, os autores consideraram como crucial a escolha do nmero de neurnios na
camada invisvel e das pocas necessrias, sendo que estes valores no eram dependentes entre
eles mas determinados de forma iterativa. Tendo em conta a relao existente entre as variveis
utilizadas, foram encontrados os valores de 0.84 e 0.71 para o tamanho e profundidade com o erro
absoluto de 0.31cm e 0.2cm respetivamente. Em nota final indicada a necessidade de recolha de
mais imagens para melhorias no sistema.
3.3 Redes Bayesianas
Uma rede Bayesiana (BN - Bayesian Network) um modelo de representao causal e proba-
bilstico e pode ser entendido como um grafo orientado e acclico. Na figura 3.4 est representado
um exemplo de um grafo com as especificaes referidas pelas redes Bayesianas, ou seja, os vr-
tices e as arestas representam, respetivamente, as variveis e as relaes de dependncia causal.
Deste modo, fica assegurado o mapeamento entre causa e efeito atravs de dependncias proba-
bilsticas. Desta forma, os sistemas baseados em redes Bayesianas tm a capacidade de gerar
previses automticas no caso de existir falta de informao nos dados existentes e, portanto, no
preciso um nmero elevado de elementos de construo.
Figura 3.4: Exemplo de um grafo orientado e acclico
O algoritmo de Naive Bayes (NB) que tem por base o clculo probabilstico do teorema de
Bayes com suposies de independncia entre as caractersticas. A frmula expressa pelo teorema
descrito apresentada na equao 3.6 que significa que a probabilidade da ocorrncia do evento A
sabendo que aconteceu o evento B corresponde diviso entre a probabilidade da interseco dos
eventos A e B com a probabilidade do evento B.
P(A|B) = P(A
B)P(B)
(3.6)
-
3.4 Support Vector Machine 31
Por outras palavras, o classificador de NB afirma que a presena de uma caracterstica parti-
cular numa classe no est diretamente relacionada com a presena de outra qualquer caraterstica
[43]. Uma vantagem deste classificador o facto de necessitar de poucos elementos de construo
para que seja possvel calcular os parmetros necessrios para a classificao.
Na prtica existem 3 casos conhecidos de aplicaes do NB em termografia para a classificao
em cancro da mama. Apesar de a exatido obtida ser mais baixa comparativamente com outros
classificadores, foi obtido um valor percentual de 71.86% num estudo de 2013[44]. Em outras
duas publicaes [45] e [43] est indicado que os valores de exatido obtidos com a aplicao de
NB foram cerca de 3% e 11%, respetivamente, a menos do que foi obtido no caso da aplicao de
SVM.
3.4 Support Vector Machine
3.4.1 Definio
O conceito de mquina de vectores de suporte (Support Vector Machine - SVM) aplicado a
um conjunto de mtodos de classificao que analisam dados e reconhecem padres. Este proce-
dimento de aprendizagem automtica construtiva baseado no princpio de minimizao do risco
estrutural, ou seja, pretende minimizar os limites de erro criados pela mquina de aprendizagem
automtica durante a fase de construo.
De uma forma geral, um classificador SVM produz resultados lineares binrios, ou seja, ana-
lisa um conjunto de dados iniciais e atribui-os a uma de duas categorias possveis. Normalmente,
este algoritmo funciona bem quando aplicado a novos dados. Isto acontece porque os dados que
foram aplicados durante a fase de construo so, de um modo geral, os mais difceis de classi-
ficar, ou seja, implica que os mtodos que optem por utilizar esta tcnica tenham capacidade de
superar os mtodos concorrentes em muitas aplicaes.
Como modelo de representao, o SVM utiliza um mapeamento de pontos no espao, sendo
que, existe no espao de representao um hiperplano que separa as duas classes. Deste modo
os pontos so distribudos no espao de acordo com a classe pertencente. Na figura 3.5 pode-se
visualizar um exemplo.
Neste exemplo, pode-se visualizar a classificao dos dados, a definio do hiperplano e da
margem de separao. Os dados iniciais foram divididos em duas classes, sendo que os dados
foram representados por quadrados e crculos sendo que cada uma destas representaes remete
para uma classe distinta. O hiperplano criado encontra-se otimizado de modo a que a margem de
separao resultante seja maximizada.
Neste sentido, um algoritmo de SVM tem como objetivo definir o hiperplano do modelo de
representao e pretende maximizar a distncia existente entre os pontos de classes diferentes.
Para a converso dos dados iniciais input data em pontos no espao normalmente utilizado
funes do tipo nonlinear kernel. Deste modo, os dados convertidos so apresentados de forma
mais distante do que se fossem utilizados dados no convertidos.
-
32 Reviso do uso de classificadores em termografia
Figura 3.5: Exemplo da representao de um SVM.
3.4.2 Utilizao na termografia
Em 2012, na publicao de Archarya e restantes autores[46], o objetivo foi o de avaliar a
viabilidade do uso da classificao em termografia no diagnstico do cancro da mama. Atravs de
matrizes run length e co-occurence foram obtidas caractersticas da textura. Aps o processo de
normalizao pretendia-se realizar a classificao com aplicao do SVM que foi escolhido com a
justificao de que tinham sido obtida boa performance em estudos anteriores de reconhecimento
de padres. Na implementao foi adotado o mtodo (Tree-fold stratified cross validation method),
e por isso, os dados foram divididos em 3 conjuntos. Para a fase de aprendizagem do SVM criado,
foram criados e utilizados combinaes de dois dos conjuntos de elementos existentes. O conjunto
restante de cada combinao foi utilizado para teste. Como resultados, nesta publicao foram
apresentados uma ex