classificaÇÃo de ritmos cardÍacos em tempo real …

172
UNIVERSIDADE ESTADUAL DO OESTE DO PARANÁ CAMPUS DE FOZ DO IGUAÇU PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA E COMPUTAÇÃO DISSERTAÇÃO DE MESTRADO CLASSIFICAÇÃO DE RITMOS CARDÍACOS EM TEMPO REAL APLICANDO TECNOLOGIAS EMBARCADAS LUCAS GUILHERME HÜBNER FOZ DO IGUAÇU 2020

Upload: others

Post on 08-Jan-2022

1 views

Category:

Documents


0 download

TRANSCRIPT

UNIVERSIDADE ESTADUAL DO OESTE DO PARANÁ

CAMPUS DE FOZ DO IGUAÇU

PROGRAMA DE PÓS-GRADUAÇÃO EMENGENHARIA ELÉTRICA E COMPUTAÇÃO

DISSERTAÇÃO DE MESTRADO

CLASSIFICAÇÃO DE RITMOS CARDÍACOS EM TEMPOREAL APLICANDO TECNOLOGIAS EMBARCADAS

LUCAS GUILHERME HÜBNER

FOZ DO IGUAÇU2020

Lucas Guilherme Hübner

Classificação de Ritmos Cardíacos em Tempo Real AplicandoTecnologias Embarcadas

Dissertação de Mestrado apresentada ao Programa dePós-Graduação em Engenharia Elétrica e Computa-ção como parte dos requisitos para obtenção do tí-tulo de Mestre em Engenharia Elétrica e Computa-ção. Área de concentração: Sistemas Dinâmicos eEnergéticos.

Orientador: Profa. Dr.a Adriana Kauati

Foz do Iguaçu2020

ii

Ficha de identificação da obra elaborada através do Formulário de Geração Automática do Sistema de Bibliotecas da Unioeste.

Hübner, Lucas GuilhermeCLASSIFICAÇÃO DE RITMOS CARDÍACOS EM TEMPO REAL

APLICANDO TECNOLOGIAS EMBARCADAS / Lucas Guilherme Hübner;orientador(a), Adriana Kauati, 2020.

172 f.

Dissertação (mestrado), Universidade Estadual do Oestedo Paraná, Centro de Engenharias e Ciências Exatas,Programa de Pós-Graduação em Engenharia Elétrica eComputação, 2020.

1. Eletrocardiograma. 2. Processamento de Sinais. 3.Arritmias. 4. Monitoração. I. Kauati, Adriana. II. Título.

iii

iv

Resumo

O processo de envelhecimento faz mudanças na estrutura cardiovascular, aumentandoassim o risco de doenças cardiovasculares e tornando as pessoas cada vez menos independentese mais vulneráveis. O Instituto Nacional do Seguro Social aponta que todo ano surgem cercade 250 mil novos casos de Acidente Vascular Cerebral no Brasil, sendo que aproximadamente40% dos pedidos de aposentadoria decorrem de derrames e infartos.

Doenças cardíacas são uma das causas mais proeminentes de morte no mundo inteiro e amaioria dos casos de morte súbita ocorre sem sintomas prévios, já algumas arritmias não letaiscomo extrassístoles ventriculares, precedem outras diretamente relacionadas à morte súbita.Neste sentido, convém monitorar no dia a dia os indivíduos com alto risco, não hospitalizados.

Além disso, considerando o envelhecimento da população e aumento de pessoas que mo-ram sozinhas, é importante que sistemas de monitoramento remoto de vários tipos de sinaisbiomédicos. Por este motivo está sendo desenvolvido na, UNIOESTE, pesquisas visando umSistema de Monitoramento do Corpo Humano em tempo real, que auxilie no monitoramento depacientes idosos ou com risco cardíaco.

Assim, este trabalho se insere no Sistema de Monitoramento do Corpo Humano e o prin-cipal objetivo é a implementação de um método de classificação de arritmias cardíacas para soaralarmes a serem enviados a um hospital, médico e/ou responsável.

Para a escolha do classificador foram comparados o desempenho de diversas abordagens,como calculo de entropia, dimensão fractal e medidas estatísticas utilizando o banco de dadosMIT-BIH Arrhythmia Database. Os algoritmos testados foram: Random Forests, J48 e Multi-layer Perceptron, tendo o Random Forests obtido o melhor desempenho.

Palavras-chave: Eletrocardiograma, Processamento de Sinais, Arritmias, Monitoração.

v

Abstract

The aging process makes changes in the cardiovascular structure, increasing the risk ofcardiovascular diseases and making people more dependent and vulnerable. The National Insti-tute of Social Security points out that every year around 250 thousand new cases of stroke occurin Brazil, with approximately 40 % of retirement requests because of strokes and heart attacks.

Heart disease is one of the most prominent causes of death in the world. Most casesof sudden death occur without previous symptoms, while some non-lethal arrhythmias suchas ventricular extrasystoles precede others directly related to sudden death. In this sense, it isadvisable to monitor individuals at high risk on a daily basis who are not hospitalized.

In addition, considering the aging of the population and the increase in the number of pe-ople living alone, it is important that remote monitoring systems for various types of biomedicalsignals. For this reason a Monitoring System of the Human Body, to work in real time, is beingdeveloped at UNIOESTE to helps the monitoring of elderly patients or with cardiac risk.

This work is part of the Monitoring System of the Human Body and The main objectiveis to implement a method for classifying QRS complexes and send alarms to a hospital, doctorand / or guardian. The classifier was chosen comparing 3 methods using the same database.

To choose the classifier, we used several approaches, including entropy, fractal dimensionand statistical measurements using the same database comparing the performance obtained oneach approach. The algorithms tested were: J48, Multilayer Perceptron and Random Forests.

Keywords: Electrocardiogram, Signal Processing, Arrhythmia, Monitoring.

vi

vii

Dedico este trabalho a todos.E a tudo.

viii

Agradecimentos

Primeiramente gostaria de agradecer a todos meus amigos e colegas que contribuíram demaneira direta ou indireta na realização deste trabalho e principalmente a minha orientadoraAdriana Kauati pela paciência e ajuda.

ix

x

Sumário

Lista de Figuras xvii

Lista de Tabelas xix

1 Introdução 1

1.1 Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

1.1.1 Objetivo Geral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

1.1.2 Objetivos Específicos . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

1.2 Organização do Trabalho . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

2 Revisão Bibliográfica 5

2.1 O Coração (Guyton et al., 2011) . . . . . . . . . . . . . . . . . . . . . . . . . 5

2.2 O Eletrocardiograma (Pastore et al., 2009) . . . . . . . . . . . . . . . . . . . . 6

2.3 Arritmias Cardíacas (Pastore et al., 2009) . . . . . . . . . . . . . . . . . . . . 10

2.3.1 Considerações Iniciais . . . . . . . . . . . . . . . . . . . . . . . . . . 10

2.3.2 Bloqueios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

2.3.2.1 Bloqueio de Ramo Direito (RBBB - Right Bundle BranchBlock) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

2.3.2.2 Bloqueio de Ramo Esquerdo ( LBBB - Left Bundle BranchBlock) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

2.3.3 Extrassístole . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

2.3.3.1 Contração Atrial Prematura (APC - Atrial Premature Con-traction) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

2.3.3.2 Contração Atrial Prematura Aberrante (ABERR - AberratedAtrial Premature Contraction) . . . . . . . . . . . . . . . . 15

2.3.3.3 Contração Juncional/Nodal Prematura (NPC - Nodal (juncti-onal) Premature Contraction) . . . . . . . . . . . . . . . . . 16

2.3.3.4 Contração Ventricular Prematura (PVC - Premature Ventri-cular Contraction) . . . . . . . . . . . . . . . . . . . . . . . 16

2.3.4 Escapes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

2.3.4.1 Batimento de Escape Juncional (NESC - Nodal Escape Con-traction) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

xi

xii

2.3.4.2 Batimento com Escape Ventricular (VESC - Ventricular Es-cape Contraction) . . . . . . . . . . . . . . . . . . . . . . . 19

2.3.5 Fusão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

2.3.5.1 Batimento de Fusão (FUSION - Fusion of Ventricular andNormal Beat ) . . . . . . . . . . . . . . . . . . . . . . . . . 19

2.3.6 Flutter e Fibrilações . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

2.3.6.1 Flutter Ventricular (FLWAV - Ventricular Flutter Wave) . . . 20

2.4 Trabalhos Relacionados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

3 Fundamentação Teórica 29

3.1 Séries Temporais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

3.2 Mineração de Dados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

3.3 Aprendizado de Máquina . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

3.3.1 Classificadores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

3.3.2 Erro da Classe Majoritária . . . . . . . . . . . . . . . . . . . . . . . . 31

3.3.3 Erro Aparente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

3.3.4 Erro Verdadeiro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32

3.3.5 Sensibilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32

3.3.6 Precisão ou Valor Positivo Preditivo . . . . . . . . . . . . . . . . . . . 32

3.3.7 Redes Neurais Artificiais . . . . . . . . . . . . . . . . . . . . . . . . . 32

3.3.7.1 Neurônio Artificial . . . . . . . . . . . . . . . . . . . . . . . 33

3.3.7.2 Perceptron . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

3.3.7.3 Rede Neural Multilayer Perceptron . . . . . . . . . . . . . . 34

3.3.7.4 Backpropagation . . . . . . . . . . . . . . . . . . . . . . . . 35

3.3.8 Árvore de Decisão . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

3.4 Geometria Fractal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

3.4.1 Katz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

3.4.2 Box Counting . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

3.4.3 Hallwood . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

3.4.4 Estimadores Baseados em Variância . . . . . . . . . . . . . . . . . . . 38

3.4.5 Estimadores Espectrais e Wavelets . . . . . . . . . . . . . . . . . . . . 38

3.5 Entropia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

3.5.1 Entropia Empírica . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39

3.5.2 Entropia de Shannon com Correção de Miller-Madow . . . . . . . . . 39

4 Material e Métodos 41

xiii

4.1 Contextualização . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

4.2 O Banco de Dados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

4.3 Detecção do Complexo QRS . . . . . . . . . . . . . . . . . . . . . . . . . . . 42

4.3.1 Pan & Tompkins (1985) . . . . . . . . . . . . . . . . . . . . . . . . . 43

4.3.2 Chen & Chen (2003) . . . . . . . . . . . . . . . . . . . . . . . . . . . 45

4.4 Processamento dos Sinais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46

4.4.1 Normalizações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46

4.4.1.1 Normalização de Offset . . . . . . . . . . . . . . . . . . . . 47

4.4.1.2 Normalização de Amplitude: Origin . . . . . . . . . . . . . 47

4.4.1.3 Normalização de Escala: Zero Axis . . . . . . . . . . . . . . 48

4.4.2 Filtragem do Sinal . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50

4.4.3 Segmentação do Sinal . . . . . . . . . . . . . . . . . . . . . . . . . . 52

4.4.4 Normalização . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52

4.4.5 Medidas de Complexidade . . . . . . . . . . . . . . . . . . . . . . . . 55

4.5 Algoritmos de Classificação . . . . . . . . . . . . . . . . . . . . . . . . . . . 57

4.5.1 Árvore de Decisão J48 . . . . . . . . . . . . . . . . . . . . . . . . . . 58

4.5.2 Random Forests . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59

4.5.3 Multilayer Perceptron . . . . . . . . . . . . . . . . . . . . . . . . . . 60

4.6 Algoritmos de Validação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61

4.6.1 k-Fold Stratified Cross Validation . . . . . . . . . . . . . . . . . . . . 61

4.7 Hardware . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62

4.7.1 Hardware do Classificador . . . . . . . . . . . . . . . . . . . . . . . . 62

4.7.2 Hardware do Simulador . . . . . . . . . . . . . . . . . . . . . . . . . 63

4.7.3 System On Chip - ESP32 . . . . . . . . . . . . . . . . . . . . . . . . . 66

4.7.4 Single Lead Heart Rate Monitor - AD8232 . . . . . . . . . . . . . . . 67

4.7.5 Conversor Digital Analógico - MCP4725 . . . . . . . . . . . . . . . . 67

4.8 Avaliação do Modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68

5 Resultados 69

5.1 Resultados para J48 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70

5.1.1 Resultados para J48 Medidas de Complexidade . . . . . . . . . . . . . 70

5.1.2 Resultados para J48 Série Temporal . . . . . . . . . . . . . . . . . . . 72

5.2 Resultados para MLP . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73

5.2.1 Resultados para MLP Medidas de Complexidade . . . . . . . . . . . . 73

5.2.2 Resultados para MLP Séries Temporais . . . . . . . . . . . . . . . . . 74

xiv

5.3 Resultados para RF . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75

5.3.1 Resultados para RF Medidas de Complexidade . . . . . . . . . . . . . 75

5.3.2 Resultados para RF Séries Temporais . . . . . . . . . . . . . . . . . . 76

5.4 Acerto por Classe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77

5.5 Resumo dos Resultados para RF e ST . . . . . . . . . . . . . . . . . . . . . . 90

5.6 Resultados para RF Híbrido . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90

5.7 Classificação para Alarmes . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92

5.7.1 Resultados para o Classificador de Alarmes . . . . . . . . . . . . . . . 92

6 Discussão 93

6.1 Resultados Iniciais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93

6.1.1 J48 Medidas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93

6.1.2 J48 ST . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94

6.1.3 MLP Medidas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95

6.1.4 MLP ST . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95

6.1.5 RF Medidas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96

6.1.6 RF ST . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96

6.2 Resultados Por Classe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96

6.2.1 NORMAL . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96

6.2.2 LBBB . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96

6.2.3 RBBB . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97

6.2.4 ABERR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97

6.2.5 PVC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97

6.2.6 FUSION . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97

6.2.7 NPC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98

6.2.8 APC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98

6.2.9 VESC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98

6.2.10 NESC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99

6.2.11 FLWAV . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99

6.2.12 NAPC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99

6.2.13 Considerações Gerais . . . . . . . . . . . . . . . . . . . . . . . . . . . 100

6.3 Literatura e Estado da Arte . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100

6.3.1 RF Hibrido . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101

6.3.2 Modelo para a classificação em Alarmes . . . . . . . . . . . . . . . . . 102

xv

7 Conclusão 105

7.1 Classificação Mediante Medidas de Complexidade . . . . . . . . . . . . . . . 105

7.2 Algoritmos de Aprendizado de Máquina . . . . . . . . . . . . . . . . . . . . . 105

7.3 Trabalho Futuros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106

Referências Bibliográficas 109

Appendices 115

A Saída do Weka para Testes Iniciais de Normalização Sem Normalização 117

B Saída do Weka para Testes Iniciais de Normalização Origin 119

C Saída do Weka para Testes Iniciais de Normalização Offset 121

D Saída do Weka para Testes Iniciais de Normalização Zero Axis 123

E Saída do Weka para Testes Iniciais de Normalização Sem Normalização e FiltroPassa Baixa 125

F Saída do Weka para Testes Iniciais de Normalização Origin e Filtro Passa Baixa 127

G Saída do Weka para Testes Iniciais de Normalização Offset e Filtro Passa Baixa 129

H Saída do Weka para Testes Iniciais de Normalização Zero Axis e Filtro Passa Baixa131

I Saida do Weka para Testes Iniciais de Normalização Sem Normalização e FiltroPassa Alta 133

J Saída do Weka para Testes Iniciais de Normalização Origin e Filtro Passa Alta 135

K Saída do Weka para Testes Iniciais de Normalização Offset e Filtro Passa Alta 137

L Saída do Weka para Testes Iniciais de Normalização Zero Axis e Filtro Passa Alta 139

M Saída do Weka para Testes Iniciais de Normalização Sem Normalização e FiltroPassa Banda 141

N Saída do Weka para Testes Iniciais de Normalização Origin e Filtro Passa Banda 143

O Saída do Weka para Testes Iniciais de Normalização Offset e Filtro Passa Banda 145

P Saída do Weka para Testes Iniciais de Normalização Zero Axis e Filtro Passa

xvi

Banda 147

Lista de Figuras

Figura 2.1: O Coração Humano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

Figura 2.2: Processo de batimento no ECG . . . . . . . . . . . . . . . . . . . . . . . 7

Figura 2.3: Derivações do ECG . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

Figura 2.4: Triângulo de Einthoven . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

Figura 2.5: Trecho de ECG do MIT-BIH Arrhythmia Database com Bloqueio de RamoDireito . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

Figura 2.6: Trecho de ECG do MIT-BIH Arrhythmia Database com Bloqueio de RamoEsquerdo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

Figura 2.7: Trecho de ECG do MIT-BIH Arrhythmia Database com Contração AtrialPrematura . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

Figura 2.8: Trecho de ECG do MIT-BIH Arrhythmia Database com Contração AtrialPrematura Aberrante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

Figura 2.9: Trecho de ECG do MIT-BIH Arrhythmia Database com Contração Junci-onal Prematura . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

Figura 2.10: Trecho de ECG do MIT-BIH Arrhythmia Database com Contração Ventri-cular Prematura . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

Figura 2.11: Trecho de ECG do MIT-BIH Arrhythmia Database com Batimento de Es-cape Juncional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

Figura 2.12: Trecho de ECG do MIT-BIH Arrhythmia Database com Batimento de Es-cape Ventricular . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

Figura 2.13: Trecho de ECG do MIT-BIH Arrhythmia Database com fusão de batimentonormal com ventricular . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

Figura 2.14: Trecho de ECG do MIT-BIH Arrhythmia Database com Flutter Ventricular 21

Figura 3.1: Representação de um neurônio artificial. . . . . . . . . . . . . . . . . . . 33

Figura 3.2: Representação de uma MLP feedforward. . . . . . . . . . . . . . . . . . 34

Figura 4.1: Processo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42

Figura 4.2: Sinal original . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44

Figura 4.3: Sinal após filtragem passa baixa . . . . . . . . . . . . . . . . . . . . . . . 45

Figura 4.4: Sinal após filtragem passa alta . . . . . . . . . . . . . . . . . . . . . . . . 46

Figura 4.5: Sinal após filtro derivativo . . . . . . . . . . . . . . . . . . . . . . . . . . 47

Figura 4.6: Sinal após ser elevado ao quadrado . . . . . . . . . . . . . . . . . . . . . 48

Figura 4.7: Sinal após integração . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

xvii

xviii

Figura 4.8: Normalização Offset . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

Figura 4.9: Normalização Origin . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50

Figura 4.10: Normalização Zero Axis . . . . . . . . . . . . . . . . . . . . . . . . . . . 50

Figura 4.11: Sinal Original do Banco de Dados. . . . . . . . . . . . . . . . . . . . . . 51

Figura 4.12: Sinal do Banco de Dados Filtrado com Passa Banda. . . . . . . . . . . . . 52

Figura 4.13: Batimento Extraido . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

Figura 4.14: Batimento Extraído e Normalizado . . . . . . . . . . . . . . . . . . . . . 54

Figura 4.15: Stratified Cross Validation (SCV) . . . . . . . . . . . . . . . . . . . . . . 62

Figura 4.16: Proposta de Hardware para Captura. . . . . . . . . . . . . . . . . . . . . 63

Figura 4.17: Proposta de Simulador . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64

Figura 4.18: Esquemático do Simulador . . . . . . . . . . . . . . . . . . . . . . . . . 66

Figura 4.19: Captura ECG de um batimento normal . . . . . . . . . . . . . . . . . . . 67

Figura 5.1: VSE por classe, para J48 Medidas . . . . . . . . . . . . . . . . . . . . . 71

Figura 5.2: VSE por classe, para J48 ST . . . . . . . . . . . . . . . . . . . . . . . . . 72

Figura 5.3: VSE por classe, para MLP ST . . . . . . . . . . . . . . . . . . . . . . . . 73

Figura 5.4: VSE por classe, para MLP ST . . . . . . . . . . . . . . . . . . . . . . . . 74

Figura 5.5: VSE por classe, para RF Medidas . . . . . . . . . . . . . . . . . . . . . . 75

Figura 5.6: VSE por classe, para RF ST . . . . . . . . . . . . . . . . . . . . . . . . . 76

Figura 5.7: Percentual de acerto da classe NORMAL para as diferentes abordagens . . 78

Figura 5.8: Percentual de acerto da classe LBBB para as diferentes abordagens . . . . 79

Figura 5.9: Percentual de acerto da classe RBBB para as diferentes abordagens . . . . 80

Figura 5.10: Percentual de acerto da classe ABERR para as diferentes abordagens . . . 81

Figura 5.11: Percentual de acerto da classe PVC para as diferentes abordagens . . . . . 82

Figura 5.12: Percentual de acerto da classe FUSION para as diferentes abordagens . . . 83

Figura 5.13: Percentual de acerto da classe NPC para as diferentes abordagens . . . . . 84

Figura 5.14: Percentual de acerto da classe APC para as diferentes abordagens . . . . . 85

Figura 5.15: Percentual de acerto da classe VESC para as diferentes abordagens . . . . 86

Figura 5.16: Percentual de acerto da classe NESC para as diferentes abordagens . . . . 87

Figura 5.17: Percentual de acerto da classe FLWAV para as diferentes abordagens . . . 88

Figura 5.18: Percentual de acerto da classe NAPC para as diferentes abordagens . . . . 89

Figura 5.19: VSE por classe para RF Híbrido . . . . . . . . . . . . . . . . . . . . . . 91

Lista de Tabelas

Tabela 2.1: Resultados Detectores . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

Tabela 2.2: Matriz de Confusão de Nadal (1991) . . . . . . . . . . . . . . . . . . . . 23

Tabela 2.3: Matriz de Confusão de Bossan (1994) . . . . . . . . . . . . . . . . . . . . 24

Tabela 2.4: Resultados de Sensibilidade e Valor Positivo Preditivo de Bossan (1994) . 24

Tabela 2.5: Valores de Sensibilidade e Valor Positivo Preditivo de Kauati & Nadal(1997) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24

Tabela 2.6: Valores de Sensibilidade e Valor Positivo Preditivo de Rodriguez et al.(2005) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

Tabela 2.7: Valores de Sensibilidade e Preditivo Positivo de Hu et al. (2012) . . . . . . 26

Tabela 2.8: Resultados de Gutiérrez-Gnecchi et al. (2017) . . . . . . . . . . . . . . . 26

Tabela 2.9: Resultados para Random Forests de Mykoliuk et al. (2018) . . . . . . . . 27

Tabela 2.10: Resultados para Redes Neurais de Mykoliuk et al. (2018) . . . . . . . . . 27

Tabela 4.1: Complexos QRS extraídos do Banco de Dados . . . . . . . . . . . . . . . 54

Tabela 4.2: Medidas de dimensão fractal utilizadas . . . . . . . . . . . . . . . . . . . 55

Tabela 5.1: VSE e VPP, por classe, para abordagem J48 Medidas . . . . . . . . . . . . 71

Tabela 5.2: VSE e VPP, por classe, para abordagem J48 ST . . . . . . . . . . . . . . . 72

Tabela 5.3: VSE e VPP, por classe, para abordagem MLP Medidas . . . . . . . . . . . 73

Tabela 5.4: VSE e VPP, por classe, para abordagem MLP ST . . . . . . . . . . . . . . 74

Tabela 5.5: VSE e VPP para abordagem RF Medidas . . . . . . . . . . . . . . . . . . 75

Tabela 5.6: VSE e VPP para abordagem RF ST . . . . . . . . . . . . . . . . . . . . . 76

Tabela 5.7: VSE e VPP para classe NORMAL . . . . . . . . . . . . . . . . . . . . . 78

Tabela 5.8: VSE e VPP para classe LBBB . . . . . . . . . . . . . . . . . . . . . . . . 79

Tabela 5.9: VSE e VPP para classe RBBB para as diferentes abordagens . . . . . . . . 80

Tabela 5.10: VSE e VPP para classe ABERR para as diferentes abordagens . . . . . . . 81

Tabela 5.11: VSE e VPP para classe PVC . . . . . . . . . . . . . . . . . . . . . . . . . 82

Tabela 5.12: VSE e VPP para classe FUSION . . . . . . . . . . . . . . . . . . . . . . 83

Tabela 5.13: VSE e VPP para classe NPC . . . . . . . . . . . . . . . . . . . . . . . . . 84

Tabela 5.14: VSE e VPP para classe APC . . . . . . . . . . . . . . . . . . . . . . . . . 85

Tabela 5.15: VSE e VPP para classe VESC . . . . . . . . . . . . . . . . . . . . . . . . 86

Tabela 5.16: VSE e VPP para classe NESC . . . . . . . . . . . . . . . . . . . . . . . . 87

xix

xx

Tabela 5.17: VSE e VPP para classe FLWAV . . . . . . . . . . . . . . . . . . . . . . . 88

Tabela 5.18: VSE e VPP para classe NAPC . . . . . . . . . . . . . . . . . . . . . . . . 89

Tabela 5.19: Resumo dos resultados em VSE . . . . . . . . . . . . . . . . . . . . . . . 90

Tabela 5.20: Resumo dos resultados em VPP . . . . . . . . . . . . . . . . . . . . . . . 90

Tabela 5.21: Resultados de VSE e VPP por classe para abordagem RF Hibrido . . . . . 91

Tabela 5.22: Resultados para a classificação de Alarmes. . . . . . . . . . . . . . . . . . 92

Tabela 6.1: Comparação de resultados com literatura . . . . . . . . . . . . . . . . . . 101

Lista de Símbolos

PGEEC Programa de Pós-Graduação em Engenharia Elétrica e ComputaçãoUNIOESTE Universidade Estadual do Oeste do ParanáAPC Atrial Premature ContractionPVC Premature Ventricular ContractionPACE Paced BeatPFUS Fusion of Paced and Normal BeatNAPC Nodal (junctional) Premature ContractionFUSION Fusion of Ventricular and Normal BeatNESC Nodal (junctional) Escape ContractionLBBB Left Bundle Branch Block BeatABERR Aberrated Atrial Premature ContractionNPC Nodal (junctional) Premature BeatRBBB Right Bundle Branch Block BeatFLWAV Ventricular Flutter WaveVESC Ventricular Escape ContractionAESC Atrial Escape BeatST Serie TemporalAM Aprendizado de MáquinaIA Inteligencia ArtificialINSS Instituto Nacional de Seguro SocialAVC Acidente Vascular CerebralECG EletrocardiogramaMS Morte SúbitaAV Átrio-VentricularPCA Principal component analisysVPP Valor Preditivo PositivoSVPB Supraventicularpremature BeatMAV Mean Absolute ValueRMS Root Mean SquareSVM Suport vector machineRBF Radial Basis FunctionMD Mineração de DadosKDD Knowledge Discovery and Data Mining

xxi

xxii

ECM Erro da Classe MajoritáriaRNA Redes Neurais ArtificiaisMLP Multilayer PerceptronMIT Massachussetts Institute of TechnologyADC Analog Digital ConverterDAC Digital Analógico ConverterAPI Application programming InterfaceSVC Stratified Cross ValidationCI Circuito IntegradoSMCH Sistema de Monitoramento do Corpo HumanoVSE Valor de Sensibilidade

Capítulo 1

Introdução

Com o processo de envelhecimento, as pessoas vão se tornando cada vez menos indepen-dentes e mais vulneráveis. Segundo Lakatta & Levy (2003), este processo estimula mudançasna estrutura cardiovascular, aumentando assim o risco de doenças cardiovasculares. O InstitutoNacional do Seguro Social (INSS) aponta que todo ano surgem cerca de 250 mil novos casosde Acidente Vascular Cerebral (AVC) no Brasil, sendo que aproximadamente 40% dos pedidosde aposentadoria decorrem de derrames e infartos (Biolo et al., 2006).

Doenças cardíacas são uma das causas mais proeminentes de morte no mundo inteiro, umdiagnóstico precoce é de extrema importância para prevenir que ataques cardíacos se tornemfatais, sendo uma das técnicas utilizadas para o diagnóstico o Eletrocardiograma (ECG) (Gifariet al., 2015).

A maioria dos casos de Morte Súbita (MS) ocorre sem sintomas prévios (Martinelli et al.,2012), já algumas arritmias não letais, como extrassístoles ventriculares, precedem outras dire-tamente relacionadas à MS. Neste sentido, convém o tratamento preditivo e correto diagnóstico,portanto a detecção precoce das doenças ou anormalidades pode ajudar o paciente a prolongare manter sua qualidade de vida caso o tratamento adequado seja utilizado.

Atualmente a monitorização fora do ambiente hospitalar vem ganhando campo, esta abor-dagem é de interesse de pesquisadores há muito tempo e, com os avanços da tecnologia e co-municação wireless esta abordagem torna-se possível e cada vez mais fácil. A aquisição devariáveis fisiológicas e psicológicas em condições do dia a dia pode ser especialmente útil paradetectar problemas crônicos e problemas de saúde (Korhonen et al., 2003).

Devido às melhores condições de vida atualmente, a população está envelhecendo mais.Entretanto idosos normalmente estão limitados em diversas aspectos, tanto fisiológicos quantopsicológicos, atividades diárias básicas tornam-se problemáticas exigindo cuidados contínuos(Liu et al., 2016).

Com o intuito de auxiliar no diagnóstico precoce de problemas, diversos trabalhos como(Chan et al., 2013), (Fensli et al., 2005), (Rotariu & Manta, 2012) procuram ajudar estas pes-soas propondo uma arquitetura de captura e armazenamento de dados para posterior avaliaçãomédica, o que auxilia no diagnóstico precoce. Entretanto estas arquiteturas ainda necessitam deum especialista realizando diagnósticos todos os dias, ou não se aplicam para monitoramento

1

2

em tempo real. Esse processo manual é inviável, pois requer vigilância constante e cuidadosa,sendo prejudicado devido a fadiga ou desatenção do observador (Nadal, 1991).

Vanzella (2018) desenvolveu um sistema web para monitoramento remoto de pacientes,responsável por integrar alarmes provindos de um dispositivo que realiza detecção de quedas emonitoramento da frequência cardíaca. A comunicação de hardware com o sistema é feita pormeio do protocolo Message Queuing Telemetry Transport (MQTT)(OASIS, 2014).

O hardware é composto pelo microcontrolador ESP8266, que possui Wi-Fi embutido,para o monitoramento do frequência cardíaca o módulo AD8232 (Ana, 2018) é utilizado emconjunto com o algoritmo de detecção de QRS (Cai et al., 2003), para a detecção de quedas foiutilizada a placa GY-89 (KAT, 2018).

O Sistema desenvolvido por Vanzella (2018) denominado Sistema de Monitoramento doCorpo Humano (SMCH) é um sistema web desenvolvido para fazer a interface entre o hardware,paciente e responsáveis. Suas funcionalidades incluem:

• Manter usuários: cadastrar, editar, remover e buscar usuários. Todos os pacientes assimcomo os responsáveis pelos pacientes devem ser cadastrados como usuários.

• Associar um responsável: após cadastrar o paciente e o responsável, o administrador dosistema pode realizar a associação entre os dois.

• Manter dispositivos: cadastrar, editar, remover e buscar dispositivos. Cada paciente temum ou mais dispositivos, sendo estes os responsáveis por enviar alertas para o sistema.

• Associar o usuário ao dispositivo: após cadastrar o dispositivo no sistema, o administradorpode associar o paciente ao dispositivo. Essa configuração é necessária pois o dispositivoapenas envia alertas e não existe nenhuma identificação do usuário no alerta.

• Reconhecer alertas: após resolver o alerta, o administrador pode reconhecer esse alerta.Ao reconhecer um alerta, o mesmo não estará mais disponível para visualização.

• Visualizar alertas: o administrador do sistema pode visualizar todos os alertas ocorridos,de todos os pacientes.

Este trabalho propõe a integração da detecção de arritmias cardíacas a esse sistema, tor-nando possível enviar alarmes para os cuidadores.

Devido a característica do sistema, é possível que sejam cadastrados diferentes disposi-tivos sem a necessidade de alteração de códigos do sistema, sendo assim, o hardware poderáutilizar o protocolo MQTT para se comunicar com o sistema, assim, enviando mensagens parauma fila onde cada responsável associado ao paciente recebe um alerta em caso de problemascom o paciente.

Neste sentido, nesta dissertação comparam-se diversas abordagens de classificadores dearritmias cardíacas, visando escolher o de melhor desempenho possível para ser implementado

3

no microcontrolador, para futuramente ser integrado ao SMCH, ampliando ainda mais sua usa-bilidade.

1.1 Objetivos

1.1.1 Objetivo Geral

O principal objetivo deste trabalho é a comparação de métodos de classificação de arrit-mias cardíacas, para escolha da melhor opção para utilização em um sistema de monitoramentoem tempo-real.

1.1.2 Objetivos Específicos

Os objetivos específicos deste trabalho são listados a seguir:

• Comparação do desempenho dos métodos de classificação de ritmos cardíacos utilizandouma mesma base de dados;

• Estudo sobre o ECG e arritmias cardíacas;

• Propor um algoritmo para implementação em um microcontrolador;

• Propor uma arquitetura de simulador de ECG a partir do banco de dados;

• Construção dos protótipos de um dispositivo para monitorar pessoas de risco cardíacocom função de alarmes a serem enviados a médicos e responsáveis em caso de emergên-cia.

1.2 Organização do Trabalho

Este trabalho está estruturado na seguinte ordem:

• Revisão Bibliográfica: Contém um resumo sobre coração e eletrocardiograma, seguidodas principais arritmias cardíacas. O capítulo segue apresentando a revisão bibliográficasobre detectores de QRS, classificadores de QRS e de arritmias cardíacas, além de siste-mas de monitorização de sinais biomédicos, em tempo-real, fora do ambiente hospitalar.

• Fundamentação Teórica: Neste capítulo serão explicados o significado de séries tem-porais e mineração de dados, além de aprendizado de máquinas. Conceitos de geometriafractal e entropia, utilizados neste trabalho, também estão neste capítulo.

4

• Material e Métodos: Explicações sobre o banco de dados, o detector de QRS e os algo-ritmos de classificação testados estão neste capítulo. Além dos algoritmos de validação,o processo de segmentação de dados e o hardware desenvolvido. Ao final deste capítulo éapresentado o sistema completo de monitoramento de corpo humano, no qual o trabalhodesta dissertação se insere.

• Resultados: Este capítulo apresenta os resultados para cada classificador de complexosQRS e de arritmias testados, bem como o resultado do algoritmo implementado no mi-crocontrolador e testado com o simulador de ECG.

• Discussão e Conclusões: Finaliza-se a dissertação apresentando a discussão e as con-clusões sobre os resultados apresentados no capítulo anterior, bem como a proposta decontinuidade deste trabalho.

• Apêndices: O trabalho contém nos apêndices os resultados de testes iniciais para escolhada normalização.

Capítulo 2

Revisão Bibliográfica

2.1 O Coração (Guyton et al., 2011)

O coração humano é responsável pelo bombeamento do sangue através do organismo,para isto, é composto por duas bombas distintas, direita e esquerda. A bomba direita é res-ponsável pela circulação de sangue para os pulmões, enquanto a esquerda é responsável pelacirculação dos órgãos periféricos. Cada uma destas bombas possui duas repartições, denomi-nadas de átrio e ventrículo. A principal função do átrio é mover o sangue para os ventrículos,cerca de 80% do sangue flui diretamente dos átrios para os ventrículos. Uma representação docoração humano é apresentada na Figura 2.1.

Para que este processo ocorra, é necessário que haja contração dos músculos cardíacos, epara isso uma grande quantidade de células em certa condição dão origem a potenciais elétricosperiódicos. Um grupo dessas células localizadas na parte posterior do átrio direito, entre a veiacava superior e o apêndice atrial, domina o ritmo cardíaco através da geração espontânea ecíclica de potenciais elétricos, este grupo é conhecido como Nódulo Sinusal.

Estes potenciais elétricos propagam-se pelos dois átrios e causam sua contração, conse-quentemente, bombeando o sangue para os ventrículos. Entre os átrios e ventrículos, existe umaestrutura cartilaginosa que apresenta baixa condutividade elétrica, impedindo a passagem des-tes impulsos, estes impulsos são transmitidos através de um grupo de células conhecido comoNódulo Átrio-Ventricular (AV).

Devido a baixa velocidade de condução do nódulo AV, a contração dos ventrículos ocorreapenas após a ejeção, pelo menos parcial, do sangue contido nos átrios. A extremidade inferiordo nódulo AV se prolonga por um feixe que conduz os potenciais elétricos até a extremidadeinferior dos ventrículos por meio de fibras, este feixe é conhecido como feixe de His.

Após, a frente de despolarização passa pelo miocárdio ventricular, causando a contraçãodos ventrículos.

5

6

Figura 2.1: O Coração HumanoFonte: http://wikimedia.org/

2.2 O Eletrocardiograma (Pastore et al., 2009)

O Eletrocardiograma (ECG) é o procedimento mais utilizado para auxiliar o diagnósticodas doenças cardíacas. Este método é de simples realização, seguro e reprodutível, podendoser usado em grandes estudos devido ao seu baixo custo. A metodologia foi favorecida pelodesenvolvimento de aparelhos mais sofisticados, computadorizados e menores, o que facilitoua sua utilização nas situações de emergência e nas rotinas ambulatoriais e hospitalares.

A partir do ECG é possível identificar cada uma das fases do batimento, o complexoQRS corresponde a despolarização ventricular e é constituído por um conjunto de ondas. OComplexo de um ritmo sinusal é precedido por uma onda P e sucedido por uma onda T, nestesentido, encontrar o complexo QRS é de suma importância para o janelamento dos batimentos,o processo completo é exemplificado na Figura 2.2.

O ECG pode conter até 12 derivações usando quatro eletrodos sobre os membros dopaciente e seis sobre o tórax. Cada derivação fornece uma "visão"de um ângulo diferente docoração, existem dois grupos de derivações: precordiais e periféricas, a Figura 2.3 ilustra as 12derivações.

7

Figura 2.2: Processo de batimento no ECGFonte: http://wikimedia.org/

As derivações periféricas são obtidas a partir dos eletrodos colocados nos membros, es-tas, fornecem dados eletrocardiográficos do plano frontal. Existem dois tipos de derivaçõesperiféricas: bipolares e unipolares aumentadas.

As derivações bipolares do eletrocardiograma são as clássicas descritas por Einthoven,estas registram a diferença de potencial entre dois eletrodos localizados em diferentes membros,sendo essas D1, D2 e D3.

• D1: diferença de potencial entre o braço direito e o braço esquerdo. O vetor é em direçãode 0o.

• D2: diferença de potencial entre o braço direito e a perna esquerda. O vetor é em direçãode 60o.

• D3: diferença de potencial entre o braço esquerdo e a perna esquerda. O vetor é emdireção de 120o.

Para entender melhor estas derivações, é importante conhecer o Triângulo de Einthoven,apresentado na Figura 2.4, é formado pelas três derivações bipolares, estas derivações mantêmuma proporção matemática refletida na lei de Einthoven, a qual diz que D2 = D1 + D3.

8

Figura 2.3: Derivações do ECGFonte: http://wikimedia.org/

Figura 2.4: Triângulo de EinthovenAdaptado de http://wikimedia.org/

Esta lei permite determinar se os eletrodos estão corretamente posicionados, caso algumeletrodo não esteja corretamente posicionado, esta lei não é cumprida, apontando para a falha

9

de posicionamento dos eletrodos.

Já as derivações unipolares aumentadas registram a diferença de potencial entre um pontoteórico no centro do triângulo de Einthoven, com um valor de 0, e os eletrodos em cada extre-midade, inicialmente, foram denominadas VR, VL e VF. A letra V significa Vector, e as letrasR, L, F significam direita (Right), esquerda (Left) e pé (Foot). Posteriormente foi adicionada aletra ’a’ (Amplificada) minúscula (as derivações unipolares atuais são amplificados com relaçãoao inicial).

• aVR: potencial absoluto do braço direito. O vetor é em direção de -150o.

• aVL: potencial absoluto do braço esquerdo. O vetor é em direção de -30o.

• aVF: potencial absoluto da perna esquerda. O vetor é em direção de 90o.

Além das derivações periféricas, existem as derivações precordiais ou derivações do planohorizontal, ao todo são seis, e são denominadas com uma letra V maiúscula e um número de1 a 6, são derivações unipolares e registram o potencial do ponto em que o elétrodo de mesmonome é posicionado.

São as melhores derivações do ECG para determinar alterações do ventrículo esquerdo,especialmente das paredes anterior e posterior.

No eletrocardiograma normal os complexos QRS são predominantemente negativos nasderivações V1 e V2 (morfologia rS) e predominantemente positivo nas derivações V4, V5, e V6(morfologia Rs).

• V1: esta derivação do eletrocardiograma registra os potenciais dos átrios, de uma partedo septo interventricular e da parede anterior do ventrículo direito. O complexo QRS temuma pequena onda R (despolarização do septo interventricular), seguido por uma onda Sprofunda.

• V2: esta derivação precordial está acima da parede do ventrículo direito, por conseguinte,a onda R é ligeiramente maior do que em V1, seguida por uma onda S profunda (ativaçãodo ventrículo esquerdo).

• V3: derivação de transição entre os potenciais esquerdos e direitos do ECG. O eletrodoé localizado sobre o septo interventricular. A onda R e a onda S são praticamente iguais(QRS isodifásico).

• V4: o eletrodo desta derivação está localizado no ápice do ventrículo esquerdo, onde aespessura é maior. Tem uma onda R alta seguida por uma onda S pequena (ativação doventrículo direito).

• V5 e V6: estas derivações estão localizadas no miocárdio ventricular esquerdo, cuja es-pessura é menor do que em V4. Por conseguinte, a onda R é menor do que em V4, emboraseja alta. A onda R é precedida de uma onda Q pequena (despolarização do septo).

10

2.3 Arritmias Cardíacas (Pastore et al., 2009)

2.3.1 Considerações Iniciais

Segundo Pastore et al. (2009), arritmias são alterações da formação, frequência, tendo ounão alterações na condução do impulso elétrico através do miocárdio. Geralmente as pessoasnão tem consciência das arritmias, entretanto, sentem suas consequências como fraqueza oudesmaio. Para diagnosticá-las é necessário que o paciente se submeta a um eletrocardiograma.

O objetivo desta seção é fornecer uma visão geral sobre as arritmias cardíacas abordadasneste trabalho, como identificar, quais suas consequências e como são apresentadas em umeletrocardiograma. Neste trabalho foram estudados 10 tipos de arritmias, sendo estes:

• Bloqueios:

– Bloqueio de Ramo Esquerdo;

– Bloqueio de Ramo Direito.

• Extra-sístoles:

– Contração Atrial Prematura;

– Contração Atrial Prematura Aberrante;

– Contração Ventricular Prematura;

– Contração Juncional1 Prematura.

• Escape:

– Batimento de Escape Juncional;

– Batimento com Escape Ventricular.

• Flutter e Fibrilação:

– Flutter Ventricular.

• Fusão:

– Fusão de Batimento normal com Ventricular.

1Juncional/Nodal: Provindo do nó atrioventricular

11

2.3.2 Bloqueios

O bloqueio cardíaco nada mais é do que um atraso nos sinais do nódulo atrioventricular,feixe de His ou em ambas as ramificações do feixe. Estes atrasos são localizados entre os átriose ventrículos. Normalmente bloqueios não possuem sintomas e não interferem no dia a dia,entretanto alguns sintomas em casos específicos podem acontecer.

Os bloqueios podem ser caracterizados em duas classes, bloqueios de ramo e bloqueiosatrioventriculares. Neste trabalho serão abordados apenas os bloqueios de ramo direito e es-querdo.

2.3.2.1 Bloqueio de Ramo Direito (RBBB - Right Bundle Branch Block)

O RBBB é um bloqueio no ramo direito do sistema de condução elétrico do coração,devido o ventrículo direito não ser diretamente ativado pelos impulsos que passam pelo ramodireito, entretanto, o ventrículo esquerdo continua sendo ativado normalmente pelo ramo es-querdo.

Na maioria dos casos o RBBB não causa nenhum sintoma, entretanto, algumas pessoasnão sabem que possuem um bloqueio de ramo. Alguns sintomas de que pessoas possuem RBBBsão desmaios (síncope) e sentimento de que vão desmaiar (pre-síncope).

Os critérios para diagnosticar um bloqueio de ramo direito incluem:

• Duração do QRS maior que 120 ms;

• rsR’ com padrão "Orelha de Coelho"2 nas derivações precordiais anteriores (v1-v3);

• Ondas S arrastadas nas derivações I, aVL e frequentemente em V5 e V6.

As ondas T invertidas e a depressão do segmento ST são normais nas derivações V1 a V3quando há um bloqueio de ramo direito. Nesse sentido, a isquemia miocárdica tecnicamentenão pode ser facilmente determinada nessas derivações. Entretanto, diferente de um bloqueiono ramo esquerdo, a isquemia miocárdica e o infarto podem ser facilmente identificados quandoum RBBB está presente.

Um padrão “orelha de coelho” tipico, nem sempre está presente em um RBBB, já que Rou R’ podem ser muito pequenos, neste sentido, basear-se apenas no padrão “Orelha de coelho”não é sempre confiável.

Um RBBB dependente de frequência também pode ocorrer durante períodos de ritmoacelerado. Quando a frequência cardíaca diminui, o complexo QRS estreito retorna. Um RBBBdependente de frequência pode ser confundido com taquicardia ventricular.

2Também conhecido como Osborn’s Wave ou onda J

12

Os critério morfológico do QRS para diagnosticar um VT com um RBBB incluem:

• R monofásico ou complexo qR bifásico em V1.

• Um RSR’ ou padrão "Orelha de coelho"presente em V1 ou V2 com o pico R maior queR’.

• Complexo rS na derivação 6.

Para facilitar a compreensão, um exemplo de sinal contendo RBBB é apresentado naFigura 2.5, neste é possível identificar o padrão "Orelha de Coelho"a esquerda do complexoQRS.

Figura 2.5: Trecho de ECG do MIT-BIH Arrhythmia Database com Bloqueio de Ramo DireitoFonte: Autor

2.3.2.2 Bloqueio de Ramo Esquerdo ( LBBB - Left Bundle Branch Block)

O LBBB é uma perturbação na condução intraventricular onde o impulso elétrico vindodo nódulo átrio-ventricular não passa através do ramo esquerdo do feixe de His, mas apenaspelo ramo direito.

Normalmente, o LBBB não possui sintomas, é mais comum ter sintomas quando emconjunto com outros problemas. Para pessoas com problemas no coração, pode causar sintomascomo falta de ar e fadiga.

Alguns critérios para identificação do LBBB são:

1. Duração do QRS maior do que 120 milissegundos;

2. Ausência da onda Q nas derivações I, V5 e V6;

13

3. Onda R monomórfica em I, V5 e V6;

4. Deslocamento de ST e T ao lado contrário da maior deflexão do complexo QRS;

Um método simples para diagnosticar o LBBB em um ECG é a comprovação de umcomplexo QRS alargado (acima de 120 ms) na derivação V1. Se o complexo QRS for alargadoe desviado para baixo na derivação V1, então um LBBB é diagnosticado. Mas se a duração doQRS for entre 100 e 119 ms com o critério 2, 3 e 4, um LBBB incompleto é diagnosticado.

Quando ocorre em frequências superiores a 100 bpm, pode ser difícil distinguir da taqui-cardia ventricular, pois ambos causam um complexo QRS largo.

Um exemplo de sinal contendo um LBBB é apresentado na Figura 2.6.

Figura 2.6: Trecho de ECG do MIT-BIH Arrhythmia Database com Bloqueio de RamoEsquerdo

Fonte: Autor

2.3.3 Extrassístole

Extrassístoles são batimentos considerados precoces, ou seja, ocorrem antes do próximobatimento esperado para o ritmo. Estas podem ser de três origens: atrial, ventricular ou juncio-nal (nodal), denominadas Supraventriculares3 e Ventriculares.

Neste trabalho foi utilizada a Contração Ventricular prematura dentre as ventriculares edentre as supraventriculares foram utilizadas as seguintes:

• Contração Atrial Prematura;

3Supraventricular: que tem origem acima dos ventrículos

14

• Contração Atrial Prematura com condução Aberrante;

• Contração Atrial Prematura com Bloqueio;

• Contração Nodal/Juncional Prematura;

2.3.3.1 Contração Atrial Prematura (APC - Atrial Premature Contraction)

A Contração Atrial Prematura, também conhecida como extrassístole atrial, ocorre quandoo foco do átrio (não o nodo sinoatrial) gera uma ação potencial antes da ação potencial do pró-ximo nodo SA.

Assim como os bloqueios de ramo, a extrassístole atrial pode ou não provocar sintomas,alguns sintomas que elas podem causar são falhas no batimento cardíaco. Quando aparece pré-síncope, síncope ou palpitações taquicárdicas surgem outras arritmias associadas que devem serinvestigadas. As extrassístoles só devem ser tratadas se os sintomas forem muito fortes.

Para que um APC seja detectado, exitem quatro características primárias:

• Prematuro, ocorrendo antes do esperado, levando em consideração os intervalos P–P an-teriores.

• Ectópico4, originado fora do nodo SA, portanto, a morfologia da onda P seria diferenteda morfologia normal da onda P sinusal.

• Complexos estreitos; porque eles vêm do átrio, eles eventualmente viajarão pelo nó AV eusarão o sistema de condução normal para se espalhar para os ventrículos. Ao contráriodas contrações ventriculares prematuras que são complexas porque não usam o sistemanormal de condução ventricular. Menos comumente, os APCs podem conduzir de formaaberrante em um padrão de pacote direito ou esquerdo, o que pode dificultar a diferenci-ação das contrações ventriculares prematuras.

• Pausa compensatória após a contração; o potencial de ação atrial extra faz com que o nóSA se torne refratário a gerar sua próxima batida programada e, portanto, deve "pularuma batida"e retomar exatamente 2 intervalos P-P após a última batida normal.

Estas características podem ser observadas no exemplo apresentado na Figura 2.7.

Se um APC ocorre quando o nó AV ainda não se recuperou do período refratário, ele nãoirá conduzir aos ventrículos, ou seja, não haverá um complexo QRS após, ou o intervalo PRectópico será prolongado. O ECG mostrará uma onda P prematura e ectópica e depois nenhumcomplexo QRS posteriormente. Quando isso ocorre em um padrão de bigeminismo (batimentonormal seguido de APC sucessivamente), o intérprete pode ser levado a pensar que a bradicardia

4Ectópico: Que se encontra ou produz fora do lugar habitual.

15

Figura 2.7: Trecho de ECG do MIT-BIH Arrhythmia Database com Contração AtrialPrematura

Fonte: Autor

sinusal está presente, porque todos os outros batimentos são APC não-conduzidos e a taxa deQRS é bastante lenta.

Quando um APC ou batimento supraventricular ocorre antes que o ramo direito se recu-pere de seu período refratário. Isso resulta no batimento prematuro mostrando um padrão debloqueio de ramo direito e pode ser confundido com uma contração ventricular prematura.

2.3.3.2 Contração Atrial Prematura Aberrante (ABERR - Aberrated Atrial Premature Con-traction)

A ABERR é a condução de um impulso supraventricular para os ventrículos em uma ma-neira diferente da usual. A aberrância é vista como um padrão de bloqueio de ramo (complexoQRS encurtado). Também conhecido como extrassístole atrial com aberrância de condução, obatimento atrial prematuro aberrante ao ser conduzido para o ventrículo, possui dificuldade depropagação regional no sistema de condução. (Pastore et al., 2009)

No eletrocardiograma a ABERR é reconhecida por apresentar uma onda P seguida docomplexo QRS com morfologia de bloqueio de ramo, um exemplo é apresentado na Figura 2.8.

16

Figura 2.8: Trecho de ECG do MIT-BIH Arrhythmia Database com Contração AtrialPrematura Aberrante

Fonte: Autor

2.3.3.3 Contração Juncional/Nodal Prematura (NPC - Nodal (junctional) Premature Contrac-tion)

A NPC apresenta frequência normal ou acelerada, onda P com ritmo juncional, QRSnormal, condução com intervalo P-R menor que 0.12 segundos se a onda P estiver presente,ocorrem no inicio do ciclo base, uma pausa compensatória completa pode ocorrer, podem ocor-rer em corações saudáveis, se ocasionais, são insignificantes, se frequentes, podem ocasionartaquicardia juncional, normalmente não é necessário tratamento. Um exemplo do sinal é apre-sentado na Figura 2.9.

2.3.3.4 Contração Ventricular Prematura (PVC - Premature Ventricular Contraction)

A PVC, também conhecida por Extrassístole Ventricular, é um batimento precoce origi-nado no ventrículo com pausa pós-extra-sistólica (pausa após a extra-sístole/contração prema-tura), quando recicla o intervalo RR.

Existem mais três tipos:

• Interpolada: Caso não ocorra modificação no intervalo RR;

• Monomórfica: Caso possua a mesma forma eletrocardiográfica;

• Polimórfica: Caso possua diversas formas eletrocardiográficas.

Normalmente são assintomáticas, eventualmente podem ser sentidas como uma batidamais forte, um “tranco” peito seguido de uma sensação de pausa dos batimentos. Muito ra-

17

Figura 2.9: Trecho de ECG do MIT-BIH Arrhythmia Database com Contração JuncionalPrematura

Fonte: Autor

ramente, dependendo da quantidade, pode haver o desenvolvimento de insuficiência cardíaca.Nesta situação, pode haver dilatação do músculo levando a cansaço, falta de ar, inchaço e in-tolerância a atividades físicas, sendo esta condição chamada de taquicardiomiopatia. Nenhumtratamento é necessário para PVCs. Se sintomáticos, betabloqueadores ou drogas antiarrítmicaspodem ser eficazes, A Figura 2.10 apresenta o ECG referente a uma ocorrência de um PVC.

Figura 2.10: Trecho de ECG do MIT-BIH Arrhythmia Database com Contração VentricularPrematura

Fonte: Autor

Existem quatro características principais da PVC:

• Prematuro, ocorre antes do esperado se comparado com o RR anterior;

18

• Ectópico, originado fora do nó SA, portanto, a morfologia do complexo QRS não seranormal quando o potencial de ação viaja através do sistema de condução normal;

• Complexos largos, porque eles vêm dos ventrículos e não usam o sistema normal decondução ventricular, os potenciais de ação precisam ir do miócito para o miócito, o queé muito mais lento, criando um complexo QRS largo. Ao contrário das contrações atriaisprematuras, ou APCs, geralmente de complexo estreito, porque eles usam o sistema decondução ventricular normal (a menos que um bloqueio de ramo direito ou esquerdo dalinha de base esteja presente).

• Pausa compensatória após a contração; o potencial de ação extra faz com que o nó SA setorne refratário a gerar a próxima batida programada e portanto, deve "pular uma batida"eretomar exatamente dois intervalos P-P após a última batida normal.

2.3.4 Escapes

Os batimentos de escape são considerados tardios ou de suplência. São precedidos poruma pausa, geralmente relacionada a um atraso transitório da automaticidade das fibras miocár-dicas responsáveis pela determinação do ritmo cardíaco. Neste sentido, o trabalho aborda doisritmos de escape, Juncional/Nodal e Ventricular.

2.3.4.1 Batimento de Escape Juncional (NESC - Nodal Escape Contraction)

O NESC é um ritmo de suplência originado na junção AV com frequência inferior a 50bpm. Também pode ser visto na presença de um alto grau ou bloqueio átrio-ventricular com-pleto. Se a frequência ventricular é lenta, pode ocorrer um comprometimento hemodinâmico.

O tratamento depende da causa subjacente e das disritmias basais, atropina ou um marca-passo podem ser usados para aumentar a frequência ventricular.

Frequência entre 40-60 bpm, onda P invertida em derivações que normalmente estariamna vertical, isso acontece quando a onda de despolarização atrial se move em direção de umaderivação negativa. A onda P pode aparecer antes, durante ou após o QRS dependendo onde omarca-passo está localizado na junção átrio-ventricular. Complexo QRS normal.

Condução com intervalo P-R menor que 0.12 segundos, se presente. Ritmo irregularcomo resultado dos batimentos de escape. A causa mais comum deste ritmo em pessoas emcondições saudáveis é a bradicardia sinusal. Um exemplo de sinal contendo um exemplo deNESC é apresentado na Figura 2.11.

19

Figura 2.11: Trecho de ECG do MIT-BIH Arrhythmia Database com Batimento de EscapeJuncional

Fonte: Autor

2.3.4.2 Batimento com Escape Ventricular (VESC - Ventricular Escape Contraction)

Na cardiologia, o VESC é uma descarga elétrica auto-gerada que causa contração dosventrículos, normalmente, o ritmo cardíaco começa pelo átrio e então é transmitido aos ventrí-culos. O VESC é acompanhado de uma longa pausa ventricular que age para prevenir a paradacardíaca.

A forma do QRS é mais ampla, visto que o impulso não pode ser transmitido rapidamentepelo sistema de condução elétrica normal, o que pode ser observado na Figura 2.12.

2.3.5 Fusão

2.3.5.1 Batimento de Fusão (FUSION - Fusion of Ventricular and Normal Beat )

O batimento de Fusão é originados tardiamente no ventrículo que, se fundem com o ba-timento do ritmo fisiológico do coração. Eletrocardiograficamente, possuem a onda P seguidade um QRS alargado, que é a soma elétrica do batimento supraventricular com a extra-sístoleventricular (Pastore et al., 2009), um exemplo de sinal é apresentado na Figura 2.13.

20

Figura 2.12: Trecho de ECG do MIT-BIH Arrhythmia Database com Batimento de EscapeVentricular

Fonte: Autor

Figura 2.13: Trecho de ECG do MIT-BIH Arrhythmia Database com fusão de batimentonormal com ventricular

Fonte: Autor

2.3.6 Flutter e Fibrilações

2.3.6.1 Flutter Ventricular (FLWAV - Ventricular Flutter Wave)

O Flutter Ventricular é um tipo de arritmia, mais especificamente, uma taquicardia queataca os ventrículos (TV, taquicardia ventricular) com uma frequência acima de 250-350 bpm, éuma das mais indiscerníveis. É caracterizada no ECG por uma onda sinusal sem uma definiçãolimpa do QRS e das ondas T. É considerada como uma possível transição entre o estado de

21

taquicardia ventricular e fibrilação, sendo uma arritmia crítica e instável que pode resultar emmorte súbita.

Pode ocorrer na infância, juventude ou quando adulto. Pode ser induzido por estimulaçãoelétrica programada. A Figura 2.14 apresenta um exemplo do FLWAV.

Significância clínica do Flutter Ventricular:

• Forma extrema da TV com perda de atividade elétrica organizada;

• Associado ao comprometimento hemodinâmico rápido e profundo;

• Normalmente tem vida curta, devida a progressão para fibrilação ventricular;

• Assim como a fibrilação ventricular, é necessário que se tenha acompanhamento médicoo mais rápido possível.

Como reconhecer o flutter ventricular:

• Onda senoidal continua;

• Onda P, complexo QRS e ondas T não identificáveis;

• Frequência normalmente maior que 200 bpm;

• O ECG é idêntico se olhado de ponta cabeça;

Figura 2.14: Trecho de ECG do MIT-BIH Arrhythmia Database com Flutter VentricularFonte: Autor

22

2.4 Trabalhos Relacionados

Sendo o ECG uma das técnicas utilizadas para diagnóstico de doenças cardíacas (Gi-fari et al., 2015), os pesquisadores vem investindo no desenvolvimento de algoritmos precisospara monitorização automática. Há vários parâmetros possíveis de analisar no ECG, mas nestetrabalho iremos nos ater especificamente a classificação de ritmos cardíacos. Neste caso, sãonecessários dois principais tipos de algoritmos: detector de QRS e classificador de QRS.

O detector de QRS é um ponto importante, pois é a partir da marcação do pico da ondaR que se calcula a frequência cardíaca. Além disso, para classificar o complexo é precisoidentificá-lo adequadamente.

O classificador de QRS é o ponto que antecede a classificação de ritmos, pois algunsritmos dependem disto, por exemplo, considera taquicardia ventricular quando 3 ou mais PVCssão identificadas.

Com o auxílio do MIT-BIH Arrythmia Database, cujos detalhes são apresentados no Ca-pítulo Material e Métodos, diversos pesquisadores desenvolveram vários trabalhos. A seguirsão apresentados exemplos de trabalhos encontrados utilizando este banco de dados, cujos re-sultados são apresentados em tabelas, quando possível.

Iniciando pelos detectores de QRS, foram encontrados na literatura diversos trabalhos,dos quais destacam-se os que utilizaram os mesmos sinais de ECG do MIT-BIH ArrythmiaDatabase para avaliação. Os resultados de Valor de Sensibilidade (VSE) e Valor PreditivoPositivo (VPP), de alguns trabalhos, estão apresentados na Tabela 2.1.

Para compreender os resultados dos trabalhos apresentados, a seguir, é necessário que secompreendam os conceitos e cálculos utilizados para avaliação de cada modelo. Neste sentido,serão apresentadas algumas equações e seus respectivos significados.

Precisão ou Valor Positivo Preditivo (VPP) : É a porcentagem de exemplos classificadoscorretamente em uma classe c pelo classificador, pode ser calculado a partir da Equação 2.1

V PPc =TPc

TPc + FPc(2.1)

Onde TPc é a quantidade de exemplos da classe c corretamente classificados e FPc é aquantidade de exemplos de outras classes classificadas como sendo da classe c.

Sensibilidade (VSE): É a porcentagem de exemplos da classe c classificados correta-mente em relação a quantidade de exemplos da classe c existentes no conjunto de testes, podeser calculado a partir da Equação 2.2

V SEc =TPc

TPc + FNc

(2.2)

23

Onde TPc é a quantidade de exemplos da classe c corretamente classificados como sendoda classe c e FNc é a quantidade de exemplos da classe c incorretamente classificados comosendo de outras classes.

Tabela 2.1: Resultados Detectores

VSE VPPArzeno et al. (2008) 99,68% 99,63%Martínez et al. (2004) 99,66% 99,56%Abibullaev & Seo (2011) 97,2% 98,52%Pan & Tompkins (1985) 99,3% -Hamilton & Tompkins (1986) 99,69% 99,77%Martínez et al. (2010) 99,81% 99,89%Chen & Chen (2003) 99,5% %

Fazer um estudo comparativo dos classificadores de QRS e de arritmias, com base nosartigos é complexo, pois cada autor escolhe um conjunto de complexos QRS e de ritmos di-ferentes para classificar. A seguir apresentamos alguns artigos encontrados na literatura paraclassificar QRS e ritmos cardíacos utilizando o MIT-BIH Arrythmia Database.

Nadal (1991), em seu trabalho, utiliza as 10 primeiras Componentes Principais (PCA) daextração de autovetores e autovalores para realizar a classificação dos batimentos, com estascomponentes, é então desenvolvida uma árvore binária de decisão que realiza a classificaçãodos batimentos. A matriz de confusão com a saída do classificador é apresentada na Tabela 2.2,sendo na horizontal a classificação segundo o banco de dados e na vertical de acordo com oalgoritmo proposto.

Tabela 2.2: Matriz de Confusão de Nadal (1991)

NORMAL FLUTTER VESC ABER PVC VFUS SVPBNORMAL 97497 1 109 150 13 240FLUTTER 1 59 154 257VESC 69 29 8ABER 52 22 58 18PVC 205 10 6477 21 395VFUS 396 1 281 120 2SVPB 328 6 29 2255

Bossan (1994) faz uma derivação do trabalho de Nadal (1991) utilizando redes neurais emsubstituição às arvores de decisão, permitindo assim, a criação de funções de separação maisflexíveis. Uma rede neural com duas camadas, 20 células na primeira camada e 7 na na segundaé suficiente para alcançar o objetivo proposto pelo trabalho. A Tabela 2.3 apresenta a matriz

24

de confusão do modelo utilizando o conjunto de treino e teste e na Tabela 2.4 são apresentadosVSE e VPP.

Tabela 2.3: Matriz de Confusão de Bossan (1994)

NORMAL SVPB ABERR PVC FUSÃO VESC FLUTTERNORMAL 97351 725 20 328 260 8 4SVPB 392 1696 6 8 0 0 1ABERR 1 20 57 6 0 0 2PVC 152 83 61 6700 67 1 8FUSÃO 94 0 0 54 473 0 0VESC 2 0 0 1 0 97 0FLUTTER 1 91 6 1 0 0 456

Tabela 2.4: Resultados de Sensibilidade e Valor Positivo Preditivo de Bossan (1994)

Classe VSE % VPP (%)NORMAL 98,64 99,34SVPB 80,65 64,86ABERR 66,28 38,00PVC 94,73 95,82FUSÃO 80,31 60,41VESC 97,00 91,51FLUTTER 82,16 96,82

Kauati & Nadal (1997) faz a integração de um detector (Abrantes & Nadal, 1992) (Abran-tes & Nadal, 1997) e classificador de complexos QRS (Nadal, 1991), adicionando a cada uma identificação do seu ritmo: normal, bigeminia atrial, bigeminia ventricular, trigeminia ven-tricular, taquicardia ventricular, taquiarritmia supraventricular e bradicardia, criando assim, umsistema básico para monitoramento de arritmias cardíacas com índices de sensibilidade (VSE)e Valor Preditivo Positivo (VPP), para batimentos PVC e SVPB apresentados na Tabela 2.5.

Tabela 2.5: Valores de Sensibilidade e Valor Positivo Preditivo de Kauati & Nadal (1997)

Classe VSP % VPP %PVC 86,0 91,8SVPB 67,4 78,8

Moraes et al. (2002) desenvolvem um método não supervisionado para reconhecer e clas-sificar complexos QRS, para criar um classificador automático de batimentos cardíacos em

25

tempo real. Após análise exaustiva dos parâmetros, são selecionadas quatro características ex-traídas de um complexo QRS no domínio do tempo, sendo as que apresentaram os melhoresresultados: largura, soma total das áreas sob as curvas positiva e negativa, soma total dos va-lores absolutos das variações amostrais e amplitude total. Os resultados indicaram que essascaracterísticas seguem uma distribuição normal, permitindo o uso da distância de Mahalanobiscomo critério de classificação. Após um período inicial de aprendizado, o algoritmo extrai osquatro recursos de cada novo complexo QRS e calcula a distância de Mahalanobis entre o con-junto e todas as classes existentes para determinar a classe à qual o novo QRS pertence. Taltécnica permite uma detecção com alto nível de precisão e baixo percentual de falsos positivos.

Rodriguez et al. (2005) utiliza o algoritmo J48 para classificar complexos QRS e poste-riormente para ritmos cardíacos. O modelo gerado pelo algoritmo é implementado em PDAsafim de realizar a classificação em tempo real. Os resultados para Rodriguez et al. (2005),encontram-se na Tabela 2.6.

Tabela 2.6: Valores de Sensibilidade e Valor Positivo Preditivo de Rodriguez et al. (2005)

Classe VSE% VPP%NORMAL 98,42 97,87LBBB 98,38 98,93RBBB 97,35 96,73ABERR 46,34 57,58PVC 88,44 92,80FUSION 76,36 77,49NPC 50,00 66,67APC 77,20 84,65VESC 93,94 91,18NESC 33,33 100FLWAV 91,30 87,50

Tsipouras et al. (2005) utilizam informações de uma janela deslizante que engloba trêsintervalos RR. A classificação se baseia em quatro categorias de batimentos: normal, contraçãoventricular prematura, flutter/fibrilação ventricular e 2o bloqueio cardíaco. Seis tipos de ritmossão classificados: bigeminia ventricular, trigeminia ventricular, dístico ventricular, taquicardiaventricular, flutter/fibrilação ventricular e 2o bloqueio cardíaco, para realizar a classificação sãoaplicadas regras de decisão. Os resultados apresentam 98% de acurácia para classificação debatimentos e 94% de acurácia para detecção e classificação de episódios arrítmicos.

Hu et al. (2012) desenvolvem um dispositivo que realiza monitoramento em tempo real dearritmias cardíacas. Para isto, um sensor é utilizado para a digitalização, e o sinal é enviado viabluetooth para um smartphone e uma rede markoviana é utilizada para realizar a classificaçãodas arritmias. Neste sentido os batimentos detectados são: Normal, PVC e APC. Na Tabela 2.7

26

os valores preditivos positivos e de sensibilidades são apresentados.

Tabela 2.7: Valores de Sensibilidade e Preditivo Positivo de Hu et al. (2012)

Classe VPP% VSE%Normal 99,64 99,72PVC 96,63 97,75APC 95,77 99,48

Já Gutiérrez-Gnecchi et al. (2017) apresentam uma plataforma de processamento de si-nais digitais destinada a classificação online, em tempo real, de oito condições de batimentos:NORMAL, Fibrilação Atrial, PAC, LBBB, RBBB, PVC, bloqueio sinoatrial e taquicardia su-praventricular. O algoritmo proposto utiliza um processo de transformadas de Wavelets baseadoem ondas quadráticas para identificação de ondas ECG individuais, e obter um vetor de mar-cações fiduciais. A classificação é dada por uma rede neural probabilística, os resultados sãoapresentados na Tabela 2.8.

Tabela 2.8: Resultados de Gutiérrez-Gnecchi et al. (2017)

Classe Treino Teste Acerto Falso Negativo Falso PositivoAtrial Fibrilation 45 45 45 97,78% 1 2,2% 0 0%NORMAL 195 195 194 99,49% 0 0% 1 0,51%PAC 45 45 45 100% 0 0% 0 0%LBBB 45 45 45 100% 0 0% 0 0%RBBB 45 45 43 43% 2 4,44% 0 0%PVC 45 45 44 97,78% 1 2,22% 0 0%SHB 20 20 20 100% 0 0% 0 0%SVT 10 10 10 100% 0 0% 0 0%Total 450 450 445 98,89% 4 0,89% 1 0,22%

Chang et al. (2018) apresentam um sistema de baixa complexidade que inclui a detecçãode QRS e arritmias, classifica QRS’s Normal, RBBB, LBBB, APC e PVC com 98,05% deacurácia para classificação e 99,29% para detecção.

Alfarhan et al. (2018) realizam a extração de estatísticas entre os intervalos RR sendoessas: MAV (Mean Absolute Value), RMS (Root Mean Square), mediana e desvio padrão. Osintervalos R-R são extraídos encontrando os picos R de cada segmento e calculando a distância.Para encontrar os picos R, o sinal é elevado ao quadrado e aplica-se um threshold para encontraros valores mais altos. A classificação é dada por uma SVM com a função Gausian Radial BasisFunction (RBF) e classifica em: NORMAL PAC e PVC com acurácia de 96,2%.

Hassan et al. (2018) desenvolvem um classificador de arritmias, em tempo real, usando

27

memristor neuro-morphic computing system para classificação de 5 tipos de batimentos: nor-mal, contração atrial prematura, contração ventricular prematura, bloqueio de ramo direito ebloqueio de ramo esquerdo. A computação neuromórfica utiliza novos dispositivos emergentes,como memristores como um bloco básico de construção. Consequentemente, esses sistemasprovem um ótimo balanço entre tempo-real, consumo e acurácia. Resultados experimentais emtermos de acurácia e tempo de testes mostram uma acurácia média de 96,17% e 34 ms de tempomédio para classificação por batimento.Mykoliuk et al. (2018) fazem uma análise da aplicabilidade do aprendizado de máquina, com-binado ao processamento de sinais para detecção automática de fibrilação atrial, usando apenasuma derivação gravada. Nesse, o autor realiza experimentos usando um modelo baseado em re-des neurais e Random Forest. O classificador realiza a classificação de ritmos em 4 categorias,Fibrilação Atrial, Normal, Outro Ritmo e Sinal com Ruido. Os resultados para Random Forestssão apresentados na Tabela 2.9 e para Redes Neurais na Tabela 2.10.

Tabela 2.9: Resultados para Random Forests de Mykoliuk et al. (2018)Classe VPP% VSE%

Fibrilação Atrial 0,77 0,67Normal 0,73 0,75Outro 0,64 0,68Ruído 0,68 0,61Média/Total 0,7 0,7

Tabela 2.10: Resultados para Redes Neurais de Mykoliuk et al. (2018)

Classe VPP% VSE%Fibrilação Atrial 0,58 0,26Normal 0,65 0,94Outro 0,60 0,28Ruído 0,47 0,03Média/Total 0,62 0,64

Segundo Nath et al. (2018), a detecção oportuna de arritmia cardíaca é fundamental parao diagnóstico e tratamento de doenças cardíacas. O sinal de ECG fornece informações valiosassobre o funcionamento do coração e permite o diagnóstico de condições de arritmia. O sistemaé criado para a classificação automatizada de problemas cardíacos, e utiliza um computadorde placa única Raspberry Pi 3b (RPi3b), possibilitando analisar o sinal de ECG e identificarcondições cardíacas normais ou anormais. O sistema pode adquirir sinais de ECG de forma

28

independente, e classificar arritmia usando redes neurais artificias em execução no RPi3b. Osistema foi testado usando o banco de dados de arritmias MIT-BIH. Também foi realizada aaquisição e classificação do sinal de ECG em tempo real.

Ihsanto et al. (2019) propõe um método de classificação em que se elimina o estágio depré processamento do ECG, e combinam as fases de extração de características e classificaçãoem um estágio de cálculo, nomeado Ensemble MLP. Este método espera diminuir o custo com-putacional enquanto mantém uma acurácia de 97% ou mais para um grande número de classes.

Capítulo 3

Fundamentação Teórica

3.1 Séries Temporais

Uma Série Temporal (ST) é um conjunto de observações sequênciais ao longo do tempo,cuja característica mais importante deste tipo de dados é sua dependência entre as observações.Diversos procedimentos estatísticos foram desenvolvidos para analisar observações indepen-dentes, entretanto o estudo de séries temporais requer o uso de técnicas específicas. Dadosde séries temporais surgem em vários campos do conhecimento, como Economia, Medicina,Epidemiologia, Meteorologia, entre outros (Morettin & Toloi, 2006).

Neste sentido, o ECG é uma série temporal, e para isso, precisamos entender seu compor-tamento e aplicar técnicas específicas para a análise destes dados. Ao longo dos anos, muitastécnicas para a análise deste tipo de dados foram desenvolvidas.

Abordagens tradicionais para análise de STs consistem na comparação morfológica, en-tretanto para que sejam comparadas distintas STs, é necessário que as mesmas possuam amesma unidade de medida. Erros de calibração e/ou de leitura podem fazer que STs de mesmaclasse estejam com valores discrepantes (Maletzke, 2009).

3.2 Mineração de Dados

A Mineração de Dados (MD) é uma das principais etapas do Processo de Busca de Conhe-cimento (KDD - do inglês Knowledge Discovery and Data Mining). Utilizada para identificartécnicas avançadas de análise de dados, podendo ou não utilizar a Inteligencia Artificial (IA).

29

30

3.3 Aprendizado de Máquina

Antes de definirmos o Aprendizado de Máquina (AM), apresentamos a seguir algunstermos necessárias a compreensão do mesmo.

• Aprendizado: Denomina-se aprendizado ao processo de aquisição de conhecimentos,habilidades, valores e atitudes, possibilitado através do estudo, do ensino ou da experiên-cia.

• Aprendizado Supervisionado: Ocorre quando os conjuntos de exemplos fornecidos aosistema possuem suas respectivas classes e, com isto, pretende-se classificar os novosconjuntos ainda não classificados. Há dois tipos de aprendizado supervisionado de acordocom o tipo da saída sendo eles:

– Regressão: Previsão de um valor numérico contínuo;

– Classificação: Previsão de classes discretas pré-definidas.

• Aprendizado Não Supervisionado: Supõe que o conjunto de exemplos não possui clas-sificação. Deste modo, tenta-se agrupar os exemplos semelhantes em classes.

• Conhecimento: O conhecimento é a informação tratada e absorvida por uma pessoa.Um modelo de classificador simbólico pode fornecer informações sobre quais dados sãoimportantes para a discriminação de alguma classe e, a partir da análise deste modelo, épossível a extração de conhecimento.

O AM é um conceito no qual a realização de uma tarefa melhora por meio do aprendizado(Mitchell, 1997b). Neste sentido, existem quatro paradigmas:

• Estatístico: busca através de métodos estatísticos aproximar um modelo;

• Simbólico: explora as representações de estruturas gráficas ou lógicas;

• Baseado em Exemplos: compara diversos exemplos armazenados e classifica pela simi-laridade entre eles;

• Conexionista: utiliza redes neurais e suas conexões para tomada de decisões.

Vários métodos e algoritmos de aprendizado de máquina foram desenvolvidos, entre-tanto, não é possível afirmar que um algoritmo seja superior a outro, pois diferentes problemasrequerem diferentes abordagens. Para que o problema seja resolvido de maneira satisfatória, énecessário que haja uma avaliação do problema e dos algoritmos para a escolha do mais ade-quado (Monard & Baranauskas, 2003).

31

3.3.1 Classificadores

Classificadores são modelos de AM que a partir de um conjunto de informações são ca-pazes de identificar a classe a qual pertence uma entrada. Estes modelos podem ser construídosa partir de regras “se-então” já conhecidas ,ou utilizando técnicas de AM, tais como MultilayerPerceptron (Gardner & Dorling, 1998), Tree J48 e Random Forests (Breiman, 2001). Os doisúltimos algoritmos também podem ser utilizados como forma de extração de conhecimento. Al-guns trabalhos utilizam a mescla de algoritmos, ou focam somente na extração de característicasdos sinais. Neste trabalho serão explorados ambos os tipos de algoritmos e estratégias.

Entretanto para que os modelos gerados por AM sejam úteis, são necessárias validações,a validação básica para utilidade de um modelo é o Erro da Classe Majoritária.

O AM tem por fim obter modelos capazes de se generalizar aos dados. Para isso, sãorealizados testes de validação, para que estes modelos sejam avaliados e testados, algumasformas de avaliar a performance de modelos são apresentados a seguir.

3.3.2 Erro da Classe Majoritária

O Erro da Classe Majoritária (ECM) é o erro que se comete ao classificar todas os exem-plos como sendo da classe que mais possui exemplos no banco de dados, ou seja, o limitemínimo de acerto de um classificador tem de ser maior que o ECM, caso contrário não hásentido em utilizar este classificador(Rezende, 2003). O ECM de um conjunto é definido pelaEquação 3.1.

E = 1− (T − C) (3.1)

Sendo T o total de exemplos e C a quantidade de exemplos da classe com maior númerode exemplos no conjunto.

O erro majoritário de um conjunto de exemplos é independente do algoritmo de apren-dizado, ele fornece um limiar máximo abaixo do qual o erro máximo de um classificador deveficar para ser aceitáve(Rezende, 2003).

3.3.3 Erro Aparente

O Erro Aparente é o erro calculado utilizando o conjunto de treino para testar, ou seja,após a construção do modelo, o mesmo conjunto de exemplos utilizado para treinamento ésubmetido ao modelo para testar sua performance, geralmente este erro tende a ser menor que

32

o Erro Verdadeiro (Rezende, 2003).

3.3.4 Erro Verdadeiro

O Erro Verdadeiro é o erro calculado sobre o conjunto de exemplos de teste. Ou seja,o modelo é treinado por um conjunto de treino, em seguida, o modelo utiliza o conjunto deexemplos de teste para calcular a taxa de erro cometida ao classificar instâncias não apresentadaspreviamente ao modelo (Rezende, 2003).

3.3.5 Sensibilidade

Sensibilidade (VSE) é a porcentagem de acerto do Verdadeiro Negativo. Para calcular aSensibilidade pode ser utilizada a Equação 3.2, onde TN é a quantidade de ocorrências nãopertencentes a classe A que não foram classificadas como a classe A, FN é a quantidade deocorrências da classeA que foram classificadas como não sendo da classeA e TN a quantidadede ocorrências que não são da classe A que foram classificadas como não sendo da classe.

V SE =TN

FN + TN(3.2)

3.3.6 Precisão ou Valor Positivo Preditivo

A Precisão, ou Valor Positivo Preditivo (VPP), é a porcentagem de exemplos classificadoscorretamente em uma classe, pode ser calculado a partir da Equação 3.3 onde TP é a quantidadede ocorrências classificados corretamente na classe e TFN é a quantidade de ocorrências deoutras classes classificadas como sendo da classe em questão.

V PP =TP

TP + FN(3.3)

3.3.7 Redes Neurais Artificiais

Para entendermos as Redes Neurais Artificiais (RNA), primeiro precisamos abstrai-las aoseu ponto mínimo, ou seja, ao Neurônio Artificial.

33

3.3.7.1 Neurônio Artificial

Um neurônio artificial é um modelo simplificado com base nas redes neurais biológicas.Suas características básicas são a adaptação e a representação de conhecimentos baseada emconexões.

Os neurônios se comunicam através de sinapses. Sinapse é a região onde dois neurôniosentram em contato e através da qual os impulsos nervosos são transmitidos entre eles.

Os impulsos recebidos por um neurônio A, em um determinado momento, são proces-sados, e atingindo um dado limiar de ação, o neurônio A dispara, produzindo uma substâncianeurotransmissora que flui do corpo celular para o axônio, que pode estar conectado a um den-drito de um outro neurônio B.

O neurotransmissor pode diminuir ou aumentar a polaridade da membrana pós-sináptica,inibindo ou excitando a geração dos pulsos no neurônio B. Este processo depende de váriosfatores, como a geometria da sinapse e o tipo de neurotransmissor (Russel & Norvig, 2004).

Um exemplo de neurônio artificial é apresentado na Figura 3.1. Sendo o vetor [x1, x2, ..., xm]o conjunto de entradas apresentadas ao neurônio, o vetor [w1, w2, ..., wn] o conjunto pesos re-ferentes a cada conexão, que corresponde a junção somadora, g(.) função de ativação e porúltimo y sendo a saída.

Figura 3.1: Representação de um neurônio artificial.http://wikimedia.com/

34

3.3.7.2 Perceptron

O Perceptron é uma rede neural simples composta por uma camada de entrada que recebeinformações do exterior, uma última camada traz o resultado de acordo com o peso e só écapaz de resolver problemas linearmente separáveis de classes binárias. A princípio, sua saídaé aleatória, entretanto, com os ajuste de pesos feito durante o treinamento, passa a fornecersaídas de acordo com os dados recebidos (Braga, 2007).

3.3.7.3 Rede Neural Multilayer Perceptron

Problemas nem sempre são linearmente separáveis. Sendo assim, perceptrons nem sem-pre podem ser utilizados. Para resolver problemas de funções matemáticas mais complexas,surgiram as redes Multilayer Perceptron (MLP). Essa rede é composta por uma camada de en-trada, uma ou mais camadas ocultas, e a camada de saída. Uma MLP com uma camada ocultapode aproximar de qualquer função contínua, com duas camadas ocultadas é possível a aproxi-mação de qualquer função (Braga, 2007).

As redes MLP podem ser do tipo feedforward, onde o sinal nunca passa de uma camadaposterior a uma camada anterior, ou recorrentes, onde os sinais podem ou não passar paracamadas posteriores. A Figura 3.2 apresenta uma ilustração de uma MLP feedforward.

Figura 3.2: Representação de uma MLP feedforwardFonte: http://wikimedia.org/

Um item importante das redes MLP é a função de ativação, que foi introduzida nas redesMLP para resolver o problema do ajuste do peso e do bias, que antes das funções de ativação,um pequeno ajuste nos pesos e no bias de redes MLP poderiam causar mudanças drásticas nasaída de rede. Com as funções de ativação, tem-se apenas uma pequena mudança no peso e nobias da rede. As funções de ativação têm como objetivo tomar a decisão se um neurônio deve

35

ser ativado ou não. Elas usam o sinal de entrada e o aplica em uma função não linear. A saídadessa função serve como entrada para a próxima camada de neurônios. Existem vários tiposde funções de ativação, que devem ser utilizadas em diferentes situações (Mitchell, 1997b), emredes MLP as mais comuns são (Zuben, 2001):

• Linear: utilizada para fazer regressão;

• Sigmóide Logística: essa função é muito utilizada, pois é diferenciável e não linear, issosignifica que quando uma MLP utiliza esse tipo de função sua saída também não serálinear;

• Tangente Hiperbólica: muito semelhante a função Sigmóide, sua principal diferença éque varia entre -1 e 1.

Com a evolução dos estudos das redes MLP, foi necessário o uso de funções mais moder-nas e complexas para redes mais profundas.

• ReLU: é uma função não linear, seu maior defeito é que seu gradiente é sempre 0 quandox é menor do que 0;

• Leaky ReLU: uma versão otimizada da ReLU, resolve o problema que para quando x formenor que 0, que na ReLU seu gradiente sempre é 0;

• Softmax: é um tipo de função sigmóide, que ajuda a lidar com problemas de classificação.A saída de neurônio em uma camada sigmoide segue sendo em 0 e 1, e seus valores podemser interpretados como probabilidades;

3.3.7.4 Backpropagation

o Backpropagation é o algoritmo mais utilizado para realizar o treinamento de redes MLPfeedforward. Este algoritmo é baseado em duas fases, primeiro a fase forward, onde ocorremas entradas e os dados passam pela rede, depois a fase backward, onde é calculado o erro, porisso o nome Backpropagation (Mitchell, 1997b).

A fase forward do algoritmo tem o seguinte funcionamento: a entrada, chamada de sinal,é enviada da camada entrada para cada camada da rede. O sinal é propagado até que chegue nacamada de saída. A última camada tem seu resultado que é comparado com as saídas desejadas.

A fase backward do algoritmo tem o seguinte funcionamento: a partir da última camadaaté a entrada, baseado no gradiente são reajustados os pesos da atual camada para reduzir seuserros (Braga, 2007).

A principal vantagem do backpropagation é a minimização de erros, pois o cálculo doerro da fase backward faz o ajuste nos pesos da última camada até primeira, fazendo assim com

36

que, no conjunto de treinamento, os erros vão se minimizando (Mitchell, 1997a). Um exemplodado por Mitchell (1997a) utiliza como função de ativação a função Sigmóide e como custo afunção Erro Quadrático Médio.

Na Equação 3.4 o wi representa o peso que deve ser recalculado, xi é o dado de entrada,e o δ é erro calculado para o neurônio associado ao peso em questão do erro. A Equação 3.5refere-se ao ajuste do bias, muito semelhante ao ajuste do peso.

wij = wij − ηxiδj (3.4)

bj = bj − ηδj (3.5)

O cálculo do erro δ é feito de duas maneiras diferentes. Uma para última camada e outrapara camadas ocultas (intermediárias). A Equação 3.6 refere-se a última camada. A saídaobtida é representado por yj e a saída desejada por dj . Nas camadas intermediárias, o princípiodo cálculo é o mesmo, a principal diferença como é visível na Equação 3.7 é que é feito umsomatório dos pesos e dos erros δ que encontrados na camada seguinte.

δj = yj(1− yj)(yj − δj) (3.6)

δj = yj(1− yj)∑

wjkδk (3.7)

3.3.8 Árvore de Decisão

Pertencente ao paradigma simbólico, a Árvore de Decisão é um modelo estatístico queutiliza a técnica de treinamento supervisionado para fazer classificação e previsão de dados, ouseja, para sua construção são necessárias entradas rotuladas com suas classes (saídas).

As árvores utilizam a estratégia de dividir para conquistar, dividindo o problema em pro-blemas menores e mais simples (Gama et al., 2004).

3.4 Geometria Fractal

Fractais são formas complexas que não podem ser medidas apenas por dimensão topo-lógica. A dimensão fractal surge então como uma alternativa de medição já que pode assumirvalores fracionários, obtendo assim o grau de complexidade de uma forma. Pode-se afirmar que

37

a dimensão fractal de um conjunto é um valor que diz o quão densamente um conjunto ocupa oespaço métrico em que ele existe (Takayasu, 1990).

A estimativa de dimensão fractal determina a complexidade de objetos fractais, e podeser estendida para diversas áreas. A seguir são apresentadas algumas abordagens que estimama dimensão fractal de uma Série Temporal.

3.4.1 Katz

A estimativa de dimensão fractal por Katz é definida pela Equação 3.8, onde L é o tama-nho total da série, d a distância euclidiana entre o primeiro ponto na série e o ponto que provê amaior distância entre o primeiro ponto (Katz, 1988).

FDKatz =log10(n)

(log10(dL) + log10(n))

(3.8)

3.4.2 Box Counting

Dentre os vários cálculos de dimensão fractal existentes, o Box Ccounting ou Box-dimensioné um dos mais utilizados. Sua grande popularidade se deve a sua facilidade de uso em cálculosmatemáticos e em estimativas experimentais.

O algoritmo para o cálculo dessa dimensão considera uma figura qualquer coberta por umconjunto de quadrados, e calcula o número de quadrados necessários para cobrir toda a figuraque é representado por N(s), sendo s a escala, ou seja, número de vezes que o lado da imagemserá dividido (Peitgen et al., 2012). Conforme podemos observar na Equação 3.9

logN(s)

log 1s

(3.9)

3.4.3 Hallwood

Este estimador é uma versão do box-count que ao invés de considerar caixas (box), con-sidera a área coberta pela curva subjacente. (Hall & Wood, 1993)

38

3.4.4 Estimadores Baseados em Variância

Estes estimadores utilizam o conceito de variância da ST a cada escala ε como medida, avariância pode ser calculada conforme a Equação 3.10:

var(Q) =p(ε)∑i

(qi − qi+ε)p (3.10)

Onde Q é o conjunto de observações, qi é a observação i do conjunto de observações e pé uma potência qualquer.

O gráfico de log var(Q) versus log ε fornece o semi-variograma da ST e a dimensão fractalpode ser calculada a partir da inclinação deste.

Outro estimador baseado em variância utiliza a fórmula baseada em derivadas de segundaordem, o que é o caso do incr1 (Gneiting et al., 2012).

3.4.5 Estimadores Espectrais e Wavelets

Estimadores espectrais trabalham no domínio da frequência ao invés do temporal. Oestimador de dimensão fractal wavelets usa os coeficientes da transformada de wavelets, já,outros estimadores como Periodograma e DCT-II, utilizam a densidade espectral da ST.

De maneira análoga ao semi-variograma, é computado o semi-periodograma e a dimensãofractal é calculada a partir da inclinação da reta ajustada por regressão de diferentes frequênciacom a densidade espectral (Gneiting et al., 2012).

3.5 Entropia

A Entropia é uma grandeza fundamental em estatística e AM, possui vasto número deaplicações, por exemplo, em astronomia, criptografia, processamento de sinais, estatística, fí-sica, análise de imagens, teoria de rede e bioinformática (Hausser & Strimmer, 2009).

Devido a esta vasta gama de aplicações, diversas formas de calcular a entropia de con-juntos foram desenvolvidos. Neste trabalho serão abordadas as seguintes formas de cálculo deentropia, Entropia Empírica e Entropia de Shannon com correção de Miller-Madow, o valorcalculado de entropia será utilizado como informação sobre os complexos.

39

3.5.1 Entropia Empírica

Utiliza a definição de Entropia de Shannon e troca as definições de probabilidades por suasfrequências empíricas respectivas, sendo calculada pela Equação 3.11 (Hausser & Strimmer,2009).

HML =p∑

k=1

θMLk log θML

k (3.11)

Onde θMLk é calculado pela Equação 3.12.

θMLk =

γkn

(3.12)

Neste sentido, S é a série temporal de onde deseja-se calcular a entropia, Sk a amostra kde S, γk é a quantidade de vezes em que a amostra Sk em S.

3.5.2 Entropia de Shannon com Correção de Miller-Madow

Aplica a correção de bias no estimador de Entropia Empírica (Miller, 1955), o cálculocom a correção de bias é apresentada na Equação 3.13.

HMM = HML +M > 0− 1

2n(3.13)

M > 0 é a quantidade de exemplos em que yk é maior que 0.

40

Capítulo 4

Material e Métodos

4.1 Contextualização

Antes de classificar os ritmos cardíacos, sinal do ECG precisa ser tratado. Inicia-se pelafiltragem, seguida de segmentação dos complexos QRS. Segue-se normalizando e realizando asmedidas necessárias. Depois, com a base processada, utilizam-se algoritmos de AM para gerarum modelo, seguindo com técnicas para avaliação e análise dos resultados. O modelo maisadequado é implementado no hardware de monitoramento, que por sua vez se comunica com osistema e gera alarmes. Para melhor compreensão, uma ilustração do processo realizado nestetrabalho é apresentada na Figura 4.1.

4.2 O Banco de Dados

Este trabalho utilizou o banco de dados "MIT-BIH Arrythmia Database", desenvolvidopelo Beth Israel Hospital e MIT (Massachusetts Institute of Technology), o qual contêm ele-trocardiogramas previamente classificados por cardiologistas. O banco é composto por trechosde ECG de 48 pacientes em duas derivações, 30 minutos de cada uma, dispondo de um totalde 24 horas de sinais analisados por especialistas experientes. Estes sinais possuem anotações,demarcações e classificações de batimentos(Moody & Mark, 1990).

Originalmente, os sinais foram armazenados na forma analógica em fitas magnéticas Mo-ody & Mark (1990), posteriormente foi disponibilizado por meio de CD com aproximadamente200 horas de gravações. Atualmente, esta base de dados está disponível online para download1

e também conta com um sistema online para visualização e anotação manual em trechos decada sinal2. Sua utilização se deve a alguns fatores importantes, tais como:

• Ampla utilização bibliográfica: Diversos trabalhos clássicos e atuais utilizam essa base dedados, tais como: Pan & Tompkins (1985), Hamilton & Tompkins (1986), Nadal (1991),

1https://www.physionet.org/physiobank/database/mitdb/2https://physionet.org/lightwave/

41

42

Figura 4.1: ProcessoFonte: Autor

Bossan (1994) ,Hilton (1997), Acharya et al. (2017), neste sentido, a comparação dosresultados entre estes trabalhos será facilitada;

• Possibilita o desenvolvimento de métodos de análise de situações clínicas reais com di-versos exemplos de arritmias que podem ser utilizados quantas vezes necessário;

• Anotações realizadas por profissionais facilitam a segmentação dos complexos QRS edão mais credibilidade a base de dados.

Entretanto, para que possamos executar o processo inteiramente sem o auxílio humano,é necessário que os complexos QRS sejam determinados automaticamente, possibilitando aextração e segmentação automática. A Seção 4.3 aborda o tema da detecção automática decomplexos QRS e o algoritmo utilizado neste trabalho.

4.3 Detecção do Complexo QRS

Afim de desenvolver dispositivos de monitoramento remoto, algumas etapas são neces-sárias. Para que sejam analisados os batimentos, o complexo QRS deve ser analisado, para

43

nós humanos, esta é uma tarefa trivial, entretanto para as máquinas esta não é uma tarefa sim-ples, não apenas por sua variação fisiológica, mas também pelos vários tipos de interferênciasque podem estar presentes no sinal. Estas interferências podem ter origens distintas, desde omovimento dos músculos, movimentação dos eletrodos, entre outros. (Pan & Tompkins, 1985)

Em 2002, Kohler et al. (2002) já consideraram que há 40 anos, diversos algoritmos para adetecção do complexo QRS foram propostos. Diversas abordagens, desde redes neurais, algorit-mos genéticos, transformadas, banco de filtros, métodos heurísticos e métodos de aprendizadode máquina. Atualmente, ao longo de 60 anos podemos imaginar a vasta gama de algoritmosdesenvolvidos para este fim.

Neste sentido, Álvarez et al. (2013) fizeram um estudo sobre algoritmos de detecção deQRS, para melhor comparação, são implementados três algoritmos: Pan & Tompkins (1985),Hamilton & Tompkins (1986) e um algoritmo baseado na transformação fasorial Martínez et al.(2010). Segundo (Álvarez et al., 2013) o algoritmo com melhor performance dentre estes é ode Pan & Tompkins, o qual foi escolhido para utilização neste trabalho, o funcionamento destealgoritmo é apresentado na Seção 4.3.1.

4.3.1 Pan & Tompkins (1985)

Baseado na análise digital da inclinação, amplitude e comprimento do sinal, este algo-ritmo é dividido em quatro etapas, Filtro passa Banda, Filtro Derivativo, Sinal elevado ao Qua-drado e Integração por Janela Deslizante. O sinal original utilizado é apresentado na Figura4.2.

O primeiro passo é aplicar o filtro passa banda (5-15 Hz), composto por um filtro passabaixa e um filtro passa alta, apresentados nas Equações 4.1 e 4.2 respectivamente, sendo y obuffer de sinais filtrados e x o buffer de sinais de entrada. O resultado de cada filtro aplicado aosinal original é apresentado nas Figuras 4.3 e 4.4.

y(nT ) = 2y(nT − T )− y(nT − 2T ) + x(nT )− 2x(nT − 6T ) + x(nT − 12T ) (4.1)

y(nT ) = 32x(nT − 16T )− [y(nT − T ) + x(nT )− x(nT − 32T )] (4.2)

Filtro derivativo para destacar o complexo QRS apresentado na Equação 4.3, o resultadodo filtro é apresentado Figura 4.5;

44

Figura 4.2: Sinal original

y(nT ) = (1/8T )[−x(nT − 2T )− 2x(nT − T ) + 2x(nT + T ) + x(nT + 2T )] (4.3)

O sinal é elevado ao quadrado utilizando a Equação 4.4, o resultado é apresentado naFigura 4.6;

y(nT ) = [x(nT )]2 (4.4)

É feita a integração por janela deslizante do sinal para obter informações sobre a formada onda e inclinação da onda R com a Equação 4.5, e o resultado é apresentado na Figura 4.7.

y(nT ) = (1/N)[x(nT − (N − 1)T + x(nT − (N − 2)T + ...+ x(nT )] (4.5)

Depois de aplicar os filtros, elevar o sinal ao quadrado e integrar, o passo seguinte é oalgoritmo de decisão responsável por detectar o complexo QRS. São utilizados dois grupos delimites, um deles é aplicado no sinal proveniente da derivação e outro no sinal integrado pelajanela deslizante. Esses limites são alterados conforme o ruído e picos detectados.

45

Figura 4.3: Sinal após filtragem passa baixa

São utilizados limites duplos afim de detectar batidas perdidas e reduzir falsos positi-vos. Se não for encontrado nenhum complexo em um tempo correspondente a 166% do tempoequivalente ao intervale R–R médio, o pico máximo é considerado um QRS.

Cada intervalo de QRS só é detectado a cada 200ms, visto que não há possibilidade deque um QRS ocorra neste tempo.

4.3.2 Chen & Chen (2003)

O trabalho apresentado por Chen & Chen (2003) apresenta uma simplificação do algo-ritmo de Pan & Tompkins (1985). O algoritmo simplificado é dividido em três etapas, quesão: uma filtragem de passa alta linear, uma filtragem de passa baixa não linear e uma etapade tomada de decisão. O algoritmo acentua o complexo QRS e suprime ondas indesejadas deECG com a filtragem de passas altas. O algoritmo também intensifica as informações sobre ainclinação e o comprimento do complexo QRS, através do filtro de passa baixa, que é compostopor uma elevação ao quadrado de cada ponto seguido de uma integração por janela deslizante.Por fim, na etapa de tomada de decisão, é utilizado um threshold adaptativo. O algoritmo deChen & Chen (2003) alcançou VPP de 99,50% utilizando parâmetros de ajuste do threshold.

46

Figura 4.4: Sinal após filtragem passa alta

Para a avaliação inicial dos modelos, optou-se pela segmentação dos complexos QRS dabase de dados utilizando as marcações e informações presentes no próprio banco de dados, oprocesso de segmentação para os modelos iniciais é apresentado na Seção 4.4, a detecção au-tomática é utilizada posteriormente para a implementação em hardware utilizando a linguagemC++.

4.4 Processamento dos Sinais

Além de filtrar os sinais, para desenvolvimento dos algoritmos de classificação de arrit-mias foi necessário separar cada complexo QRS do banco de dados, normalizar os trechos desinais, além de extrair medidas de complexidade, estimativa de dimensão fractal e entropia.

4.4.1 Normalizações

Com o tempo, distintas técnicas para normalização de series temporais foram desenvolvi-das, dentre elas estão: Normalização de Amplitude, Offset e Escala.

47

Figura 4.5: Sinal após filtro derivativo

4.4.1.1 Normalização de Offset

A normalização offset translada o eixo da ST para seu ponto médio, ou seja, consiste emrealizar a subtração de cada observação da série temporal com a média aritmética dessa série.

z′1 = zi − µ(Z) (4.6)

Onde Z é a ST a ser normalizada, µ(Z) é a média aritmética da ST Z e zi é a observaçãoda ST no ponto i e z′i é a observação normalizada da ST no instante i, o resultado da aplicaçãodesta normalização é apresentado na Figura 4.8.

4.4.1.2 Normalização de Amplitude: Origin

A normalização de Amplitude Origin nada mais é do que uma translação onde a ST étransladada para o ponto 0, ou seja, é feita a diferença entre o menor ponto da ST e o ponto0, esta diferença é aplicada a toda a ST, deste modo, o menor ponto da ST passa a ser 0, umexemplo é apresentado na Figura 4.9

48

Figura 4.6: Sinal após ser elevado ao quadrado

z′i =(zi − µ(Z))

σ(Z)(4.7)

Onde Z é a ST, Zi é a observação da ST no ponto i, z′i é a observação normalizada daST no ponto i,σ(Z) é o desvio padrão da ST, a Figura 4.9 apresenta a comparação entre a SToriginal e normalizada.

4.4.1.3 Normalização de Escala: Zero Axis

A normalização de escala consiste em re-escalar a ST para um intervalo, no caso da ZeroAxis, em um intervalo de 0 à 1, neste sentido, a ST pode ser deformada.

z′i =(zi −min(Z)

max(Z)−min(Z)(4.8)

Onde Z é a ST, Zi é a observação da ST no ponto i, z′i é a observação normalizada da STno ponto i, max(Z) é o maior valor da ST e min(Z) o menor valor. O resultado da aplicaçãodesta normalização é apresentado na Figura 4.10.

A avaliação das normalizações foi realizada anteriormente e é apresentada nos anexos,

49

Figura 4.7: Sinal após integração

Figura 4.8: Normalização OffsetFonte: Autor

para este trabalho, foi escolhida a normalização Origin por conveniência.

50

Figura 4.9: Normalização OriginFonte: Autor

Figura 4.10: Normalização Zero AxisFonte: Autor

4.4.2 Filtragem do Sinal

Inicialmente foi desenvolvido um script na linguagem R 3.O script monta um arquivo noformato arff.

Para realizar a leitura dos arquivos do banco de dados foi necessário a utilização das bi-bliotecas seewave e tuneR, tendo em vista que as gravações de cada paciente estão armazenadasem arquivos no formato wav. Dstas bibliotecas são responsáveis pela conversão do arquivoswav para um vetor normal dentro do R.

A conversão do arquivo wav para vetor foi realizada utilizando a função desenvolvida eapresentada no Algoritmo 1, de modo às anotações ficarem corretamente relacionadas com as

3https://www.r-project.org/

51

posições do vetor.

Algorithm 1 Conversão wav para vetor

procedure PARSEWAV(arquivo)wav = readWave(arquivo)wav = inputw(wave = wav)wav <- wav$wst <- wav/(max(abs(wav1))*1.5)return st

end procedure

Após a conversão, foram aplicados filtros passa alta e passa baixa, separando somente asfaixas de interesse, com isso diminuindo o ruído. Estes filtros são os mesmos utilizados por Pan& Tompkins (1985). O sinal original é apresentado na Figura 4.11, as equações do filtro sãoapresentadas em Equação 4.1 e Equação 4.2, o código implementado para o filtro é apresentadono Algoritmo 2 e o resultado do sinal filtrado é apresentado na Figura 4.12.

Figura 4.11: Sinal Original do Banco de Dados.Fonte: Autor

52

Figura 4.12: Sinal do Banco de Dados Filtrado com Passa Banda.Fonte: Autor

4.4.3 Segmentação do Sinal

Após a aplicação do filtro passa banda, foi realizada a separação de todos os locais deocorrência de QRS a partir das anotações providas pelo banco de dados, o tamanho do trechoescolhido para segmentação foi de 301 pontos na ST, sendo 100 anteriores ao pico do QRSe 200 posteriores incluindo o ponto atual (0.83 segundos), o suficiente para capturar a maiorparte da informação de um ciclo de batimentos (Ye et al., 2010). Um exemplo de sinal extraídoé apresentado na Figura 4.13.

Entretanto, nem todos os QRSs são utilizados, complexos QRS que não possuem outrosadjacentes válidos são ignorados, pois não podem ser utilizados devido a falta de informação,já que a distância entre duas ondas Rs é informação importante. A quantidade de complexosextraídos de cada classe pela segmentação é apresentada na Tabela 4.1.

4.4.4 Normalização

Os complexos QRS validados passam por normalização pelo método Origin, o trechode código utilizado para normalização é apresentado no Algoritmo 3, a Figura 4.14 apresenta

53

Algorithm 2 Filtro Passa Banda

procedure PASSA ALTA(st)N2 = length(x)+32y2 = rep(0,N2)y = c(rep(0,32), x)for i = 32...N2 do

value = 32*y[i-16] - ( y2[i-1] + y[i] - y[i-32])y2[i] = value

end forreturn (y2[33:length(x)])

end procedureprocedure PASSA BAIXA(st)

N1 = length(x+12)y = rep(0,N1+12)x1 = c(rep(0,12), x)for i = 13..N1 do

value = 2 * y[i-1] - y[i-2] + x1[i] - 2*x1[i-6] + x1[i-12]y[i] = value

end forreturn y[13:length(y)]

end procedureprocedure PASSA BANDA(st)

st = PassaBaixa(st)st = PassaAlta(st)

return stend procedure

Figura 4.13: Batimento ExtraidoFonte: Autor

o sinal extraído normalizado. É possível observar que as características morfológicas do sinalforam preservadas e que o sinal teve apenas seu eixo transladado para a origem, não interferindo

54

Tabela 4.1: Complexos QRS extraídos do Banco de Dados

Total Extraído Ignorados por não conterbatimentos adjacentes Total Utilizado

NORMAL 75.017 2.701 72.316APC 2.546 138 2.408PVC 7.129 802 6.327NAPC 193 4 189FUSION 802 28 774NESC 229 61 168LBBB 8.072 105 7.967ABERR 150 3 147NPC 83 7 76RBBB 7.255 197 7.058FLWAV 472 12 460VESC 106 2 104Total 102054 4560 97994

no formato da onda.

Algorithm 3 Normaliza

procedure NORMALIZA(st)min = min(st)st = st - minreturn st

end procedure

Figura 4.14: Batimento Extraído e NormalizadoFonte: Autor

55

4.4.5 Medidas de Complexidade

Antes de prosseguir, precisamos definir o que será entendido por "Medidas de Complexi-dade"neste trabalho, esta definição é apresentada abaixo:

Medidas de Complexidade: São medidas de Dimensão Fractal, Entropia, Estatística eCaracterísticas de uma ST.

A extração das medidas de complexidade baseadas em dimensão fractal foi feita utili-zando funções da biblioteca fractaldim4. A Tabela 4.2 apresenta as medidas utilizadas no tra-balho e a função utilizada para a extração de cada.

Tabela 4.2: Medidas de dimensão fractal utilizadas

Medida FunçãoBox Counting fd.estim.variogram(st)$fdVariogram fd.estim.variogram(st)$fdMadogram fd.estim.madogram(st)$fd)Rodogram fd.estim.rodogram(st)$fdVariation fd.estim.variation(st)$fdIncr1 fd.estim.incr1(st)$fdHallwood fd.estim.hallwood(st)$fdPeriodogram fd.estim.periodogram(st)$fdWavelet fd.estim.wavelet(st)$fdDctII fd.estim.dctII(st)$fdKatz Algoritmo 4Complexidade Estimada Algoritmo 5

Para os estimadores baseados em variância, o parâmetro p da equação 3.10 são definidoscomo:

• Variogram : p = 2 ;

• Madogram : p = 1;

• Rodogram : p = 1/2;

Para a extração das medidas foram utilizados majoritariamente funções da biblioteca frac-taldim. Entretanto, para a estimativa Katz e Complexidade estimada foram desenvolvidas fun-ções apresentadas.

Para extração das medidas de entropia foram utilizadas funções da biblioteca entropy5, asmedidas de entropia e suas respectivas funções utilizadas neste trabalho foram entropy.empirical

4https://cran.r-project.org/web/packages/fractaldim/fractaldim.pdf5https://cran.r-project.org/web/packages/entropy/entropy.pdf

56

Algorithm 4 Katz

procedure EXTRACTKATZ(st)L <- 0for i 1..length(st)-1 do

L <- L + (dist(rbind(st[i], st[i+1] , "euclidean")))[1]end forp1 <- st[1]

d <- Inffor j 2..length(st) do

if dist(rbind(p1, serie[i] , "euclidean")))[1] < d) thend <- (dist(rbind(p1, serie[i] , "euclidean")))[1]

end ifend forD <- log(L,10)/log(d,10)return D

end procedure

Algorithm 5 Complexidade Estimada

procedure EXTRACTCOMPLEXIDADE(st)CE <- sqrt(sum(diff(st)2))return CE

end procedure

para Entropia Empírica e entropy.MillerMadow para Entropia de Shannon com correção deMiller-Madow, mais informações sobre a implementação destes métodos estão disponíveis nomanual da biblioteca entropy (Hausser & Strimmer, 2014).

Além das medidas, foram extraídas Distância do QRS anterior e Distância do QRS pos-terior. Para realizar o cálculo da distância do QRS anterior e do QRS posterior foram utilizadasas marcações da base de dados. Para a distância do QRS anterior, subtraiu-se a posição do vetordo batimento atual pela posição do vetor do QRS anterior, e para a distância do QRS poste-rior subtraiu-se a posição do vetor do batimento posterior com a posição do vetor do batimentoatual.

Algumas medidas estatísticas também foram calculadas, sendo essas Média Equação 4.9utilizando a função mean, Desvio Padrão Equação 4.10 utilizando a função sd, Mediana utili-zando a função median e Valor Eficaz Equação 4.11 utilizando a função rms.

x =1

n

n∑i=0

xi (4.9)

dp =

√√√√ 1

n

n∑i=0

xi − x (4.10)

57

rms =

√√√√ 1

n

n∑i=0

x2i (4.11)

Este processo foi realizado duas vezes, uma com extração apenas do trecho do sinal, deno-minada ST, e outra contendo apenas as medidas. No final do pre-processamento foram geradosdois arquivos arff, um para as medidas e outro para a ST. Adicionalmente ambas abordagensforam concatenadas, ou seja, para cada classe foram concatenadas as medidas de complexidadecom o sinal extraído, esta abordagem foi denominada Híbrida.

Após a segmentação dos dados e extração de características, foram utilizados diversosalgoritmos de AM, a partir dos quais foram gerados diversos modelos diferentes. Os algoritmosutilizados para classificação são apresentados na Seção 4.5.

4.5 Algoritmos de Classificação

No Capitulo 3 explicamos a base dos algoritmos. Neste capítulo serão apresentados osalgoritmos de fato utilizados neste trabalho e suas configurações, todos os algoritmos são imple-mentados pela ferramenta Weka6, que por sua vez, possui código aberto e livre sobre a licençaGNU/GPL3.07, a partir do modelo gerado, o algoritmo de classificação foi implementado nalinguagem C++.

Neste trabalho foram utilizados três algoritmos de AM: random forests, multilayer per-ceptron e árvore de decisão J48. Inicialmente, duas formas de segmentação e pré-processamentodos sinais de ECG foram utilizadas, cálculos de medidas de Dimensão Fractal, Entropia e Esta-tística, denominada Medidas de Complexidade (Medidas), e, que utiliza apenas o sinal filtradoe normalizado, denominada Série Temporal (ST). Além disso, foram integradas as duas abor-dagens, Medidas e ST, denominada de Híbrida.

Adicionalmente, para implementação no hardware, tendo em vista que o hardware devegerar alarmes apenas quando há risco real, as classes NORMAL. LBBB e RBBB foram agrupa-das como uma nova classe denominada NORMAL e as classes ABERR, PVC, FUSION, NPC,APC, VESC, NESC. FLWAV, NAPC foram agrupadas em outra classe denominada ALARM,devido a estes novos agrupamentos, a base de dados foi submetida novamente aos algoritmosde AM.

6https://www.cs.waikato.ac.nz/ml/weka/7https://www.gnu.org/licenses/gpl-3.0.html

58

4.5.1 Árvore de Decisão J48

O algoritmo J48 é uma implementação do algoritmo C4.5 (Quinlan, 1993), feita paraa aplicação Weka. O C4.5 constrói árvores de decisão a partir de um conjunto de dados detreinamento, da mesma forma que o algoritmo ID3 (Quinlan, 1986), utilizando o conceito deEntropia.

Para a construção da árvore, um conjunto de dados de treinamento S = s1, s2, ... deamostras já classificadas é utilizado. Cada amostra si consiste de um vetor p-dimensional(x1,i, x2,i, ..., xp,i), onde o xj representa valores de atributos ou características da amostra, assimcomo a categoria ou a classe a qual si pertence. O C4.5 apresenta uma série de melhorias aoalgoritmo ID3. Algumas destas melhorias são:

• Lidar com atributos contínuos e discretos;

• Lidar com dados de treinamento com atributos incompletos;

• Lidar com atributos com diferentes custos;

• Poda de árvores após a criação.

Em cada nó da árvore, é escolhido o atributo que mais efetivamente particiona o seuconjunto de amostras em subconjuntos tendendo a uma classe ou a outra. O critério de par-ticionamento é o ganho de informação normalizado (diferença em entropia). O atributo commaior ganho de informação normalizado é escolhido para tomar a decisão. Então repete a etapaanterior nas partições menores. Este algoritmo possui alguns casos básicos:

• Todas as amostras do conjunto pertencem a uma mesma categoria: cria um nó folha paraa árvore de decisão e escolhe a categoria em questão;

• Nenhuma das características fornece ganho de informação: cria um nó de decisão árvoreacima usando o valor esperado;

• Instâncias previamente não vistas: Cria um nó de decisão árvore acima usando o valoresperado.

Dado estes casos básicos, pseudo código do algoritmo é apresentado no Algoritmo 6.

Os parâmetros utilizados no Weka Foram:

• Número mínimo de instâncias por folha (-M): 2;

• Número de Folds para redução de erro (-N): 3;

• Limite de confiança para poda (-C): 0.25.

Para mais informações sobre os parâmetros consulte o manual do J488.8https://weka.sourceforge.io/doc.dev/weka/classifiers/trees/J48.html

59

Algorithm 6 C4.5

Require: Dataset com atributos valorados Dif D pertence a um caso básico then

terminateend iffor all atributo a ∈ D do

Calcula informações teóricas para saber se vai dividir em aend foramelhor = Melhor atributo de acordo com o critério computadoTreev = Cria um nó de decisão que testa amelhor na raizDv = Sub-datasets de D baseados em abestfor all Dv do

Treev = C4.5(Dv)Anexa Treev ao galho correspondente de Tree

end forreturn Tree

4.5.2 Random Forests

O Random Forests é um algoritmo de AM Ensembled9 que pode ser utilizado para classi-ficação, regressão e outras tarefas. Funciona com a construção de múltiplas árvores de decisãona fase de treino, neste sentido, para a classificação, o resultado é a moda das classes e pararegressão a média das arvores. O Random Forests corrige o problema das árvores de decisãoclássicas de Overfitting10.

O algoritmo funciona do seguinte modo, para cada árvore na floresta, é selecionado umaamostra do bootstrap de S, onde Si denota a iésima amostra de bootstrap. Então, é construídauma árvore de decisão usando um algoritmo de aprendizado de árvore de decisão modificado.Este algoritmo modificado, ao invés de passar por todos os atributos (F ), seleciona aleatori-amente alguns subsets de atributos f ⊆ F . Então, o nó com a melhor característica em f édividido, um pseudo código do algoritmo é apresentado no Algoritmo 7.

Os parâmetros utilizados para o Random Forest no Weka foram:

• Tamanho de cada saco, em relação a percentagem do tamanho do conjunto de treinamento(-P): 100;

• Numero de Iterações (-I): 100;

• Número de slots de execução (-num-slots) 1;

• Número de atributos para investigar aleatoriamente (-K): 0;

• Número mínimo de instâncias por folha (-m): 1.0;

9Ensembled: Conjunto de classificadores treinados individualmente cujas decisões são de alguma forma com-binadas (Marqués et al., 2012).

10Overfitting é o ajuste demasiado dos dados de treinamento.

60

Algorithm 7 Random Forest

Require: Dataset com atributos valorados S := (xi, yi), .... , (xn, yn), atributos F e numero dearvores na florestaprocedure RANDOMFOREST(S, F )

H = 0for i = 0...B do

Si = Amostra do bootsrap de Shi = RandomizedTreeLearn(Si, F )H = HUhi

end forreturn H

end procedureprocedure RANDOMIZEDTREELEARN(S, F )

for all node ∈ S dof = subset muito pequeno de FDivide no melhor atributo

end forreturn ArvoreAprendida

end procedure

• Proporção mínima de variação da classe numérica para divisão (-V): 0.001;

• Seed de aleatoriedade (-S): 1.

Para mais informações sobre os parâmetros consulte o manual do Random Forests 11.

4.5.3 Multilayer Perceptron

Tendo em vista que Perceptrons comuns resolvem apenas problemas linearmente sepa-ráveis, o Multilayer Perceptron (MLP) é um classificador que utiliza Backpropagation comométodo de aprendizado, possui múltiplas camadas de neurônios artificiais e cada um destespossui função de ativação sigmoidal. Nas redes MLP, os neurônios são agrupados em camadas.Essa rede é composta por uma camada de entrada, zero ou mais camadas ocultas, e a camada desaída. Uma MLP com uma camada oculta pode aproximar de qualquer função contínua, comduas camadas ocultadas é possível a aproximação de qualquer função (Braga, 2007).

Um item importante das redes MLP é a função de ativação, que foi introduzida nas redesMLP para resolver o problema do ajuste do peso e do bias, que antes das funções de ativação,um pequeno ajuste nos pesos e no bias de redes MLP poderiam causar mudanças drásticas nasaída de rede. Com as funções de ativação, tem-se apenas uma pequena mudança no peso e nobias da rede. As funções de ativação têm como objetivo tomar a decisão se um neurônio deveser ativado ou não. Elas usam o sinal de entrada e o aplica em uma função não linear. A saída

11https://weka.sourceforge.io/doc.dev/weka/classifiers/trees/RandomForest.html

61

dessa função serve como entrada para a próxima camada de neurônios. Existem vários tiposde funções de ativação, que devem ser utilizadas em diferentes situações (Mitchell, 1997b), narede MLP utilizada todas os nós possuem função sigmoidal.

Os parâmetros utilizados na Weka foram:

• Taxa de aprendizado (-L): 0.3;

• Taxa de momentum (-M): 0.2;

• Número de épocas (-N): 500;

• Percentual da validação para finalizar o treinamento(-V): 0;

• Seed de Aleatoriedade (-S): 0;

• Numero de aumento de erro permitido para validação (-E): 20;

• Número de camadas ocultas (-H): a.

Para mais informações sobre os parâmetros consulte o manual da MLP 12.

Entretanto, apenas gerar um modelo não é o suficiente, é necessário que este modelo sejaavaliado em relação a sua performance, neste sentido, um algoritmo de validação é a abordagemmais comum utilizada, o algoritmo utilizado neste trabalho é apresentado na Seção 4.6

4.6 Algoritmos de Validação

Para validar um modelo, deve-se avaliar sua performance quando exposto a dados aosquais ele ainda não foi exposto anteriormente. Para isso, utilizam-se técnicas de validação, estastécnicas dividem a base de dados em treino e teste, uma destas técnicas é o k-Fold StratifiedCross Validation (SVC).

4.6.1 k-Fold Stratified Cross Validation

Esta técnica utiliza a estratificação ao dividir as amostras em k-folds, ou seja, dividir a basede dados em k-folds onde as proporções de classe são preservadas em cada fold para garantirque cada fold seja representativo das proporções de classe no conjunto de dados original.

Para realizar a validação, o algoritmo em questão é executado k-vezes utilizando k-1 foldspara treinamento e 1 fold para teste. Cada fold é utilizado uma vez para teste e k-1 vezes paratreino. Este processo é explicado na Figura 4.15, onde a amostra destacada em amarelo é usadacomo teste e as outras são usadas como treino.

12https://weka.sourceforge.io/doc.dev/weka/classifiers/functions/MultilayerPerceptron.html

62

Figura 4.15: Stratified Cross Validation (SCV)Fonte: http://wikimedia.org/

Após gerar o modelo e avaliá-lo, um hardware será necessário para que o mesmo sejautilizado. O hardware e a arquitetura proposta por este trabalho é apresentado na Seção 4.7.

4.7 Hardware

Esta seção irá apresentar o hardware utilizado para implementação do dispositivo e re-alização dos testes dos algoritmos embarcados. Dois dispositivos de Hardware foram desen-volvidos, um para classificação de complexos QRS e outro para simulação de sinal ECG. ASeção 4.7.1 apresenta o hardware desenvolvido para classificação e a Seção 4.7.2 apresenta ohardware desenvolvido para o simulador.

4.7.1 Hardware do Classificador

O microcontrolador escolhido para o a implementação do classificador foi o ESP32, apre-sentado na Seção 4.7.3, para ser utilizado em conjunto com a placa de captura AD8232, apresen-tada na Seção 4.7.4, com o objetivo de aquisição de dados de ECG. A Figura 4.16 exemplificaa arquitetura proposta para o classificador.

63

Figura 4.16: Proposta de Hardware para Captura.Fonte: Autor

O software embarcado no hardware de classificação divide o trabalho em duas Threads,uma responsável pela aquisição do sinal ECG, via ADC, e outra que processa o sinal e encontracomplexos QRS, utilizando o algoritmo proposto por Chen & Chen (2003), segmenta, processae classifica o sinal.

O algoritmo de Chen & Chen (2003) utilizado neste trabalho é implementado por BlakeMilner e está disponível no github13.

O Algoritmo 8 apresenta o pseudo código da aquisição de dados e classificação do ECGutilizando a placa de captura AD8232.

4.7.2 Hardware do Simulador

O simulador utiliza um ESP32, apresentado na Seção 4.7.3, em conjunto com o conversorDigital Analógico (DAC) MCP4725, apresentado na Seção 4.7.5, para realizar a simulação. Ohardware deve estar conectado a Internet, assim que conectado, executa uma rotina de down-load de dados. Todos os dados são obtidos através do sistema disponibilizado pela Physionet14,que disponibiliza uma grande variedade de bancos de dados médicos, incluso o MIT-BIH Ar-rhythmia Database, neste sentido, a API disponibiliza diversas funcionalidades para consultados bancos de dados, a Figura 4.17 exemplifica a arquitetura proposta para o simulador.

O software embarcado no hardware de simulação divide o trabalho em duas Threads, aprimeira, faz a aquisição dos dados de ECG via API da Physionet, um pseudocódigo é apresen-tado no Algoritmo 9.

A segunda thread faz o controle do MCP4725 e realiza a simulação dos dados obtidospela thread de aquisição, para realizar a simulação é utilizado DAC MCP4725, um pseudocódigo desta thread é apresentado no Algoritmo 10.

Um esquemático exemplificando a conexão entre o ESP32 e o MCP4725 é apresentado

13https://github.com/blakeMilner/real_time_QRS_detection14http://physionet.org/lightwave/doc/lw-api.html

64

Algorithm 8 Captura ECG

procedure CAPTURAECG

array ecgprimeiroQrs = truesegundoQrs = falseqrsAnterior = 0while true do

new_data = AD8232.read()isQrs = DetectQrs(new_data)posicaoArray = array.add(newdata)tempoInicialMs = tempoAtualMsif isQrs then

qrsAnterior = posicaoArrayif primeiroQrs then

primeiroQrs = falsesegundoQrs = truecontinue

end ifif segundoQrs then

segundoQrs = falsecontinue

end ifclassificaQrs(ecg[qrsAnterior-100:qrsAnterior+200])

end ifEspera(3 - tempoAtualMs - tempoInicialMs)

end whileend procedure

Figura 4.17: Proposta de SimuladorFonte: Autor

na Figura 4.18, onde é possível observar que se trata de uma ligação simples que pode serexecutada por qualquer pessoa com o mínimo de conhecimento em eletrônica de circuitos, oque possibilita a replicação deste simulador de forma rápida e barata, dado o fato que utilizauma API públicas e gratuita sobre a licença GPL/2.015, onde qualquer um é livre para usar e

15http://www.gnu.org/licenses/old-licenses/gpl-2.0-standalone.html

65

Algorithm 9 Recupera Base de Dados

Require: URL do Database url, Parte do Sinal partprocedure RETRIEVEINFORMATION(url, part, array)

data = fetch_database(url, part)samples = data[’fetch’][’signal’][’samp’]base = data[’fetch’][’signal’][’base’]gain = data[’fetch’][’signal’][’gain’]for all item ∈ samples do

if item é o primeiro elemento? thenlast_item = itemarray.add((item - base)/gain

elselast_item = last_item + itemarray.add((last_value - base)/gain

end ifend for

end procedure

Algorithm 10 Simula Sinal ECG

Require: Url da API lightwave url, Numero do Paciente pacienteprocedure SIMULAECG(url, paciente)

url = BuildUrlQuery(url, paciente)integer ecg_part = 1short ecg_1short ecg_2integer array_part_max = 1805for ecg_part = 0→ array_part_max do

if using_ecg_1 thenusing_ecg_1 = falsesignal = ecg_2OpenThread: RetrieveInformation(url, ecg_part, ecg_1)

elseusing_ecg_1 = truesignal = ecg_1OpenThread: RetrieveInformation(url, ecg_part, ecg_2)

end iffor all item ∈ signal do

set_voltage_output(item)end forecg_part = ecg_part + 1

end forend procedure

copiar, neste sentido, um servidor do LightWave pode ser instalado localmente para otimizar oprocesso de download do simulador.

66

Figura 4.18: Esquemático do SimuladorFonte: Autor

Para este trabalho, o simulador foi desenvolvido com aspectos direcionados especifica-mente para a base de dados MIT-BIH Arrhythmia Database, entretanto, com pequenos ajustespode ser utilizado para simular qualquer base de dados presente na API do Lightwave.

4.7.3 System On Chip - ESP32

Mais poderoso que seu antecessor, o ESP32 possui dois núcleos possibilitando o proces-samento paralelo, esta característica o torna ideal para a realização de duas tarefas simultanea-mente facilitando a implementação de algoritmos mais complexos.

• Processador: Xtensa R© Dual-Core 32-bit LX6;

• Memória Flash programável: 4MB;

• Memória RAM: 520KBytes;

• Memória ROM: 448KBytes;

• Clock máximo: 240MHz;

• Pinos Digitais GPIO: 11 (todos com PWM);

• Resolução do PWM: até 16 bits;

• Wireless 802.11 b/g/n

• Bluetooth Low Energy padrão 4.2 integrado;

67

• Tensão de alimentação externa: 4,5V a 9V.

4.7.4 Single Lead Heart Rate Monitor - AD8232

O AD8232, funciona como um amplificador operacional para ajudar a obter um sinal deECG mais claro. O AD8232 foi projetado para extrair, amplificar e filtrar pequenos sinais bio-potenciais em condições ruidosas, como por exemplo quando posiciona-se eletrodos (Devices,2012).

Gifari et al. (2015) conseguem utilizar este sensor para extrair 12 derivações do sinalECG. Neste sentido, este sensor torna-se muito versátil, pois permite que sejam desenvolvidosmétodos que utilizem qualquer uma destas derivações. Além disso, diversos trabalhos utilizameste sensor para captura de dados de ECG.

Na Figura 4.19 é apresentada uma imagem da captura de sinais ECG feita pelo móduloAD8232.

Figura 4.19: Captura ECG de um batimento normalFonte: Autor

4.7.5 Conversor Digital Analógico - MCP4725

O MCP4725 é um Conversor Digital para Analógico (DAC - Digital to Analog Converter)de 12 bits de precisão capaz de realizar a conversão de sinais digitais em sinais analógicos,desta forma, é possível simular um cenário real baseado em informações previamente coletadas.Algumas características deste Circuito Integrado (CI) são:

68

• Amplificador de saída configurável;

• Memória EEPROM interna para armazenar as configurações;

• Baixo consumo de energia;

• Tempo de set de tensão de saida 6 µs;

• Tensão de entrada: 2,7 a 5,5V;

• Resolução: 12-bits;

• Interface: I2C (padrão (100 kHz), rápida (400 kHz) ou alta velocidade (3,4 MHz).

(Mic, 2007)

4.8 Avaliação do Modelo

Para realizar a avaliação dos modelos a partir das bases de dados geradas anteriormente,cada algoritmo de AM foi executado 10 vezezs, para cada execução, a seed de aleatoriedade foimodificada, ao modificar esta seed.

O algoritmo de validação realiza a divisão da base de dados baseada na seed de aleatorie-dade, ou seja, a cada vez que um novo valor é atribuído, este algoritmo divide os conjuntos detreino e teste novamente. Desta forma, pode-se calcular o desvio padrão entre estas execuçõespara que a consistência do modelo possa ser avaliada.

Este trabalho utiliza os três algoritmos de AM apresentados anteriormente e realiza esteprocesso de dez execuções para cada abordagem, Medidas de Complexidade e Série Temporal.

Após a execução destes, uma nova abordagem que concatena a ST com as medidas decomplexidade foi avaliada com o mesmo processo.

Adicionalmente, foram agrupados os complexos NORMAL, LBBB e RBBB em umaclasse denominada NORMAL e os outros complexos em uma classe denominada ALARM,para este agrupamento foram executados os algoritmos J48 e RF utilizando as abordagens ST,MEDIDAS e Híbrido.

Capítulo 5

Resultados

Neste capitulo serão apresentados os resultados separadamente dosalgoritmos de classifi-cação de arritmias e da geração de alarmes das seguintes técnicas:

• J48 Série Temporal;

• J48 Medidas de Complexidade;

• MLP Série Temporal;

• MLP Medidas de Complexidade;

• RF Série Temporal;

• RF Medidas de Complexidade;

• RF Hibrido.

Após a apresentação dos resultados separadamente por técnica, são mostrados os diferentesdesempenhos para as seguintes classes:

• NORMAL;

• LBBB;

• RBBB;

• ABERR;

• PVC;

• FUSION;

• NPC;

• APC;

• VESC;

• NESC;

• FLWAV;

• NAPC.

69

70

Em relação a alarmes, foram consideradas as seguintes técnicas:

• J48 Série Temporal para Alarmes;

• J48 Medidas de Complexidade para Alarmes;

• J48 Híbrido para Alarmes;

• RF Série Temporal para Alarmes;

• RF Medidas de Complexidade para Alarmes;

• RF Híbrido para Alarmes.

Os algoritmos foram avaliados utilizando o banco de dados do MIT-BIH, não tendo sidorealizados em tempo real no hardware de aquisição.

5.1 Resultados para J48

Esta seção apresenta os resultados obtidos utilizando o algoritmo J48. Está divida emduas partes: resultados para a abordagem utilizando Medidas de Complexidade e resultadospara abordagem utilizando Série Temporal.

5.1.1 Resultados para J48 Medidas de Complexidade

Os resultados para J48 Medidas de Complexidade são apresentados na Tabela 5.1, ondeencontram-se a média e o desvio padrão das 10 execuções do Valor Preditivo Positivo (VPP)e Sensibilidade (VSE). Para facilitar a visualização e comparação dos resultados de acerto porclasse, os valores médios foram plotados em um gráfico de barras na Figura 5.1.

71

Tabela 5.1: VSE e VPP, por classe, para abordagem J48 Medidas

Média do VSE DP do VSE (DP) Média do VPP DP do VPPNORMAL 98,54 0,05 97,98 0,04LBBB 94,25 0,17 94,97 0,29RBBB 97,03 0,18 97,41 0,14ABERR 53,46 3,49 60,89 4,50PVC 93,29 0,18 93,63 0,23FUSION 64,17 1,31 72,96 0,81NPC 35,65 1,92 52,73 4,55APC 85,51 0,39 89,56 0,31VESC 90,74 1,03 93,68 1,78NESC 37,73 3,50 52,95 2,99FLWAV 93,35 0,56 95,62 0,53NAPC 92,07 0,97 94,16 1,78Média Ponderada 96,91 0,06 96,81 0,07

Figura 5.1: VSE por classe, para J48 MedidasFonte: Autor

72

5.1.2 Resultados para J48 Série Temporal

Para J48 Série Temporal, os resultados são apresentados na Tabela 5.2, a qual apresenta asmédias e os DPs do VPP e do VSE. A Figura 5.2 mostra os valores médios plotados em gráficode barras.

Tabela 5.2: VSE e VPP, por classe, para abordagem J48 ST

Média do VSE DP do VSE Média do VPP DP do VPPNORMAL 98,80 0,07 98,17 0,05LBBB 97,21 0,12 97,23 0,20RBBB 97,03 0,14 97,26 0,15ABERR 44,09 2,27 50,89 3,37PVC 91,68 0,20 92,17 0,34FUSION 69,31 0,96 75,91 0,89NPC 29,72 3,12 36,93 3,42APC 77,19 0,68 83,81 0,85VESC 84,04 2,14 87,43 3,79NESC 22,79 3,21 29,73 5,03FLWAV 64,65 2,12 74,35 2,41NAPC 81,43 2,96 89,30 2,22Media Ponderada 96,85 0,05 96,74 0,05

Figura 5.2: VSE por classe, para J48 STFonte: Autor

73

5.2 Resultados para MLP

5.2.1 Resultados para MLP Medidas de Complexidade

Os resultados para MLP Medidas de Complexidade estão apresentados na Tabela 5.4, queapresenta as médias e os DPs de VPP e VSE. Os valores médios foram plotados em um gráficode barras, apresentado na Figura 5.3.

Tabela 5.3: VSE e VPP, por classe, para abordagem MLP MedidasMédia do VSE DP do VSE Média do VPP DO do VPP

NORMAL 98,84 0,08 96,45 0,19LBBB 93,88 0,65 92,62 1,00RBBB 77,72 2,61 95,48 6,33ABERR 30,08 4,33 59,06 4,81PVC 91,69 0,50 90,01 1,03FUSION 42,68 3,75 62,63 6,26NPC 9,88 3,77 1,49 0,49APC 66,80 1,88 89,49 1,45VESC 87,10 3,67 69,43 18,41NESC 3,23 1,79 15,85 12,78FLWAV 87,39 1,84 86,97 1,92NAPC 77,39 4,71 77,46 2,64Média Ponderada 94,77 0,16 93,87 3,53

Figura 5.3: VSE por classe, para MLP STFonte: Autor

74

5.2.2 Resultados para MLP Séries Temporais

Para MLP Séries Temporais, os resultados são apresentados na Tabela 5.4, tem-se asmédias e os DPs do VPP e do VSE. Os valores médios foram plotados em um gráfico de barrase apresentados na Figura 5.4.

Tabela 5.4: VSE e VPP, por classe, para abordagem MLP ST

Média do VSE DP do VSE Média do VPP DP do VPPNORMAL 99,61 0,09 97,76 0,13LBBB 98,70 0,13 98,19 0,21RBBB 96,05 0,76 96,37 1,36ABERR 10,66 4,76 53,84 19,48PVC 95,36 0,35 94,73 0,54FUSION 74,04 1,05 89,18 0,75NPC 5,78 3,47 29,34 19,29APC 51,90 6,25 89,44 3,53VESC 86,25 4,28 84,43 4,56NESC 1,32 1,83 14,92 18,39FLWAV 81,25 2,93 72,10 8,49NAPC 47,78 11,22 74,58 14,97Média Ponderada 97,04 0,17 96,78 0,24

Figura 5.4: VSE por classe, para MLP STFonte: Autor

75

5.3 Resultados para RF

5.3.1 Resultados para RF Medidas de Complexidade

Os resultados para RF Medidas de Complexidade estão em duas tabelas. A Tabela 5.5apresenta as médias e os DPs de VPP e VSE. Os valores médios foram plotados em um gráficode barras apresentados na Figura 5.5.

Tabela 5.5: VSE e VPP para abordagem RF Medidas

Média do VSE DP do VSE Média do VPP DP do VPPNORMAL 99,70 0,00 98,14 0,05LBBB 96,16 0,05 98,98 0,04RBBB 98,26 0,05 99,18 0,06ABERR 55,78 0,96 90,40 1,29PVC 96,01 0,12 96,85 0,08FUSION 64,13 0,48 91,31 0,55NPC 28,27 1,44 99,58 1,33APC 85,21 0,20 98,09 0,23VESC 94,30 0,32 99,00 0,00NESC 26,38 1,30 85,96 2,69FLWAV 96,21 0,42 99,67 0,12NAPC 91,32 0,52 99,35 0,16Média Ponderada 98,19 0,03 98,11 0,03

Figura 5.5: VSE por classe, para RF MedidasFonte: Autor

76

5.3.2 Resultados para RF Séries Temporais

Os resultados para RF Séries Temporais são apresentados na Tabela 5.6 apresenta as mé-dias e os DPs de VPP e VSE. Os valores médios foram plotados em um gráfico de barras naFigura 5.6.

Tabela 5.6: VSE e VPP para abordagem RF ST

Média de VSE DP de SE (DP) Média de VPP DP de VPPNORMAL 99,90 0,00 98,21 0,03LBBB 98,92 0,04 99,73 0,07RBBB 99,08 0,04 99,09 0,03ABERR 57,00 1,79 99,64 0,58PVC 95,44 0,07 96,70 0,05FUSION 70,51 0,39 93,82 0,59NPC 17,75 1,53 100,0 0,00APC 79,95 0,26 98,62 0,16VESC 89,23 1,07 98,51 0,53NESC 12,92 1,72 95,72 1,89FLWAV 71,44 0,67 99,37 0,26NAPC 87,13 0,86 100,0 0,00Media Ponderada 98,30 0,00 98,30 0,00

Figura 5.6: VSE por classe, para RF STFonte: Autor

77

5.4 Acerto por Classe

Visando facilitar a comparação, para cada classe foi traçado um gráfico com as taxas deacerto para cada abordagem (RF Medidas, RF ST, MLP Medidas, MLP ST, J48 Medidas e J48ST) e uma tabela com média e DP de VPP e VSE.

Os resultados da Classe NORMAL são apresentados na Figura 5.7 e na Tabela 5.7. En-quanto para LBBB estão na Figura 5.8 e na Tabela 5.8. Para a Classe RBBB os resultados sãoapresentados na Figura 5.9 e na Tabela 5.9. Já para a Classe ABERR os resultados estão naFigura 5.10 e na Tabela 5.10. A Figura 5.11 e a Tabela 5.11 expõem os resultados para a ClassePVC. Para a Classe APC os resultados são apresentados na Figura 5.14 e na Tabela 5.14. Osresultados para a Classe FUSION estão na Figura 5.12 e na Tabela 5.12. Para a Classe NPCos resultados são mostrados na Figura 5.9 e na Tabela 5.9. Enquanto a Figura 5.15 e a Tabela5.15 contém os resultados para a Classe VESC. Para a Classe NESC estão na Figura 5.16 e naTabela 5.16. A Classe NAPC têm seus resultados expostos na Figura 5.18 e na Tabela 5.18.Para a Classe FLWAV os resultados são apresentados na Figura 5.17 e na Tabela 5.17.

78

Figura 5.7: Percentual de acerto da classe NORMAL para as diferentes abordagensFonte: Autor

Tabela 5.7: VSE e VPP para classe NORMALMédia de VSE DP de VSE Média de VPP DP de VPP

J48 ST 98,80 0,07 98,17 0,05J48 Medidas 98,54 0,05 97,98 0,04RF ST 99,90 0,00 98,21 0,03RF Medidas 99,70 0,00 98,10 0,05MLP ST 99,61 0,09 97,76 0,13MLP Medidas 98,84 0,08 96,45 0,19

79

Figura 5.8: Percentual de acerto da classe LBBB para as diferentes abordagensFonte: Autor

Tabela 5.8: VSE e VPP para classe LBBB

Média de VSE DP de VSE Média de VPP DP de VPPJ48 ST 97,21 0,12 97,23 0,20J48 Medidas 94,25 0,17 94,97 0,29RF ST 98,92 0,04 99,73 0,07RF Medidas 96,16 0,05 98,98 0,04MLP ST 98,70 0,13 98,19 0,21MLP Medidas 93,88 0,65 92,62 1,00

80

Figura 5.9: Percentual de acerto da classe RBBB para as diferentes abordagensFonte: Autor

Tabela 5.9: VSE e VPP para classe RBBB para as diferentes abordagens

Média de VSE DP de VSE Média de VPP DP de VPPJ48 ST 97,03 0,14 97,26 0,15J48 Medidas 97,03 0,18 97,41 0,14RF ST 99,08 0,04 99,09 0,03RF Medidas 98,26 0,05 99,18 0,06MLP ST 96,05 0,76 96,37 1,36MLP Medidas 77,72 2,61 95,48 6,33

81

Figura 5.10: Percentual de acerto da classe ABERR para as diferentes abordagensFonte: Autor

Tabela 5.10: VSE e VPP para classe ABERR para as diferentes abordagens

Média de VSE Média de VSE Média de VPP DP de VPPJ48 ST 44,09 2,27 50,89 3,37J48 Medidas 53,46 3,49 60,89 4,50RF ST 57,00 1,79 99,64 0,58RF Medidas 55,78 0,96 90,40 1,29MLP ST 10,66 4,76 53,84 19,48MLP Medidas 30,08 4,33 59,06 4,81

82

Figura 5.11: Percentual de acerto da classe PVC para as diferentes abordagensFonte: Autor

Tabela 5.11: VSE e VPP para classe PVC

Média de VSE DP de VSE Média de VPP DP de VPPJ48 ST 91,68 0,20 92,17 0,34J48 Medidas 93,29 0,18 93,63 0,23RF ST 95,44 0,07 96,70 0,05RF Medidas 96,01 0,12 96,85 0,08MLP ST 95,36 0,35 94,73 0,54MLP Medidas 91,69 0,50 90,01 1,03

83

Figura 5.12: Percentual de acerto da classe FUSION para as diferentes abordagensFonte: Autor

Tabela 5.12: VSE e VPP para classe FUSION

Média de VSE DP de VSE Média de VPP DP de VPPJ48 ST 69,31 0,96 75,91 0,89J48 Medidas 64,17 1,31 72,96 0,81RF ST 70,51 0,39 93,82 0,59RF Medidas 64,13 0,48 91,31 0,55MLP ST 74,04 1,05 89,18 0,75MLP Medidas 42,68 3,75 62,63 6,26

84

Figura 5.13: Percentual de acerto da classe NPC para as diferentes abordagensFonte: Autor

Tabela 5.13: VSE e VPP para classe NPC

Média de VSE DP de VSE Média de VPP DP de VSEJ48 ST 29,72 3,12 36,93 3,42J48 Medidas 35,65 1,92 52,73 4,55RF ST 17,75 1,53 100,0 0,00RF Medidas 28,27 1,44 99,58 1,33MLP ST 5,78 3,47 29,34 19,29MLP Medidas 9,88 3,77 1,49 0,49

85

Figura 5.14: Percentual de acerto da classe APC para as diferentes abordagensFonte: Autor

Tabela 5.14: VSE e VPP para classe APC

Média de VSE DP de VSE Média de VPP DP de VPPJ48 ST 77,19 0,68 83,81 0,85J48 Medidas 85,51 0,39 89,56 0,31RF ST 79,95 0,26 98,62 0,16RF Medidas 85,21 0,20 98,09 0,23MLP ST 51,90 6,25 89,44 3,53MLP Medidas 66,80 1,88 89,49 1,45

86

Figura 5.15: Percentual de acerto da classe VESC para as diferentes abordagensFonte: Autor

Tabela 5.15: VSE e VPP para classe VESC

Média de VSE DP de VSE Média de VPP DP de VPPJ48 ST 84,04 2,14 87,43 3,79J48 Medidas 90,74 1,03 93,68 1,78RF ST 89,23 1,07 98,51 0,53RF Medidas 94,30 0,32 99,00 0,00MLP ST 86,25 4,28 84,43 4,56MLP Medidas 87,10 3,67 69,43 18,41

87

Figura 5.16: Percentual de acerto da classe NESC para as diferentes abordagensFonte: Autor

Tabela 5.16: VSE e VPP para classe NESC

Média de VSE DP de VSE Média de VPP DP de VSEJ48 ST 22,79 3,21 29,73 5,03J48 Medidas 37,73 3,50 52,95 2,99RF ST 12,92 1,72 95,72 1,89RF Medidas 26,38 1,30 85,96 2,69MLP ST 1,32 1,83 14,92 18,39MLP Medidas 3,23 1,79 15,85 12,78

88

Figura 5.17: Percentual de acerto da classe FLWAV para as diferentes abordagensFonte: Autor

Tabela 5.17: VSE e VPP para classe FLWAV

Média de VSE DP de VSE Média de VPP DP de VPPJ48 ST 64,65 2,12 74,35 2,41J48 Medidas 93,35 0,56 95,62 0,53RF ST 71,44 0,67 99,37 0,26RF Medidas 96,21 0,42 99,67 0,12MLP ST 81,25 2,93 72,10 8,49MLP Medidas 87,39 1,84 86,97 1,92

89

Figura 5.18: Percentual de acerto da classe NAPC para as diferentes abordagensFonte: Autor

Tabela 5.18: VSE e VPP para classe NAPC

Média de VSE DP de VSE Média de VPP DP de VPPJ48 ST 81,43 2,96 89,30 2,22J48 Medidas 92,07 0,97 94,16 1,78RF ST 87,13 0,86 100,0 0,00RF Medidas 91,32 0,52 99,35 0,16MLP ST 47,78 11,22 74,58 14,97MLP Medidas 77,39 4,71 77,46 2,64

90

5.5 Resumo dos Resultados para RF e ST

Para melhor visualizar os índices de VPP e VSE, as Tabelas 5.19 e 5.20 apresentam todosos resultados de cada uma das abordagens apresentadas anteriormente, os melhores índices sãogrifados em negrito.

Tabela 5.19: Resumo dos resultados em VSE

J48ST SD J48MED SD RFST SD RFMED SD MLPST SD MLPMED SDNORMAL 98,79 0,05 98,55 0,03 99,90 0,00 99,72 0,01 99,61 0,09 98,84 0,08LBBB 97,20 0,11 94,26 0,16 98,92 0,04 96,18 0,04 98,70 0,13 93,88 0,65RBBB 97,03 0,13 97,04 0,17 99,08 0,04 98,25 0,06 96,05 0,76 77,72 2,61ABERR 44,08 2,15 53,47 3,29 57,00 1,79 55,78 0,91 10,66 4,76 30,08 4,33PVC 91,66 0,18 93,28 0,17 95,44 0,07 96,02 0,11 95,36 0,35 91,69 0,50FUSION 69,32 0,91 64,17 1,23 70,51 0,39 64,12 0,45 74,04 1,05 42,68 3,75NPC 29,74 2,95 35,66 1,81 17,75 1,53 28,29 1,35 5,78 3,47 9,88 3,77APC 77,19 0,64 85,49 0,38 79,95 0,26 85,21 0,19 51,90 6,25 66,80 1,88VESC 84,04 2,03 90,77 0,98 89,23 1,07 94,33 0,29 86,25 4,28 87,10 3,67NESC 22,80 3,04 37,74 3,32 12,92 1,72 26,37 1,22 1,32 1,83 3,23 1,79FLWAV 64,65 2,01 93,35 0,52 71,44 0,67 96,22 0,41 81,25 2,93 87,39 1,84NAPC 81,43 2,79 92,06 0,92 87,13 0,86 91,32 0,48 47,78 11,22 77,39 4,71

Tabela 5.20: Resumo dos resultados em VPP

J48 ST SD J48 MED SD RF ST SD RF MED SD MLP ST SD MLP MED SDNORMAL 98,17 0,05 97,98 0,04 98,21 0,03 98,14 0,05 97,76 0,13 96,45 0,19LBBB 97,23 0,20 94,97 0,29 99,73 0,07 98,98 0,04 98,19 0,21 92,62 1,00RBBB 97,26 0,15 97,41 0,14 99,09 0,03 99,18 0,06 96,37 1,36 95,48 6,33ABERR 50,89 3,37 60,89 4,50 99,64 0,58 90,40 1,29 53,84 19,48 59,06 4,81PVC 92,17 0,34 93,63 0,23 96,70 0,05 96,85 0,08 94,73 0,54 90,01 1,03FUSION 75,91 0,89 72,96 0,81 93,82 0,59 91,31 0,55 89,18 0,75 62,63 6,26NPC 36,93 3,42 52,73 4,55 100,00 0,00 99,58 1,33 29,34 19,29 1,49 0,49APC 83,81 0,85 89,56 0,31 98,62 0,16 98,09 0,23 89,44 3,53 89,49 1,45VESC 87,43 3,79 93,68 1,78 98,51 0,53 99,00 0,00 84,43 4,56 69,43 18,41NESC 29,73 5,03 52,95 2,99 95,72 1,89 85,96 2,69 14,92 18,39 15,85 12,78FLWAV 74,35 2,41 95,62 0,53 99,37 0,26 99,67 0,12 72,10 8,49 86,97 1,92NAPC 89,30 2,22 94,16 1,78 100,00 0,00 99,35 0,16 74,58 14,97 77,46 2,64

5.6 Resultados para RF Híbrido

Após selecionar os melhores resultados para abordagens Medidas e ST, o modelo RandomForest Híbrido foi avaliado. A Figura 5.19 apresenta graficamente o VSE para cada classe e aTabela 5.21 apresenta VSE e VPP.

91

Figura 5.19: VSE por classe para RF HíbridoFonte: Autor

Tabela 5.21: Resultados de VSE e VPP por classe para abordagem RF Hibrido

VSE VSE (DP) VPP VPP (DP)NORMAL 99,90 0,00 98,40 0,00LBBB 98,97 0,05 99,81 0,03RBBB 99,19 0,03 99,26 0,05ABERR 60,60 1,26 99,67 0,53PVC 96,00 0,11 97,10 0,11FUSION 70,85 0,42 93,74 0,31NPC 17,76 2,07 100,00 0,00APC 81,78 0,20 99,18 0,13VESC 91,43 1,16 99,59 0,72NESC 15,91 2,12 95,98 1,46FLWAV 83,64 0,90 99,92 0,18NAPC 89,31 0,72 100,00 0,00Média Ponderada 98,5 0 98,5 0

92

5.7 Classificação para Alarmes

Como na seção anterior, serão apresentados os resultados para as duas abordagens utili-zando o novo agrupamento. A Seção 5.7.1 apresenta os resultados das abordagens ST e Me-didas utilizando o algoritmo J48, adicionalmente, uma versão agrupando ambas abordagens,denominada Hibrido, também será apresentada.

5.7.1 Resultados para o Classificador de Alarmes

Tendo em vista que estas abordagens possuem apenas duas classes, NORMAL e ALARM,serão apresentados os resultados de VSE e VPP tabelados para todas as abordagens realizadasutilizando esta configuração, os resultados tabelados são apresentados na Tabela 5.22.

Tabela 5.22: Resultados para a classificação de Alarmes.

Abordagem VSE VPP VSE VPP VSE VPPNORMAL NORMAL ALARM ALARM MEDIA MEDIA

J48 ST 98,8 98,5 87,4 89,6 97,6 97,5J48 Medidas 99,3 98,9 90,5 93,6 98,3 98,3J48 Hibrido 99,3 99,1 92,9 94,4 98,7 98,6RF ST 99,8 98,7 88,8 98,4 98,6 98,6RF Medidas 99,8 99,0 91,4 98,2 98,9 98,9RF Hibrido 99,9 98,9 90,6 98,9 98,9 98,9

Capítulo 6

Discussão

Neste capitulo serão discutidos os resultados apresentados no Capítulo 5. Este capituloestá dividido nas seguinte seções:

• Resultados Iniciais : Discussão dos resultados obtidos para cada uma das abordagenspresentes neste trabalho, neste sentido para cada abordagem serão apontados valores deVSE e VPP referentes a todas as classes de complexos QRS presentes no trabalho ondeserão discutidas hipóteses sobre o comportamento dos valores de VSE e VPP de cada. Asabordagens serão apresentadas na seguinte ordem:

– J48 Medidas;

– J48 ST;

– MLP Medidas;

– MLP ST;

– RF Medidas;

– RF ST.

• Resultados por Classes : Para melhor compreensão e análise, os resultados iniciais fo-ram apresentados de forma gráfica e tabelada por classe.

• Comparação com a Literatura : Adicionalmente, uma versão hibrida, denominada RFHibrido, entre a abordagem Medidas e ST, mediante o AM Random Forest, foi avaliadaperante resultados da literatura, adicionalmente, uma versão que utiliza apenas as classesALARM e NORMAL foi avaliada.

6.1 Resultados Iniciais

6.1.1 J48 Medidas

Observa-se na Figura 5.1 a média e o desvio padrão dos resultados das dez execuções daabordagem J48 Medidas utilizando seeds de aleatoriedade diferentes. Como estas execuções

93

94

forçam o algoritmo de validação a montar conjuntos de treino e teste diferentes, nos permitecalcular o desvio padrão do modelo, para que se possa ter uma ideia do real comportamento me-diante a apresentação de novos exemplos. Os resultados serão citados na forma Média(DesvioPadrão)% para facilitar a leitura.

Na Tabela 5.1 e na Figura5.1 pode-se observar que para abordagem J48 Medidas de Com-plexidade as classes NORMAL, LBBB, RBBB, PVC, VESC, FLWAV e NAPC possuem acertosuperior a 90%. Enquanto as classes NORMAL, LBBB RBBB obtém os maiores valores,sendo 96,54(0,05)%, 94,25(0,17)% e 97,03(018)% respectivamente, mas estas classes repre-sentam mais da metade do banco de dados e os complexos QRS destas classes apresentamnaturalmente pouca variabilidade no seu formato.

A classe ABERR, para J48 Medidas, obteve 53,46(3,49)% de VSE e VPP de 60,89(4,5)%.Esta classe apresenta baixo VSE e VPP em relação às outras classes classificadas anterior-mente. Observa-se na Figura 2.8 uma onda disforme, entretanto, para outros exemplos deQRSs desta classe este padrão não se repete, tornando a tarefa de gerar um modelo genéricocapaz de classificar outros complexos mais difícil, o mesmo ocorre para a classe FUSION, queobteve 64,17(1,31)% de VSE e 72,96(0,81)% de VPP. Outra classe que possui resultados declassificação satisfatórios foi APC, tendo VSE de 85,51(0,39)% e VPP de 89,56(0,31)%.

Também é possível observar que as classes como NPC e NESC possuem baixa taxa deacerto, com 35,66%(1,81%) para NPC e 37,74%(3.32%) respectivamente, ambos complexosarrítmicos de origem juncional, NPC possui 76 exemplos e NESC 161 exemplos. Entretanto,mesmo com poucos exemplos, VESC obteve taxa de acerto de 90,77(0.98)%. Uma hipótese domotivo da baixa taxa de acerto é de que os exemplos extraídos da base de dados não possuemum padrão próximo para estas classes.

6.1.2 J48 ST

Observando a Tabela 5.2 e a Figura 5.2 observa-se nos resultados obtidos pela abordagemJ48 ST, que ao avaliarmos os primeiros VSE, esta gera um modelo mais robusto que o ante-rior, com NORMAL obtendo VSE de 98,80(0,07)% para J48 ST, contra 98,54(0,05)% de J48Medidas e VPP de 98,17(0,05)% de J48 ST contra 97,98(0,04)% de J48Medidas.

O mesmo se repete com LBBB, onde as taxas de VSE e VPP são de 97,21(0,12)% e97,23(0,2)% para a abordagem J48 ST enquanto a abordagem J48 Medidas apresenta VSE eVPP de 94,25(0,17)% e 94,97(0,29)%. Para RBBB, os valores de VSE e VPP utilizando aabordagem J48 ST são de 97,03(0,14)% 97,26(0,15)% respectivamente, sendo muito próximosaos valores da abordagem anterior.

Assim como na abordagem anterior, possui baixo VSE e VPP para a classe ABERR,obtendo VSE de 44,09(2,27)% e de VPP 50,89(3,37)%, Já PVC possui VSE de 91,68(0,20)%

95

com 92,17(0,34)% de VPP, sendo assim um resultado razoável, entretanto não tão bom quantoo modelo anterior, que possui VSE de 93,29(0,18)% 93,63(0,23)%.

Para a classe FUSION foi obtido VSE de 69,31(0,96)% e VPP de 75,91(0,89)%, resultadosuperior à J48 Medidas, tanto em VSE quanto em VPP.

Prosseguindo com a classe NPC, os resultados obtidos por J48 ST apresentam valoresinferiores à J48 medidas, obtendo 29,72(3,12)% de VSE e 36,93(3,42)% de VPP.

Para a classe APC, novamente são obtidos VSE e VPP inferiores aos obtidos anterior-mente em J48 Medidas, para a abordagem J48 ST os valores de VSS e VPP são 77,19(1,03)%e 83,81(0,85)% respectivamente.

Os valores de VSE e VPP para J48 ST são de 84,04(2,14)% e 87,43(3,79). Esses valorestambém são inferiores aos valores obtidos pela J48 Medidas.

Para NESC, os valores de VSE e VPP são 22,79(3,21)% e 29,73(5,03)% respectivamente,sendo estes inferiores a abordagem J48 Medidas.

Assim como nos últimos resultados, os valores de VSE e VPP são inferiores aos obtidosanteriormente, sendo estes 81,41(2,96)% e 89,30(2,22)%.

Para NAPC o mesmo cenário é observado, o VSE e VPP para J48 são de 81,43(2,96)% e89,30(2,22)% respectivamente.

A média ponderada geral da abordagem J48 ST é de 98,85(0,05)% de VSE e 96,71(0,05)%de VPP.

6.1.3 MLP Medidas

Para MLP Medidas, a Tabela 5.3 apresenta os resultados de VSE e VPP para esta aborda-gem, onde é possivel observar que para todas as classes os valores de VSE e VPP são inferioresaos obtidos anteriormente com J48 Medidas, já para J48 ST, os valores de VPP para NORMALPVC VESC são superiores ou muito próximos aos de MLP Medidas, entretanto, os valores deVPP são todos inferiores.

Estes resultados indicam que a abordagem de Medidas apresenta resultados interessantespara classificação de complexos problemáticos.

6.1.4 MLP ST

Para MLP ST, o VSE para as classes NORMAL, LBBB, PVC e FUSION são observados,entretanto, os valores de VSE nem sempre são superiores aos resultados anteriores.

96

6.1.5 RF Medidas

Na Tabela 5.6 é possível observar que os valores de VSE são superiores para a maioriadas classes, exceto para NPC, APC, NESC, NAPC e FUSION.

6.1.6 RF ST

Para RF ST, é possível observar na Tabela 5.6 que os valores de VSE para os complexosNORMAL, LBBB e RBBB possuem os maiores valores entre todos as abordagens apresentadasanteriormente.

A partir das informações apresentadas até agora, é possível observar que as abordagensque utilizam ST possuem altos índices de VSE para classes NORMAL, LBBB, RBBB e FU-SION, enquanto abordagens utilizando Medidas de Complexidade taxas de VSE maiores paraas outras classes. Já Observando os valores de VPP, é evidente que as abordagens utilizando RFpossuem os maiores índices.

6.2 Resultados Por Classe

Ao analisar o desempenho para cada classe observa-se que possuem taxas de acertossemelhantes nas diferentes abordagens utilizadas neste trabalho, mas com pequenas diferençasdiscutidas a seguir.

6.2.1 NORMAL

Para a classe NORMAL, observa-se na Tabela 5.7 que a abordagem RF ST obteve a taxade 99,9% de acerto com desvio padrão desprezível, ou seja, mesmo modificando os agrupamen-tos de exemplos nos conjuntos de treino e teste, sua taxa de acerto se manteve consistente semalteração significativa.

6.2.2 LBBB

Na Tabela 5.8 vê-se que LBBB a abordagem RF ST teve maior taxa de acerto com98,92(0,04)% e VPP de 99,73(0,07)%, enquanto a abordagem MLP ST conseguiu 98,70(0,13)%,o segundo melhor resultado, juntamente com 98,19(0,21)% de VPP, ou seja, mesmo analisando

97

o desvio padrão, a abordagem RF ST ainda é superior na taxa de acerto.

6.2.3 RBBB

Já para RBBB observa-se na Tabela 5.9 que a abordagem RF ST obteve uma taxa deacerto de 99,08(0,04)% e VPP de 99,09(0,03)%. Enquanto a segunda melhor abordagem, emtermos de VSE, RF Medidas obteve uma taxa de acerto de 98,26(0,05)% e 99,18(0,03)% deVPP, mesmo levando em consideração o DP a abordagem RF ST possui desempenho maior.

Todas as abordagens obtiveram taxa de acerto maior que 90% para NORMAL, LBBB eRBBB, exceto MLP MED, isto se deve a grande quantidade de exemplos presentes no bancode dados, o que ajuda o algoritmo de AM a encontrar padrões que descrevam melhor cadasegmento destas classes. Além de que a forma de onda para estas classes possui menos variaçãoentre pacientes, desta maneira, encontra-se mais facilmente um padrão que possa generalizá-las.

6.2.4 ABERR

Para a Classe ABERR, cujo resultado está na Tabela 5.10), a abordagem com maior taxade acerto foi RF ST, com 57,00(1,79)% com VPP de 99,64(0,58)%, enquanto a segunda abor-dagem com maior acerto foi RF Medidas com 55.78(0,96)% de acerto, mesmo considerando odesvio padrão estas abordagens continuam sendo as duas com maior VSE.

6.2.5 PVC

Verifica-se que para a classe PVC (Tabela 5.11) o algoritmo com maior VSE foi RF MEDcom 96,01(0,12)% de VSE com 96,85(0,08)% de VPP, sendo a segunda abordagem com maiostaxa de acerto a abordagem RF ST com 95.44(0,07)% de VSE com 96,7(0,05)% de VPP, nestesentido, mesmo levando em consideração considerando o DP a RF MED segue sendo a aborda-gem com maior taxa de acerto e VPP.

6.2.6 FUSION

Para a Classe FUSION, resultados na Tabela 5.12, a abordagem com maior VSE foi MLPST com 74,04(1,05)% com 89,18(0,75)% de VPP, enquanto RF ST, segunda melhor aborda-gem, apresenta VSE de 70,51(0,39)% com 93,82(0,59)% de VPP, entretanto, mesmo a aborda-

98

gem MLP ST possuindo maior VSE, suas taxas de VPP são inferiores as taxas obtidas pelasabordagens utilizando RF, ou seja, o índice de falsos positivos para esta abordagem é maior doque para as abordagens usando RF.

6.2.7 NPC

Na Tabela 5.13 pode-se observar que a abordagem com maior VSE para a classe NPCfoi J48 Medidas com 35,65(1,81)% com 52,73(4,55)% de VPP, sendo que a segunda aborda-gem com maior VSE foi J48 ST com 29,72(3,12)% obtendo 36,93(3,42)% de VPP e a terceiraabordagem com maior VSE foi RF Medidas, com 28,27(1,44)% e VPP 99,58(1,33)%.

Neste sentido, se observarmos o DP, a abordagem com segundo maior VSE possui poucadiferença entre a terceira, sendo que a terceira abordagem com maior VSE possui VPP superiora segunda, mesmo com as maiores taxas de VSE, as abordagens que obtiveram maior VPPforam RF ST e RF Medidas, com 100,00(0,00)% e 99,58(1,33)% respectivamente.

Ou seja, para os dez agrupamentos diferentes realizados pelo algoritmo de validação, emtodas, a abordagem RF ST obteve VPP de 100,00% para esta classe.

Assim sendo, a classificação de um complexo nesta classe por este modelo possui certezade ser corretamente classificada, levando em considerações todos os exemplos do banco dedados do MIT, entretanto, para um cenário real não é possível afirmar que esta precisão sejaválida.

6.2.8 APC

Para a Classe APC, resultados são apresentados na Tabela 5.14, a abordagem com maiorVSE foi J48 Medidas com 85,51(0,39)% com 89,58(0,31)% de VSE, a segunda abordagemcom maior VSE foi RF Medidas, obtendo 85,21(0,20)% de VSE, entretanto, a abordagem commaior VPP foi RF ST 98,62(0,16)%, e a segunda abordagem com maior VPP foi RF Medidas,com 98,09(0,23)% de VPP, indicando que mesmo com menor VSE, a abordagem RF medidaspossui menor taxa de falsos positivos, sendo uma melhor abordagem para se utilizar.

6.2.9 VESC

Para a Classe VESC, Tabela 5.15, a abordagem com maior VSE foi RF Medidas com94,30(0,32)% obtendo 99(0)% de VPP, seguido da abordagem J48 ST com 90,74(1,03)% apre-sentando VPP de 93,68(1,78)%, observando que a abordagem RF Medidas possui maior VPP

99

seguido da RF ST, que obteve VPP de 98,51(0,53)% e VSE de 89,23(1,07)%, novamente autilização da abordagem RF ST mostra-se mais interessante do que a abordagem J48 Medidas,tendo em vista que as taxas de falso negativo evidentemente inferiores ás obtidas por RF ST eRF Medidas.

6.2.10 NESC

As melhores abordagens para classificação do complexo NESC foram J48 Medidas comVSE de 37,73(3,50)% e VPP de 52,95(2,99)%, seguido de RF Medidas com VSE 26,38(1,30)%e VPP 85,96(2,69)%, as abordagens usando MLP ST e MLP Medidas e obtiveram 1.32(1,83)%de VSE e 3.23(1,79)% respectivamente, como é possível verificar na Tabela 5.16, um resultadoextremamente baixo comparado com outras abordagens.

Uma hipótese é de que os complexos extraídos não representam um sinal com padrãocomum para todos os pacientes do BD, tendo em vista que foram extraídos 168 complexosdesta classe, dificultando a criação de um modelo genérico para classificação deste complexo.

6.2.11 FLWAV

Para a Classe FLWAV, cujos resultados estão na Tabela 5.17, a abordagem com maior VSEfoi RF Medidas com 96,21(0,42)%, a segunda abordagem com maior VSE foi J48 Medidas com93,35(0,56)% de VSE e 95,62(0,53)% de VPP, para a abordagem RF Medidas o VPP foi de99,35% com DP de 0,24%, entretanto, novamente a abordagem com maior VPP foi RF ST com99,67(0,12)% de VPP, índice superior ao obtido por J48 Medidas, que foi a segunda melhorabordagem em termos de VSE.

6.2.12 NAPC

Observa-se na Tabela 5.18 que para NAPC a abordagem com maior VSE foi J48 Medi-das, com 92,07(0,97)% e VPP de 94,16(1,78)%, a segunda abordagem com maior VSE foi RFMedidas obtendo 91,32(0,52)%, para os resultados de VPP, as melhores abordagens foram RFMedidas e RF ST, obtendo 100(0)% e 99,35(0,16)% respectivamente.

100

6.2.13 Considerações Gerais

NPC foi uma das classe que obtiveram menor VSE entre todas as classes, isso se deve acarência de exemplos no banco de dados, neste trabalho foram extraídos 83 exemplos e destes83, 7 foram removidos pois não apresentaram as características necessárias para utilização.

Tendo em vista que classes como NORMAL, LBBB e RBBB não representam nenhumou baixo risco a saúde, é desejavel que estes sejam classificados como classes de QRS de riscoao invés de que classes de QRS de risco real sejam classificadas como de baixo risco.

Neste sentido, as classes foram agrupadas em duas grandes classes, NORMAL, englo-bando as classes NORMAL, LBBB e RBBB, e ALARM, englobando todas as outras classesque representam algum tipo de risco, esta abordagem permite encontrar padrões mais simplespara divisão entre as classes.

A abordagem abordagem J48 ST foi escolhida para a implementação em hardware devidoa sua baixa complexidade. Esta abordagem não necessita de cálculos complexos precedentes àclassificação do complexo, otimizando o processo.

Tendo em vista que o classificador está rodando em paralelo à aquisição de dados, estenecessita realizar a classificação no menor tempo possível, pois o próximo complexo QRS a serclassificado não deve acontecer enquanto o complexo QRS anterior ainda não foi classificado.

Tendo em vista que para o cuidado com a saúde um Falso Negativo (Alarme detectadocomo Normal) é mais nocivo do que um Falso Positivo (Normal detectado como alarme), nestesentido podemos observar que a abordagem com maior VSE para classe de alarmes foi J48Hibrido.

Outra consideração importante sobre dispositivos de monitorização é que se um dispo-sitivo apresenta alarmes de forma constante, os mesmos podem passar a ser ignorados pelousuário, sendo assim, uma alta taxa de falsos negativos também não é interessante.

Entretanto, as abordagens utilizando RF são extremamente pesadas e consomem muitorecurso, visto que são geradas 100 árvores de decisão, as abordagens utilizando Medidas deComplexidade também exigem muitos cálculos para que sejam utilizadas pelo classificador,neste sentido, para implementação em hardware a abordagem escolhida foi J48 ST.

6.3 Literatura e Estado da Arte

Diversos trabalhos na área de classificação de arritmias têm sido desenvolvidos ao longodos anos, esta seção compara os resultados de alguns trabalhos com os obtidos por este trabalho,apresentados na Tabela 6.1.

101

Tabela 6.1: Comparação de resultados com literatura

NORMAL LBBB RBBB ABERR PVC FUSION NPC APC VESC NESC FLWAV NAPCEste Trabalho 99,90 98,97 99,19 60,60 96,00 70,85 17,76 81,78 91,43 15,91 83,64 89,31(Nadal, 1991) 98,93 10,63 90,23 74,07 0 0,00(Bossan, 1994) 98,64 66,28 94,73 80,31 97,00 82,16(Rodriguez et al., 2005) 98,42 98,38 97,35 46,34 88,44 76,36 50,00 77,20 93,94 33,33 91,30(Ye et al., 2010) 99.95 100 99.99 92.86 99.26 100 97.06 92.86 100 100 100 100(Hu et al., 2012) 99.72 97.75 99.48(Gutiérrez-Gnecchi et al., 2017) 97.15 91.06 87.50 71.04 76.82(Alfarhan et al., 2018) 95.83 91.66 95.83(Nath et al., 2018) 100 97,5 100 97,5(Hassan et al., 2018) 98.68 91.62 98.98 97.09(Ihsanto et al., 2019) 98.91 97.68 95.36 0.00 90.57 62.69 61.75 58.05 73.20

Esta seção será dividida em duas partes, uma contemplando a abordagem RF Hibrida eoutra contemplando a abordagem implementada no microcontrolador. A Seção 6.3.1 apresentaa discussão a partir da abordagem RF Hibrida enquanto a Seção 6.3.2 apresenta a discussãosobre a abordagem J48 ST Alarmes.

6.3.1 RF Hibrido

A abordagem RF Hibrido apresenta resultados de VSE superiores para NORMAL, LBBB,RBBB e ABERR, para PVC o resultado é muito próximo do maior observado anteriormente ob-tendo VSE de 96,00(0,11), para os complexos FUSION os valores se distanciam em no máximo5% das abordagens com maior VSE apresentadas anteriormente.

Para melhor comparar, os resultados, a Tabela 6.1 apresenta os resultados de VSE emcomparação a outros trabalhos relevantes.

O trabalho de Nadal (1991) possui VSE maior para as classes FUSION, entretanto, tanto otrabalho de Nadal (1991) e Bossan (1994), que obtém VSE superior para as classe ABERR,FUSIONe VESC, realizam a classificação de 7 tipos diferentes de complexos, sendo que este trabalhorealiza a classificação de um total de 12 complexos.

Rodriguez et al. (2005) utiliza PDAs para fazer a classificação de complexos QRS e ritmoscardíacos, para classificação de QRSs, e possui VSE superior a este trabalho para as classesFUSION, NPC, NESC e FLWAV. Entretanto o total de complexos QRS utilizado por Rodriguezet al. (2005) é de 21.849 complexos, sendo que nesta dissertação se utiliza 97.994. Neste sentidoo presente trabalho possui melhor confiabilidade, visto que a avaliação aborda um número maiorde exemplos para todas as classes.

O trabalho de Ye et al. (2010) possui maior VSE para todas as classificações abordadasneste trabalho, sendo que a maioria dos valores é próxima de 100. Entretanto o processamentoutilizado requer muito esforço computacional, visto que para cada batimento é necessário quesejam extraídas diversas características diferentes utilizando transformada de Daubechies, aná-lise de componente principal e análise de componente independente juntamente com o intervalo

102

médio de RR.

Enquanto o trabalho de Hu et al. (2012) possui VSE superiores para as classes PVCAPC. Mas para fazer a avaliação de seu trabalho, Hu et al. (2012) simula somente 16 sinais deECG do banco de dados do MIT, utilizando um total de 34799 complexos simulados enquantoeste trabalho utiliza 97994 para treino e teste, possuindo assim maior representatividade decomplexos.

Gutiérrez-Gnecchi et al. (2017) apresenta uma abordagem de classificação utilizandotransformadas wavelets e redes neurais probabilísticas. Entretanto, nenhuma das classes decomplexo QRS classificadas obteve VSE maior que os obtidos por esta dissertação.

Analisando o trabalho de Alfarhan et al. (2018) observa-se valores de VSE para APCmaiores que este trabalho. Entretanto a quantidade de exemplos utilizados para teste da classeAPC no trabalho de Alfarhan et al. (2018) foi 24, para este trabalho. Enquanto nesta dissertaçãoum conjunto de 2.408 exemplos de APC foram utilizadas para treino e teste com cross validationde 10 folds.

O trabalho de Nath et al. (2018) apresenta valores maiores de VSE comparado a estetrabalho para as seguintes classes: NORMAL,RBBB e APC. Entretanto, a avaliação realizadapelos autores contempla apenas a utilização de 45 exemplos para treino e 45 para teste paracada classe, não apresentando um resultado confiável para um cenário real. Neste sentido, estadissertação apresenta a avaliação completa do banco de dados do MIT utilizando cross valida-tion de 10 folds, apresentando uma avaliação mais próxima de um cenário real, contemplandotodos os pacientes do banco de dados, sendo assim a avaliação deste trabalho apresenta maiorconfiabilidade para os resultados.

O trabalho de Hassan et al. (2018) possui valores de VSE superiores para as classesLBBB, PVC e APC. Porém para testes o sistema utiliza apenas 6.258 exemplos do banco dedados, diferente desta dissertação que contempla 97.994 exemplos de diversas classes.

Ihsanto et al. (2019) apresenta uma abordagem diferente, na qual elimina o estágio depré processamento e combina a fase de extração de características e classificação em um únicoestágio. Todavia, todos os ritmos classificados pela abordagem de (Ihsanto et al., 2019) possuemVSE inferior ao obtido por esta dissertação.

6.3.2 Modelo para a classificação em Alarmes

Para as abordagens que agrupam as classes em NORMAL e ALARM, a abordagem commaior VSE foi RF Hibrido, obtendo 99,9% de VSE com VPP de 98,9%, como observado naTabela 5.22.

Entretanto, as abordagens RF Medidas e RF ST possuem mesmo valor de VSE, 99,8,

103

portanto, analisando o VPP de cada uma, é possível observar que RF Medidas possui melhoresresultados, sendo o VPP de RF Medidas 99,0% contra 98,7% de RF ST.

Para a classe ALARM o algoritmo que obteve maior VSE foi J48 Hibrido, com 92,9% e94,4% de VPP, a segunda melhor abordagem foi RF Medidas, com VSE de 91,4% e VPP de98,2%.

104

Capítulo 7

Conclusão

7.1 Classificação Mediante Medidas de Complexidade

As medidas de complexidade utilizadas neste trabalho apresentaram boa performancepara a classificação de complexos QRS, neste sentido, é possível afirmar que este tipo de abor-dagem pode ser de auxilio para classificação de sinais .

Observando as figuras apresentadas no Capitulo 5 é possível observar que em diversas si-tuações, as abordagens que utilizaram medidas de complexidade obtiveram VSE superior a suasabordagens utilizando Series Temporais, e mesmo comparando com os resultados da literatura,obtém-se resultados de VSE muitas vezes superiores ou próximos.

7.2 Algoritmos de Aprendizado de Máquina

Analisando os resultados, fica evidente que o algoritmo com melhor performance paraclassificação neste trabalho foi o Random Forests, mesmo em situações em que o VSS para outroalgoritmo foi superior, os índices de VPP em Random Forests foram maiores, neste sentido, asclassificações feitas para estas classes são mais confiáveis, pois possuem menos falsos positivos.

Entretanto, em níveis de performance para classificação de um exemplo são muito mai-ores, os parâmetros padrões deste algoritmo definem que serão treinadas 100 árvores interna-mente para realizar a classificação, sendo que algoritmos como J48 criam apenas uma árvore.

O J48, mesmo sendo uma abordagem simples, apresenta resultados satisfatórios para mui-tas classes, tendo em alguns casos VSE superior a abordagem utilizando Random Forests, queé uma abordagem muito mais complexa.

Outro aspecto interessante observado é que, na maioria dos casos, o desempenho de MLPfoi inferior às outras abordagens apresentadas, muitas vezes apresentando desvio padrão muitoalto entre as execuções. A partir desta análise, é possível afirmar que os modelos treinados pelaMLP não apresentam confiabilidade, pois possuem alto desvio padrão em relação aos índices

105

106

de VSE e VPP.

Levando em consideração os resultados apresentados, podemos afirmar que todas as abor-dagens anteriores alcançaram um nível de acerto maior que o ECM, neste sentido, o primeiroquesito para validação do modelo é cumprido.

A classe NESC foi a pior em resultados, obtendo 37,74% de VSE com 3,32% de DP nomelhor caso com a abordagem J48 medidas e 26,37% com 1,22% de DP no segundo melhorcaso com a abordagem RF Medidas.

Um fato interessante observado na utilização do algoritmo RF é de que o VPP é superiorem quase todos os casos, o que pode ser facilmente observado na Tabela 5.20. Também é evi-dente que o DP para as múltiplas execuções é o menor em todas as abordagens, demonstrandoque o modelo obtido pelo algoritmo possui melhor consistência. Entretanto, essa consistênciatem um preço de performance. O algoritmo J48 gera apenas uma árvore para decisão enquantoa abordagem padrão de RF utiliza 100 árvores diferentes para realizar a classificação, aumen-tando significativamente o custo de execução da mesma.

A MLP foi o algoritmo de AM que obteve os piores resultados dentre os três algoritmosutilizados, se forem observadas as taxas de acerto para complexos mais nocivos, sua taxa deacerto é muito inferior as outras abordagens na maioria dos casos. Possuindo boas taxas deacerto para as classes NORMAL, LBBB e RBBB, entretanto, estes complexos não são nocivosa saúde isso fica evidente na Seção 5.4, onde são apresentados os resultados por classe emrelação a todos algoritmos de AM.

Assim o RF Híbrido apresenta resultados melhores ou equivalentes que os encontradosna literatura e pode ser utilizado em tempo real, tendo em vista que utiliza apenas informaçõeslocais do complexo QRS.

O poder computacional atual permite que sejam utilizados dispositivos com maior poderde processamento para monitorização, entretanto, para maior processamento existe um custoatrelado, este trabalho utiliza um microcontrolador de baixo custo, neste sentido, o J48 ST apre-senta uma alternativa razoável para a redução de processamento pois realiza menos cálculos,possibilitando a rápida classificação dos complexos, visto que o hardware necessita classificarcada complexo em um tempo menor do que o próximo complexo QRS.

7.3 Trabalho Futuros

Como proposta de trabalhos futuros citam-se:

1. Realizar análise de tempo/custo para o hardware em função dos algoritmos;

2. Validação e testes em tempo real do hardware;

107

3. Estudo aprofundado em relação aos tipos de alarmes dependentes da arritmia cardíaca.

4. Integração com o SMCH, realizando monitoramento de quedas e arritmias cardíacas;

5. Utilização de PCA e ICA para melhora no índice de acerto.

108

Referências Bibliográficas

Abibullaev, B. & Seo, H. D. (2011). A new qrs detection method using wavelets and artificialneural networks, Journal of medical systems 35(4): 683–691. Citado na página 23.

Abrantes, A. C. S. & Nadal, J. (1992). Algoritmo para detecção de complexos qrs em micro-computadores pc–at, I Førum Nacional de Ciência e Tecnologia em Sa´˘de ’92 . Citadona página 24.

Abrantes, A. C. S. & Nadal, J. (1997). Sistema computadorizado para monitorização cardio-respiratøria, Master’s thesis, COPPE/UFRJ, Rio de Janeiro. Citado na página 24.

Acharya, U. R., Fujita, H., Sudarshan, V. K., Oh, S. L., Adam, M., Tan, J. H., Koo, J. H., Jain,A., Lim, C. M. & Chua, K. C. (2017). Automated characterization of coronary arterydisease, myocardial infarction, and congestive heart failure using contourlet and shearlettransforms of electrocardiogram signal, Knowledge-Based Systems 132: 156–166. Citadona página 42.

Alfarhan, K. A., Mashor, M. Y., Saad, M., Rahman, A. & Omar, M. I. (2018). Wireless heartanormality monitoring kit based on raspberry pi, Journal of Biomimetics, Biomaterialsand Biomedical Engineering, Vol. 35, Trans Tech Publ, pp. 96–108. Citado 3 vezes naspáginas 26, 101 e 102.

Álvarez, R. A., Penín, A. J. M. & Sobrino, X. A. V. (2013). A comparison of three qrs detectionalgorithms over a public database, Procedia Technology 9: 1159–1165. Citado na página43.

Ana (2018). Single-Lead, Heart Rate Monitor Front End. Rev. C. Citado na página 2.

Arzeno, N. M., Deng, Z.-D. & Poon, C.-S. (2008). Analysis of first-derivative based qrs detec-tion algorithms, IEEE Transactions on Biomedical Engineering 55(2): 478–484. Citadona página 23.

Biolo, A., Garcia, S. B., Silva, S. et al. (2006). Análise do manejo agudo do acidente vascularcerebral no hospital de clínicas de porto alegre, Revista HCPA. Porto Alegre. Vol. 26, n.1,(2006), p. 17-21 . Citado na página 1.

Bossan, M. d. C. (1994). Classificação de Batimentos Cardíacos Utilizando Redes Neurais,PhD thesis, Tese de Mestrado, Programa de Engenharia Biomédica, COPPE/UFRJ, Rio deJaneiro. Citado 5 vezes nas páginas xix, 23, 24, 42 e 101.

Braga, A. d. P. (2007). Redes Neurais Artificiais: teoria e aplicações. Citado 3 vezes naspáginas 34, 35 e 60.

Breiman, L. (2001). Random forests, Machine Learning 45(1): 5–32. Citado na página 31.

Cai, C.-L., Liang, X., Shi, Y., Chu, P.-H., Pfaff, S. L., Chen, J. & Evans, S. (2003). Isl1 identifiesa cardiac progenitor population that proliferates prior to differentiation and contributes amajority of cells to the heart, Developmental cell 5(6): 877–889. Citado na página 2.

Chan, A. M., Selvaraj, N., Ferdosi, N. & Narasimhan, R. (2013). Wireless patch sensor for

109

110

remote monitoring of heart rate, respiration, activity, and falls, Engineering in Medicineand Biology Society (EMBC), 2013 35th Annual International Conference of the IEEE,IEEE, pp. 6115–6118. Citado na página 1.

Chang, R. C.-H., Chen, H.-L., Lin, C.-H. & Lin, K.-H. (2018). Design of a low-complexity real-time arrhythmia detection system, Journal of Signal Processing Systems 90(1): 145–156.Citado na página 26.

Chen, H. & Chen, S.-W. (2003). A moving average based filtering system with its applicationto real-time qrs detection, Computers in Cardiology, 2003, IEEE, pp. 585–588. Citado 4vezes nas páginas xiii, 23, 45 e 63.

Devices, A. (2012). Single-lead, heart rate monitor front end, AD8232 Data Sheet . Citado napágina 67.

Fensli, R., Gunnarson, E. & Gundersen, T. (2005). A wearable ecg-recording system for conti-nuous arrhythmia monitoring in a wireless tele-home-care situation, Computer-Based Me-dical Systems, 2005. Proceedings. 18th IEEE Symposium on, IEEE, pp. 407–412. Citadona página 1.

Gama, J., Medas, P. & Rodrigues, P. (2004). Concept drift in decision-tree learning for data stre-ams, Proceedings of the Fourth European Symposium on Intelligent Technologies and theirimplementation on Smart Adaptive Systems, Aachen, Germany, Verlag Mainz, pp. 218–225. Citado na página 36.

Gardner, M. W. & Dorling, S. R. (1998). Artificial neural networks (the multilayer percep-tron)—a review of applications in the atmospheric sciences, Atmospheric environment32(14-15): 2627–2636. Citado na página 31.

Gifari, M. W., Zakaria, H. & Mengko, R. (2015). Design of ecg homecare: 12-lead ecg acqui-sition using single channel ecg device developed on ad8232 analog front end, ElectricalEngineering and Informatics (ICEEI), 2015 International Conference on, IEEE, pp. 371–376. Citado 3 vezes nas páginas 1, 22 e 67.

Gneiting, T., Ševcíková, H. & Percival, D. B. (2012). Estimators of fractal dimension: Asses-sing the roughness of time series and spatial data, Statistical Science pp. 247–277. Citadona página 38.

Gutiérrez-Gnecchi, J. A., Morfin-Magana, R., Lorias-Espinoza, D., del Carmen Tellez-Anguiano, A., Reyes-Archundia, E., Méndez-Patiño, A. & Castañeda-Miranda, R. (2017).Dsp-based arrhythmia classification using wavelet transform and probabilistic neuralnetwork, Biomedical Signal Processing and Control 32: 44–56. Citado 4 vezes nas pági-nas xix, 26, 101 e 102.

Guyton, A. C., Hall, J. E. & Guyton, A. C. (2011). Tratado de fisiologia médica, Vol. 12,Guanabara Koogan. Citado 2 vezes nas páginas xi e 5.

Hall, P. & Wood, A. (1993). On the performance of box-counting estimators of fractal dimen-sion, Biometrika 80(1): 246–251. Citado na página 37.

Hamilton, P. S. & Tompkins, W. J. (1986). Quantitative investigation of qrs detection rules usingthe mit/bih arrhythmia database, IEEE transactions on biomedical engineering (12): 1157–1165. Citado 3 vezes nas páginas 23, 41 e 43.

Hassan, A. M., Khalaf, A. F., Sayed, K. S., Li, H. H. & Chen, Y. (2018). Real-time cardiacarrhythmia classification using memristor neuromorphic computing system, 2018 40th An-

111

nual International Conference of the IEEE Engineering in Medicine and Biology Society(EMBC), IEEE, pp. 2567–2570. Citado 3 vezes nas páginas 26, 101 e 102.

Hausser, J. & Strimmer, K. (2009). Entropy inference and the james-stein estimator, withapplication to nonlinear gene association networks, Journal of Machine Learning Research10(Jul): 1469–1484. Citado 2 vezes nas páginas 38 e 39.

Hausser, J. & Strimmer, K. (2014). Estimation of Entropy, Mutual Information and RelatedQuantities. Citado na página 56.

Hilton, M. L. (1997). Wavelet and wavelet packet compression of electrocardiograms, IEEETransactions on Biomedical Engineering 44(5): 394–402. Citado na página 42.

Hu, S., Wei, H., Chen, Y. & Tan, J. (2012). A real-time cardiac arrhythmia classification systemwith wearable sensor networks, Sensors 12(9): 12844–12869. Citado 5 vezes nas páginasxix, 25, 26, 101 e 102.

Ihsanto, E., Ramli, K. & Sudiana, D. (2019). Real-time classification for cardiac arrhythmiaecg beat, 2019 16th International Conference on Quality in Research (QIR): InternationalSymposium on Electrical and Computer Engineering, IEEE, pp. 1–5. Citado 3 vezes naspáginas 28, 101 e 102.

KAT (2018). 412 ARDUINO 10DOF SENSOR MODULE GY-89. Citado na página 2.

Katz, M. J. (1988). Fractals and the analysis of waveforms, Computers in biology and medicine18(3): 145–156. Citado na página 37.

Kauati, A. T. & Nadal, J. (1997). Desenvolvimento e avaliação de método para identificaçãoautomática de ritmos cardíacos no eletrocardiograma, Master’s thesis, COPPE/UFRJ, Riode Janeiro. Citado 2 vezes nas páginas xix e 24.

Kohler, B.-U., Hennig, C. & Orglmeister, R. (2002). The principles of software qrs detection,IEEE Engineering in Medicine and Biology Magazine 21(1): 42–57. Citado na página 43.

Korhonen, I., Parkka, J. & Van Gils, M. (2003). Health monitoring in the home of the future,IEEE Engineering in medicine and biology magazine 22(3): 66–73. Citado na página 1.

Lakatta, E. G. & Levy, D. (2003). Arterial and cardiac aging: major shareholders in cardiovas-cular disease enterprises, Circulation 107(3): 490–497. Citado na página 1.

Liu, L., Stroulia, E., Nikolaidis, I., Miguel-Cruz, A. & Rincon, A. R. (2016). Smart homes andhome health monitoring technologies for older adults: A systematic review, Internationaljournal of medical informatics 91: 44–59. Citado na página 1.

Maletzke, A. G. (2009). Uma metodologia para extração de conhecimento em séries temporaispor meio da identificação de motifs e da extração de características, PhD thesis, Univer-sidade de São Paulo. Citado na página 29.

Marqués, A. I., García, V. & Sánchez, J. S. (2012). Exploring the behaviour of base classifiers incredit scoring ensembles, Expert Systems with Applications 39(11): 10244–10250. Citadona página 59.

Martinelli, M., Siqueira, S. F. d., Zimerman, L. I., Neto, V. A., Moraes Jr, A. V. & Fenelon,G. (2012). Sudden cardiac death in brazil: study based on physicians’ perceptions ofthe public health care system, Pacing and Clinical Electrophysiology 35(11): 1326–1331.Citado na página 1.

Martínez, A., Alcaraz, R. & Rieta, J. J. (2010). Application of the phasor transform for automa-

112

tic delineation of single-lead ecg fiducial points, Physiological measurement 31(11): 1467.Citado 2 vezes nas páginas 23 e 43.

Martínez, J. P., Almeida, R., Olmos, S., Rocha, A. P. & Laguna, P. (2004). A wavelet-based ecgdelineator: evaluation on standard databases, IEEE Transactions on biomedical enginee-ring 51(4): 570–581. Citado na página 23.

Mic (2007). 12-Bit Digital-to-Analog Converter with EEPROM Memory in SOT-23-6 High-speed CAN transceiver. Citado na página 68.

Miller, G. (1955). Note on the bias of information estimates, Information theory in psychology:Problems and methods . Citado na página 39.

Mitchell, T. M. (1997a). Does Machine Learning Really Work?, American Association forArtificial Intelligence 18(3): 71–83.URL: http://www.aaai.org/ojs/index.php/aimagazine/article/viewArticle/1303 Citado napágina 36.

Mitchell, T. M. (1997b). Machine Learning Book, Vol. 27.URL: http://www-stat.stanford.edu/ tibs/book/preface.ps Citado 3 vezes nas páginas 30,35 e 61.

Monard, M. C. & Baranauskas, J. A. (2003). Conceitos sobre aprendizado de máquina. Citadona página 30.

Moody, G. B. & Mark, R. G. (1990). The mit-bih arrhythmia database on cd-rom and softwarefor use with it, Computers in Cardiology 1990, Proceedings., IEEE, pp. 185–188. Citadona página 41.

Moraes, J. C. T. d. B., Seixas, M., Vilani, F. N. & Costa, E. (2002). A real time qrs com-plex classification method using mahalanobis distance, Computers in Cardiology, IEEE,pp. 201–204. Citado na página 24.

Morettin, P. A. & Toloi, C. M. d. C. (2006). Análise de séries temporais, Análise de sériestemporais. Citado na página 29.

Mykoliuk, I., Jancarczyk, D., Karpinski, M. & Kifer, V. (2018). Machine learning methodsin electrocardiography classification, ACIT 2018 : International Conference AdvancedComputer Information Technologies . Citado 2 vezes nas páginas xix e 27.

Nadal, J. (1991). Classificação de arritmias cardíacas baseada em análise de componentesprincipais e árvores de decisão, PhD thesis, Tese de Doutorado, Programa de EngenhariaBiomédica, COPPE, Universidade Federal do Rio de Janeiro, Rio de Janeiro. Citado 6vezes nas páginas xix, 2, 23, 24, 41 e 101.

Nath, U. S., Arunima, C., Jaisha, R., Amjad, U. & Monteiro, J. I. (2018). A standalone openhardware system for ecg detection and classification, 2018 9th International Conferenceon Computing, Communication and Networking Technologies (ICCCNT), IEEE, pp. 1–5.Citado 3 vezes nas páginas 27, 101 e 102.

OASIS (2014). Mqtt version 3.1.URL: http://docs.oasis-open.org/mqtt/mqtt/v3.1.1/os/mqtt-v3.1.1-os.pdf Citado na página2.

Pan, J. & Tompkins, W. J. (1985). A real-time qrs detection algorithm, IEEE transactions onbiomedical engineering (3): 230–236. Citado 6 vezes nas páginas xiii, 23, 41, 43, 45 e 51.

113

Pastore, C. A., Pinho, C., Germiniani, H., Samesima, N. & Mano, R. (2009). Diretrizes dasociedade brasileira de cardiologia sobre análise e emissão de laudos eletrocardiográficos,Arquivos Brasileiros de Cardiologia 93(3): 1–19. Citado 5 vezes nas páginas xi, 6, 10, 15e 19.

Peitgen, H.-O., Jürgens, H. & Saupe, D. (2012). Fractals for the classroom: part two: complexsystems and mandelbrot set, Springer Science & Business Media. Citado na página 37.

Quinlan, J. R. (1986). Induction of decision trees, Machine learning 1: 81–106. Citado napágina 58.

Quinlan, J. R. (1993). C4.5: Programs for Machine Learning, Morgan Kaufmann Publishers,San Mateo, CA. Citado na página 58.

Rezende, S. O. (2003). Sistemas inteligentes: fundamentos e aplicações, Editora Manole Ltda.Citado 2 vezes nas páginas 31 e 32.

Rodriguez, J., Goni, A. & Illarramendi, A. (2005). Real-time classification of ecgs on a pda,IEEE Transactions on Information Technology in Biomedicine 9(1): 23–34. Citado 3 vezesnas páginas xix, 25 e 101.

Rotariu, C. & Manta, V. (2012). Wireless system for remote monitoring of oxygen saturationand heart rate, Computer Science and Information Systems (FedCSIS), 2012 FederatedConference on, IEEE, pp. 193–196. Citado na página 1.

Russel, S. & Norvig, P. (2004). Artificial inteligence: A modern approach. Citado na página33.

Takayasu, H. (1990). Fractals in the physical sciences, Manchester University Press. Citadona página 37.

Tsipouras, M. G., Fotiadis, D. I. & Sideris, D. A. (2005). An arrhythmia classification systembased on the rr-interval signal, Artificial intelligence in medicine 33(3): 237–250. Citadona página 25.

Vanzella, A. (2018). Sistema de detecção de queda e monitoramento da frequência cardíacautilizando esp8266 e protocolo mqtt, Master’s thesis, Universidade Estadual do Oeste doParaná - UNIOESTE, Foz do Iguaçu. Citado na página 2.

Ye, C., Coimbra, M. T. & Kumar, B. V. (2010). Arrhythmia detection and classification usingmorphological and dynamic features of ecg signals, 2010 Annual International Conferenceof the IEEE Engineering in Medicine and Biology, IEEE, pp. 1918–1921. Citado 2 vezesnas páginas 52 e 101.

Zuben, F. J. V. (2001). Redes neurais artificais. Citado na página 35.

114

Apêndices

115

116 Apêndices

Apêndice A

Saída do Weka para Testes Iniciais deNormalização Sem Normalização

=== Run i n f o r m a t i o n ===

Scheme : weka . c l a s s i f i e r s . t r e e s . RandomForest −P 100 −I 100 −num−s l o t s 1 −K 0 −M 1 . 0 −V 0.001 −S 1R e l a t i o n : a r ry thmya−weka . f i l t e r s . u n s u p e r v i s e d . a t t r i b u t e . Remove−R3−5,25−26I n s t a n c e s : 97645A t t r i b u t e s : 22

d i s t a n c i a _ r r _ a n td i s t a n c i a _ r r _ p o s tmediasdrmsmediank a t zcomplex idadeb o x _ c o u n t i n gv a r i o g r a mmadogramrodogramv a r i a t i o ni n c r 1ha l lwoodpe r iodog ramw a v e l e td c t I Ie n t r o p i a _ e m p i r i c ae n t r o p i a _ s h a n n o n _ c h a oe n t r o p i a _ s h a n n o n _ m i l l e rc l a s s

T e s t mode : 10− f o l d c r o s s−v a l i d a t i o n

=== C l a s s i f i e r model ( f u l l t r a i n i n g s e t ) ===

RandomForest

Bagging wi th 100 i t e r a t i o n s and base l e a r n e r

weka . c l a s s i f i e r s . t r e e s . RandomTree −K 0 −M 1 . 0 −V 0.001 −S 1 −do−not−check−c a p a b i l i t i e s

Time t a k e n t o b u i l d model : 80 .98 s e c o n d s

=== S t r a t i f i e d c r o s s−v a l i d a t i o n ====== Summary ===

117

118 Apêndices

C o r r e c t l y C l a s s i f i e d I n s t a n c e s 95449 97 .751 %I n c o r r e c t l y C l a s s i f i e d I n s t a n c e s 2196 2 .249 %Kappa s t a t i s t i c 0 .9474Mean a b s o l u t e e r r o r 0 .0089Root mean s q u a r e d e r r o r 0 .055R e l a t i v e a b s o l u t e e r r o r 13 .242 %Root r e l a t i v e s q u a r e d e r r o r 29 .9744 %T o t a l Number o f I n s t a n c e s 97645

=== D e t a i l e d Accuracy By C l a s s ===

TP Rate FP Rate P r e c i s i o n R e c a l l F−Measure MCC ROC Area PRC AreaC l a s s

0 ,996 0 ,065 0 ,977 0 ,996 0 ,987 0 ,948 0 ,997 0 ,999NORMAL

0 ,954 0 ,001 0 ,985 0 ,954 0 ,969 0 ,967 1 ,000 0 ,995LBBB

0 ,966 0 ,001 0 ,987 0 ,966 0 ,977 0 ,975 0 ,999 0 ,996RBBB

0 ,653 0 ,000 0 ,950 0 ,653 0 ,774 0 ,788 0 ,968 0 ,835ABERR

0 ,938 0 ,002 0 ,964 0 ,938 0 ,951 0 ,948 0 ,999 0 ,988PVC

0 ,565 0 ,000 0 ,905 0 ,565 0 ,695 0 ,713 0 ,982 0 ,769FUSION

0 ,329 0 ,000 1 ,000 0 ,329 0 ,495 0 ,573 0 ,979 0 ,702NPC

0 ,870 0 ,001 0 ,977 0 ,870 0 ,920 0 ,920 0 ,996 0 ,967APC

0 ,913 0 ,000 0 ,990 0 ,913 0 ,950 0 ,951 0 ,985 0 ,952VESC

0 ,232 0 ,000 0 ,886 0 ,232 0 ,368 0 ,453 0 ,980 0 ,649NESC

0 ,000 0 ,000 ? 0 ,000 ? ? 0 ,687 0 ,079AESC

0 ,993 0 ,000 0 ,991 0 ,993 0 ,992 0 ,992 1 ,000 1 ,000FLWAV

0 ,937 0 ,000 0 ,994 0 ,937 0 ,965 0 ,965 0 ,997 0 ,987NAPCWeighted Avg . 0 ,978 0 ,049 ? 0 ,978 ? ? 0 ,997 0 ,994

=== Confus ion Mat r i x ===

a b c d e f g h i j k l m <−− c l a s s i f i e d as71848 99 46 0 91 16 0 35 0 5 0 0 0 | a = NORMAL

356 7600 4 0 6 0 0 0 1 0 0 0 0 | b = LBBB234 2 6821 0 0 0 0 1 0 0 0 0 0 | c = RBBB

23 0 0 96 22 0 0 5 0 0 0 1 0 | d = ABERR327 10 1 2 5760 30 0 8 0 0 0 2 1 | e = PVC274 1 0 0 61 437 0 1 0 0 0 0 0 | f = FUSION

31 0 20 0 0 0 25 0 0 0 0 0 0 | g = NPC271 0 13 2 28 0 0 2094 0 0 0 0 0 | h = APC

7 2 0 0 0 0 0 0 95 0 0 0 0 | i = VESC124 0 5 0 0 0 0 0 0 39 0 0 0 | j = NESC

13 0 0 0 0 0 0 0 0 0 0 0 0 | k = AESC2 0 0 0 1 0 0 0 0 0 0 457 0 | l = FLWAV4 0 0 1 6 0 0 0 0 0 0 1 177 | m = NAPC

Apêndice B

Saída do Weka para Testes Iniciais deNormalização Origin

=== Run i n f o r m a t i o n ===

Scheme : weka . c l a s s i f i e r s . t r e e s . RandomForest −P 100 −I 100 −num−s l o t s 1 −K 0 −M 1 . 0 −V 0.001 −S 1R e l a t i o n : a r ry thmya−weka . f i l t e r s . u n s u p e r v i s e d . a t t r i b u t e . Remove−R3−5,25−26I n s t a n c e s : 97645A t t r i b u t e s : 22

d i s t a n c i a _ r r _ a n td i s t a n c i a _ r r _ p o s tmediasdrmsmediank a t zcomplex idadeb o x _ c o u n t i n gv a r i o g r a mmadogramrodogramv a r i a t i o ni n c r 1ha l lwoodpe r iodog ramw a v e l e td c t I Ie n t r o p i a _ e m p i r i c ae n t r o p i a _ s h a n n o n _ c h a oe n t r o p i a _ s h a n n o n _ m i l l e rc l a s s

T e s t mode : 10− f o l d c r o s s−v a l i d a t i o n

=== C l a s s i f i e r model ( f u l l t r a i n i n g s e t ) ===

RandomForest

Bagging wi th 100 i t e r a t i o n s and base l e a r n e r

weka . c l a s s i f i e r s . t r e e s . RandomTree −K 0 −M 1 . 0 −V 0.001 −S 1 −do−not−check−c a p a b i l i t i e s

Time t a k e n t o b u i l d model : 71 .19 s e c o n d s

=== S t r a t i f i e d c r o s s−v a l i d a t i o n ====== Summary ===

119

120 Apêndices

C o r r e c t l y C l a s s i f i e d I n s t a n c e s 95700 98 .0081 %I n c o r r e c t l y C l a s s i f i e d I n s t a n c e s 1945 1 .9919 %Kappa s t a t i s t i c 0 .9535Mean a b s o l u t e e r r o r 0 .0081Root mean s q u a r e d e r r o r 0 .0519R e l a t i v e a b s o l u t e e r r o r 12 .0053 %Root r e l a t i v e s q u a r e d e r r o r 28 .2693 %T o t a l Number o f I n s t a n c e s 97645

=== D e t a i l e d Accuracy By C l a s s ===

TP Rate FP Rate P r e c i s i o n R e c a l l F−Measure MCC ROC Area PRC AreaC l a s s

0 ,997 0 ,057 0 ,980 0 ,997 0 ,988 0 ,955 0 ,998 0 ,999NORMAL

0 ,968 0 ,001 0 ,986 0 ,968 0 ,977 0 ,975 1 ,000 0 ,997LBBB

0 ,969 0 ,001 0 ,987 0 ,969 0 ,978 0 ,976 1 ,000 0 ,997RBBB

0 ,653 0 ,000 0 ,923 0 ,653 0 ,765 0 ,776 0 ,975 0 ,827ABERR

0 ,944 0 ,002 0 ,972 0 ,944 0 ,958 0 ,955 0 ,998 0 ,990PVC

0 ,568 0 ,000 0 ,902 0 ,568 0 ,697 0 ,714 0 ,985 0 ,775FUSION

0 ,329 0 ,000 1 ,000 0 ,329 0 ,495 0 ,573 0 ,952 0 ,719NPC

0 ,861 0 ,000 0 ,979 0 ,861 0 ,916 0 ,916 0 ,997 0 ,969APC

0 ,894 0 ,000 0 ,979 0 ,894 0 ,935 0 ,936 0 ,995 0 ,969VESC

0 ,423 0 ,000 0 ,798 0 ,423 0 ,553 0 ,580 0 ,984 0 ,679NESC

0 ,000 0 ,000 ? 0 ,000 ? ? 0 ,727 0 ,099AESC

0 ,987 0 ,000 0 ,998 0 ,987 0 ,992 0 ,992 1 ,000 1 ,000FLWAV

0 ,926 0 ,000 0 ,989 0 ,926 0 ,956 0 ,957 0 ,997 0 ,986NAPCWeighted Avg . 0 ,980 0 ,043 ? 0 ,980 ? ? 0 ,998 0 ,994

=== Confus ion Mat r i x ===

a b c d e f g h i j k l m <−− c l a s s i f i e d as71926 74 37 1 46 12 0 26 0 18 0 0 0 | a = NORMAL

244 7709 7 0 5 0 0 0 2 0 0 0 0 | b = LBBB216 2 6839 0 0 0 0 1 0 0 0 0 0 | c = RBBB

29 0 0 96 17 0 0 5 0 0 0 0 0 | d = ABERR269 21 1 4 5798 36 0 9 0 0 0 1 2 | e = PVC274 3 0 0 57 440 0 0 0 0 0 0 0 | f = FUSION

33 0 17 0 1 0 25 0 0 0 0 0 0 | g = NPC283 0 19 2 30 0 0 2074 0 0 0 0 0 | h = APC

5 6 0 0 0 0 0 0 93 0 0 0 0 | i = VESC88 0 6 0 0 0 0 3 0 71 0 0 0 | j = NESC12 0 0 0 0 0 0 1 0 0 0 0 0 | k = AESC

5 0 0 0 1 0 0 0 0 0 0 454 0 | l = FLWAV3 0 0 1 10 0 0 0 0 0 0 0 175 | m = NAPC

Apêndice C

Saída do Weka para Testes Iniciais deNormalização Offset

=== Run i n f o r m a t i o n ===

Scheme : weka . c l a s s i f i e r s . t r e e s . RandomForest −P 100 −I 100 −num−s l o t s 1 −K 0 −M 1 . 0 −V 0.001 −S 1R e l a t i o n : a r ry thmya−weka . f i l t e r s . u n s u p e r v i s e d . a t t r i b u t e . Remove−R3−5,25−26I n s t a n c e s : 97645A t t r i b u t e s : 22

d i s t a n c i a _ r r _ a n td i s t a n c i a _ r r _ p o s tmediasdrmsmediank a t zcomplex idadeb o x _ c o u n t i n gv a r i o g r a mmadogramrodogramv a r i a t i o ni n c r 1ha l lwoodpe r iodog ramw a v e l e td c t I Ie n t r o p i a _ e m p i r i c ae n t r o p i a _ s h a n n o n _ c h a oe n t r o p i a _ s h a n n o n _ m i l l e rc l a s s

T e s t mode : 10− f o l d c r o s s−v a l i d a t i o n

=== C l a s s i f i e r model ( f u l l t r a i n i n g s e t ) ===

RandomForest

Bagging wi th 100 i t e r a t i o n s and base l e a r n e r

weka . c l a s s i f i e r s . t r e e s . RandomTree −K 0 −M 1 . 0 −V 0.001 −S 1 −do−not−check−c a p a b i l i t i e s

Time t a k e n t o b u i l d model : 73 .25 s e c o n d s

=== S t r a t i f i e d c r o s s−v a l i d a t i o n ====== Summary ===

121

122 Apêndices

C o r r e c t l y C l a s s i f i e d I n s t a n c e s 95011 97 .3025 %I n c o r r e c t l y C l a s s i f i e d I n s t a n c e s 2634 2 .6975 %Kappa s t a t i s t i c 0 .9365Mean a b s o l u t e e r r o r 0 .0112Root mean s q u a r e d e r r o r 0 .0606R e l a t i v e a b s o l u t e e r r o r 16 .558 %Root r e l a t i v e s q u a r e d e r r o r 33 .0539 %T o t a l Number o f I n s t a n c e s 97645

=== D e t a i l e d Accuracy By C l a s s ===

TP Rate FP Rate P r e c i s i o n R e c a l l F−Measure MCC ROC Area PRC AreaC l a s s

0 ,996 0 ,081 0 ,972 0 ,996 0 ,984 0 ,937 0 ,996 0 ,998NORMAL

0 ,941 0 ,001 0 ,983 0 ,941 0 ,961 0 ,958 0 ,999 0 ,993LBBB

0 ,952 0 ,001 0 ,984 0 ,952 0 ,968 0 ,965 0 ,999 0 ,994RBBB

0 ,605 0 ,000 0 ,947 0 ,605 0 ,739 0 ,757 0 ,978 0 ,788ABERR

0 ,931 0 ,003 0 ,961 0 ,931 0 ,946 0 ,943 0 ,998 0 ,985PVC

0 ,534 0 ,000 0 ,916 0 ,534 0 ,674 0 ,697 0 ,978 0 ,746FUSION

0 ,342 0 ,000 1 ,000 0 ,342 0 ,510 0 ,585 0 ,952 0 ,697NPC

0 ,816 0 ,000 0 ,978 0 ,816 0 ,890 0 ,891 0 ,995 0 ,954APC

0 ,894 0 ,000 0 ,979 0 ,894 0 ,935 0 ,936 0 ,985 0 ,949VESC

0 ,179 0 ,000 0 ,833 0 ,179 0 ,294 0 ,385 0 ,979 0 ,605NESC

0 ,000 0 ,000 ? 0 ,000 ? ? 0 ,648 0 ,021AESC

0 ,970 0 ,000 0 ,991 0 ,970 0 ,980 0 ,980 1 ,000 0 ,998FLWAV

0 ,926 0 ,000 0 ,994 0 ,926 0 ,959 0 ,959 0 ,997 0 ,983NAPCWeighted Avg . 0 ,973 0 ,060 ? 0 ,973 ? ? 0 ,996 0 ,992

=== Confus ion Mat r i x ===

a b c d e f g h i j k l m <−− c l a s s i f i e d as71836 110 59 1 97 7 0 24 0 6 0 0 0 | a = NORMAL

455 7496 9 0 3 0 0 2 2 0 0 0 0 | b = LBBB335 1 6721 0 0 0 0 1 0 0 0 0 0 | c = RBBB

32 0 0 89 17 0 0 7 0 0 0 2 0 | d = ABERR361 15 0 4 5720 31 0 7 0 0 0 2 1 | e = PVC288 1 0 0 71 413 0 1 0 0 0 0 0 | f = FUSION

31 0 19 0 0 0 26 0 0 0 0 0 0 | g = NPC392 1 20 0 29 0 0 1966 0 0 0 0 0 | h = APC

8 3 0 0 0 0 0 0 93 0 0 0 0 | i = VESC132 0 5 0 0 0 0 1 0 30 0 0 0 | j = NESC

13 0 0 0 0 0 0 0 0 0 0 0 0 | k = AESC6 0 0 0 8 0 0 0 0 0 0 446 0 | l = FLWAV7 0 0 0 6 0 0 1 0 0 0 0 175 | m = NAPC

Apêndice D

Saída do Weka para Testes Iniciais deNormalização Zero Axis

=== Run i n f o r m a t i o n ===

Scheme : weka . c l a s s i f i e r s . t r e e s . RandomForest −P 100 −I 100 −num−s l o t s 1 −K 0 −M 1 . 0 −V 0.001 −S 1R e l a t i o n : a r ry thmya−weka . f i l t e r s . u n s u p e r v i s e d . a t t r i b u t e . Remove−R3−5,25−26I n s t a n c e s : 97645A t t r i b u t e s : 22

d i s t a n c i a _ r r _ a n td i s t a n c i a _ r r _ p o s tmediasdrmsmediank a t zcomplex idadeb o x _ c o u n t i n gv a r i o g r a mmadogramrodogramv a r i a t i o ni n c r 1ha l lwoodpe r iodog ramw a v e l e td c t I Ie n t r o p i a _ e m p i r i c ae n t r o p i a _ s h a n n o n _ c h a oe n t r o p i a _ s h a n n o n _ m i l l e rc l a s s

T e s t mode : 10− f o l d c r o s s−v a l i d a t i o n

=== C l a s s i f i e r model ( f u l l t r a i n i n g s e t ) ===

RandomForest

Bagging wi th 100 i t e r a t i o n s and base l e a r n e r

weka . c l a s s i f i e r s . t r e e s . RandomTree −K 0 −M 1 . 0 −V 0.001 −S 1 −do−not−check−c a p a b i l i t i e s

Time t a k e n t o b u i l d model : 7 9 . 7 s e c o n d s

=== S t r a t i f i e d c r o s s−v a l i d a t i o n ====== Summary ===

123

124 Apêndices

C o r r e c t l y C l a s s i f i e d I n s t a n c e s 95429 97 .7306 %I n c o r r e c t l y C l a s s i f i e d I n s t a n c e s 2216 2 .2694 %Kappa s t a t i s t i c 0 .9469Mean a b s o l u t e e r r o r 0 .0091Root mean s q u a r e d e r r o r 0 .0548R e l a t i v e a b s o l u t e e r r o r 13 .4482 %Root r e l a t i v e s q u a r e d e r r o r 29 .8746 %T o t a l Number o f I n s t a n c e s 97645

=== D e t a i l e d Accuracy By C l a s s ===

TP Rate FP Rate P r e c i s i o n R e c a l l F−Measure MCC ROC Area PRC AreaC l a s s

0 ,997 0 ,067 0 ,977 0 ,997 0 ,987 0 ,948 0 ,997 0 ,999NORMAL

0 ,960 0 ,001 0 ,988 0 ,960 0 ,974 0 ,972 1 ,000 0 ,997LBBB

0 ,960 0 ,001 0 ,985 0 ,960 0 ,973 0 ,971 1 ,000 0 ,996RBBB

0 ,612 0 ,000 0 ,957 0 ,612 0 ,747 0 ,765 0 ,978 0 ,817ABERR

0 ,939 0 ,002 0 ,969 0 ,939 0 ,954 0 ,951 0 ,999 0 ,990PVC

0 ,536 0 ,001 0 ,894 0 ,536 0 ,670 0 ,691 0 ,985 0 ,765FUSION

0 ,329 0 ,000 1 ,000 0 ,329 0 ,495 0 ,573 0 ,978 0 ,647NPC

0 ,837 0 ,001 0 ,976 0 ,837 0 ,901 0 ,902 0 ,996 0 ,963APC

0 ,894 0 ,000 0 ,979 0 ,894 0 ,935 0 ,936 0 ,995 0 ,966VESC

0 ,357 0 ,000 0 ,800 0 ,357 0 ,494 0 ,534 0 ,980 0 ,649NESC

0 ,000 0 ,000 ? 0 ,000 ? ? 0 ,766 0 ,161AESC

0 ,993 0 ,000 0 ,981 0 ,993 0 ,987 0 ,987 1 ,000 1 ,000FLWAV

0 ,921 0 ,000 0 ,994 0 ,921 0 ,956 0 ,957 0 ,995 0 ,983NAPCWeighted Avg . 0 ,977 0 ,050 ? 0 ,977 ? ? 0 ,998 0 ,994

=== Confus ion Mat r i x ===

a b c d e f g h i j k l m <−− c l a s s i f i e d as71909 67 40 0 66 12 0 28 0 15 0 3 0 | a = NORMAL

308 7646 8 0 3 0 0 0 2 0 0 0 0 | b = LBBB275 2 6779 0 0 0 0 2 0 0 0 0 0 | c = RBBB

26 0 0 90 26 0 0 5 0 0 0 0 0 | d = ABERR308 11 0 4 5766 37 0 8 0 0 0 6 1 | e = PVC300 2 1 0 55 415 0 1 0 0 0 0 0 | f = FUSION

30 0 20 0 1 0 25 0 0 0 0 0 0 | g = NPC339 2 27 0 25 0 0 2015 0 0 0 0 0 | h = APC

5 6 0 0 0 0 0 0 93 0 0 0 0 | i = VESC99 0 7 0 0 0 0 2 0 60 0 0 0 | j = NESC12 0 0 0 0 0 0 1 0 0 0 0 0 | k = AESC

2 0 0 0 1 0 0 0 0 0 0 457 0 | l = FLWAV7 0 0 0 6 0 0 2 0 0 0 0 174 | m = NAPC

Apêndice E

Saída do Weka para Testes Iniciais deNormalização Sem Normalização e FiltroPassa Baixa

=== Run i n f o r m a t i o n ===

Scheme : weka . c l a s s i f i e r s . t r e e s . RandomForest −P 100 −I 100 −num−s l o t s 1 −K 0 −M 1 . 0 −V 0.001 −S 1R e l a t i o n : a r ry thmya−weka . f i l t e r s . u n s u p e r v i s e d . a t t r i b u t e . Remove−R3−5,25−26I n s t a n c e s : 97644A t t r i b u t e s : 22

d i s t a n c i a _ r r _ a n td i s t a n c i a _ r r _ p o s tmediasdrmsmediank a t zcomplex idadeb o x _ c o u n t i n gv a r i o g r a mmadogramrodogramv a r i a t i o ni n c r 1ha l lwoodpe r iodog ramw a v e l e td c t I Ie n t r o p i a _ e m p i r i c ae n t r o p i a _ s h a n n o n _ c h a oe n t r o p i a _ s h a n n o n _ m i l l e rc l a s s

T e s t mode : 10− f o l d c r o s s−v a l i d a t i o n

=== C l a s s i f i e r model ( f u l l t r a i n i n g s e t ) ===

RandomForest

Bagging wi th 100 i t e r a t i o n s and base l e a r n e r

weka . c l a s s i f i e r s . t r e e s . RandomTree −K 0 −M 1 . 0 −V 0.001 −S 1 −do−not−check−c a p a b i l i t i e s

Time t a k e n t o b u i l d model : 88 .55 s e c o n d s

125

126 Apêndices

=== S t r a t i f i e d c r o s s−v a l i d a t i o n ====== Summary ===

C o r r e c t l y C l a s s i f i e d I n s t a n c e s 95605 97 .9118 %I n c o r r e c t l y C l a s s i f i e d I n s t a n c e s 2039 2 .0882 %Kappa s t a t i s t i c 0 .9512Mean a b s o l u t e e r r o r 0 .0082Root mean s q u a r e d e r r o r 0 .0528R e l a t i v e a b s o l u t e e r r o r 12 .1365 %Root r e l a t i v e s q u a r e d e r r o r 28 .7878 %T o t a l Number o f I n s t a n c e s 97644

=== D e t a i l e d Accuracy By C l a s s ===

TP Rate FP Rate P r e c i s i o n R e c a l l F−Measure MCC ROC Area PRC AreaC l a s s

0 ,997 0 ,061 0 ,979 0 ,997 0 ,988 0 ,952 0 ,998 0 ,999NORMAL

0 ,958 0 ,001 0 ,985 0 ,958 0 ,971 0 ,969 1 ,000 0 ,996LBBB

0 ,975 0 ,001 0 ,992 0 ,975 0 ,983 0 ,982 1 ,000 0 ,998RBBB

0 ,639 0 ,000 0 ,940 0 ,639 0 ,761 0 ,775 0 ,985 0 ,822ABERR

0 ,943 0 ,002 0 ,968 0 ,943 0 ,955 0 ,952 0 ,999 0 ,989PVC

0 ,594 0 ,000 0 ,920 0 ,594 0 ,722 0 ,738 0 ,989 0 ,803FUSION

0 ,303 0 ,000 1 ,000 0 ,303 0 ,465 0 ,550 0 ,964 0 ,585NPC

0 ,866 0 ,001 0 ,974 0 ,866 0 ,917 0 ,916 0 ,996 0 ,967APC

0 ,942 0 ,000 0 ,980 0 ,942 0 ,961 0 ,961 0 ,990 0 ,974VESC

0 ,125 0 ,000 0 ,750 0 ,125 0 ,214 0 ,306 0 ,983 0 ,581NESC

0 ,000 0 ,000 ? 0 ,000 ? ? 0 ,764 0 ,021AESC

0 ,987 0 ,000 0 ,991 0 ,987 0 ,989 0 ,989 1 ,000 1 ,000FLWAV

0 ,937 0 ,000 0 ,994 0 ,937 0 ,965 0 ,965 0 ,997 0 ,986NAPCWeighted Avg . 0 ,979 0 ,045 ? 0 ,979 ? ? 0 ,998 0 ,994

=== Confus ion Mat r i x ===

a b c d e f g h i j k l m <−− c l a s s i f i e d as71890 98 15 0 79 15 0 36 0 6 0 0 0 | a = NORMAL

323 7630 7 0 4 0 0 1 2 0 0 0 0 | b = LBBB171 1 6884 0 1 0 0 1 0 0 0 0 0 | c = RBBB

30 0 0 94 17 0 0 4 0 0 0 2 0 | d = ABERR299 14 0 2 5789 25 0 9 0 0 0 2 1 | e = PVC248 5 0 0 59 460 0 2 0 0 0 0 0 | f = FUSION

33 0 19 0 1 0 23 0 0 0 0 0 0 | g = NPC288 0 11 2 21 0 0 2085 0 1 0 0 0 | h = APC

6 0 0 0 0 0 0 0 98 0 0 0 0 | i = VESC139 0 6 0 0 0 0 2 0 21 0 0 0 | j = NESC

13 0 0 0 0 0 0 0 0 0 0 0 0 | k = AESC3 0 0 0 2 0 0 1 0 0 0 454 0 | l = FLWAV4 0 0 2 6 0 0 0 0 0 0 0 177 | m = NAPC

Apêndice F

Saída do Weka para Testes Iniciais deNormalização Origin e Filtro Passa Baixa

=== Run i n f o r m a t i o n ===

Scheme : weka . c l a s s i f i e r s . t r e e s . RandomForest −P 100 −I 100 −num−s l o t s 1 −K 0 −M 1 . 0 −V 0.001 −S 1R e l a t i o n : a r ry thmya−weka . f i l t e r s . u n s u p e r v i s e d . a t t r i b u t e . Remove−R3−5,25−26I n s t a n c e s : 97644A t t r i b u t e s : 22

d i s t a n c i a _ r r _ a n td i s t a n c i a _ r r _ p o s tmediasdrmsmediank a t zcomplex idadeb o x _ c o u n t i n gv a r i o g r a mmadogramrodogramv a r i a t i o ni n c r 1ha l lwoodpe r iodog ramw a v e l e td c t I Ie n t r o p i a _ e m p i r i c ae n t r o p i a _ s h a n n o n _ c h a oe n t r o p i a _ s h a n n o n _ m i l l e rc l a s s

T e s t mode : 10− f o l d c r o s s−v a l i d a t i o n

=== C l a s s i f i e r model ( f u l l t r a i n i n g s e t ) ===

RandomForest

Bagging wi th 100 i t e r a t i o n s and base l e a r n e r

weka . c l a s s i f i e r s . t r e e s . RandomTree −K 0 −M 1 . 0 −V 0.001 −S 1 −do−not−check−c a p a b i l i t i e s

Time t a k e n t o b u i l d model : 89 .72 s e c o n d s

=== S t r a t i f i e d c r o s s−v a l i d a t i o n ====== Summary ===

127

128 Apêndices

C o r r e c t l y C l a s s i f i e d I n s t a n c e s 95560 97 .8657 %I n c o r r e c t l y C l a s s i f i e d I n s t a n c e s 2084 2 .1343 %Kappa s t a t i s t i c 0 .9501Mean a b s o l u t e e r r o r 0 .0082Root mean s q u a r e d e r r o r 0 .053R e l a t i v e a b s o l u t e e r r o r 12 .238 %Root r e l a t i v e s q u a r e d e r r o r 28 .8816 %T o t a l Number o f I n s t a n c e s 97644

=== D e t a i l e d Accuracy By C l a s s ===

TP Rate FP Rate P r e c i s i o n R e c a l l F−Measure MCC ROC Area PRC AreaC l a s s

0 ,997 0 ,062 0 ,978 0 ,997 0 ,987 0 ,951 0 ,998 0 ,999NORMAL

0 ,956 0 ,001 0 ,986 0 ,956 0 ,970 0 ,968 1 ,000 0 ,996LBBB

0 ,974 0 ,001 0 ,992 0 ,974 0 ,983 0 ,981 1 ,000 0 ,997RBBB

0 ,619 0 ,000 0 ,958 0 ,619 0 ,752 0 ,770 0 ,978 0 ,812ABERR

0 ,942 0 ,002 0 ,966 0 ,942 0 ,954 0 ,951 0 ,999 0 ,989PVC

0 ,584 0 ,000 0 ,908 0 ,584 0 ,711 0 ,726 0 ,986 0 ,801FUSION

0 ,329 0 ,000 1 ,000 0 ,329 0 ,495 0 ,573 0 ,964 0 ,580NPC

0 ,863 0 ,001 0 ,974 0 ,863 0 ,915 0 ,915 0 ,996 0 ,967APC

0 ,942 0 ,000 1 ,000 0 ,942 0 ,970 0 ,971 0 ,990 0 ,972VESC

0 ,161 0 ,000 0 ,794 0 ,161 0 ,267 0 ,357 0 ,977 0 ,582NESC

0 ,000 0 ,000 ? 0 ,000 ? ? 0 ,687 0 ,006AESC

0 ,987 0 ,000 0 ,991 0 ,987 0 ,989 0 ,989 1 ,000 1 ,000FLWAV

0 ,921 0 ,000 0 ,994 0 ,921 0 ,956 0 ,957 0 ,997 0 ,986NAPCWeighted Avg . 0 ,979 0 ,046 ? 0 ,979 ? ? 0 ,998 0 ,994

=== Confus ion Mat r i x ===

a b c d e f g h i j k l m <−− c l a s s i f i e d as71890 89 17 0 88 16 0 33 0 6 0 0 0 | a = NORMAL

344 7615 5 0 3 0 0 0 0 0 0 0 0 | b = LBBB183 1 6872 0 1 0 0 1 0 0 0 0 0 | c = RBBB

32 0 0 91 14 0 0 7 0 0 0 3 0 | d = ABERR295 14 2 2 5785 30 0 11 0 0 0 1 1 | e = PVC252 7 0 0 62 452 0 1 0 0 0 0 0 | f = FUSION

33 0 17 0 1 0 25 0 0 0 0 0 0 | g = NPC293 0 12 1 24 0 0 2077 0 1 0 0 0 | h = APC

6 0 0 0 0 0 0 0 98 0 0 0 0 | i = VESC135 0 5 0 0 0 0 1 0 27 0 0 0 | j = NESC

13 0 0 0 0 0 0 0 0 0 0 0 0 | k = AESC3 0 0 0 2 0 0 1 0 0 0 454 0 | l = FLWAV5 0 0 1 9 0 0 0 0 0 0 0 174 | m = NAPC

Apêndice G

Saída do Weka para Testes Iniciais deNormalização Offset e Filtro Passa Baixa

=== Run i n f o r m a t i o n ===

Scheme : weka . c l a s s i f i e r s . t r e e s . RandomForest −P 100 −I 100 −num−s l o t s 1 −K 0 −M 1 . 0 −V 0.001 −S 1R e l a t i o n : a r ry thmya−weka . f i l t e r s . u n s u p e r v i s e d . a t t r i b u t e . Remove−R3−5,25−26I n s t a n c e s : 97644A t t r i b u t e s : 22

d i s t a n c i a _ r r _ a n td i s t a n c i a _ r r _ p o s tmediasdrmsmediank a t zcomplex idadeb o x _ c o u n t i n gv a r i o g r a mmadogramrodogramv a r i a t i o ni n c r 1ha l lwoodpe r iodog ramw a v e l e td c t I Ie n t r o p i a _ e m p i r i c ae n t r o p i a _ s h a n n o n _ c h a oe n t r o p i a _ s h a n n o n _ m i l l e rc l a s s

T e s t mode : 10− f o l d c r o s s−v a l i d a t i o n

=== C l a s s i f i e r model ( f u l l t r a i n i n g s e t ) ===

RandomForest

Bagging wi th 100 i t e r a t i o n s and base l e a r n e r

weka . c l a s s i f i e r s . t r e e s . RandomTree −K 0 −M 1 . 0 −V 0.001 −S 1 −do−not−check−c a p a b i l i t i e s

Time t a k e n t o b u i l d model : 74 .22 s e c o n d s

=== S t r a t i f i e d c r o s s−v a l i d a t i o n ====== Summary ===

129

130 Apêndices

C o r r e c t l y C l a s s i f i e d I n s t a n c e s 95302 97 .6015 %I n c o r r e c t l y C l a s s i f i e d I n s t a n c e s 2342 2 .3985 %Kappa s t a t i s t i c 0 .9438Mean a b s o l u t e e r r o r 0 .0098Root mean s q u a r e d e r r o r 0 .0571R e l a t i v e a b s o l u t e e r r o r 14 .605 %Root r e l a t i v e s q u a r e d e r r o r 31 .1422 %T o t a l Number o f I n s t a n c e s 97644

=== D e t a i l e d Accuracy By C l a s s ===

TP Rate FP Rate P r e c i s i o n R e c a l l F−Measure MCC ROC Area PRC AreaC l a s s

0 ,997 0 ,070 0 ,976 0 ,997 0 ,986 0 ,945 0 ,997 0 ,999NORMAL

0 ,951 0 ,001 0 ,985 0 ,951 0 ,968 0 ,965 0 ,999 0 ,995LBBB

0 ,969 0 ,001 0 ,991 0 ,969 0 ,980 0 ,979 0 ,999 0 ,997RBBB

0 ,497 0 ,000 0 ,901 0 ,497 0 ,640 0 ,669 0 ,977 0 ,737ABERR

0 ,934 0 ,003 0 ,956 0 ,934 0 ,945 0 ,941 0 ,998 0 ,986PVC

0 ,550 0 ,000 0 ,920 0 ,550 0 ,689 0 ,710 0 ,980 0 ,782FUSION

0 ,263 0 ,000 0 ,952 0 ,263 0 ,412 0 ,500 0 ,938 0 ,568NPC

0 ,832 0 ,000 0 ,978 0 ,832 0 ,899 0 ,900 0 ,996 0 ,957APC

0 ,942 0 ,000 0 ,990 0 ,942 0 ,966 0 ,966 0 ,990 0 ,966VESC

0 ,101 0 ,000 0 ,773 0 ,101 0 ,179 0 ,279 0 ,978 0 ,520NESC

0 ,000 0 ,000 ? 0 ,000 ? ? 0 ,726 0 ,017AESC

0 ,972 0 ,000 0 ,982 0 ,972 0 ,977 0 ,977 1 ,000 0 ,997FLWAV

0 ,910 0 ,000 0 ,994 0 ,910 0 ,950 0 ,951 0 ,997 0 ,985NAPCWeighted Avg . 0 ,976 0 ,052 ? 0 ,976 ? ? 0 ,997 0 ,993

=== Confus ion Mat r i x ===

a b c d e f g h i j k l m <−− c l a s s i f i e d as71891 79 11 3 116 8 0 26 0 5 0 0 0 | a = NORMAL

367 7577 9 0 9 0 0 4 1 0 0 0 0 | b = LBBB215 0 6842 0 0 0 0 1 0 0 0 0 0 | c = RBBB

49 0 0 73 17 0 0 5 0 0 0 3 0 | d = ABERR337 24 1 3 5735 29 0 6 0 0 0 5 1 | e = PVC263 9 0 0 75 426 0 1 0 0 0 0 0 | f = FUSION

35 0 21 0 0 0 20 0 0 0 0 0 0 | g = NPC356 5 13 1 28 0 1 2004 0 0 0 0 0 | h = APC

6 0 0 0 0 0 0 0 98 0 0 0 0 | i = VESC144 0 4 0 0 0 0 3 0 17 0 0 0 | j = NESC

13 0 0 0 0 0 0 0 0 0 0 0 0 | k = AESC5 0 0 0 8 0 0 0 0 0 0 447 0 | l = FLWAV8 0 0 1 8 0 0 0 0 0 0 0 172 | m = NAPC

Apêndice H

Saída do Weka para Testes Iniciais deNormalização Zero Axis e Filtro Passa Baixa

=== Run i n f o r m a t i o n ===

Scheme : weka . c l a s s i f i e r s . t r e e s . RandomForest −P 100 −I 100 −num−s l o t s 1 −K 0 −M 1 . 0 −V 0.001 −S 1R e l a t i o n : a r ry thmya−weka . f i l t e r s . u n s u p e r v i s e d . a t t r i b u t e . Remove−R3−5,25−26I n s t a n c e s : 97644A t t r i b u t e s : 22

d i s t a n c i a _ r r _ a n td i s t a n c i a _ r r _ p o s tmediasdrmsmediank a t zcomplex idadeb o x _ c o u n t i n gv a r i o g r a mmadogramrodogramv a r i a t i o ni n c r 1ha l lwoodpe r iodog ramw a v e l e td c t I Ie n t r o p i a _ e m p i r i c ae n t r o p i a _ s h a n n o n _ c h a oe n t r o p i a _ s h a n n o n _ m i l l e rc l a s s

T e s t mode : 10− f o l d c r o s s−v a l i d a t i o n

=== C l a s s i f i e r model ( f u l l t r a i n i n g s e t ) ===

RandomForest

Bagging wi th 100 i t e r a t i o n s and base l e a r n e r

weka . c l a s s i f i e r s . t r e e s . RandomTree −K 0 −M 1 . 0 −V 0.001 −S 1 −do−not−check−c a p a b i l i t i e s

Time t a k e n t o b u i l d model : 78 .72 s e c o n d s

=== S t r a t i f i e d c r o s s−v a l i d a t i o n ====== Summary ===

131

132 Apêndices

C o r r e c t l y C l a s s i f i e d I n s t a n c e s 95615 97 .922 %I n c o r r e c t l y C l a s s i f i e d I n s t a n c e s 2029 2 .078 %Kappa s t a t i s t i c 0 .9515Mean a b s o l u t e e r r o r 0 .0081Root mean s q u a r e d e r r o r 0 .0522R e l a t i v e a b s o l u t e e r r o r 12 .0156 %Root r e l a t i v e s q u a r e d e r r o r 28 .4618 %T o t a l Number o f I n s t a n c e s 97644

=== D e t a i l e d Accuracy By C l a s s ===

TP Rate FP Rate P r e c i s i o n R e c a l l F−Measure MCC ROC Area PRC AreaC l a s s

0 ,996 0 ,060 0 ,979 0 ,996 0 ,988 0 ,952 0 ,998 0 ,999NORMAL

0 ,959 0 ,001 0 ,985 0 ,959 0 ,972 0 ,969 1 ,000 0 ,996LBBB

0 ,975 0 ,001 0 ,991 0 ,975 0 ,983 0 ,982 1 ,000 0 ,998RBBB

0 ,626 0 ,000 0 ,939 0 ,626 0 ,751 0 ,766 0 ,985 0 ,815ABERR

0 ,941 0 ,002 0 ,968 0 ,941 0 ,955 0 ,952 0 ,999 0 ,990PVC

0 ,583 0 ,000 0 ,907 0 ,583 0 ,710 0 ,726 0 ,984 0 ,808FUSION

0 ,303 0 ,000 1 ,000 0 ,303 0 ,465 0 ,550 0 ,972 0 ,631NPC

0 ,866 0 ,001 0 ,977 0 ,866 0 ,918 0 ,918 0 ,996 0 ,967APC

0 ,942 0 ,000 0 ,970 0 ,942 0 ,956 0 ,956 0 ,990 0 ,971VESC

0 ,304 0 ,000 0 ,773 0 ,304 0 ,436 0 ,484 0 ,974 0 ,607NESC

0 ,000 0 ,000 ? 0 ,000 ? ? 0 ,765 0 ,041AESC

0 ,989 0 ,000 0 ,993 0 ,989 0 ,991 0 ,991 1 ,000 1 ,000FLWAV

0 ,937 0 ,000 0 ,994 0 ,937 0 ,965 0 ,965 0 ,997 0 ,987NAPCWeighted Avg . 0 ,979 0 ,045 ? 0 ,979 ? ? 0 ,998 0 ,994

=== Confus ion Mat r i x ===

a b c d e f g h i j k l m <−− c l a s s i f i e d as71881 100 19 0 76 20 0 29 0 14 0 0 0 | a = NORMAL

317 7639 4 0 4 0 0 0 3 0 0 0 0 | b = LBBB174 1 6881 0 1 0 0 1 0 0 0 0 0 | c = RBBB

38 0 0 92 12 0 0 2 0 0 0 3 0 | d = ABERR305 11 1 3 5781 26 0 13 0 0 0 0 1 | e = PVC253 6 0 0 62 451 0 2 0 0 0 0 0 | f = FUSION

35 0 17 0 1 0 23 0 0 0 0 0 0 | g = NPC286 0 11 1 23 0 0 2086 0 1 0 0 0 | h = APC

6 0 0 0 0 0 0 0 98 0 0 0 0 | i = VESC108 0 7 0 0 0 0 2 0 51 0 0 0 | j = NESC

13 0 0 0 0 0 0 0 0 0 0 0 0 | k = AESC2 0 0 0 3 0 0 0 0 0 0 455 0 | l = FLWAV3 0 0 2 7 0 0 0 0 0 0 0 177 | m = NAPC

Apêndice I

Saida do Weka para Testes Iniciais deNormalização Sem Normalização e FiltroPassa Alta

=== Run i n f o r m a t i o n ===

Scheme : weka . c l a s s i f i e r s . t r e e s . RandomForest −P 100 −I 100 −num−s l o t s 1 −K 0 −M 1 . 0 −V 0.001 −S 1R e l a t i o n : a r ry thmya−weka . f i l t e r s . u n s u p e r v i s e d . a t t r i b u t e . Remove−R3−5,25−26I n s t a n c e s : 97644A t t r i b u t e s : 22

d i s t a n c i a _ r r _ a n td i s t a n c i a _ r r _ p o s tmediasdrmsmediank a t zcomplex idadeb o x _ c o u n t i n gv a r i o g r a mmadogramrodogramv a r i a t i o ni n c r 1ha l lwoodpe r iodog ramw a v e l e td c t I Ie n t r o p i a _ e m p i r i c ae n t r o p i a _ s h a n n o n _ c h a oe n t r o p i a _ s h a n n o n _ m i l l e rc l a s s

T e s t mode : 10− f o l d c r o s s−v a l i d a t i o n

=== C l a s s i f i e r model ( f u l l t r a i n i n g s e t ) ===

RandomForest

Bagging wi th 100 i t e r a t i o n s and base l e a r n e r

weka . c l a s s i f i e r s . t r e e s . RandomTree −K 0 −M 1 . 0 −V 0.001 −S 1 −do−not−check−c a p a b i l i t i e s

Time t a k e n t o b u i l d model : 88 .88 s e c o n d s

133

134 Apêndices

=== S t r a t i f i e d c r o s s−v a l i d a t i o n ====== Summary ===

C o r r e c t l y C l a s s i f i e d I n s t a n c e s 95526 97 .8309 %I n c o r r e c t l y C l a s s i f i e d I n s t a n c e s 2118 2 .1691 %Kappa s t a t i s t i c 0 .9494Mean a b s o l u t e e r r o r 0 .0086Root mean s q u a r e d e r r o r 0 .0537R e l a t i v e a b s o l u t e e r r o r 12 .7105 %Root r e l a t i v e s q u a r e d e r r o r 29 .2824 %T o t a l Number o f I n s t a n c e s 97644

=== D e t a i l e d Accuracy By C l a s s ===

TP Rate FP Rate P r e c i s i o n R e c a l l F−Measure MCC ROC Area PRC AreaC l a s s

0 ,996 0 ,062 0 ,979 0 ,996 0 ,987 0 ,950 0 ,997 0 ,999NORMAL

0 ,954 0 ,002 0 ,981 0 ,954 0 ,967 0 ,965 0 ,999 0 ,995LBBB

0 ,968 0 ,001 0 ,988 0 ,968 0 ,978 0 ,976 1 ,000 0 ,997RBBB

0 ,660 0 ,000 0 ,960 0 ,660 0 ,782 0 ,796 0 ,982 0 ,843ABERR

0 ,944 0 ,002 0 ,967 0 ,944 0 ,956 0 ,953 0 ,998 0 ,989PVC

0 ,633 0 ,000 0 ,911 0 ,633 0 ,747 0 ,758 0 ,985 0 ,818FUSION

0 ,329 0 ,000 1 ,000 0 ,329 0 ,495 0 ,573 0 ,972 0 ,745NPC

0 ,864 0 ,001 0 ,975 0 ,864 0 ,916 0 ,916 0 ,995 0 ,966APC

0 ,913 0 ,000 0 ,990 0 ,913 0 ,950 0 ,951 0 ,981 0 ,950VESC

0 ,226 0 ,000 0 ,927 0 ,226 0 ,364 0 ,458 0 ,980 0 ,639NESC

0 ,000 0 ,000 ? 0 ,000 ? ? 0 ,765 0 ,088AESC

0 ,989 0 ,000 0 ,998 0 ,989 0 ,993 0 ,993 1 ,000 1 ,000FLWAV

0 ,931 0 ,000 0 ,994 0 ,931 0 ,962 0 ,962 0 ,995 0 ,983NAPCWeighted Avg . 0 ,978 0 ,046 ? 0 ,978 ? ? 0 ,998 0 ,994

=== Confus ion Mat r i x ===

a b c d e f g h i j k l m <−− c l a s s i f i e d as71832 121 49 0 80 21 0 33 0 3 0 0 0 | a = NORMAL

352 7604 3 0 6 0 0 1 1 0 0 0 0 | b = LBBB219 2 6835 0 1 0 0 1 0 0 0 0 0 | c = RBBB

27 0 0 97 19 0 0 4 0 0 0 0 0 | d = ABERR279 21 0 3 5798 27 0 11 0 0 0 1 1 | e = PVC222 3 0 0 58 490 0 1 0 0 0 0 0 | f = FUSION

32 0 18 0 1 0 25 0 0 0 0 0 0 | g = NPC294 1 11 1 20 0 0 2081 0 0 0 0 0 | h = APC

7 2 0 0 0 0 0 0 95 0 0 0 0 | i = VESC123 0 5 0 0 0 0 2 0 38 0 0 0 | j = NESC

13 0 0 0 0 0 0 0 0 0 0 0 0 | k = AESC2 0 0 0 2 0 0 1 0 0 0 455 0 | l = FLWAV3 0 0 0 10 0 0 0 0 0 0 0 176 | m = NAPC

Apêndice J

Saída do Weka para Testes Iniciais deNormalização Origin e Filtro Passa Alta

=== Run i n f o r m a t i o n ===

Scheme : weka . c l a s s i f i e r s . t r e e s . RandomForest −P 100 −I 100 −num−s l o t s 1 −K 0 −M 1 . 0 −V 0.001 −S 1R e l a t i o n : a r ry thmya−weka . f i l t e r s . u n s u p e r v i s e d . a t t r i b u t e . Remove−R3−5,25−26I n s t a n c e s : 97644A t t r i b u t e s : 22

d i s t a n c i a _ r r _ a n td i s t a n c i a _ r r _ p o s tmediasdrmsmediank a t zcomplex idadeb o x _ c o u n t i n gv a r i o g r a mmadogramrodogramv a r i a t i o ni n c r 1ha l lwoodpe r iodog ramw a v e l e td c t I Ie n t r o p i a _ e m p i r i c ae n t r o p i a _ s h a n n o n _ c h a oe n t r o p i a _ s h a n n o n _ m i l l e rc l a s s

T e s t mode : 10− f o l d c r o s s−v a l i d a t i o n

=== C l a s s i f i e r model ( f u l l t r a i n i n g s e t ) ===

RandomForest

Bagging wi th 100 i t e r a t i o n s and base l e a r n e r

weka . c l a s s i f i e r s . t r e e s . RandomTree −K 0 −M 1 . 0 −V 0.001 −S 1 −do−not−check−c a p a b i l i t i e s

Time t a k e n t o b u i l d model : 100 .81 s e c o n d s

=== S t r a t i f i e d c r o s s−v a l i d a t i o n ====== Summary ===

135

136 Apêndices

C o r r e c t l y C l a s s i f i e d I n s t a n c e s 95562 97 .8678 %I n c o r r e c t l y C l a s s i f i e d I n s t a n c e s 2082 2 .1322 %Kappa s t a t i s t i c 0 .9503Mean a b s o l u t e e r r o r 0 .0084Root mean s q u a r e d e r r o r 0 .0533R e l a t i v e a b s o l u t e e r r o r 12 .5265 %Root r e l a t i v e s q u a r e d e r r o r 29 .0472 %T o t a l Number o f I n s t a n c e s 97644

=== D e t a i l e d Accuracy By C l a s s ===

TP Rate FP Rate P r e c i s i o n R e c a l l F−Measure MCC ROC Area PRC AreaC l a s s

0 ,996 0 ,060 0 ,979 0 ,996 0 ,987 0 ,951 0 ,998 0 ,999NORMAL

0 ,955 0 ,002 0 ,981 0 ,955 0 ,968 0 ,966 1 ,000 0 ,996LBBB

0 ,968 0 ,001 0 ,989 0 ,968 0 ,978 0 ,977 1 ,000 0 ,997RBBB

0 ,626 0 ,000 0 ,929 0 ,626 0 ,748 0 ,762 0 ,982 0 ,844ABERR

0 ,944 0 ,002 0 ,967 0 ,944 0 ,955 0 ,952 0 ,999 0 ,989PVC

0 ,636 0 ,001 0 ,908 0 ,636 0 ,748 0 ,758 0 ,982 0 ,816FUSION

0 ,342 0 ,000 1 ,000 0 ,342 0 ,510 0 ,585 0 ,972 0 ,729NPC

0 ,868 0 ,001 0 ,975 0 ,868 0 ,919 0 ,918 0 ,997 0 ,967APC

0 ,913 0 ,000 0 ,990 0 ,913 0 ,950 0 ,951 0 ,985 0 ,949VESC

0 ,256 0 ,000 0 ,878 0 ,256 0 ,396 0 ,474 0 ,989 0 ,640NESC

0 ,000 0 ,000 ? 0 ,000 ? ? 0 ,803 0 ,051AESC

0 ,993 0 ,000 0 ,993 0 ,993 0 ,993 0 ,993 1 ,000 1 ,000FLWAV

0 ,926 0 ,000 0 ,994 0 ,926 0 ,959 0 ,959 0 ,997 0 ,983NAPCWeighted Avg . 0 ,979 0 ,045 ? 0 ,979 ? ? 0 ,998 0 ,994

=== Confus ion Mat r i x ===

a b c d e f g h i j k l m <−− c l a s s i f i e d as71853 119 39 1 71 19 0 32 0 5 0 0 0 | a = NORMAL

345 7611 4 0 6 0 0 0 1 0 0 0 0 | b = LBBB223 2 6831 0 1 0 0 1 0 0 0 0 0 | c = RBBB

30 0 0 92 22 0 0 3 0 0 0 0 0 | d = ABERR276 19 0 3 5796 30 0 13 0 0 0 3 1 | e = PVC219 2 0 0 60 492 0 1 0 0 0 0 0 | f = FUSION

33 0 16 0 1 0 26 0 0 0 0 0 0 | g = NPC278 0 11 2 24 1 0 2091 0 1 0 0 0 | h = APC

7 2 0 0 0 0 0 0 95 0 0 0 0 | i = VESC118 0 5 0 0 0 0 2 0 43 0 0 0 | j = NESC

13 0 0 0 0 0 0 0 0 0 0 0 0 | k = AESC0 0 0 0 2 0 0 1 0 0 0 457 0 | l = FLWAV1 0 0 1 11 0 0 1 0 0 0 0 175 | m = NAPC

Apêndice K

Saída do Weka para Testes Iniciais deNormalização Offset e Filtro Passa Alta

=== Run i n f o r m a t i o n ===

Scheme : weka . c l a s s i f i e r s . t r e e s . RandomForest −P 100 −I 100 −num−s l o t s 1 −K 0 −M 1 . 0 −V 0.001 −S 1R e l a t i o n : a r ry thmya−weka . f i l t e r s . u n s u p e r v i s e d . a t t r i b u t e . Remove−R3−5,25−26I n s t a n c e s : 97644A t t r i b u t e s : 22

d i s t a n c i a _ r r _ a n td i s t a n c i a _ r r _ p o s tmediasdrmsmediank a t zcomplex idadeb o x _ c o u n t i n gv a r i o g r a mmadogramrodogramv a r i a t i o ni n c r 1ha l lwoodpe r iodog ramw a v e l e td c t I Ie n t r o p i a _ e m p i r i c ae n t r o p i a _ s h a n n o n _ c h a oe n t r o p i a _ s h a n n o n _ m i l l e rc l a s s

T e s t mode : 10− f o l d c r o s s−v a l i d a t i o n

=== C l a s s i f i e r model ( f u l l t r a i n i n g s e t ) ===

RandomForest

Bagging wi th 100 i t e r a t i o n s and base l e a r n e r

weka . c l a s s i f i e r s . t r e e s . RandomTree −K 0 −M 1 . 0 −V 0.001 −S 1 −do−not−check−c a p a b i l i t i e s

Time t a k e n t o b u i l d model : 83 .46 s e c o n d s

=== S t r a t i f i e d c r o s s−v a l i d a t i o n ====== Summary ===

137

138 Apêndices

C o r r e c t l y C l a s s i f i e d I n s t a n c e s 94975 97 .2666 %I n c o r r e c t l y C l a s s i f i e d I n s t a n c e s 2669 2 .7334 %Kappa s t a t i s t i c 0 .9358Mean a b s o l u t e e r r o r 0 .0108Root mean s q u a r e d e r r o r 0 .0598R e l a t i v e a b s o l u t e e r r o r 16 .0527 %Root r e l a t i v e s q u a r e d e r r o r 32 .6037 %T o t a l Number o f I n s t a n c e s 97644

=== D e t a i l e d Accuracy By C l a s s ===

TP Rate FP Rate P r e c i s i o n R e c a l l F−Measure MCC ROC Area PRC AreaC l a s s

0 ,995 0 ,080 0 ,972 0 ,995 0 ,984 0 ,936 0 ,997 0 ,999NORMAL

0 ,941 0 ,002 0 ,975 0 ,941 0 ,958 0 ,954 0 ,999 0 ,993LBBB

0 ,952 0 ,001 0 ,987 0 ,952 0 ,969 0 ,967 0 ,999 0 ,995RBBB

0 ,558 0 ,000 0 ,911 0 ,558 0 ,692 0 ,713 0 ,978 0 ,791ABERR

0 ,933 0 ,003 0 ,961 0 ,933 0 ,947 0 ,943 0 ,998 0 ,986PVC

0 ,576 0 ,000 0 ,920 0 ,576 0 ,708 0 ,726 0 ,983 0 ,792FUSION

0 ,316 0 ,000 1 ,000 0 ,316 0 ,480 0 ,562 0 ,952 0 ,707NPC

0 ,813 0 ,001 0 ,965 0 ,813 0 ,882 0 ,883 0 ,996 0 ,951APC

0 ,904 0 ,000 0 ,989 0 ,904 0 ,945 0 ,946 0 ,985 0 ,936VESC

0 ,173 0 ,000 0 ,879 0 ,173 0 ,289 0 ,389 0 ,991 0 ,610NESC

0 ,000 0 ,000 ? 0 ,000 ? ? 0 ,649 0 ,031AESC

0 ,978 0 ,000 0 ,998 0 ,978 0 ,988 0 ,988 0 ,999 0 ,997FLWAV

0 ,910 0 ,000 0 ,994 0 ,910 0 ,950 0 ,951 0 ,995 0 ,981NAPCWeighted Avg . 0 ,973 0 ,059 ? 0 ,973 ? ? 0 ,997 0 ,993

=== Confus ion Mat r i x ===

a b c d e f g h i j k l m <−− c l a s s i f i e d as71776 166 44 2 98 10 0 39 0 4 0 0 0 | a = NORMAL

458 7498 6 0 4 0 0 0 1 0 0 0 0 | b = LBBB338 1 6718 0 0 0 0 1 0 0 0 0 0 | c = RBBB

39 0 0 82 17 0 0 9 0 0 0 0 0 | d = ABERR343 20 0 3 5728 29 0 16 0 0 0 1 1 | e = PVC249 3 0 0 74 446 0 2 0 0 0 0 0 | f = FUSION

34 0 17 0 1 0 24 0 0 0 0 0 0 | g = NPC405 0 18 1 26 0 0 1958 0 0 0 0 0 | h = APC

7 3 0 0 0 0 0 0 94 0 0 0 0 | i = VESC132 0 4 0 0 0 0 3 0 29 0 0 0 | j = NESC

13 0 0 0 0 0 0 0 0 0 0 0 0 | k = AESC4 0 0 1 5 0 0 0 0 0 0 450 0 | l = FLWAV8 0 0 1 6 0 0 2 0 0 0 0 172 | m = NAPC

Apêndice L

Saída do Weka para Testes Iniciais deNormalização Zero Axis e Filtro Passa Alta

=== Run i n f o r m a t i o n ===

Scheme : weka . c l a s s i f i e r s . t r e e s . RandomForest −P 100 −I 100 −num−s l o t s 1 −K 0 −M 1 . 0 −V 0.001 −S 1R e l a t i o n : a r ry thmya−weka . f i l t e r s . u n s u p e r v i s e d . a t t r i b u t e . Remove−R3−5,25−26I n s t a n c e s : 97644A t t r i b u t e s : 22

d i s t a n c i a _ r r _ a n td i s t a n c i a _ r r _ p o s tmediasdrmsmediank a t zcomplex idadeb o x _ c o u n t i n gv a r i o g r a mmadogramrodogramv a r i a t i o ni n c r 1ha l lwoodpe r iodog ramw a v e l e td c t I Ie n t r o p i a _ e m p i r i c ae n t r o p i a _ s h a n n o n _ c h a oe n t r o p i a _ s h a n n o n _ m i l l e rc l a s s

T e s t mode : 10− f o l d c r o s s−v a l i d a t i o n

=== C l a s s i f i e r model ( f u l l t r a i n i n g s e t ) ===

RandomForest

Bagging wi th 100 i t e r a t i o n s and base l e a r n e r

weka . c l a s s i f i e r s . t r e e s . RandomTree −K 0 −M 1 . 0 −V 0.001 −S 1 −do−not−check−c a p a b i l i t i e s

Time t a k e n t o b u i l d model : 8 3 . 2 s e c o n d s

=== S t r a t i f i e d c r o s s−v a l i d a t i o n ====== Summary ===

139

140 Apêndices

C o r r e c t l y C l a s s i f i e d I n s t a n c e s 95543 97 .8483 %I n c o r r e c t l y C l a s s i f i e d I n s t a n c e s 2101 2 .1517 %Kappa s t a t i s t i c 0 .9498Mean a b s o l u t e e r r o r 0 .0084Root mean s q u a r e d e r r o r 0 .0532R e l a t i v e a b s o l u t e e r r o r 12 .4945 %Root r e l a t i v e s q u a r e d e r r o r 29 .0121 %T o t a l Number o f I n s t a n c e s 97644

=== D e t a i l e d Accuracy By C l a s s ===

TP Rate FP Rate P r e c i s i o n R e c a l l F−Measure MCC ROC Area PRC AreaC l a s s

0 ,996 0 ,061 0 ,979 0 ,996 0 ,987 0 ,951 0 ,998 0 ,999NORMAL

0 ,956 0 ,002 0 ,981 0 ,956 0 ,969 0 ,966 1 ,000 0 ,996LBBB

0 ,970 0 ,001 0 ,987 0 ,970 0 ,978 0 ,977 1 ,000 0 ,997RBBB

0 ,660 0 ,000 0 ,924 0 ,660 0 ,770 0 ,780 0 ,988 0 ,830ABERR

0 ,941 0 ,002 0 ,967 0 ,941 0 ,954 0 ,951 0 ,999 0 ,990PVC

0 ,636 0 ,001 0 ,906 0 ,636 0 ,747 0 ,757 0 ,981 0 ,820FUSION

0 ,329 0 ,000 1 ,000 0 ,329 0 ,495 0 ,573 0 ,979 0 ,738NPC

0 ,867 0 ,001 0 ,975 0 ,867 0 ,918 0 ,917 0 ,996 0 ,967APC

0 ,904 0 ,000 0 ,979 0 ,904 0 ,940 0 ,941 0 ,985 0 ,950VESC

0 ,262 0 ,000 0 ,846 0 ,262 0 ,400 0 ,470 0 ,983 0 ,634NESC

0 ,000 0 ,000 ? 0 ,000 ? ? 0 ,842 0 ,064AESC

0 ,991 0 ,000 0 ,996 0 ,991 0 ,993 0 ,993 1 ,000 1 ,000FLWAV

0 ,937 0 ,000 0 ,994 0 ,937 0 ,965 0 ,965 0 ,997 0 ,985NAPCWeighted Avg . 0 ,978 0 ,045 ? 0 ,978 ? ? 0 ,998 0 ,995

=== Confus ion Mat r i x ===

a b c d e f g h i j k l m <−− c l a s s i f i e d as71832 116 54 1 74 19 0 36 0 7 0 0 0 | a = NORMAL

334 7619 2 0 10 0 0 0 2 0 0 0 0 | b = LBBB213 1 6843 0 0 0 0 1 0 0 0 0 0 | c = RBBB

28 0 0 97 19 0 0 3 0 0 0 0 0 | d = ABERR292 23 0 4 5776 32 0 11 0 0 0 2 1 | e = PVC221 3 0 0 58 492 0 0 0 0 0 0 0 | f = FUSION

32 0 18 0 1 0 25 0 0 0 0 0 0 | g = NPC282 0 9 2 26 0 0 2088 0 1 0 0 0 | h = APC

7 3 0 0 0 0 0 0 94 0 0 0 0 | i = VESC117 0 5 0 0 0 0 2 0 44 0 0 0 | j = NESC

13 0 0 0 0 0 0 0 0 0 0 0 0 | k = AESC2 0 0 0 1 0 0 1 0 0 0 456 0 | l = FLWAV3 0 0 1 8 0 0 0 0 0 0 0 177 | m = NAPC

Apêndice M

Saída do Weka para Testes Iniciais deNormalização Sem Normalização e FiltroPassa Banda

=== Run i n f o r m a t i o n ===

Scheme : weka . c l a s s i f i e r s . t r e e s . RandomForest −P 100 −I 100 −num−s l o t s 1 −K 0 −M 1 . 0 −V 0.001 −S 1R e l a t i o n : a r ry thmya−weka . f i l t e r s . u n s u p e r v i s e d . a t t r i b u t e . Remove−R3−5,25−26I n s t a n c e s : 97643A t t r i b u t e s : 22

d i s t a n c i a _ r r _ a n td i s t a n c i a _ r r _ p o s tmediasdrmsmediank a t zcomplex idadeb o x _ c o u n t i n gv a r i o g r a mmadogramrodogramv a r i a t i o ni n c r 1ha l lwoodpe r iodog ramw a v e l e td c t I Ie n t r o p i a _ e m p i r i c ae n t r o p i a _ s h a n n o n _ c h a oe n t r o p i a _ s h a n n o n _ m i l l e rc l a s s

T e s t mode : 10− f o l d c r o s s−v a l i d a t i o n

=== C l a s s i f i e r model ( f u l l t r a i n i n g s e t ) ===

RandomForest

Bagging wi th 100 i t e r a t i o n s and base l e a r n e r

weka . c l a s s i f i e r s . t r e e s . RandomTree −K 0 −M 1 . 0 −V 0.001 −S 1 −do−not−check−c a p a b i l i t i e s

Time t a k e n t o b u i l d model : 8 1 . 7 s e c o n d s

141

142 Apêndices

=== S t r a t i f i e d c r o s s−v a l i d a t i o n ====== Summary ===

C o r r e c t l y C l a s s i f i e d I n s t a n c e s 95618 97 .9261 %I n c o r r e c t l y C l a s s i f i e d I n s t a n c e s 2025 2 .0739 %Kappa s t a t i s t i c 0 .9516Mean a b s o l u t e e r r o r 0 .0079Root mean s q u a r e d e r r o r 0 .0519R e l a t i v e a b s o l u t e e r r o r 11 .723 %Root r e l a t i v e s q u a r e d e r r o r 28 .299 %T o t a l Number o f I n s t a n c e s 97643

=== D e t a i l e d Accuracy By C l a s s ===

TP Rate FP Rate P r e c i s i o n R e c a l l F−Measure MCC ROC Area PRC AreaC l a s s

0 ,996 0 ,059 0 ,979 0 ,996 0 ,988 0 ,952 0 ,998 0 ,999NORMAL

0 ,961 0 ,002 0 ,983 0 ,961 0 ,972 0 ,969 1 ,000 0 ,997LBBB

0 ,979 0 ,001 0 ,991 0 ,979 0 ,985 0 ,984 1 ,000 0 ,998RBBB

0 ,639 0 ,000 0 ,931 0 ,639 0 ,758 0 ,771 0 ,985 0 ,821ABERR

0 ,942 0 ,002 0 ,968 0 ,942 0 ,955 0 ,952 0 ,999 0 ,988PVC

0 ,640 0 ,001 0 ,908 0 ,640 0 ,751 0 ,761 0 ,984 0 ,822FUSION

0 ,289 0 ,000 0 ,957 0 ,289 0 ,444 0 ,526 0 ,965 0 ,630NPC

0 ,860 0 ,001 0 ,975 0 ,860 0 ,914 0 ,914 0 ,996 0 ,967APC

0 ,942 0 ,000 0 ,970 0 ,942 0 ,956 0 ,956 0 ,985 0 ,960VESC

0 ,137 0 ,000 0 ,767 0 ,137 0 ,232 0 ,324 0 ,980 0 ,570NESC

0 ,000 0 ,000 ? 0 ,000 ? ? 0 ,841 0 ,012AESC

0 ,978 0 ,000 0 ,998 0 ,978 0 ,988 0 ,988 1 ,000 1 ,000FLWAV

0 ,894 0 ,000 0 ,994 0 ,894 0 ,942 0 ,943 0 ,997 0 ,985NAPCWeighted Avg . 0 ,979 0 ,044 ? 0 ,979 ? ? 0 ,998 0 ,994

=== Confus ion Mat r i x ===

a b c d e f g h i j k l m <−− c l a s s i f i e d as71849 110 29 1 87 23 0 33 0 6 0 0 0 | a = NORMAL

301 7656 2 0 5 0 0 0 3 0 0 0 0 | b = LBBB144 2 6910 0 0 0 1 1 0 0 0 0 0 | c = RBBB

37 0 0 94 13 0 0 2 0 0 0 1 0 | d = ABERR302 18 0 2 5782 27 0 9 0 0 0 0 1 | e = PVC221 5 0 0 52 495 0 1 0 0 0 0 0 | f = FUSION

36 0 17 0 1 0 22 0 0 0 0 0 0 | g = NPC301 1 10 1 24 0 0 2070 0 1 0 0 0 | h = APC

6 0 0 0 0 0 0 0 98 0 0 0 0 | i = VESC138 0 4 0 0 0 0 3 0 23 0 0 0 | j = NESC

13 0 0 0 0 0 0 0 0 0 0 0 0 | k = AESC5 0 0 0 3 0 0 2 0 0 0 450 0 | l = FLWAV9 0 0 3 7 0 0 1 0 0 0 0 169 | m = NAPC

Apêndice N

Saída do Weka para Testes Iniciais deNormalização Origin e Filtro Passa Banda

=== Run i n f o r m a t i o n ===

Scheme : weka . c l a s s i f i e r s . t r e e s . RandomForest −P 100 −I 100 −num−s l o t s 1 −K 0 −M 1 . 0 −V 0.001 −S 1R e l a t i o n : a r ry thmya−weka . f i l t e r s . u n s u p e r v i s e d . a t t r i b u t e . Remove−R25−26−weka . f i l t e r s . u n s u p e r v i s e d . a t t r i b u t e . Remove−R3−weka . f i l t e r s . u n s u p e r v i s e d . a t t r i b u t e . Remove−R3−4I n s t a n c e s : 97643A t t r i b u t e s : 22

d i s t a n c i a _ r r _ a n td i s t a n c i a _ r r _ p o s tmediasdrmsmediank a t zcomplex idadeb o x _ c o u n t i n gv a r i o g r a mmadogramrodogramv a r i a t i o ni n c r 1ha l lwoodpe r iodog ramw a v e l e td c t I Ie n t r o p i a _ e m p i r i c ae n t r o p i a _ s h a n n o n _ c h a oe n t r o p i a _ s h a n n o n _ m i l l e rc l a s s

T e s t mode : 10− f o l d c r o s s−v a l i d a t i o n

=== C l a s s i f i e r model ( f u l l t r a i n i n g s e t ) ===

RandomForest

Bagging wi th 100 i t e r a t i o n s and base l e a r n e r

weka . c l a s s i f i e r s . t r e e s . RandomTree −K 0 −M 1 . 0 −V 0.001 −S 1 −do−not−check−c a p a b i l i t i e s

Time t a k e n t o b u i l d model : 94 .71 s e c o n d s

=== S t r a t i f i e d c r o s s−v a l i d a t i o n ====== Summary ===

143

144 Apêndices

C o r r e c t l y C l a s s i f i e d I n s t a n c e s 95664 97 .9732 %I n c o r r e c t l y C l a s s i f i e d I n s t a n c e s 1979 2 .0268 %Kappa s t a t i s t i c 0 .9528Mean a b s o l u t e e r r o r 0 .0078Root mean s q u a r e d e r r o r 0 .0515R e l a t i v e a b s o l u t e e r r o r 11 .5274 %Root r e l a t i v e s q u a r e d e r r o r 28 .0942 %T o t a l Number o f I n s t a n c e s 97643

=== D e t a i l e d Accuracy By C l a s s ===

TP Rate FP Rate P r e c i s i o n R e c a l l F−Measure MCC ROC Area PRC AreaC l a s s

0 ,996 0 ,057 0 ,980 0 ,996 0 ,988 0 ,953 0 ,998 0 ,999NORMAL

0 ,964 0 ,001 0 ,983 0 ,964 0 ,974 0 ,971 1 ,000 0 ,997LBBB

0 ,979 0 ,001 0 ,991 0 ,979 0 ,985 0 ,984 1 ,000 0 ,998RBBB

0 ,639 0 ,000 0 ,931 0 ,639 0 ,758 0 ,771 0 ,982 0 ,828ABERR

0 ,941 0 ,002 0 ,967 0 ,941 0 ,954 0 ,951 0 ,999 0 ,989PVC

0 ,647 0 ,001 0 ,898 0 ,647 0 ,752 0 ,761 0 ,986 0 ,823FUSION

0 ,276 0 ,000 1 ,000 0 ,276 0 ,433 0 ,526 0 ,972 0 ,639NPC

0 ,865 0 ,001 0 ,975 0 ,865 0 ,917 0 ,916 0 ,996 0 ,967APC

0 ,942 0 ,000 0 ,980 0 ,942 0 ,961 0 ,961 0 ,985 0 ,962VESC

0 ,155 0 ,000 0 ,839 0 ,155 0 ,261 0 ,360 0 ,974 0 ,570NESC

0 ,000 0 ,000 ? 0 ,000 ? ? 0 ,765 0 ,011AESC

0 ,980 0 ,000 0 ,996 0 ,980 0 ,988 0 ,988 1 ,000 1 ,000FLWAV

0 ,905 0 ,000 0 ,994 0 ,905 0 ,947 0 ,948 0 ,997 0 ,987NAPCWeighted Avg . 0 ,980 0 ,043 ? 0 ,980 ? ? 0 ,998 0 ,994

=== Confus ion Mat r i x ===

a b c d e f g h i j k l m <−− c l a s s i f i e d as71854 106 27 1 84 27 0 34 0 5 0 0 0 | a = NORMAL

273 7682 2 0 8 0 0 0 2 0 0 0 0 | b = LBBB147 2 6908 0 0 0 0 1 0 0 0 0 0 | c = RBBB

36 0 0 94 12 0 0 4 0 0 0 1 0 | d = ABERR307 15 0 3 5776 30 0 8 0 0 0 1 1 | e = PVC211 6 0 0 56 501 0 0 0 0 0 0 0 | f = FUSION

36 0 18 0 1 0 21 0 0 0 0 0 0 | g = NPC290 1 10 1 24 0 0 2082 0 0 0 0 0 | h = APC

6 0 0 0 0 0 0 0 98 0 0 0 0 | i = VESC134 0 6 0 0 0 0 2 0 26 0 0 0 | j = NESC

13 0 0 0 0 0 0 0 0 0 0 0 0 | k = AESC6 0 0 0 2 0 0 1 0 0 0 451 0 | l = FLWAV5 0 0 2 8 0 0 3 0 0 0 0 171 | m = NAPC

Apêndice O

Saída do Weka para Testes Iniciais deNormalização Offset e Filtro Passa Banda

=== Run i n f o r m a t i o n ===

Scheme : weka . c l a s s i f i e r s . t r e e s . RandomForest −P 100 −I 100 −num−s l o t s 1 −K 0 −M 1 . 0 −V 0.001 −S 1R e l a t i o n : a r ry thmya−weka . f i l t e r s . u n s u p e r v i s e d . a t t r i b u t e . Remove−R3−5,25−26I n s t a n c e s : 97643A t t r i b u t e s : 22

d i s t a n c i a _ r r _ a n td i s t a n c i a _ r r _ p o s tmediasdrmsmediank a t zcomplex idadeb o x _ c o u n t i n gv a r i o g r a mmadogramrodogramv a r i a t i o ni n c r 1ha l lwoodpe r iodog ramw a v e l e td c t I Ie n t r o p i a _ e m p i r i c ae n t r o p i a _ s h a n n o n _ c h a oe n t r o p i a _ s h a n n o n _ m i l l e rc l a s s

T e s t mode : 10− f o l d c r o s s−v a l i d a t i o n

=== C l a s s i f i e r model ( f u l l t r a i n i n g s e t ) ===

RandomForest

Bagging wi th 100 i t e r a t i o n s and base l e a r n e r

weka . c l a s s i f i e r s . t r e e s . RandomTree −K 0 −M 1 . 0 −V 0.001 −S 1 −do−not−check−c a p a b i l i t i e s

Time t a k e n t o b u i l d model : 75 .41 s e c o n d s

=== S t r a t i f i e d c r o s s−v a l i d a t i o n ====== Summary ===

145

146 Apêndices

C o r r e c t l y C l a s s i f i e d I n s t a n c e s 95310 97 .6107 %I n c o r r e c t l y C l a s s i f i e d I n s t a n c e s 2333 2 .3893 %Kappa s t a t i s t i c 0 .944Mean a b s o l u t e e r r o r 0 .0095Root mean s q u a r e d e r r o r 0 .0563R e l a t i v e a b s o l u t e e r r o r 14 .1798 %Root r e l a t i v e s q u a r e d e r r o r 30 .6875 %T o t a l Number o f I n s t a n c e s 97643

=== D e t a i l e d Accuracy By C l a s s ===

TP Rate FP Rate P r e c i s i o n R e c a l l F−Measure MCC ROC Area PRC AreaC l a s s

0 ,996 0 ,070 0 ,976 0 ,996 0 ,986 0 ,945 0 ,997 0 ,999NORMAL

0 ,952 0 ,001 0 ,983 0 ,952 0 ,967 0 ,965 0 ,999 0 ,996LBBB

0 ,973 0 ,001 0 ,991 0 ,973 0 ,982 0 ,981 1 ,000 0 ,997RBBB

0 ,531 0 ,000 0 ,907 0 ,531 0 ,670 0 ,693 0 ,988 0 ,756ABERR

0 ,935 0 ,003 0 ,958 0 ,935 0 ,947 0 ,943 0 ,998 0 ,986PVC

0 ,593 0 ,000 0 ,922 0 ,593 0 ,722 0 ,738 0 ,983 0 ,801FUSION

0 ,263 0 ,000 0 ,952 0 ,263 0 ,412 0 ,500 0 ,964 0 ,594NPC

0 ,823 0 ,001 0 ,973 0 ,823 0 ,891 0 ,892 0 ,994 0 ,953APC

0 ,942 0 ,000 0 ,990 0 ,942 0 ,966 0 ,966 0 ,985 0 ,964VESC

0 ,054 0 ,000 0 ,643 0 ,054 0 ,099 0 ,185 0 ,981 0 ,524NESC

0 ,000 0 ,000 ? 0 ,000 ? ? 0 ,688 0 ,029AESC

0 ,959 0 ,000 0 ,987 0 ,959 0 ,972 0 ,972 1 ,000 0 ,997FLWAV

0 ,899 0 ,000 0 ,994 0 ,899 0 ,944 0 ,946 0 ,997 0 ,977NAPCWeighted Avg . 0 ,976 0 ,052 ? 0 ,976 ? ? 0 ,997 0 ,993

=== Confus ion Mat r i x ===

a b c d e f g h i j k l m <−− c l a s s i f i e d as71856 91 25 3 115 11 0 32 0 5 0 0 0 | a = NORMAL

368 7585 1 0 7 0 0 5 1 0 0 0 0 | b = LBBB188 0 6869 0 0 0 0 1 0 0 0 0 0 | c = RBBB

45 0 0 78 18 0 0 4 0 0 0 2 0 | d = ABERR328 26 0 2 5744 28 0 8 0 0 0 4 1 | e = PVC247 8 0 0 60 459 0 0 0 0 0 0 0 | f = FUSION

37 0 19 0 0 0 20 0 0 0 0 0 0 | g = NPC375 3 12 0 36 0 1 1981 0 0 0 0 0 | h = APC

6 0 0 0 0 0 0 0 98 0 0 0 0 | i = VESC150 0 5 0 0 0 0 4 0 9 0 0 0 | j = NESC

13 0 0 0 0 0 0 0 0 0 0 0 0 | k = AESC8 0 0 1 8 0 0 2 0 0 0 441 0 | l = FLWAV9 0 0 2 8 0 0 0 0 0 0 0 170 | m = NAPC

Apêndice P

Saída do Weka para Testes Iniciais deNormalização Zero Axis e Filtro Passa Banda

=== Run i n f o r m a t i o n ===

Scheme : weka . c l a s s i f i e r s . t r e e s . RandomForest −P 100 −I 100 −num−s l o t s 1 −K 0 −M 1 . 0 −V 0.001 −S 1R e l a t i o n : a r ry thmya−weka . f i l t e r s . u n s u p e r v i s e d . a t t r i b u t e . Remove−R3−5,25−26I n s t a n c e s : 97643A t t r i b u t e s : 22

d i s t a n c i a _ r r _ a n td i s t a n c i a _ r r _ p o s tmediasdrmsmediank a t zcomplex idadeb o x _ c o u n t i n gv a r i o g r a mmadogramrodogramv a r i a t i o ni n c r 1ha l lwoodpe r iodog ramw a v e l e td c t I Ie n t r o p i a _ e m p i r i c ae n t r o p i a _ s h a n n o n _ c h a oe n t r o p i a _ s h a n n o n _ m i l l e rc l a s s

T e s t mode : 10− f o l d c r o s s−v a l i d a t i o n

=== C l a s s i f i e r model ( f u l l t r a i n i n g s e t ) ===

RandomForest

Bagging wi th 100 i t e r a t i o n s and base l e a r n e r

weka . c l a s s i f i e r s . t r e e s . RandomTree −K 0 −M 1 . 0 −V 0.001 −S 1 −do−not−check−c a p a b i l i t i e s

Time t a k e n t o b u i l d model : 92 .34 s e c o n d s

=== S t r a t i f i e d c r o s s−v a l i d a t i o n ====== Summary ===

147

148 Apêndices

C o r r e c t l y C l a s s i f i e d I n s t a n c e s 95697 98 .007 %I n c o r r e c t l y C l a s s i f i e d I n s t a n c e s 1946 1 .993 %Kappa s t a t i s t i c 0 .9536Mean a b s o l u t e e r r o r 0 .0078Root mean s q u a r e d e r r o r 0 .0513R e l a t i v e a b s o l u t e e r r o r 11 .5384 %Root r e l a t i v e s q u a r e d e r r o r 27 .9324 %T o t a l Number o f I n s t a n c e s 97643

=== D e t a i l e d Accuracy By C l a s s ===

TP Rate FP Rate P r e c i s i o n R e c a l l F−Measure MCC ROC Area PRC AreaC l a s s

0 ,996 0 ,056 0 ,980 0 ,996 0 ,988 0 ,954 0 ,998 0 ,999NORMAL

0 ,962 0 ,001 0 ,984 0 ,962 0 ,973 0 ,970 1 ,000 0 ,997LBBB

0 ,980 0 ,001 0 ,992 0 ,980 0 ,986 0 ,985 1 ,000 0 ,998RBBB

0 ,660 0 ,000 0 ,933 0 ,660 0 ,773 0 ,784 0 ,978 0 ,831ABERR

0 ,939 0 ,002 0 ,969 0 ,939 0 ,954 0 ,951 0 ,999 0 ,989PVC

0 ,660 0 ,001 0 ,900 0 ,660 0 ,762 0 ,769 0 ,983 0 ,822FUSION

0 ,276 0 ,000 1 ,000 0 ,276 0 ,433 0 ,526 0 ,972 0 ,650NPC

0 ,866 0 ,001 0 ,974 0 ,866 0 ,917 0 ,916 0 ,995 0 ,967APC

0 ,942 0 ,000 0 ,980 0 ,942 0 ,961 0 ,961 0 ,985 0 ,963VESC

0 ,339 0 ,000 0 ,814 0 ,339 0 ,479 0 ,525 0 ,971 0 ,634NESC

0 ,000 0 ,000 ? 0 ,000 ? ? 0 ,687 0 ,009AESC

0 ,987 0 ,000 0 ,996 0 ,987 0 ,991 0 ,991 1 ,000 1 ,000FLWAV

0 ,915 0 ,000 0 ,994 0 ,915 0 ,953 0 ,954 0 ,997 0 ,985NAPCWeighted Avg . 0 ,980 0 ,042 ? 0 ,980 ? ? 0 ,998 0 ,995

=== Confus ion Mat r i x ===

a b c d e f g h i j k l m <−− c l a s s i f i e d as71859 98 23 1 85 27 0 32 0 13 0 0 0 | a = NORMAL

293 7663 2 0 7 0 0 0 2 0 0 0 0 | b = LBBB141 2 6914 0 0 0 0 1 0 0 0 0 0 | c = RBBB

34 0 0 97 13 0 0 3 0 0 0 0 0 | d = ABERR309 20 0 1 5765 30 0 13 0 0 0 2 1 | e = PVC208 8 0 0 47 511 0 0 0 0 0 0 0 | f = FUSION

37 0 17 0 1 0 21 0 0 0 0 0 0 | g = NPC285 0 11 1 26 0 0 2085 0 0 0 0 0 | h = APC

6 0 0 0 0 0 0 0 98 0 0 0 0 | i = VESC102 0 5 0 0 0 0 4 0 57 0 0 0 | j = NESC

13 0 0 0 0 0 0 0 0 0 0 0 0 | k = AESC2 0 0 0 1 0 0 3 0 0 0 454 0 | l = FLWAV7 0 0 4 5 0 0 0 0 0 0 0 173 | m = NAPC