universidade federal da bahia escola politÉcnica · departamento de engenharia elÉtrica programa...

106
Salvador 2017 UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA DEPARTAMENTO DE ENGENHARIA ELÉTRICA PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA SISTEMAS INTELIGENTES PARA DETECÇÃO DE NOVIDADES EM INSPEÇÕES NÃO-DESTRUTIVAS POR ULTRASSOM MOISÉS ARAUJO OLIVEIRA

Upload: vunhu

Post on 12-Feb-2019

217 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

Salvador

2017

UNIVERSIDADE FEDERAL DA BAHIA

ESCOLA POLITÉCNICA

DEPARTAMENTO DE ENGENHARIA ELÉTRICA PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA

SISTEMAS INTELIGENTES PARA DETECÇÃO DE NOVIDADES EM

INSPEÇÕES NÃO-DESTRUTIVAS POR ULTRASSOM

MOISÉS ARAUJO OLIVEIRA

Page 2: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

SISTEMAS INTELIGENTES PARA DETECCAO DE NOVIDADES EMINSPECOES NAO-DESTRUTIVAS POR ULTRASSOM

Moises Araujo Oliveira

Dissertacao de Mestrado apresentada aoPrograma de Pos-graduacao em EngenhariaEletrica da Universidade Federal da Bahia, comoparte dos requisitos necessarios a obtencao dotıtulo de Mestre em Engenharia Eletrica.

Orientadores: Eduardo F. de Simas FilhoIvan C. da Silva

SalvadorDezembro de 2017

UNIVERSIDADE FEDERAL DA BAHIA

ESCOLA POLITÉCNICA

DEPARTAMENTO DE ENGENHARIA ELÉTRICA PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA

Page 3: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo
Page 4: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo
Page 5: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

Ao Senhor, pois sem Ele nadaseria possıvel

iv

Page 6: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

Agradecimentos

Agradeco aos meus pais Elizabete e Araujo pelo apoio por toda a vida.Aos meus orientadores Eduardo Simas e Ivan Silva com o incentivo e suporte

para o desenvolvimento dos trabalhos em uma nova area da pesquisa cientıfica.Ao LABIND/GPEND, na figura da Professora Claudia Farias e Ygor Tadeu, que

desde 2009 compartilham o aprendizado do metodo cientıfico e a amizade fora dolaboratorio.

Aos colegas do LSD da UFBA, com a convivencia e troca de conhecimentosdurante o andamento do trabalho.

Aos amigos que torceram, acompanharam, deram forca para a realizacao duranteesse perıodo.

Agradeco ao Conselho Nacional de Desenvolvimento Cientıfico e Tecnologico(CNPq) e a Coordenacao de Aperfeicoamento de Pessoal de Nıvel Superior (CAPES),pela concessao da bolsa de dedicacao exclusiva e apoio financeiro.

v

Page 7: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

Resumo da Dissertacao apresentada ao PPGEE/UFBA como parte dos requisitosnecessarios para a obtencao do grau de Mestre em Engenharia Eletrica

SISTEMAS INTELIGENTES PARA DETECCAO DE NOVIDADES EMINSPECOES NAO-DESTRUTIVAS POR ULTRASSOM

Moises Araujo Oliveira

Dezembro/2017

Orientadores: Eduardo F. de Simas FilhoIvan C. da Silva

Programa: Engenharia Eletrica

A deteccao de novidades e uma tarefa de aprendizado de maquina que verifica seum exemplo ou um conjunto de exemplos diferem consideravelmente dos exemplaresobtidos de antemao. Essa caracterıstica e tida como uma habilidade vantajosa parasistemas de aprendizado, sobretudo quando amostras sao adquiridas progressivamente.Os procedimentos convencionais para identificacao de danos atraves dos ensaios naodestrutivos normalmente carecem de informacoes a priori suficientes acerca daestrutura sob investigacao, a fim de poder formular um modelo matematico. Comoconsequencia, para estruturas complexas, a necessidade de formular intuitivamenteum modelo seguro pode dificultar a aplicacao dessas tecnicas, tornando-as demoradase onerosas. Neste trabalho sera avaliada a aplicacao da deteccao de novidades comoalternativa as tecnicas de classificacao multiclasse atualmente empregadas com sucessopara o problema. Pretende-se comparar a eficiencia de 4 abordagens: maquina devetor de suporte, baseadas em algoritmos de medicao de distancia, agrupamentos k-medias e mapas auto-organizaveis para identificacao de anomalias em sinais coletadosatraves de ensaios nao destrutivos por ultrassom. Os metodos utilizaram dadosprovenientes de tres inspecoes distintas: usando a tecnica de Tempo de Voo DifratadoTOFD em chapa de aco soldada, a inspecao de pas de aerogeradores por meio datecnica Bubbler e a inspecao por imersao de ligas de aco HP. Os dados coletadosserao submetidos a etapas de pre-processamento que incluem a transformada waveletpara filtragem de ruıdo e a transformada discreta de Fourier para estudo no domınioda frequencia. A analise de componentes principais foi empregada para a reducao dadimensionalidade, selecionando as caracterısticas intrınsecas as diferentes condicoesde cada material.

vi

Page 8: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

Abstract of Dissertation presented to PPGEE/UFBA as a partial fulfillment of therequirements for the degree of Master of Engenharia Eletrica

INTELLIGENT SYSTEMS FOR NOVELTIES DETECTION INNON-DESTRUCTIVE ULTRASONIC INSPECTIONS

Moises Araujo Oliveira

December/2017

Advisors: Eduardo F. de Simas FilhoIvan C. da Silva

Department: Electrical Engineering

Novelty detection is a machine learning task that checks whether an exampleor a set of examples differ considerably from the samples obtained in advance.This feature is seen as an advantageous skill for learning systems, especially whensamples are progressively acquired. Conventional procedures for identifying damagethrough nondestructive testing usually lack sufficient a priori information about thestructure under investigation in order to formulate a mathematical model. As aconsequence, for complex structures, the need to intuitively formulate a secure modelmay hinder the application of these techniques, making them time-consuming andcostly. This work will evaluate the application of a novelty detection methodologyas an alternative to the multiclass classification techniques currently employedsuccessfully for the problem. It is intended to compare the efficiency of 4 differenttechniques for novelties detection using support vector machine-based approaches,based on distance-measuring algorithms, k-means clustering and self-organized mapsto identify anomalies in collected signals through non-destructive tests by ultrasound.The methods used data from three different inspections: using Time of FlightDiffraction (TOFD) technique in welded steel plate, the inspection of wind turbineblades by the Bubbler technique and the immersion inspection of HP alloys steel.The collected data will be subjected to pre-processing steps which include wavelettransform for noise filtering and the discrete Fourier transform for frequency domainstudy. Principal component analysis was used to reduce dimensionality, selecting thecharacteristics intrinsic to different conditions of each material.

vii

Page 9: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

Sumario

Lista de Figuras x

Lista de Tabelas xiii

Lista de Sımbolos xiv

Lista de Abreviaturas xv

1 Introducao 11.1 Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21.2 Organizacao do Documento . . . . . . . . . . . . . . . . . . . . . . . 2

2 Visao Geral sobre os Ensaios nao Destrutivos por Ultrassom 42.1 Tecnicas de Inspecao por Ultrassom . . . . . . . . . . . . . . . . . . . 9

3 Tecnicas de Processamento de Sinais e Classificacao Utilizadas 133.1 Normalizacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133.2 Transformada Discreta de Fourier . . . . . . . . . . . . . . . . . . . . 143.3 Transformada Discreta wavelet . . . . . . . . . . . . . . . . . . . . . . 153.4 Analise de Componentes Principais . . . . . . . . . . . . . . . . . . . 173.5 Metodos de Classificacao Multiclasse . . . . . . . . . . . . . . . . . . 18

3.5.1 Redes Neurais Artificiais . . . . . . . . . . . . . . . . . . . . . 193.5.2 Maquinas de Vetor de Suporte . . . . . . . . . . . . . . . . . . 21

3.6 Metodos de Deteccao de Novidades . . . . . . . . . . . . . . . . . . . 233.6.1 Deteccao de novidades usando abordagem baseada em distancia 273.6.2 Deteccao de novidades usando abordagem de construcao de

domınio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 303.6.3 Deteccao de novidades usando abordagem baseada em mapas

auto-organizaveis . . . . . . . . . . . . . . . . . . . . . . . . . 31

4 Metodologia dos ensaios 354.1 Experimento 1 - Solda . . . . . . . . . . . . . . . . . . . . . . . . . . 354.2 Experimento 2 - Pas de Aerogeradores . . . . . . . . . . . . . . . . . 37

viii

Page 10: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

4.3 Experimento 3 - Tubos de Fornos de Pirolise . . . . . . . . . . . . . . 404.4 Cadeia de Processamento de Sinais Proposta . . . . . . . . . . . . . . 414.5 Representacao dos resultados . . . . . . . . . . . . . . . . . . . . . . 44

5 Resultados e Discussoes 485.1 Solda - Experimento 1 . . . . . . . . . . . . . . . . . . . . . . . . . . 48

5.1.1 Processamento de Sinais . . . . . . . . . . . . . . . . . . . . . 485.1.2 Detectores de Novidade . . . . . . . . . . . . . . . . . . . . . 51

5.2 Pas de Aerogeradores - Experimento 2 . . . . . . . . . . . . . . . . . 605.2.1 Processamento de Sinais . . . . . . . . . . . . . . . . . . . . . 605.2.2 Detectores de Novidade . . . . . . . . . . . . . . . . . . . . . 62

5.3 Tubos de Fornos de Pirolise - Experimento 3 . . . . . . . . . . . . . . 695.3.1 Processamento de Sinais . . . . . . . . . . . . . . . . . . . . . 695.3.2 Detectores de Novidade . . . . . . . . . . . . . . . . . . . . . 71

5.4 Consideracoes sobre os resultados obtidos . . . . . . . . . . . . . . . . 76

6 Conclusoes 78

Referencias Bibliograficas 80

A Trabalhos Publicados 87A.1 Artigos apresentados em Congressos . . . . . . . . . . . . . . . . . . . 87

ix

Page 11: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

Lista de Figuras

2.1 Ensaio por Lıquidos Penetrantes. . . . . . . . . . . . . . . . . . . . . 42.2 Ensaio por Partıculas Magneticas. . . . . . . . . . . . . . . . . . . . . 52.3 Ensaio por Raios-X. . . . . . . . . . . . . . . . . . . . . . . . . . . . 62.4 Configuracao dos transdutores normal e angular. . . . . . . . . . . . . 72.5 Comportamento do Feixe Ultrassonico. . . . . . . . . . . . . . . . . . 82.6 Diagrama ilustrativo da propagacao das ondas de ultrassom. . . . . . 82.7 Ensaio por ultrassom - Tecnica Pulso-Eco. . . . . . . . . . . . . . . . 92.8 Transdutor especial Bubbler. . . . . . . . . . . . . . . . . . . . . . . . 102.9 Ensaio por ultrassom - Tecnica TOFD. . . . . . . . . . . . . . . . . . 11

3.1 Decomposicao wavelet com Subamostragem. . . . . . . . . . . . . . . 163.2 Maquina de Vetor de Suporte como kernel Radial Basis Function. . . 223.3 Comportamento de um algoritmo para deteccao de novidades. . . . . 233.4 Construcao de modelos para deteccao de novidades usando assinaturas

de ultrassom. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 263.5 Comparacao da distancia entre a condicao normal e a novidade. . . . 273.6 Aplicacao do clustering k-means. . . . . . . . . . . . . . . . . . . . . . 283.7 Construcao da hiperesfera para o SVDD. . . . . . . . . . . . . . . . . 303.8 Organizacao do mapeamento nao-linear de Kohonen. . . . . . . . . . 32

4.1 Tipos de defeitos usualmente observados em soldas. . . . . . . . . . . 364.2 Corpo de prova soldado com a presenca de defeitos internos inseridos

de modo controlado durante a soldagem. . . . . . . . . . . . . . . . . 364.3 Esquema da realizacao do experimento 01 e coleta das amostras. . . . 374.4 Madeira de balsa utilizada nas pas de aerogeradores. . . . . . . . . . 384.5 Localizacao da regiao dos defeitos nos corpos de prova do experimento 2 394.6 Esquema da realizacao do experimento 02 e coleta das amostras. . . . 394.7 Amostras de tubos utilizados no experimento. . . . . . . . . . . . . . 404.8 Esquema da realizacao do experimento 03 e coleta das amostras. . . . 414.9 Etapas do sistema de tomada de decisao. . . . . . . . . . . . . . . . . 434.10 Exemplos de possıveis comportamentos da curva ROC e AUC. . . . . 45

x

Page 12: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

4.11 Metodo para descricao estatıstica de dados boxplot. . . . . . . . . . . 46

5.1 Sinal tıpico no domınio do tempo apos a DWT Famılia Daubechie de3o nıvel para as diferentes classes de interesse existentes na Solda. . . 49

5.2 Espectros de frequencia tıpicos das classes observadas na solda. . . . . 505.3 Mapas de treinamento do metodo ND DIST para base de dados Solda. 525.4 Mapas de treinamento do metodo ND k-means para base de dados

Solda. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 535.5 Mapas de treinamento obtidos com o metodo de ND SOM para base

de dados Solda. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 545.6 Mapas de treinamento obtidos com o metodo de ND SVDD para base

de dados Solda. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 555.7 Boxplot do produto medio da acuracia dos detectores de novidade

para base de dados Solda. . . . . . . . . . . . . . . . . . . . . . . . . 575.8 ROC construıda utilizando base de dados Solda. . . . . . . . . . . . . 585.9 AUC percentual variando com o tamanho dos componentes principais

para o experimento 1. . . . . . . . . . . . . . . . . . . . . . . . . . . . 595.10 Sinal tıpico no domınio do tempo apos a DWT Famılia Daubechie 3o

nıvel para as classes existentes nas pas de aerogeradores. . . . . . . . 605.11 Espectros de frequencia tıpicos das classes observadas nas pas de

aerogeradores. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 615.12 Mapas de treinamento obtidos com o metodo de ND DIST para base

de dados pas de aerogeradores. . . . . . . . . . . . . . . . . . . . . . . 625.13 Mapas de treinamento obtidos com o metodo de ND k-means para

base de dados pas de aerogeradores. . . . . . . . . . . . . . . . . . . . 635.14 Mapas de treinamento obtidos com o metodo de ND SOM para base

de dados pas de aerogeradores. . . . . . . . . . . . . . . . . . . . . . . 645.15 Mapas de treinamento obtidos com o metodo de ND SVDD para base

de dados pas de aerogeradores. . . . . . . . . . . . . . . . . . . . . . . 655.16 Boxplot do produto medio da acuracia dos detectores de novidade

para base de dados pas de aerogeradores. . . . . . . . . . . . . . . . . 665.17 ROC construıda utilizando base de dados pas de aerogeradores. . . . 675.18 AUC percentual variando com o tamanho dos componentes principais

para o experimento 2. . . . . . . . . . . . . . . . . . . . . . . . . . . . 685.19 Sinal tıpico no domınio do tempo apos a DWT Famılia Daubechie 3o

nıvel para as classes existentes nos tubos HP. . . . . . . . . . . . . . . 695.20 Espectros de frequencia tıpicos das classes observadas nos tubos HP. . 705.21 Mapas de treinamento obtidos com o metodo de ND DIST para base

de dados tubos HP. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71

xi

Page 13: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

5.22 Mapas de treinamento obtidos com o metodo de ND k-means parabase de dados tubos HP. . . . . . . . . . . . . . . . . . . . . . . . . . 72

5.23 Mapas de treinamento obtidos com o metodo de ND SOM para basede dados tubos HP. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72

5.24 Mapas de treinamento obtidos com o metodo de ND SVDD para basede dados tubos HP. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73

5.25 Boxplot do produto medio da acuracia dos detectores de novidadepara base de dados tubos HP. . . . . . . . . . . . . . . . . . . . . . . 74

5.26 ROC construıda utilizando base de dados tubos HP. . . . . . . . . . . 755.27 AUC percentual variando com o tamanho dos componentes principais

para o experimento 3. . . . . . . . . . . . . . . . . . . . . . . . . . . . 76

xii

Page 14: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

Lista de Tabelas

4.1 Dimensoes dos corpos de prova extraıdo de aerogeradores . . . . . . . 384.2 Dimensoes dos corpos de prova dos tubos de aco inoxidavel da classe HP 404.3 Bases de dados usadas nos experimentos de deteccao de novidade . . 424.4 Matriz de confusao tıpica para o total de amostras avaliadas com a

deteccao de novidades . . . . . . . . . . . . . . . . . . . . . . . . . . 44

5.1 Eficiencia percentual dos metodos multiclasse para o experimento 1 . 565.2 Acuracia percentual dos metodos de deteccao de novidades para o

experimento 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 565.3 AUC percentual calculado para o experimento 1 . . . . . . . . . . . . 585.4 Eficiencia percentual dos metodos multiclasse para o experimento 2 . 665.5 Acuracia percentual dos metodos de deteccao de novidades para os

experimento 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 665.6 AUC percentual calculado para o experimento 2 . . . . . . . . . . . . 685.7 Eficiencia percentual dos metodos multiclasse para o experimento 3 . 735.8 Acuracia percentual dos metodos de deteccao de novidades para o

experimento 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 745.9 AUC percentual calculado para o experimento 3 . . . . . . . . . . . . 755.10 Teste de classificacao Wilcoxon pareado para os valores de AUC dos

detectores de novidade . . . . . . . . . . . . . . . . . . . . . . . . . . 77

xiii

Page 15: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

Lista de Sımbolos

αi Multiplicadores de Lagrange, p. 29

σ(t) Largura do kernel gaussiano, p. 31

ξi Variaveis Lentas, p. 29

Ω Conjunto de dados amostrais, p. 27

η Taxa de aprendizado, p. 20

γ Radiacao gamma, p. 5

λ Comprimento de Onda, p. 7, 8

c Medida do baricentro para o agrupamento, p. 26

µ Amostras de Media, p. 27

νc Velocidade de Onda Transversal, p. 8

νl Velocidade de Onda Longitudinal, p. 8

ω Frequencia, p. 14

ψ wavelet Mae, p. 15

σ2 Variancia, p. 29

a Raio do cluster, p. 28

K Clusters do algoritmo de agrupamento k-means, p. 27

b Bias, p. 19

h Funcao de Ativacao, p. 19

w Peso Sinaptico, p. 19

x Sinal de Entrada da Rede Neural, p. 19

y Saıda da Rede Neural, p. 19

xiv

Page 16: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

Lista de Abreviaturas

ACB Tubo HP com Alta Carburizacao, p. 38

AUC Area Under Curve, p. 2

AvA All vs All, p. 18

BCB Tubo HP com Baixa Carburizacao, p. 38

BMU Best Method Unit, p. 31

CP Corpo de Prova, p. 34

DFT Discret Fourier Transform, p. 14

DL1 Pa de aerogerador 1 com Delaminacao, p. 36

DL2 Pa de aerogerador 2 com Delaminacao, p. 36

DWT Discret wavelet Transform, p. 16

END Ensaios Nao Destrutivos, p. 4

FFT Fast Fourier Transform, p. 14

FF Falta de Fusao, p. 34

FNr False Negative rate, p. 42

FPTC Falta de Penetracao/Trinca, p. 34

FPr False Positive rate, p. 42

IE Inclusao de Escoria, p. 34

LP Lıquidos Penetrantes, p. 4

MC Matriz de Confusao, p. 42

MIG Metal Inert Gas, p. 34

xv

Page 17: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

MLP MultiLayer Perceptron, p. 20

MS3 Pa de aerogerador 3 com Matriz Seca, p. 36

ND Novelty Detection, p. 1

NF Total de Condicoes Negativas, p. 42

NP Total de Condicoes Positivas, p. 42

OvA One vs All, p. 18

PCA Principal Component Analysis, p. 2

PM Partıculas Magneticas, p. 5

PO Porosidade, p. 34

RBF Radial-Basis Function, p. 21

RNA Redes Neurais Artificiais, p. 19

ROC Receiver Operation Characteristic, p. 2

SAE Society of Automotive Engineers - EUA, p. 34

SCB Tubo HP sem Carburizacao, p. 38

SD Solda Sem Defeito, p. 34

SF Pa de aerogerador sem falha, p. 36

SOM Self-Organizing Map, p. 30

SVDD Support Vector Data Description, p. 29

SVM Support Vector Machine, p. 21

TIG Tungsten Inert Gas, p. 34

TNr True Negative rate, p. 42

TOFD Time of Flight Detection, p. 11

TPr True Positive rate, p. 42

US Ultrassom, p. 1

xvi

Page 18: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

Capıtulo 1

Introducao

A determinacao de descontinuidades e defeitos internos em materiais e muitoimportante para garantir a integridade de estruturas em diferentes ramos industriais,e tambem na construcao civil. A inspecao nao-destrutiva por ultrassom (US) temsido largamente aplicada para esse objetivo.

A alta sensibilidade de identificacao, a possibilidade de definicao do tamanho elocalizacao da descontinuidade sem que haja a necessidade de processos intermediariossao algumas vantagens do ensaio por ultrassom em comparacao com outros tipos deensaios nao destrutivos. Contudo, a interpretacao dos resultados depende muito daexperiencia do inspetor.

A classificacao automatica de defeitos em inspecao ultrassonica vem sendo es-tudada ha alguns anos. Diversas tecnicas como redes neurais artificiais, arvores dedecisao e discriminantes lineares foram utilizadas com sucesso.

Entretanto, normalmente, os sistemas de classificacao sao projetados para identi-ficar sinais, ou parametros deles extraıdos, que pertencem a um numero limitadode classes, estabelecido previamente a partir das amostras disponıveis para treina-mento [1].

Tradicionalmente, quando a amostra de uma nova classe, que nao estava presenteno conjunto de treinamento, e apresentada a um sistema de classificacao ela eassociada a uma das classes conhecidas a priori [2].

Esta e a questao abordada pelos metodos de deteccao de novidades (ND - NoveltyDetection). Dado o fato de que nunca e possıvel treinar um sistema de aprendizadode maquina utilizando todas as classes de objetos possıveis, torna-se importante queele seja capaz de diferenciar entre informacoes conhecidas e desconhecidas durante oteste[3].

Varios estudos apontam que a deteccao de novidades e uma tarefa extremamentedesafiadora. E por esta razao que existem varios modelos de ND que demonstraramter bons resultados em problemas diferentes. Deste modo e claramente evidente quenao ha uma unica abordagem para a deteccao de novidades e o sucesso depende nao

1

Page 19: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

apenas do tipo de metodo utilizado, mas tambem das propriedades estatısticas dosdados tratados [4].

1.1 Objetivos

Neste trabalho, e proposto um sistema automatico de auxılio a decisao, baseadoem tecnicas de deteccao de novidades, para a identificacao de defeitos em diferentesconjuntos de sinais obtidos durante ensaios nao destrutivos por ultrassom: um ensaioutilizando a tecnica TOFD em um corpo de prova soldado, um ensaio com transdutorBubbler simulando a imersao de amostras de pas de aerogeradores e um ensaio porimersao de tubos de aco retirados de fornos de pirolise.

Os objetivos especıficos desse trabalho incluem:

• Aplicacao de ferramentas de processamento digital de sinais para a analise dosconjuntos de dados, como a normalizacao dos padroes, a filtragem de ruıdocom a transformada wavelet discreta e a avaliacao no domınio da frequenciacom a transformada discreta de Fourier ;

• Verificar o efeito da dimensionalidade dos conjuntos de dados por meio da selecaode caracterısticas essenciais para a classificacao automatica por intermedio daAnalise de Componentes Principais PCA;

• Construcao de quatro abordagens para a deteccao de novidades: baseado emdistancia, agrupamento k-means, maquina de vetor de descricao de dados emapas auto-organizaveis.

• Avaliar estatisticamente o desempenho dos detectores construıdos, como amedia da eficiencia global, visualizacao de graficos boxplot, acuracia, curvaROC (Receiver Operation Characteristic)e a respectiva AUC (Area UnderCurve), e o teste de classificacao Wilcoxon pareado;

• Comparar os metodos de aprendizado nao supervisionado da deteccao denovidades com o aprendizado supervisionado dos classificadores multiclasseredes neurais artificiais e maquinas de vetor de suporte.

1.2 Organizacao do Documento

Este documento esta organizado conforme descrito a seguir:No Capıtulo 2, e apresentada uma visao geral sobre a inspecao nao destrutiva e

suas diferentes tecnicas, detalhando, em especial, as inspecoes por ultrassom.

2

Page 20: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

No Capıtulo 3, sao expostos os fundamentos teoricos das ferramentas para oprocessamento digital de sinais e selecao de caracterısticas empregadas neste trabalho,juntamente com o aprendizado de maquina supervisionado comumente realizadopara os ensaios por ultrassom e as abordagens da deteccao de novidades propostas.

O Capıtulo 4 discorre sobre a metodologia dos ensaios e classificacao utilizada noprojeto bem como a apresentacao das caracterısticas dos conjunto de sinais utilizadosno trabalho.

No Capıtulo 5, sao discutidos os resultados obtidos com sinais experimentaisconforme a metodologia proposta.

No Capıtulo 6, as conclusoes e perspectivas futuras do trabalho sao apresentadas.

3

Page 21: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

Capıtulo 2

Visao Geral sobre os Ensaios naoDestrutivos por Ultrassom

Os ensaios nao destrutivos (END) sao empregados para avaliar a integridade dosmateriais sem destruı-los ou introduzir alteracoes em suas caracterısticas. Adotadosna vistoria de materia prima, no controle de processos industriais, montagem einspecao final, os END sao eficientes metodos que podem indicar a existencia dedescontinuidades com poucos milımetros de dimensao, sendo um procedimentoindispensavel para o monitoramento da qualidade dos produtos fabricados pelaindustria moderna [5].

O ensaio por lıquidos penetrantes (LP) e um metodo desenvolvido especialmentepara a deteccao de falhas superficiais. A principal vantagem do metodo e a sua sim-plicidade de execucao, interpretacao dos resultados e o pouco tempo de treinamentodo inspetor [6].

Visto que o indicativo do defeito equipara-se com uma fotografia, a avaliacaodos resultados e direta. Contudo, a inspecao por lıquidos penetrantes detecta taosomente descontinuidades abertas para a superfıcie, dado que o LP requer a entradano defeito para ser revelado consoante a Figura 2.1.

Figura 2.1: Ensaio por Lıquidos Penetrantes.

Fonte: Adaptado de [7].

4

Page 22: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

O ensaio por partıculas magneticas (PM) e empregado na descoberta de defeitossuperficiais e subsuperficiais em materiais ferromagneticos. Pode ser executado empecas acabadas e semiacabadas inclusive durante as etapas de fabricacao [8].

Os benefıcios da tecnica PM compreendem o resultado instantaneo e a realizacaoem grande faixa de temperatura, contudo o proposito e restrito aos materiais ferro-magneticos. As pecas estao sujeitas a danos superficiais e, em algumas variacoes dainspecao por PM, as indicacoes de descontinuidades nao sao constatadas visivelmente(Figura 2.2).

Figura 2.2: Ensaio por Partıculas Magneticas.

Fonte: Adaptado de [8].

A radiografia e um metodo utilizado para inspecao nao destrutiva que emprega aabsorcao diferenciada da radiacao penetrante na peca inspecionada. Diferencas nadensidade e variacoes de espessura do material, ou modificacoes nas caracterısticas deabsorcao causadas por mudancas de composicao, resultam em concentracoes distintasde radiacao incidente no corpo inspecionado. Essa variacao na medida de radiacaoabsorvida podera indicar a presenca de uma falha interna ou defeito no objeto [9].

O ensaio por radiografia tem restricoes relacionadas a protecao da saude dooperador, dados os prejuızos provenientes da exposicao aos raios-X e a radiacao γpara o ser humano. Ademais, cuidados sao exigidos para a protecao do meio ambientee da vizinhanca em torno do ensaio. A Figura 2.3 exemplifica uma inspecao naodestrutiva por raios-X sendo efetuada num corpo de prova. .

5

Page 23: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

Figura 2.3: Ensaio por Raios-X.

Fonte: Adaptado de [10].

O ensaio por ultrassom (US) e um metodo nao destrutivo que tem por objetivo adeteccao de danos internos, presentes nos mais variados tipos ou forma de materiaissejam eles ferrosos ou nao. O transdutor, ou cabecote, e constituıdo de uma carcacametalica e um elemento piezoeletrico responsavel por gerar as ondas mecanicas comfrequencia variando na faixa de 100kHz a 50 MHz, apos a excitacao por um pulsoeletrico [5].

As propriedades fundamentais para um transdutor comumente utilizado em ENDpor US sao listadas a seguir [11]:

• Tipo: contato direto, angular, imersao. A selecao do transdutor e influenciadapelas caracterısticas do material, como a rugosidade da superfıcie, acessibilidade,temperatura, posicao do defeito no material inspecionado e a velocidade deinspecao;

• Diametro do cristal piezoeletrico sensor, que e acondicionado dentro de umcompartimento ligeiramente maior;

• Frequencia Nominal, relacionada com o aumento da penetracao da onda ul-trassonica para uma frequencia menor, enquanto que a resolucao e a nitidezfocal aumentam utilizando uma frequencia maior;

• Largura de banda, cuja parcela da resposta em frequencia esteja em confor-midade com limites de amplitude especificados na industria, como o limite de-6dB (50% da amplitude maxima);

• Duracao da forma de onda, que relaciona o numero de ciclos de onda gerados

6

Page 24: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

pelo transdutor a cada vez que e pulsado. Um transdutor com largura de bandaestreita tem mais ciclos do que um outro com maior largura de banda

A Figura 2.4 mostra a construcao interna e a propagacao de onda ultrassonicaobtida para transdutores do tipo normal e angular:

Figura 2.4: Configuracao dos transdutores normal e angular.

(a) Normal (b) Angular

Fonte: Adaptado de [11].

O perfil real do feixe ultrassonico e complexo, com gradientes de pressao diferentesnas direcoes transversal e axial. A regiao de propagacao do feixe e dividida em duaszonas: o campo proximo e o campo distante.

O campo proximo e a regiao do transdutor onde a pressao sonora passa por umaserie de oscilacoes, e encerra no ultimo pico na distancia N desde a face do transdutor.A medida N representa o foco natural do transdutor conforme a Equacao 2.1.

N = D2.f

4.v [mm] ou N = D2

4.λ [mm] (2.1)

onde:

• N = comprimento do campo proximo em mm;

• D = diametro do cristal piezoeletrico em µm;

• f = frequencia em Hz;

• v = velocidade de propagacao do som no material em m/s;

• λ = comprimento de onda (v/f) em 1/m.

O campo distante e a regiao alem de N onde a pressao sonora gradualmente caipara zero a medida que o diametro do feixe se expande e sua energia se dissipa. AFigura 2.5 ilustra os dois componentes.

7

Page 25: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

Figura 2.5: Comportamento do Feixe Ultrassonico.

Fonte: Adaptado de [11].

Em funcao das variacoes de pressao sonora dentro do campo proximo, nao epossıvel avaliar com precisao as falhas usando tecnicas baseadas em amplitude. Ovalor de N significa a maior distancia para a qual e possıvel utilizar o foco do feixesonico atraves de uma lente acustica.

Existem diferentes formas de propagacao das ondas de ultrassom, destacando-se asondas de placa (ou de Lamb) que tem uma vibracao complexa ocorrendo em materiaisonde a espessura e menor que o λ do sinal de ultrassom introduzido nele [11].

As ondas longitudinais sao ondas de compressao, nas quais o movimento dapartıcula esta na mesma direcao da propagacao da onda. As ondas transversaisapresentam movimento perpendicular a direcao da propagacao.

As ondas longitudinais (ou de Rayleigh) tem um movimento elıptico das partıculase percorrem a superfıcie de um material. Sua velocidade νl e de aproximadamente 90%da velocidade de cisalhamento νc e a sua profundidade de penetracao e equivalentea uma unidade de λ. A Figura 2.6 apresenta um resumo da propagacao das ondasultrassonicas:

Figura 2.6: Diagrama ilustrativo da propagacao das ondas de ultrassom.

Fonte: Adaptado de [11].

8

Page 26: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

O metodo ultrassonico apresenta uma grande precisao na determinacao da posicaodo defeito interno, da estimacao do formato, tamanho e da profundidade de penetracaopara a deteccao da falha. Essas caracterısticas associadas a seguranca do operadorsao as principais vantagens do ensaio por ultrassom [5].

Todavia, a inspecao por US requer grande conhecimento teorico e experiencia doinspetor. Efeitos de dispersao em funcao do tamanho de grao do material (quandoeste e da ordem de 10% do λ), absorcao, atenuacao e divergencia sonica constituemdificuldades para a interpretacao dos resultados de ensaios por ultrassom [6].

2.1 Tecnicas de Inspecao por Ultrassom

A tecnica pulso eco e aquela em que um unico transdutor e utilizado para emissaoe recepcao das ondas ultrassonicas propagadas dentro do material. Posiciona-se otransdutor utilizando um meio acoplante em uma das faces, podendo ser verificada aprofundidade da descontinuidade, suas dimensoes, e localizacao.

A visualizacao A-Scan e o modo trivial de apresentacao do sinal ultrassonico, emque e possıvel exibir a cada ponto da varredura a amplitude da onda versus o tempo,conforme a Figura 2.7 [5].

Figura 2.7: Ensaio por ultrassom - Tecnica Pulso-Eco.

Fonte: Adaptado de [5].

O conhecimento do ensaio por ultrassom manual e fator preponderante parao desenvolvimento da automacao do procedimento cuja estrutura pode incluir amovimentacao dos transdutores e/ou material inspecionado, a tecnica de acoplamento,a coleta e o processamento dos dados, o controle do sistema, os dados da posicaorelativa a regiao e a exibicao dos resultados do ensaio graficamente [12].

Outra forma de acoplar o ultrassom do transdutor a um corpo de prova se dapor meio da agua, imergindo o transdutor e a peca inspecionada dentro de um

9

Page 27: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

reservatorio.Os transdutores de imersao oferecem algumas vantagens em relacao aos trans-

dutor de contato direto devido ao acoplamento uniforme, que reduz as variacoes desensibilidade, e o foco que aumenta a deteccao dos pequenos refletores [12].

Assim, a aplicacao com os transdutores de imersao pode empregar a focalizacaocom lentes acusticas para criar um feixe em formato de ampulheta que se estreitapara uma pequena area focal e depois se expande [11].

O grafico de sinais analisado para o ensaio por imersao e diferente do pulso-eco.Entre o pulso inicial e as reflexoes da interface do material havera um pico adicionalcausado pela onda sonora refletida da agua para o corpo de prova. O operador deveajustar o equipamento para ignorar o pico do pulso inicial, de modo que a primeirareflexao analisada sera proveniente da parede frontal.

Para materiais que sofrem degradacao em funcao do contato direto com a agua,o ensaio ultrassonico por imersao usando um Bubbler surge como alternativa deacoplamento. O Bubbler geralmente possui uma pequena entrada de agua quedeve ser bombeada para um reservatorio e assim fornecer de forma constante oacoplamento, enquanto permite uma blindagem contınua para a face do transdutorna superfıcie da inspecao como ilustrado na Figura 2.8.

Assim, o feixe sonico e transmitido ao material do corpo de prova utilizando umacoluna d’agua com altura suficiente para assegurar apenas a utilizacao da regiao doultrassom que e de interesse, reduzindo ruıdos e turbulencias [13].

Figura 2.8: Transdutor especial Bubbler.

Fonte: Adaptado de [13].

No Brasil, ha uma grande aplicacao do ultrassom automatizado com sistemasconvencionais. Um procedimento automatico comumente empregado utiliza um sensorque contem uma grande quantidade de elementos piezoeletricos separados em umaunica estrutura, colocados para emitir os pulsos de ultrassom sequencialmente [14].

Este sistema, chamado Phased Array, e capaz de realizar a inspecao atraves datecnica Time of Flight Detection - TOFD para soldas principalmente por questoesnormativas. Alem de outras vantagens, observa-se uma reducao significativa do

10

Page 28: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

tempo de inspecao, com a chance de alcancar resultados em tempo real, reducao dosreparos de soldas e diminuicao no atraso ou interrupcao das etapas de fabricacao daspecas [15].

A tecnica TOFD destaca-se como alternativa para deteccao e dimensionamentode falhas em estruturas soldadas face as dificuldades encontradas nas tecnicas ul-trassonicas convencionais. A configuracao basica usa um arranjo com os transdutorestransmissor-receptor simetricamente espacados ao longo do cordao de solda [16].

As sapatas sao construıdas em material acrılico com um angulo de incidencia paragerar ondas longitudinais com largura de feixe sonico suficiente para que o maximode area seja inspecionada [17].

O primeiro sinal a chegar e o da onda lateral gerado a partir da largura de feixe dotransdutor, enquanto os outros dois sinais sao reflexoes difratadas das extremidadessuperior e inferior do defeito, seguido pela reflexao do eco de fundo. Caso nao existadefeito as reflexoes observadas serao apenas a onda lateral e o eco de fundo [18]. AFigura 2.9 exibe um esquema de inspecao para uma solda com a presenca de umdefeito do tipo trinca.

Figura 2.9: Ensaio por ultrassom - Tecnica TOFD.

Fonte: Adaptado de [19].

Os percursos L1 e L2 da onda ultrassonica para a determinacao dos defeitos emum arranjo transmissao-recepcao com os transdutores angulares sao obtidos atravesdas Equacoes 2.2 e 2.3.

11

Page 29: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

L12 = d2 + (S +X)2, (2.2)L22 = d2 + (S −X)2 (2.3)

onde S e a metade da distancia entre os transdutores que se mantem fixa durante oensaio, d e a profundidade do defeito e X o valor do deslocamento lateral em direcaoa solda [20].

Portanto, com o movimento lateral do par de transdutores, e possıvel calcularo tempo total de atraso da onda ultrassonica nas extremidades com a velocidadelongitudinal da onda vl e o tempo de percurso t no interior do material de acordocom Equacao 2.4:

vl.t =√d2 + (S +X)2 +

√d2 + (S −X)2 (2.4)

Ao derivar a Equacao 2.4 em termos do deslocamento lateral X, o menor atrasodo tempo de propagacao ocorre com a presenca do defeito no ponto central dostransdutores, resultando na Equacao 2.5:

vl.t = 2√d2 + S2 (2.5)

Dessa forma, e analisada somente a distancia entre os pontos de saıda do feixenos transdutores e o tempo de percurso da onda no material, permitindo obter aprofundidade do defeito.

12

Page 30: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

Capıtulo 3

Tecnicas de Processamento deSinais e Classificacao Utilizadas

A Secao 2.1 introduziu a nocao dos ensaios nao destrutivos por ultrassom com osdiferentes tipos de inspecoes e a coleta das assinaturas correspondentes as condicoesexistentes no corpo de prova.

A metodologia para analise dos sinais ultrassonicos atraves dessas assinaturasobtidas sera apresentada nesse capıtulo.

3.1 Normalizacao

Para identificar mudancas na forma dos sinais de ultrassom em relacao a umapopulacao de assinaturas normais, independentemente dos valores absolutos deamplitude, a normalizacao deve ser aplicada.

Esse estagio de pre-processamento retira o vınculo das amplitudes absolutas,preservando informacoes sobre a forma geral das assinaturas. Um proposito danormalizacao e transformar as caracterısticas do sinal ultrassonico, de forma que asassinaturas “normais” e “anormais” sejam mais facilmente separaveis.

CLIFTON e TARASSENKO [21] avaliaram cinco metodos de normalizacao du-rante a aplicacao da deteccao de novidades para assinaturas de vibracao provenientesda turbinas a gas.

A normalizacao component-wise tem por objetivo fornecer uma separacao ade-quada entre os padroes “normais” e “anormais” em termos de sua forma geral, aomesmo tempo em que e removida a dependencia dos valores absolutos de amplitude,da media e desvio padrao do conjunto de amostras.

O termo padrao sera empregado nesta secao para se referir a uma assinaturade ultrassom cuja normalizacao foi aplicada. Um padrao e definido por xn

i , ondei = 1. . . I representa o conjunto de dados das assinaturas e n = 1. . . N e o total de

13

Page 31: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

elementos da i-esima assinatura.A funcao de normalizacao component-wise N(xi) e definida como uma trans-

formacao linear dos n elementos ou componentes xi presentes em um conjunto dedados, conforme a Equacao 3.1:

N(xi) =n : [1 . . . N ] .

(x

(n)i − µ(n)

)σ(n)

(3.1)

onde (µ(n), σ(n)) sao vetores de media e desvio padrao com tamanho N , calculadospara todos os i componentes por meio das Equacoes 3.2 e 3.3:

µn = 1I

I∑i=1

xni (3.2)

σn =(

11− I

I∑i=1

(xni − µn)2)1/2

(3.3)

3.2 Transformada Discreta de Fourier

A analise espectral do sinal de ultrassom permite obter a distribuicao de energiado sinal no domınio da frequencia sendo possıvel extrair tambem informacoes de fase,que poderiam ser mascaradas no domınio do tempo, a fim de realizar a caracterizacaodo material avaliado [22].

Dada uma funcao absolutamente integravel, a sua transformada de Fouriercontınua e definida pela Equacao 3.4:

F (ω) =∫ ∞−∞

f(t)e−jωtdt. (3.4)

Para sinais discretos e limitados no tempo, utiliza-se a Transformada Discretade Fourier DFT (Discret Fourier Transform). Esta transformacao e importante emtermos computacionais, uma vez que pode ser implementada atraves do algoritmo daTransformada Rapida de Fourier (FFT -Fast Fourier Transform) que coleta o totalde amostras do vetor, aproximando-o a proxima potencia de 2, elevando a eficienciacomputacional do processamento [23].

A Equacao 3.5 apresenta a expressao da DFT, na qual N e o comprimento dovetor de entrada onde WN = e

−j2πN .

F [k] =N−1∑n=0

f [n]W nkN (3.5)

Assim, a transformada de Fourier de tempo discreto para uma sequencia de

14

Page 32: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

comprimento finito pode ser amostrada em ω = 2πN

(que periodiza a sequencia).Portanto, a DFT pode ser avaliada como a transformacao periodica de um sinalperiodico, ou uma amostragem da Discret-Time Fourier Transform para um sinal decomprimento finito [24].

Assim, o uso da analise espectral para a assinatura do pulso ultrassonico e umaferramenta importante de avaliacao da mudanca na frequencia do pico espectral dostransdutores banda larga ao interagir com variacoes microestruturais induzidas nosdiferentes tipos de materiais. E possıvel correlacionar o efeito da mudanca na relacaoentre as amplitudes de pico para altas e baixas frequencias com o tamanho de graoe outros eventos metalurgicos que modificam a natureza microestrutural de acosinoxidaveis, entre outros aspectos.

3.3 Transformada Discreta wavelet

As transformacoes wavelet, particularmente as wavelets ortonormais e biortogo-nais com suporte finito, surgiram como uma nova ferramenta matematica para adecomposicao multiresolucao de sinais de tempo contınuo com possıveis aplicacoesem visao computacional, codificacao de sinal e outros.

Para analisar estruturas de sinais com escalas diferenciadas nos domınios tempo-frequencia com diferentes suportes temporais, a transformada wavelet decompoe umsinal em versoes expandidas e transladadas das funcoes wavelet [25].

Assim, as wavelets reproduzem um sinal transiente de modo mais adequado queas senoides, visto que sao capazes de decompor a dinamica global e local de umsinal. Considere a famılia de funcoes obtida deslocando e expandindo uma wavelet“mae”ψ(t) na Equacao 3.6 [24]:

ψa,b(t) = 1√|a|ψ

(t− ba

)(3.6)

onde a,b ∈ < (a6=0), e a normalizacao garante que ‖ψa,b(t)‖ = ‖ψ(t)‖.Assumindo que a wavelet satisfaz a condicao de admissibilidade (Equacao 3.7).

Cψ =∫ ∞−∞

|Ψ(ω)|2

|ω|dω <∞ (3.7)

onde Ψ(ω) e a Transformada de Fourier de ψ(t). Ψ(ω) tera sempre que decair osuficiente para que a condicao de admissibilidade se reduza ao requisito de queΨ(0)=0. Como a transformada de Fourier e zero na origem e o espectro cai em altafrequencias, a wavelet possui um comportamento de passa-faixa. Agora a Equacao 3.7e normalizada para que tenha energia unitaria conforme Equacao 3.8:

15

Page 33: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

‖ψ(t)‖2 =∫ ∞−∞|ψ(t)|2 dt = 1

∫ ∞−∞|Ψ(ω)|2 dω = 1 (3.8)

logo, ‖ψa,b(t)‖2 = ‖ψ(t)‖2.Assim a transformada wavelet contınua CWT (Continuous wavelet Transform)

de uma funcao e definida na Equacao 3.9:

CWTf (a, b) =∫ ∞−∞

Ψ∗a,b(t)f(t)dt = 〈Ψa,b(t), f(t)〉 . (3.9)

As wavelets ortogonais dilatadas por a apresentam variacoes de sinal na posicaob. A construcao dessas bases pode estar relacionada a aproximacoes de sinaismultirresolucao. Desse modo, ha uma equivalencia inesperada entre bases de wavelete filtros de espelho conjugado usados em bancos de filtros discretos. Neste trabalho,em vez de uma construcao direta em tempo contınuo, utilizaremos filtros de tempodiscreto.

Daubechies iniciou a construcao das famılias produzindo esquemas de decom-posicao das wavelets de forma muito pratica, uma vez que sao implementaveis atravesde filtros de tempo discreto cujo comprimento e finito [26].

A transformada discreta wavelet (DWT - Discret wavelet Transform) se baseia nadecomposicao do sinal em aproximacoes e detalhes, atraves de filtros de suavizacao(passa baixa) e outros trazendo informacoes de detalhes (passa alta) conformeilustrado na Figura 3.1 [24].

Figura 3.1: Decomposicao wavelet com Subamostragem.

Fonte: Adaptado de [25].

Inicialmente, o sinal e subdividido, por meio de filtros passa-baixa e passa-alta,com frequencia de corte variando com aquela do sinal amostrado, visto que a largurade banda do sinal digital varia conforme o Teorema de Nyquist [27].

Para efetuar a analise wavelet e necessario escolher uma funcao prototipo (waveletmae ψ(t)). Na DWT, os filtros digitais passa-baixa e passa-alta sao projetadoscom base em uma funcao wavelet escolhida previamente e usados para gerar duasversoes filtradas do sinal original. Posteriormente, os sinais passam por um processo

16

Page 34: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

denominado sub-amostragem, no qual a quantidade de amostras dos novos sinais(filtrados) e reduzida por um fator de dois [28].

A remocao de ruıdo e vantajosa para algumas aplicacoes de imagens ultrassonicase END, em que o sinal recebido contem muito ruıdo. A filtragem wavelet e umaferramenta consolidada em muitas aplicacoes de ensaios nao destrutivos, e umproblema principal na filtragem de ruıdo com wavelet e a selecao do limite otimo [29].

O ruıdo geralmente se manifesta como uma estrutura de grao fino (em imagenspor exemplo) e a wavelet fornece uma representacao em escala por coeficientesem escalas mais finas. A transformada wavelet produz um grande numero depequenos coeficientes, devido ao ruıdo, e um pequeno numero de grandes coeficientes,relacionados as caracterısticas importantes do sinal [30].

O limiar e uma tecnica nao linear simples, que opera em um dos coeficientes dawavelet para descarte dos valores relacionados ao ruıdo, removendo os coeficientesinferiores a um valor fixo. Assim, a tecnica fornece uma reducao de ruıdo sem afetaras caracterısticas significativas do sinal, e os coeficientes restantes sao usados parareconstruir o sinal.

ADAMO et al. [30] realizaram um estudo comparativo na selecao da wavelet maeem imagens de ultrassom. Verificaram que as funcoes de wavelet com maior ordemde filtro (3a ou 4a ordem) sao mais efetivas quando o nıvel de ruıdo aumenta. Asfamılias Daubechies e Symlet oferecem resultados muito semelhantes.

3.4 Analise de Componentes Principais

A analise de componentes principais PCA (Principal Component Analysis) euma tecnica estatıstica de processamento de sinais que objetiva encontrar umatransformacao linear tal que a projetacao deles seja nao-correlacionada (ortogonais)e grande parcela da energia (variancia) esteja concentrada em um pequeno numerode componentes. Para isso, sao exploradas informacoes estatısticas de ate segundaordem (medias e variancias)[31].

Considerando-se um vetor x = [x1, ..., xN ]T aleatorio com N elementos, assume-seque ele tenha media zero, Ex = 0. Entao, a projecao zi de x na direcao de umoutro vetor vi pode ser expressa pela Equacao 3.10:

zi = vTi x =N∑k=1

vkixk. (3.10)

Na transformacao por PCA, os componentes zi (i = 1, ..., N) devem ser ortogonaise ordenados (de modo decrescente) pela variancia das projecoes, sendo, entao, z1 aprojecao de maxima variancia.

Como Ex = 0, entao Ezi = 0. Portanto, a variancia da projecao zi e

17

Page 35: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

calculada por Ez2i . Seguindo a definicao da PCA, z1 tem maxima variancia; logo,

v1 pode ser encontrado pela maximizacao da Equacao 3.11:

JPCA1 (v1) = Ez2i = E(vT1 x)2

E(vT1 x)2 == vT1ExxTv1 = vT1 Cxv1,(3.11)

onde Cx e a matriz de covariancia de x.A solucao para o problema de maximizacao de JPCA1 pode ser encontrada na

algebra linear, em funcao dos autovetores e1, e2, ..., eN da matriz Cx. A ordem dosautovetores e tal que os autovalores associados satisfazem d1 > d2 > ... > dN . Destaforma, a solucao para a Equacao 3.12 e dada por:

vi = ei, 1 ≤ i ≤ N (3.12)

A transformacao por PCA pode ser expressa na forma matricial: z = Vx, ondez = [z1, z2, . . . , zN ]T e V = [v1,v2, . . . ,vN ]T .

MOHD ARIS et al. [32] abordam a capacidade das tecnicas de PCA para deter-minar as condicoes da integridade estrutural de laminados fibra-metal em carbonoutilizando ondas de Lamb e reconstrucao do sinal no domınio do tempo atraves daCWT. Os resultados mostraram que, em todos os casos considerados, foi possıvel dis-tinguir as condicoes de estados nao danificados, avariados e reparados, com precisaopromissora e repetibilidade dos resultados.

3.5 Metodos de Classificacao Multiclasse

A classificacao multiclasse e um problema central na aprendizagem de maquina,uma vez que as aplicacoes requerem uma discriminacao entre varias classes quesao onipresentes. Na aprendizagem de maquina, as aplicacoes podem variar desdereconhecimento de caracteres manuscritos ate a categorizacao de texto.

Em razao da classificacao binaria ser bem compreendida, uma abordagem comumpara a classificacao multiclasse envolve o uso direto de classificadores binarios padraopara codificar e treinar os rotulos de saıda atraves da abordagem OvA (One vs Allum contra todos). O esquema OvA assume que, para cada classe, existe um unicoseparador (simples) entre essa classe e todas as outras classes. A alternativa todoscontra todos (AvA All-versus-All) e mais expressiva pois assume a existencia de umseparador entre duas classes [33].

SCHOLKOPF e SMOLA [34] discutem que provavelmente nao ha um metodomulticlasse capaz de abordar todas as hipoteses e, para fins praticos, a escolha dometodo deve ser feita dependendo das restricoes, como o nıvel de precisao desejado,o tempo disponıvel para desenvolvimento, o treinamento e a natureza do problemas

18

Page 36: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

de classificacao. Contudo, na pratica, a escolha do melhor metodo e uma tarefadesafiadora. Mesmo para uma abordagem fixa multiclasse, existem muitos detalhesque podem ser ajustados.

Nesta secao serao apresentados alguns metodos de classificacao multiclasse lar-gamente utilizados na literatura para a tarefa de avaliacao de sinais ultrassonicos,como as redes neurais artificiais e as maquinas de vetor de suporte.

3.5.1 Redes Neurais Artificiais

As Redes Neurais Artificiais (RNA) sao compostas de unidades basicas de proces-samento (neuronios) distribuıdas paralelamente, garantindo a habilidade de adaptacaoe aprendizagem. Uma rede suficientemente treinada pode adquirir capacidade degeneralizacao, quando sao apresentadas as entradas dados diferentes dos utilizadosdurante o seu treinamento [35].

O modelo nao linear de um neuronio artificial foi proposto inicialmente porMcCulloch utilizando entradas, representadas por xi, ponderadas por peso sinapticowi e somadas em um combinador linear [35]. Uma funcao de ativacao restringe asaıda da rede, reduzindo-a a valores finitos, descrito pela Equacao 3.13.

y = h

(n∑i=1

wixi + bi

)(3.13)

onde y e a saıda da rede Neural, h e a funcao de ativacao e b e o vies.O algoritmo Perceptron foi definido nos anos 1950 e serviu de base para o

desenvolvimento dos modelos de rede neural nos anos de 1980 e 1990. Consistebasicamente de classificadores que buscam encontrar um hiperplano de separacao,minimizando a distancia de pontos mal classificados para o limite de decisao [36].

Este algoritmo, de fato, usa o gradiente estocastico descendente para minimizaro criterio linear por partes. Isso significa que, em vez de calcular a soma dascontribuicoes do gradiente de cada observacao seguida de um passo na direcao dogradiente negativo, um passo e tomado depois que cada observacao e visitada. Assim,as observacoes mal classificadas sao visitadas em alguma sequencia, e os parametrosdo hiperplano sao atualizados [36].

Alguns problemas relacionados com o uso do Perceptron sao apontados a seguir:

• Quando os dados sao separaveis, existem muitas solucoes e qual delas e encon-trada depende dos valores iniciais;

• O numero “finito” de etapas pode ser muito grande. Quanto menor o espaco,mais tempo e requerido;

19

Page 37: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

• Quando os dados nao sao separaveis, o algoritmo nao converge, e os ciclos sedesenvolvem, podendo ser longos e, portanto, difıceis de detectar;

Para superar as limitacoes praticas do perceptron, uma estrutura de rede neuraisPerceptron Multicamada (MLP - MultiLayer Perceptron) foi desenvolvida. Osrecursos basicos do MLP incluem o modelo de cada neuronio na rede com uma funcaode ativacao nao-linear diferenciavel. A rede contem uma ou mais camadas ocultasdos nos de entrada e saıda que exibem um alto grau de conectividade, determinadopor pesos sinapticos [35].

A popularidade do aprendizado em tempo real para o treinamento supervisionadode MLP foi melhorado pelo desenvolvimento do algoritmo backpropagation, quefornece uma “aproximacao”da trajetoria no espaco de peso calculado pelo gradientedescendente. Quanto menor for o parametro da taxa de aprendizado η, menor sera amudanca nos pesos sinapticos na rede de uma iteracao para a proxima, e mais suavedar-se-a a trajetoria ate os pesos sinapticos conforme a Equacao 3.14.

O MLP e parametrizado por uma arquitetura A (representando um parametrodiscreto) e um vetor de peso w (composto por elementos contınuos) segundo aEquacao 3.15:

F (w,x) =m1∑j=0

wojϕ

(m0∑i=0

wjixi

)(3.14)

F (w,x) = ϕ(A(3)

1

)(3.15)

onde w e o vetor de peso ordenado, x e o vetor de entrada, ϕ e a funcao de ativacao.Esta mudanca de arquitetura oferecida pelo backpropagation, entretanto, e al-

cancada ao custo de η mais lenta. Se, por outro lado, tornarmos η muito grandepara acelerar o aprendizado, as mudancas resultantes nos pesos sinapticos assumemtal forma que a rede pode tornar-se instavel [35].

A inicializacao da rede MLP com backpropagation e feita com pesos aleatorios.Durante o processo de aprendizagem, um vetor de entrada e apresentado para a redee propagado para determinar os valores da saıda. O vetor de saıda produzido pelarede e comparado com o vetor de saıda desejado, resultando num sinal de erro, quee propagado em direcao aos neuronios da camada de entrada atraves da rede parapermitir o ajuste dos pesos. Este processo e repetido ate que a rede responda, paracada vetor de entrada, com um vetor de saıda com valores suficientemente proximosdo desejado [35].

O metodo Levenberg-Marquardt e uma combinacao entre o metodo de Newton,que converge rapidamente perto de um mınimo local ou global, mas tambem podedivergir, e o gradiente descendente, que e assegurado por convergencia atraves de

20

Page 38: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

uma selecao adequada do parametro tamanho do passo, convergindo lentamente.Considerando a otimizacao de uma funcao de segunda ordem F(w), sendo g seu

vetor de gradiente e H a matriz Hessiana, de acordo com o metodo de Levenberg-Marquardt, o ajuste otimo ∆w aplicado ao vetor de parametro w e definido por:

∆w = [H + ΛI]−1g (3.16)

onde I e a matriz identidade das mesmas dimensoes de H;Λ e um parametro de regularizacao ou carregamento que obriga a matriz de soma

(H + Λ I) a ser definida de forma positiva e bem condicionada ao longo do calculo.A versao aproximada do algoritmo de Levenberg-Marquardt, com base no vetor

gradiente e no Hessiano, e um metodo de otimizacao de primeira ordem que eadequado para problemas de estimativa dos mınimos quadrados nao-lineares. Alemdisso, o algoritmo e realizado em forma de lote.

LIU et al. [37] utilizaram uma rede neural do tipo backpropagation com metodoLevenberg-Marquadt e 3 camadas ocultas para classificar automaticamente dadosprovenientes de quatro tipos de pontos com solda em uma peca de aco austenıticonos quais havia 4 tipos de defeito. Os sinais coletados foram analisados no domınioda frequencia apos a realizacao da transformada wavelet. A precisao de classificacao eidentificacao de defeitos foi superior a 96%, cujo resultado do teste permitiu verificara viabilidade da deteccao por ultrassom da soldagem por pontos

3.5.2 Maquinas de Vetor de Suporte

A maquina de vetor de suporte (SVM - Support Vector Machine) e uma maquinade aprendizagem binaria que, dada uma amostra de treinamento, constroi umhiperplano como superfıcie decisoria de tal forma que a margem de separacao entreexemplos positivos e negativos e maximizada [35].

Para descrever formalmente a construcao de uma SVM para realizar uma tarefadestinada ao reconhecimento de padroes, esta depende de duas operacoes matematicas:mapeamento nao-linear de um vetor de entrada em um espaco de caracterıstica comalta dimensao que esta oculto tanto para a entrada quanto para a saıda e construcaode um hiperplano ideal para separar as caracterısticas descobertas [36]. Na verdade,nao precisamos especificar uma transformacao h(x), mas definir apenas a funcao dokernel K(x,x’) que computa produtos internos no espaco transformado. O kerneldeve ser uma funcao simetrica semi-positiva definida [36].

Tres escolhas populares para a definicao do kernel na literatura SVM: a funcaode base radial, o polinomio de grau n-esimo e a rede Neural. Considerando a funcaode base radial da Equacao 3.17, este pode ser descrito sob a forma de uma estruturaem camadas, conforme listado a seguir e ilustrado na Figura 3.2:

21

Page 39: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

K(x, x′) = exp(−γ ‖ x− x′ ‖2) (3.17)

• Camada de Entrada - Consiste de m0 nos de fonte, onde m0 e a dimensionalidadedo vetor x;

• Camada Oculta: Possui o mesmo numero de unidades de computacao como otamanho da amostra de treino N. Cada unidade e descrita matematicamentepor uma funcao de base radial. Comumente, observa-se o uso de uma funcaogaussiana (como RBF), em que cada unidade computacional na camada ocultada rede;

• Camada de Saıda - Consiste, geralmente, em uma unica unidade computacional.Claramente, nao ha restricao no tamanho da camada de saıda, exceto paradizer que tipicamente o tamanho da camada de saıda e muito menor que o dacamada oculta.

Figura 3.2: Maquina de Vetor de Suporte como kernel Radial Basis Function.

Fonte:Adaptado de [35].

Para a construcao de uma SVM com kernel RBF, o numero de funcoes de baseradial e seus centros sao determinados automaticamente pelo numero de vetores desuporte e seus valores, respectivamente, identificados como parametros (σ,C).

A dimensionalidade do espaco de caracterısticas e determinada pelo numero dosvetores de suporte extraıdos dos dados de treinamento considerando a solucao para oproblema da otimizacao apresentada na Equacao 3.18 que envolve somente os recursosde entrada transformados h(xi) atraves de produtos internos. Para determinadasescolhas particulares de h, o calculo dos produtos internos podem ser simplificados:

22

Page 40: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

LP = 12 ‖ β ‖

2 +CN∑i=1

ξi −N∑i=1

αi[yi(xTi β + β0)− (1− ξi)]−N∑i=1

µiξi. (3.18)

A funcao do Lagrangiano dual e expressa sob a forma indicada na Equacao 3.19:

LD =N∑i=1

αi −12

N∑i=1

N∑i′=1

αiα′

iyiy′

i〈h(xi), h(x′i)〉. (3.19)

A solucao da funcao de transformacao pode ser reescrita conforme a Equacao 3.20:

f(x) = h(x)Tβ + β0 =N∑i=1

αiyi〈h(x), h(xi)〉+ β0. (3.20)

Assim, dado os coeficientes αi, o valor de β0 pode ser determinado pela resolucaode yi,f(xi) = 1 na Equacao 3.20 para qualquer (ou todos) xi para o qual 0 < αi < oparametro de penalidade C. Portanto, as Equacoes 3.19 e 3.20 envolvem a solucaoda funcao de transformacao h(x) somente atraves de produtos internos.

3.6 Metodos de Deteccao de Novidades

A deteccao de novidades (ND - Novelty Detection) pode ser definida como acapacidade de reconhecer que um estımulo difere em alguns aspectos dos estımulos co-nhecidos (outliers). Isto pode ser uma habilidade util para sistemas de aprendizagem,tanto natural como artificial [38, 39].

O problema do reconhecimento de padroes convencional normalmente incidesobre a classificacao de duas ou mais classes. Ja os problemas multiclasse sao,frequentemente, decompostos em varios sistemas de classificacao com duas classes,que e considerada a tarefa basica [40, 41], como pode ser observado na Figura 3.3.

Figura 3.3: Comportamento de um algoritmo para deteccao de novidades.

Fonte:Adaptado de [42].

23

Page 41: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

O interesse na deteccao de novidades decorreu do estudo de sistemas de controle.Estruturas de alta integridade nao podiam usar o procedimento de classificacaotradicional por uma serie de razoes entre as quais estao a ocorrencia de anormalidadesraras ou a ausencia de dados que descrevam todas as condicoes de falha [4].

A deteccao de novidades ofereceu uma solucao para esse problema modelandodados da condicao normal, usando uma medida de distancia e um limite paradeterminar possıveis anormalidades.

Nos ultimos anos, a deteccao de novidades foi utilizada em varias aplicacoes taiscomo interpretacao de mamografias [43] e outros problemas de diagnostico medico[44, 45], deteccao de falhas e anomalias em sistemas industriais complexos [46],identificacao de danos estruturais [1, 47], problemas de seguranca eletronica, comodeteccao de fraude em cartao de credito ou celular [48, 49], vigilancia por vıdeo [50],robotica movel [51], redes de sensores [52], astronomia [53] e mineracao de texto [54].

Em determinadas aplicacoes, o problema torna-se complicado pela existencia devarias classes de interesse, alta dimensionalidade, caracterısticas ruidosas e falta deamostras suficientes. Neste sentido, as abordagens de ND tentaram acompanharesses problemas para oferecer solucoes que podem ser usadas no mundo real.

MARKOU e SINGH [4] apresentam princıpios importantes relacionados a deteccaode novidades:

1. Princıpio de robustez e troca: um metodo de ND deve ser capaz de apresentarum desempenho robusto em dados de teste que maximize a exclusao de novasamostras, minimizando a retirada de sinais conhecidos. Esse trade-off (troca)deve ser, de forma limitada, previsıvel e sob controle experimental;

2. Princıpio da escala uniforme de dados: para auxiliar a ND, deve ser possıvelque todos os dados de teste e os dados de treinamento apos a normalizacaoestejam dentro do mesmo intervalo;

3. Princıpio de minimizacao de parametros: a ND deve visar minimizar o numerode fatores que sao definidos pelo usuario;

4. Princıpio da generalizacao: o sistema deve ser capaz de generalizar sem con-fundir a informacao generalizada;

5. Princıpio da independencia: os modelos de ND devem ser independentes donumero de recursos e das classes disponıveis e devem oferecer um desempenhoadmissıvel no contexto de conjunto de dados desequilibrado, com baixo numerode amostras e ruıdo;

6. Princıpio da adaptabilidade: um sistema que reconhece novas amostras duranteo teste deve poder usar essas informacoes para um novo treinamento;

24

Page 42: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

7. Princıpio da complexidade computacional: uma serie de aplicacoes de ND estaoonline e, portanto, a complexidade computacional de um mecanismo ND deveser a menor possıvel.

As diferentes tecnicas de ND podem ser classificadas em duas categorias princi-pais de acordo com seu procedimento de treinamento: nao-supervisionado e semi-supervisionado [28, 55].

O treinamento semi-supervisionado manuseia dados assinalados das classes po-sitiva (normal) e negativa (anormal). Contudo, o exito de uma abordagem semi-supervisionada para a aplicacao da deteccao de novidade sustenta-se na qualidadedos dados anormais angariados, cuja obtencao nao e trivial.

Partindo do princıpio de que somente assinaturas normais sao disponibilizadas,a solucao elementar para treinar um detector de novidades e a geracao artificialde dados anormais para localizar uma fronteira ao redor dos dados normais. Atocontınuo, o detector de novidades pode ser treinado para discriminar os dados normaisdos anormais produzidos artificialmente.

No entanto, e difıcil para este metodo gerar um conjunto de dados quase normaispertencentes a uma classe anormal para problemas com dimensoes elevadas e estaabordagem e limitada pelo requisito de que nao haja justaposicao entre as classesnormal e anormal [28].

A tarefa de treinamento nao-supervisionado requer exclusivamente dados nor-mais nao identificados. No decorrer da estruturacao do modelo de normalidade, oconhecimento do domınio a priori disponıvel pode ser explorado para caracterizar ocomportamento do conjunto de dados mais adequadamente.

E possıvel adiantar que uma abordagem supervisionada para a construcao de ummodelo normal seria mais plausıvel para viabilizar uma caracterizacao mais precisada normalidade do que uma abordagem nao supervisionada. Alem disso, para variasaplicacoes da deteccao de novidades, diversas observacoes essenciais precisam sercontempladas ao adotar uma tecnica de ND [21, 56].

A precisao e credibilidade de um detector, a normalizacao de dados, o numeromınimo de ajustes dos parametros, a complexidade computacional entre outrosvariados aspectos complementares, abrangendo a distribuicao de dados, os tipos denovidades, a acessibilidade aos rotulos para cada ponto de dados, a saıda de umdetector de novidades (pontuacao ou rotulos) e os domınios de proposito tıpico.

O tipo da novidade e desconhecido em todos os domınios de uma aplicacao. Atıtulo de exemplo, um evento de novidade pode evoluir com o passar do tempo parauma funcao estipulada ou uma novidade circunstancial pode surgir no futuro, quedifere das novidades anteriores.

Outrossim, a novidade que ja aconteceu podera tornar-se uma condicao ditanormal ao longo do tempo. Isto posto, a deteccao de novidades dinamicas (atualizadas

25

Page 43: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

em tempo real) estimula o desenvolvimento das tecnicas existentes.Neste trabalho, os sistemas para deteccao de novidade foram desenvolvidos usando

treinamento nao supervisionado em 4 tipos: maquinas de vetor de suporte, sistemasbaseados em distancia, clustering k-means e mapas auto-organizaveis.

A Figura 3.4 ilustra o processo de construcao dos modelos e deteccao de novidades.Um modelo de normalidade e mostrado neste exemplo para ser construıdo a partirdas n assinaturas de ultrassom. As assinaturas de teste sao entao comparadas a essemodelo.

O processo da deteccao de novidades categoriza cada assinatura de ultrassomtestada como sendo “normal” ou “anormal” e um score de novidade e calculado paracada assinatura avaliada.

Figura 3.4: Construcao de modelos para deteccao de novidades usando assinaturasde ultrassom.

Fonte:Adaptado de [21].

Apos a normalizacao de todas as assinaturas e a realizacao das demais etapas depre-processamento, um modelo de normalidade pode ser construıdo para caracterizarvetores normais. Os padroes que dao origem a desvios deste modelo, se significativosem magnitude, podem entao ser classificados como novos.

Esta secao descreve a aplicacao dos algoritmos para um conjunto de treinamentocom padroes normais, para construir um modelo de normalidade utilizando os sinaisultrassonicos. A avaliacao desses modelos como base para a deteccao de novidades ediscutido na Secao 4.4.

26

Page 44: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

3.6.1 Deteccao de novidades usando abordagem baseada emdistancia

Os metodos baseados em distancia, incluindo o clustering ou vizinhanca, sao umoutro tipo de tecnica que pode ser utilizada para realizar uma tarefa equivalente aestimacao da funcao densidade de probabilidade dos dados. Estas tarefas contamcom as metricas de distancia bem definidas para calcular a medida de similaridadeentre dois pontos [57].

CLIFTON [58] define como c o baricentro de todos os dados de treinamentonormais, e dmax a distancia euclidiana maxima de todos os dados de treinamentonormais para c. Dada uma amostra de teste x, a saıda rdist(x) e definida pelaEquacao 3.21:

rdist(x) = d(x, c)dmax

(3.21)

Esta e a distancia mais proxima da descricao de dados vizinhos, onde e assumidoque uma matriz de distancia ou dissimilaridade e dada como entrada. Portanto, naoha distancias calculadas. Um limiar a de uma saıda no rdist(x) define um limiteesferico de raio a.dmax da formacao centroide c, ilustrada pela Figura 3.5.

Figura 3.5: Comparacao da distancia entre a condicao normal e a novidade.

Fonte:Adaptado de [28].

Para a deteccao da novidade, a amostra de teste cujo raio rdist(x) > a e conside-rada anormal no que diz respeito aos dados de treino normais. Caso o valor do limiarseja a = 1, ou seja, corresponda a um raio igual a distancia dmax, sera classificadocomo condicao normal, igual a todos os dados de treino. A definicao do parametroa > 1 permite que seja alcancado um limite superior aos dados de treino, e que,portanto, o metodo seja capaz de generalizar com maior precisao a ocorrencia dedados normais durante a etapa de teste em comparacao aos dados anormais.

27

Page 45: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

O algoritmo k-means e um dos mais populares metodos de estruturacao dos dadosde contorno devido a sua simplicidade de implementacao. A tecnica pode tratar umtipo complexo de dados apenas articulando um algoritmo de agrupamento capazde lidar com esses tipos de dados complexos e especıficos. O processo de teste erapido, pois os dados testados sao comparados meramente com um pequeno numerode clusters em vez de usar todos os dados normais [59].

Entretanto, o desempenho desta abordagem e decidido pelo metodo de capturadas estruturas de cluster dos dados normais. Portanto, a medida de distancia oudensidade utilizada pelo algoritmo de agrupamento precisa ser otimizada e continuaa ser um desafio para esta tecnica de ND.

A ferramenta avalia um conjunto de dados amostrais Ω = x1; x2; x3; ...; xNonde N e a quantidade total de amostras. O algoritmo iterativamente separa osdados em K (K < N) clusters distintos de Ω tal que a soma dos erros quadraticose mınima. Portanto, o metodo k-means deve minimizar o erro da funcao de erroEk−means que e definida como a soma dos quadrados das distancias euclidianas entreos centros sua populacao de amostras [58]. Assim, o calculo do erro e da media µpara a construcao do cluster e realizado atraves das Equacoes 3.22 e 3.23:

Ek−means(x) =k∑j=1

∑xεΩi‖x− µ‖2 (3.22)

µj = 1Nj

∑xεΩi

x (3.23)

onde µj e um prototipo associado ao cluster e kth, e pode ser considerado comoo centro do respectivo cluster. Durante o processo de teste do metodo k-means,os dados que nao se enquadram em nenhum cluster serao considerados novidade,conforme apresentado na Figura 3.6.

Figura 3.6: Aplicacao do clustering k-means.

Fonte:Adaptado de [28].

28

Page 46: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

A otimizacao de µj comeca com uma localizacao aleatoria dos prototipos. Todosos dados de treinamento sao atribuıdos ao prototipo mais proximo, entao o valor deµj e atualizado para a media desse conjunto de pontos. Este processo de re-estimativase repete ate que os locais do prototipo sejam estaveis. O parametro k, o numero declusters para o qual os dados de treinamento pertencem, e sintonizado com validacaocruzada em nossos experimentos para obter um detector de novidades com bomdesempenho.

A complexidade computacional da formacao de um detector de novidades baseadoem cluster depende rigorosamente do algoritmo de agrupamento empregado paragerar clusters a partir dos dados. Para o algoritmo de agrupamento k-means, devidoao uso da tecnica baseada em heurıstica, a complexidade computacional e entaolinear no tamanho dos dados.

O metodo Elbow e uma das maneiras de selecionar a quantidade de clusters (K)no algoritmo, analisando a porcentagem de variancia explicada como uma funcaodo numero de clusters. Quando o salto entre uma quantidade de cluster e o valorsubsequente e irrelevante, o valor de K correspondente e selecionado para segmentaros dados [40].

A saıda da novidade R(x) (Equacao 3.24) da amostra de teste x e dada porsua menor distancia normalizada para um centro de cluster como apresentado naEquacao 3.25:

R(x) = 1Ni

∑xεΩi‖x− µi‖ (3.24)

r(x) = mini

1Ri

‖x− µi‖ (3.25)

Um limiar local em R(x) e definido para ser Rmaxi ≥ 1, a fim de permitir que

todos os dados de treino normais sejam aceitos em um conjunto Ωi. Note-se que oraio a = 1 corresponde a um limite esferico com um raio Rmax

i a partir do centro deΩi, enquanto a > 1 corresponde a um limite esferico com um raio de maior Rmax

i .PAVLOPOULOU et al. [1] avaliou danos estruturais de compositos laminados

utilizando ondas guiadas com a deteccao de novidades. Neste caso, o processamentode sinal permitiu a extracao das caracterısticas adequadas com o uso de algoritmospara o reconhecimento de padroes e reducao da dimensao com a PCA nao-linear,correlacionando com o defeito.

29

Page 47: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

3.6.2 Deteccao de novidades usando abordagem de cons-trucao de domınio

Uma das tecnicas de ND comumente usada e baseada em SVM para a construcaode um limiar decisorio esferico/hiperplano que separe/agrupe a maioria dos pontosde dados normais [28].

A SVM de uma classe e um algoritmo nao-supervisionado que aprende umafuncao de decisao para a deteccao de novidade: classificando novos dados comosemelhantes ou diferentes do conjunto de treinamento [39, 60].

O metodo de Support Vector Data Description SVDD descrito por TAX e DUIN[61] assume uma abordagem esferica, em vez de planar. O SVDD obtem um limiteesferico, no espaco de caracterısticas, em torno dos dados. O volume desta hiperesferae minimizado, para reduzir o efeito da incorporacao de valores atıpicos na solucao.

A hiperesfera resultante e caracterizada por um centro a e um raio R > 0como distancia de a para qualquer vetor de suporte o limite, do qual o R2 seraminimizado. O centro a e uma combinacao linear dos vetores de suporte. O problemade minimizacao torna-se entao:

minR,a

R2 + Cn∑i=1

ξi (3.26)

‖xi − a‖2 ≤ R2 + ξi, ξi ≥ 0 (3.27)

para i:1,. . ., n. Assim como na formulacao tradicional, pode-se exigir que todas asdistancias dos pontos de dados xi para o centro sejam menores que R, mas paracriar uma margem suave, as variaveis lentas ξi com o parametro de penalidade C saousadas, ilustrado na Figura 3.7.

Figura 3.7: Construcao da hiperesfera para o SVDD.

Fonte:Adaptado de [28].

30

Page 48: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

Depois de resolver a Equacao 3.27 por introducao dos multiplicadores Lagrangeαi, um novo ponto de dados z pode ser testado para estar dentro ou fora da classe. Econsiderado normal quando a distancia ao centro e menor ou igual ao raio, usando okernel Gaussiano como uma funcao de distancia em dois pontos de dados (ver 3.28):

‖z− x‖2 =n∑i=1

αiexp

(−‖z − x‖2

σ2

)≥ −R2/2 + CR (3.28)

O desempenho do metodo SVDD depende totalmente da selecao de doisparametros: a largura de σ na funcao do kernel de Gauss e do parametro depenalidade C. Uma configuracao pequena (ou grande) desses dois parametros podelevar a um limite inadequado do SVDD devido ao overtraining (excesso de ajuste)ou em casos de amostras insuficientes para o processo de treinamento.

Como os dados anormais nao estao disponıveis durante o processo de treinamento,C pode ser configurado como C = 1 / (N . eSVDD), onde N e o total dos dados detreinamento, eSVDD e o erro na deteccao dados normais, ou seja, a fracao de dadosnormais que pode ser rejeitado. Para a largura do kernel σ, a abordagem de buscaem grade foi utilizada para a selecao de um valor adequado, conforme trabalhadopor [28].

O metodo SVDD tem sido aplicado em diferentes areas como em casos nos quaisocorre o tratamento de dados para extracao de caracterısticas com o objetivo dereduzir a dimensao e aumentar o desempenho na ND [62, 63]

3.6.3 Deteccao de novidades usando abordagem baseada emmapas auto-organizaveis

O Self-Organizing Map (SOM) ou mapas de Kohonen sao um dos exemplos daarquitetura da rede neural artificial introduzido por KOHONEN [64] que pode serinterpretado como uma tecnica de visualizacao, pois pode realizar uma projecao deum espaco multidimensional de entrada para um bidimensional de saıda, criandoassim uma estrutura de mapa.

A localizacao dos pontos na saıda visa refletir as semelhancas entre os objetoscorrespondentes da entrada. Portanto, o SOM permite a visualizacao de relacoesentre objetos em espaco multidimensional.

O metodo fornece um mapeamento nao-linear entre um espaco de dados original dealta dimensao e um mapa bidimensional de neuronios. Os neuronios sao organizadosde acordo com uma grade regular, de tal forma que os vetores semelhantes no espacode entrada sao representados pelos neuronios proximos na grade. Portanto, a tecnicaSOM visualiza as associacoes de dados no espaco de alta dimensao na entrada [65, 66],que pode ser observada na Figura 3.8.

31

Page 49: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

Figura 3.8: Organizacao do mapeamento nao-linear de Kohonen.

Fonte:Adaptado de [64].

Os resultados obtidos pelo metodo SOM em (3.29) sao alcancados minimizandoa seguinte funcao de erro em relacao aos prototipos wr e ws:

e =∑r

∑xµ∈Vr

D(xµ, wr) + k∑r

∑s 6=r

D(xr, ws) (3.29)

onde:

• xµ sao os objetos no espaco de alta dimensao;

• wr e ws sao os prototipos de objetos na grade;

• D(,) e a distancia euclidiana ao quadrado;

• Vr e a regiao de Voronoi correspondente ao prototipo wr.

O numero de prototipos deve ser suficientemente grande para satisfazer a igualdadeD(xµ,ws)=D(xµ,wr) + D(wr,ws)

A funcao de erro SOM pode ser decomposta como a soma de dois erros: quan-tificacao e topologico. O primeiro minimiza a perda de informacao, quando ospadroes de entrada sao representados por um conjunto de prototipos. Ao minimizaro segundo, e assegurada a correlacao maxima entre as desigualdades do prototipoe as distancias de neuronio correspondentes, garantindo assim a visualizacao dasrelacoes de dados no espaco de entrada [35, 66].

A otimizacao de (3.29) e obtida por um metodo iterativo consistindo em duasetapas. Primeiro, um algoritmo de quantificacao que representa cada padrao deentrada pelo prototipo vizinho mais proximo e executado. Esta operacao minimiza oprimeiro componente da Equacao 3.29. Em seguida, os prototipos estao dispostos aolongo da grade dos neuronios, atenuando o segundo componente na funcao de erro[66, 67].

32

Page 50: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

Este problema de otimizacao pode ser solucionado explicitamente com aEquacao 3.30 de adaptacao para qualquer prototipo:

wrs =∑Mr=1

∑xµ∈Vr hrsxµ∑M

r=1∑xµ∈Vr hrs

(3.30)

onde M e o numero de neuronios e hrs e uma funcao de vizinhanca.Por exemplo, o kernel K gaussiano de largura σ(t) que e adaptada em cada

iteracao do algoritmo usando a seguinte regra σ(t) = σi(σf/σi)(t/Niter). Nesse caso σi= M/2 e tipicamente assumido na literatura, e σf e o parametro que determina ograu de suavizacao da curva principal gerada pelo algoritmo SOM [66].

O ”Kohonen SOM” e um SOM estatico com uma estrutura fixa: o tamanho dagrade e o numero de nos devem ser determinados a priori. Isso resulta em umalimitacao significativa no mapeamento final, pois e improvavel que a estrutura maisadequada seja conhecida de antemao.

Antes do treino, os pesos de cada no devem ser inicializados. Normalmente, estesserao definidos para pequenos valores aleatorios padronizados. Os pesos no SOM saoinicializados de modo que 0 < wrs < 1.

Para determinar a melhor unidade de correspondencia, um metodo e iterar atravesde todos os nos e calcular a distancia euclidiana entre o vetor de peso em cada noe o vetor de entrada atual. O no com um vetor de peso mais proximo do vetor deentrada e marcado como o melhor da unidade da maquina BMU (Best Method Unit).

A distancia euclidiana e dada por (3.31):

D =

√√√√i=n∑i=0

(Vi −Wrs(i))2 (3.31)

onde V e o vetor de entrada atual e W e o vetor de peso do no.A cada iteracao, apos a determinacao do BMU, o proximo passo e calcular quais

dos outros nos estao dentro do na vizinhanca da BMU. Todos esses nos terao seusvetores de peso alterados na proxima etapa. Deve-ser calculado o raio da vizinhancapara determinar se cada no esta dentro da distancia radial ou nao [65].

Uma caracterıstica do algoritmo de aprendizagem de Kohonen e que a areada vizinhanca se encolhe ao longo do tempo. Isto e conseguido tornando o raioda vizinhanca menor ao longo do tempo [66]. Para tal, a funcao exponencial dedecaimento expressa em Equacao 3.32 e empregada:

σ(t) = σoexp(−tτ

)t = 1, . . . , n

(3.32)

onde σo e a largura da rede no tempo t0, τ indica uma constante de tempo e t e otempo.

33

Page 51: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

Ao longo do tempo, a vizinhanca ira encolher para o tamanho de um unico no,o BMU, mas tambem o efeito da aprendizagem deve ser proporcional a distanciaentre um no e o BMU. Assim, na vizinhanca do BMU o processo de aprendizagemnao deve ter qualquer efeito. Desse modo, a taxa de aprendizado deve desaparecerem relacao a distancia com um comportamento gaussiana. Ao ser determinado oraio, as iteracoes atraves de todos os nos na rede servirao para determinar se elesencontram-se no raio ou nao. Se um no for encontrado dentro da vizinhanca, e ditonormal e seu vetor de peso e ajustado pela Equacao 3.33:

W (t+ 1) = W (t) + Θ(t)η(t)(V (t)−W (t) (3.33)

onde η(t) e a taxa de aprendizado que decai com o tempo calculada a cada iteracaousando a Equacao 3.34, e Θ(t) para representar a quantidade de influencia que adistancia de um no da BMU tem em sua aprendizagem com a Equacao 3.35:

η(t) = η(0)exp(−tτ

), t = 1, . . . , n (3.34)

Θ(t) = exp

(−D2

2σ2(t)

), t = 1, . . . , n (3.35)

34

Page 52: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

Capıtulo 4

Metodologia dos ensaios

Neste trabalho foi verificada a aplicacao das tecnicas para deteccao de novidadesas assinaturas obtidas dos tres experimentos de inspecao por ultrassom escolhidosem funcao da aplicacao pratica das tecnicas e novas metodologias de analise paraa identificacao e classificacao dos defeitos associados as condicoes dos materiais.A realizacao dos experimentos ocorreu em parceria com o Grupo de Pesquisas emEnsaios Nao-Destrutivos (GPEND) no Instituto Federal da Bahia - Campus Salvador.Este capıtulo aborda os experimentos executados, assim como, a sistematizacaoaplicada para verificacao dos resultados.

4.1 Experimento 1 - Solda

O corpo de prova (CP) (ver Figura 4.2) inspecionado e composto de duas chapasde aco carbono SAE1020 com dimensoes 1000x500x15,5 mm unidas utilizandouma combinacao das tecnicas arco eletrico TIG, MIG e eletrodo revestido. Foramidentificadas atraves de exame radiografico as condicoes subsequentes ao longo docordao de solda (ver Figura 4.1):

• Sem defeito (SD);

• Falta de Fusao (FF): falha observada quando nao ha fusao entre o metal dasolda e as superfıcies da placa base. Nıvel de corrente muito baixa, velocidadede soldagem muito alta, angulo de inclinacao da tocha incorreto, presenca dapelıcula de oxido na superfıcie, limpeza inadequada das juntas e preparacao desolda muito estreita sao algumas das causas.

• Falta de Penetracao/Trinca (FPTC); defeito que ocorre quando a solda naopenetra a espessura inteira do metal base. As causas sao bem similares aocorrencia da falta de fusao;

35

Page 53: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

• Inclusao de Escoria (IE): indica a presenca de material solido estranho quepode ser metalico ou nao;

• Porosidade (PO): e a contaminacao da solda sob a forma de um gas preso eque e liberado a medida que a solidificacao ocorre, afetando negativamente ocordao de solda.

Figura 4.1: Tipos de defeitos usualmente observados em soldas.

Fonte: Elaborado pelo autor.

Figura 4.2: Corpo de prova soldado com a presenca de defeitos internos inseridos demodo controlado durante a soldagem.

Fonte: Elaborado pelo autor.

36

Page 54: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

O ensaio TOFD foi executado atraves de varredura manual, com um passo de 5mm entre cada sinal utilizando os equipamentos a seguir:

• Transdutores Olympus Panametrics® C543-SM, sapata acrılica com angulo deincidencia igual a 45o, frequencia central 5 MHz, tamanho do cristal 3 mm, ecomprimento de onda λ igual a 648 µm.;

• Gerador de pulsos Olympus Panametrics® modelo 5077PR, responsavel pelaexcitacao de um trem de pulsos de onda quadrada com tensao de 5 V e ganhode 10 dB, em que os transdutores de transmissao e recepcao foram conectados;

• Osciloscopio digital Tektronix® modelo TDS 2024B com frequencia de amos-tragem ajustada a 250 MHz

A comunicacao com o osciloscopio foi realizada atraves de uma porta USB2.0por um computador com uma interface utilizando o software LabVIEW® . Emseguida, os sinais foram armazenados em plataforma desktop para armazenamento eprocessamento dos sinais, de acordo com a ilustracao da Figura 4.3. Cada assinaturacoletada foi digitalizada com 2500 componentes.

Figura 4.3: Esquema da realizacao do experimento 01 e coleta das amostras.

Fonte: Elaborado pelo autor.

4.2 Experimento 2 - Pas de Aerogeradores

Para a inspecao do sistema eolico, o ensaio visual pode detectar alguns defeitos,tais como alteracao na cor das superfıcies dos componentes, que podem indicarvariacoes de temperatura ou deterioracao, e o som proveniente dos rolamentos podeindicar deformacao da condicao fısica [68, 69].

37

Page 55: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

Contudo, muitas das falhas mais tıpicas, como rachaduras e rugosidades nassuperfıcies das pas, curtos-circuitos eletricos no gerador e superaquecimento da caixamultiplicadora de velocidades de um aerogerador, exigem uma abordagem maissofisticada para a manutencao [70].

O ensaio ultrassonico pulso-eco Bubbler com os aerogeradores utilizou tres corposde prova retirados das pas de uma turbina eolica constituıdos de uma camada commadeira de balsa medindo 10 mm de espessura, recoberta por uma fibra de vidro emmatriz de polımeros, conforme o esquema na Figura 4.4.

Figura 4.4: Madeira de balsa utilizada nas pas de aerogeradores.

Fonte: Adaptado de [71].

Os tres corpos de prova apresentam regioes sem falha (SF) e a sinalizacao dedois defeitos do tipo delaminacao (descolamento entre a fibra e o nucleo) e matrizseca (ausencia de fibra) [72], respectivamente identificados como DL1, DL2, MS3. ATabela 4.1 revela as dimensoes dos CP com a espessura da camada de fibra, conformeindicado na Figura 4.5.

Tabela 4.1: Dimensoes dos corpos de prova extraıdo de aerogeradores

Corpo de Prova Espessura (mm) Comprimento (mm) Largura (mm)

DL1 - Delaminacao 5,1 229 201DL2 - Delaminacao 5,1 226 226MS3 - Matriz Seca 4,9 224 216

38

Page 56: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

Figura 4.5: Localizacao da regiao dos defeitos nos corpos de prova do experimento 2

(a) DL1 (b) DL2 (c) MS3

Fonte: Elaborado pelo autor.

O ensaio utilizou um transdutor Olympus Panametrics® V303, com frequenciacentral de 1 MHz, tamanho do cristal 13mm conectado ao gerador de pulsos OlympusPanametrics® modelo 5077PR configurado com os mesmos parametros de formade onda e excitacao para o experimento 1, cuja forma de onda era observada edigitalizada num osciloscopio digital Tektronix® modelo TDS 2024B com frequenciade amostragem ajustada a 500MHz.

O Bubbler foi construıdo com altura suficiente para que a coluna d’agua defi-nida para o experimento fosse igual a medida do campo proximo N do transdutorselecionado, com o proposito de evitar interferencias acusticas.

A varredura ultrassonica ocorreu em modo manual, com uma malha deespacamento igual a 5mm entre cada ponto sobre as regioes defeituosas e semdefeito, sendo adquiridas 100 assinaturas com 2500 componentes cada para os danosobservados. A Figura 4.6 exemplifica o ensaio praticado.

Figura 4.6: Esquema da realizacao do experimento 02 e coleta das amostras.

Fonte: Elaborado pelo autor.

39

Page 57: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

4.3 Experimento 3 - Tubos de Fornos de Pirolise

Os fornos de pirolise sao equipamentos indicados para a producao de hidrocarbo-netos na industria petroquımica, cujos tubos que constituem as serpentinas dessasmaquinas estao submetidos a temperaturas superiores a 1000o C.

Durante a reacao quımica no interior das serpentinas nos fornos de pirolise,carbono sob a forma de gas e liberado e provoca danos a parede interna do tubo,denominados carburizacao [73].

Em virtude desse fenomeno, tubos de aco inoxidavel comecaram a ser utilizadosdevido as suas caracterısticas de resistencia ao trabalho em elevadas temperaturase menor espessura. Portanto, a importancia em definir o momento ideal para asubstituicao desses tubos das serpentinas com base no grau da carburizacao recorrendoa ensaios nao-destrutivos tem sido alvo de pesquisas recentes [73].

Neste experimento, foram disponibilizadas 03 amostras de tubos em aco inoxidavelda famılia HP40 retiradas durante servico de um mesmo forno de pirolise, aposdiferentes tempos de operacao. A Tabela 4.2 expoe as dimensoes dos corpos de provamostrados na Figura 4.7.

Tabela 4.2: Dimensoes dos corpos de prova dos tubos de aco inoxidavel da classe HP

Corpo de Prova Diametro externo (mm) Diametro interno (mm)

SCB - Sem Carburizacao 7,9 6,19BCB - Baixa Carburizacao 7,2 6,2ACB - Alta Carburizacao 7,0 6,19

Figura 4.7: Amostras de tubos utilizados no experimento.

Fonte: Elaborado pelo autor.

40

Page 58: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

O ensaio ultrassonico por imersao convencional foi executado com os mesmosequipamentos da Secao 4.2, submergindo os corpos de prova em um tanque comagua, e a taxa de amostragem definida para o osciloscopio igual a 250MHz, coletando200 assinaturas com 2500 componentes cada para as regioes de interesse, conformeilustrado pela Figura 4.8.

Figura 4.8: Esquema da realizacao do experimento 03 e coleta das amostras.

Fonte: Elaborado pelo autor.

4.4 Cadeia de Processamento de Sinais Proposta

As tecnicas de processamento digital de sinais sao ferramentas de grande aplicacaona extracao de caracterısticas e classificacao de sinais ultrassonicos dado que ainterpretacao dos resultados de amplitude no domınio do tempo e, em muitos casos,difıcil.

Apos a normalizacao indicada para a classificacao utilizando deteccao de novidadesapontada no trabalho de CLIFTON e TARASSENKO [21], a filtragem do ruıdo ereconstrucao dos sinais ultrassonicos atraves da Transformada wavelet Discreta foirealizada selecionando a famılia Daubechies, ate o 3 nıvel de aproximacao, conformeapontado pelo estudo de ADAMO et al. [30].

Em seguida, a execucao da analise do espectro de frequencia utilizou a amplitudedas assinaturas com a realizacao da FFT, resultando em 2048 coeficientes espectrais.

A selecao de caracterısticas com o PCA foi executada usando o algoritmo FastICA.Esse metodo e largamente conhecido pela eficiencia da implementacao do algoritmofast-fixed point voltado para a analise de componentes independentes. Contudo,

41

Page 59: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

a selecao dos parametros de autovalor e a definicao do numero dos componentesprincipais foi adotada para a projecao desejada que descreve o conjunto de assinaturas,preservando a parcela relevante da informacao original.

Neste sentido, a compactacao dos dados e um processo valioso, pois a analise deuma grande quantidade de informacao reduziria a eficiencia do sistema. A Tabela 4.3apresenta o tamanho das bases de dados obtidas para os detectores de novidadeconstruıdos.

Tabela 4.3: Bases de dados usadas nos experimentos de deteccao de novidade

Experimento# ClassesNovidade

# Assinaturas Normais # Assinaturas Novidades

Treinamento Validacao Teste Validacao Teste

Solda 4 120 40 40 100 100Pas de

Aerogeradores3 60 20 20 50 50

Tubos deFornos de Pirolise

2 120 40 40 40 40

A validacao cruzada foi empregada atraves do k-Fold para a construcao de 10subconjuntos de dados. A cada sorteio de um conjunto, 50 inicializacoes foramexecutadas, entre as quais os melhores resultados foram destacados.

O objetivo deste procedimento e garantir a amostragem aleatoria estratificada,evitando-se que um determinado conjunto de amostras interfira na independenciaestatıstica da resposta de treinamento dos metodos.

O treinamento foi realizado integralmente com o software MATLAB® usandoalgoritmos proprios adequados aos metodos RNA, SVM e a implementacao dasquatro abordagens para deteccao de novidades, com todas as etapas cumpridas nomesmo computador.

O procedimento proposto para a deteccao de novidades pode operar em paralelocom um classificador tradicional, se ja existirem classes conhecidas para o problemaem questao. O diagrama de blocos da Figura 4.9 ilustra a sequencia de etapas.

42

Page 60: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

Figura 4.9: Etapas do sistema de tomada de decisao.

A aplicacao dos classificadores multiclasse utilizaram os seguintes parametros:

• RNA: algoritmo Levenberg-Marquardt backpropagation com 5 neuronios nacamada oculta, funcao de ativacao tangente sigmoide tansig, erro=10−6;

• SVM: construcao dos vetores de suporte usando kernel RBF com o valor (σ; ν)otimo para os casos.

As abordagens para deteccao de novidades foram implementadas seguindo oscriterios estabelecidos na Secao 3.5, listados a seguir:

• distancia: limiar de partida com raio a = 1, selecionado empiricamente a fimde permitir alguma area fora dos dados de treino normais para ser incluıdodentro do limite de normalidade;

• k-means: Numero de agrumapentos K = 3 e raio r = 10, com a construcao deum limiar local definido iterativamente para cada cluster.

• SVDD : (σ;C)=(1,50;0,10) para a construcao da hiperesfera que delimitara asclasses normais e a identificacao das novidades.

• metodo SOM: partindo de 2 classes desconhecidas reduzindo linearmente para1 sobre as primeiras 50 iteracoes, enquanto os pesos sao ajustados apos cadapadrao. A taxa de aprendizado e reduzida linearmente de 0,9 para 0,05. Nafase de convergencia do metodo, a aprendizagem apenas atualiza o no vencedore a taxa de aprendizado e reduzida de 0,05 para 0,01 em mais de 400 iteracoes.

43

Page 61: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

4.5 Representacao dos resultados

De acordo com a revisao bibliografica, a avaliacao do desempenho das abordagensda deteccao de novidades utilizadas na literatura atual pode ser realizada atraves dacurva ROC, o respectivo valor da Area sob a Curva (AUC), entre outras metricasestatısticas, incluindo eficiencia media, mediana, bem como a execucao do testepareado de Wilcoxon [28, 38, 40].

O objetivo essencial da deteccao de novidades e maximizar a sua sensibilidademinimizando a taxa de falsos positivos [74]. Assim, devem ser avaliados os seguintesparametros, conforme a matriz de confusao MC da Tabela 4.4:

• Taxa de Verdadeiros Positivos TPr (True Positive Rate) ou sensibilidade:Probabilidade de deteccao que define quantos resultados positivos corretos, TP,ocorrem entre todas as amostras positivas, NP=TP+FP, disponıveis durante oteste, conforme definido em (4.1).

TPr = Σ TP

NP(4.1)

• Taxa de Falsos Positivos FPr (False Positive Rate): Probabilidade de deteccaoque define quantos resultados incorretamente classificados como positivos, FP,ocorrem entre todas as amostras negativas, NF=FN+TN, disponıveis duranteo teste, de acordo com a Equacao 4.2.

FPr = Σ FP

NF(4.2)

• Taxa de Falso Negativo (FNr - False Negative Rate): E a probabilidade deum resultado positivo dado que um evento desta classe nao esteja presente.Portanto, FNr = 1 - TPr.

• Taxa de Verdadeiro Negativo ou especificidade (TNr - True Negative Rate): Pro-babilidade de medir a proporcao de eventos negativos corretamente identificadoscomo tal. Desse modo, TNr = 1 - FPr.

Tabela 4.4: Matriz de confusao tıpica para o total de amostras avaliadas com adeteccao de novidades

ClasseObservada

Classe Prevista

Condicao Positiva Condicao Negativa

Observacao Positiva TP FPObservacao Negativa FN TN

44

Page 62: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

A acuracia para um detector de novidades tambem e importante, uma vez querepresenta o grau de acerto e exclusao das amostras comparadas com o seu valorverdadeiro, calculada pela Equacao 4.3.

Acuracia =∑TP +∑

TN∑Total das amostras (4.3)

A curva ROC (Receiver Operation Characteristic) e uma figura de merito paraa visualizacao, avaliacao e selecao de classificadores binarios. A tecnica baseia-sena construcao grafica de coordenadas no qual a taxa de verdadeiros positivos eassociada ao eixo das ordenadas e a taxa de falsos positivos ao eixo das abscissas ousensibilidade versus (1-especificidade) [75].

A curva ROC ideal se assemelha a um degrau. A area sob curva ROC (AUC)ilustrada na Figura 4.10 e uma apresentacao quantitativa integrada que mede adiscriminacao dessa figura estatıstica e, portanto, esse valor pode ser utilizado comouma medida de qualidade para um detector de novidades.

Figura 4.10: Exemplos de possıveis comportamentos da curva ROC e AUC.

A fim de comparar diretamente diferentes curvas ROC mais facilmente, umunico indicador de desempenho da AUC pode resumir o comportamento da curva[28]. Quanto maior o valor AUC, melhor o desempenho do detector de novidades.Portanto, o valor de AUC calculado sera empregado para medir o desempenho dosquatro detectores de novidade selecionados para avaliacao [60].

Outra abordagem estatıstica de comparacao do comportamento daacuracia/eficiencia dos treinamentos executados e embasada no uso dos diagra-mas de caixa (boxplot). Boxplots graficamente retratam grupos de dados numericoslidando com cinco quantidades [76]:

45

Page 63: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

• Mınimo: menor valor da observacao;

• Maximo: maior valor da observacao;

• Quartis (Q1, Q2, Q3): Sao valores dados a partir do conjunto de observacoesordenado em ordem crescente, que dividem a distribuicao em quatro partesiguais.

Dado n como o numero total de elementos da amostra, Qj sera um elementoentre Xk e Xk+1, calculado a partir da Equacao 4.4:

Qj = Xk +(j(n + 1)

4 − k)

(Xk+1 −Xk)

onde k=(j(n + 1)

4

)para j=1,2,3.

(4.4)

O primeiro quartil, Q1, e o numero que limita 25% das observacoes abaixo e 75%acima, enquanto que o terceiro quartil, Q3, delimita 75% das observacoes abaixo e25% acima. Ja Q2 e a mediana, 50% das observacoes.

Os valores de limite inferior e superior podem ser calculados utilizando aEquacao 4.5 e a Equacao 4.6:

Limite inferior = Q1 − 1, 5.(Q3 −Q1) (4.5)Limite superior = Q3 + 1, 5.(Q3 −Q1) (4.6)

Nesta situacao, os valores alem destes limites sao encarados como discrepantes eassinalados por asterisco exibidos pela Figura 4.11.

Figura 4.11: Metodo para descricao estatıstica de dados boxplot.

46

Page 64: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

Dado que a revisao bibliografica aponta que o tamanho do conjunto de dadospode afetar o desempenho dos detectores, uma etapa de treinamento foi realizadapara avaliar os mesmos quatro detectores representativos em diferentes tamanhos doconjunto de dados, a fim de justificar a selecao da PCA.

Foram construıdos conjuntos de dados normais para treinamento de 2, 50, 100,150, 200 e 2048 componentes principais respectivamente para os tres experimentos.Este salto na dimensao dos conjuntos foi empregada em funcao da forte correlacaodos sinais verificada durante a aplicacao da PCA, o que levou ao truncamento doespectro fazendo que o total de coeficientes (2048) fosse o ultimo nıvel de analise.

Os parametros em cada detector sao sintonizados da mesma maneira que noconjunto de experimentos principal e os mesmos limiares sao definidos para calcularos valores da AUC.

Alem dessas ferramentas, o teste de classificacao Wilcoxon pareado foi aplicadoaos resultados de AUC obtidos para os tres experimentos descritos, a fim de avaliaro desempenho geral e relativo dos metodos utilizados para a deteccao das novidades.

O teste de classificacao Wilcoxon e um teste nao parametrico para duas populacoes,quando as observacoes sao emparelhadas [77]. O problema das hipoteses e asrespectivas condicoes sao apresentadas na Equacao 4.7:

H0 : ∆ < 0, 05H1 : Aceito

H0 : ∆ > 0, 05H1 : Rejeitado

(4.7)

Neste caso, e testada a hipotese nula de que os dados das duas populacoes saoamostras de distribuicoes contınuas com medianas iguais, contra a alternativa quenao sao. O teste pressupoe que as duas amostras sao independentes. Alem disso, ocomprimento pode ser diferente entre as amostras.

Para todos os resultados de desempenho dos detectores de novidades utilizandoa AUC apresentadas no Capıtulo 5, foi realizado o teste de Wilcoxon com nıvel designificancia igual a 0,05. Ambos os resultados do teste de hipotese h e p foramlistados. Valores de h = 1 indicam uma rejeicao da hipotese nula no nıvel designificancia igual a 0,05 e h = 0 indica uma falha na rejeicao da hipotese nula no0,05 nıvel de significancia.

47

Page 65: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

Capıtulo 5

Resultados e Discussoes

Este capıtulo discute cada um dos experimentos executados individualmente comrelacao as etapas apresentadas na cadeia de processamento proposta na Secao 4.4 eos resultados obtidos atraves das metricas definidas na Secao 4.5

5.1 Solda - Experimento 1

5.1.1 Processamento de Sinais

Apos coleta das amostras e normalizacao, a etapa do processamento digital desinais teve inıcio com a filtragem atraves da transformada discreta wavelet conformeexibido na Figura 5.1. A janela temporal apresentada contempla o tempo deamostragem para que a amostra coletada englobasse desde a reflexao superficial ateo eco de fundo e as possıveis difracoes associadas com os defeitos sinalizados peloraio-x.

E possıvel notar que a analise no domınio do tempo possui um traco caracterısticointrınseca para os sinais considerados tıpicos de cada um dos defeitos associados aocorpo de prova soldado do experimento 1. Por exemplo, a Figura 5.1a, associada acondicao sem defeito, destaca uma amplitude de reflexao do eco de fundo superior asdemais condicoes que apresentam diversas reflexoes para o tempo de amostragemda amostra coletada. Isso permite tomar como ponto de partida ao longo do ensaio,mas requer novamente a capacitacao do inspetor responsavel para caracterizar asoutras condicoes.

Desse modo, seguindo a cadeia de implementacao indicada na Figura 4.9 oresultado da FFT permitiu avaliar o especto de frequencia para cada assinaturade classe do corpo de prova. Os sinais normalizados tıpicos sao apresentados naFigura 5.2.

Pode-se observar algumas caracterısticas particulares de cada classe de interesse,como o maior espalhamento espectral dos sinais tıpicos da falta de penetracao/trinca.

48

Page 66: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

Figura 5.1: Sinal tıpico no domınio do tempo apos a DWT Famılia Daubechie de 3o

nıvel para as diferentes classes de interesse existentes na Solda.

(a) Sem Defeito

(b) Falta de Fusao (c) Falta de Penetracao/Trinca

(d) Inclusao de Escoria (e) Porosidade

49

Page 67: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

Figura 5.2: Espectros de frequencia tıpicos das classes observadas na solda.

(a) Sem Defeito

(b) Falta de Fusao (c) Falta de Penetracao/Trinca

(d) Inclusao de Escoria (e) Porosidade

50

Page 68: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

5.1.2 Detectores de Novidade

Apos a aplicacao da FFT para obter o espectro de frequencia dos sinais ul-trassonicos, foi realizada a reducao de dimensionalidade com a PCA para assegurara maior parte da energia associada ao conjunto de sinais.

Essa etapa foi implementada principalmente para evitar que o tamanho doconjunto de dados afete o desempenho dos detectores, dado que estudos preliminaresna literatura apontam uma grande variacao de desempenho entre os metodos quandoo tamanho dos dados de treinamento e pequeno.

O melhor resultado das assinaturas para as classes de solda ocorreu com alimitacao de 200 componentes principais dos 2048 coeficientes da FFT disponıveis.Em seguida, teve inıcio a tarefa de classificacao utilizando as abordagens com adeteccao de novidades.

Os mapas de treinamento tıpicos foram construıdos para representar a distribuicaobidimensional das amostras utilizadas no modelo, sinalizando a regiao limıtrofe paraa classificacao das amostras de novidade, mostradas na Figura 5.3, referentes aabordagem baseada em distancia cujos resultados para a identificacao das novidadesassociadas a Falta de Fusao (Figura 5.3a) e Inclusao de Escoria (Figura 5.3c)apresentaram uma eficiencia global superior as condicoes Porosidade (Figura 5.3d) eFalta de Penetracao/Trinca (Figura 5.3b).

As sinalizacoes em preto e azul indicam a classe normal utilizada para o trei-namento e teste respectivamente, separada por um limiar tracejado das diferentescondicoes anormais sinalizadas em vermelho para cada metodo de ND.

A classe Falta de Fusao apresenta-se sem sobreposicao espacial, com a indicacaode elevada sensibilidade e acuracia na classificacao e pequena especificidade; enquantoque a classe Inclusao de Escoria exibe um pequeno registro associado a taxa de falsospositivos.

A decisao de contorno para as classes Porosidade e Falta de Penetracao/Trinca,classes com menor acuracia, indica que o comportamento da primeira classe tem umabaixa dispersao espacial em torno do limiar de novidade, sugerindo que a dimensaodo defeito pode ser confundida com um estado normal da solda.

A analise da classe FPTC sugere uma investigacao maior no comportamento dosinal em virtude da taxa de falsos negativos ter sido maior que as demais condicoesexploradas durante o teste do detector.

A heterogeneidade na presenca dos defeitos simulados para o corpo de provasoldado resultou na imprecisao associada com a regiao das assinaturas da classePorosidade, devido a existencia de assinaturas normais. Para o caso da Falta dePenetracao/Trinca, o efeito aponta para uma configuracao de novos outliers, semrelacao com a condicao normal.

51

Page 69: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

Figura 5.3: Mapas de treinamento do metodo ND DIST para base de dados Solda.

(a) Falta de Fusao

Amostras

0 20 40 60 80 100 120

SaıdaND

0.8

1

1.2

1.4

1.6

1.8

2dist

Treino

Validacao

Teste

Limiar

(b) Falta de Penetracao/Trinca

Amostras

0 20 40 60 80 100 120

SaıdaND

0.65

0.7

0.75

0.8

0.85

0.9

0.95

1

1.05

1.1dist

Treino

Validacao

Teste

Limiar

(c) Inclusao de Escoria

Amostras

0 20 40 60 80 100 120

SaıdaND

0.6

0.7

0.8

0.9

1

1.1

1.2

1.3dist

Treino

Validacao

Teste

Limiar

(d) Porosidade

Amostras

0 20 40 60 80 100 120

SaıdaND

0.5

0.6

0.7

0.8

0.9

1

1.1dist

Treino

Validacao

Teste

Limiar

A Figura 5.4 mostra o comportamento dos mapas associados a abordagemutilizando o k-means. A distribuicao espacial das novidades para o numero de clustersaponta que a identificacao das novidades para as classes Falta de Fusao e Inclusaode Escoria, observadas nas Figuras 5.4a e 5.4c respectivamente, tambem alcancaramuma eficiencia global superior as condicoes Porosidade e Falta de Penetracao/Trinca,exibidas nesta ordem nas Figuras 5.4d e 5.4b. Ou seja, o resultado alcancado esimilar a abordagem usando o metodo baseado em distancia.

Contudo, a taxa de falsos negativos com o numero de novidades para as classesPorosidade e Falta de Penetracao/Trinca e maior, devido a condicao associada com alocalizacao e a geometria dos defeitos apontados pela analise da solda na Figura 4.2,gerando outros tipos de outliers.

52

Page 70: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

Figura 5.4: Mapas de treinamento do metodo ND k-means para base de dados Solda.

(a) Falta de Fusao

Amostras

0 20 40 60 80 100 120

SaıdaND

0.8

1

1.2

1.4

1.6

1.8

2

2.2kmeans

Treino

Validacao

Teste

Limiar

(b) Falta de Penetracao/Trinca

Amostras

0 20 40 60 80 100 120

SaıdaND

0

0.2

0.4

0.6

0.8

1

1.2kmeans

Treino

Validacao

Teste

Limiar

(c) Inclusao de Escoria

Amostras

0 20 40 60 80 100 120

SaıdaND

0

0.5

1

1.5kmeans

Treino

Validacao

Teste

Limiar

(d) Porosidade

Amostras

0 20 40 60 80 100 120

SaıdaND

0.5

0.6

0.7

0.8

0.9

1

1.1kmeans

Treino

Validacao

Teste

Limiar

A Figura 5.5 revela a saıda do mapa de treinamento para a abordagem empregandoos mapas auto-organizaveis. Inicialmente, pode-se depreender que a eficiencia dessemetodo e inferior as abordagens k-means e baseada em distancia.

A analise exclusiva dos mapas aponta que para a classe Falta de Penetracao/Trinca,alem do incremento na taxa de falso positivo observada, as assinaturas usadas navalidacao tambem colaboraram para um acrescimo da taxa de falso negativo.

Mais uma vez o mapa relacionado a classe Falta de Fusao exposto na Figura 5.5aaponta que o detector construıdo identificou integralmente de maneira correta asamostras valendo-se dessa abordagem, seguido em termos de eficiencia pelas classesInclusao de Escoria (Figura 5.5c), Porosidade e Falta de Penetracao/Trinca, cujosmapas sao exibidos nas Figuras 5.5d e 5.5b.

53

Page 71: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

Figura 5.5: Mapas de treinamento obtidos com o metodo de ND SOM para base dedados Solda.

(a) Falta de Fusao

Amostras

0 20 40 60 80 100 120

SaıdaND

200

400

600

800

1000

1200

1400

1600

1800som

Treino

Validacao

Teste

Limiar

(b) Falta de Penetracao/Trinca

Amostras

0 20 40 60 80 100 120

SaıdaND

150

200

250

300

350

400

450

500som

Treino

Validacao

Teste

Limiar

(c) Inclusao de Escoria

Amostras

0 20 40 60 80 100 120

SaıdaND

200

300

400

500

600

700

800

900som

Treino

Validacao

Teste

Limiar

(d) Porosidade

Amostras

0 20 40 60 80 100 120

SaıdaND

100

150

200

250

300

350

400

450

500som

Treino

Validacao

Teste

Limiar

A Figura 5.6 exibe o comportamento das assinaturas apos a abordagem deconstrucao de domınio usando a maquina de vetor de descricao de dados. Verifica-seque o detector de novidades estabeleceu um modelo coerente, cuja eficiencia naidentificacao das amostras de novidade para as classes Falta de Fusao (Figura 5.6a) eInclusao de Escoria (Figura 5.6c) tiveram melhor resultado comparado com as falhasFalta de Penetracao/Trinca e Porosidade, retratados nas Figuras 5.6b e 5.6d.

54

Page 72: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

Figura 5.6: Mapas de treinamento obtidos com o metodo de ND SVDD para base dedados Solda.

(a) Falta de Fusao

Amostras

0 20 40 60 80 100 120

SaıdaND

0.45

0.5

0.55

0.6

0.65

0.7

0.75

0.8

0.85

0.9svmtax

Treino

Validacao

Teste

Limiar

(b) Falta de Penetracao/Trinca

Amostras

0 20 40 60 80 100 120

SaıdaND

0.35

0.4

0.45

0.5

0.55svmtax

Treino

Validacao

Teste

Limiar

(c) Inclusao de Escoria

Amostras

0 20 40 60 80 100 120

SaıdaND

0.4

0.45

0.5

0.55

0.6

0.65

0.7svmtax

Treino

Validacao

Teste

Limiar

(d) Porosidade

Amostras

0 20 40 60 80 100 120

SaıdaND

0.25

0.3

0.35

0.4

0.45

0.5

0.55svmtax

Treino

Validacao

Teste

Limiar

As Tabelas 5.1 e 5.2 apresentam o produto medio dos melhores resultadosalcancados de eficiencia dos classificadores multiclasse e da acuracia dos detectoresde novidade selecionados, respectivamente, para o experimento em questao.

A comparacao direta entre as eficiencias alcancadas mostra que rede neuralartificial e a SVM com kernel rbf sao equivalentes com um valor pouco superior deeficiencia em todas as classes apresentadas para o algoritmo da RNA.

Para as abordagens da deteccao de novidades foi destacado em negrito o maiorvalor do produto da acuracia media para cada classe. Como destacado pelos mapas,a deteccao alcancada atraves dos metodos baseado em distancia e k-means tiverammelhor desempenho, sobressaindo-se sobre as abordagens SVDD e SOM.

55

Page 73: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

Tabela 5.1: Eficiencia percentual dos metodos multiclasse para o experimento 1

ExperimentoClasse

DetectadaClassificadores

RNA bcp SVM kernel

Solda

SD 98,97 94,00FF 100,00 90,00

FPTC 97,91 97,00IE 99,01 96,00PO 94,97 95,00

Tabela 5.2: Acuracia percentual dos metodos de deteccao de novidades para oexperimento 1

ExperimentoClasse

DetectadaMetodos de ND

Dist k-means SVDD SOM

Solda

FF 99,21±0,41 98,93±0,69 89,15±3,57 72,35±0,89FPTC 71,00±4,59 72,72±4,49 56,11±4,34 53,03±2,97

IE 97,86±0,00 97,64±0,67 84,07±3,41 71,14±0,83PO 59,41±10,23 65,24±8,86 70,06±1,32 69,98±1,38

Para cada abordagem da deteccao de novidade, a avaliacao da performanceresultou na construcao da Figura 5.7 com os graficos boxplot dos melhores resultadosde cada subconjunto treinado.

Os resultados para a abordagem baseada em distancia apontam elevada eficienciamedia de deteccao com baixa dispersao para as classe Falta de Fusao e Inclusao deEscoria, uma eficiencia razoavel preservando a dispersao baixa com relacao a classeFalta de Penetracao/Trinca, e uma elevada dispersao com eficiencia media razoavel.

O metodo k-means tem um comportamento similar a abordagem baseada emdistancia para distribuicao das eficiencias medias de deteccao das novidades associadasas classes do experimento solda.

Os metodos SOM e SVDD mostraram consistencia equivalente, com baixa dis-persao da eficiencia obtida entre os subconjuntos treinados para as classes Faltade Fusao, Inclusao de Escoria e Porosidade, alem de uma dispersao maior comeficiencia media inferior as demais condicoes de novidade para a classe Falta dePenetracao/Trinca.

Entretanto, os valores medios para acuracia dos detectores baseados em mapasauto-organizaveis e maquina de vetor com descricao de dados foram inferiores emtermos absolutos comparados com as abordagens baseada em distancia e o k-means.

56

Page 74: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

Figura 5.7: Boxplot do produto medio da acuracia dos detectores de novidade parabase de dados Solda.

A Figura 5.8 aponta o comportamento do melhor resultado para ROC alcancadoentre os quatro metodos de treinamento para deteccao da classe novidade investi-gada. Novamente, as classes Falta de Fusao e Inclusao de Escoria apresentaram umcomportamento quase ideal. Essa condicao implica em uma baixa taxa de falsospositivos (maior especificidade) e tambem uma alta taxa de verdadeiros positivos(maior sensibilidade) para as metodologias aplicadas.

A ROC calculada para a classe Porosidade apresenta uma curvatura em que ataxa de verdadeiros positivos cresce mais lentamente quando a taxa de falsos positivosatinge 10% e segue de forma irregular ate 60% de FPr.

Com relacao a classe Falta de Penetracao/Trinca, o crescimento da taxa deverdadeiros positivos se desloca ao alcancar 20% e, depois atingir 50%, tem sua taxade variacao reduzida para uma faixa de falsos positivos entre 10% e 95%. Assim,verifica-se uma acuracia media baixa como observada anteriormente pelos graficosboxplot.

A Tabela 5.3 reune os valores maximos alcancados para a AUC das curvas ROCapresentadas na Figura 5.8. Em negrito foram apontadas as melhores condicoespara as classes Falta de Fusao e Inclusao de Escoria com a abordagem baseada emdistancia e o SOM para Falta de Penetracao/Trinca e Porosidade

57

Page 75: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

Figura 5.8: ROC construıda utilizando base de dados Solda.

(a) Falta de Fusao (b) Falta de Penetracao/Trinca

(c) Inclusao de Escoria (d) Porosidade

Tabela 5.3: AUC percentual calculado para o experimento 1

ExperimentoClasse

DetectadaAUC dos Metodos de ND

Dist k-means SVDD SOM

Solda

FF 97,09±0,31 97,09±0,31 97,09±0,31 97,09±0,31FPTC 70,96±2,26 70,86±2,46 70,75±2,57 71,27±2,05

IE 97,19±1,03 97,19±1,03 96,99±1,15 97,19±1,03PO 76,36±4,79 74,40±4,01 75,87±4,44 76,53±5,21

A Figura 5.9 apresenta o comportamento do resultado da AUC com relacaoa dimensionalidade do conjunto de dados em escala logarıtmica utilizada para aconstrucao e treinamento dos quatro metodos da deteccao de novidades estudadospara o experimento da inspecao nao destrutiva da junta soldada.

Nota-se a justificativa pela escolha do conjunto com aproximadamente 100%dos componentes principais associados com as assinaturas das classes de solda emtorno de 200 pontos. Alem disso, o metodo de mapas auto-organizaveis se mostra

58

Page 76: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

mais sensıvel a variacao da dimensionalidade do conjunto de treinamento e teste,seguido pela abordagem k-means. Os metodos baseado em distancia e SVDD saomais estaveis para uma dimensionalidade menor dos padroes utilizados.

Figura 5.9: AUC percentual variando com o tamanho dos componentes principaispara o experimento 1.

(a) Falta de Fusao (b) Falta de Penetracao/Trinca

(c) Inclusao de Escoria (d) Porosidade

59

Page 77: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

5.2 Pas de Aerogeradores - Experimento 2

5.2.1 Processamento de Sinais

A Figura 5.10 reune os A-Scans tıpicos para a regiao sem defeito e os tres tiposde defeitos encontrados nos CP retirados das pas de aerogeradores. Foi definidauma janela de tempo que englobasse somente a primeira reflexao apos a colunad’agua definida para o transdutor utilizado. E notavel a dificuldade de interpretacaodos padroes para o reconhecimento das classes associadas aos danos observados emqualquer condicao.

Figura 5.10: Sinal tıpico no domınio do tempo apos a DWT Famılia Daubechie 3o

nıvel para as classes existentes nas pas de aerogeradores.

(a) Sem Falha (b) Delaminacao 1

(c) Delaminacao 2 (d) Matriz Seca 3

A Figura 5.11 permite examinar a faixa de frequencia em que o conjunto de dadose melhor caracterizado por suas instancias. De forma inicial, e observado que paraa condicao sem defeito (Figura 5.11a), a energia associada ao especto situa-se emtorno da frequencia central de 1MHz.

60

Page 78: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

Com relacao as diferentes condicoes de defeito, a classe DL1, observada naFigura 5.11b, tem um queda acentuada de energia e ha um espalhamento maiorpara as classes DL2 (Figura 5.11c) e MS3 (Figura 5.11d).

Figura 5.11: Espectros de frequencia tıpicos das classes observadas nas pas deaerogeradores.

(a) Sem Falha (b) Delaminacao 1

(c) Delaminacao 2 (d) Matriz Seca 3

Essa diferenciacao revelada sera de grande valia para a extracao de caracterısticascom a analise de componentes principais executada na sequencia da cadeia deprocessamento designada para a classificacao utilizando os detectores de novidadesestudados.

61

Page 79: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

5.2.2 Detectores de Novidade

A Figura 5.12 apresenta o melhor comportamento obtido para as amostrascoletadas apresentadas ao detector de novidades construıdo a partir da abordagembaseada em distancia. Os resultados do teste com as amostras de novidades mostramum desempenho excelente para esse metodo, com um limiar bem definido e uma taxade falsos positivos praticamente nula para todas as tres classes de defeito investigadas.

Figura 5.12: Mapas de treinamento obtidos com o metodo de ND DIST para basede dados pas de aerogeradores.

(a) Delaminacao 1

Amostras

0 10 20 30 40 50 60

SaıdaND

0

1

2

3

4

5dist

Treino

Validacao

Teste

Limiar

(b) Delaminacao 2

Amostras

0 10 20 30 40 50 60

SaıdaND

0

0.5

1

1.5

2

2.5

3dist

Treino

Validacao

Teste

Limiar

(c) Matriz Seca 3

Amostras

0 10 20 30 40 50 60

SaıdaND

0

0.5

1

1.5

2

2.5dist

Treino

Validacao

Teste

Limiar

A saıda do treinamento para a deteccao da classe DL1, simbolizada pela Fi-gura 5.12a, apresenta um comportamento tipicamente ideal. Para as classes DL2(Figura 5.12b) e MS3 (Figura 5.12c), e possıvel notar a presenca de uma pequenaocorrencia de falsos negativos em torno da origem do mapa, com nenhuma indicacaode falsos positivos.

62

Page 80: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

A abordagem para deteccao de novidades utilizando o clustering k-means eexemplificada atraves dos mapas na Figura 5.13. A sensibilidade para identificar asnovidades vinculadas as classes DL1 (Figura 5.13a), DL2 (Figura 5.13b) e MS3(Figura 5.13c) mostrou-se elevada para as tres condicoes investigadas. Foi notado umcomportamento mais disperso das novidades para o cluster obtido para a condicaoDL1.Figura 5.13: Mapas de treinamento obtidos com o metodo de ND k-means para basede dados pas de aerogeradores.

(a) Delaminacao 1

Amostras

0 10 20 30 40 50 60

SaıdaND

0

2

4

6

8

10

12kmeans

Treino

Validacao

Teste

Limiar

(b) Delaminacao 2

Amostras

0 10 20 30 40 50 60

SaıdaND

0.5

1

1.5

2

2.5

3

3.5

4

4.5kmeans

Treino

Validacao

Teste

Limiar

(c) Matriz Seca 3

Amostras

0 10 20 30 40 50 60

SaıdaND

0.5

1

1.5

2

2.5

3

3.5

4kmeans

Treino

Validacao

Teste

Limiar

Um comportamento mais agregado das novidades testadas e visualizado para asclasses DL2 e principalmente MS3, que possui uma baixa dispersao espacial do clusterdefinido para o conjunto de testes. Enquanto isso, ha uma pequena especificidaderelacionada com as amostras de validacao para as condicoes DL2 e MS3.

A Figura 5.14 reune todas as saıdas dos treinamentos efetuados para os mapasauto-organizaveis aplicados aos experimento 2. Essa abordagem, diferentemente dasoutras verificadas ao longo da aplicacao de ND para os corpos de prova das pas

63

Page 81: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

de aerogeradores, teve um comportamento de especificidade maior para todas asamostras da classe normal apresentadas durante a fase de validacao.

O limiar de decisao entre a condicao normal e a novidade foi bem proximoda origem, apresentando uma caracterıstica bem uniforme do conjunto treinado.Entretanto, ainda assim o metodo sinaliza uma eficiencia satisfatoria na identificacaodas novidades apresentadas.

Figura 5.14: Mapas de treinamento obtidos com o metodo de ND SOM para base dedados pas de aerogeradores.

(a) Delaminacao 1

Amostras

0 10 20 30 40 50 60

SaıdaND

0

1000

2000

3000

4000

5000

6000som

Treino

Validacao

Teste

Limiar

(b) Delaminacao 2

Amostras

0 10 20 30 40 50 60

SaıdaND

0

500

1000

1500som

Treino

Validacao

Teste

Limiar

(c) Matriz Seca 3

Amostras

0 10 20 30 40 50 60

SaıdaND

0

200

400

600

800

1000

1200som

Treino

Validacao

Teste

Limiar

A Figura 5.15 destaca as condicoes associadas com a saıda do treinamento obtidopara a abordagem SVDD. Em todas as classes, a fronteira de decisao obtida secomportou da mesma forma, embora menor em termos absolutos se comparado comas abordagens baseadas em distancia e k-means.

Para o caso da classe DL1, observado na Figura 5.15a, nota-se que a saıda danovidade mostrou-se linear, com a aparicao de somente alguns pontos de especificidadedurante a validacao do metodo. As classes DL2 (Figura 5.15b) e MS3 (Figura 5.15c)

64

Page 82: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

tiveram a regiao do vetor de suporte das novidades bem definida, com sensibilidadetambem satisfatoria, embora a especificidade associada com as amostras de validacaoseja maior para as duas condicoes.

Figura 5.15: Mapas de treinamento obtidos com o metodo de ND SVDD para basede dados pas de aerogeradores.

(a) Delaminacao 1

Amostras

0 10 20 30 40 50 60

SaıdaND

0.5

0.6

0.7

0.8

0.9

1

1.1

1.2

1.3svmtax

Treino

Validacao

Teste

Limiar

(b) Delaminacao 2

Amostras

0 10 20 30 40 50 60

SaıdaND

0.5

0.6

0.7

0.8

0.9

1

1.1

1.2

1.3svmtax

Treino

Validacao

Teste

Limiar

(c) Matriz Seca 3

Amostras

0 10 20 30 40 50 60

SaıdaND

0.4

0.5

0.6

0.7

0.8

0.9

1

1.1

1.2svmtax

Treino

Validacao

Teste

Limiar

A Tabela 5.4 compara o produto medio das eficiencias para a RNA e SVM desti-nadas para o modelo de aprendizado supervisionado dos classificadores multiclassepara as amostras de pas de aerogeradores, em que novamente e possıvel apurar umresultado satisfatorio para os metodos.

A Tabela 5.5 aponta que o metodo baseado em distancia e o k-means tem umaacuracia elevada para a identificacao de novidades relacionadas com os defeitosobservados nos corpos de prova de aerogeradores.

65

Page 83: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

Tabela 5.4: Eficiencia percentual dos metodos multiclasse para o experimento 2

ExperimentoClasse

DetectadaClassificadores

RNA bcp SVM kernel rbf

Pas deAerogeradores

SF 96,25 92,00DL1 82,50 90,00DL2 100,00 100,00MS3 100,00 92,00

Tabela 5.5: Acuracia percentual dos metodos de deteccao de novidades para osexperimento 2

ExperimentoClasse

DetectadaMetodos de ND

Dist k-means SVDD SOM

Pas deAerogeradores

DL1 98,98±1,78 99,13±1,53 92,76±3,49 85,52±3,18DL2 98,68±2,64 97,82±2,62 90,04±4,38 76,54±2,35MS3 97,51±3,56 96,11±2,35 90,49±3,93 79,49±3,81

A Figura 5.16 apresenta os boxplots de eficiencia para os melhores resultadosobtidos em cada uma das 4 abordagens diferentes para os 10 subconjuntos detreinamento e teste definidos aleatoriamente para a deteccao de novidades.

Figura 5.16: Boxplot do produto medio da acuracia dos detectores de novidade parabase de dados pas de aerogeradores.

Como era esperado, apos a analise dos mapas de treinamento, o comportamentoda eficiencia media foi bastante elevado para as abordagens baseada em distancia ek-means, seguido pelo metodo SVDD e, por ultimo, a metrica SOM. Os resultadosforam bastante compactos em termos percentuais para as classes de acordo com o

66

Page 84: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

metodo selecionado para a deteccao de novidades, com destaque para o baseado emdistancia menos disperso.

A construcao das curvas ROC para cada classe associada ao experimento 2 sugereum comportamento bem similar entre as curvas resultantes. A melhor condicaoobtida em todos os metodos de ND a partir dos conjuntos de dados das tres condicoesobservadas para o experimento 2 esta ilustrada na Figura 5.17.

Neste caso, e possıvel indicar qualquer uma das metricas de deteccao das novidadespara a analise dos defeitos das pas de aerogeradores, gracas a elevada sensibilidadede ambos com uma relacao de (1-especificidade) pequena.

Figura 5.17: ROC construıda utilizando base de dados pas de aerogeradores.

(a) Delaminacao 1 (b) Delaminacao 2

(c) Matriz Seca 3

A Tabela 5.6 apresenta os valores de AUC que corroboram com as curvas ROCconstruıdas. Os valores sao bem proximos, com uma pequena vantagem para odetector elaborado a partir da distancia.

67

Page 85: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

Tabela 5.6: AUC percentual calculado para o experimento 2

ExperimentoClasse

DetectadaAUC dos Metodos de ND

Dist k-means SVDD SOM

Pas deAerogeradores

DL1 95,50±0,00 95,50±0,00 95,49±0,00 95,20±0,00DL2 95,30±0,00 95,30±0,00 95,29±0,00 95,10±0,00MS3 95,50±0,00 95,50±0,00 95,20±0,00 94,60±0,00

Esse resultado elevado de AUC foi obtido com a selecao de 100 componentesprincipais conforme indicado pelo comportamento do desempenho observado naFigura 5.18. Os metodos baseado em distancia e k-means sofreram menor oscilacaocom um numero reduzido de componentes, enquanto que a abordagem SOM teveuma variacao maior com uma dimensionalidade comprimida do conjunto

Figura 5.18: AUC percentual variando com o tamanho dos componentes principaispara o experimento 2.

(a) Delaminacao 1 (b) Delaminacao 2

(c) Matriz Seca 3

68

Page 86: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

5.3 Tubos de Fornos de Pirolise - Experimento 3

5.3.1 Processamento de Sinais

A Figura 5.19 mostra o comportamento mais comum do sinal ultrassonico obtidopara as amostras de tubos coletadas dos fornos de pirolise sujeitos a diferentescondicoes com relacao a exposicao da temperatura de trabalho e tempo de operacao.

A interpretacao do resultado a partir da visualizacao A-Scan para os sinaiscoletados do ensaio usando a tecnica de imersao convencional com os tubos HPainda e insuficiente para caracterizar de forma imediata a condicao de carburizacaoindicada previamente.

Contudo, e notavel um indıcio de queda na amplitude com a condicao de altacarburizacao na Figura 5.19c em comparacao com a situacao de baixa carburizacao(Figura 5.19b), e para o estado sem carburizacao, conforme a Figura 5.19a.

Figura 5.19: Sinal tıpico no domınio do tempo apos a DWT Famılia Daubechie 3o

nıvel para as classes existentes nos tubos HP.

(a) Sem Carburizacao

(b) Baixa Carburizacao (c) Alta Carburizacao

69

Page 87: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

A Figura 5.20 mostra o comportamento no domınio da frequencia para os diferentesestagios de carburizacao investigados. A condicao sem carburizacao, observada naFigura 5.20a, tem seu pico maximo de energia em torno do valor central da banda defrequencia analisada, enquanto que o estagio de baixa carburizacao (Figura 5.20b)tem um deslocamento na frequencia central do pico de maior intensidade comalgumas reflexoes proximas da frequencia nominal do transdutor, e o estagio de altacarburizacao (Figura 5.20c) tem um numero maior de picos em torno da frequenciade interesse.

Figura 5.20: Espectros de frequencia tıpicos das classes observadas nos tubos HP.

(a) Sem Carburizacao

(b) Baixa Carburizacao (c) Alta Carburizacao

A analise atraves da selecao das caracterısticas com a compactacao dos componen-tes principais extraıdos sera essencial para a aplicacao dos algoritmos de aprendizagemnao supervisionada dos detectores de novidade discutidos na Subsecao 5.3.2

70

Page 88: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

5.3.2 Detectores de Novidade

A Figura 5.21 mostra o comportamento da saıda do treinamento das amostrasapresentadas ao modelo baseado em distancia para as duas condicoes associadas aostubos HP40. O limiar da deteccao de novidade foi bem definido para o conjunto detreino utilizado, e identico para as duas classes estudadas.

Apesar disso, ambos os estagios de baixa carburizacao (Figura 5.21a) e altacarburizacao (Figura 5.21b) apresentaram uma quantidade de novidades testadaserroneamente classificadas como normais, produzindo uma taxa de falsos negativosconsideravel para o experimento, assim como a ocorrencia de sinais utilizados navalidacao classificados equivocadamente como novidades.

Esse comportamento pode estar relacionado a condicao irregular do estagio decarburizacao associado com a regiao inspecionada durante a realizacao do experimento3. Tal condicao e possıvel ser investigada atraves de ensaios mecanicos com analiseda composicao microestrutural dos tubos inspecionados.

Figura 5.21: Mapas de treinamento obtidos com o metodo de ND DIST para basede dados tubos HP.

(a) Baixa Carburizacao

Amostras

0 20 40 60 80 100 120

SaıdaND

0.92

0.94

0.96

0.98

1

1.02

1.04

1.06dist

Treino

Validacao

Teste

Limiar

(b) Alta Carburizacao

Amostras

0 20 40 60 80 100 120

SaıdaND

0.88

0.9

0.92

0.94

0.96

0.98

1

1.02

1.04

1.06dist

Treino

Validacao

Teste

Limiar

Ja a Figura 5.22 exibe o resultado do treinamento para a abordagem utilizandoo clustering kmeans a partir do conjunto de treinamento dos diferentes nıveis decarburizacao. O limiar de deteccao foi superior em comparacao ao metodo baseadoem distancia apresentado anteriormente, e diferente entre os dois estagios tambem.Contudo, a observacao de falsos negativos, assim como a indicacao para algumasamostras de validacao classificada como falsos positivos, se mantem.

71

Page 89: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

Figura 5.22: Mapas de treinamento obtidos com o metodo de ND k-means para basede dados tubos HP.

(a) Baixa Carburizacao

Amostras

0 20 40 60 80 100 120

SaıdaND

0.96

0.98

1

1.02

1.04

1.06

1.08

1.1kmeans

Treino

Validacao

Teste

Limiar

(b) Alta Carburizacao

Amostras

0 20 40 60 80 100 120

SaıdaND

0.92

0.94

0.96

0.98

1

1.02

1.04

1.06

1.08

1.1kmeans

Treino

Validacao

Teste

Limiar

A realizacao do treinamento a partir da abordagem com o metodo de mapasauto-organizaveis e exibido na Figura 5.23. A construcao da fronteira de decisaopara a identificacao das novidades nao teve uma eficiencia satisfatoria como pode serobservado para a condicao de baixa carburizacao (Figura 5.23a) e tambem para aalta carburizacao (Figura 5.23b).

Mesmo que o metodo tenha obtido uma alta sensibilidade com relacao as amostrasde novidades apresentadas ao detector, o grau de especificidade foi elevado para ossinais de validacao estudados, o que reduz a eficiencia global para a abordagem SOM.

Figura 5.23: Mapas de treinamento obtidos com o metodo de ND SOM para base dedados tubos HP.

(a) Baixa Carburizacao

Amostras

0 20 40 60 80 100 120

SaıdaND

280

300

320

340

360

380

400

420

440

460

480som

Treino

Validacao

Teste

Limiar

(b) Alta Carburizacao

Amostras

0 20 40 60 80 100 120

SaıdaND

250

300

350

400

450

500som

Treino

Validacao

Teste

Limiar

72

Page 90: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

Os resultados do treinamento para o detector de novidades a partir do metodomaquina de vetor de suporte de descricao de dados sao mostrados na Figura 5.24.A fronteira de decisao para a novidade ocorreu num patamar inferior aos demaismetodos. Ambas as classes de baixa carburizacao (Figura 5.24a) e alta carburizacao(Figura 5.24b) nao apresentaram ocorrencia de falsos positivos, apesar da indicacaode amostras com atributos que foram classificados como falsos negativos nas duascondicoes estudadas.

Figura 5.24: Mapas de treinamento obtidos com o metodo de ND SVDD para basede dados tubos HP.

(a) Baixa Carburizacao

Amostras

0 20 40 60 80 100 120

SaıdaND

0.48

0.49

0.5

0.51

0.52

0.53svmtax

Treino

Validacao

Teste

Limiar

(b) Alta Carburizacao

Amostras

0 20 40 60 80 100 120

SaıdaND

0.47

0.48

0.49

0.5

0.51

0.52

0.53

0.54svmtax

Treino

Validacao

Teste

Limiar

A Tabela 5.7 mostra que a identificacao dos estagios de carburizacao com osalgoritmos de aprendizado supervisionado para os sinais ultrassonicos coletados temuma eficiencia inferior aqueles obtidos nos outros experimentos, mas sendo aindapossıvel distinguir os dois nıveis de defeito existentes nos tubos das serpentinas defornos de pirolise.

Tabela 5.7: Eficiencia percentual dos metodos multiclasse para o experimento 3

ExperimentoClasse

DetectadaClassificadores

RNA bcp SVM kernel rbf

Tubos de Fornosde Pirolise

SCB 93,89 92,00BCB 84,83 84,00ACB 88,34 87,00

O desempenho medido atraves da acuracia dos metodos da deteccao de novidadespara o experimento 3 e apresentado na Tabela 5.8. O desempenho global comparadocom os demais experimentos tambem e inferior,embora seja possıvel identificar com

73

Page 91: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

melhor acuracia a baixa carburizacao com a abordagem k-means e o nıvel de altacarburizacao atraves do metodo SVDD.

Tabela 5.8: Acuracia percentual dos metodos de deteccao de novidades para oexperimento 3

ExperimentoClasse

DetectadaMetodos de ND

Dist k-means SVDD SOM

Tubos de Fornosde Pirolise

BCB 76,40±3,91 81,17±4,34 78,20±1,30 71,43±0,00ACB 76,83±4,76 75,32±4,34 82,04±2,41 71,43±0,00

A Figura 5.25 exibe os boxplots construıdos para os 10 melhores resultados daacuracia para cada subconjunto sorteado para validacao dos metodos de ND. Ometodo baseado em distancia teve uma acuracia media equivalente ao clusteringk-means, mas a dispersao entre as classes teve comportamento oposto: o boxplotpara a BCB foi mais curto do que a ACB com o metodo de distancia, ao contrariodo observado para a abordagem k-means.

O resultado para as acuracias medias dos subconjuntos observadas no boxplot dosmapas auto-organizaveis foi o menor de todos, sem apresentar dispersao consideravel,enquanto que o boxplot do SVDD teve uma distribuicao da eficiencia diferente dosdemais, com um valor medio equiparado as abordagens baseadas em distancia ek-means

Figura 5.25: Boxplot do produto medio da acuracia dos detectores de novidade parabase de dados tubos HP.

A Figura 5.26 ilustra o comportamento da melhor curva ROC para cada metodode deteccao de novidades utilizado com relacao a identificacao das classes. E possıvelinferir que as quatro abordagens utilizadas para essa aplicacao tem uma sensibilidadede deteccao para o caso do estagio de alta carburizacao do que para a situacao debaixa carburizacao na faixa de 0 a 20% de FPr.

74

Page 92: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

Figura 5.26: ROC construıda utilizando base de dados tubos HP.

(a) Baixa Carburizacao (b) Alta Carburizacao

A Tabela 5.9 apresenta os valores de AUC alcancados para as metricas de deteccaode novidades para identificacao dos nıveis de carburizacao associados com os corposde prova em tubos de aco inoxidavel da classe HP 40.

Essa forma de avaliacao permite observar um destaque para a abordagem utilizadoo SVDD para os dois graus de carburizacao, embora o patamar de AUC esteja proximopara as demais metricas.

Tabela 5.9: AUC percentual calculado para o experimento 3

ExperimentoClasse

DetectadaAUC dos Metodos de ND

Dist k-means SVDD SOM

Tubos de Fornosde Pirolise

BCB 83,71±5,78 83,62±5,59 84,04±5,28 83,32±5,60ACB 84,54±3,27 84,84±3,17 85,25±3,02 84,64±3,23

A Figura 5.27 aponta a escolha de 200 componentes principais para a construcaodos detectores de novidades selecionados em estudo no experimento 3. A oscilacao doresultado da AUC do metodo dos mapas auto-organizaveis para uma condicao de baixadimensionalidade uma vez mais e destacada para esses conjuntos de treinamentos.Entretanto, o metodo SVDD e o k-means tiveram um comportamento de menordispersao com relacao a baixa dimensionalidade.

75

Page 93: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

Figura 5.27: AUC percentual variando com o tamanho dos componentes principaispara o experimento 3.

(a) Baixa Carburizacao (b) Alta Carburizacao

5.4 Consideracoes sobre os resultados obtidos

A analise global das figuras que comparam a dimensionalidade dos componentesprincipais das amostras utilizadas no treinamento revelam notoriamente que otamanho do conjunto dos dados afeta o desempenho do detector de novidades.Em especial, quando o tamanho das assinaturas de treinamento e inferior a 50componentes principais, ha uma grande instabilidade de desempenho entre as quatroabordagens.

O mapa auto-organizavel e particularmente sensıvel ao tamanho dos dados detreinamento, apresentando uma linha muito mais flutuante do que os outros tresmetodos quando o tamanho do conjunto de dados e menor que a selecao aproximadade 100% das caracterısticas extraıdas pelo PCA.

Vale ressaltar que durante a realizacao da selecao dos componentes principais, aelevada correlacao entre os sinais resultou num truncamento das amostras para umnumero de componentes menor, assegurando que a obtencao dos valores correspon-diam a 100% da energia do espectro.

Para comparar o desempenho relativo da AUC entre um par de detectores paratodos os experimentos executados, o teste de classificacao Wilcoxon pareado foirealizado utilizando os valores das Tabelas 5.3, 5.6 e 5.9. O resultado do teste dehipoteses h e valor p sao detalhados na Tabela 5.10. Em cada celula da tabela, ovalor superior e o valor p do teste de classificacao Wilcoxon: o valor inferior e oresultado do teste de hipotese h, com um nıvel de significancia igual a 0,05.

76

Page 94: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

Tabela 5.10: Teste de classificacao Wilcoxon pareado para os valores de AUC dosdetectores de novidade

k-means SVDD SOM

Dist(h)

0.03911

0.30080

0.16410

k-means(h)

0.00781

0.02731

SVDD(h)

0.09770

O teste mostra estatisticamente que o metodo baseado em distancia e levementesuperior ao k-means e bem melhor que os metodos da maquina de vetor de descricao dedados e mapas auto-organizaveis. Para o metodo clustering k-means, ele se sobressaicomparado a maquina de vetor de descricao de dados e os mapas auto-organizaveis,cujos metodos mostram um desempenho de AUC relativamente parecido entre ospares, pois o valor h resultante para a comparacao entre SVDD-SOM e nulo.

Em resumo, a partir dos resultados alcancados da avaliacao experimental, o testeWilcoxon aponta que o metodo da distancia supera os outros tres metodos que temuma similaridade em desempenho quando comparados diretamente com relacao ametrica de avaliacao utilizando o resultado de AUC para a melhor curva ROC.

77

Page 95: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

Capıtulo 6

Conclusoes

Este trabalho avaliou a aplicacao de quatro metodos de deteccao de novidades naosupervisionados para problemas praticos de inspecao nao destrutiva por ultrassomcomo suporte a tomada de decisao.

Nesse contexto, uma avaliacao comparativa completa de aspectos qualitativos equantitativos para quatro metodos selecionados de ND foi realizada em tres conjuntosde dados com diferentes dimensoes e diferentes complexidade do problema.

A realizacao do pre-processamento dos sinais no domınio do tempo coletadosdurante a inspecao ultrassonica com a remocao de ruıdo utilizando a DWT wavelet-mae Daubechie de 3a ordem, a analise no domınio da frequencia usando a FFT e areducao da dimensionalidade com PCA, mostraram-se bastante uteis para prepararos dados apresentados aos classificadores multiclasse e aos detectores de novidade.

O desempenho dos detectores de novidade foi avaliado utilizando as curvas ROC,a metrica AUC, o teste de classificacao de paridade Wilcoxon, juntamente com aeficiencia media. Os resultados da avaliacao mostram que os metodos baseado emdistancia e clustering kmeans sao relativamente estaveis e alcancaram um melhordesempenho em comparacao com os outros detectores que tem um comportamentosimilar em termos de AUC.

Os limites de deteccao de novidades dos metodos SVDD e SOM apresentarammenor acuracia do que os dos outros dois metodos no contexto do conjunto de dados.Alem disso, o metodo SVDD parece ser mais sensıvel pois consumiu um tempo detreinamento e de memoria maiores do que os outros tres metodos.

Os detectores k-means e baseado distancia sao conceitualmente simples, apre-sentando um desempenho geral do boxplot superior aos outros dois metodos. Emparticular, a abordagem baseada em distancia atinge valores de AUC mais altosem todos os conjuntos de dados. Este resultado indica que e mais provavel queobtenhamos um bom desempenho de deteccao se AUC for o principal objetivo.

A complexidade computacional dessas tecnicas tambem e um aspecto importante.Normalmente, os metodos probabilısticos, baseados em reconstrucao e domınio, tem

78

Page 96: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

fases de treinamento dilatadas, mas com testes curtos. Em diversas aplicacoes, issonao e um inconveniente, pois os modelos podem ser treinados offline, enquanto oteste e crucial para sua execucao em tempo real.

No entanto, os metodos baseados em distancia, usualmente, sao computacional-mente pesados durante os testes, despontando como um entrave significativo nosaspectos de aplicacoes com necessidade de resposta em tempo real.

Portanto, os trabalhos futuros da pesquisa devem ser voltados para as abordagensbaseadas em distancia a fim de melhorar sua eficiencia computacional como, porexemplo, padroes de classificacao utilizando algoritmos de vizinhanca mais eficientes,alem da construcao de prototipos cujo sistema para tomada de decisao utilizando adeteccao de novidades em tempo real sejam adotados.

79

Page 97: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

Referencias Bibliograficas

[1] PAVLOPOULOU, S., WORDEN, K., SOUTIS, C. “Novelty detection anddimension reduction via guided ultrasonic waves: Damage monitoringof scarf repairs in composite laminates”, Journal of Intelligent MaterialSystems and Structures, v. 27, n. 4, pp. 549–566, 2016.

[2] MARKOU, M., SINGH, S. “Novelty detection: a review—part 2:: neural networkbased approaches”, Signal processing, v. 83, n. 12, pp. 2499–2521, 2003.

[3] LIU, C., HARLEY, J. B., YING, Y., et al. “Singular value decomposition fornovelty detection in ultrasonic pipe monitoring”. In: SPIE Smart Structuresand Materials+ Nondestructive Evaluation and Health Monitoring, pp.86921R–86921R. International Society for Optics and Photonics, 2013.

[4] MARKOU, M., SINGH, S. “Novelty detection: a review—part 1: statisticalapproaches”, Signal processing, v. 83, n. 12, pp. 2481–2497, 2003.

[5] ANDREUCCI, R. Ensaio por Ultrassom. Revista ABENDI, 2016.

[6] CARVALHO, D. J. T. Desenvolvimento e aplicacao de tecnicas inovadorasde Ensaios Nao Destrutivos (END) com celulas bacterianas. Tese deDoutorado, Faculdade de Ciencias e Tecnologia, 2012.

[7] WELDEN, C. “Basic steps for inspection with diepenetrants”. Acessado em26 de setembro de 2017. Disponıvel em: <http://wellden.mx/en/pasos-basicos-la-inspeccion-liquidos-penetrantes/>.

[8] WORMAN, J. “Magnetic Particle Examination”. Acessado em 26 de setembro de2017. Disponıvel em: <http://www.nationalboard.org/index.aspx?pageID=164&ID=377>.

[9] PEREIRA, J. A. V. Estudo e Aplicacao de Ensaios Nao Destrutivos. Lıquidospenetrantes, Ultra sons, Radiografia digital-Tecnica tangencial medicao deespessuras. Tese de Mestrado, FEUP, 2013.

[10] WORKFORCE, E. “Radiography Testing (RT)”. Acessado em 26 de setembrode 2017. Disponıvel em: <http://www.energyworkforce.net/?p=116>.

80

Page 98: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

[11] NELLIGAN, T. Ultrasonic Transducers Technical Notes. Relatorio tecnico,Olympus NDT, 2011.

[12] ARIZMENDI, C. J., GARCIA, W. L., QUINTERO, M. A. “Automatic weldingdetection by an intelligent tool pipe inspection”, Journal of Physics:Conference Series, , n. 1, pp. 012082, 2015.

[13] CHAPLIN, R. Industrial Ultrasonic Inspection: Levels 1 and 2. FriesenPress,2017.

[14] CERQUEIRA, A. S. Avaliacao da tecnica de ultrassom Phased Array na inspecaode juntas soldadas dissimilares e cladeadas com diferentes espessuras deamanteigamento. Tese de Mestrado, UFRGS, 2009.

[15] TROMBINI, M. Avaliacao da tecnica de ultrassom phased array para a oti-mizacao do controle de qualidade em acos laminados e forjados. Tese deMestrado, Unicamp, 2015.

[16] SAMEEUDDIN, S., POUDEL, A., LI, S., et al. “Automated defect classificationusing artificial neural networks”. In: 23rd Annual Research Symposium2014, pp. 125–131, 2014.

[17] LALITHAKUMARI, S., SHEELARANI, B., VENKATRAMAN, B. “ArtificialNeural Network based Defect Detection of Welds in TOFD Technique”,International Journal of Computer Applications, v. 41, n. 20, 2012.

[18] MOLES, M., ROBERTSON, L., SINCLAIR, T. “Developments in Time-Of-Flight Diffraction (TOFD)”. In: 18th World Conference on NondestructiveTesting, pp. 16–20. Citeseer, 2012.

[19] SOLUTION, A. “TOFD SCANNER”. Acessado em 25 de setembro de 2017. Dis-ponıvel em: <http://www.autsolutions.net/ndt-resources/tofd/>.

[20] DE MOURA, E. P. Reconhecimento de padroes de defeitos de soldagem emsinais ultrassonicos obtidos pela tecnica TOFD utilizando redes neuraisartificiais. Tese de Doutorado, Universidade Federal do Rio de Janeiro,COPPE, 2003.

[21] CLIFTON, D., TARASSENKO, L. “Condition monitoring of gas-turbine engi-nes”, Transfer Report, Department of Engineering Science, University ofOxford, 2006.

[22] DINIZ, P. S. R., SILVA, E. A. B., NETTO, S. L. Digital signal processing:system analysis and design. Cambridge University Press, 2010.

81

Page 99: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

[23] OPPENHEIM, A. V., SCHAFER, R. W. Discrete-time signal processing. PearsonHigher Education, 2010.

[24] VETTERLI, M., KOVACEVIC, J. Wavelets and subband coding, v. 1. Prentice-Hall, Englewood Cliffs, New Jersey., 1995.

[25] AKANSU, A. N., HADDAD, R. A. Multiresolution signal decomposition: trans-forms, subbands, and wavelets. Academic Press, New Jersey Institute ofTechnology Newark, NJ, 2001.

[26] MALLAT, S. A wavelet tour of signal processing: the sparse way. Academicpress, 2008.

[27] DE LA HERMOSA GONZALEZ, R. R., MARQUEZ, F. P. G., DIMLAYE,V., et al. “Pattern recognition by wavelet transforms using macro fibrecomposites transducers”, Mechanical Systems and Signal Processing, v. 48,n. 1, pp. 339–350, 2014.

[28] DING, X., LI, Y., BELATRECHE, A., et al. “An experimental evaluation ofnovelty detection methods”, Neurocomputing, v. 135, pp. 313–327, 2014.

[29] ZHOU, Z., MA, B., JIANG, J., et al. “Application of wavelet filtering andBarker-coded pulse compression hybrid method to air-coupled ultrasonictesting”, Nondestructive Testing and Evaluation, v. 29, n. 4, pp. 297–314,2014. doi: 10.1080/10589759.2014.941840.

[30] ADAMO, F., ANDRIA, G., ATTIVISSIMO, F., et al. “A comparative study onmother wavelet selection in ultrasound image denoising”, Measurement,v. 46, n. 8, pp. 2447–2456, 2013. doi: 10.1016/j.measurement.2013.04.064.

[31] JOLLIFFE, I. Principal component analysis. Wiley Online Library, 2002.

[32] MOHD ARIS, K. D., MUSTAPHA, F., SALIT, M. S., et al. “ConditionStructural Index using Principal Component Analysis for undamaged,damage and repair conditions of carbon fiber–reinforced plastic laminate”,Journal of Intelligent Material Systems and Structures, v. 25, n. 5, pp. 575–584, 2014.

[33] HAR-PELED, S., ROTH, D., ZIMAK, D. “Constraint classification for multiclassclassification and ranking”. In: Advances in neural information processingsystems, pp. 809–816, 2003.

[34] SCHOLKOPF, B., SMOLA, A. J. Learning with kernels: support vector machi-nes, regularization, optimization, and beyond. MIT press, 2001.

82

Page 100: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

[35] HAYKIN, S. S. Neural networks and learning machines, v. 3. Pearson UpperSaddle River, NJ, USA, 2009.

[36] JOHN LU, Z. The elements of statistical learning: data mining, inference, andprediction. Wiley Online Library, 2010.

[37] LIU, J., XU, G., REN, L., et al. “Defect intelligent identification in resistance spotwelding ultrasonic detection based on wavelet packet and neural network”,The International Journal of Advanced Manufacturing Technology, v. 90,n. 9-12, pp. 2581–2588, 2017.

[38] PIMENTEL, M. A., CLIFTON, D. A., CLIFTON, L., et al. “A review ofnovelty detection”, Signal Processing, v. 99, pp. 215–249, 2014.

[39] PEDREGOSA, F., VAROQUAUX, G., GRAMFORT, A., et al. “Scikit-learn:Machine Learning in Python ”, Journal of Machine Learning Research,v. 12, pp. 2825–2830, 2011.

[40] DE FARIA, E. R., DE LEON FERREIRA, A. C. P., GAMA, J., et al. “MINAS:multiclass learning algorithm for novelty detection in data streams”, DataMining and Knowledge Discovery, v. 30, n. 3, pp. 640–680, 2016.

[41] FARIA, E. R., GONCALVES, I. J., DE CARVALHO, A. C., et al. “Noveltydetection in data streams”, Artificial Intelligence Review, v. 45, n. 2,pp. 235–269, 2016.

[42] PRIETO, M. D., CORRALES, J. A. C., MILLAN, D. Z., et al. “Evaluationof Novelty Detection Methods for Condition Monitoring applied to anElectromechanical System”. In: Fault Diagnosis and Detection, InTech,2017.

[43] BORACCHI, G., CARRERA, D., WOHLBERG, B. “Novelty detection inimages by sparse representations”. In: Intelligent Embedded Systems (IES),2014 IEEE Symposium on, pp. 47–54. IEEE, 2014.

[44] CICHOSZ, P., JAGODZINSKI, D., MATYSIEWICZ, M., et al. “Noveltydetection for breast cancer image classification”. In: Proc. of SPIE Vol, v.10031, pp. 1003135–1, 2016.

[45] LI, W., MO, W., ZHANG, X., et al. “Outlier detection and removal improvesaccuracy of machine learning approach to multispectral burn diagnosticimaging”, Journal of biomedical optics, v. 20, n. 12, pp. 121305–121305,2015.

83

Page 101: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

[46] NADER, P., HONEINE, P., BEAUSEROY, P. “λp-norms in One-Class Classifi-cation for Intrusion Detection in SCADA Systems”, IEEE Transactionson Industrial Informatics, v. 10, n. 4, pp. 2308–2317, 2014.

[47] DERVILIS, N., CHOI, M., TAYLOR, S., et al. “On damage diagnosis for a windturbine blade using pattern recognition”, Journal of sound and vibration,v. 333, n. 6, pp. 1833–1850, 2014.

[48] LI, S., TUNG, W. L., NG, W. K. “A novelty detection machine and itsapplication to bank failure prediction”, Neurocomputing, v. 130, pp. 63–72,2014.

[49] KANG, P., KIM, K., CHO, N. “Toll Fraud Detection of Voip Services viaan Ensemble of Novelty Detection Algorithms.” International Journal ofIndustrial Engineering, v. 22, n. 2, 2015.

[50] MORRIS, G., ANGELOV, P. “Real-time novelty detection in video usingbackground subtraction techniques: State of the art a practical review”.In: Systems, Man and Cybernetics (SMC), 2014 IEEE InternationalConference on, pp. 537–543. IEEE, 2014.

[51] OZBILGE, E. “On-line expectation-based novelty detection for mobile robots”,Robotics and Autonomous Systems, v. 81, pp. 33–47, 2016.

[52] TUNA, G., GUNGOR, V. C., GULEZ, K. “An autonomous wireless sensornetwork deployment system using mobile robots for human existencedetection in case of disasters”, Ad Hoc Networks, v. 13, pp. 54–68, 2014.

[53] HUIJSE, P., ESTEVEZ, P. A., PROTOPAPAS, P., et al. “Computationalintelligence challenges and applications on large-scale astronomical timeseries databases”, IEEE Computational Intelligence Magazine, v. 9, n. 3,pp. 27–39, 2014.

[54] PURARJOMANDLANGRUDI, A., GHAPANCHI, A. H., ESMALIFALAK, M.“A data mining approach for fault diagnosis: An application of anomalydetection algorithm”, Measurement, v. 55, pp. 343–352, 2014.

[55] MARSLAND, S. “Novelty detection in learning systems”, Neural computingsurveys, v. 3, n. 2, pp. 157–195, 2003.

[56] CLIFTON, D. A., BANNISTER, P. R., TARASSENKO, L. “Application of anintuitive novelty metric for jet engine condition monitoring”. In: IEA/AIE,pp. 1149–1158. Springer, 2006.

84

Page 102: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

[57] HE, Z., XU, X., DENG, S. “Discovering cluster-based local outliers”, PatternRecognition Letters, v. 24, n. 9, pp. 1641–1650, 2003.

[58] CLIFTON, L. A. Multi-channel novelty detection and classifier combination.Tese de Doutorado, University of Manchester, 2007.

[59] VAN DER HEIJDEN, F., DUIN, R. P. W., DE RIDDER, D., et al. Classification,parameter estimation and state estimation: An engineering approach usingMATLAB. John Wiley & Sons, 2004.

[60] DE MOURA, N. N., DE SEIXAS, J. M. “Novelty detection in passive SONARsystems using support vector machines”. In: Computational Intelligence(LA-CCI), 2015 Latin America Congress on, pp. 1–6. IEEE, 2015.

[61] TAX, D. M., DUIN, R. P. “Support vector data description”, Machine learning,v. 54, n. 1, pp. 45–66, 2004.

[62] WANG, S., YU, J., LAPIRA, E., et al. “A modified support vector datadescription based novelty detection approach for machinery components”,Applied Soft Computing, v. 13, n. 2, pp. 1193–1205, 2013.

[63] MCBAIN, J., TIMUSK, M. “Feature extraction for novelty detection as appliedto fault detection in machinery”, Pattern Recognition Letters, v. 32, n. 7,pp. 1054–1061, 2011.

[64] KOHONEN, T. “The self-organizing map”, Neurocomputing, v. 21, n. 1, pp. 1–6,1998.

[65] AGUAYO, L., BARRETO, G. A. “Novelty Detection in Time Series UsingSelf-Organizing Neural Networks: A Comprehensive Evaluation”, NeuralProcessing Letters, pp. 1–28, 2017.

[66] OLSZEWSKI, D. “Fraud detection using self-organizing map visualizing theuser profiles”, Knowledge-Based Systems, v. 70, pp. 324–334, 2014.

[67] HESKES, T. “Self-organizing maps, vector quantization, and mixture modeling”,IEEE Transactions on Neural Networks, v. 12, n. 6, pp. 1299–1305, 2001.

[68] TANG, J., SOUA, S., MARES, C., et al. “An experimental study of acousticemission methodology for in service condition monitoring of wind turbineblades”, Renewable Energy, v. 99, pp. 170–179, 2016.

[69] DREWRY, M., GEORGIOU, G. “A review of NDT techniques for windturbines”, Insight-Non-Destructive Testing and Condition Monitoring,v. 49, n. 3, pp. 137–141, 2007.

85

Page 103: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

[70] JASINIEN, E., RAIUTIS, R., VOLEIIS, A., et al. “NDT of wind turbineblades using adapted ultrasonic and radiographic techniques”, Insight-Non-Destructive Testing and Condition Monitoring, v. 51, n. 9, pp. 477–483,2009.

[71] GRUNEWALD, S. “New 3D Printing Material Mimics Light Weight BalsaWood for use in Wind Turbine Construction”, Retrieved, v. 11, n. 7, 2014.

[72] KATNAM, K., COMER, A., ROY, D., et al. “Composite repair in wind turbineblades: an overview”, The Journal of Adhesion, v. 91, n. 1-2, pp. 113–139,2015.

[73] SILVA, I. C. Avaliacao da Carburizacao em Acos HP por ensaio magneticonao-destrutivo. Tese de Doutorado, Universidade Federal do Rio de Janeiro,COPPE, 2006.

[74] BATISTA, G. E., PRATI, R. C., MONARD, M. C. “A study of the behaviorof several methods for balancing machine learning training data”, ACMSigkdd Explorations Newsletter, v. 6, n. 1, pp. 20–29, 2004.

[75] HUANG, J., LING, C. X. “Using AUC and accuracy in evaluating learningalgorithms”, IEEE Transactions on knowledge and Data Engineering, v. 17,n. 3, pp. 299–310, 2005.

[76] SOLBERG, H. E., LAHTI, A. “Detection of outliers in reference distributions:performance of Horn’s algorithm”, Clinical chemistry, v. 51, n. 12, pp. 2326–2332, 2005.

[77] JIANG, J. Large sample techniques for statistics. Springer Science & BusinessMedia, 2010.

86

Page 104: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

Apendice A

Trabalhos Publicados

Durante o desenvolvimento do trabalho, os artigos foram aceitos para apresentacaoem congressos nacionais listados a seguir:

A.1 Artigos apresentados em Congressos

Oliveira, M. A., Silva, L. C., Simas Filho, E. F., Silva, I. C., Albuquerque,M. C. S., Farias, C. T. T. “Deteccao de Novidades na Classificacao de Defeitos emJunta Soldada de Aco SAE 1020.” In: XXXIV Congresso Nacional de Ensaios NaoDestrutivos e Inspecao. Sao Paulo, 2016

Resumo: A classificacao automatica de defeitos em juntas soldadas utilizandoinspecao ultrassonica vem sendo estudada ha alguns anos. Diversas tecnicas comoredes neurais artificiais, arvores de decisao e discriminantes lineares foram utilizadascom sucesso. Entretanto, normalmente, os sistemas de classificacao sao projetadospara identificar sinais que pertencem a um numero limitado de classes, estabelecidopreviamente a partir das amostras disponıveis para treinamento. Se na operacaodo sistema ocorrer uma condicao diferente das existentes no treinamento (classe desinal desconhecida), ela sera associada a condicao conhecida mais semelhante. Essalimitacao pode representar um problema quando o conjunto de treinamento nao erepresentativo de todas as possıveis condicoes do material. Este trabalho propoeutilizar uma tecnica de projeto de sistemas de classificacao denominada ”deteccao denovidades”para identificacao de defeitos em juntas soldadas a partir de inspecoes porultrassom pela tecnica TOFD. Neste caso, o classificador sera capaz de reconheceruma amostra de entrada que nao pertence a nenhum dos padroes de treinamento,possibilitando maior flexibilidade ao sistema. Sinais de ultrassom TOFD, tomadospor varredura numa chapa de aco SAE1020 soldada onde existem diferentes tipos dedefeito, serao utilizados para alimentar um sistema de classificacao por redes neurais

87

Page 105: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

artificiais.

Oliveira, M. A., Simas Filho, E. F., Santos, Y. T. B, Silva, I. C., Albuquerque,M. C. S., Farias, C. T. T. “Identificacao de Danos em Pas de Turbinas EolicasUtilizando Classificacao Automatica Atraves de Deteccao de Novidades.” In: 14a

Conferencia sobre Tecnologia de Equipamentos, Rio de Janeiro, 2017.

Resumo: A utilizacao de energias renovaveis e, especialmente, a energia eolicavem crescendo anualmente no Brasil. Este tipo de geracao se mostra como umaalternativa viavel em decorrencia do potencial elevado de instalacao das usinas. Aintegridade e seguranca dos materiais empregados tem papel importante, necessitandode inspecao em intervalos regulares, principalmente aqueles que compoem as pas dasturbinas eolicas que estao sujeitas a maior desgaste em operacao. Os metodos declassificacao automatica de defeitos podem ser utilizados nos ensaios nao destrutivosultrassonicos para auxiliar no processo de tomada de decisao. Neste trabalho eproposta a aplicacao de um sistema de classificacao atraves da tecnica de deteccao denovidades com a analise de outliers para os sinais ultrassonicos coletados em corpos deprova obtidos a partir de pas eolicas. O sistema sera treinado utilizando apenas sinaisda condicao sem defeito. Para extracao de caracterısticas foram utilizadas diferentestecnicas de processamento digital de sinais. A analise de componentes principaisfoi utilizada para selecao das caracterısticas mais representativas para descreveros sinais medidos, reduzindo a dimensao dos dados apresentados ao classificador.Os resultados mostram que o sistema de classificacao e capaz de contribuir para aidentificacao de defeitos produzidos durante o processamento das pas eolicas.

Silva, L. C., Oliveira, M. A., Simas Filho, E. F., Albuquerque, M. C. S., Silva,I. C., Farias, C. T. T. “Classificacao de falhas em solda por meio de maquina deaprendizado extremo aplicadas a inspecoes nao-destrutivas por ultrassom.” In: 14a

Conferencia sobre Tecnologia de Equipamentos, Rio de Janeiro, 2017.

Resumo: E utilizado um metodo de treinamento de Redes Neurais Artificiaisconhecido como Maquinas de Aprendizado Extremo para classificacao de defeitos eminspecoes nao- destrutivas por ultrassom em regioes de solda de chapas de aco-carbono.Essa estrategia de treinamento visa a diminuicao do esforco computacional necessariopara o desenvolvimento do classificador, sendo adequada para o uso em sistemasembarcados dedicados. As assinaturas espectrais (apos transformada de Fourier)dos sinais de defeitos comumente observados em soldas tais como falta de fusao,porosidade e inclusao de escoria, sao utilizadas para projetar e testar o metodo declassificacao proposto. O metodo e comparado com tecnicas de classificacao baseadas

88

Page 106: UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA · departamento de engenharia elÉtrica programa de pÓs-graduaÇÃo em engenharia elÉtrica sistemas inteligentes para detecÇÃo

em topologias de Redes Neurais Artificiais estabelecidas na literatura. Os resultadosobtidos indicam que o uso de Maquinas de Aprendizado Extremo e vantajoso sobo ponto de vista do tempo de treinamento do classificador em relacao aos outrosalgoritmos. Deste modo, o metodo proposto se apresenta como uma boa opcao paratreinamento em campo utilizando dispositivos portateis dedicados.

Rodrigues, L. F. M., Cruz, F. C., Simas Filho, E. F., Santos, Y. T. B, Oliveira,M. A., Silva, I. C., Albuquerque, M. C. S., Farias, C. T. T. “Sistema de classificacaoaplicado na deteccao de danos em pas de aerogeradores inspecionados por ultrassom.”In: 14a Conferencia sobre Tecnologia de Equipamentos, Rio de Janeiro, 2017.

Resumo: A contribuicao da geracao de energia eletrica, atraves da fonte eolica,aumentou nos ultimos anos no Brasil. Entre as vantagens da geracao eolica pode-sedestacar o preco competitivo da energia produzida e o fato do recurso primario serrenovavel. As pas sao componentes importantes de um gerador eolico e, geralmente,sao feitas de materiais compositos. As principais causas de defeitos nestes elementossao: descargas atmosfericas, esforcos mecanicos, desbalanceamentos, delaminacoes,etc. As tecnicas de inspecao nao destrutivas ultrassonicas sao comumente aplicadasna manutencao de equipamentos industriais. Contudo, devido as condicoes deoperacao dos aerogeradores e a natureza do material composito, as ondas ultrassonicaspodem sofrer atenuacao e dispersao, dificultando a interpretacao dos resultadosdiretamente pelo operador. Neste trabalho, utilizou-se tecnicas de inteligenciaartificial e processamento digital de sinais para a deteccao de defeitos em secoes depas eolicas. Os corpos de prova foram ensaiados pela tecnica ultrassonica por imersaonao convencional, Bubbler. A transformada de Fourier foi utilizada na extracao decaracterısticas e um sistema de suporte a decisao, baseado em arvore de decisao,foi implementado. O sistema proposto alcancou eficiencia media superior a 97% naclassificacao dos sinais.

89