prediÇÃo de propriedades mecÂnicas de aÇos de … · prediÇÃo de propriedades mecÂnicas de...

128
PROGRAMA DE PÓS GRADUAÇÃO EM ENGENHARIA PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL Hiroshi Jorge Takahashi Dissertação submetida à banca examinadora designada pelo Colegiado do Programa de Pós-Graduação em Engenharia do Centro Universitário do Leste de Minas Gerais, como parte dos requisitos necessários à obtenção do grau de Mestre em Engenharia Industrial. Área de Concentração: Processos Industriais Orientador: Dr. Roselito de Albuquerque Teixeira Coronel Fabriciano, Dezembro de 2006

Upload: lenguyet

Post on 28-Jan-2019

217 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

PROGRAMA DE PÓS GRADUAÇÃO EM ENGENHARIA

PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOSDE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO

TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

Hiroshi Jorge Takahashi

Dissertação submetida à banca examinadora designada peloColegiado do Programa de Pós-Graduação em Engenharia doCentro Universitário do Leste de Minas Gerais, como partedos requisitos necessários à obtenção do grau de Mestre emEngenharia Industrial.Área de Concentração:Processos Industriais

Orientador: Dr. Roselito de Albuquerque Teixeira

Coronel Fabriciano, Dezembro de 2006

Page 2: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

PROGRAMA DE PÓS GRADUAÇÃO EM ENGENHARIA

PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOSDE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO

TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

Hiroshi Jorge Takahashi

Banca:

Prof. Roselito de Albuquerque Teixeira, Dr. - PPGE/Unileste-MG - Orientador.

Prof. Walmir Matos Caminhas, Dr. - PPGEE/UFMG.

Prof. Túlio Magno Füzessy de Melo, Dr. - USIMINAS.

Profa. Andréa Oliveira Souza da Costa, Dr. - PPGE/Unileste-MG.

Page 3: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

Quebra-galho

À Tânia, Denise e Isabela

Page 4: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

Agradecimentos

Agradeço a Tânia; minha esposa, amiga, auto-astral, incentivadora de primeira hora, meu"porto seguro"; e a Denise e Isabela, pelo amor, compreensão e por simplesmente existirem emminha vida. Agradeço também a Tia Taninha, que acolheu nossa família tornando-se a sua.

Agradeço aos meus pais pelo exemplo, pela valorização do conhecimento e por toda dedi-cação e suporte a mim dispensados. Aos meus irmãos Hiroko, Hissashi, Hiroito e Hideko, cadaum em sua "distância", torcedores incondicionais e participantes de todas as batalhas.

Agradeço aos professores Roselito de Albuquerque Teixeira e Marcelo Vieira Corrêa, com-panheiros de longa data, pela amizade, atenção, confiança, apoio durante todo o curso e pelaperseverança em implantar o Programa de Pós graduação em Engenharia no Unileste. Emespecial ao Prof. Roselito de Albuquerque Teixeira, meu orientador neste trabalho, pela com-petência, dedicação, presteza, discussões e precisão nos comentários.

Agradeço aos professores Andréa, Elsy e Figueiredo, pela dedicação e contribuição paraconsolidação do programa.

Agradeço aos colegas da equipe de automação da laminação a frio que através do convívionos permitem crescer enquanto pessoas e conhecermos melhor a nós mesmos, em especialao Flávio e Wanderley, pelas palavras de incentivo diário e ao Cid pelas longas discussõese troca de experiências. Agradeço também ao Bruno e Gláucio pelas discussões e preciosascontribuições para esse trabalho.

Agradeço a todos os colegas do mestrado pela união em torno de um objetivo comum,fazendo com que o fardo parecesse mais leve, em especial, Aline, Belini, Custódio, Marluce,Nilton, Leonardo, Rodrigo, "Ronaldos", Souza e Tavares.

Agradeço ao Flávio Granato pela contribuição dada na elaboração das figuras.

À USIMINAS - Usinas Siderúrgicas de Minas Gerais, pela oportunidade, confiança e apoionecessários à participação no curso e ao desenvolvimento do trabalho.

Agradeço a Deus pela vida!

Page 5: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

Quebra-galho

"A mente que se abre a uma nova idéiajamais voltará ao seu tamanho original."

Albert Einstein

Page 6: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

Resumo

Este trabalho apresenta o estudo e a aplicação de técnicas de inteligência computacionalpara predição de propriedades mecânicas de aços, quais sejam, Limite de Escoamento, Limitede Resistência e Alongamento. São investigadas as técnicas de Redes Neurais Artificiais eSistemas HíbridosNeuro-fuzzy.

São apresentados procedimentos para o pré-processamento dos dados de entrada, incluindoa identificação automática deoutiliersem bases de dados multivariáveis e a redução da dimen-sionalidade através da análise de componentes principais.

É detalhado o projeto de Redes neurais artificiais do tipoMultilayer Perceptrontreinadascom o algoritmoBackpropagatione são aplicadas estratégias para elevar a capacidade de ge-neralização comoEarly Stopping, Pruning e Regularização Bayesiana. Visando melhorar odesempenho, a robustez e também a capacidade de generalização das Redes Neurais Artificiaiso método deEnsemble Modellingtambém é empregado.

É implementada a análise de sensibilidade das saídas do "modelo neural" em relação àsvariáveis de entrada.

Para tornar viável a implementação de sistemas Neuro-Fuzzy com elevado número de en-tradas foram investigadas técnicas declusterizaçãodos dados de entrada e aplicado o métodosubtractive clustering.

São aplicadas também as técnicasforward selectione backward selectionpara seleção dasvariáveis de entrada mais importantes para a modelagem utilizando sistemas híbridos Neuro-fuzzy, e é proposta uma nova alternativa para seleção das variáveis mais importantes combi-nando a análise de sensibilidade da RNA com o métodoforward selection.

Os bons resultados obtidos com a aplicação de ambas as técnicas, usando dados reais deprocesso, mostram que tanto as Redes Neurais Artificiais quanto os Sistemas HíbridosNeuro-fuzzyapresentam condições de serem implementados em ambiente de produção para a prediçãode propriedades mecânicas de aços HSLA.

Page 7: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

v

No trabalho é apresentada uma ferramenta para predição de propriedades mecânicas deaços HSLA, desenvolvida em ambiente Windows e disponibilizada para testes em ambienteindustrial, cujos resultados têm sido considerados pelos especialistas como coerentes e promis-sores.

Page 8: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

AbstractThis work presents the application of Computational Intelligence Methods for the predic-

tion of mechanical properties, yield strength, tensile strength and elongation, of strip steel.Neural networks and hybrid neuro-fuzzy modelling techniques are investigated.

Some tools for input data pre-processing are presented, including automatic identificationof multivariate outliers and principal components analysis.

The design of Multilayer Perceptrons (MLPs) neural network trained with back-propagationalgorithm is detailed including methods for improving generalization of (MLPs), such asEarlyStopping, PruningandBayesian Regularization. Ensemble Modellingmethod was applied inorder to improve performance, robustness and also generalization of neural networks.

An empirical method for determining the neural model output’s sensitivity to its inputs isimplemented.

Clustering techniques were investigated to allow the implementation of a hybrid neuro-fuzzy model, since the number of inputs is not small andsubtractive clusteringwas adopted.Methods for selecting the most important set of input variables when building a neuro-fuzzymodel, forward selectione backward selectionwere tested, and a new approach combiningsensitivity of the neural model and forward selection is proposed.

The results achieved using actual process data show that both methods, Artificial NeuralNetworks and Hybrid Neuro-fuzzy, present good performance for the problem solution andthey are in condition to be tested in a real industrial steel production environment.

A tool for mechanical properties prediction was developed in Windows environment for in-dustrial use and the initial results has been considered by the metallurgists coherent and promis-ing.

Page 9: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

Sumário

1 Introdução 1

1.1 Motivação . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

1.2 Objetivos . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

1.3 Organização do Texto . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . 4

2 Métodos de Inteligência Computacional 5

2.1 Introdução . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

2.2 Sistemas de inferência nebulosa. . . . . . . . . . . . . . . . . . . . . . . . . 5

2.2.1 Conjuntos clássicos . . .. . . . . . . . . . . . . . . . . . . . . . . . . 6

2.2.2 Conjuntos nebulosos . .. . . . . . . . . . . . . . . . . . . . . . . . . 7

2.2.3 Regras Se-Então e sistemas de inferência nebulosa . . . .. . . . . . . 10

2.3 Redes neurais artificiais . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . 13

2.3.1 Modelo de um neurônio. . . . . . . . . . . . . . . . . . . . . . . . . 15

2.3.2 Funções de ativação . .. . . . . . . . . . . . . . . . . . . . . . . . . 16

Page 10: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

viii

2.3.3 Arquiteturas de RNAs .. . . . . . . . . . . . . . . . . . . . . . . . . 17

2.3.4 Processo de apredizagem supervisionado em RNAs . . . .. . . . . . . 20

2.3.5 Algoritmoback-propagation. . . . . . . . . . . . . . . . . . . . . . . 21

2.3.6 Métodos de segunda ordem . . . . .. . . . . . . . . . . . . . . . . . 24

2.3.7 Generalização em RNAs. . . . . . . . . . . . . . . . . . . . . . . . . 25

2.3.8 Parada antecipada do treinamento . .. . . . . . . . . . . . . . . . . . 27

2.3.9 Algoritmo de regularização bayesiana. . . . . . . . . . . . . . . . . . 28

2.3.10 Algoritmo dePruning Optimal brain surgeon. . . . . . . . . . . . . . 29

2.3.11 Métodoensemble modelling. . . . . . . . . . . . . . . . . . . . . . . 31

2.4 Sistemas híbridosneuro-fuzzy . . . . . . . . . . . . . . . . . . . . . . . . . . 32

2.4.1 O sistema ANFIS . . . .. . . . . . . . . . . . . . . . . . . . . . . . . 33

2.4.2 O treinamento do sistema ANFIS . .. . . . . . . . . . . . . . . . . . 35

2.4.3 Seleção das entradas para o sistema ANFIS .. . . . . . . . . . . . . . 36

3 Descrição do Processo 38

3.1 Introdução . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

3.2 O processo de produção de tiras de aço em uma usina integrada a coque . . . . 38

3.3 Etapas do processo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

3.3.1 Preparação do minério e do carvão . .. . . . . . . . . . . . . . . . . . 41

3.3.2 Redução do minério de ferro . . . . .. . . . . . . . . . . . . . . . . . 41

Page 11: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

ix

3.3.3 Refino . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42

3.3.4 Conformação mecânica .. . . . . . . . . . . . . . . . . . . . . . . . . 44

3.3.5 Conclusão da seção . . .. . . . . . . . . . . . . . . . . . . . . . . . . 49

3.4 Propriedades mecânicas de aços. . . . . . . . . . . . . . . . . . . . . . . . . 49

3.4.1 Conceitos básicos . . . .. . . . . . . . . . . . . . . . . . . . . . . . . 49

3.4.2 Limite de escoamento - LE . . . . . .. . . . . . . . . . . . . . . . . . 50

3.4.3 Limite de resistência - LR . . . . . .. . . . . . . . . . . . . . . . . . 51

3.4.4 Ductilidade - ALO . . .. . . . . . . . . . . . . . . . . . . . . . . . . 51

3.4.5 Máquina de ensaio de tração da USIMINAS .. . . . . . . . . . . . . . 52

3.5 Aços de alta resistência microligados . . . . .. . . . . . . . . . . . . . . . . . 53

4 Predição das Propriedades Mecânicas de Aços HSLA 55

4.1 Introdução . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55

4.2 Seleção e pré-processamento das variáveis de entrada. . . . . . . . . . . . . . 55

4.2.1 Seleção das variáveis de entrada . . .. . . . . . . . . . . . . . . . . . 56

4.2.2 Coleta de dados . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . 58

4.2.3 Análise estatística das variáveis . . .. . . . . . . . . . . . . . . . . . 58

4.2.4 Identificação automática deoutliers . . . . . . . . . . . . . . . . . . . 58

4.2.5 Normalização das variáveis . . . . .. . . . . . . . . . . . . . . . . . 62

4.2.6 Redução da dimensionalidade utilizando PCA. . . . . . . . . . . . . . 62

Page 12: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

x

4.2.7 Agrupamento de dados .. . . . . . . . . . . . . . . . . . . . . . . . . 63

4.3 Predição utilizando regressão linear múltipla .. . . . . . . . . . . . . . . . . . 64

4.4 Predição através de RNAs . . .. . . . . . . . . . . . . . . . . . . . . . . . . 66

4.4.1 Arquitetura de RNAs . .. . . . . . . . . . . . . . . . . . . . . . . . . 66

4.4.2 Treinamentos realizados. . . . . . . . . . . . . . . . . . . . . . . . . 69

4.4.3 Análise de sensibilidade. . . . . . . . . . . . . . . . . . . . . . . . . 80

4.5 Predição através de sistemas híbridosneuro-fuzzy . . . . . . . . . . . . . . . . 81

4.5.1 SistemasNeuro-fuzzydesenvolvidos .. . . . . . . . . . . . . . . . . . 82

4.5.2 Conclusão .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90

5 Ferramenta Off-line para Predição de Propriedades Mecânicas e Parâmetros de

Processo 91

5.1 Introdução . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91

5.2 Benefícios esperados . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . 91

5.3 RNA para predição de parâmetros de processo. . . . . . . . . . . . . . . . . . 92

5.4 A ferramenta . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94

6 Considerações Finais 98

6.1 Conclusões . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99

6.2 Sugestões para trabalhos futuros. . . . . . . . . . . . . . . . . . . . . . . . . 99

Page 13: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

Lista de Figuras

2.1 Operações entre conjuntos - União:A ∪ B, Interseção:A ∩ B e Complemento:¬A. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

2.2 Funções de pertinência mais comuns. . . . .. . . . . . . . . . . . . . . . . . 8

2.3 Funções de Pertinência típicas para os valores linguísticosjovem, meia-idadeevelho. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

2.4 Operações sobre conjuntos nebulosos. . . . .. . . . . . . . . . . . . . . . . . 10

2.5 Sistema de inferência nebulosa. .. . . . . . . . . . . . . . . . . . . . . . . . . 12

2.6 Regras se-então e mecanismos de inferência nebulosos normalmente usados. . . 13

2.7 Modelo de um neurônio. . . . .. . . . . . . . . . . . . . . . . . . . . . . . . 16

2.8 Funções de ativação: (a) função limiar, (b) função linear, (c) função linear porpartes, (d) função sigmoidal tangente hiperbólica. . .. . . . . . . . . . . . . . 17

2.9 RNAFeedforwardde uma única camada. . .. . . . . . . . . . . . . . . . . . 18

2.10 RNAfeedforward, com duas camadas e totalmente conectada. . .. . . . . . . 19

2.11 RNA recorrente. . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

2.12 Aprendizagem supervisionada. .. . . . . . . . . . . . . . . . . . . . . . . . . 21

2.13 Problema do ajuste do modelo -Underfitting, Ajuste Adequado eOverfitting. . 26

2.14 Comportamento dos erros de treinamento e validação no treinamento com da-dos ruidosos. . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

2.15 (a) Sistema de inferência nebuloso tipo 3 (Sugeno) com 2 entradas; (b) sistemaANFIS equivalente.. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

Page 14: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

xii

3.1 Fluxo de produção de uma usina siderúrgica integrada a coque. . .. . . . . . . 40

3.2 Fluxo de produção da redução do minério de ferro. .. . . . . . . . . . . . . . 42

3.3 Fluxo de produção da etapa de refino do aço.. . . . . . . . . . . . . . . . . . 43

3.4 Fluxo de produção da laminação a quente. . .. . . . . . . . . . . . . . . . . . 46

3.5 Fluxo de produção da laminação a frio. . . . .. . . . . . . . . . . . . . . . . . 48

3.6 Fluxo de produção completo com identificação dos processos onde foram cole-tados dados para o modelo. Entradas: elipses cheias. Saída: elipse tracejada. . . 50

3.7 Diagrama tensão x deformação típico. . . . .. . . . . . . . . . . . . . . . . . 51

3.8 Máquina de ensaio de tração. . .. . . . . . . . . . . . . . . . . . . . . . . . . 52

4.1 Carga de laminação.. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58

4.2 Histograma - Carga de laminação. . . . . . .. . . . . . . . . . . . . . . . . . 58

4.3 Outliers do conjunto multivariável identificados pelo método da distância deMahalanobis apresentados sobre a variável ’Temperatura do forno SF’. . . . . . 60

4.4 RNN - Rede Neural Replicadora, mostrando as 5 camadas e o vetor de entradasV que é também o vetor de saídas desejadas. .. . . . . . . . . . . . . . . . . . 60

4.5 Outliersdo conjunto multivariável identificados pela RNN apresentados sobrea variável ’Temperatura do forno SF’. . . . .. . . . . . . . . . . . . . . . . . 61

4.6 Histogramas dos Erros percentuais e Erros percentuais médios (EPM) usandoregressão linear múltipla. . . . .. . . . . . . . . . . . . . . . . . . . . . . . . 65

4.7 Análise de correlação (R:Coeficiente de correlação) dos resultados de prediçãousando regressão linear múltipla.. . . . . . . . . . . . . . . . . . . . . . . . . 65

4.8 Histogramas dos Erros percentuais e Erros percentuais médios (EPM) da RNAusando LM com parada antecipada pelo erro de validação e normalização entre-1 e +1. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70

4.9 Análise de correlação (R:Coeficiente de correlação) dos resultados de prediçãoda RNA usando LM com parada antecipada pelo erro de validação e normali-zação entre -1 e +1.. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71

Page 15: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

xiii

4.10 Histogramas dos Erros percentuais e Erros percentuais médios (EPM) da RNAusando LM com parada antecipada pelo erro de validação e normalização commédia 0 e desvio padrão 1. . . .. . . . . . . . . . . . . . . . . . . . . . . . . 72

4.11 Análise de correlação (R:Coeficiente de correlação) dos resultados de prediçãoda RNA usando LM com parada antecipada pelo erro de validação e normali-zação com média 0 e desvio padrão 1. . . . .. . . . . . . . . . . . . . . . . . 72

4.12 Histogramas dos Erros percentuais e Erros percentuais médios (EPM) da RNAusando LM com regularização bayesiana e normalização entre -1 e +1. . . . . . 73

4.13 Análise de correlação (R:Coeficiente de correlação) dos resultados de prediçãoda RNA usando LM com regularização bayesiana e normalização entre -1 e +1. 73

4.14 Histogramas dos Erros percentuais e Erros percentuais médios (EPM) da RNAusando LM com regularização bayesiana e normalização com média 0 e desviopadrão 1. . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74

4.15 Análise de correlação (R:Coeficiente de correlação) dos resultados de prediçãoda RNA usando LM com regularização bayesiana e normalização com média 0e desvio padrão 1. .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74

4.16 Histogramas dos Erros percentuais e Erros percentuais médios (EPM) da RNAusando LM com regularização bayesiana, redução por PCA e normalização commédia zero e desvio padrão 1. . .. . . . . . . . . . . . . . . . . . . . . . . . . 75

4.17 Análise de correlação (R:Coeficiente de correlação) dos resultados de prediçãoda RNA usando LM com regularização bayesiana, redução por PCA e normali-zação com média 0 e desvio padrão 1. . . . .. . . . . . . . . . . . . . . . . . 76

4.18 Histogramas dos Erros percentuais e Erros percentuais médios (EPM) da RNAusando técnica depruninge normalização entre -1 e +1. . . . . . .. . . . . . . 77

4.19 Análise de correlação (R:Coeficiente de correlação) dos resultados de prediçãoda RNA usando técnica depruninge normalização entre -1 e +1. .. . . . . . . 77

4.20 Histogramas dos Erros percentuais e Erros percentuais médios (EPM) usandoEnsemble model. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78

4.21 Análise de correlação (R:Coeficiente de correlação) dos resultados de prediçãousandoEnsemble model. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79

Page 16: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

xiv

4.22 Sensibilidade relativa das saídas da RNA às entradas.. . . . . . . . . . . . . . 81

4.23 Histogramas dos Erros percentuais e Erros percentuais médios (EPM) dos sis-temasneuro-fuzzyusando todas as entradas . .. . . . . . . . . . . . . . . . . . 83

4.24 Análise de correlação (R:Coeficiente de correlação) dos resultados de prediçãodos sistemasneuro-fuzzyusando todas as entradas. .. . . . . . . . . . . . . . 84

4.25 Histogramas dos Erros percentuais e Erros percentuais médios (EPM) dos sis-temasneuro-fuzzyusandobackward selection. . . . . . . . . . . . . . . . . . . 85

4.26 Análise de correlação (R:Coeficiente de correlação) dos resultados de prediçãodos sistemasneuro-fuzzyusandobackward selection. . . . . . . . . . . . . . . 85

4.27 Histogramas dos Erros percentuais e Erros percentuais médios (EPM) dos sis-temasneuro-fuzzyusandoforward selection. . . . . . . . . . . . . . . . . . . . 86

4.28 Análise de correlação (R:Coeficiente de correlação) dos resultados de prediçãodos sistemasneuro-fuzzyusandoforward selection. . . . . . . . . . . . . . . . 87

4.29 Histogramas dos Erros percentuais e Erros percentuais médios (EPM) dos sis-temasneuro-fuzzyusando o método combinado de Análise de sensibilidade eforward selection. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88

4.30 Análise de correlação (R:Coeficiente de correlação) dos resultados de prediçãodos sistemasneuro-fuzzyusando o método combinado de Análise de sensibili-dade eforward selection. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88

5.1 Fluxo de produção completo com identificação dos processos onde foram co-letados dados para o modelo de predição de parâmetros de processo. Entradas:elipses cheias. Saídas: elipses tracejadas. . . .. . . . . . . . . . . . . . . . . . 93

5.2 Interface gráfica da ferramenta de predição de propriedades mecânicas paraaços HSLA, laminados a frio e revestidos por imersão a quente. .. . . . . . . 96

5.3 Interface gráfica da ferramenta de predição de parâmetros de processo para in-tegração das linhas de produção CAPL e CGL. . . .. . . . . . . . . . . . . . 97

Page 17: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

Lista de Tabelas

2.1 Operações sobre conjuntos nebulosos. . . . .. . . . . . . . . . . . . . . . . . 11

2.2 Treinamento híbrido do sistema ANFIS. . . .. . . . . . . . . . . . . . . . . . 35

3.1 Valores de composição química [%] para aços HSLA - FONTE: Norma EN10292. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

3.2 Garantias de propriedades mecânicas para aços HSLA - FONTE: Norma EN10292. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

4.1 Variáveis de entrada. . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . 57

4.2 Médias e Desvios padrão (SD) dos erros de predição de propriedades mecânicaspara aços HSLA, usando regressão linear, regressão não linear quadrática (Q) ecúbica (C) - FONTE: (Jones et al., 2005). . .. . . . . . . . . . . . . . . . . . 66

4.3 Erro médio quadrático (MSE) dos treinamentos de RNAs com uma e duas ca-madas intermediárias. . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . 68

4.4 Resumo dos resultados de Erro médio quadrático (MSE) das RNAs na prediçãodas propriedades mecânicas. . .. . . . . . . . . . . . . . . . . . . . . . . . . 79

4.5 Resumo dos resultados da análise de correlação (R:Coeficiente de correlação)das RNAs para predição de propriedades mecânicas.. . . . . . . . . . . . . . 80

4.6 Número de entradas de cada sistemaneuro-fuzzygerado pelo métodobackwardselection. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84

4.7 Número de entradas de cada sistemaneuro-fuzzygerado pelo métodoforwardselection. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86

Page 18: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

xvi

4.8 Número de entradas de cada sistemaneuro-fuzzygerado pelo método combi-nado de Análise de sensibilidade eforward selection. . . . . . . . . . . . . . . 87

4.9 Resumo dos resultados, Erro médio quadrático (MSE) e análise de correlação(R:Coeficiente de correlação), obtidos nas implementações de sistemasneuro-fuzzypara predição de propriedades mecânicas. . . .. . . . . . . . . . . . . . 89

4.10 Resumo dos melhores resultados, Erro médio quadrático (MSE) e análise decorrelação (R:Coeficiente de correlação), obtidos na predição de propriedadesmecânicas usando Regressão linear múltipla, RNAs (única eensemble) e sis-temas híbridosneuro-fuzzy. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90

5.1 Resumo dos resultados do Erro percentual médio (EPM) das RNAs para prediçãode parâmetros de processo para integração das linhas de produção CAPL e CGL. 94

5.2 Resultados de propriedades mecânicas obtidas em experimentos realizados comparâmetros de processo fornecidos pelas RNAs projetadas para a integração dasplantas CAPL e CGL. . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . 95

Page 19: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

Lista de Algoritmos

1 Estratégia de treinamento para se obter a melhor RNA. . . . . . . . . . . . . . 69

Page 20: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

Siglas e Abreviações

ALO ALOngamentoCAPL Linha de recozimento contínuo

(Continuos Annealing Processing Line)CGL Linha de galvanização por imersão a quente

(Continuos Galvanizing Line)ANFIS Sistemas de inferêncianeuro-fuzzyadaptativos

(Adaptive Neuro-Fuzzy Inference Systems)EP Erro PercentualEPM Erro Percentual MédioHSLA Aços de alta resistência microligados

(High Strength Low Alloy)IC Inteligência ComputacionalLE Limite de EscoamentoLM Algoritmo de otimização proposto por Levemberg MarquardtLR Limite de ResistênciaMLP Redes neurais multi-camadas

(Multilayer Perceptron)MSE Média do somatório dos erros quadráticos

(Mean Squared Errors)PCA Análise de componentes principais

(Principal Components Analysis)RBF Redes de funções de base radiais

(Radial Basis Function)RMSE Raiz quadrada da média do somatório dos erros quadráticos

(Root Mean Squared Errors)RNA Rede Neural ArtificialRNN Redes neurais replicadoras

(Replicator Neural Network)

Page 21: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

xix

SD Desvio padrão(Standard Deviation)

USIMINAS Usinas SIderúrgicas de MINASGerais S.A.

Page 22: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

Capítulo 1

Introdução

A competição acirrada na siderurgia mundial tem forçado os fabricantes a estreitar cada vezmais as faixas de tolerâncias dimensionais e de propriedades mecânicas dos produtos. Dessaforma, a obtenção de propriedades mecânicas especificadas, tais comoLimite de escoamento,Limite de resistênciae Alongamentoé um aspecto crucial para a indústria siderúrgica.

Modelos físicos fenomenológicos formam a base para a compreensão dos processos, poréma construção de tais modelos para processos complexos, multidimensionais e com relaciona-mentos não-lineares pode ser uma tarefa altamente complexa, além de exigir alto consumo detempo (Myllykoski et al., 1996). No caso das propriedades mecânicas de aços, apenas o co-nhecimento físico disponível destes processos, como por exemplo o tratamento térmico, nãopermite a construção de modelos físicos confiáveis (Mahfouf et al., 2005).

Uma abordagem à luz datentativa e erropara solucionar o problema muitas vezes é levadaem conta pela indústria, com elevado investimento tanto de tempo quanto financeiro, baixaconfiabilidade e baixa capacidade de predição (Chen e Linkens, 1999).

Como os processos industriais modernos estão geralmente associados a grandes massas dedados, modelos empíricos também têm sido usados para descrever tais processos (Tenner et al.,2001).

Na tentativa de superar os problemas citados pela modelagem convencional, técnicas de in-teligência computacional1 têm sido propostas como alternativas viáveis para modelagem onde

1Inteligência computacional (IC) poderia ser definida como um conjunto de modelos, algoritmos, técnicas,ferramentas e aplicações, em um sistema computadorizado, que emula algumas das habilidades cognitivas dohomem (Allard e Fuchs, 1993).

Page 23: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

2

abordagens convencionais têm apresentados resultados insatisfatórios.

Técnicas de inteligência computacional inspiradas em habilidades humanas e classificadascomoaproximadores universais de funções, redes neurais artificiais e sistemas híbridosneuro-fuzzy, têm sido pesquisadas para predição de propriedades mecânicas de materiais (Myllykoskiet al., 1996; Liu et al., 1996; Myllykoski, 1997; Dumortier et al., 1998; Chen e Linkens, 1999;Warde e Knowles, 1999; Femminela et al., 1999; Tenner et al., 2001; Yang e Linkens, 2001;Abbod et al., 2003; Jones et al., 2005; Sterjovski et al., 2005).

As Redes neurais artificiais são implementações computacionais que simulam os proces-sos que ocorrem no cérebro e no sistema nervoso humano (Sterjovski et al., 2005), capazes deaprender através de exemplos. Bons resultados têm sido obtidos pela utilização de redes neuraisartificiais na modelagem de processos complexos. Uma rede neural do tipoMultilayer Percep-tron (MLP) com algoritmo de aprendizadobackpropagationse mostrou capaz de realizar comprecisão a predição de propriedades mecânicas de tiras de aço (Myllykoski, 1997).

Os sistemas híbridosneuro-fuzzy, segundo Jang et al. (1997), combinam a representaçãoexplícita do conhecimento e a capacidade de tratar informações linguísticas da lógicafuzzy,baseada na teoria de conjuntos nebulosos proposta por Zadeh (1965), com a capacidade deaprendizagem das redes neurais artificiais (Haykin, 1999).

Segundo Jones et al. (2005), são óbvios os benefícios da utilização das técnicas de in-teligência computacional para predição das propriedades mecânicas e podem ser destacados:

1. a possibilidade de se confirmar as propriedades mecânicas em tempo real em cada fasedo processo;

2. a possibilidade de otimização da composição química e dos parâmetros de processo;

3. o suporte para realização de ações defeed-forwardnos diversos processos da cadeia deprodução;

4. a redução do tempo e volume de produção experimental envolvidos no projeto de aços.

Baseando-se nas evidências promissoras das pesquisas realizadas, este trabalho detalha umcaso real de aplicação das técnicas de redes neurais artificiais e sistemas híbridosneuro-fuzzypara a predição das propriedades mecânicas de aços de alta resistência microligados - HSLA(High Strength Low Alloy), laminados a frio e revestidos por imersão a quente.

As propriedades mecânicas; LE (Limite de escoamento), LR (Limite de resistência) e ALO(Alongamento); são influenciadas em várias das etapas do processo de fabricação do aço. Cada

Page 24: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

1.1 Motivação 3

uma destas etapas pode ser considerada uma unidade fabril distinta dentro de uma usina siderúr-gica integrada. Dessa forma, o processo de modelagem das propriedades mecânicas envolve autilização de dados oriundos de grande parte da gama de etapas do processo de produção doaço. Essas considerações dificultam a modelagem através de uma abordagem fenomenológica.

1.1 Motivação

Tradicionalmente, as propriedades mecânicas dos produtos siderúrgicos são obtidas atravésde testes mecânicos em laboratórios. Considerando-se que um produto siderúrgico, laminado afrio típico, possui um tempo total de fabricação (lead time) de cerca de dois meses (PROMINP,2006), o não atingimento dos valores especificados de propriedades mecânicas representa umsério transtorno para os fabricantes de aço. Um outro complicador é a variabilidade das pro-priedades dentro de um mesmo produto (Jones et al., 2005)

Com o desenvolvimento dehardwaree o advento das técnicas de inteligência computa-cional abre-se a possibilidade de se desenvolver ferramentas para realizar a predição destaspropriedades em tempo real nas diversas etapas do processo de produção do aço.

A possibilidade da utilização de uma ferramenta de apoio a decisão para predição de pro-priedades mecânicas permite vislumbrar os seguintes benefícios:

• o auxílio no projeto de aços, basicamente o desenvolvimento de novas ligas e condiçõesde processo, bem como a otimização de composição de ligas existentes;

• a redução da variabilidade das propriedades mecânicas nos produtos em função da definiçãode ações defeedforwardao longo das etapas do processo;

• a redução nos custos e prazos de experiências desenvolvidas em ambiente industrial. De-vido a produção em larga escala, característica comum nos processos da indústria siderúr-gica, a realização de experiências é bastante restrita.

1.2 Objetivos

Os objetivos deste trabalho são:

1. investigar as técnicas de inteligência computacional - Redes Neurais Artificiais e sistemashíbridosneuro-fuzzy;

Page 25: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

1.3 Organização do Texto 4

2. aplicar as técnicas investigadas no problema de predição de propriedades mecânicas deaços HSLA laminados a frio e revestidos;

3. desenvolver em ambiente Windows uma ferramenta de apoio à decisão para: prediçãode propriedades mecânicas e auxílio no projeto de aços e; predição de parâmetros deprocesso para integração das linhas de produção CAPL (Recozimento Contínuo) e CGL(Galvanização por imersão a quente) da USIMINAS.

1.3 Organização do Texto

Este texto está organizado da seguinte forma:

Capítulo 2: Métodos de Inteligência Computacional.Este capítulo apresenta uma revisãobibliográfica dos métodos de inteligência computacional investigados e aplicados no trabalho,redes neurais artificiais e sistemas híbridosneuro-fuzzy. No caso das redes neurais são discu-tidos algoritmos que buscam modelos neurais com elevada capacidade de generalização. Paraos sistemas híbridosneuro-fuzzysão abordadas questões relativas à implementação de sistemascom elevado número de entradas e também técnicas para seleção das variáveis mais importantespara o modelo.

Capítulo 3: Descrição do Processo.Primeiramente, é apresentado todo o processo de fa-bricação de aço em uma usina siderúrgica integrada a coque. Em seguida, são caracterizados osaços de alta resistência microligados e detalhadas as propriedades mecânicas a serem buscadasna sua produção. É abordado ainda o ensaio de tração, realizado em laboratório, no qual sãoobtidas as propriedades mecânicas.

Capítulo 4: Predição das Propriedades Mecânicas de Aços HSLA.Este capítulo apresentatodo o desenvolvimento realizado no trabalho. Descreve-se a seleção e o pré-processamento dasvariáveis a serem utilizadas na modelagem, as diversas implementações realizadas utilizando-seos métodos de inteligência computacional e discutem-se resultados obtidos.

Capítulo 5: Ferramenta Off-line para Predição de Propriedades Mecânicas.Neste capítuloé apresentada a implementação em ambienteWindowsde uma ferramentaofflinepara prediçãodas propriedades mecânicas de aços HSLA e integração das linhas de produção CAPL e CGL.

Capítulo 6: Considerações Finais.Este capítulo apresenta as conclusões da dissertação esugestões para trabalhos futuros.

Page 26: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

Capítulo 2

Métodos de Inteligência Computacional

2.1 Introdução

Esse capítulo introduz os métodos de inteligência computacional, RNAs e sistemas híbridosneuro-fuzzy, os quais foram aplicados no presente trabalho.

Como mencionado no capítulo 1, estes métodos foram selecionados por terem sido utiliza-dos com sucesso para predição de propriedades mecânicas de materiais.

Na primeira parte deste capítulo será realizada uma breve apresentação dos conceitos deconjuntos nebulosos e de sistemas de inferência nebulosa. Na sequência são apresentas asRNAs, o algoritmo de treinamento por retropropagação do erro (error back-propagation) e asdiversas estratégias aplicadas ao treinamento para se gerar modelos com elevada capacidade degeneralização. Finalmente os sistemas híbridosneuro-fuzzysão apresentados.

2.2 Sistemas de inferência nebulosa

Sistemas de inferência nebulosa, ou sistemas nebulosos, são implementações computa-cionais baseadas nos conceitos da teoria de conjuntos nebulosos, nas regrasSe-entãonebulosase na inferência nebulosa (Jang et al., 1997).

Nas teorias de controle convencionais, clássica e moderna, o primeiro passo para imple-mentar o controle de determinado processo é derivar o modelo matemático que descreve oprocesso, o que nem sempre é factível em função da complexidade do sistema. Quando a

Page 27: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

2.2 Sistemas de inferência nebulosa 6

modelagem do processo é impraticável, por exemplo em função do volume de dados a ser ma-nipulado ou no caso em que as informações disponíveis são variáveis qualitativas ou linguísticas1, estas situações inviabilizam a aplicação da maioria das teorias de controle convencionais. Agrande simplicidade de implementação de sistemas de controle nebuloso (fuzzy) pode reduzir acomplexidade de um projeto a um ponto em que problemas anteriormente intratáveis passam aser solúveis.

A modelagem e o controle nebulosos são técnicas para se manusear informações qualita-tivas, considerando a falta de exatidão e a incerteza, tornando-se ferramentas suficientementepoderosas para a manipulação conveniente do conhecimento (Gomide e Gudwin, 1994).

2.2.1 Conjuntos clássicos

A Teoria de Conjuntos Clássicaé a teoria matemática que trata das propriedades dos con-juntos e teve sua origem nos trabalhos do matemático russo Georg Cantor (1845 - 1918). Essateoria baseia-se na idéia de se definir conjunto como uma noção primitiva, também chamada deteoriaingênuaou intuitiva devido à descoberta de vários paradoxos relacionados à definição deconjunto. Segundo Cantor"a set is a collection into a whole M of definite and separate objectsm of our intuition or thought"(Seizing, 2005).

Na teoria de conjuntos clássica, um conjunto é descrito como uma coleção de objetos bemdefinidos. Neste contexto, cada objeto individualmente é referido como sendo um elementoou um membro do conjunto. Num dado conjunto, um objetox qualquer pode ou não ser umelemento deste conjunto e, de acordo com a teoria criada por Cantor, pertinência parcial não épermitida.

SejaX um espaço de objetos ex um elemento genérico deX. Um conjunto clássicoAé definido como uma coleção de objetos ou elementosx ∈ X, tal que cada elementox podepertencer ou não ao conjuntoA, A ⊆ X. Definindo uma função característica ou funçãode pertinência sobre cada elementox em X, um conjunto clássicoA pode ser representadopor um conjunto de pares ordenados(x,0) ou (x,1), sendo1 e 0 pertinência e não pertinênciarespectivamente.

A álgebra dos conjuntos é o estudo da criação de novos conjuntos a partir de conjuntos jádefinidos, utilizando por exemplo, operações de União, Interseção e Complemento. A Figura2.1 apresenta graficamente as operações citadas.

1Variáveis linguísticas: Variáveis cujos valores são palavras ou frases de uma linguagem natural (Zadeh, 1988),usualmente empregadas na comunicação humana.

Page 28: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

2.2 Sistemas de inferência nebulosa 7

Figura 2.1: Operações entre conjuntos - União:A ∪ B, Interseção:A ∩ B e Complemento:¬A.

2.2.2 Conjuntos nebulosos

A teoria de conjuntos nebulosos pode ser considerada como uma extensão da teoria deconjuntos clássica. O conceito formal de conjunto nebuloso foi introduzido por Zadeh (1965).

Definição 2.2.1"A fuzzy set (class)A in X is characterized by a membership function (char-acteristic function)µA(x) which associates with each point inX a real number in the interval[0,1], with the value ofµA(x) at x representing the grade of membership ofx in A" (Zadeh,1965).

Em contraste à teoria de conjuntos clássica, um conjunto nebuloso (fuzzy set) como opróprio nome diz, é um conjunto no qual a pertinência dos objetos não se resume asimounão(Jang et al., 1997). Neste caso a transição entre"pertencer a um conjunto"ou "não pertencera um conjunto"é gradual, e essa transição suave é caracterizada pelas funções de pertinênciaque dão aos conjuntos nebulosos flexibilidade para modelagem de expressões linguísticas, taiscomo"a água está quente"ou "a temperatura está alta"(Jang et al., 1997). Como apontadopor Zadeh (1965) essa abordagem"play an important role in human thinking, particularly inthe domains of pattern recognition, communication of information, and abstraction".

Diferentemente do conjunto clássico mencionado anteriormente, um conjunto nebuloso ex-pressa o grau de pertinência no qual um elemento pertence ao conjunto. Neste caso a funçãocaracterística de um conjunto nebuloso permite valores entre0 e 1, denotando o grau de per-

Page 29: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

2.2 Sistemas de inferência nebulosa 8

tinência de um elemento em um dado conjunto. SeX é uma coleção de objetos denotadosgenericamente porx, então um conjunto nebulosoA emX é definido como um conjunto depares ordenados:

A = {(x,µA(x))|x ∈ X} (2.1)

sendoµA(x) chamada a função de pertinência dex em A, que mapeiaX para o espaço depertinênciaM , M = [0,1]. QuandoX possui apenas dois pontos0 e 1, A é um conjunto nãonebuloso eµA(x) é idêntica à função de pertinência de um conjunto clássico.

A Figura 2.2 apresenta alguns tipos de funções de pertinência mais comuns.

0 5 100

0.2

0.4

0.6

0.8

1

Triangular

Gra

u de

Per

tinên

cia

0 5 100

0.2

0.4

0.6

0.8

1

Gaussiana

Gra

u de

Per

tinên

cia

0 5 100

0.2

0.4

0.6

0.8

1

Sino generalizada

Gra

u de

Per

tinên

cia

0 5 100

0.2

0.4

0.6

0.8

1

Trapezoidal

Gra

u de

Per

tinên

cia

Figura 2.2: Funções de pertinência mais comuns.

Como exemplo, considere-se um universo de discursoX = idade. EntãoA pode as-sumir vários termos linguísticos como,jovem, meia-idadee velhoque são caracterizados pelasfunções de pertinênciaµjovem(x), µmeia−idade(x) e µvelho(x). Funções de pertinência típicaspara estes valores linguísticos são apresentados na Figura 2.3.

Obviamente as funções de pertinência usadas na maioria das aplicações não são simplescomo as mostradas na Figura 2.2. Funções de pertinência podem ser dependentes de mais deuma variável ou depender de mais de um universo de discurso.

O tipo de função de pertinência a ser selecionado deve ser aquele que mais se adeque aoproblema. Como os conjuntos nebulosos são utilizados para modelagem do conhecimento, adefinição e a parametrização das funções de pertinência podem levar em conta a experiência e

Page 30: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

2.2 Sistemas de inferência nebulosa 9

Figura 2.3: Funções de Pertinência típicas para os valores linguísticosjovem, meia-idadee velho.

o conhecimento de especialistas no problema.

Assim como nos conjuntos clássicos pode-se verificar para os conjuntos nebulosos a exis-tência das operações de conjuntos correspondentes. SejamA e B dois conjuntos nebulososemU com funções de pertinênciaµA e µB respectivamente. As operações de conjuntos união(A ∪ B), interseção(A ∩B) e complemento(¬A) são definidas da seguinte forma:

µ(A∪B)(U) = µ(A)(U) ∨ µ(B)(U); disjunção nebulosaµ(A∩B)(U) = µ(A)(U) ∧ µ(B)(U); conjunção nebulosa

µ¬A(U) = 1 − µA(U)

sendo∨ e ∧ são operadores de união e interseção respectivamente. Exemplos de operadores∧ são as normas triangularest (e.g., mínimo, produto dentre outras). Definição: Uma normatriangular é uma funçãot:[0,1]x[0,1]→[0,1] tal que,∀ x, y, z, w ∈ [0,1]:

1. x t w ≤ y t z, se x ≤ y, w ≤ z

2. x t y = y t x3. (x t y) t z = x t (y t z)4. x t 0 = 0; x t 1 = x

Exemplos de operadores∨ são as co-normas triangularess (e.g., máximo, soma probabilística,soma limitada dentre outras). Definição: Uma co-norma triangular é uma funçãos:[0,1]x[0,1]→[0,1],satisfazendo as propriedades (1) a (3) acima e ainda:

5. x s0 = x; x s1 = 1

Page 31: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

2.2 Sistemas de inferência nebulosa 10

A Figura 2.4 apresenta graficamente as operações sobre conjuntos nebulosos e a Tabela 2.1mostra cada uma das operações realizadas detalhando as respectivas expressões, onde podemser vistos os operadores usados em cada operação.

Figura 2.4: Operações sobre conjuntos nebulosos.

2.2.3 Regras Se-Então e sistemas de inferência nebulosa

Regras nebulosas ou mais formalmente declarações condicionais nebulosas são expressõesda formaSe A Então B, sendoA e B variáveis de conjuntos nebulosos (fuzzy) caracterizadospor suas respectivas funções de pertinência. Devido a sua forma concisa as regrasSe - Entãosão empregadas para emular os modos imprecisos do raciocínio humano utilizados para tomadade decisões em ambientes de incerteza e imprecisão (Jang, 1992).

Um exemplo que descreve um simples fato é

Se a pressão é alta, então o volume é pequeno,

sendopressãoe volumevariáveis linguísticas ealta e pequenovalores linguísticos caracteriza-dos por funções de pertinência.

Como citado em Jang (1993), uma outra forma das regrasSe-Então, proposta por Takagi eSugeno, é usar conjuntos nebulosos apenas no antecedente da regra. Usando esta nova definição,pode-se descrever a forçaf de resistência a um objeto se movendo como:

Se a velocidade é alta, entãof = k ∗ (velocidade2).

Page 32: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

2.2 Sistemas de inferência nebulosa 11

Tabela 2.1: Operações sobre conjuntos nebulosos.

Operação Expressão

A ∪ B µA∪B(x) = max[µA(x),µB(x)]

A ∩ B µA∩B(x) = min[µA(x),µB(x)]

¬A µ¬A(x) = 1 − µA(x)

As regras de inferência constituem o núcleo de um sistema de inferência nebulosa, que serádetalhado a seguir.

Sistemas de inferência nebulosa (Fuzzy inference systems) são também conhecidos comosistemas baseados em regras nebulosas, sistemas nebulosos, modelos nebulosos ou contro-ladores nebulosos quando usados como controladores.

Um sistema de inferência nebulosa, representado na Figura 2.5, é composto por cinco blo-cos funcionais:

• base de regras- onde são armazenadas as regras nebulosasSe - Então;

• base de dados- onde são armazenadas os parâmetros das funções de pertinência dosconjuntos nebulosos usados nas regras nebulosas;

• mecanismo de inferência- parte do sistema onde são realizadas as inferências sobre asregras;

• nebulização- responsável por transformar as variáveiscrisp 2 em graus de pertinência;

• desnebulização- responsável por transformar a saída nebulosa num valor de saídacrisp.

2O termocrispaparece em oposição ao termofuzzy, com o significado de categórico, taxativo, concreto, nítidoe objetivo (Andrade, 2003).

Page 33: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

2.2 Sistemas de inferência nebulosa 12

Figura 2.5: Sistema de inferência nebulosa.

Normalmente a base de dados e a base de regras são referenciadas conjuntamente comobase de conhecimento.

De acordo com Jang (1993), há na literatura várias implementações de sistemas nebulosos,diversificando basicamente na maneira de realizar a inferência nebulosa e na definição das re-gras de inferência. A maioria dos sistemas, no entanto, pode ser classificada de acordo com ostrês tipos apresentados na Figura 2.6:

• tipo 1 - Neste tipo, conhecido por modelo nebuloso de Tsukamoto (Jang et al., 1997),o consequente de cada regra é representado por uma função de pertinência monotônica.A saída para cada regra é inferida a partir do resultado de uma operação de produtoou mínimo entre os graus de pertinência dos antecedentes. A saída geral é uma médiaponderada das saídas de cada regra, usando-se o resultado da operação de produto oumínimo dos antecedentes como peso de ponderação;

• tipo 2 - Neste tipo, conhecido por modelo nebuloso de Mamdani (Jang et al., 1997), asaída para cada regra é inferida a partir do resultado de uma operação de produto oumínimo entre os graus de pertinência dos antecedentes, nas funções de pertinência doconjunto nebuloso da saída. A saída nebulosa é calculada a partir da composição dassaídas de cada regra, usando-se por exemplo a operação de máximo. Há várias abordagenspara o cálculo da saídacrisp, sendo comum o uso do centróide da figura;

• tipo 3 - Neste tipo, conhecido por modelo nebuloso de Sugeno (Jang et al., 1997), oconsequente de cada regra é gerado a partir de uma combinação linear das variáveis deentrada. A saída geral é uma média ponderada das saídas de cada regra, usando-se o

Page 34: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

2.3 Redes neurais artificiais 13

Figura 2.6: Regras se-então e mecanismos de inferência nebulosos normalmente usados.

resultado da operação de produto ou mínimo dos antecedentes como peso de ponderação.No sistema de inferência nebulosa do tipo Sugeno temos conjuntos nebulosos nas entradase funções lineares na saída.

Na próxima seção será realizada uma introdução às Redes Neurais Artificiais e em seguidaserão apresentados os sistemas híbridosNeuro-fuzzyque combinam as técnicas de sistemas deinferência nebulosa com as redes neurais artificiais.

2.3 Redes neurais artificiais

Redes neurais artificiais (RNAs) têm sido aplicadas com sucesso nos mais diversos proble-mas, dentre os quais citam-se: controle de processos, classificação de padrões, aproximação defunções e predição (Teixeira, 2005).

O interesse no estudo e aplicação das RNAs pode em parte ser atribuído às propriedadesidentificadas nas RNAs, entre as quais destacam-se:

• não-linearidade;

Page 35: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

2.3 Redes neurais artificiais 14

• mapeamento de entrada-saída;

• adaptabilidade;

• generalização.

Uma rede neural pode ser projetada para representar funções não-lineares ou lineares. Estacaracterística é importante, uma vez que a maior parte dos problemas reais são regidos pordinâmicas não-lineares. A não-linearidade de uma RNA é de um tipo especial, uma vez que elaé distribuída por toda a rede (Haykin, 1999). A modelagem de fenômenos não-lineares é umatarefa de difícil execução, visto que as relações entre as variáveis de entrada e saída nem sempresão conhecidas.

Um paradigma de aprendizado bastante popular é o aprendizado supervisionado. Nesteparadigma de aprendizado são apresentados ao modelo neural um conjunto de treinamentocomposto de entradas e saídas desejadas, que são chamados de padrões de treinamento. Arede neural é capaz de mapear as saídas no espaço das entradas. Assim, a rede aprende dosexemplos ao construir um mapeamento de entrada-saída para o problema considerado (Haykin,1999).

A capacidade de adaptação ao ambiente é uma característica inerente às RNAs, dada acapacidade de adaptação de seus pesos sinápticos.

A generalização em redes neurais pode ser explicada como a capacidade da RNA fornecerrespostas coerentes para padrões desconhecidos. O benefício proporcionado pela capacidadede generalização de um modelo neural é considerável, dada a necessidade de resposta da redea padrões desconhecidos ou diferentes dos padrões de treinamento. A alta capacidade de gene-ralização também proporciona robustez ao modelo quando os dados ou exemplos estão sob oefeito de ruído.

As redes neurais são modelos matemáticos inspirados no cérebro humano e constituemum sistema de processamento paralelo e distribuído, composto de unidades de processamentosimples (neurônios) que têm a capacidade de armazenar conhecimento experimental e torná-lodisponível para o uso (Haykin, 1999).

Segundo Haykin (1999) as RNAs se assemelham ao funcionamento do cérebro humanonos seguintes aspectos:

• o conhecimento é adquirido pela RNA a partir de seu ambiente, através de um processode aprendizagem;

Page 36: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

2.3 Redes neurais artificiais 15

• forças de conexão entre neurônios, conhecidas como pesos sinápticos, são utilizadas paraarmazenar o conhecimento adquirido.

Uma RNA treinada para operar em um ambiente específico pode ser re-treinada para con-tinuar em operação, caso ocorram alterações dentro de certos limites, neste ambiente (Haykin,1999).

2.3.1 Modelo de um neurônio

Um neurônio artificial é uma aproximação rudimentar de um neurônio biológico e constituia unidade fundamental de processamento de informação de uma rede neural (Haykin, 1999). AFigura 2.7 mostra o modelo de um neurônio artificial. Podem ser identificados três elementosbásicos no modelo:

1. sinapses- ou conexões de entrada, caracterizadas por pesos ou forças próprias. Sendoassim, um sinalxj na entrada da sinapsej conectada ao neurôniok é multiplicado pelopeso sinápticowkj;

2. junção de soma- responsável pela combinação aditiva dos sinais de entrada, realizandoa soma ponderada dos sinais de entrada;

3. função de ativação- pode ser linear ou não linear e no segundo caso geralmente restringea amplitude de saída do neurônio.

Pode-se descrever matematicamente o modelo do neurônio da Figura 2.7 pelas Equações2.2 e 2.3

vk =

p∑j=0

wkjxj (2.2)

yk = ϕ (vk) , (2.3)

sendox0, x1, ..., xp os sinais de entrada,wk0, wk1, ..., wkp os pesos sinápticos do neurôniok, vk

o nível de ativação interna ou potencial de ativação do neurôniok, ϕ (.) a função de ativação eyk é a saída do neurôniok.

Na Figura 2.7 verifica-se a presença de uma entrada de polarização fixax0 = +1. Estaentrada, juntamente com o pesowk0 a ela associada, tem o efeito de transladar a função deativação em torno da origem, fazendo com que a ativação internavk do neurônio não seja nulaquando todas as demais entradasx0, x1, ..., xp forem nulas.

Page 37: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

2.3 Redes neurais artificiais 16

Figura 2.7: Modelo de um neurônio.

2.3.2 Funções de ativação

A função de ativaçãoϕ (.) é responsável por definir a saída do neurônio em termos do seunível de ativação internavk. Podem ser enumerados alguns tipos de função de ativação maisusados.

1. Função limiar - neste caso, ilustrado pela Figura 2.8(a), a saída do neurônio é dada pelaEquação 2.4

ϕ (v) =

{+1, parav ≥ 0

−1, parav < 0(2.4)

2. Função linear - neste caso, ilustrado pela Figura 2.8(b), a saída do neurônio é dada pelaEquação 2.5

ϕ (v) = αv, (2.5)

sendoα um número real que define a saída linear para os valores dev.

3. Função linear por partes- neste caso, ilustrado pela Figura 2.8(c), a saída do neurônioé dada pela Equação 2.6

ϕ (v) =

+1, parav ≥ γ

v, para|v| < γ

−1, parav ≤ −γ

(2.6)

Page 38: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

2.3 Redes neurais artificiais 17

sendoγ um número real que parametriza a função.

4. Função sigmoidal tangente hiperbólica- neste caso, apresentado na Figura 2.8(d), asaída do neurônio é dada pela Equação 2.7

ϕ (v) =1 − e−2v

1 + e−2v. (2.7)

−5 0 5

−1

−0.5

0

0.5

1

vk

(a)

y(v k)

−5 0 5−5

0

5

vk

(b)

y(v k)

−5 0 5

−1

−0.5

0

0.5

1

vk

(c)

y(v k)

−5 0 5

−1

−0.5

0

0.5

1

vk

(d)

y(v k)

Figura 2.8: Funções de ativação: (a) função limiar, (b) função linear, (c) função linear por partes, (d)função sigmoidal tangente hiperbólica.

No caso das funções de ativação limiar, linear por partes e tangente hiperbólica foi consi-derada a faixa de variação entre± 1, porém pode ser desejável em algumas situações que avariação seja entre0 e 1.

2.3.3 Arquiteturas de RNAs

Segundo Haykin (1999), a arquitetura é a maneira pela qual os neurônios de uma RNAestão estruturados, e pode-se identificar fundamentalmente três tipos de arquiteturas:

1. redes alimentadas adiante (Feedforward) de uma única camada;

2. redes alimentadas adiante com múltiplas camadas (Multilayer Feedforward Networks);

Page 39: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

2.3 Redes neurais artificiais 18

3. redes recorrentes.

As redes de uma única camada possuem uma camada de entrada, contendo os nós fonte, euma camada de saída contendo os nós computacionais. A camada de entrada não é consideradana contagem do número de camadas porque os neurônios da camada de entrada são neurôniosespeciais, cujo papel é exclusivamente distribuir cada uma das entradas da rede (sem modificá-las) a todos os neurônios da camada seguinte (Iyoda, 2000). A Figura 2.9 ilustra as redesfeedforwardde uma camada.

Figura 2.9: RNAFeedforwardde uma única camada.

As RNAs alimentadas adiante com múltiplas camadas distinguem-se pela presença de umaou mais camadas intermediárias, cujos neurônios são chamados de neurônios escondidos. Afunção dos neurônios escondidos é extrair estatísticas de ordem elevada (Haykin, 1999). Nestetipo de RNA, os neurônios de uma camada têm como entradas apenas os sinais de saída dosneurônios da camada anterior. Estas RNAs podem ser totalmente ou apenas parcialmente co-nectadas, caso alguma conexão sináptica não se faça necessária. Na Figura 2.10 tem-se umexemplo de uma RNA alimentada adiante, com duas camadas e totalmente conectada.

As RNAs alimentadas adiante com múltiplas camadas (Multilayer Feedforward Networks)são comumente chamadas de MLP (Multilayer Perceptron). As RNAs do tipo MLP são as maisdifundidas na literatura e serão as RNAs exploradas neste trabalho.

As redes recorrentes são assim denominadas por apresentarem pelo menos um laço de rea-limentação (Haykin, 1999). As conexões de realimentação podem originar tanto dos neurônios

Page 40: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

2.3 Redes neurais artificiais 19

Figura 2.10: RNAfeedforward, com duas camadas e totalmente conectada.

Figura 2.11: RNA recorrente.

de saída quanto dos neurônios escondidos. A presença de laços de realimentação altera signi-ficativamente a capacidade de aprendizagem e a performance da RNA (Haykin, 1999). A Figura2.11 apresenta uma RNA recorrente com laços de realimentação entre os neurônios.

Page 41: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

2.3 Redes neurais artificiais 20

2.3.4 Processo de apredizagem supervisionado em RNAs

A mais importante propriedade das RNAs é a capacidade de aprender a partir de seu ambi-ente e melhorar seu desempenho através da aprendizagem. A aprendizagem é realizada atravésde um processo iterativo de ajuste dos pesos sinápticos. Idealmente, a RNA deve saber maissobre seu ambiente após cada iteração do processo de aprendizagem.

No contexto de redes neurais artificiais, Haykin (1999) define aprendizagem da seguinteforma: "Aprendizagem é um processo pelo qual os parâmetros livres de uma rede neural sãoadaptados através de um processo de estímulo pelo ambiente no qual a rede está inserida. O tipode aprendizagem é determinado pela maneira na qual a modificação dos parâmetros ocorre".Assim, um processo de aprendizagem de uma rede neural implica na seguinte seqüência deeventos:

1. a rede neural é estimulada pelo ambiente;

2. a rede neural se submete a alteração de seus parâmetros livres como resultado do estímulo;

3. em função das alterações em sua estrutura interna, a rede modifica sua resposta aos estí-mulos do ambiente.

Define-se como algoritmo de aprendizagem o conjunto de regras bem definidas que leva aoaprendizado (Haykin, 1999).

Os diversos métodos desenvolvidos para treinamento de RNAs podem ser agrupados emdois paradigmas principais: aprendizado supervisionado e aprendizado não supervisionado(Braga et al., 2000).

O método de aprendizado supervisonado, assim chamado em função da existência de umsupervisor externo (professor) que fornece as entradas e as saídas desejadas, é o mais comumno treinamento das RNAs (Braga et al., 2000).

A Figura 2.12 apresenta um diagrama de blocos da aprendizagem supervisionada.

Os exemplos mais conhecidos de algoritmos para aprendizado supervisionado são a regradelta (Widrow e Hoff, 1960) e a sua generalização para RNAs de múltiplas camadas, o algoritmode retropropagação do erroerror back-propagation(Rumelhart et al., 1986). Neste trabalho seráenfocado o aprendizado supervisionado, especificamente o algoritmoback-propagation.

Page 42: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

2.3 Redes neurais artificiais 21

Figura 2.12: Aprendizagem supervisionada.

2.3.5 Algoritmo back-propagation

O algoritmoback-propagation, proposto por Rumelhart et al. (1986) e citado em Haykin(1999) é o algoritmo mais utilizado no treinamento de redes neurais multicamadas do tipo MLPcom uma ou mais camadas escondidas.

O algoritmo de retropopagação de erro, ou simplesmente retropropagação (back-propagation),utiliza pares entrada-saída desejada para ajustar os pesos da rede neural, por meio de um meca-nismo de correção de erro.

O treinamento através do algoritmoback-propagationocorre em dois passos:

• fase propagação- essa fase é utilizada para definir a saída da rede para um dado padrãode entrada e nessa fase os pesos são mantidos fixos. O fluxo segue no sentido entrada-saída;

• fase retropropagação- essa fase utiliza a saída desejada e a saída calculada pela rede nafase de propagação, para a realização do ajuste dos pesos das conexões da rede. Nessafase o fluxo do sinal de erro é inverso daquele na fase de propagação.

O desenvolvimento do algoritmoback-propagationde Rumelhart et al. (1986), pode servisto em detalhes em Haykin (1999) e em Braga et al. (2000).

Page 43: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

2.3 Redes neurais artificiais 22

O cálculo dos ajustes nos pesos pelo algoritmo de retropropagação do erro é dado pelasseguintes relações:

1. Cálculo da correção dos pesos, pela regra delta (Widrow e Hoff, 1960) generalizada:

∆wji (n) = ηδj (n) yi (n) , (2.8)

sendo:

∆wji (n) Correção no peso do neurônioj na iteraçãon;η Taxa de aprendizagem;

δj (n) Gradiente local do neurônioj na iteraçãon;yi (n) Sinal da entradai do neurônioj na iteraçãon.

2. Cálculo do gradiente local:

• Para um neurônioj da camada de saída:

δj (n) = ej (n)ϕ′j (vj (n)) , (2.9)

sendoej (n) o erro entre a saída do neurônioj e a saída desejada na iteraçãon,ϕ′

j (vj (n)) a derivada da função de ativação do neurônioj em relação à saída lineardo neurônio,vj (n), na iteraçãon.

• Para um neurônioj da camada intermediária:

δj (n) = ϕ′j (vj (n))

∑k

δk (n)wkj (n) , (2.10)

sendoϕ′j (vj (n)) a derivada da função de ativação do neurônioj em relação à saída

linear do neurônio na iteraçãon e∑

k δk (n)wkj (n) a soma ponderada dos gradi-entes locais da camada seguinte na iteraçãon

Como aparece o termoϕ′j (vj (n)) nas Equações 2.9 e 2.10 do cálculo do gradiente local, isso

significa que as funções de ativação utilizadas em uma rede MLP devem ser diferenciáveis.

2.3.5.1 A taxa de aprendizado

O algoritmoback-propagationfornece uma aproximação para a trajetória no espaço de pe-sos calculada pelo método da "descida mais íngreme"ou "máximo declive"(steepest descent)

Page 44: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

2.3 Redes neurais artificiais 23

(Haykin, 1999). Dessa forma, quanto menor for a taxa de aprendizadoη menor será o ajustedos pesos∆w para a próxima iteração e consequentemente mais lento será o processo de treina-mento. Por outro lado, valores elevados deη podem instabilizar o algoritmo.

Uma das maneiras para se evitar o problema da instabilidade é a adição de um termo demomento na regra de aprendizagem, como mostrado na Equação 2.11

∆wji (n) = ηδj (n) yi (n) + α∆wji (n− 1) , (2.11)

sendoα chamada de constante de momento. Neste caso, a Equação 2.11 é chamada de regradelta generalizada. A adição do termo de momento, além de estabilizar o algoritmo, aumenta avelocidade de aprendizado em regiões planas da superfície de erro e pode também retirar a redede mínimos locais (Braga et al., 2000).

2.3.5.2 Modos de treinamento sequencial e por lote

Uma apresentação de todos os padrões do conjunto de treinamento à rede é chamada deépoca. Segundo Haykin (1999), para um dado conjunto de treinamento, o algoritmoback-propagationpode ser executado de dois modos distintos:

• modo sequencialque é também chamado de modoonline, no qual o ajuste de pesosé realizado após a apresentação de cada padrão à rede. Neste modo, considerando umconjunto de treinamento comm padrões, ao final de uma época terão sido realizadosm

ajustes nos pesos;

• modo por lote ou bateladaque é também chamado de modobatch, no qual o ajuste depesos é realizado após a apresentação de todos os padrões à rede. Ainda considerandoum conjunto de treinamento comm padrões, ao final de uma época será realizado apenas1 ajuste nos pesos, porém este ajuste leva em conta os erros obtidos em todos os padrões;

2.3.5.3 Critérios de parada

Como mencionado em Haykin (1999) não existem critérios de parada bem formalizadospara o algoritmoback-propagation, mas sim critérios de parada razoáveis do ponto de vistaprático e que são normalmente empregados. Alguns dos critérios são:

• pelo valor da norma euclidiana do vetor gradiente: o algoritmo converge quando a normaeuclidiana do vetor gradiente atinge um limiar especificado;

Page 45: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

2.3 Redes neurais artificiais 24

• pelo valor da taxa de variação do erro médio quadrático: o algoritmo converge quando ataxa de variação do erro médio quadrático por época for suficientemente pequena;

• pela capacidade de generalização da rede: neste caso deve ser usado um conjunto depadrões, segregado do conjunto total de padrões, para validação.

2.3.6 Métodos de segunda ordem

Como pode ser visto no desenvolvimento do algoritmoback-propagationem Haykin (1999),o treinamento de redes neurais multicamadas é um problema de otimização não-linear de umafunção de custo, que mede o erro quadrático médio calculado pela saída da rede neural frente auma saída desejada. Existem na literatura vários métodos de otimização não-lineares, os quaispodem ser aplicados ao problema de treinamento de redes neurais, para minimização do erro.

O algoritmoback-propagationapresentado na seção 2.3.5 é uma implementação baseadano método do gradiente. No método do gradiente, o vetor de parâmetros (pesos) é ajustado nadireção oposta ao do vetor gradiente. O método do gradiente é classificado como um métodoindireto de primeira ordem, já que utiliza apenas a informação do gradiente (primeira derivada)da função de custo para o ajuste dos pesos da rede. Os métodos de primeira ordem são conheci-dos por serem ineficientes no tratamento de problemas de larga escala, pois apresentam taxas deconvergência muito pobres, especialmente em regiões próximas a mínimos locais (Iyoda, 2000)

Do ponto de vista da direção de busca, o método do gradiente pode ser interpretado comosendo ortogonal a uma aproximação linear da função de custo em determinado ponto (Edgare Himmelblau, 1988). Nos métodos indiretos de segunda ordem, além do vetor gradiente dafunção objetivo, faz-se também o uso da matrizHessiana(matriz de derivadas de segundaordem) da função erro. Na literatura referente à otimização não-linear, uma classe de algoritmosde segunda ordem é apontada como apropriada para problemas de larga escala (Silva, 1998).Apesar de notadamente superiores aos métodos de primeira ordem, os métodos de segundaordem também apresentam desvantagens, sendo a principal delas o alto custo computacionalassociado ao cálculo e armazenamento da matrizHessiana.

Um dos algoritmos de segunda ordem mais rápidos para o treinamento de RNAs de tamanhomoderado (Jones et al., 2005) é o algoritmo proposto porLevemberg Marquardt, uma variaçãodo método de Newton (Edgar e Himmelblau, 1988) que aproxima localmente a superfície deerro por uma função quadrática, mas que simplifica o cálculo da matrizHessianausando apenasa matrizJacobiana(Matriz de derivadas de primeira ordem com relação aos pesos e termos depolarização da RNA) (Silva, 1998).

Page 46: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

2.3 Redes neurais artificiais 25

Neste trabalho, para o treinamento das RNAs, será usado basicamente o algoritmo propostoporLevemberg Marquardt.

2.3.7 Generalização em RNAs

Capacidade de generalização é a capacidade de uma RNA, devidamente treinada, respondercoerentemente a padrões desconhecidos. Ao termo padrões desconhecidos fica subentendidoque seja um conjunto de padrões extraído da mesma população dos conjuntos de dados detreinamento, ou seja, dados com mesmas características estatísticas dos padrões de treinamento.

Segundo Teixeira (2001), a capacidade de generalização não é uma propriedade inerente àsRNAs, ou seja, ela não é facilmente obtida simplesmente submetendo a rede à fase de treina-mento.

Alguns fatores devem ser levados em consideração para se obter uma RNA com elevadacapacidade de generalização. Basicamente a generalização em uma RNA tem influência dosseguintes fatores:

• tamanho e representatividade estatística do conjunto de dados de treinamento;

• arquitetura da rede neural;

• complexidade física do problema abordado.

Não existe uma regra para escolher o tamanho do conjunto de treinamento. Cada problemaabordado requer uma quantidade de amostras capaz de representá-lo. Este parâmetro não é desimples estimativa, dado que o domínio do problema nem sempre é conhecidoa priori.

A escolha da arquitetura do modelo neural adequada à complexidade do problema é um dosmaiores desafios no estudo da capacidade de generalização. Modelos com arquiteturas muitograndes elevam a complexidade do modelo. Quando a complexidade do modelo é maior quea necessária para modelar o problema, a rede fica super-ajustada aos dados de treinamento,respondendo inadequadamente aos padrões de validação e teste. Este fenômeno de super-ajustedo modelo aos dados de treinamento é comumente chamado deoverfittinge, reduz a capacidadede um modelo generalizar. Porém se a complexidade do problema supera a complexidade domodelo, este não é capaz de descrever e representar o domínio do problema, caracterizandoassim o fenômeno de sub-ajuste ouunderfitting. A Figura 2.13 ilustra o que pode ocorrercom o erro de generalização quando sob os efeitos de sub-ajuste e super-ajuste aos dados etreinamento.

Page 47: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

2.3 Redes neurais artificiais 26

0 1 2 3 4 5 6 7−1.5

−1

−0.5

0

0.5

1

1.5

2F. GeradoraPadrões treinamentoSaída RNA

(a)Underfitting

0 1 2 3 4 5 6 7−1.5

−1

−0.5

0

0.5

1

1.5

2F. GeradoraPadrões treinamentoSaída RNA

(b) Ajuste Adequado

0 1 2 3 4 5 6 7−1.5

−1

−0.5

0

0.5

1

1.5

2F. GeradoraPadrões treinamentoSaída RNA

(c) Overfitting

Figura 2.13: Problema do ajuste do modelo -Underfitting, Ajuste Adequado eOverfitting.

Na Figura 2.13 a função geradora é uma senóide que varia de0 a2π e que foi contaminadapor um ruído de média0 e desvio padrão1. Apenas os pontos nas figuras foram submetidosàs RNAs para treinamento. Como pode ser verificado na Figura 2.13(a), a RNA não foi capazde modelar toda a complexidade do problema, gerando um modelo neural pobre em termos degeneralização. Já na Figura 2.13(c) o modelo neural criado superou a complexidade da funçãogeradora, passando a modelar o ruído presente nos dados, ficando também mal ajustado à funçãogeradora.

Apenas na Figura 2.13(b) o ajuste do modelo está compatível com a complexidade doproblema e nota-se que a RNA buscou modelar a função geradora.

Os fenômenos deunderfittinge overfittingafetam sobremaneira a capacidade de generali-zação das RNAs e buscar um equilíbrio pode ser uma tarefa árdua. Esses fenômenos são influ-enciados pelo tamanho do conjunto de treinamento, pelo número de épocas de treinamento, etambém pelo número de parâmetros livres (pesos) da RNA. Equilibrar os efeitos deunderfittingeoverfittingse configura num dos principais desafios no projeto de RNAs e é abordado como odilema entre polarização e variância (Geman et al., 1992).

Existem na literatura várias estratégias que objetivam soluções com elevada capacidadede generalização, como oEarly Stopping, a Regularização Bayesiana, o algoritmo depruningOptimal Brain Surgeone o método deEnsemble Modelling, entre vários outros.

Nas próximas seções deste capítulo será realizada uma breve introdução em cada uma dasestratégias citadas e, no capítulo 4, serão apresentados os resultados obtidos com a implemen-tação dessas estratégias no problema de predição de propriedades mecânicas de aços de altaresistência microligados laminados a frio e revestidos por imersão a quente.

Page 48: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

2.3 Redes neurais artificiais 27

2.3.8 Parada antecipada do treinamento

A parada antecipada do treinamento (Early Stopping) é uma técnica, proposta por Weigendet al. (1990) e citada em Teixeira (2001), baseada na divisão do conjunto de padrões em pelomenos dois conjuntos distintos, mas com mesma representatividade estatística, chamados nor-malmente de conjuntos de treinamento e validação.

O conjunto de treinamento é o único conjunto a ser usado durante o treinamento para aatualização dos parâmetros da RNA (pesos e termos de polarização).

O conjunto de validação é um conjunto através do qual, durante o treinamento, será tambémcalculado um erro (erro de validação) cuja finalidade é monitorar o nível de ajuste (fitting) daRNA aos dados de treinamento.

O erro de validação deve ser monotonicamente decrescente a partir do início do treina-mento, que deve ser interrompido no momento em que este erro começar a crescer, embora oerro de treinamento ainda seja decrescente. Este sintoma indica que o treinamento está levandoa RNA à uma condição de sobreajuste e para evitá-lo, o treinamento é interrompido e os parâ-metros da RNA na época anterior são considerados como os parâmetros finais obtidos com otreinamento.

A Figura 2.14 mostra o comportamento dos erros de treinamento e de validação no treina-mento com dados ruidosos.

Figura 2.14: Comportamento dos erros de treinamento e validação no treinamento com dados ruidosos.

Page 49: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

2.3 Redes neurais artificiais 28

Dessa forma, o treinamento usando a estratégia de parada antecipada do treinamento buscaelevar a capacidade de generalização do modelo, baseando-se na minimização do erro de vali-dação, que é usado como critério de parada do algoritmo (Haykin, 1999).

Na sequência será apresentado o algoritmo de regularização bayesiana, que ao contrário doalgoritmo de parada antecipada, regula a complexidade do modelo.

2.3.9 Algoritmo de regularização bayesiana

Este algoritmo, proposto por Mackay (1992), além de buscar a minimização da função deerro, controla também a complexidade do modelo, de forma a se obter uma RNA com altacapacidade de generalização.

O objetivo inicial do treinamento das RNAs é a minimização da função de custo

F = εD, (2.12)

sendoεD a soma do erro quadrático dada pela equação 2.13

εD =n∑

i=1

(di − yi)2 , (2.13)

sendon é o número de padrões de treinamento,d e y sendo respectivamente a saída desejada ea saída da RNA para o padrãoi. Um segundo objetivo do treinamento da RNA é que esta res-ponda satisfatoriamente a padrões desconhecidos. Quando uma RNA responde bem a padrõesdesconhecidos diz-se que ela generaliza bem. À luz deste segundo objetivo, a função de custoF é modificada adicionando-se um termo adicional, o termo de regularizaçãoεW . Dessa forma,a função de custo modificada pode ser descrita pela Equação 2.14

F = βεD + αεW , (2.14)

sendoεW a soma dos quadrados dos pesos da RNA,β e α novos parâmetros da função decusto, chamados parâmetros de regularização e cujo valor relativo define a ênfase do treina-mento (Foresee e Hagan, 1997). Seα << β o treinamento dará ênfase à minimização do erroquadrático da RNA, mas seα >> β a ênfase será para a um modelo que forneça respostas maissuaves pois a minimização da complexidade do modelo (redução dos valores dos pesos) foipriorizada. O principal problema com a implementação de técnicas de regularização é a deter-minação dos melhores valores para os parâmetros de regularização da função objetivo (Foreseee Hagan, 1997).

Page 50: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

2.3 Redes neurais artificiais 29

Na regularização bayesianaα eβ são obtidos iterativamente, livrando o usuário desta árduatarefa.

2.3.10 Algoritmo dePruning Optimal brain surgeon

Os algoritmos depruningsão caracterizados por alterarem a estrutura das RNAs durante otreinamento. A estrutura das RNAs pode ser alterada de duas formas diferentes:

• através da adição de termos de penalidade à função objetivo, por exemplo a adição de umtermo proporcional à magnitude dos pesos da RNA, o que favoreceria soluções com pesosde baixa magnitude. O algoritmo de treinamentoweight decay(Hinton, 1989) classifica-se neste grupo;

• através da remoção de elementos que afetam menos a função do erro. Esta estratégiapode reduzir a estrutura do modelo (número de parâmetros livres) produzindo soluçõeseficientes. Os algoritmosOptimal brain damage(LeCun et al., 1990) eOptimal brainsurgeon(Hassibi et al., 1993) classificam-se neste segundo grupo.

O algoritmo depruning Optimal brain surgeon(OBS) faz o ajuste de complexidade al-terando a estrutura da rede. Inicialmente, treina-se uma rede superdimensionada para o pro-blema em questão e após este treinamento, os pesos são eliminados temporariamente e um cál-culo indicando como cada peso da rede afeta a função de erro é realizado. Este cálculo recebe onome de cálculo de saliências e os pesos que apresentarem menores saliências são eliminados.Uma vez eliminados, um re-treinamento deve ser feito para a nova arquitetura. Para o cálculo dasaliência é utilizada uma aproximação por série de Taylor da função de custo pela qual pode-sepredizer o efeito de uma perturbação no vetor de pesos (Teixeira, 2001).

O ponto de partida na construção do modelo OBS é a aproximação por série de Taylorda função de custoε (w) pela qual pode-se predizer o efeito de uma perturbação no vetor deparâmetrosw (pesos). Considerando uma perturbação∆ w nos parâmetros, tem-se:

ε (w + ∆w) = ε (w) + gT (w)∆w +1

2∆wTH (w)∆w + O

(||∆w||3) , (2.15)

sendog (w) o vetor gradiente avaliado emw e H (w) a matrizHessianatambém avaliada emw.

O objetivo é encontrar um conjunto de parâmetrosw tais que quando estes são eliminados,a funçãoε (w) tenha um incremento dentro de uma faixa permitida.

Page 51: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

2.3 Redes neurais artificiais 30

Para isso, algumas aproximações são necessárias. Considerando que os parâmetros só sãoeliminados depois do processo de treinamento ter convergido, significa quew representa umponto de mínimo local ou global da superfície de erro e isso implica que o gradiente emw é 0,ougT (w) = 0

Fazendo uma aproximação quadrática da superfície de erro no ponto de mínimo, significaque os termos de ordem superior a 2 podem ser eliminados, isso significa queO (||∆w||3) = 0.

Com essas duas aproximações, a Equação 2.15 fica:

ε (w + ∆w) = ε (w) +1

2∆wTH (w)∆w. (2.16)

Chamando de∆ε (w) = ε (w + ∆w) − ε (w) , (2.17)

tem-se

∆ε (w) =1

2∆wTH (w)∆w. (2.18)

No algoritmoOptimal brain damage(OBD), para redução do custo computacional, é feitaa aproximação considerando a matrizHessianadiagonal. Essa aproximação não é feita noalgoritmo OBS. Dessa forma, pode-se considerar o algoritmo OBD como um caso particular doalgoritmo OBS (Haykin, 1999).

Como já fora mencionado, a meta do algoritmo OBS é zerar algum peso de forma que oincremento emε (w + ∆w), ∆ε (w), seja mínimo.

Sejawi (n) esse peso. Nesse caso, a eliminação desse peso é equivalente à condição

∆wi + wi = 0. (2.19)

ou1T

i ∆w + wi = 0, (2.20)

sendo1i o vetor unitário cujos elementos são todos zero, exceto para oi-ésimo elemento, quetem o valor1.

Tem-se então um problema com dois níveis de minimização. Uma minimização é sobre osvetores de pesos que permanecem após oi-ésimo vetor ter sido feito igual a zero e a segundaminimização é sobre qual vetor será eliminado.

Page 52: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

2.3 Redes neurais artificiais 31

Para solucionar esse problema de otimização restrito, constrói-se primeiramente oLa-grangeano

S =1

2∆wTH (w)∆w − λ

(1T

i ∆w + wi

), (2.21)

sendoλ o multiplicador deLagrange. Tomando a derivada doLagrangeanoS com relação a∆w, aplicando a restrição da Equação 2.20, fazendo a inversão da matriz, chega-se que a ótimavariação no vetor de pesosw é:

∆w = − wi

[H−1]i,iH−11i, (2.22)

e o valor ótimo correspondente doLagrangeanoS para o elementowi é

Si =w2

i

2[H−1]i,i, (2.23)

sendoH−1 a inversa da matrizHessianaH (w), e [H−1]i,i o i-ésimo elemento dessa matrizinversa. OLagrangeanoSi otimizado com relação a∆w, sujeito à restrição doi-ésimo peso tersido eliminado, é chamado a saliência dewi. A saliência representa o incremento no erro médioquadrático resultante da remoção dewi.

Nota-se da Equação 2.23 que a saliência é proporcional aw2i , sinalizando que pesos com

valores pequenos têm pequeno efeito sobre o erro médio quadrático.

No algoritmo OBS o peso correspondente à menor saliência é selecionado para remoção.

Na próxima seção será apresentado o método deensemble modelling, também desenvolvidocom objetivo de se elevar a capacidade de generalização das RNAs.

2.3.11 Métodoensemble modelling

O termoensemblevem sendo usado em textos em língua portuguesa em função da nãoexistência de uma tradução adequada que exprima fielmente a essência da metodologia que omesmo representa (Lima, 2004). Dessa forma, neste trabalho o termo também será empregadona sua forma mais usual.

Um ensembleconsiste de um conjunto de regressores ou classificadores que fornecem umasaída global baseada numa combinação das saídas individuais de cada um dos seus membros,com o objetivo de se obter um desempenho que seja superior ao desempenho individual de cadacomponente.

Page 53: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

2.4 Sistemas híbridosneuro-fuzzy 32

Segundo Lima (2004), em função dos bons resultados apresentados pelo método, é vasta agama de aplicações tanto para classificação de padrões quanto para regessão.

Em Sharkey (1999) citado por Castro et al. (2005), os melhores resultados para a prediçãode séries temporais são obtidos pela combinação de diferentes modelos e não pela seleção domelhor modelo individual.

No caso deensemblede RNAs, Perrone e Cooper (1993) sugerem que as RNAs com-ponentes doensembledevam ter diferentes arquiteturas, devam ser treinadas com algoritmosdiferentes e tambem com conjuntos de dados de diferentes. Segundo Yang e Linkens (2001), aaplicação desta técnica apresenta melhoria na robustez, capacidade de predição e generalizaçãodo modelo neural.

Como citado por Lima (2004), há várias propostas para a geração da saída de umensem-ble de RNAs, sendo predominante o voto majoritário para problemas de classificação e médiasimples, ou média ponderada, para problemas de regressão. Já em Castro et al. (2005) foi imple-mentado umensemblea partir de três RNAs do tipo MLP treinadas com algoritmos diferentes ea combinação doensemblefoi gerada a partir de um neurônio de saída com função de ativaçãolinear.

Para a predição de limite de escoamento de aços, Yang e Linkens (2001) implementaramumensemblede dez RNAs do tipo MLP e usaram como saída doensemblea média simples dassaídas das RNAs componentes.

Tendo em vista a grande ênfase dada à pesquisa de métodosensemblee os resultados obti-dos pela aplicação dos mesmos, decidiu-se neste trabalho pela sua implementação.

2.4 Sistemas híbridosneuro-fuzzy

Apesar de a técnica de modelagemfuzzyser largamente aplicada em controle, predição einferência, ela apresenta algumas desvantagens, citadas por Jang (1993):

1. não existe uma maneira formal de se transformar o conhecimento de especialistas em umabase de regras de um sistemafuzzy;

2. uma vez criadas as funções de pertinência do sistemafuzzy, não existem métodos efetivospara sintonia destas funções, de forma a se elevar o desempenho do sistema.

Page 54: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

2.4 Sistemas híbridosneuro-fuzzy 33

Por outro lado, as RNAs também apresentam limitações, como por exemplo, a maneira pelaqual o conhecimento está representado. Pelo fato de ser um modelo "caixa preta", o modeloneural não contribui para o entendimento físico do sistema.

Com a perspectiva de superar as limitações apresentadas pelos sistemasfuzzye pelas RNAs,várias propostas tem sido realizadas (Abraham, 2001), onde se aliam as vantagens de cada téc-nica. Aliam-se a representação explícita do conhecimento e a capacidade de tratar informaçõeslinguísticas da lógicafuzzyà capacidade de aprendizagem das redes neurais artificiais (Haykin,1999) de forma complementar, combinando os méritos de cada uma das técnicas em uma únicanova técnica, mais versátil e também mais próxima das habilidades humanas.

Nesse contexto, Jang (1993) propôs uma nova arquitetura chamada ANFIS (Adaptive NeuroFuzzy Inference System) que mantinha as características básicas dos sistemasfuzzymas tinhaincorporadas as propriedades de adaptação das RNAs.

Na próxima seção o sistema híbrido ANFIS será introduzido, uma vez que apenas estesistema híbridoneuro-fuzzyserá abordado e aplicado neste trabalho.

2.4.1 O sistema ANFIS

O sistema ANFIS pode ser considerado um subconjunto especial das RNAs alimentadasadiante com capacidade de aprendizado supervisionado (Jang, 1993).

A Figura 2.15 ilustra a arquitetura do sistema ANFIS equivalente ao sistema de inferên-cia nebulosa do tipo 3 (Sugeno) apresentado na seção 2.2.3. O sistema do tipo 3, ilustradonovamente na Figura 2.15(a) foi selecionado porque este será o sistema implementado nestetrabalho, cujos resultados são apresentados no capítulo 4. Na arquitetura ilustrada na Figura2.15(b) pode-se observar uma rede alimentada adiante (feedforward) com 2 entradas, 1 saída,5 camadas (sendo três camadas intermediárias), e com nodos representados por quadrados ecírculos. Os nodos representados por quadrados são nodos adaptativos, enquanto os circularessão fixos (não adaptativos).

Considerando como exemplo o sistema ANFIS da Figura 2.15(b), no qual tem-se duasentradasx e y, cada entrada com duas funções de pertinênciaA1, A2, B1 eB2, uma saídaf e,considerando ainda as seguintes regras:

• regra 1: Sex éA1 ey éB1, entãof1 = p1x + q1y + r1,

• regra 2: Sex éA2 ey éB2, entãof2 = p2x + q2y + r2,

Page 55: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

2.4 Sistemas híbridosneuro-fuzzy 34

Figura 2.15: (a) Sistema de inferência nebuloso tipo 3 (Sugeno) com 2 entradas; (b) sistema ANFISequivalente.

pode-se descrever a função de saída de cada nodo, como mostrado em Jang et al. (1997) eapresentado a seguir. SejaOj,i a saída de cada nodo, ondej é a camada ei é o nodo:

• camada 1- Nodos adaptativos - Nebulização;

O1,i = µAi (x), parai = 1,2

O1,i = µBi−2 (y), parai = 3,4

sendoµA eµB as funções de pertinência das entradasx ey.

• camada 2- Nodos fixos - Disparo das regras;

O2,i = wi = µAi (x) ∗ µBi (y), parai = 1,2.

• camada 3- Nodos fixos - Normalização do disparo das regras;

O3,i = wi = wi

w1+w2, parai = 1,2.

Page 56: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

2.4 Sistemas híbridosneuro-fuzzy 35

• camada 4- Nodos adaptativos - Cálculo da saída de cada regra;

O4,i = wifi

O4,i = wi (pix + qiy + ri), parai = 1,2.

sendopi, qi, eri os parâmetros da função linear de saída

• camada 5- Nodos fixos - Cálculo da saída

O5,1 =∑

i

wifi =

∑i wifi∑i wi

, parai = 1,2.

2.4.2 O treinamento do sistema ANFIS

O treinamento do sistema ANFIS, chamado de treinamento híbrido, difere do treinamentodas RNAs, do tipo MLP usando o algoritmoback-propagation, em dois aspectos:

• o ajuste dos parâmetros da rede ocorre nos dois sentidos, tanto no passoforward quantono passo de retropropagação do erro (backward);

• para cada sentido do fluxo de sinal é usado um algoritmo diferente para o ajuste dosparâmetros.

A Tabela 2.2 apresenta um resumo do treinamento híbrido do sistema ANFIS.

Tabela 2.2: Treinamento híbrido do sistema ANFIS.

Parâmetros ajustados Passoforward Passobackward

Funções de Pertinência (não lineares) fixos Descida do gradienteFunções de saída (lineares) Mínimos quadrados fixos

O algoritmo do treinamento híbrido pode ser visto com mais detalhes em Jang (1993) eJang et al. (1997)

Um dos grandes desafios na modelagem de sistemas não lineares multivariáveis é a seleçãodas variáveis de entrada importantes para o modelo dentre todo o conjunto das variáveis deentrada. Do ponto de vista da modelagem, a incorporação apenas das variáveis importantespropicia modelos mais simples, mais úteis, mais confiáveis e mais práticos (Chiu, 1996). Ainda

Page 57: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

2.4 Sistemas híbridosneuro-fuzzy 36

segundo Chiu (1996), do ponto de vista de controle, o entendimento da importância relativadas variáveis permite aos engenheiros de controle focar seus esforços nas variáveis que real-mente interessam, reduzindo tempo e custos envolvidos na busca deset-pointsadequados paravariáveis não importantes.

No desenvolvimento de sistemas híbridosneuro-fuzzyo número de entradas do sistemapode tornar o desenvolvimento do sistema altamente custoso do ponto de vista computacional,podendo até mesmo inviabilizá-lo. Dessa forma, modelos mais simples envolvendo apenas asvariáves mais importantes devem ser pesquisados.

Na próxima seção serão introduzidos métodos de seleção das variáveis de entrada maisimportantes.

2.4.3 Seleção das entradas para o sistema ANFIS

Em Chiu (1996) são apresentados os métodosforward selectionebackward-selection.

O métodoforward selectionenvolve sistematicamente a geração de modelos nos quais onúmero de variáveis de entrada cresce gradualmente em função da avaliação de determinadocritério, por exemplo a raiz quadrada do erro médio quadrático (RMSE) do modelo, que deveser monotonicamente decrescente.

O métodoforward selectionpode ser descrito de acordo com o seguinte procedimento:

1. avaliar o desempenho den sistemas cada 1 com apenas 1 variável de entrada candidata;

2. acrescentar permanentemente a variável associada ao sistema que apresentou o melhordesempenho;

3. se ainda existirem variáveis não adicionadas ao sistema, acrescentar temporariamentecada uma das variáveis e ir para o passo 4. Senão ir para o passo 5;

4. avaliar o desempenho dos sistemas acrescidos com cada variável de entrada candidata eir para o passo 2;

5. selecionar o melhor conjunto de variáveis entre os conjuntos gravados no passo 2.

Por outro lado, no métodobackward selection, parte-se de um modelo com todas as pos-síveis variáveis de entrada e a partir da remoção das variáveis chega-se a um conjunto de en-tradas cujo critério de avaliação aponta como ótimo.

Page 58: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

2.4 Sistemas híbridosneuro-fuzzy 37

O métodobackward selectionpode ser descrito de acordo com o seguinte procedimento:

1. avaliar o desempenho de um sistema com todas asn variáveis de entrada candidatas;

2. remover temporariamente cada uma das variáveis de entrada gerando-sen sistemas comn− 1 variáveis;

3. avaliar o desempenho dosn sistemas do item 2 e remover permanentemente a variávelassociada ao sistema que apresentou melhor desempenho;

4. se ainda existirem variáveis remanescentes no sistema, ir para o passo 2 para eliminaroutra variável. Senão ir para o passo 5;

5. selecionar o melhor conjunto de variáveis entre os conjuntos gravados no passo 3.

Como pode ser visto nos dois procedimentos, embora o erro (RMSE) deixe de ser mono-tonicamente decrescente, os métodos continuam até se acrescentar todas as possíveis variáveisno caso doforward selection, ou remover todas as variáveis no caso dobackward selection.Neste trabalho, foram implementados os dois métodos, mas em ambos os casos o processo foiinterrompido quando o RMSE deixou de ser monotonicamente decrescente.

Para tentar agilizar o processo de seleção de variáveis foi implementado também um ter-ceiro método de seleção das variáveis de entrada mais importantes para o modelo. Esse terceirométodo parte de um conjunto de variáveis apontadas pela RNA como as que tem maior influên-cia em cada saída. Essa influência é medida através da análise de sensibilidade, descrita nocapítulo 4, das saídas da RNA a cada uma das variáveis de entrada. A partir desse conjuntobase de variáveis de entrada, aplica-se o métodoforward selectionpara acrescentar variáveisque promovam o desempenho do sistema.

Os resultados da implementação de cada um dos três métodos são apresentados no capítulo4.

Page 59: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

Capítulo 3

Descrição do Processo

3.1 Introdução

Inicialmente, este capítulo descreve de forma resumida todo o processo de produção de açosplanos numa usina siderúrgica integrada a coque. Em seguida, são apresentadas e detalhadasas propriedades mecânicas dos aços. Na sequência são apresentados os aços de alta resistênciamicroligados do ponto de vista metalúrgico, identificando de acordo com a literatura, a influên-cia da composição química e dos parâmetros de processo nas referidas propriedades destesaços. Finalmente é apresentada a máquina de ensaio de tração da USIMINAS, na qual foramrealizados os ensaios para a obtenção das propriedades mecânicas dos aços de alta resistênciamicroligados, laminados a frio e revestidos por imersão a quente, objeto deste trabalho.

3.2 O processo de produção de tiras de aço em uma usinaintegrada a coque

Basicamente, o aço é uma liga de ferro e carbono. O ferro, que não existe puro na natureza,é encontrado em toda a crosta terrestre associado ao oxigênio e à sílica. O minério de ferroé um óxido de ferro, misturado com areia fina. O carbono é também relativamente abundantena natureza e pode ser encontrado sob diversas formas. Na siderurgia, o carbono é obtido docarvão mineral, e em alguns casos do carvão vegetal (Ramos, 2002).

De acordo com o Instituto Brasileiro de Siderurgia (IBS, 2006) as usinas siderúrgicas, se-gundo o seu processo produtivo, classificam-se como:

Page 60: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

3.2 O processo de produção de tiras de aço em uma usina integrada a coque 39

• integradas- que operam as três fases básicas: redução, refino e laminação;

• semi-integradas- que operam duas fases: refino e laminação. Estas usinas partem deferro gusa, ferro esponja ou sucata metálica, adquiridos de terceiros, para transformá-losem aço em aciarias elétricas seguindo-se sua posterior laminação;

• não integradas- que operam apenas uma fase do processo: redução ou laminação. Noprimeiro caso estão os produtores de ferro gusa, os chamados guseiros, que têm como ca-racterística comum o emprego de carvão vegetal em altos fornos para redução do minério.No segundo, estão os relaminadores, geralmente de placas e tarugos, adquiridos de usinasintegradas ou semi-integradas, e os que relaminam material sucatado.

A usina na qual este trabalho foi aplicado pertence ao Sistema Usiminas1. Esta unidade pro-dutiva, Usina Intendente Câmara, está situada em Ipatinga, região de Minas Gerais conhecidacomo Vale do Aço, a 220 quilômetros da capital. A Usina fica próxima a uma das maioresreservas de minério de ferro do mundo, o Quadrilátero Ferrífero de Minas Gerais.

A Usina Intendente Câmara produz e comercializa aços sob a forma de placas, laminadosplanos a quente e a frio, revestidos ou não, atendendo a segmentos estratégicos da economia,como indústria automobilística, autopeças, ferroviária, naval, de construção civil, agrícola, deembalagens, mecânico, eletroeletrônico, de utilidades domésticas, máquinas e equipamentos ede distribuição.

Como uma usina siderúrgica integrada a coque, a Usina Intendente Câmara prepara previa-mente o minério e o carvão para em seguida serem levados aos altos-fornos onde é produzido oferro gusa, que é levado para a aciaria, ainda em estado líquido, para ser transformado em aço,mediante a queima de impurezas e adições. Após a transformação do ferro gusa em aço e esteser solidificado na forma de placas, toma lugar a última etapa clássica do processo de fabrica-ção do aço, a laminação. O aço, solidificado, é deformado mecanicamente e transformado emprodutos siderúrgicos utilizados pela indústria de transformação.

A Figura 3.1 apresenta todo o fluxo de produção2 de uma usina integrada a coque.

1Informações adicionais emhttp://www.usiminas.com.br2O fluxo de produção, completo e com animação, da Usina Intendente Câmara pode ser acessado emhttp:

//www.usiminas.com.br

Page 61: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

3.3 Etapas do processo 40

Figura 3.1: Fluxo de produção de uma usina siderúrgica integrada a coque.

3.3 Etapas do processo

Como mencionado na seção 3.2 o processo de produção de aço em uma siderúrgica in-tegrada a coque pode ser dividido em quatro abrangentes etapas seqüenciais. São elas:

1. preparação do minério e do carvão;

2. redução do minério de ferro;

3. refino;

4. conformação mecânica.

Nesta seção cada uma das etapas será discutida com mais detalhes.

Page 62: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

3.3 Etapas do processo 41

3.3.1 Preparação do minério e do carvão

A primeira etapa, a preparação do minério e do carvão, é constituída por dois processos: acoqueificação e a sinterização, que preparam o carvão e a maior parte do minério de ferro para,juntamente com minério de ferro em pelotas e outros materiais, alimentarem os equipamentosde produção de ferro líquido (ferro-gusa) que são os altos-fornos (Ramos, 2002).

A coqueificação é um processo realizado na coqueria. O coque é um importante elementosiderúrgico constituído à base de mistura de vários tipos de carvão mineral metalúrgico. Ele éo elemento energético na mistura coque, sinter, pelotas e outros para a obtenção do ferro-gusalíquido (Ramos, 2002).

A sinterização é um processo realizado a alta temperatura no forno de sinterização, onde éfeita a mistura de minérios de ferro de granulometria fina (pó) com aglomerantes de finos (oufundentes), protetores de refratários e formadores de escória (conferem basicidade à escória) eelementos protetores de lança do convertedor (soprador de oxigênio). Alguns destes elementosmisturados ao minério são: calcário, cal fina, dolomita, dunito, manganês, óxido de titânio,coque fino, antracito, alcatrão, etc (Ramos, 2002).

O produto gerado neste processo recebe o nome de sinter, que é um material sólido, amorfo,com tamanho bem definido e poroso, com o objetivo de facilitar a troca e o fluxo de calor e degases dentro de um alto-forno, facilitando o processo de redução, ou seja, a retirada de oxigênio(Ramos, 2002).

3.3.2 Redução do minério de ferro

A redução do minério de ferro é a retirada do oxigênio existente no óxido de ferro, por istoo uso do termo redução, fazendo uma alusão ao termo redução de oxigênio, muito conhecido nomeio químico. Esse processo é realizado em um alto-forno. É no alto-forno que são misturadoso coque com o sinter e outras cargas metálicas (minério de ferro, por exemplo). Como resultadodeste processo tem-se o ferro-gusa líquido, que é uma liga ferro carbono com alto teor decarbono e de impurezas, portanto, ainda não se trata de aço (Ramos, 2002).

O ferro-gusa líquido é vazado em um vagão de transporte chamado carro torpedo, ondesofre um pré-refino, que é o processo de dessulfuração. Após isto, o carro torpedo transportaeste material até a aciaria, onde será iniciado o refino propriamente dito (Ramos, 2002).

A Figura 3.2 apresenta o fluxo de produção das etapas de preparação do minério e do carvãoe redução do minério de ferro.

Page 63: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

3.3 Etapas do processo 42

Figura 3.2: Fluxo de produção da redução do minério de ferro.

3.3.3 Refino

O gusa líquido, produzido nos altos fornos, apresenta em sua composição química teores deenxofre num patamar elevado para atender a maioria das especificações dos produtos. A etapade refino objetiva basicamente a adequação da composição química do aço com relação àscaracterísticas desejadas do produto final, removendo elementos indesejáveis, como o enxofreem excesso, e adicionando outros elementos em função das necessidades. (Araújo, 2003).

O refino primário (que ocorre no equipamento de fusão - convertedor) tem como objetivobásico o ajuste dos teores de carbono, enxofre e fósforo. No refino secundário (que ocorre forado convertedor) são realizados ajustes finos nos teores de hidrogênio, carbono, enxofre e naquantidade e forma das inclusões.

No refino primário, o processo de sopro de oxigênio caracteriza-se pelas reações de oxida-ção parcial do carbono, manganês, silício, fósforo e outros elementos contidos no gusa líquido.O refino primário permite também a redução do teor de fósforo, estabilizado em uma escóriabásica, formada durante esta etapa.

Durante o sopro são adicionados fundentes, que formam juntamente com os óxidos obtidosa partir de reações do silício, manganês e ferro uma escória, que tem por finalidade fixar assubstancias indesejáveis. O volume de oxigênio soprado é definido em função das matériasprimas utilizadas além do carbono e temperatura previstos no fim de sopro (Oliveira, 1994). Nofinal do sopro, mede-se a temperatura do banho, retiram-se amostras de aço e escória. Então,o convertedor é basculado e o aço líquido é vazado para uma panela onde são adicionados osferro-ligas (desoxidação) que conferem ao aço as propriedades mecânicas especificadas para o

Page 64: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

3.3 Etapas do processo 43

produto.

O processo de refino secundário de aços consiste em um enobrecimento do produto atravésda utilização de equipamentos como o desgaseificador a vácuo, a estação de ajuste de com-posição química e temperatura, forno panela. São removidas impurezas prejudiciais às pro-priedades mecânicas e às características desejadas para o aço (Araújo, 2003).

O desgaseificador a vácuo é um equipamento destinado à retirada de gases, desoxidação elimpidez dos aços. Os gases como hidrogênio e nitrogênio são assim retirados (Araújo, 2003).

Outro equipamento de refino secundário é o forno panela, que consiste de uma abóboda quecobre a panela de aço líquido. Tem como principais funções o aquecimento, a dessulfuração doaço, o ajuste de composição química em faixas estreitas, a melhoria de limpidez e o controleda morfologia de inclusões não metálicas. Após o completo tratamento de refino secundário, oaço líquido está pronto para ser lingotado, ou seja, transformado em placas de aço. As placasproduzidas na aciaria têm dimensões usuais com espessuras entre 200 e 250 mm e entre 9 e 15m de comprimento (Araújo, 1997).

A Figura 3.3 apresenta o fluxo de produção da etapa de refino.

Figura 3.3: Fluxo de produção da etapa de refino do aço.

Page 65: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

3.3 Etapas do processo 44

3.3.4 Conformação mecânica

Conformação mecânica é o nome genérico dado aos processos em que se aplica uma so-licitação mecânica em metais, que respondem com uma mudança permanente de dimensões(Cacciopoli, 1987). O volume e a massa do metal se conservam nestes processos. A laminaçãoé um processo de conformação mecânica que essencialmente consiste em modificar a seçãotransversal de um metal na forma de barra, lingote, placa, fio, tira, etc., pela passagem entredois cilindros com geratriz retilínea (laminação de produtos planos) ou contendo canais enta-lhados de forma mais ou menos complexa (laminação de produtos não planos) e que giram àmesma velocidade periférica, mas em sentidos contrários.

O laminador é o equipamento no qual se realiza a operação de laminação e consiste basi-camente de cilindros (ou rolos), mancais, uma carcaça chamada de gaiola ou quadro para fixarestas partes e um motor para fornecer potência aos cilindros e controlar a velocidade de rotação.

O processo de laminação de aços planos pode ser divido em dois tipos básicos:

• laminação a quente- neste caso o material a ser laminado é aquecido previamente e atemperatura de trabalho se situa acima da temperatura de recristalização do material3, afim de reduzir a resistência à deformação plástica4 em cada passagem e permitir a recu-peração da estrutura do material, evitando o encruamento5para os passes subsequentes;

• laminação a frio - na laminação a frio o material entra no laminador à temperatura am-biente (abaixo da temperatura de recristalização) apresentando maior resistência à de-formação e verifica-se o aumento dessa resistência com a deformação sofrida durante oprocesso.

Os processos de laminação a quente e a frio, bem como os principais equipamentos en-volvidos, serão apresentados mais detalhadamente nas seções 3.3.4.1 e 3.3.4.2.

3.3.4.1 Laminação a quente

Esta etapa do processo tem a finalidade de transformar as placas produzidas na aciaria emtiras laminadas a quente, com larguras entre 610 a 2438 mm e espessuras entre 1,19 a 12,7

3Temperatura na qual um metal com uma quantidade particular de deformação se recristalizará em um espaçode tempo definido (Barbosa e Santos, 1987).

4Deformação plástica é aquela que permanece no metal após a remoção da carga (Barbosa e Santos, 1987).5A resistência mecânica de um metal aumenta à medida que esse metal é deformado mecânicamente. A esse

processo de aumento de resistência do material por deformação plástica dá-se o nome de encruamento.

Page 66: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

3.3 Etapas do processo 45

mm (Araújo, 1997). As tiras produzidas na laminação a quente podem ser produtos acabadoscom aplicação direta na fabricação de máquinas e equipamentos agrícolas, veículos médios epesados, material ferroviário e naval, além de tubos de espessuras variadas; assim como podemposteriormente ser laminadas a frio, transformando-se em tiras laminadas a frio.

Uma linha de laminação a quente é composta por três equipamentos principais, quais sejam:o forno de reaquecimento de placas, o laminador de desbaste e o trem acabador. O processode laminação de tiras a quente consiste basicamente de duas fases: a fase de aquecimento, naqual as placas passam pelos fornos de reaquecimento; e a fase de laminação das placas (Araújo,1997).

A função principal dos fornos de reaquecimento é elevar a temperatura das placas a umatemperatura adequada para o processo de conformação, obedecendo curvas de aquecimentoespecíficas para cada tipo de aço e garantindo a eficiência no controle da combustão, visando:

• baixo consumo de combustível;

• menor perda por carepa (mistura de óxidos de ferro);

• isenção de defeitos superficiais nas placas por excesso de aquecimento;

• eficiência operacional dos fornos.

No caso dos aços microligados, o reaquecimento também deve permitir a dissolução doselementos de microliga, para permitir a sua posterior precipitação durante a laminação.

Após o reaquecimento das placas ocorre o desenfornamento e o transporte para a área dolaminador de desbaste, um laminador intermediário, que tem a finalidade de desbastar as placasem esboços para posteriormente serem laminados pelo trem acabador.

A finalidade do trem acabador é reduzir a espessura do esboço recebido, observando (aten-dendo) a temperatura, a espessura, a largura e a forma do material na saída do laminador.

Na saída do trem acabador existe um sistema de resfriamento da tira para permitir diversasestratégias de resfriamento, trazendo como principal vantagem, a obtenção de um perfil tér-mico homogêneo ao longo da superfície da tira com conseqüente melhoria das propriedadesmecânicas e metalúrgicas do produto (Silva et al., 2004).

As temperaturas de acabamento e de bobinamento influenciam diretamente as propriedadesmecânicas do produto (Barbosa et al., 2004), o que foi comprovado também pela análise de

Page 67: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

3.3 Etapas do processo 46

sensibilidade em modelos de predição de propriedades mecânicas baseados em inteligênciacomputacional (Tenner et al., 2001; Datta e Banerjee, 2005; Sterjovski et al., 2005).

Finalmente, as tiras de aço são bobinadas para serem enviadas para o processo seguinte, alaminação a frio.

A Figura 3.4 apresenta o fluxo de produção da laminação a quente.

Figura 3.4: Fluxo de produção da laminação a quente.

3.3.4.2 Laminação a frio

A unidade de laminação a frio reduz a espessura das chapas laminadas a quente, conferindo-lhes melhor qualidade superficial e características mecânicas adequadas a seu uso, direcionadoespecialmente para carrocerias de veículos leves, embalagens, auto-peças, utilidades domésticase eletroeletrônico.

Uma planta de laminação a frio é composta pelos seguintes equipamentos principais: deca-pagem, laminador contínuo a frio, limpeza eletrolítica, recozimento, laminador de encruamentoe, no caso da produção de produtos revestidos, incluem-se linhas de galvanização eletrolíticae/ou por imersão a quente.

O aço, após o processo de laminação a quente, recobre-se de uma camada formada poróxidos de distintas composições e espessura, que depende fundamentalmente da temperatura,do tempo de processo, das condições de resfriamento, do meio ambiente e do tipo de aço. Afinalidade do processo de decapagem é a retirada da carepa (mistura de óxidos de ferro) dasuperfície da tira através de uma reação com ácido (IFT, 2005).

Muitas são as variáveis que influenciam a taxa de decapagem, dentre elas: tipo de ácido,concentração de ferro e de ácido na solução, temperatura da solução, tipo de aço, quebradorde carepa antes da decapagem, utilização de inibidores e velocidade da tira dentro dos tanques

Page 68: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

3.3 Etapas do processo 47

quando o processo é contínuo (IFT, 2005).

No laminador a frio a espessura da tira laminada a quente é reduzida, à medida que a tirapassa pelas cadeiras de laminação. Ao final do processo, a bobina laminada a frio encontra-se na espessura desejada pelo cliente, porém ainda são necessários ajustes nas propriedadesmecânicas. A deformação plástica imposta ao aço na laminação a frio introduz defeitos narede cristalina que levam a uma drástica deterioração das propriedades mecânicas dos aços,tornando-o inadequado para as aplicações usuais. O material encontra-se altamente encruado,ou seja, com alta resistência mecânica e baixa ductilidade (IFT, 2005).

A adequação das propriedades mecânicas das tiras laminadas a frio para as especificaçõesdos clientes é obtida nos processos de recozimento e encruamento.

O processo de recozimento consiste num tratamento térmico, com o objetivo de recuperara ductilidade do material e remover as tensões internas oriundas do laminador de tiras a frio(Araújo, 2003).

Basicamente, no recozimento, é realizado o aquecimento do aço a uma determinada tem-peratura, seguido de resfriamento lento, visando a recuperação das propriedades mecânicasatravés da recristalização dos grãos (IFT, 2005).

Para o caso de tiras de aço laminadas a frio, existem basicamente dois tipos distintos deprocessos de recozimento:

• recozimento em caixa- Neste caso, as bobinas são empilhadas no interior de fornos,em recipientes vedados. O processo de recozimento em caixa consiste num tratamentotérmico subcrítico (temperaturas abaixo de727 oC). O processo de recozimento em caixaapresenta baixa produtividade, uma vez que o ciclo completo pode levar de 3 a 5 dias emmédia;

• recozimento contínuo- Neste caso, as bobinas são desbobinadas e processadas numalinha de processo contínua. Na linha, o material passa pelos fornos de aquecimento,encharque, resfriamento lento, resfriamento rápido, superenvelhecimento e resfriamentosecundário. O processo de recozimento contínuo consiste num tratamento térmico inter-crítico (temperaturas entre700 oC e850 oC). O processo de recozimento contínuo apre-senta alta produtividade, se comparado com o recozimento em caixa, uma vez que umabobina é processada em alguns minutos. O processo de recozimento contínuo apresentaainda as vantagens de possibilitar a produção de produtos de maior valor agregado e aredução do custo de liga dos aços.

Page 69: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

3.3 Etapas do processo 48

A principal finalidade da laminação de encruamento é a eliminação do patamar de escoa-mento definido6, pois se o material após o processo de recozimento vier a ser estampado iráapresentar estrias em sua superfície. Há duas maneiras de se garantir que um material nãoapresente estrias ao ser estampado. A primeira seria deformá-lo por tração simples como numensaio de tração, até o ponto em que o patamar de escoamento tenha sido eliminado. A segundamaneira, seria através da laminação de encruamento, que utiliza pressão e tração na deformaçãodo material. Na laminação de encruamento elimina-se o patamar de escoamento definido comaplicação de deformações da ordem de1%.

No processo de galvanização a tira de aço pode ser revestida com uma fina camada dezinco, liga de zinco-níquel, liga de zinco-ferro ou liga de alumínio-zinco, com a finalidade deelevar a resistência à corrosão. O uso de aço galvanizado na fabricação de veículos tem sidouma solução eficiente contra a corrosão e se constitui numa tendência mundial (IFT, 2005).

Existem basicamente dois tipos de processos de galvanização, o primeiro por eletrode-posição dos íons metálicos sobre a tira de aço e o segundo por imersão da tira num banhometálico. A linha contínua de galvanização por imersão a quente possui dentre as suas diversasseções, uma seção de recozimento, similar à uma linha de recozimento contínuo. Dessa forma,as tiras são primeiramente recozidas para em seguida serem revestidas.

A Figura 3.5 apresenta o fluxo de produção da laminação a frio.

Figura 3.5: Fluxo de produção da laminação a frio.

6Região (patamar) existente na curva do ensaio de tração (tensão x deformação) quando o corpo de prova passado regime plástico para o regime elástico (IFT, 2005).

Page 70: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

3.4 Propriedades mecânicas de aços 49

3.3.5 Conclusão da seção

Como pode ser visto na seção 3.3 o processo completo de fabricação de tiras de aço revesti-das é composto por vários subprocessos independentes e o tempo de produção de um determi-nado produto (lead-time) é elevado. As propriedades mecânicas dos aços são influenciadas emvários destes subprocessos, como no refino, na laminação a quente (aquecimento, laminaçãoe resfriamento) e na laminação a frio (laminação, recozimento e encruamento). Essas consi-derações dificultam sobremaneira a modelagem das propriedades mecânicas através de técni-cas de modelagem fenomenológica. Considerando ainda que o processo é realizado em largaescala, a realização de produção experimental apresenta custo elevado. Essas característicascorroboram o que já foi apresentado no capítulo 1 com relação à motivação principal para odesenvolvimento de uma ferramenta computacional, baseada nas técnicas de inteligência com-putacional, para auxílio no projeto de aços. Analisando cada um dos processos individualmente,desde o refino até a linha de galvanização por imersão a quente, e avaliando a influência de cadaum nas propriedades mecânicas, chegou-se a um conjunto de20 variáveis de entrada, distribuí-das entre a composição química e dados dos processos de laminação a quente, laminação a frioe galvanização por imersão a quente. A Figura 3.6 apresenta o fluxo de produção completoidentificando os processos onde foram coletados dados para serem usados no modelo.

3.4 Propriedades mecânicas de aços

3.4.1 Conceitos básicos

Um tipo de aço a ser selecionado para uma determinada aplicação deve reunir característi-cas adequadas para as condições de trabalho. Inicialmente devem ser identificadas as caracterís-ticas mais importantes que o material deve apresentar (Askeland, 1994). Deve ser um materialresistente, rígido ou dúctil? Estará sujeito a que tipo de esforço? Esforços repetitivos com altascargas? Esforços instantâneos com cargas extremas? Altas tensões? Quais são as condiçõesdo ambiente de instalação do material? Ambiente com temperaturas extremas? Condiçõesabrasivas?

As propriedades mecânicas, Limite de escoamento, Limite de resistência à tração e Alonga-mento constituem características importantes para qualquer tipo de aço e são chamadas de pro-priedades fundamentais.

Para efeito de certificação dos produtos, as propriedades fundamentais são obtidas atravésdo ensaio de tração, onde um corpo de prova é submetido a um esforço de tração uniaxial

Page 71: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

3.4 Propriedades mecânicas de aços 50

Figura 3.6: Fluxo de produção completo com identificação dos processos onde foram coletados dadospara o modelo. Entradas: elipses cheias. Saída: elipse tracejada.

crescente. As especificações quanto à forma e dimensões dos corpos de prova, velocidadede tensionamento e base de medida, entre outras, são ditadas por normas técnicas. Durantea realização do ensaio é registrada a força (que pode ser convertida em tensão,σc) versus avariação de comprimento do corpo de prova (que se converte em deformação,εc) até a rupturado mesmo.

Ao final do ensaio é obtida a curva de tensão versus deformação do corpo de prova, con-forme apresentado na Figura 3.7

3.4.2 Limite de escoamento - LE

Segundo Askeland (1994), o limite de escoamento é a tensão na qual a deformação plásticase torna aparente, ou também, a tensão que divide o comportamento do material entre plásticoe elástico. Na Figura 3.7 a tensãoσ1 corresponde ao limite de escoamento do material.

Page 72: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

3.4 Propriedades mecânicas de aços 51

Figura 3.7: Diagrama tensão x deformação típico.

Em referências de língua inglesa, é comum o uso da expressãoyield strengthpara esseparâmetro.

3.4.3 Limite de resistência - LR

Ainda segundo Askeland (1994), o limite de resistência é a máxima força aplicada noensaio de tração, ou também, a maior tensão presente na curva tensão-deformação. Na Figura3.7 a tensãoσ2 corresponde ao limite de resistência do material.

Em referências de língua inglesa, é comum o uso das expressõesultimate strengthe tensilestrengthpara esse parâmetro.

3.4.4 Ductilidade - ALO

Askeland (1994) define ductilidade como sendo uma medida da quantidade de deformaçãoque um corpo de prova resiste sem se romper. Essa propriedade é obtida através da mediçãodo comprimento do corpo de prova antes e após o ensaio. Na Figura 3.7εc corresponde àdeformação do material. O alongamento percentual, calculado como na Equação 3.1, descreve

Page 73: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

3.4 Propriedades mecânicas de aços 52

o quanto o material extende antes da ruptura.

ALO(%) =lf − l0

l0× 100, (3.1)

sendol0 o comprimento inicial elf o comprimento final do corpo de prova. Pelo fato da ducti-lidade ser mensurada pelo alongamento, como pode ser visto na Equação 3.1, o alongamento éo termo mais comumente usado tanto na literatura quanto na siderurgia e na indústria.

3.4.5 Máquina de ensaio de tração da USIMINAS

Os ensaios de tração cujos resultados foram utilizados no presente trabalho foram reali-zados no laboratório de testes mecânicos da USIMINAS, em amostras retiradas da produçãoreal. As máquinas de ensaio são de fabricaçãoINSTRON, modelo4482, equipadas com umsoftwarepara controle do ensaio, aquisição de dados e geração de resultados. As máquinas pos-suem ainda extensômetros digitais de alta resolução e acessórios para identificação, mediçãodas dimensões e robôs para manuseio dos corpos de prova. A Figura 3.8 apresenta uma foto damáquina de ensaio de tração.

Figura 3.8: Máquina de ensaio de tração.

Page 74: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

3.5 Aços de alta resistência microligados 53

Após conceituadas as propriedades mecânicas e apresentada a máquina que realiza os en-saios de tração, na seção seguinte será apresentada uma introdução sobre os aços HSLA.

3.5 Aços de alta resistência microligados

No passado, a demanda por aços de alta resistência era quase que exclusivamente restritaa produtos laminados a quente. Somente em meados da década de 1970 foi iniciada a pro-dução destes materiais laminados a frio, visando principalmente o atendimento às exigências desegurança e redução de peso, impostas pela indústria automobilística (Barbosa et al., 2004).

Os aços HSLA constituem-se em produtos com limite de escoamento entre 350 MPa a500 MPa, desenvolvidos a partir da adição de microligantes como Nb, Ti, V e outros, que empequena quantidade têm a finalidade de elevar o nível de resistência. Vários mecanismos sãoutilizados para se produzir este efeito. Os normalmente utilizados são o endurecimento porsolução sólida, por precipitação, por refino de grãos e por transformação de fases (Barbosaet al., 2004).

A obtenção de propriedades mecânicas adequadas aos aços de alta resistência dependetanto da composição química quanto das condições de processamento industrial (Barbosa et al.,2004).

A influência da composição química nas propriedades mecânicas, segundo Barbosa et al.(2004) deve ser entendida sob dois aspectos distintos, sendo o primeiro em relação ao efeito doselementos microligantes (Nb, Ti, V e outros), que envolve mecanismos de endurecimento porprecipitação e refinamento de grãos. O outro aspecto é o aumento de resistência por soluçãosólida, provocado pelo acréscimo nas concentrações de P, Mn e S.

Ainda segundo Barbosa et al. (2004), a importância das variáveis operacionais nas pro-priedades torna-se ainda mais significativa em função da multiplicidade de mecanismos de en-durecimento envolvidos (solução sólida, precipitação e refino de grãos). Na laminação a quenteos parâmetros mais importantes são a temperatura de acabamento e a temperatura de bobina-mento. Já na laminação a frio um parâmetro importante é a taxa de redução a frio, que afetaas propriedades mecânicas por alterar as condições de recristalização destes aços após o reco-zimento. No recozimento, a fase de encharque do material é a que exerce maior influência naspropriedades mecânicas dos aços de alta resistência microligados.

Para os diversos graus de aços HSLA, laminados a frio e revestidos por imersão a quente,os valores de composição química e as garantias de propriedades mecânicas da norma inter-nacional EN 10292 são apresentados, repectivamente, nas Tabelas 3.1 e 3.2. Neste trabalho

Page 75: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

3.5 Aços de alta resistência microligados 54

Tabela 3.1: Valores de composição química [%] para aços HSLA - FONTE: Norma EN 10292.

Grau C Máx. Si Máx. Mn Máx. P Máx. S Máx. Al Min. Ti Máx. Nb Máx.

H260LAD 0,60H300LAD 1,00H340LAD 0,11 0,50 0,025 0,025 0,015 0,15 0,09H380LAD 1,40H420LAD

Tabela 3.2: Garantias de propriedades mecânicas para aços HSLA - FONTE: Norma EN 10292.

Grau LE [MPa] LR [MPa] ALO [%] Min.

H260LAD 260 a330 350 a430 26H300LAD 300 a380 380 a480 23H340LAD 340 a420 410 a510 21H380LAD 380 a480 440 a560 19H420LAD 420 a520 470 a590 17

foram usados dados de processo de todos os graus de aços apresentados nas Tabelas 3.1 e 3.2.

Outras características destes aços poderiam ser tratadas, mas isso foge ao escopo do tra-balho. Melhores informações podem ser obtidas em Ono et al. (1982), Goodman e R. (1984),Pradhan (1984) e Barbosa et al. (2004).

A seção seguinte apresenta as implementações das RNAs e dos sistemas híbridosneuro-fuzzye os resultados obtidos na predição das propriedades mecânicas dos aços HSLA, lamina-dos a frio e revestidos por imersão a quente.

Page 76: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

Capítulo 4

Predição das Propriedades Mecânicas deAços HSLA

4.1 Introdução

Este capítulo apresenta o desenvolvimento realizado no trabalho. São apresentados os pro-blemas e as técnicas empregadas para a seleção e o pré-processamento das variáveisde e asdiversas implementações realizadas utilizando os métodos de inteligência computacional, Re-des Neurais Artificiais e Sistemas HíbridosNeuro-fuzzy, a fim de se obter o melhor modelo paraa predição de propriedades mecânicas de aços HSLA. Também são apresentados e discutidosos respectivos resultados.

Para uma melhor comparação do desempenho dos diversos modelos, em todas as aborda-gens utilizou-se o mesmo conjunto de dados de treinamento e validação

4.2 Seleção e pré-processamento das variáveis de entrada

A seleção e o pré-processamento das variáveis são importantes no sentido de dar robusteze elevar o desempenho de modelos baseados em dados de processos industriais. Neste capítulosão discutidas técnicas para a seleção e o pré-processamento das variáveis a serem usadas namodelagem através dos métodos de inteligência computacional.

Segundo Bishop (1995), um dos fatores mais importantes para determinação do sucesso deuma aplicação prática de redes neurais artificiais é a forma de pré-processamento aplicada aos

Page 77: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

4.2 Seleção e pré-processamento das variáveis de entrada 56

dados.

Tenner et al. (2001) faz algumas considerações que devem ser levadas em conta para aconstrução de modelos baseados em dados reais de processos industriais. Dados inconsistentespodem ocorrer devido a vários fatores, tais como:

• erros na medição dos dados do processo;

• ruídos presentes nos dados de processo;

• erros no manuseio dos dados (leitura ou digitação);

• erros no tratamento dos dados.

Para localizar os dados inconsistentes, algumas técnicas podem ser empregadas. As técni-cas mais comum são:

• checagem dos limites dos dados;

• análise de correlação;

• técnicas para deteção automática deoutliers;

• avaliação dos resultados do modelo, que podem apontar para dados de entrada inconsis-tentes.

Além da avaliação dos dados inconsistentes, deve-se levar em conta a distribuição dosdados para se evitar que o modelo apresente desempenho pior para determinadas regiões doespaço de entradas onde houve poucos padrões disponíveis para o treinamento.

4.2.1 Seleção das variáveis de entrada

O fluxo de produção de tiras de aço laminadas a frio e galvanizadas envolve uma série deprocessos até a obtenção do produto final. No caso particular da Usina Intendente Câmara, ondeeste trabalho foi aplicado, o fluxo de produção completo foi detalhado no capítulo 3.

Para a seleção das variáveis importantes para a predição das propriedades mecânicas foramlevados em consideração os trabalhos de Myllykoski et al. (1996), Chen e Linkens (1999),Tenner et al. (2001), Yang e Linkens (2001) e Golodnikov et al. (2005). Nestes estudos, é

Page 78: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

4.2 Seleção e pré-processamento das variáveis de entrada 57

unânime a utilização dos dados de composição química e parâmetros de processo, tais comoas temperaturas de laminação a quente e temperaturas dos fornos de recozimento, nos modelospara predição de propriedades mecânicas utilizando técnicas de inteligência computacional.

Seguindo a sugestão de Tenner et al. (2001), a seleção das variáveis a serem incluídas nomodelo deve levar em conta também a avaliação de especialistas em metalurgia.

Como mencionado no capítulo 3, e de acordo com a literatura, foram selecionadas 20variáveis de entrada de dois grupos distintos: composição química e dados dos processos. ATabela 4.1 apresenta as variáveis de entrada.

Tabela 4.1: Variáveis de entrada.

Grupo Variável Unidade

Composição química C %Mn %Nb %P %S %Al %N %Ti %

Dados de processo Espessura da bobina a quente mmTemperatura de acabamento oCTemperatura de bobinamento oC

Espessura da bobina a frio mmLargura da bobina a frio mm

Temperatura do forno RTF oCTemperatura do forno SF oC

Temperatura do forno SCF oCTemperatura do forno JCF oC

Carga de laminação (encruamento) tAlongamento no encruamento %

Velocidade mpm

As variáveis de saída a serem preditas pelos modelos são as propriedades fundamentais dosaços, também definidas no capítulo 3; Limite de escoamento, Limite de resistência e Alonga-mento. Como apresentado na seção 3.4.5, os valores destas propriedades são obtidos através doensaio de tração.

Page 79: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

4.2 Seleção e pré-processamento das variáveis de entrada 58

4.2.2 Coleta de dados

Após a definição das variáveis de entrada e saída a serem usadas para o desenvolvimentodo modelo partiu-se para a coleta dos dados.

Foram realizadas consultas ao banco de dados de processo de forma a se ter um conjunto depadrões contendo todas as variáveis de entrada e saída num único arquivo Excel. Este arquivo,contendo 4983 padrões, compreendia toda a produção de aços da família HSLA processados nagalvanização por imersão a quente da USIMINAS nos anos de 2004 e 2005.

4.2.3 Análise estatística das variáveis

A partir do arquivo básico de dados, foram realizadas análises para identificação e remoçãode padrões com variáveis faltantes, checagens de limites dos dados de acordo com a orientaçãodos especialistas em metalurgia e verificada a distribuição de cada uma das variáveis.

A Figura 4.1 apresenta, como exemplo, o gráfico da variável carga de laminação do lami-nador de encruamento e a Figura 4.2 o histograma para a mesma variável.

0 500 1000 1500 2000 2500 3000 3500 4000100

150

200

250

300

350

400

450

500

Amostras

[Ton

]

Dados de Carga

Figura 4.1: Carga de laminação.

100 150 200 250 300 350 400 450 5000

100

200

300

400

500

600

700

800

900

1000

[Ton]

No.

de

Am

ostr

as

Dados de Carga: Média: 264.45 STD: 51.36

Figura 4.2: Histograma - Carga de laminação.

4.2.4 Identificação automática deoutliers

Um outlier pode ser definido como uma amostra que desvia muito em relação às outraslevantando a suspeita que ela tenha sido gerada por um outro mecanismo (Hawkins, 1980).

A identificação de outliers pode ser aplicada durante o processo de filtragem dos dados emmineração de dados (data mining) para a identificação de dados com problemas e também em

Page 80: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

4.2 Seleção e pré-processamento das variáveis de entrada 59

outros casos nos quais ooutlier é de particular interesse; por exemplo no caso de fraudes emcartões de crédito ooutlier representa a fraude (Hawkins et al., 2002).

Neste trabalho, a identificação deoutliers foi utilizada como uma segunda filtragem dosdados, após a análise apresentada na seção 4.2.3.

Foram aplicadas duas técnicas para identificação deoutliersem conjuntos de dados mul-tivariáveis, a primeira baseada no cálculo da distância de Mahalanobis e a segunda baseadana implementação de uma rede neural replicadora das entradas,Replicator Neural Network(RNN).

4.2.4.1 Identificação de outliers pela distância de Mahalanobis

A distância de Mahalanobis é um método estatístico baseado no cálculo de distância, criadopor P. C. Mahalanobis, no qual é calculada a distância de uma amostra em relação ao centróidede todas as amostras (Jarrel, 1992).

Considere-se um conjunto de dados multivariávelp-dimensional comn amostras, no quala i−ésima amostra sejaXT

i = (xi1,xi2,...,xip), X seja o vetor de médias do conjunto eV seja amatriz de covariância. Uma maneira clássica de se detetar outliers deste conjunto é calculando-se a distância de Mahalanobis de cada amostra, como descrito em Jarrel (1992), através daequação:

D2(Xi) = (Xi −X)TV −1(Xi −X) (4.1)

O uso da distância de Mahalanobis normalmente oferece melhores resultados do que o métodocomumente utilizado da distância Euclidiana. Isto ocorre porque a distância de Mahalanobisavalia não somente a média, como a distância Euclidiana, mas também a variância e a cova-riância entre as variáveis envolvidas (Rennó, 1995).

A Figura 4.3 apresenta osoutliers identificados em todo o conjunto de dados e destacadosna variável ’Temperatura do forno SF’.

4.2.4.2 Identificação de outliers utilizando RNN

Uma RNN (Replicator Neural Network) é um caso específico de RNA do tpo MLP (Multi-layer Perceptron) com três camadas intermediárias e cujo objetivo é a reprodução dos padrõesde entrada na camada de saída. O número de neurônios nas três camadas intermediárias éselecionado experimentalmente com a finalidade de minimizar o erro para os padrões de treina-mento (Hawkins et al., 2002).

Page 81: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

4.2 Seleção e pré-processamento das variáveis de entrada 60

0 200 400 600 800 1000 1200 1400680

700

720

740

760

780

800Outliers de temperatura do forno SF

amostras

T [o

C]

Possíveis Outliers

Figura 4.3:Outliers do conjunto multivariável identificados pelo método da distância de Mahalanobisapresentados sobre a variável ’Temperatura do forno SF’.

A Figura 4.4 apresenta uma RNN onde podem ser vistas as 5 camadas, sendo 3 camadasintermediárias, e o vetor de entradas que é também o vetor de saídas desejadas.

Figura 4.4: RNN - Rede Neural Replicadora, mostrando as 5 camadas e o vetor de entradasV que étambém o vetor de saídas desejadas.

Como as variáveis de entrada numa RNN são também as variáveis de saída, a RNN formaum codificador, criando um modelo comprimido dos dados durante o treinamento. A identifica-

Page 82: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

4.2 Seleção e pré-processamento das variáveis de entrada 61

ção deoutliersé baseada no erro de reconstrução de cada um dos padrões de entrada (Hawkinset al., 2002). Padrões com alto erro de reconstrução são consideradosoutliers.

A Figura 4.5 apresenta osoutliers identificados em todo o conjunto de dados e destacadosna variável ’Temperatura do forno SF’.

0 200 400 600 800 1000 1200 1400680

700

720

740

760

780

800Outliers de temperatura do forno SF

amostras

T [o

C]

Possíveis Outliers

Figura 4.5:Outliers do conjunto multivariável identificados pela RNN apresentados sobre a variável’Temperatura do forno SF’.

4.2.4.3 Conclusão da seção

A aplicação de técnicas de indentificação deoutliersem conjuntos de dados multivariáveisé uma etapa importante no pré-processamento dos dados de entrada para o desenvolvimento demodelos baseados em dados reais.

Como mostrado nas Figuras 4.3 e 4.5, para a variável ’Temperatura do forno SF’, ambasas técnicas aplicadas no trabalho identificaram como sendo possíveisoutliersos padrões desta-cados nas figuras, os quais foram posteriormente analisados, pelos especialistas em metalurgia,e chegou-se a conclusão que vários destes possíveis outliers sobre a variável ’Temperatura doforno SF’ eram realmenteoutliers. Alguns dos possíveisoutliersmostrados nas Figuras 4.3 e4.5 não se configuraramoutliersverdadeiros durante a análise.

Analisando osoutliersidentificados nas Figuras 4.3 e 4.5, verifica-se a importância da apli-

Page 83: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

4.2 Seleção e pré-processamento das variáveis de entrada 62

cação de mais de uma técnica de identificação deoutlierse também a necessidade de avaliaçãodos possíveisoutliers, uma vez que as técnicas podem apresentar falhas e identificar falsosoutliers.

4.2.5 Normalização das variáveis

Após as etapas de pré-processamento dos dados das seções 4.2.3 e 4.2.4, obteve-se umconunto de3599 padrões válidos para o desenvolvimento dos modelos.

Como última etapa do pré-processamento dos dados, iniciou-se a normalização das en-tradas. A normalização tem o objetivo de se evitar problemas numéricos durante o treinamento,devido à ordem de grandeza de cada uma das variáveis de entrada, e também melhorar o de-sempenho do algoritmo de treinamentoback-propagation(Haykin, 1999).

Foram realizados os dois tipos de normalização mais comuns na literatura, a normalizaçãode cada uma das variávis de entradas na faixa de±1 e também a normalização com média0 edesvio padrão1.

4.2.6 Redução da dimensionalidade utilizando PCA

A análise de componentes principais é um método estatístico multivariado linear, que per-mite a redução da dimensionalidade de um conjunto de variáveis (Johnson e Wichern, 1988),fornecendo uma visão estatisticamente privilegiada do conjunto de dados. O método de PCAfornece as ferramentas adequadas para identificar as variáveis mais importantes no espaço dascomponentes principais (Moita Neto, 2004).

A método de PCA consiste em reescrever as variáveis originais em novas variáveis deno-minadas componentes principais, através de uma transformação de coordenadas. Cada compo-nente principal é uma combinação linear de todas as variáveis originais (Moita Neto, 2004).

Uma vantagem dos compontentes principais sobre as variáveis originais é que as variáveisoriginais podem guardar correlações entre si e os componentes principais são ortogonais entresi, de forma que cada componente principal traz uma informação estatística diferente dos outros.

Para o treinamento das RNAs, a descorrelação das variáveis de entrada no conjunto deestimação possibilita melhoria na convergência, com ganho de simplicidade para o modelo(Haykin, 1999);

Neste trabalho foi aplicada a técnica de PCA no conjunto de variáveis de entrada, con-

Page 84: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

4.2 Seleção e pré-processamento das variáveis de entrada 63

siderando um conjunto de componentes principais representando99% da variância do conjuntodas variáveis originais. Com essa restrição de99% da variância, o conjunto de variáveis deentrada foi reduzido de20 variáveis para 14. Esse novo conjunto de variáveis de entrada geradofoi usado no treinamento da RNA e os resultados dessa implementação são apresentados naseção 4.4.

4.2.7 Agrupamento de dados

Agrupamento de dados (data clustering) é uma técnica largamente empregada para organi-zação e segregação de dados, mas também útil para a compressão de dados e a construção demodelos (Jang et al., 1997).

O agrupamento de dados consiste no particionamento de um conjunto de dados em váriosgrupos, de forma que a similaridade interna em um grupo seja menor que entre grupos. Amedida da similaridade normalmente envolve métricas baseadas no cálculo de distância.

Existem várias técnicas para a criação de agrupamentos, porém, segundo Jang et al. (1997),algumas técnicas são mais frequentemente utilizadas na modelagem através de sistemas nebu-losos (fuzzy). São elas:

• K-means ou C-means;

• fuzzy C-means clustering;

• mountain clustering;

• subtractive clustering.

Cada uma das técnicas, incluindo seu algoritmo, é detalhada em Jang et al. (1997).

No trabalho foi aplicada a técnica desubtractive clusteringpara o agrupamento das variá-veis para a criação dos sistemas híbridosneuro-fuzzy.

Essa técnica encontra-se embutida na funçãogenfis2do MATLAB e é aplicada sobre oconjunto de entradas e saídas, para determinação dos centros dos agrupamentos, que serão emseguida usados na determinação do número de regras e de funções de pertinência das entradasdo sistemaneuro-fuzzy.

Page 85: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

4.3 Predição utilizando regressão linear múltipla 64

4.3 Predição utilizando regressão linear múltipla

A análise de regressão é uma técnica para modelagem do relacionamento entre duas oumais variáveis. A análise de regressão pode ser vista como o estudo de correlação entre asvariáveis (Jones et al., 2005).

Essa primeira abordagem foi realizada apesar da literatura consultada apontar para a exis-tência de relações não lineares entre os parâmetros envolvidos na predição das propriedadesmecânicas de aços HSLA(Jones et al., 2005).

Os histogramas dos erros percentuais e os erros percentuais médios obtidos para os padrõesde validação, para cada uma das propriedades mecânicas, através da regressão linear múltiplasão apresentados na Figura 4.6.

O erro percentual foi calculado de acordo com a Equação 4.2 e o erro percentual médiocomo em Jang (1993) e apresentado na Equação 4.3

EP =T (i) − O(i)

T (i)∗ 100%, (4.2)

EPM =1

P

P∑i=1

|T (i) − O(i)||T (i)| ∗ 100%, (4.3)

sendoP o número de padrões de validação,T (i) eO(i) a i−ésima saída desejada e calculadarespectivamente.

A Figura 4.7 apresenta os resultados da análise de correlação para a predição das pro-priedades mecânicas através da regressão linear múltipla.

De acordo com o trabalho de Jones et al. (2005), para os aços HSLA, uma comparação dodesvio padrão do erro de predição (predito x real) para as propriedades mecânicas utilizando re-gressão linear múltipla, regressão não linear múltipla (quadrática), regressão não linear múltipla(cúbica) e RNAs treinadas com algoritmoLevemberg-Marquardte parada antecipada, demons-tra que todas as técnicas de análise de regressão utilizadas apresentam desempenhos similares,enquanto que o modelo neural apresenta o melhor desempenho. A Tabela 4.2 apresenta o de-sempenho dos modelos citados.

Page 86: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

4.3 Predição utilizando regressão linear múltipla 65

−20 −10 0 10 200

500

1000

1500LE: EPM = 3.58 %

Erro percentual

No.

Am

ostr

as

−20 −10 0 10 200

500

1000

1500

2000LR: EPM = 2.05 %

Erro percentual

No.

Am

ostr

as−50 0 500

500

1000

1500

2000LE: EPM = 5.81 %

Erro percentual

No.

Am

ostr

as

Figura 4.6: Histogramas dos Erros percentuais e Erros percentuais médios (EPM) usando regressão li-near múltipla.

200 300 400 500 600200

300

400

500

600LE [MPa]: R = 0.89

Real

Reg

ress

ão li

near

300 400 500 600 700300

400

500

600

700LR [MPa]: R = 0.95

Real

Reg

ress

ão li

near

10 20 30 40 5010

20

30

40

50ALO[%]: R = 0.74

Real

Reg

ress

ão li

near

Figura 4.7: Análise de correlação (R:Coeficiente de correlação) dos resultados de predição usando re-gressão linear múltipla.

Page 87: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

4.4 Predição através de RNAs 66

Tabela 4.2: Médias e Desvios padrão (SD) dos erros de predição de propriedades mecânicas para açosHSLA, usando regressão linear, regressão não linear quadrática (Q) e cúbica (C) - FONTE:(Jones et al., 2005).

Modelo LE LR ALOMédia SD Média SD Média SD

Reg. Linear 0,0 28,65 0,0 23,43 0,0 3,22Reg. Não Linear (Q) 0,0 26,80 0,0 22,30 0,0 3,15Reg. Não Linear (C) 0,0 24,75 0,0 20,76 0,0 3,04

RNA −0,01827 8,171 −0,004365 8,248 0,01796 1,301

4.4 Predição através de RNAs

A predição de propriedades mecânicas de materiais através de modelos desenvolvidos apartir de RNAs, objetivo deste trabalho, tem sido objeto de pesquisa há alguns anos, comopode ser visto nos trabalhos realizados por Myllykoski et al. (1996), Liu et al. (1996), Warde eKnowles (1999), Tenner et al. (2001), Yang e Linkens (2001) e Jones et al. (2005), que apre-sentam resultados satisfatórios na aplicação desta técnica. Assim como nos trabalhos citados,foram também desenvolvidas neste trabalho RNAs do tipo MLP (Multilayer Perceptron).

4.4.1 Arquitetura de RNAs

4.4.1.1 Definição do número de camadas intermediárias

As RNAs de uma só camada conseguem tratar apenas problemas lineramente separáveis(Braga et al., 2000). O tratamento de problemas não linearmente separáveis passa necessaria-mente pela aplicação de RNAs com uma ou mais camadas intermediárias. Segundo Cybenko(1988) uma RNA com uma camada intermediária, sem restrição no número de neurônios nestacamada, é capaz de aproximar qualquer função contínua. Uma RNA com duas camadas inter-mediárias permite a aproximação de qualquer função (Cybenko, 1988).

Neste trabalho, em testes preliminares, foram realizadas implementações de RNAs comuma e duas camadas intermediárias, sendo que as RNAs com apenas uma camada intermediáriaapresentaram melhores resultados. Para este propósito, as RNAs foram treinadas com o algo-ritmo de treinamentoback-propagationusando a minimização do erro médio quadrático (MSE)pelo método de otimização do gradiente conjugado descrito em Edgar e Himmelblau (1988) eJang et al. (1997), usando a funçãotrainscgdetalhada em Demut e Beale (1997). A função

Page 88: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

4.4 Predição através de RNAs 67

trainscg foi usada para treinamento das RNAs apenas para definição do número de camadasintermediárias. Em todas as outras implementações foi usado o algoritmo deLevemberg Mar-quardt.

Os resultados de algumas situações para as duas implementações podem ser vistos naTabela 4.3. No caso das RNAs com apenas uma camada intermediária obteve-se o melhor resul-tado, em termos de validação, com21 neurônios na camada intermediária. Por isso não são apre-sentados na tabela os MSE para as configurações com mais de21 neurônios. No caso das RNAscom duas camadas intermediárias, por questões de simplificação na implementação, as mesmasforam treinadas com números iguais de neurônios em ambas as camadas intermediárias. Nestecaso, o melhor resultado de validação foi obtido com35 neurônios em ambas as camadas.

Em função dos resultados apresentados na Tabela 4.3 optou-se, neste trabalho, pelo desen-volvimento de RNAs com apenas uma camada intermediária.

4.4.1.2 Definição do número de neurônios na camada intermediária

A partir da definição de se trabalhar com RNAs com apenas uma camada intermediária,o próximo problema que se apresenta é a definição do número de neurônios da camada inter-mediária. Segundo Braga et al. (2000) o número de neurônios da camada intermediária é emgeral definido empiricamente e depende de vários fatores, tais como:

• número de exemplos de treinamento;

• quantidade de ruído nos exemplos;

• complexidade da função a ser aprendida;

• distribuição estatística dos dados de treinamento.

Na tentativa de se buscar a melhor arquitetura para as RNAs desenvolvidas, em relação aonúmero de neurônios da camada intermediária, foi implementada uma estratégia de treinamentobaseda na implementação de vários modelos com diferentes números de neurônios, variando-se o número de neurônios da camada intermediária den/2 até2n + 1, sendon o número deentradas da RNA.

O valor limite de2n+1 neurônios foi definido com base no teorema de Kolmogorov citadoem Gorni (1997), Mazzatorta et al. (2003) e Jones et al. (2005).

Page 89: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

4.4 Predição através de RNAs 68

Tabela 4.3: Erro médio quadrático (MSE) dos treinamentos de RNAs com uma e duas camadas inter-mediárias.

No. Camadas No. Neurônios MSE: Padrõesintermediárias escondidos de validação

1 5 125,52 5 - 5 129,0

1 10 118,22 10 - 10 119,3

1 17 115,32 17 - 17 116,2

1 21 112,02 21 - 21 115,4

1 25 −2 25 - 25 115,1

1 29 −2 29 - 29 113,7

1 35 −2 35 - 35 112,6

1 40 −2 40 - 40 −1 45 −2 45 - 45 −1 50 −2 50 - 50 −

Em seguida, é apresentado o detalhamento do algoritmo utilizado para obtenção da arquite-tura da melhor RNA, em termos de erro de validação, variando-se o número de neurônios dacamada intermediária den/2 até2n + 1.

Como função de ativação dos neurônios, tanto da camada intermediária quanto da camadade saída, foi usada a função sigmoidal tangente hiperbólica.

Page 90: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

4.4 Predição através de RNAs 69

Algoritmo 1 Estratégia de treinamento para se obter a melhor RNA1: Carrega conjunto de padrões de treinamento e validação;2: Inicializa número mínimo (nnmin) e máximo (nnmax) de neurônios da camada inter-

mediária;3: Inicializa número máximo de inicializações (nmaxreinic) de cada configuração da RNA;4: Inicializa erro de validação (menormse); {Inicializa erro de validação com valor elevado}5: for (nn = nnmin : nnmax) do6: for (nreinic = 1 : nmaxreinic) do7: Incializa RNA com nn; {Inicializa RNA comnn neurônios na camada intermediária}8: Treina RNA comearly stopping; {Treina RNA comnn neurônios na camada inter-

mediária}9: if (msevalatual < menormse) then

10: menormse = mseatual; {Atualiza menor erro de validação obtido}11: Salva a RNA; {Salva pesos ebiasda RNA}12: end if13: end for14: end for

4.4.2 Treinamentos realizados

Foi implementado basicamente o algoritmo de treinamentoback-propagationusando aminimização do MSE baseada no método deLevemberg Marquardt, por sua característica derápida convergência e robustez (Norgaard, 1997).

Foram implementadas também várias estratégias para elevar a capacidade de generalizaçãodas RNAs durante o treinamento, de forma a se obterem modelos com elevada capacidade degeneralização, ou seja, redes que respondam de forma adequada a padrões desconhecidos. Alémde ser realizada a separação do conjunto de dados em 2 subconjuntos, um para treinamentocom 3

4dos dados e o segundo para validação com1

4dos dados, foram utilizadas as estratégias

apresentadas no capítulo 2 :

• early stopping - parada antecipada do treinamento pelo erro do conjunto de validação;

• regularização bayesiana- controla o crescimento da complexidade do modelo;

• pruning - reduz a complexidade da RNA alterando a sua estrutura;

• ensemble model - uso de um conjunto de RNAs.

Para efeito de comparação da influência da normalização dos dados no desempenho dos

Page 91: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

4.4 Predição através de RNAs 70

modelos foram treinadas RNAs cujos padrões de treinamento e validação foram normalizadoscom duas abordagens diferentes. A primeira normalizando os dados entre−1 e+1 e a segundanormalizando com média zero e desvio padrão 1.

Como mencionado na seção 4.2.6 foi usada no pré-processamento dos dados de entrada atécnica de PCA para redução da dimensionalidade das entradas sem perda da informação pre-sente nos dados. Uma RNA foi treinada utilizando este conjunto de dados de entrada reduzido.

Os resultados de cada implementação são apresentados a seguir.

4.4.2.1 Algoritmo Levemberg Marquardt com parada antecipada pelo erro de validação

Os histogramas dos erros percentuais e os erros percentuais médios obtidos para os padrõesde validação, para cada uma das propriedades mecânicas, através da RNA treinada utilizandoo algoritmo de otimização proposto porLevemberg Marquardt, com parada antecipada (funçãotrainlm do MATLAB) e normalização dos padrões entre−1 e +1, são apresentados na Figura4.8. A Figura 4.9 apresenta os resultados da análise de correlação.

−20 −10 0 10 200

100

200

300LE: EPM = 2.75 %

Erro percentual

No.

Am

ostr

as

−10 −5 0 5 100

100

200

300LR: EPM = 1.67 %

Erro percentual

No.

Am

ostr

as

−40 −20 0 20 400

100

200

300

400LE: EPM = 5.19 %

Erro percentual

No.

Am

ostr

as

Figura 4.8: Histogramas dos Erros percentuais e Erros percentuais médios (EPM) da RNA usando LMcom parada antecipada pelo erro de validação e normalização entre -1 e +1.

Na Figura 4.10 são apresentados os histogramas dos erros percentuais e os erros percentu-ais médios obtidos para os padrões de validação com o algoritmo de otimização proposto por

Page 92: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

4.4 Predição através de RNAs 71

200 300 400 500 600200

300

400

500

600LE [MPa]: R = 0.94

Real

RN

A

300 400 500 600 700300

400

500

600

700LR [MPa]: R = 0.97

Real

RN

A10 20 30 40 50

10

20

30

40

50ALO[%]: R = 0.81

Real

RN

A

Figura 4.9: Análise de correlação (R:Coeficiente de correlação) dos resultados de predição da RNAusando LM com parada antecipada pelo erro de validação e normalização entre -1 e +1.

Levemberg Marquardt, com parada antecipada (funçãotrainlm do MATLAB) e normalizaçãodos padrões com média 0 e desvio padrão 1. A Figura 4.11 apresenta os resultados da análisede correlação.

4.4.2.2 Algoritmo Levemberg Marquardt com Regularização bayesiana

Os histogramas dos erros percentuais e os erros percentuais médios obtidos para os padrõesde validação, para cada uma das propriedades mecânicas, através da RNA treinada utilizandoo algoritmo de otimização proposto porLevemberg Marquardt, com regularização bayesiana(funçãotrainbr do MATLAB) e normalização dos padrões entre−1 e+1, são apresentados naFigura 4.12. A Figura 4.13 apresenta os resultados da análise de correlação.

Na Figura 4.14 são apresentados os histogramas dos erros percentuais e os erros percentu-ais médios obtidos para os padrões de validação com o algoritmo de otimização proposto porLevemberg Marquardt, com regularização bayesiana (funçãotrainbr do MATLAB) e normali-zação dos padrões com média 0 e desvio padrão 1. A Figura 4.15 apresenta os resultados daanálise de correlação.

Page 93: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

4.4 Predição através de RNAs 72

−20 −10 0 10 200

100

200

300

400LE: EPM = 2.85 %

Erro percentual

No.

Am

ostr

as

−10 −5 0 5 100

100

200

300LR: EPM = 1.69 %

Erro percentual

No.

Am

ostr

as

−40 −20 0 20 400

100

200

300

400LE: EPM = 5.21 %

Erro percentual

No.

Am

ostr

as

Figura 4.10: Histogramas dos Erros percentuais e Erros percentuais médios (EPM) da RNA usando LMcom parada antecipada pelo erro de validação e normalização com média 0 e desvio padrão1.

200 300 400 500 600200

300

400

500

600LE [MPa]: R = 0.93

Real

RN

A

300 400 500 600 700300

400

500

600

700LR [MPa]: R = 0.97

Real

RN

A

10 20 30 40 5010

20

30

40

50ALO[%]: R = 0.81

Real

RN

A

Figura 4.11: Análise de correlação (R:Coeficiente de correlação) dos resultados de predição da RNAusando LM com parada antecipada pelo erro de validação e normalização com média 0 edesvio padrão 1.

Page 94: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

4.4 Predição através de RNAs 73

−20 −10 0 10 200

100

200

300LE: EPM = 2.79 %

Erro percentual

No.

Am

ostr

as

−20 −10 0 100

100

200

300LR: EPM = 1.62 %

Erro percentual

No.

Am

ostr

as−40 −20 0 20 400

100

200

300LE: EPM = 5.24 %

Erro percentual

No.

Am

ostr

as

Figura 4.12: Histogramas dos Erros percentuais e Erros percentuais médios (EPM) da RNA usando LMcom regularização bayesiana e normalização entre -1 e +1.

200 300 400 500 600200

300

400

500

600LE [MPa]: R = 0.94

Real

RN

A

300 400 500 600 700300

400

500

600

700LR [MPa]: R = 0.97

Real

RN

A

10 20 30 40 5010

20

30

40

50ALO[%]: R = 0.81

Real

RN

A

Figura 4.13: Análise de correlação (R:Coeficiente de correlação) dos resultados de predição da RNAusando LM com regularização bayesiana e normalização entre -1 e +1.

Page 95: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

4.4 Predição através de RNAs 74

−20 −10 0 10 200

100

200

300LE: EPM = 2.85 %

Erro percentual

No.

Am

ostr

as

−10 −5 0 5 100

100

200

300

400LR: EPM = 1.64 %

Erro percentual

No.

Am

ostr

as−40 −20 0 20 400

100

200

300LE: EPM = 5.25 %

Erro percentual

No.

Am

ostr

as

Figura 4.14: Histogramas dos Erros percentuais e Erros percentuais médios (EPM) da RNA usando LMcom regularização bayesiana e normalização com média 0 e desvio padrão 1.

200 300 400 500 600200

300

400

500

600LE [MPa]: R = 0.93

Real

RN

A

300 400 500 600 700300

400

500

600

700LR [MPa]: R = 0.97

Real

RN

A

10 20 30 40 5010

20

30

40

50ALO[%]: R = 0.81

Real

RN

A

Figura 4.15: Análise de correlação (R:Coeficiente de correlação) dos resultados de predição da RNAusando LM com regularização bayesiana e normalização com média 0 e desvio padrão 1.

Page 96: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

4.4 Predição através de RNAs 75

4.4.2.3 Algoritmo Levemberg Marquardt com Regularização bayesiana e redução por PCA

No caso da aplicação do método para redução da dimensionalidade das entradas, como des-crito no capítulo 2, foi selecionado um conjunto de componentes principais que explicasse99%da variância. Dessa forma foram selecionados14 componentes, gerando consequentemente14

variáveis de entrada para o treinamento da RNA.

Os histogramas dos erros percentuais e os erros percentuais médios obtidos para os padrõesde validação, para cada uma das propriedades mecânicas, através da RNA treinada utilizandoo algoritmo de otimização proposto porLevemberg Marquardt, com regularização bayesiana(funçãotrainbr do MATLAB), redução da dimensionalidade das entradas pela técnica de PCAe normalização dos padrões com média 0 e desvio padrão 1, são apresentados na Figura 4.16.A Figura 4.17 apresenta os resultados da análise de correlação.

−20 −10 0 10 200

100

200

300LE: EPM = 3.07 %

Erro percentual

No.

Am

ostr

as

−10 −5 0 5 100

100

200

300

400LR: EPM = 1.77 %

Erro percentual

No.

Am

ostr

as

−40 −20 0 20 400

100

200

300

400LE: EPM = 5.22 %

Erro percentual

No.

Am

ostr

as

Figura 4.16: Histogramas dos Erros percentuais e Erros percentuais médios (EPM) da RNA usando LMcom regularização bayesiana, redução por PCA e normalização com média zero e desviopadrão 1.

4.4.2.4 Técnica de pruning

Para a aplicação da técnica depruning(Hassibi et al., 1993) foi utilizado otoolbox NNSYDdesenvolvido por Norgaard (1997). Neste caso, foram treinadas RNAs com 20 a 45 neurôniosna camada intermediária, uma vez que o modelo deveria ser primeiramente sobreparametrizado

Page 97: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

4.4 Predição através de RNAs 76

200 300 400 500 600200

300

400

500

600LE [MPa]: R = 0.93

Real

RN

A

300 400 500 600 700300

400

500

600

700LR [MPa]: R = 0.96

Real

RN

A10 20 30 40 50

10

20

30

40

50ALO[%]: R = 0.81

Real

RN

A

Figura 4.17: Análise de correlação (R:Coeficiente de correlação) dos resultados de predição da RNAusando LM com regularização bayesiana, redução por PCA e normalização com média 0 edesvio padrão 1.

e durante o treinamento a estrutura teria a complexidade reduzida.

O algoritmo utilizado para a implementação da técnica depruning foi o algoritmoOBS -Optimal brain surgeon(Hassibi et al., 1993), detalhado no capítulo 2.

Os histogramas dos erros percentuais e os erros percentuais médios obtidos para os padrõesde validação, para cada uma das propriedades mecânicas, através da RNA treinada utilizando atécnica depruningcom a normalização dos padrões entre -1 e +1 são apresentados na Figura4.18. A Figura 4.19 apresenta os resultados da análise de correlação.

4.4.2.5 Técnica de Ensemble model

Neste projeto, como descrito no capítulo 2, foi criado umensemblecom o mesmo númerode RNAs do tipo MLP usado por Yang e Linkens (2001). Foram treinadas várias RNAs comdiferentes arquiteturas, usando diferentes algoritmos de treinamento, variando-se também ométodo de normalização dos dados. Após o treinamento foram selecionadas as dez melhoresRNAs pelo critério do erro médio quadrático para os padrões de validação. Para o cálculo dasaída doensemblefoi adotada a média simples das saídas das RNAs componentes.

Page 98: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

4.4 Predição através de RNAs 77

−20 −10 0 10 200

100

200

300LE: EPM = 2.89 %

Erro percentual

No.

Am

ostr

as

−20 −10 0 100

100

200

300LR: EPM = 1.68 %

Erro percentual

No.

Am

ostr

as−40 −20 0 20 400

100

200

300

400LE: EPM = 5.37 %

Erro percentual

No.

Am

ostr

as

Figura 4.18: Histogramas dos Erros percentuais e Erros percentuais médios (EPM) da RNA usando téc-nica depruninge normalização entre -1 e +1.

200 300 400 500 600200

300

400

500

600LE [MPa]: R = 0.93

Real

RN

A

300 400 500 600 700300

400

500

600

700LR [MPa]: R = 0.97

Real

RN

A

10 20 30 40 5010

20

30

40

50ALO[%]: R = 0.80

Real

RN

A

Figura 4.19: Análise de correlação (R:Coeficiente de correlação) dos resultados de predição da RNAusando técnica depruninge normalização entre -1 e +1.

Page 99: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

4.4 Predição através de RNAs 78

Verifica-se, pelos resultados obtidos, que para o Limite de escoamento e o Limite de re-sistência, apesar doensembleapresentar resultados superiores, não houve grande diferença emrelação aos resultados das melhores RNAs individuais, mas para o Alongamento houve melhorasignificativa no erro de validação.

Os histogramas dos erros percentuais e os erros percentuais médios obtidos para os padrõesde validação, para cada uma das propriedades mecânicas, através doEnsemble modelsão apre-sentados na Figura 4.20. A Figura 4.21 apresenta os resultados da análise de correlação.

−20 −10 0 10 200

100

200

300LE: EPM = 2.63 %

Erro percentual

No.

Am

ostr

as

−10 −5 0 5 100

100

200

300

400LR: EPM = 1.51 %

Erro percentual

No.

Am

ostr

as

−40 −20 0 20 400

100

200

300

400LE: EPM = 4.77 %

Erro percentual

No.

Am

ostr

as

Figura 4.20: Histogramas dos Erros percentuais e Erros percentuais médios (EPM) usandoEnsemblemodel.

4.4.2.6 Resumo dos resultados das RNAs

A Tabela 4.4 apresenta um resumo dos resultados obtidos nas implementações das diver-sas RNAs citadas na seção 4.4.2. Verifica-se que os melhores resultados foram obtidos com aaplicação da técnica deEnsemble modellinge que no caso desta abordagem o tipo de normali-zação empregado e o número de neurônios da camada intermediária ficam sem significado, umavez que se usa um conjunto das melhores RNAs obtidas, independentemente do algoritmo, dastécnicas usadas para maximização da capacidade de generalização e da arquitetura final.

Com relação à normalização dos dados, verifica-se pela Tabela 4.4, comparando as linhas2 e 3 e em seguida as linhas4 e 5, que as duas abordagens implementadas (±1 e média0

Page 100: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

4.4 Predição através de RNAs 79

200 300 400 500 600200

300

400

500

600LE [MPa]: R = 0.94

Real

"Ens

embl

e" R

NA

300 400 500 600 700300

400

500

600

700LR [MPa]: R = 0.97

Real

"Ens

embl

e" R

NA

10 20 30 40 5010

20

30

40

50ALO[%]: R = 0.84

Real

"Ens

embl

e" R

NA

Figura 4.21: Análise de correlação (R:Coeficiente de correlação) dos resultados de predição usandoEn-semble model.

com desvio padrão1) apresentaram resultados muito semelhantes, com ligeira vantagem para anormalização dos dados na faixa de±1.

Tabela 4.4: Resumo dos resultados de Erro médio quadrático (MSE) das RNAs na predição das pro-priedades mecânicas.

Algoritmo Normalização Neurônios RNA:MSE LE:MSE LR:MSE ALO:MSE

LM-Parada val. +1 e−1 36 98.72 185.42 106.71 4.02LM-Parada val. média 0 std 1 40 101.10 193.30 105.95 4.05

LM-Regulariz. +1 e−1 41 97.02 184.43 102.55 4.08LM-Regulariz. média 0 std 1 40 100.55 193.70 103.90 4.05

LM-PCA e Reg. média 0 std 1 29 110.83 207.22 121.17 4.10OBS-Pruning +1 e−1 41∗1 102.03 194.90 106.96 4.22

Ensemble - - 85.21 162.87 89.26 3.49

∗1 O treinamento foi iniciado com 41 neurônios.

A Tabela 4.5 apresenta os resultados obtidos através da análise de correlação (R é o coe-

Page 101: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

4.4 Predição através de RNAs 80

ficiente de correlação) entre os valores reais das propriedades mecânicas e os calculados pelasdiversas implementações.

Tabela 4.5: Resumo dos resultados da análise de correlação (R:Coeficiente de correlação) das RNAs parapredição de propriedades mecânicas.

Algoritmo Normalização Neurônios R:LE R:LR R:ALO

LM-Parada val. +1 e−1 36 0,94 0,97 0,81LM-Parada val. média 0 std 1 40 0,93 0,97 0,81

LM-Regulariz. +1 e−1 41 0,94 0,97 0,81LM-Regulariz. média 0 std 1 40 0,93 0,97 0,81

LM-PCA e Reg. média 0 std 1 29 0,93 0,96 0,81OBS-Pruning +1 e−1 41∗2 0,93 0,97 0,80

Ensemble - - 0,94 0,97 0,84

∗2 O treinamento foi iniciado com 41 neurônios.

Observa-se na Tabela 4.5 que, de maneira geral, as RNAs apresentaram melhor desempenhona predição do Limite de Resistência (LR) quando comparado com o desempenho na prediçãodo Limite de Escoamento (LE). Estes resultados são compatíveis com os resultados obtidospor Yang e Linkens (2001), que explicam o desempenho inferior na modelagem do LE quandocomparado com o LR em função da dificuldade de medição precisa desta propriedade durante oensaio de tração. Essa tendência é verificada na maioria dos modelos derivados de dados reais.

Resultados decrescentes de desempenho das RNAs na predição do LR, seguido pelo LE epelo ALO também foram obtidos por Jones et al. (2005).

4.4.3 Análise de sensibilidade

Quando um modelo linear é desenvolvido obtêm-se diretamente quais entradas o modeloconsidera como mais importantes, bastando uma simples inspeção nos coeficientes associadosa cada uma das entradas individualmente.

Num modelo neural por sua vez, a interpretação dos pesos da RNA (os quais poderiam servistos como os parâmetros de um modelo linear) torna a análise da sensibilidade do modelobem mais complexa.

Um método empírico para determinação da sensibilidade das saídas da RNA em relação àcada entrada é apresentado em Tenner et al. (2001). Este método usa o conjunto de dados de

Page 102: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

4.5 Predição através de sistemas híbridosneuro-fuzzy 81

treinamento para determinar o efeito na saída da RNA à variação de cada variável de entradade um pequeno valor, por exemplo−1% ou +1% do range da variável, em todos os padrões.Segundo Tenner et al. (2001), apesar de o conjunto de dados de treinamento ser mais usado naanálise de sensibilidade, podem ser usados o conjunto de validação ou de teste e até mesmouma combinação dos conjuntos de treinamento, validação e teste.

Neste trabalho foi implementado o método de análise de sensibilidade descrito por Tenneret al. (2001) usando todo o conjunto de padrões.

O resultado da variação média de cada variável de saída em relação à variação de cadavariável de entrada em1% é apresentado na Figura 4.22

0 5 10 15 200

0.05

0.1

0.15

0.2Variação média de LE

Entradas

[%]

0 5 10 15 200

0.1

0.2

0.3

0.4Variação média de LR

Entradas

[%]

0 5 10 15 200

0.1

0.2

0.3

0.4Variação média de ALO

Entradas

[%]

Figura 4.22: Sensibilidade relativa das saídas da RNA às entradas.

Para melhor observação do efeito de cada variável de entrada nas saídas da RNA os valoresde sensibilidade relativa de cada variável estão apresentados em valores absolutos.

4.5 Predição através de sistemas híbridosneuro-fuzzy

As RNAs desenvolvidas neste trabalho e seus respectivos resultados foram apresentadosna seção 4.4. Similarmente, nesta seção, serão apresentados os sistemas híbridosneuro-fuzzydesenvolvidos, bem como os resultados obtidos.

Page 103: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

4.5 Predição através de sistemas híbridosneuro-fuzzy 82

A aplicação de sistemas nebulosos (fuzzy) para a predição de propriedades mecânicas deaços HSLA tem sido objeto de pesquisas, como demonstra o trabalho recente de Datta e Baner-jee (2005).

Já os trabalhos de Chen e Linkens (1999), Femminela et al. (1999) e Abbod et al. (2003)apresentam a aplicação de sistemas híbridosneuro-fuzzy, combinando as técnicas de sistemasnebulosos com redes neurais artificiais, na pesquisa de propriedades mecânicas de materiais.

4.5.1 SistemasNeuro-fuzzy desenvolvidos

Os sistemas híbridosneuro-fuzzydesenvolvidos neste trabalho foram implementados uti-lizando oToolbox fuzzydo MATLAB. NesteToolboxhá basicamente duas formas de se gerarum sistema híbridoneuro-fuzzypara ser treinado com a funçãoanfis. São elas:

• usando a funçãogenfis1 - gera um sistema híbridoneuro-fuzzyusando particionamentodo tipogrid nos dados. O sistema gerado é do tipoSugeno;

• usando a funçãogenfis2 - gera um sistema híbridoneuro-fuzzyusandosubtractive clus-teringnos dados. O sistema gerado também é do tipoSugeno.

Um dos inconvenientes do uso da funçãogenfis2é a necessidade da definição do raio de in-fluência de cadacluster. Neste trabalho, foi usado o método de tentativa e erro para se encontraro melhor raio na geração dos sistemas híbridosneuro-fuzzy.

Como no problema de predição das propriedades mecânicas tem-se um conjunto inicial de20 variáveis de entrada, optou-se por utilizar a funçãogenfis2para criação do sistema híbridoneuro-fuzzy, a fim de ser realizado o agrupamento dos dados de entrada e saída. O agrupamentodos dados reduz o número de regras do sistema. Apesar de a funçãogenfis2gerar sistemasneuro-fuzzycom mais de uma saída, a função de treinamentoanfis, também doToolbox fuzzydo MATLAB, somente realiza o treinamento para sistemasneuro-fuzzycom apenas uma saída.

Dessa forma, para a implementação dos sistemas, foram gerados3 sistemasneuro-fuzzycada um com apenas1 saída.

Durante a geração e o treinamento dos sistemas híbridosneuro-fuzzyforam testadas4 abor-dagens diferentes:

• foram gerados sistemas híbridosneuro-fuzzycom todas as 20 variáveis de entrada;

Page 104: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

4.5 Predição através de sistemas híbridosneuro-fuzzy 83

• foram gerados sistemas híbridosneuro-fuzzyaplicando-se o métodobackward selectionpara seleção das variáveis de entrada;

• foram gerados sistemas híbridosneuro-fuzzyaplicando-se o método deforward selectionpara seleção das variáveis de entrada;

• foram gerados sistemas híbridosneuro-fuzzyaplicando-se uma combinação das variáveisque apresentaram maior sensibilidade na implementação das RNAs e em seguida aplicadoo método deforward selectionpara seleção das demais variáveis de entrada.

4.5.1.1 Sistemas Neuro-fuzzy usando todas as entradas

Os histogramas dos erros percentuais e os erros percentuais médios obtidos para os padrõesde validação, para cada uma das propriedades mecânicas, através dos sistemasneuro-fuzzyge-rados a partir de todas as20 variáveis de entrada são apresentados na Figura 4.23. A Figura4.24 apresenta os resultados da análise de correlação.

−20 −10 0 10 200

100

200

300LE: EPM = 3.06 %

Erro percentual

No.

Am

ostr

as

−20 −10 0 100

100

200

300

400LR: EPM = 1.64 %

Erro percentual

No.

Am

ostr

as

−40 −20 0 20 400

100

200

300

400LE: EPM = 5.27 %

Erro percentual

No.

Am

ostr

as

Figura 4.23: Histogramas dos Erros percentuais e Erros percentuais médios (EPM) dos sistemasneuro-fuzzyusando todas as entradas .

4.5.1.2 Sistemas Neuro-fuzzy usando o método backward selection

Os histogramas dos erros percentuais e os erros percentuais médios obtidos para os padrõesde validação, para cada uma das propriedades mecânicas, através dos sistemasneuro-fuzzycom

Page 105: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

4.5 Predição através de sistemas híbridosneuro-fuzzy 84

200 300 400 500 600200

300

400

500

600LE [MPa]: R = 0.93

Real

NF

300 400 500 600 700300

400

500

600

700LR [MPa]: R = 0.97

Real

NF

10 20 30 40 5010

20

30

40

50ALO [%]: R = 0.80

Real

NF

Figura 4.24: Análise de correlação (R:Coeficiente de correlação) dos resultados de predição dos sistemasneuro-fuzzyusando todas as entradas.

um conjunto de variáveis de entrada gerado a partir da aplicação do métodobackward selectionsão apresentados na Figura 4.25. A Figura 4.26 apresenta os resultados da análise de correlação.

A Tabela 4.6 apresenta o número de entradas de cada sistemaneuro-fuzzycujo conjunto devariáveis de entrada foi gerado pelo métodobackward selection.

Tabela 4.6: Número de entradas de cada sistemaneuro-fuzzygerado pelo métodobackward selection.

Neuro-fuzzy No. Entradas

LE 17LR 18ALO 18

4.5.1.3 Sistemas Neuro-fuzzy usando o método forward selection

Os histogramas dos erros percentuais e os erros percentuais médios obtidos para os padrõesde validação, para cada uma das propriedades mecânicas, através dos sistemasneuro-fuzzycomum conjunto de variáveis de entrada gerado a partir da aplicação do métodoforward selection

Page 106: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

4.5 Predição através de sistemas híbridosneuro-fuzzy 85

−20 −10 0 10 200

100

200

300LE: EPM = 2.97 %

Erro percentual

No.

Am

ostr

as

−10 −5 0 5 100

100

200

300

400LR: EPM = 1.62 %

Erro percentual

No.

Am

ostr

as−40 −20 0 20 400

100

200

300

400LE: EPM = 5.27 %

Erro percentual

No.

Am

ostr

as

Figura 4.25: Histogramas dos Erros percentuais e Erros percentuais médios (EPM) dos sistemasneuro-fuzzyusandobackward selection.

200 300 400 500 600200

300

400

500

600LE [MPa]: R = 0.93

Real

NF

300 400 500 600 700300

400

500

600

700LR [MPa]: R = 0.97

Real

NF

10 20 30 40 5010

20

30

40

50ALO [%]: R = 0.80

Real

NF

Figura 4.26: Análise de correlação (R:Coeficiente de correlação) dos resultados de predição dos sistemasneuro-fuzzyusandobackward selection.

Page 107: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

4.5 Predição através de sistemas híbridosneuro-fuzzy 86

são apresentados na Figura 4.27. A Figura 4.28 apresenta os resultados da análise de correlação.

−20 −10 0 10 200

100

200

300

400LE: EPM = 2.79 %

Erro percentual

No.

Am

ostr

as

−10 −5 0 5 100

100

200

300

400LR: EPM = 1.53 %

Erro percentual

No.

Am

ostr

as

−40 −20 0 20 400

100

200

300

400LE: EPM = 5.30 %

Erro percentual

No.

Am

ostr

as

Figura 4.27: Histogramas dos Erros percentuais e Erros percentuais médios (EPM) dos sistemasneuro-fuzzyusandoforward selection.

A Tabela 4.7 apresenta o número de entradas de cada sistemaneuro-fuzzycujo conjunto devariáveis de entrada foi gerado pelo métodoforward selection.

Tabela 4.7: Número de entradas de cada sistemaneuro-fuzzygerado pelo métodoforward selection.

Neuro-fuzzy No. Entradas

LE 11LR 11ALO 9

4.5.1.4 Sistemas Neuro-fuzzy usando o método combinado de análise de sensibilidade e for-ward selection

Os histogramas dos erros percentuais e os erros percentuais médios obtidos para os padrõesde validação, para cada uma das propriedades mecânicas, através dos sistemasneuro-fuzzyusando um conjunto de variáveis de entrada gerado a partir da aplicação do método combi-

Page 108: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

4.5 Predição através de sistemas híbridosneuro-fuzzy 87

200 300 400 500 600200

300

400

500

600LE [MPa]: R = 0.94

Real

NF

300 400 500 600 700300

400

500

600

700LR [MPa]: R = 0.97

Real

NF

10 20 30 40 5010

20

30

40

50ALO [%]: R = 0.80

Real

NF

Figura 4.28: Análise de correlação (R:Coeficiente de correlação) dos resultados de predição dos sistemasneuro-fuzzyusandoforward selection.

nado de análise de sensibilidade eforward selectionsão apresentados na Figura 4.29. A Figura4.30 apresenta os resultados da análise de correlação.

A Tabela 4.8 apresenta o número de entradas de cada sistemaneuro-fuzzycujo conjunto devariáveis de entrada foi gerado pelo método combinado de Análise de sensibilidade eforwardselection.

Tabela 4.8: Número de entradas de cada sistemaneuro-fuzzygerado pelo método combinado de Análisede sensibilidade eforward selection.

Neuro-fuzzy No. Entradas

LE 14LR 14ALO 12

Page 109: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

4.5 Predição através de sistemas híbridosneuro-fuzzy 88

−20 0 20 400

100

200

300

400LE: EPM = 2.75 %

Erro percentual

No.

Am

ostr

as

−10 −5 0 5 100

100

200

300LR: EPM = 1.63 %

Erro percentual

No.

Am

ostr

as−40 −20 0 20 400

100

200

300LE: EPM = 5.26 %

Erro percentual

No.

Am

ostr

as

Figura 4.29: Histogramas dos Erros percentuais e Erros percentuais médios (EPM) dos sistemasneuro-fuzzyusando o método combinado de Análise de sensibilidade eforward selection.

200 300 400 500 600200

300

400

500

600LE [MPa]: R = 0.93

Real

NF

300 400 500 600 700300

400

500

600

700LR [MPa]: R = 0.97

Real

NF

10 20 30 40 5010

20

30

40

50ALO [%]: R = 0.80

Real

NF

Figura 4.30: Análise de correlação (R:Coeficiente de correlação) dos resultados de predição dos sistemasneuro-fuzzyusando o método combinado de Análise de sensibilidade eforward selection.

Page 110: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

4.5 Predição através de sistemas híbridosneuro-fuzzy 89

Tabela 4.9: Resumo dos resultados, Erro médio quadrático (MSE) e análise de correlação (R:Coeficientede correlação), obtidos nas implementações de sistemasneuro-fuzzypara predição de pro-priedades mecânicas.

Neuro-fuzzy Método No. Entradas MSE R

LE − 20 213.22 0.93LE forward 11 187.07 0.94LE backward 17 202.26 0.93LE combinado 14 198.38 0.93

LR − 20 104.93 0.97LR forward 11 90.54 0.97LR backward 18 101.49 0.97LR combinado 14 97.46 0.97

ALO − 20 4.16 0.80ALO forward 9 4.28 0.80ALO backward 18 4.14 0.80ALO combinado 12 4.16 0.80

4.5.1.5 Resumo dos resultados dos sistemas Neuro-fuzzy

A Tabela 4.9 apresenta um resumo dos resultados obtidos nas implementações dos diversossistemasneuro-fuzzydescritos na seção 4.5.1. Verifica-se pela tabela que, para o problemaem questão, os sistemasneuro-fuzzygerados através da aplicação do métodoforward selectionapresentaram melhor desempenho na predição do LE e LR, e apenas para a predição do ALOo melhor desempenho foi do sistema gerado quando aplicado o métodobackward selection.Observa-se em ambos os casos que os sistemas gerados são mais simples que o sistema queutiliza todas as variáveis de entrada.

Verifica-se também que o método combinado, usando as variáveis de entrada identificadascomo de alta sensibilidade para as saídas e em seguida aplicando o métodoforward selectionapresentou resultados ligeiramente melhores que o métodobackward selection.

A aplicação do métodoforward selectionpara seleção das variáveis de entrada mais im-portantes é geralmente preferido em detrimento do métodobackward selection. Isto ocorre,segundo Chiu (1996), porque o métodoforward selectionparte de modelos mais simples au-mentando a complexidade somente quando necessário.

Page 111: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

4.5 Predição através de sistemas híbridosneuro-fuzzy 90

Tabela 4.10: Resumo dos melhores resultados, Erro médio quadrático (MSE) e análise de correlação(R:Coeficiente de correlação), obtidos na predição de propriedades mecânicas usando Re-gressão linear múltipla, RNAs (única eensemble) e sistemas híbridosneuro-fuzzy.

Técnica Método/Algoritmo Propriedade MSE R

Reg. Lin. Múltipla - LE 298,55 0,89RNA LM reg. bayesiana LE 184,43 0,94RNA Ensemble LE 162,87 0,94

Neuro-fuzzy forward LE 187,07 0,94

Reg. Lin. Múltipla - LR 168,84 0,95RNA LM reg. bayesiana LR 102,55 0,97RNA Ensemble LR 89,26 0,97

Neuro-fuzzy forward LR 90,54 0,97

Reg. Lin. Múltipla - ALO 5,34 0,74RNA LM reg. bayesiana ALO 4,08 0,81RNA Ensemble ALO 3,49 0,84

Neuro-fuzzy backward ALO 4,14 0,80

4.5.2 Conclusão

A Tabela 4.10 apresenta um resumo dos melhores resultados obtidos na predição das pro-priedades mecânicas dos aços HSLA, laminados a frio e revestidos, através de regressão linearmúltipla, RNAs (única eensemble) e sistemas híbridosneuro-fuzzy.

Verifica-se pela Tabela 4.10 que as técnicas de inteligência computacional, RNAs e sis-temas híbridosneuro-fuzzy, apresentam desempenhos muito superiores quando comparados aosobtidos através da regressão linear múltipla. Esse resultado corrobora os resultados obtidos porJones et al. (2005). Entre as técnicas de IC, observa-se que para as propriedades LE e LR odesempenho das duas técnicas são similares, com ligeira vantagem para as RNAs. No caso doALO, o desempenho das RNAs é bem superior ao do sistema híbridoneuro-fuzzy, com destaquepara o métodoensemble modelling.

Finalmente, faz-se necessário comentar o desempenho das RNAs usando o métodoensem-ble modelling. Esta abordagem destaca-se pela apresentação dos melhores resultados para astrês propriedades mecânicas pesquisadas.

Page 112: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

Capítulo 5

Ferramenta Off-line para Predição dePropriedades Mecânicas e Parâmetros deProcesso

5.1 Introdução

Como mencionado no capítulo 1, um dos objetivos deste trabalho é desenvolver em ambi-enteWindowsuma ferramenta de apoio à decisão para: predição de propriedades mecânicas eauxílio no projeto de aços em ambiente industrial e; predição de parâmetros de processo paraintegração das linhas de produção CAPL e CGL.

Essa ferramenta permitiria através de uma interface gráfica:

• realizar a predição das propriedades mecânicas de aços HSLA dados a composição químicae os parâmetros de processo;

• definir os parâmetros de processo, de forma a permitir que um material inicialmente pre-visto para ser processado no CAPL, seja processado na CGL.

5.2 Benefícios esperados

Como benefícios da utilização da ferramenta de apoio à decisão destacam-se:

Page 113: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

5.3 RNA para predição de parâmetros de processo 92

1. desenvolvimento de novas ligas e condições de processo - O principal impacto deste bene-fício será na agilização de respostas às consultas de produtos não padronizados, bemcomo no melhor acerto inicial, ou seja, menor índice de ajustes nos projetos metalúrgicose atendimento ao cliente no prazo estabelecido;

2. otimização dos projetos metalúrgicos existentes - Através da realização de simulaçõesque não envolverão os custos de experiências conduzidas em escala industrial, espera-seobter maior robustez dos projetos, com possíveis ganhos em redução de custos e tambémdiminuição de recusas por propriedades mecânicas, além da possibilidade de redução davariabilidade dentro de cada grau comercializado;

3. suporte para definição de ações defeed forward- A partir do conhecimento da com-posição química real, a ferramenta será útil para auxiliar na definição de novos parâme-tros de processamento subsequentes, visando assegurar menor nível de recusa e reduçãona variabilidade dos produtos;

4. auxílio ao julgamento e decisão sobre corridas fora de faixa - A partir da predição daspropriedades mecânicas a serem alcançadas com a composição química real, o modeloneural fornecerá subsídios ao analista para definir se o material em questão deve ou nãoseguir o fluxo de produção em função do risco potencial de recusa como produto acabado;

5. aumento da flexibilidade operacional através da integração das linhas de produção CAPLe CGL - Atualmente, os produtos produzidos nestes dois processos da USIMINAS têm acomposição química e parâmetros de processo específicos. A integração das duas plantaspermitiria o processamento na CGL, de um material inicialmente previsto para o CAPL.

5.3 RNA para predição de parâmetros de processo

A RNA para predição de parâmetros de processo para integração do CAPL e CGL teriacomo dados de entrada, a composição química dos produtos a serem produzidos no CAPLe as propriedades mecânicas desejadas para os mesmos na CGL, e como dados de saída osparâmetros para os processos no fluxo de produção destes produtos, quais sejam:

• a temperatura de acabamento (TACA) e a temperatura de bobinamento (TBOB) da lami-nação a quente;

• as temperaturas dos fornos de encharque (TSF) e aquecimento (TRTF) da CGL;

• o alongamento visado no encruamento (ALSPM).

Page 114: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

5.3 RNA para predição de parâmetros de processo 93

A Figura 5.1 apresenta o fluxo de produção completo identificando os processos onde foramcoletados dados a serem usados no modelo.

Figura 5.1: Fluxo de produção completo com identificação dos processos onde foram coletados dadospara o modelo de predição de parâmetros de processo. Entradas: elipses cheias. Saídas:elipses tracejadas.

Em função dos resultados obtidos na seção 4.4, optou-se pela utilização do algoritmo detreinamentoback-propagationusando a minimização do MSE baseada no método deLevem-berg Marquardtcom regularização bayesiana e normalização das variáveis entre -1 e +1.

Inicialmente foi desenvolvida uma única RNA para a predição das cinco saídas necessárias,mas o resultado não se mostrou satisfatório. Na tentativa de melhorar o desempenho da RNAusou-se a técnica deensemble modellingcom impacto positivo no desempenho da RNA. Final-mente, foi realizado o desenvolvimento de cinco RNAs, uma para cada variável de saída, cujodesempenho se apresentou superior aos obtidos nas duas abordagens anteriores. A Tabela 5.1apresenta a evolução do desempenho das RNAs para a predição dos parâmetros de processopara integração das linhas de produção CAPL e CGL.

Page 115: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

5.4 A ferramenta 94

O critério de desempenho apresentado na Tabela 5.1, erro percentual médio (EPM), tam-bém foi calculado como em Jang (1993) e apresentado no capítulo 4.

Tabela 5.1: Resumo dos resultados do Erro percentual médio (EPM) das RNAs para predição de parâ-metros de processo para integração das linhas de produção CAPL e CGL.

RNA EPM: TBOB EPM: TACA EPM: TSF EPM: TRTF EPM: ALSPM

Única 2,57 0,95 0,73 0,79 5,17Ensemble 2,13 0,93 0,71 0,77 4,13Separadas 2,06 0,78 0,50 0,50 3,95

5.4 A ferramenta

A ferramentaoff-linede apoio à decisão para predição de propriedades mecânicas e auxíliono projeto de aços para ambienteWindowsfoi implementada emMicrosoft Visual Basic 6.0, apartir do modelo neural desenvolvido emMATLAB 7.0.0 (R14).

A ferramenta consitui-se de 2 partes. Na primeira, está implementada uma RNA parapredição das três propriedades mecânicas; LE, LR e ALO; para aços HSLA laminados a frio erevestidos por imersão a quente. A segunda parte consiste de 5 RNAs para a predição de cadaum dos 5 parâmetros de processo para a integração das linhas de produção CAPL e CGL.

Utilizando-se da interface gráfica disponibilizada, o usuário, para a predição das propriedadesmecânicas, entra com os dados do produto, quais sejam; composição química, dados de pro-cesso da laminação a quente, dados de processo da laminação a frio e dados de processo dalinha de galvanização por imersão a quente; para a obtenção dos valores correspondentes daspropriedades mecânicas, limite de escoamento, limite de resistência e alongamento.

As Figuras 5.2 e 5.3 apresentam respectivamente as interfaces gráficas da ferramenta depredição de propriedades mecânicas e de predição de parâmetros de processo.

Para o cálculo dos parâmetros de processo, o usuário entra com os dados de composiçãoquímica e das propriedades mecânicas desejadas, para a obtenção das temperaturas de acaba-mento e bobinamento da laminação a quente, a temperatura dos dois dos fornos da CGL e oalongamento visado no encruamento.

A ferramentaoff-linede apoio à decisão para predição de propriedades mecânicas e auxíliono projeto de aços encontra-se em utilização desde agosto/2006 na USIMINAS para realização

Page 116: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

5.4 A ferramenta 95

de testes reais em ambiente industrial. Segundo os especialistas em metalurgia, responsáveispela avaliação da mesma, em testes preliminares as RNAs têm apresentado resultados bons ecoerentes com os fenômenos metalúrgicos.

No caso específico das RNAs para predição dos parâmetros de processo para a integraçãodas plantas CAPL e CGL, a Tabela 5.2 apresenta os bons resultados obtidos em dois experi-mentos de materiais com a composição química do CAPL, porém processados na CGL.

Tabela 5.2: Resultados de propriedades mecânicas obtidas em experimentos realizados com parâmetrosde processo fornecidos pelas RNAs projetadas para a integração das plantas CAPL e CGL.

Experimento Propriedade Valor visado Valor obtido

I LE 400 a406 402 a420I LR 463 a467 463 a467I ALO 30 26 a28

II ∗1 LE 417 a421 444 a445II ∗1 LR 477 a478 513 a514II ∗1 ALO 28 23 a26

∗1 No experimento II, uma temperatura de processo fornecida pelas RNAs deveria ser 745◦C ea realizada ficou entre 704 e 722◦C, o que impactou negativamente no resultado deste experi-mento.

Page 117: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

5.4 A ferramenta 96

Figura 5.2: Interface gráfica da ferramenta de predição de propriedades mecânicas para aços HSLA,laminados a frio e revestidos por imersão a quente.

Page 118: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

5.4 A ferramenta 97

Figura 5.3: Interface gráfica da ferramenta de predição de parâmetros de processo para integração daslinhas de produção CAPL e CGL.

Page 119: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

Capítulo 6

Considerações Finais

Este trabalho apresentou uma aplicação prática de técnicas de inteligência computacionalpara a predição de propriedades mecânicas de aços HSLA, laminados a frio e revestidos porimersão a quente, em ambiente industrial.

Na primeira parte do trabalho foi realizada uma breve revisão bibliográfica das técnicasde inteligência computacional, LógicaFuzzy, Redes Neurais Artificiais e Sistemas HíbridosNeuro-fuzzy.

Na sequência foi realizada a descrição de todo o processo de produção de tiras de açolaminadas a frio e revestidas, numa usina siderúrgica integrada, destacando-se as principaisetapas do processo: preparação do minério e do carvão; redução do minério de ferro; refino econformação mecânica. Foram também apresentadas e conceituadas as propriedades mecânicasdos aços e a forma de obtenção das mesmas em laboratório de ensaios mecânicos.

No capítulo 4 foram apresentados todos os resultados obtidos com as implementações dastécnicas de inteligência computacional propostas.

No capítulo 5 foi apresentada a ferramenta de apoio à decisão, implementada em ambienteWindows, para predição de propriedades mecânicas e auxílio no projeto de aços.

A seguir, são listadas as principais conclusões do trabaho.

Page 120: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

6.1 Conclusões 99

6.1 Conclusões

Na investigação das técnicas de IC verificou-se que: para o projeto de RNAs é fundamentala aplicação de estratégias para elevar a capacidade de generalização do modelo e; para o projetode sistemas híbridos neuro-fuzzy, os métodos de seleção das entradas mais importantes reduzema complexidade do modelo com impacto positivo no desempenho do mesmo;

A seleção criteriosa das variáveis de entrada e o pré-processamento dos dados reais coleta-dos dos processos industriais contribuíram efetivamente para o bom desempenho dos modelosobtidos através da aplicação das técnicas de IC;

Dentre as várias estratégias implementadas para elevação da capacidade de generalizaçãodas RNAs, a técnica deensembleapresentou os melhores resultados;

A análise de sensibilidade da RNA permitiu uma avaliação qualitativa do impacto de cadauma das variáveis de entrada nas propriedades mecânicas, fornecendo informações importantespara auxiliar no conhecimento dos processos;

No projeto dos sistemas híbridos neuro-fuzzy o método forward selection, para seleção dasvariáveis de entrada mais importantes para o modelo, se mostrou superior ao método backwardselection;

Numa avaliação dos resultados globais, conclui-se que as duas técnicas de inteligênciacomputacional investigadas e aplicadas - Redes Neurais Artificiais e sistemas híbridosneuro-fuzzy- apresentaram desempenhos similares e os modelos obtidos com ambas as técnicas seapresentam em condições de serem testados em ambientes de produção reais. Essa avaliaçãoassegurou o desenvolvimento e a disponibilização da ferramentaoff-line para predição de pro-priedades mecânicas para os aços da família HSLA, um dos objetivos deste trabalho, para osespecialistas da gerência de metalurgia da USIMINAS.

A ferramenta off-line para auxiliar na avaliação e projeto de aços foi disponibilizada emagosto/06 e até o momento, de acordo com os especialistas, tem fornecido resultados promis-sores e coerentes com os fenômenos metalúrgicos.

6.2 Sugestões para trabalhos futuros

Como propostas de trabalhos futuros destacam-se:

1. testar as redes de funções de base radiais (RBF) para a predição de propriedades mecâni-

Page 121: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

6.2 Sugestões para trabalhos futuros 100

cas, uma vez que é estabelecida uma equivalência funcional entre RBF e ANFIS (Jang,1993);

2. pesquisar técnicas para otimização do número declustersa serem usados na geração dossistemasneuro-fuzzy;

3. estudar a aplicação de técnicas de otimização multi-objetivo e computação evolucionáriapara otimização da composição química e parâmetros de processo;

4. ampliar a abrangência deste trabalho para as demais famílias de aços produzidas pelaUSIMINAS;

5. estabelecer um procedimento de avaliação e atualização (re-treinamento das RNAs) daferramenta de apoio à decisão, de forma a se garantir a precisão das predições caso ocor-ram alterações nos processos, por exemplo uma mudança nas condições de operação deum forno, ou também caso haja alteração nos produtos processados;

6. pesquisar a implementação de uma interface gráfica no MATLAB para uma plataformaintegrada para o desenvolvimento de RNAs a exemplo da interface existente notoolboxFuzzy;

7. integrar a ferramenta de apoio à decisão para predição de propriedades mecânicas eauxílio no projeto de aços ao sistema integrado de controle de produção da USIMINAS,disponibilizando assim, de formaonline, a predição das propriedades mecânicas.

Page 122: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

Referências Bibliográficas

Abbod, M. F., Zhu, Q., Linkens, D. A., M., S. C., e Mahfouf, M. (2003). Construction andvalidation of complex hybrid neuro-fuzzy models for Al-Mg materials properties prediction.Em IFAC Conference on Intelligent Control Systems and Signal Processing - ICONS 2003,pp. 292–297. The University of Algarve, Portugal.

Abraham, A. (2001). Neuro fuzzy systems: Sate-of-the-art modeling techniques.Lecture Notesin Computer Science, 2084:269–276.

Allard, F. e Fuchs, J. (1993). Artificial intelligence - the state of the art.ESA’s TechnologyProgramme Quartely, 3(3).

Andrade, M. T. C. (2003).Computação Fuzzy - PCS5711. Notas de Aula. Depto. de Engenhariade Computação e Sistemas Digitais - EPUSP.

Araújo, J. B. (2003). Economias de escala em duas tecnologias alternativas: Um estudo dosetor automobilístico. Dissertação de Mestrado, Programa de Pós-Graduação em Engenhariade Produção - Universidade Federal de São Carlos.

Araújo, L. A. (1997).Manual de siderurgia, volume 2. Editora Arte e Ciência.

Askeland, D. R. (1994).The Science and Engineering of Materials. Wadsworth PublishingCompany.

Barbosa, A. H. A., Alves, H. A., Araújo, I. L., e Ribeiro, C. F. (2004). Estudo da influência dosparâmetros de recozimento contínuo nas propriedades mecânicas de aços de alta resistênciabaixa liga laminados a frio. Technical report, USIMINAS.

Barbosa, R. A. N. M. e Santos, D. B. (1987).Fundamentos da Laminação - FundamentosMetalúrgicos. Curso. Fundação Christiano Ottoni e Associação Brasileira de Metalurgia eMateriais.

Page 123: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

Referências Bibliográficas 102

Bishop, C. M. (1995).Neural Networks for Pattern Recognition. Oxford University Press.

Braga, A. P., Ludermir, T. B., e Carvalho, A. C. (2000).Redes Neurais: Teoria e Aplicações.LTC - Livros Técnicos e Científicos Editora S.A., Rio de Janeiro, RJ,1a edição.

Cacciopoli, J. M. R. (1987).Fundamentos da Laminação - Fundamentos Mecânicos. Curso.Fundação Christiano Ottoni e Associação Brasileira de Metalurgia e Materiais.

Castro, C. L., Braga, A. P., e Andrade, A. V. (2005). Aplicação de um modeloEnsemblederedes neurais artificiais para previsão de séries temporais não estacionárias. EmAnais doXXV Congresso da Sociedade Brasileira de Computação, pp. 722–731.

Chen, M. e Linkens, D. A. (1999). Hybrid fuzzy modelling using simulated annealing andapplication to materials property prediction. EmProceedings of the Second InternationalConference on Intelligent Processing and Manufacturing of Materials, volume 1, pp. 109–114.

Chiu, S. L. (1996). Selecting input variables for fuzzy models.Journal of Intelligent I& FuzzySystems, 4(4):243–256.

Cybenko, G. (1988). Continuos valued neural networks with two hidden layers are sufficient.Technical report, Department of Computer Science, Tufts University.

Datta, S. e Banerjee, M. K. (2005). Fuzzy modelling of strength-composition-process parameterrelatioships of hsla steels.Materials and Manufacturing Processes, 20:761–776.

Demut, H. e Beale, M. (1997).Neural Network Toolbox User’s Guide 3.0. The Mathworks,Inc.

Dumortier, C., Lehert, P., Krupa, P., e Charlier, A. (1998). Statistical modelling of mechanicalproperties of microalloyed steel by application of artifical neural networks.Materials ScienceForum, 284-286:393–400.

Edgar, T. F. e Himmelblau, D. M. (1988).Optimization of Chemical Processes. Mc Graw HillBook Company, New York, NY,1a edição.

Femminela, O. P., Starink, M. J., Brown, M., Sinclair, I., Harris, C. J., e Reed, P. A. S. (1999).Data pre-processing/model inicialization in neuro-fuzzy modelling of structure-property re-lationships in Al-Zn-Mg-Cu alloys.ISIJ International, 39(10):1027–1037.

Page 124: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

Referências Bibliográficas 103

Foresee, F. D. e Hagan, M. T. (1997). Gauss-newton approximation to bayesian regularization.Em Proceedings of the 1997 International Joint Conference on Neural Netwoks, pp. 1930–1935.

Geman, S., Bienenstock, E., e Doursat, R. (1992). Neural networks and the bias/variancedilema.Neural Computation, 4(1):1–58.

Golodnikov, A., Macheret, Y., Trindade, A. A., Uryasev, S., e Zrazhevsky, G. (2005). Modelingcomposition and processing parameters for the development of steel alloys: A statisticalapproach. Technical report, University of Florida.

Gomide, F. A. C. e Gudwin, R. R. (1994). Modelagem, controle, sistemas e lógica fuzzy.SBAControle I& Automação, 4(3):97–115.

Goodman, S. R. e R., C. A. (1984). Recrystallization behavior and tensile properties of contin-uously annealed high-strength cold-rolled steel sheets containing columbium and titanium.EmAIME 1984 Symposium on Metallurgy of Continuous Annealed Sheet Steel, pp. 229–247.

Gorni, A. A. (1997). The application of neural networks in the modeling of plate mill processes.Journal of the Minerals, Metals & Material Society, 4(49):252–260.

Hassibi, B., Stork, D. G., e Wolff, G. J. (1993). Optimal brain surgeon and general networkpruning. EmProceedings of the 1993 IEEE International Conference on Neural Networks,pp. 293–299.

Hawkins, D. (1980).Identification of Outliers. Chapman and Hall, London.

Hawkins, S., H., H., Williams, G., e Baxter, R. (2002). Outlier detection using replicator neuralnetworks.Neural Networks, pp. 170–180.

Haykin, S. (1999).Neural Networks. A Comprehensive Foundation. Prentice Hall, New Jersey,2a edição.

Hinton, G. E. (1989). Connectionist learning procedures.Artificial Intelligence, 40:185–234.

IBS (2006). Instituto brasileiro de siderurgia.http://www.ibs.org.br/siderurgia_processo_siderúrgico.asp . Acesso em: 01 de dezembro de 2006.

IFT (2005). Unidade técnica da laminação a frio da usiminas. Curso de Siderurgia Básica -Laminação a Frio.

Page 125: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

Referências Bibliográficas 104

Iyoda, E. M. (2000). Inteligência computacional no projeto automático de redes neurais híbridase redes neurofuzzy heterogêneas. Dissertação de Mestrado, Programa de Pós-Graduação daFaculdade de Engenharia Elétrica e de Computação - Universidade Estadual de Campinas.

Jang, R. J. (1992).Neuro-fuzzy Modelling: Architecture, Analyses and Applications. Tese deDoutorado, University of California, Berkeley.

Jang, R. J. (1993). Anfis: Adaptive-network-based fuzzy inference system.IEEE Transactionson Systems, Man, and Cybernetics, 23:665–685.

Jang, R. J., Sun, C., e E., M. (1997).Neuro-fuzzy and Soft Computing. Prentice Hall, NewJersey,1a edição.

Jarrel, M. G. (1992). A comparison of two procedures, the Mahalanobis distance and theAndrews-Pregibon statistic, for identifying multivariate outliers. EmAnnual meeting of themid-south educational research association.

Johnson, R. A. e Wichern, D. W. (1988).Applied Multivariate Statistical Analysis. PrenticeHall, New Jersey,2a edição.

Jones, D. M., Watton, J., e Brown, K. J. (2005). Comparison of hot rolled steel mechanicalproperty prediction models using linear multiple regression, non-linear multiple regressionand non-linear artifical neural networks.Ironmaking and Steelmaking, 32(5):435–442.

LeCun, Y., Denker, J. S., e Solla, S. A. (1990). Optimal brain damage. Em Touretzky, D. S.,editor,Advances in Neural Information Processing Systems II, pp. 598–605, San Mateo, CA.Morgan Kauffman.

Lima, C. A. M. (2004). Comitê de Máquinas:Uma Abordagem Unificada EmpregandoMáquinas de Vetores-Suporte. Tese de Doutorado, Programa de Pós-Graduação da Facul-dade de Engenharia Elétrica e de Computação - Universidade Estadual de Campinas.

Liu, Z., Wang, W. D., e Gao, W. (1996). Prediction of the mechanical properties of hot-rolledC-Mn steels using artificial neural networks.Journal of Materials Processing Technology,57:332–336.

Mackay, D. J. C. (1992). Bayesian interpolation.Neural Computation, 4(3):415–447.

Mahfouf, M., Chen, M., e Linkens, D. A. (2005). Design of heat-treated alloy steels usingintelligent multi-objective optimization.ISIJ International, 45(5):694–699.

Page 126: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

Referências Bibliográficas 105

Mazzatorta, P., Benfenati, E., Neagu, C. D., e Gini, G. (2003). Tuning neural and fuzzy-neuralnetworks for toxicity modeling.Journal of Chemical Information and Computer Sciences,43:513–518.

Moita Neto, J. M. (2004). Estatística multivariada - uma visão didática-metodológica.Revistade Filosofia e Ensino, 1(1):1–1.

Myllykoski, P. (1997). A study on the causes of deviation in mechanical properties of thin steelsheets.Journal of Materials Processing Technology, 79:9–13.

Myllykoski, P., Larkiola, J., e Nylander, J. (1996). Development of prediction model for me-chanical properties of batch annealed thin steel strip by using artificail neural network mod-elling. Journal of Materials Processing Technology, 60:399–404.

Norgaard, M. (1997). Neural network based system identification toolbox. Technical Report97-E-851, Department of Automation, Technical University of Denmark.

Oliveira, J. B. (1994). Redes neuronais artificiais aplicadas ao controle dinâmico da aciarianúmero 2 da usiminas. Dissertação de Mestrado, Programa de Pós-Graduação em EngenhariaElétrica - Universidade Federal de Minas Gerais.

Ono, S., Nozoe, O., Shimomura, T., e Matsudo, K. (1982). Effect of carbon on the mechanicalproperties of continuous annealed drawing-quality steels. EmAIME 1982 Symposium onMetallurgy of Continuous Annealed Sheet Steel, pp. 99–115.

Perrone, M. P. e Cooper, L. N. (1993). When networks disagree: Ensemble methods for hy-brid neural networks. Em Mammone, R. J., editor,Neural Networks for Speech and ImageProcessing, pp. 126–142. Chapman-Hall.

Pradhan, R. (1984). High strength high yield-ratio cold-rolled steels produced by continuousannealing.Skandinavian Journal of Metallurgy, 13:298–307.

PROMINP (2006). Programa de mobilização da indústria nacional de petróleo e gás natu-ral. http://www.prominp.com.br/objects/files/2005-02/457_usiminas_27_

jan2005.pdf . Acesso em: 01 de dezembro de 2006.

Ramos, R. A. (2002). Um sistema para auxílio no sequenciamento de um laminador de tirasa quente em uma usina siderúrgica integrada. Dissertação de Mestrado, Programa de Pós-Graduação em Engenharia de Produção - Pontifícia Universidade Católica do Rio de Janeiro.

Page 127: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

Referências Bibliográficas 106

Rennó, C. D. (1995). Avaliação de medidas texturais na discriminação de classses de usoutilizando imagens SIR-C/X-SAR do perímetro irrigado de bebedouro, petrolina, PE. Dis-sertação de Mestrado, Instituto Nacional de Pesquisas Espaciais - INPE.

Rumelhart, D. E., Hinton, G. E., e Willians, R. J. (1986). Learning representations by back-propagation errors.Nature, 323:533–536.

Seizing, R. (2005). 1965 - fuzzy sets appear - a contribution to the 40th anniversary. EmIEEEInternational Conference of Fuzzy Systems, USA. IEEE.

Sharkey, A. J. C. (1999).Combining Artificial Neural Nets: Ensemble and Modular Multi-netSystems. Springer-Verlag, London.

Silva, L. N. C. (1998). Análise e síntese de estratégias de aprendizado para redes neurais arti-ficiais. Dissertação de Mestrado, Programa de Pós-Graduação da Faculdade de EngenhariaElétrica e de Computação - Universidade Estadual de Campinas.

Silva, M. R. S., Gorni, A. A., Siveira, J. H. D., Branço, V. P, V., Silva, R. A. C., Borges,H. C., Perez, F. A., Colella, R. G., Vallin, P. S. S., e Gomes, H. L. (2004). Novo sistemade resfriamento do laminador de tiras a quente da cosipa: Conceitos e resultados. Em41o

Seminário de Laminação - Processos e Produtos Planos Laminados e Revestidos, pp. 669–677.

Sterjovski, Z., Nolan, D., Carpenter, K. R., Dunne, D. P., e Norrish, J. (2005). Artificial neuralnetworks for modelling the mechanical properties of steels in various applications.Journalof Materials Processing Technology, 170:536–544.

Teixeira, R. A. (2001).Treinamento de Redes Neurais Artificais Através de Otimização Multi-objetivo: Uma Abordagem para o Equilíbrio entre a Polarização e a Variância. Tese deDoutorado, Programa de Pós-Graduação em Engenharia Elétrica - Universidade Federal deMinas Gerais.

Teixeira, R. A. (2005).Redes Neurais Artificiais. Notas de Aula. Centro Universitário do Lestede Minas Gerais, Brasil.

Tenner, J., Linkens, D. A., Morris, P. F., e Bailey, T. J. (2001). Prediciton of mechanical prop-erties in steel heat treatment process using neural networks.Ironmaking and Steelmaking,28(1):15–22.

Warde, J. e Knowles, D. M. (1999). Use of neural network for alloy design.ISIJ International,39(10):1015–1019.

Page 128: PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE … · PREDIÇÃO DE PROPRIEDADES MECÂNICAS DE AÇOS DE ALTA RESISTÊNCIA MICROLIGADOS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA COMPUTACIONAL

Referências Bibliográficas 107

Weigend, A. S., Huberman, B., e Rumelhart, D. E. (1990). Predicting the future: a connectionistapproach.International Journal of Neural Systems, 3:193–209.

Widrow, B. e Hoff, M. E. (1960). Adaptive switching circuits. Em1960 IRE WESCON Con-vention Record, pp. 96–104.

Yang, Y. Y. e Linkens, D. A. (2001). Steel yield strength prediction using ensemble model -performance improvement over single neural network model. EmIPMM 2001 IntelligentProcessing and Manufacturing of Materials, volume 1, pp. 335–346.

Zadeh, L. A. (1965). Fuzzy sets.Information and Control, 8(3):338–353.

Zadeh, L. A. (1988). Fuzzy logic.IEEE Computer, 21(4):83–92.