utilizaÇÃo de redes neurais artificiais e … · kappa em um processo kraft de cozimento de...

1

Programa de Pós-graduação em Engenharia

UTILIZAÇÃO DE REDES NEURAIS ARTIFICIAIS E TECNOLOGIA FT-NIR PARA PREDIÇÃO DO NÚMERO

KAPPA EM UM PROCESSO KRAFT DE COZIMENTO DE MADEIRA EM INDÚSTRIA DE CELULOSE

RONALDO NEVES RIBEIRO

Dissertação apresentada ao Centro Universitário do Leste de Minas Gerais para obtenção do Título de Mestre em Engenharia Industrial.

Coronel Fabriciano 2007

i

RONALDO NEVES RIBEIRO

UTILIZAÇÃO DE REDES NEURAIS ARTIFICIAIS E TECNOLOGIA FT-NIR PARA PREDIÇÃO DO NÚMERO

KAPPA EM UM PROCESSO KRAFT DE COZIMENTO DE MADEIRA EM INDÚSTRIA DE CELULOSE

Dissertação apresentada ao Centro Universitário do Leste de Minas Gerais para obtenção do Título de Mestre em Engenharia Industrial. Área de Concentração: Engenharia Industrial Orientadora: DSc. Andréa Oliveira S. da Costa Co-Orientador: Dr. Roselito Albuquerque Teixeira

Coronel Fabriciano 2007

ii

A história é vivida para frente, porém é escrita em retrospecto. Sabemos o fim antes de considerarmos o início, e jamais podemos recapturar totalmente o que deveríamos saber apenas no começo.

(Cicely Verônica Wedgwood)

iii

Dedico este trabalho a toda minha família e amigos.

iv

AGRADECIMENTOS Agradeço a Deus e a nosso Senhor Jesus Cristo pelas Bênçãos e Amor incondicional

durante toda minha vida.

Agradeço aos Meus Pais, Sr. Élvio Ribeiro Camargo a Sra. Nadir Neves Camargo,

que diante de sua humildade como seres humanos me concederam a vida e

ensinamentos valiosos sobre a mesma.

Agradeço ao meu irmão, José Antônio Ribeiro, pelo apoio, conselhos,

companheirismo, amizade e pela sua busca constante em estar por perto mesmo

diante de minhas limitações de tempo.

Agradeço à minha família e amigos que souberam entender os momentos ausentes

para dedicação às atividades do mestrado.

Agradeço aos meus colegas de trabalho na Cenibra, que cada um em sua forma

pessoal, me transferiram força e apoio nesta jornada, não se limitando em nenhum

momento, a prestar qualquer apoio solicitado.

Agradeço a Professora Êny Paula pelo apoio constante na elaboração deste trabalho.

Agradeço aos colaboradores deste trabalho Luciana e Walaston, pelo apoio técnico,

aquisições dos dados de processo e sugestões preciosas.

Agradeço aos meus alunos de graduação entre os anos de 2005 a 2007, que souberam

entender minhas limitações de disponibilidade de tempo.

Agradeço aos Professores Andréa Costa e Roselito de Albuqueque pelas valiosas

orientações, críticas, paciência e principalmente pela amizade.

Agradeço a todos os Professores do Mestrado que foram a base para realização deste

trabalho.

Agradeço aos Professores e Amigos Rodrigo Cássio e Fabrício Fernandes, pelo

companheirismo, pela amizade e apoio durante a realização deste trabalho.

Agradeço ao amigo Nilton César pela presença quase constante nos finais de semana.

Agradeço ao Júlio Cezar por participar das idéias e colaborar com continuamente

com o trabalho e ao Eng. Luis Gonzaga por dedicar seu tempo quando solicitado.

Agradeço ao Leonardo Figueirêdo, pelo apoio constante e companheirismo.

Agradeço a todos os Colegas do Mestrado que foram companheiros e encararam a

busca deste objetivo.

v

RESUMO O objetivo deste trabalho é propor um modelo matemático para predição do grau de

cozimento (#Kappa) em um digestor contínuo para uma planta de celulose com

processo de produção tipo Kraft, que utiliza como matéria prima eucalipto do tipo

Grandis. Foi explorada a modelagem através de redes neurais artificiais, com a

utilização de variáveis de processo de uma planta real. A tecnologia FT-NIR

(Fourier Transform Near Infrared) foi usada para identificar os cavacos de madeira

que entram no processo de cozimento. Associada a esta tecnologia, foi utilizada uma

técnica de análise multivariada denominada PCA (Principal Components Analysis)

para redução da dimensionalidade dos padrões de entrada do modelo. Foram

utilizadas como entradas do modelo neural, variáveis de processo e as análises

associadas aos espectros de freqüência da absorbância do infravermelho nos cavacos

de madeira. Uma rápida abordagem sobre o processo do tipo Kraft foi necessária

para melhorar o entendimento do problema. Foram realizados testes utilizando

métodos de otimização paramétrica não-linear para o treinamento do modelo neural.

Os resultados mostraram uma boa adequação na utilização destas técnicas para

predição de variáveis no ramo industrial, especialmente o grau de cozimento em um

digestor contínuo. O modelo desenvolvido é capaz de predizer a variável #Kappa,

possibilitando ações operacionais mais proativas e conseqüente redução da

variabilidade desta. Apesar da complexidade do processo de cozimento, das

inúmeras variáveis que interferem no grau de cozimento e o comportamento não

linear dos digestores, a modelagem baseada em redes neurais ofereceu coeficientes

de correlação satisfatórios entre os valores preditos e efetivamente medidos no

processo.

vi

ABSTRACT

The main objective of this work is the proposition of a mathematical model for

prediction of the cooking degree (Kappa number) in a continuous digester for a pulp

mill running Kraft production process, which utilizes Eucalyptus Grandis as raw

material. Mainly modeling through artificial neural networks utilizing process

variables from a real plant was explored in this work. The FT-NIR (Fourier

Transform Near Infrared) technology was utilized to identify the wood chips entering

the cooking process. In association with this technology, it was utilized a

multivariated analysis technique named PCA (Principal Components Analysis), for

reduction of the dimensionality of the model’s input standards. Process variables and

analyses associated to the infrared absorbency frequency spectra in the wood chips

were utilized as input to the neural model.

A rapid introduction to the Kraft process was necessary for better understanding of

the problem. Several tests utilizing various methods of nonlinear parametric

optimization for training of the neural model were conducted. The results showed

adequacy for utilization of these techniques for variable prediction in the industrial

field, especially the cooking degree in a continuous digester. The developed model is

capable of predicting the Kappa variable with a certain advance, thus enabling more

proactive operational actions and consequent reduction of the variability of this

variable. In spite of the complexity of the cooking process, the countless variables

influencing the degree of cooking and the nonlinear behavior of the digester, the

modeling based on neural networks provided good correlation coefficients between

the predicted values and those actually measured in the process.

vii

SUMÁRIO

1 INTRODUÇÃO ................................................................................................. 18

1.1 Revisão e Motivação.................................................................................. 18

1.2 Organização dos capítulos.......................................................................... 23

2 CARACTERÍSTICAS DA MADEIRA E DESCRIÇÃO DO PROCESSO DE FABRICAÇÃO DE CELULOSE (ETAPAS DE MOVIMENTAÇÃO DE MADEIRA, PICAGEM E COZIMENTO)........................................................ 25

2.1 O processo de produção de celulose Kraft ................................................. 25

2.2 Características da madeira ......................................................................... 28

2.3 Caracterização da madeira utilizada na Cenibra ........................................ 36

2.4 Sistema de recebimento e manuseio da madeira........................................ 40

2.4.1 Preparação de cavacos........................................................................ 40 2.5 Cozimento (polpeamento).......................................................................... 43

2.6 Digestor ...................................................................................................... 44

2.7 Número Kappa (#Kappa)........................................................................... 51

2.8 Variabilidade das Linhas de Produção....................................................... 52

3 ANÁLISE DOS COMPONENTES PRINCIPAIS (PCA)................................. 54 3.1 Introdução .................................................................................................. 54

3.2 Dedução das Componentes Principais ....................................................... 55

3.3 Escolha do número de Componentes Principais ........................................ 59

3.4 Comentários finais ..................................................................................... 61

4 A TECNOLOGIA FT-NIR (Fourrier Transform Near Infrared) ..................... 62 4.1 Introdução .................................................................................................. 62

4.2 Absorbância e absorção da luz................................................................... 62

4.3 A espectroscopia no infravermelho próximo por Transformada de Fourier

(FT-NIR) ................................................................................................................ 64

4.4 A Transformada de Fourier........................................................................ 66

4.5 Técnicas de pré-tratamento matemático empregadas ao FT-NIR.............. 68

4.6 Aplicações em indústrias de celulose e papel ............................................ 68

4.7 Conclusões ................................................................................................. 70

5 REDES NEURAIS ARTIFICIAIS (RNA) ........................................................ 71 5.1 Introdução .................................................................................................. 71

5.2 Modelo de um neurônio artificial............................................................... 72

5.3 Função de ativação..................................................................................... 74

viii

5.4 Arquitetura das RNAs................................................................................ 75

5.5 Projeto de uma RNA .................................................................................. 77

5.6 Aprendizado supervisionado...................................................................... 78

5.7 Algoritmo de treinamento Back-propagation ............................................ 81

5.7.1 Função de ativação............................................................................. 82 5.7.2 Taxa de aprendizagem........................................................................ 83 5.7.3 Modos de treinamento seqüencial e por lote...................................... 83 5.7.4 Critérios de parada ............................................................................. 84

5.8 Redes de múltiplas camadas (MLP)........................................................... 84

5.9 Métodos de primeira e segunda ordem ...................................................... 86

5.10 Generalização em uma RNA...................................................................... 87

5.11 Early Stopping (parada antecipada) ........................................................... 89

5.12 Conclusões ................................................................................................. 91

6 METODOLOGIA E RESULTADOS................................................................ 92 6.1 Introdução .................................................................................................. 92

6.2 O problema estudado ................................................................................. 94

6.3 Preparação dos dados e procedimentos para os testes das RNAs .............. 95

6.3.1 Planejamento dos testes ..................................................................... 95 6.3.2 Tratamento dos dados ........................................................................ 97

6.4 Apresentação de Dados, utilização de análise de componentes principais

para definição de variáveis de entrada aplicadas a rede neural artificial ............... 99

6.5 Implementação da RNA........................................................................... 102

6.6 Comparação dos resultados obtidos ......................................................... 104

6.6.1 Primeira geração de resultados RNA_01_PCA1 ............................. 105 6.6.2 Segunda geração de resultados RNA_02_PCA2 ............................. 108 6.6.3 Terceira geração de resultados (RNA _03_PCA3) .......................... 111 6.6.4 Quarta geração de resultados (RNA_04_PCA4).............................. 114 6.6.5 Quinta Geração de resultados (RNA_05_ NIR)............................... 117 6.6.6 Testes com Early Stopping.............................................................. 124 6.6.7 Simulador de processos.................................................................... 126

7 COMENTÁRIOS FINAIS............................................................................... 128 7.1 Conclusões ............................................................................................... 128

7.2 Sugestões para trabalhos futuros.............................................................. 129

ix

LISTA DE FIGURAS

Figura 2.1 Principais etapas envolvidas na rota produtiva Kraft .................... 27

Figura 2.2 Diagrama cíclico do processo recuperação Kraft .......................... 28

Figura 2.3 Ilustração de uma parede de células e organização das fibras ...... 30

Figura 2.4 Estrutura de um tronco .................................................................. 31

Figura 2.5 Tipos de nós quanto a aderência: A- Nó vivo, B- Nó morto ......... 32

Figura 2.6 Rendimento do Eucalyptus grandis para um processo em produção

com #Kappa 16............................................................................... 36

Fig. 2.7 Características da madeira da Cenibra (histograma de densidade).. 39

Fig. 2.8 Características da madeira da Cenibra (histograma de AE) .......... 39

Figura 2.9 Digestor contínuo - Cenibra .......................................................... 46

Figura 2.10 Digestor contínuo para cozimento Kraft (Lo-Solids) ..................... 49

Figura 2.11 Processo de cozimento Lo-Solids com 04 diferentes zonas de

cozimento ...................................................................................... 50

Figura 2.12 Histograma de #Kappa .................................................................. 53

Figura 3.1 (a) Dados originais nas coordenadas X1 e X2; (b) Os eixos dos

componentes principais Y1 e Y2 ................................................... 57

Figura 3.2 Dados projetados nos dois eixos principais: (a) Primeiro componente

principal contendo”ou “explicando” a maior parte da variação nos

dados; (b) Segundo componente principal, contendo a menor parte da

variação nos dados ......................................................................... 57

Figura 3.3 Representação dos escores dos autovalores de cada fator (método do

Diagrama de autovalores) .............................................................. 60

Figura 4.1 Absorbância do meio ..................................................................... 63

Figura 4.2 Espectro Eletromagnético .............................................................. 65

Figura 5.1 Modelo de um neurônio artificial................................................... 73

Figura 5.2 Funcões de ativação: (a) Função limiar, (b) Função linear, (c) Função

Linear por partes, (d) Função Sigmoidal tangente hiperbólica ............... 75

Figura 5.3 Rede alimentada adiante com uma única camada de neurônios .............. 76

Figura 5.4 Rede alimentada adiante totalmente conectada com uma camada oculta 77

Figura 5.5 Método de aprendizagem supervisionada com professor ........................ 79

x

Figura 5.6 Método de aprendizagem por correção de erros, grafo de fluxo de sinal 79

Figura 5.7 Diagrama em blocos de uma RNA, resultando em um único neurônio na

camada de saída ....................................................................................... 80

Figura 5.8 Rede MLP Típica com duas camadas intermediárias .............................. 85

Figura 5.9 Problema de ajuste do modelo ................................................................ 89

Figura 5.10 Comportamento dos erros de treinamento e validação para uma RNA. 90

Figura 6.1 Gráfico de correlação entre o desvio padrão de #Kappa e AE da madeira da

Cenibra .................................................................................................... 94

Figura 6.2 Exemplo de espectro de freqüência de cavacos de madeira, obtidos usando a

técnica FT-NIR ........................................................................................ 97

Figura 6.3 Estrutura de todos os modelos testados ................................................... 103

Figura 6.4: Estrutura de todos os modelos testados RNA _01_PCA1........................ 106

Figura 6.5 Simulação da RNA algoritmo TRAINSCG - Teste RNA _01_PCA1 ..... 106

Figura 6.6 Simulação da RNA algoritmo TRAINBR para o teste RNA _01_PCA1. 107

Figura 6.7 Simulação da RNA algoritmo TRAINLM - Teste RNA _01_PCA1 ....... 107

Figura 6.8 Simulação da RNA algoritmo TRAINGD - Teste RNA _01_PCA1 ....... 107

Figura 6.9: Simulação da RNA algoritmo TRAINGDM -Teste RNA _01_PCA1..... 108


Figura 6.11 Simulação da RNA algoritmo TRAINSCG - Teste RNA _02_PCA2 .... 109

Figura 6.12 Simulação da RNA algoritmo TRAINBR - Teste RNA _02_PCA2....... 110

Figura 6.13 Simulação da RNA algoritmo TRAINLM - Teste RNA _02_PCA2 ..... 110


Figura 6.15 Simulação da RNA algoritmo TRAINGDM – Teste RNA _02_PCA2 ... 111



Figura 6.18 Simulação da RNA algoritmo TRAINBR - Teste RNA _03_PCA3 ....... 113

Figura 6.19 Simulação da RNA algoritmo TRAINLM - Teste RNA _03_PCA3 ...... 113


Figura 6.21 Simulação da RNA algoritmo TRAINGDM - Teste RNA _03_PCA3.... 114



Figura 6.24 Simulação da RNA algoritmo TRAINBR - Teste RNA _04_PCA4........ 116

Figura 6.25 Simulação da RNA algoritmo TRAINLM - Teste RNA _04_PCA4 ....... 116

Figura 6.26: Simulação da RNA algoritmo TRAINGD - Teste RNA _04_PCA4 ....... 116

Figura 6.27: Simulação da RNA algoritmo TRAINGDM - Teste RNA _04_PCA4.... 117

xi

Figura 6.28: Estrutura de todos os modelos testados RNA _05_NIR........................... 118


Figura 6.30: Simulação da RNA algoritmo TRAINBR - Teste RNA _05_PCA5........ 119

Figura 6.31: Simulação da RNA algoritmo TRAINLM - Teste RNA _05_PCA5 ....... 119

Figura 6.32: Simulação da RNA algoritmo TRAINGD - Teste RNA _05_PCA5 ....... 119

Figura 6.33: Simulação da RNA algoritmo TRAINGDM - Teste RNA _05_PCA5.... 120

Figura 6.34: Correlação linear da melhor rede obtida .................................................. 121

Figura 6.35: Tendência dos valores do #Kappa no treinamento com o algoritmo

TRAINSCG.............................................................................................. 122

Figura 6.36: Comparação da variável #Kappa predito e medido para o melhor modelo

obtido........................................................................................................ 123

Figura 6.37 Histograma dos dados de treinamento...................................................... 123

Figura 6.38: Arquitetura RNA que apresentou melhor resultado (10x6x1) ................ 124

Figura 6.39 Resposta com Early Stopping, RNA com melhor resultado na validação 125

Figura 6.40 Janela de entrada de dados para predição do #Kappa ............................. 127

xii

LISTA DE TABELAS

Tabela 2.1 Evolução da classificação da madeira na Cenibra ....................... 37

Tabela 2.2 Curvas de correção linear de características da madeira ............. 38

Tabela 6.1 Variâncias dos componentes principais ....................................... 100

Tabela 6.2 Componentes principais ............................................................... 101

Tabela 6.3 Resumo dos resultados dos testes ................................................ 126

xiii

LISTA DE ABREVIATURAS E SIGLAS

ABRAF Associação Brasileira de Produtores de Florestas Plantadas

AA Álcali Ativo

AE Álcali Efetivo

AHex´s Ácidos hexenurônicos

ATT Álcali Total Titulável

CA Corrente Alternada

CENIBRA Celulose Nipo Brasileira SA

CLP Controlador lógico programável

CPs Componentes principais

CR Caldeira de recuperação

CSTR Continuous Stirred Tank Reactor

DB Densidade Básica

FT-NIR Fourier Transform Near Infrared

IR Infrared

ISO International Standartization Organization

ITC Isothermal Coocking

IV Radiação Infravermelha

L Lume celular

LBR Licor branco

LM Lamela média

LN Licor Negro

LPD Licor preto diluído

MATLAB® Matrix Laboratory

MIX Mistura de madeira de diferentes qualidades

xiv

MLP Multilayer Perceptron

NIR Near Infrared

#Kappa Número Kappa

PCA Principal Components Analyses

PLS Regressão multivariada (Projection to Latent Struccture)

PM Parede primária

RD Rendimento depurado

RDH Rapid Displacement Heating

RNAs Redes Neurais Artificias

S1 Primeira camada da parede secundária

S2 Segunda camada da parede secundária

S3 Terceira camada da parede secundária

SCG Gradiente Conjugado Escalonado

SG Siringila/guaiacila

TAPPI Technical Association for the Pulp, Paper and converting Industy

tSA/d Tonelada seca ao ar por dia

UV Radiação Ultravioleta

VCP Votorantim Celulose e Papel

xv

LISTA DE SÍMBOLOS

dL/dt Variação do teor de lignina nos cavacos de madeira em função do tempo

k Taxa de variação de temperatura dependente da reação

C Concentração de álcali efetivo do licor de cozimento

L Teor de lignina contida nos cavacos

H Fator H - Junção dos efeitos do tempo e temperatura no processo de cozimento

t0 Tempo inicial de circulação

kr Coeficiente de reação relativa

N Abreviação de Normal (Química)

x Vetor aleatório x

y Vetor aleatório y

z Transformação z

x1, x2, xp Vetor de variáveis x

y1, y2, yp Vetor de variáveis y

n, m Linhas e colunas de uma matriz

Iλ Autovalor associado a matriz identidade

det Determinante

xT Vetor aleatório x transposto

µ Vetor de médias

Σ Matriz de covariância

λ1 , λ2,, λp Autovalores da matriz

T1u Varáveis transpostas da linha 1 de uma matriz

11u , , 21u P1u Variáveis de uma matriz

xvi

x , , , 1x 2x px Vetores de uma matriz

UT Matriz U transposta

Var Variância

Cov Covariância

i , j Direções de um vetor

S Desvio padrão

S2 Quadrado do desvio padrão

X , Y Média aritmética

σ Desvio padrão

estY Valor do vetor Y estimado

r Coeficiente de correlação

f Freqüência

C0 Velocidade das ondas

λ Comprimento de onda

I0 Intensidade de uma onda

v Velocidade

c Velocidade da luz

h Constante de Planck

γ Radiação gama

α Coeficiente de absorção

ca Concentração de absorbância

f(x) Função

wx Freqüência angular

( )⋅ϕ Função de ativação

k Neurônio k

xvii

x1, x2,..., xn Sinais de entrada

wk1, wk2, ..., wkm Pesos sinápticos do neurônio k

vk Saída do combinador linear

bk Bias

yk Sinal de saída do neurônio

δ Gradiente local

( )nw ji∆ Variação da correção no peso do neurônio j na iteração n

η Taxa de aprendizagem

( )niδ Gradiente local do neurônio j na iteração n

)(nyi Sinal de entrada i do neurônio j na iteração n

S1 Variável de saída do digestor - #Kappa medido

E1Representa a temperatura na circulação de homogeneização após o aquecimento do licor de cozimento

E2Representa a temperatura na circulação de cozimento antes do aquecimento de licor de cozimento

E3Representa a temperatura na circulação de homogeneização antes do aquecimento de licor de cozimento

E4 Representa o Alcali Total Titulável

E5 Representa o Alcali Residual

E6 Representa a sulfididade do licor branco de cozimento

E7 Relação lignina por kilograma de celulose

CP1, CP2, CP3Componentes principais que representam a matriz de dados analisados pelo FT-NIR

18

1 INTRODUÇÃO

1.1 Revisão e Motivação

Para o período entre 2005 a 2008, a previsão para crescimento do mercado

de celulose (polpa química) será de aproximadamente 3,3% ao ano, representando 5

milhões de toneladas mundiais para o novo montante. Aproximadamente 95% desse

crescimento ocorrerá na América Latina, significando que esta região produzirá 25%

do mercado mundial (LANSDELL, 2006, p.1). No Brasil espera-se um crescimento

nesse período de 1,9 milhões de toneladas o que representa 41% do crescimento

mundial.

Para essa produção, o Brasil conta com a ajuda das condições climáticas e

uma engenharia florestal desenvolvida. As indústrias de celulose alcançam hoje

patamares elevados de produção e qualidade, competindo em níveis até mesmo

superiores ao mercado mundial. Desde o plantio da madeira até o processo de

cozimento e produto final, os sistemas automatizados têm sido amplamente

utilizados, o que gera uma alta escala produtiva, com custos mais baixos.

Diante desta estimativa de crescimento do setor de celulose, vale ressaltar

que de acordo com o relatório anual da ABRAF (2007) isto não significará em

impactos ambientais, pois as florestas ocuparão áreas já desmatadas e ainda por

vários projetos de fomento florestal. No entanto, este crescimento é uma grande

oportunidade de novos desenvolvimentos tecnológicos nos processos de fabricação,

para os sistemas que os controlam e ainda o crescimento da economia do país.

O processo de polpação pode ser considerado o coração de uma planta de

celulose, pois neste se dá o cozimento da madeira para separar as fibras dos demais

componentes. O digestor é o equipamento responsável pelo cozimento e apresenta

uma série de fatores que podem ser considerados como distúrbios nesta etapa.

Atendendo as constantes necessidades dos usuários de melhorias

operacionais, melhorias no desempenho dos equipamentos, nos processos e na

qualidade do produto acabado, surge a oportunidade para o desenvolvimento de

19

ferramentas de simulação que permitam testes off-line, sem colocar em risco a

operacionalidade da produção (FERNANDES & CASTRO, 2000, p3729).

Em indústrias de celulose e papel, os digestores são os equipamentos mais

críticos operacionalmente, pois sofrem influências das múltiplas variáveis de entrada.

Estes equipamentos podem ser classificados como reatores especiais, heterogêneos e

complexos do ponto de vista de entendimento operacional. Nestes ocorrem muitas

reações químicas, além de possuírem variáveis de processo de difícil medição.

A necessidade de estudar e ou predizer seu comportamento através de

modelagem matemática tem sido o motivo de inúmeras pesquisas ao longo dos anos

(HARKONEN, 1987); (MICHELSEN & FOSS, 1996); (QIAN et al., 1997); (AL-

AWAMI & SYDRAK, 1998); (WISNEWSKI & DOYLE III, 1998); (DOYLE III &

KYIHAN, 1999); (FERREIRA et al., 2000); (WISNEWSKI, 2001); (AGUIAR,

2001); (QUEIROZ et al., 2004); (KAYIHAN, 2002); (CARDOSO et al., 2002);

(POLIT et al., 2002); (POUGATCH et al., 2005); (DUFOUR et al., 2005) e

(PADHIYAR et al., 2006).

O pioneiro nestas pesquisas foi Vroon (1957). Este autor introduziu o

conceito do fator H, que ainda hoje continua sendo utilizado. Neste caso, temperatura

e tempo de cozimento foram agrupados em uma única variável. A partir dos estudos

de Vroon outros estudos e modelos foram desenvolvidos para o fator H (BUGAGER

et al., 1979) e (MARQUES et al., 1979).

Em todos os processos químicos de produção de celulose, as variáveis

tempo de cozimento e temperatura de deslignificação são consideradas as mais

importantes, pois afetam diretamente a remoção de lignina e a qualidade do produto

final (MARQUES et al., 1979). Estas variáveis se relacionam de forma inversa, ou

seja, quanto maior a temperatura, menor o tempo de cozimento.

Segundo Bugager et al. (1979), o uso do fator H para controlar o cozimento

é questionável e deve ser usado com restrições para madeira de eucalipto, pois um

mesmo fator H, usando tempo e temperaturas diferentes, foi obtido para celulose

com rendimentos depurados e #Kappa variados.

Variações da densidade da madeira de eucalipto ocorrem em níveis de

estrutura anatômica, composição química e propriedades físicas, podendo ser

detectadas diferenças significativas inter e intra-específicas (TOMAZELLO, 1994).

20

A densidade básica tem se mostrado um bom índice universal para a qualidade da

madeira (FOEKEL & MENOCHELLI, 1990), sendo esta propriedade a que mais

oferece informações sobre as demais características deste material (GARCIA, 1995).

Essas características influenciam diretamente no resultado do cozimento da madeira,

ou ainda influenciam diretamente no #Kappa.

Blake (2004) analisa as influências da densidade básica da madeira na

qualidade da polpação Kraft e nas características da polpa. Foram analisados os

requerimentos de carga de álcali para polpação, o rendimento do processo, as

características do licor residual, a branqueabilidade e as propriedades físico-

mecânicas da polpa branqueada. Vale ressaltar que este estudo não propôs um

modelo matemático dessas influências.

Estudos realizados com diferentes espécies de eucaliptos não encontraram

correlações bem definidas entre a densidade básica da madeira e a demanda de carga

de álcali ou o rendimento do processo (MOKFIENSKI, 2003).

Este trabalho busca identificar e propor um modelo que correlacione as

alterações do número #Kappa em função das variações na química da madeira,

identificadas pela análise da absorbância de luz do infravermelho próximo nos

cavacos de Eucalyptus Grandis em uma planta de celulose que utiliza o processo

Kraft. Esta técnica é denominada FT-NIR (Fourier Transform Near Infrared).

Também são utilizadas técnicas multivariadas como exemplo o PCA (Principal

Componentes Analyses) para redução da matriz de dados gerada pelo FT-NIR. A

modelagem é feita utilizando inteligência artificial, as RNAs (Redes Neurais

Artificiais) .

Alguns trabalhos mostram que as medições por espectroscopia, têm

apresentado bons resultados nas medições de variáveis em processos industriais.

Gomes (2007) descreve as principais aplicações nos diversos ramos industriais. Em

medições dos componentes dos cavacos de madeira, vários trabalhos mostram um

bom desempenho desta técnica de medição (SKOGLUND, et al., 2004); (HOANG et

al., 2005); (SANTOS et al., 2006); ( FACKLER et al., 2006) e (CALDEIRAA et al.,

2007).

Neste trabalho, foi utilizado um equipamento (ANTARIS) para medir o

comprimento de onda da absorção de luz infravermelho próximo NIR (Near

21

Infrared) nos cavacos de madeira. Este equipamento gera um espectro de freqüência,

que é analisado por Transformada de Fourier. A combinação desta medição e sua

análise, forma a tecnologia FT-NIR (Fourier Transform Near Infrared).

Estas informações sobre os cavacos de madeira obtidas pelo FT-NIR, são

tratadas por técnicas estatísticas multivariadas, para serem utilizadas como parte das

variáveis de entrada de um modelo empírico que utiliza inteligência artificial (Redes

Neurais) para predição do #Kappa na saída do processo de polpação (cozimento).

Foram utilizadas também outras variáveis de entrada consideradas pela

prática operacional de grande influência no processo de cozimento.

Os modelos, até então encontrados na literatura, têm utilizado predição do

#Kappa nos digestores contínuos, mas não utilizando as mesmas variáveis propostas

neste trabalho, especialmente os dados do FT-NIR. Os trabalhos que mais se

aproximam são o de Blake (2004), que analisa somente uma variável como entrada

para o seu modelo, a densidade da madeira via a técnica FT-NIR, e o de Aguiar &

Filho (2000), que propôs um modelo utilizando redes neurais, mas não utiliza as

características da madeira como entrada de seu modelo.

Os analisadores FT-NIR apresentam um conceito de medição diferente da

instrumentação analítica convencional, pois empregam tecnologia óptica e eletrônica

aliada ao conceito matemático da Transformada de Fourier. Os princípios físicos

básicos envolvidos são os da absorção. O termo Transformada de Fourier refere-se

ao método de obtenção do espectro, que essencialmente é um processo de modulação

ou codificação, seguido de uma demodulação (COHN & RIBEIRO, 2002).

Os analisadores por absorção de radiação infravermelha ou simplesmente

analisadores infravermelhos (IV ou IR) são aplicáveis às substâncias constituídas por

moléculas hetero atômicas, ou seja, aquelas formadas por no mínimo dois átomos de

espécies diferentes. Estas substâncias absorvem a radiação IV em determinadas

faixas, coincidentes com as freqüências de vibração das moléculas.

CaldeiraA et al. (2007) apresenta bons resultados com testes experimentais

através da avaliação do desempenho do equipamento NIR, com medições on-line e

utilizou destas informações, associadas com um modelo de regressão multivariada

(PLS), para análise do teor seco e densidade básica em cavacos.

22

Segundo Wisnewski & Doyle III (2001) existem vários atributos nos

digestores contínuos que desafiam uma boa modelagem e também são problemas

para um bom controle do equipamento, dentre estes destacam-se:

• a variável #Kappa possui atrasos em sua medição;

• o tempo elevado de atraso entre as variáveis de entrada e seus efeitos no

#Kappa;

• os digestores apresentam comportamento não linear;

• as variações biológicas da química da madeira estão sujeitas à variações

aleatórias não mensuráveis nas componentes como concentração, umidade e

densidade que são as principais fontes de variações contínuas na operação

dos digestores.

Identificar e conhecer as características físicas, químicas e anatômicas da

madeira (cavacos) antes de sua entrada no processo de cozimento e utilizar estas

informações para predição do #Kappa, trará grandes benefícios operacionais para o

processo de produção de celulose.

A madeira sofre influência de vários fatores em um processo de análise de

suas características, além das análises não serem procedimentos triviais, pois são

influenciadas por:

• espécie de madeira (mais importante);

• comportamento do crescimento (em regiões deformadas do tronco, a

constituição da madeira é diferenciada);

• fatores hereditários da árvore;

• ponto de tomada da amostra. Exemplo: cerne ou camada externa lenho

juvenil ou adulto, idade, altura no tronco (na parte inferior o lenho é mais

comprimido), tronco ou ramos, etc.;

• condições e história do armazenamento da madeira antes da sua análise.

• método de preparação da amostra.

O digestor estudado utiliza o processo de cozimento Lo-solids e de acordo

com Marcoccia et al. (1998), este é um processo modificado de polpação que foi

utilizado industrialmente a partir de outubro de 1993.

O objetivo básico do processo Lo-solids é minimizar a concentração de

sólidos oriundos da madeira nas fases de deslignificação principal e residual. Esta

23

rotina apresenta como principiais vantagens em relação aos processos de cozimento

convencionais (ITC – Isothermal Coocking, KobudoMari e Compact Cooking): o

aumento da resistência e viscosidade da polpa, a redução da temperatura de

cozimento e do uso de álcali, uma melhoria na eficiência de lavagem no digestor, um

cozimento mais uniforme, uma melhor desempenho no deslocamento da coluna de

cavacos dentro do digestor e redução na demanda de reagentes químicos no

branqueamento.

Devido a estas vantagens o processo Lo-Solids tem apresentando uma rápida

expansão na sua aplicação industrial no mundo, projetos mais recentes de digestores

tem utilizado esta tecnologia de cozimento, como exemplo os novos projetos de

aumento de capacidade das fábricas da Cenibra, Aracruz, Veracel e VCP (Três

Lagoas).

De acordo com Wisnewski & Doyle III (2001) os digestores exibem

comportamentos não lineares particularmente quando operam com #Kappa baixos,

estes autores afirmam ainda que os estudos e desenvolvimento de modelos para estes

equipamentos não são triviais e demandam muita dedicação.

Diante das adversidades encontradas nos processos industriais, o

desenvolvimento de modelos matemáticos tem sido fonte de estudos de diversos

pesquisadores e a utilização das RNAs (Redes Neurais Artificiais), tem alcançado

bons resultados especialmente em sistemas não lineares, com a maioria utilizando

redes do tipo MLP (Multilayer Perceptron). Nas aplicações em indústrias de

celulose e papel, vários autores têm estudado e descrito sobre estes modelos (GE, et

al., 1998); (LEMMETI et al., 1998); (KASPARIAN & BATUR, 1998); (PREMIER

et al., 1999); (HAYKIN, 2001); (AGUIAR & FILHO, 2001); (YU & GOMM, 2003);

(LAPERRIÈRE et al., 2004); (DUFOUR et al., 2005); (MALMBERG, et al., 2005);

(COSTA, et al., 2005); (RUBINI & YAMAMOTO, 2006) e (BARBER & SCOTT,

2007).

1.2 Organização dos capítulos

No Capítulo 2 são abordadas as características da madeira utilizada na

Cenibra para o processo de fabricação de celulose e a descrição do processo de

24

fabricação de celulose tipo Kraft. Comenta-se também sobre as particularidades do

processo estudado.

No Capítulo 3 são abordados conceitos relativos à Análise de Componentes

Principais (PCA) onde são mostradas as deduções dos componentes principais, a

determinação dos valores através dos autovetores e os conceitos de média aritmética,

correlação, variância e covariância.

O Capítulo 4 trata da técnica FT-NIR (Fourier Transform Near Infrared),

na qual se obtém as informações sobre os cavacos de madeira para informações que

serão utilizadas como parte das variáveis de entrada da rede neural proposta neste

trabalho. É feita uma abordagem sobre a teoria de funcionamento dos sistemas IR

(Infrared) e NIR (Near Infrared) que, associados à Transformada de Fourier, dão

origem à tecnologia FT-NIR. São mostradas também as análises dos dados obtidos.

No Capítulo 5 é feita uma abordagem genérica sobre redes Neurais

Artificiais.

No Capítulo 6 é mostrada a metodologia dos estudos, os resultados obtidos

em função dos testes realizados e também são discutidas algumas características dos

métodos abordados que podem fazer com que os mesmos não encontrem soluções

com capacidades de generalização.

No capítulo 7 são apresentadas as conclusões deste trabalho e as sugestões

de futuras pesquisas.

E finalmente as referências bibliográficas empregadas são listadas.

25

2 CARACTERÍSTICAS DA MADEIRA E DESCRIÇÃO DO PROCESSO

DE FABRICAÇÃO DE CELULOSE (ETAPAS DE MOVIMENTAÇÃO

DE MADEIRA, PICAGEM E COZIMENTO)

2.1 O processo de produção de celulose Kraft

O processo polpa sulfato ou processo Kraft foi desenvolvido em 1879, na

Alemanha, pelo pesquisador Dahl, no qual o polpeamento de madeiras é feito através

de soda e sulfeto de sódio (ASSUMPÇÃO et al., 1988, p.171).

O processo Kraft tem como função dissolver a lignina1, agente ligante das

fibras na madeira, com o objetivo de liberar as fibras com o mínimo de degradação

dos carboidratos (celulose2 e hemicelulose3). Na etapa de cozimento da madeira,

emprega o hidróxido de sódio (NaOH) e o sulfeto de sódio (Na2S) como agente ativo

na reação.

O processo de obtenção de celulose apresenta um subproduto denominado

“licor negro”. Este fluido contém a parte da madeira denominada lignina, combinada

com os reagentes químicos utilizados no início do processo de polpação. Por razões

econômicas e ambientais torna-se estritamente necessária a reutilização deste produto

em um processo denominado recuperação de produtos químicos, que consiste na

elevação do teor de sólidos e em seguida queimá-lo na caldeira de recuperação.

Os fundidos resultantes da queima do LN (Licor Negro) na CR (Caldeira de

Recuperação) são dissolvidos em licor branco fraco com uma concentração entre 20

a 60 g/L. Após a dissolução, a mistura é tratada transformando-se em licor branco,

que é utilizado no início do processo de polpação, fechando assim o ciclo de

recuperação.

1 Lignina é uma substância química, que confere rigidez à parede da célula e, nas partes da madeira, age como um agente permanente de ligação entre as células, gerando uma estrutura resistente ao impacto, compressão e dobra (D’ALMEIDA, 1988, p.76). 2 Celulose é um polissacarídeo formado por unidades do monossacarídeo β-D-glucose, que ligam entre si através dos carbonos 1 e 4, dando origem a um polímero linear (D’ALMEIDA,1988, p.47). 3 Hemicelulose é uma mistura de polímeros polissacarídeos de baixa massa molecular, os quais estão intimamente associados com a celulose no tecido das plantas (D’ALMEIDA,1988, p.68).

26

O processo Kraft, tem como principal vantagem, o sistema de recuperação

dos produtos químicos a ele associado. Por outro lado, apresenta como desvantagens:

o alto custo, as emissões de odores no ambiente, baixa alvura após o cozimento e

consequentemente maior custo de branqueamento com baixo rendimento entre 40 a

50% (ASSUMPÇÃO et al., 1988, p.171).

Após a etapa de cozimento, a polpa que deixa o digestor passa por uma

lavagem de massa marrom. Em seguida, é pré-branqueada e branqueada através de

um processo químico que envolve oxigênio, peróxido de hidrogênio, soda cáustica e

dióxido de cloro. Finalmente a celulose branqueada é enviada para as etapas de

secagem e enfardamento.

Uma boa qualidade da celulose, associada a baixos custos de produção, está

intimamente correlacionada com os bons resultados no processo de polpação, daí a

necessidade de um bom conhecimento e um bom rendimento durante a etapa do

cozimento. Para isto, o #Kappa é uma variável de extrema importância para bons

resultados operacionais.

Costa (2000) descreve as principais etapas envolvidas no processo de

produção de celulose Kraft da seguinte forma:

• preparo das toras de madeira: as toras são transformadas em cavacos por

meio de um processo que envolve a retirada das cascas seguida de uma

etapa para redução de tamanho nas linhas de picagem;

• cozimento dos cavacos de madeira: os cavacos são levados ao digestor

juntamente com o licor branco de cozimento, nesta etapa é utilizado para

aquecimento, o vapor através de troca térmica direta;

• separação da pasta e do licor formados: a etapa de cozimento separa a polpa

celulósica, que é enviada para as etapas seqüentes da linha de fibras, do licor

negro fraco que é enviado ao ciclo de recuperação.

A Figura 2.1 evidencia o processo tipo Kraft de forma simplificada em

diagrama de blocos.

27

Cozimento

Pátio de madeira

Deslignificação

Extração/ Secagem da polpa marrom

Caldeira Biomassa

Evaporação Stripping

Caustificação da Lama de cal

Turbina

Tratamento de água

Caldeira recuperação

Oxidação do Licor Branco

Preparação de Oxigênio

Prod. Químicos (branq.)

Caustificação Licor Verde

Água tratadaÓleo combustível

Cascas e finos

Vapor

Dregs

Cal

Óleo combustível

Oxigênio líquido ou ar

InsumosProdutos químicos de

branqueamento

Celulose

Branqueamento

Lavagem de Polpa marrom

Madeiras

Energia Elétrica Vapor

Licor branco

Gases Odorososconcentrados

Água tratada

Lavagem da Polpa

Licor verde

Rejeitos

Vapor de processo

Figura 2.1: Principais etapas envolvidas na rota produtiva Kraft (PIOTO, 2003)

Durante o processo de recuperação, o licor negro que sai do digestor é

levado a um sistema de evaporadores de múltiplo efeito para que o mesmo aumente o

seu conteúdo de sólidos. O licor mais concentrado é então queimado nas caldeiras de

recuperação. Os sais fundidos resultantes são tratados e retornam à rota produtiva de

celulose na forma de licor branco (NaOH e Na2S). Assim, uma característica

importante deste processo de recuperação dos sais inorgânicos é que as etapas

envolvidas estão correlacionadas de forma a atribuir ao processo global uma natureza

cíclica como mostra a Figura 2.2.

28

Figura 2.2: Diagrama cíclico do processo recuperação Kraft (ASSUMPÇÃO et al., 1988, p.176)

2.2 Características da madeira

A madeira é constituída de vários elementos celulares, unidos entre si, o que

forma tecidos diferenciados conforme a função que desempenham. Carvalho (2005)

afirma que é o conjunto e arranjo do lenho que definem sua estrutura.

Karlson (2006) descreve que a madeira é composta principalmente por três

tipos de materiais: celulose, hemicelulose e lignina e que sua composição relativa

varia de acordo com cada espécie de árvore.

Carvalho (2005) comenta que ainda que todas as madeiras sejam formadas

basicamente pelos mesmos elementos, as modificações de forma, tamanho e arranjo

dos componentes tornam diferentes as estruturas das diversas espécies. Afirma

também que embora exista uma grande variabilidade da madeira dentro da mesma

29

espécie e, até mesmo, dentro de uma mesma árvore, a estrutura básica das madeiras

pertencentes a uma mesma espécie mantém-se constante. Esta característica torna

possível a classificação e a identificação das madeiras através de observações de seus

elementos. Dentro de certos limites, o estudo da estrutura da madeira permite avaliar

as possibilidades de sua aplicação.

As paredes celulares são constituídas de muitas substâncias orgânicas e

inorgânicas. Consideram-se como substâncias orgânicas a lignina, proteínas e

lipídios. Como substâncias protéicas importantes, têm-se a extensina, que dá rigidez

à parede, e a α-expansina, que atua na expansão irreversível da parede. São também

comuns as enzimas peroxidases, fosfatases entre outras (CARVALHO, 2005, p.33).

Substâncias lipídicas como suberina, cutina e ceras tornam a parece celular

impermeável à água. Dentre as substâncias inorgânicas podem ser citados a sílica e o

carbonato de cálcio.

Carvalho (2005) descreve que a parede celular forma-se externamente à

membrana plasmática. As primeiras camadas formadas constituem a parede primária

(PM) (Figura 2.3), onde a deposição das microfibrilas ocorre por intussuscepção, ou

seja, por rearranjo entrelaçado. Entre as paredes primárias de duas células contíguas

está presente a lamela média, ou mediana (LM) (Figura 2.3).

Em muitas células a parede primária é a única que permanece. Em outras,

internamente à parede primária, ocorre a deposição de camadas adicionais que

constituem a parede secundária. Nesta parede, as microfibrilas são depositadas por

aposição, ou seja, por arranjo ordenado. A primeira, a segunda e a terceira camadas

da parede secundária são designadas S1, S2 e S3, respectivamente, sendo delimitadas

pela mudança de orientação da deposição, que varia nas diferentes camadas (Figura

2.3). A camada mais próxima da parede primária é denominada S1, a camada

seguinte é a S2 representa cerca de 70 a 75% do total da parede celular descreve

KOGA (1988). A camada S3 é semelhante a S1 e suas microfibrilas estão dispostas,

aproximadamente, na direção perpendicular ao eixo da fibra de 60° a 90°.

Durante a deposição da parede secundária inicia-se a lignificação. No caso

de células mortas, a parede secundária delimita o lume celular (L).

30

S3 - Camada de entrada da parede secundária

S2 - Camada principal da parede secundária

S1 - Camada de saída da parede secundária PM - Parede primária LM - Lamela média

L - Lume Celular

Figura 2.3 Ilustração de uma parede de células e organização das fibras

De acordo com Carvalho (2005) as paredes diferem em espessura,

composição e propriedades físicas nas diferentes células. A união entre duas células

adjacentes é efetuada através da lamela média (LM) que é constituída principlmdente

por lignina (KOGA, 1988, p. 33). A parede primária é mais espessada que a lamela

média e geralmente se mostra bem mais fina em comparação à parede secundária. A

parede primária possui alto teor de água, cerca de 65%, e o restante, que corresponde

à matéria seca, é composta de 90% de polissacarídeos (30% de celulose, 30% de

hemicelulose e 30% de pectina) e 10% de proteínas (expansina, extensina e outras

glicoproteínas). Impregnações e, ou, depósitos de cutina, suberina e ceras podem

estar presentes na parede primária de algumas células. A parede secundária possui

um teor de água reduzido, devido à deposição de lignina que é um polímero

hidrofóbico. A matéria seca é constituída de 65 a 85% de polissacarídeos (50-80% de

celulose e 5 a 30% de hemicelulose) e 15 a 35% de lignina. A celulose é o maior

componente da parede secundária, estando aparentemente ausentes as pectinas e

glicoproteínas. Embora o processo de lignificação esteja associado à parede

secundária, ele geralmente se inicia na lamela média e parede primária, de modo que

estas também podem conter lignina quando da formação da parede secundária.

Vários fatores caracterizam a madeira e a sua influência nos processos de

polpação. Dentre eles destacam-se:

• Espécie da madeira alimentada no processo:

A espécie de madeira tem grande efeito na qualidade e propriedades da polpa

celulósica. A Cenibra utiliza em suas operações apenas madeira de folhosas,

mais especificamente Eucalipto (híbridos de grandis).

31

De forma geral, a madeira proveniente de folhosas possui, quando

comparadas às madeiras de coníferas, as seguintes características:

° fibras mais curtas (cerca de 1mm de comprimento);

° menor teor de lignina;

° maior teor de xilanas4;

° maior facilidade de impregnação dos cavacos;

° maior facilidade de deslignificação;

° excelentes propriedades de impressão e escrita.

• Qualidade do cerne e alburno;

Observam-se nas caracterizações da madeira, diferenças nas qualidades das

madeiras de cerne e alburno (Figura 2.4). Embora do ponto de vista de

obtenção de celulose esse fato tenha pouco aplicação prática, pois se consome

a tora inteira, é importante destacar que:

• cerne: Possui mais extrativos e lignina, que levam:

° menor rendimento;

° mais pitch que é um depósito adesivo de origem natural (vegetal)

formado em polpa, papel e no maquinário da fábrica;

° dificuldade maior de cozimento e consequentemente de

branqueamento.

• menor permeabilidade (capacidade de absorção de umidade);

• maior dificuldade de impregnação dos cavacos;

Figura 2.4: Estrutura de um tronco, Carvalho (2005)

4 As xilanas são polissacarídeos como um esqueleto linear formado por unidades de xilose conectadas entre si pelos carbonos 1 e 4, através das ligações Beta (β) (D’ALMEIDA,1988, p.70).

32

• Presença de nós na alimentação de cavacos;

Nó é a porção basal de um ramo que se encontra embebida no tronco ou peças

de madeira, provocando na sua vizinhança desvios ou a descontinuidade dos

tecidos lenhosos (CARVALHO, 2005, p.39). O efeito dos nós depende do seu

tamanho, número, distribuição, característica (solto/vazado). A grande

presença de nós tem influência negativa no rendimento do processo, uma vez

que prejudicam as propriedades físico-mecânicas das fibras. Quanto a

aderência o nó pode ser vivo, morto ou solto conforme mostrado na Figura

2.5.

Figura 2.5: Tipos de nós quanto a aderência: A- Nó vivo, B- Nó morto, Carvalho (2005)

• Presença da madeira juvenil e de topo;

Da mesma forma que as diferenças na qualidade de cerne e alburno, embora

do ponto de vista de obtenção de celulose, esse fato tenha pouca aplicação

prática, pois se consome o tronco inteiro, cita-se as seguintes diferenças nas

características de madeira juvenil e de topo:

° menor densidade;

° menor rendimento;

° fibras mais curtas e de paredes mais finas;

° menor comprimento e diâmetro dos elementos de vasos;

° parede celular mais fina;

° maiores ângulos das microfibrilas;

° maior proporção de fibras;

° menor proporção de vasos;

° maior teor de holocelulose.

• Presença de madeira de tensão (crescimento excêntrico);

33

Caracteriza-se por uma medula acentuadamente deslocada do centro do

tronco. Os anéis de crescimento apresentam largura variável e as zonas de

lenho inicial e tardio são pouco diferenciadas. Pode ser provocada pelo vento,

ação da gravidade em árvores que crescem obliquamente, forte insolação

lateral, crescimento unilateral da copa que resulta em suprimento de

nutrientes deficiente em um dos lados (CARVALHO, 2005, p.37).

Em regiões muito acidentadas, como é o caso de algumas áreas de plantio da

Cenibra, pode ocorrer à presença de madeira de tensão, caracterizado pela

presença do crescimento excêntrico, o que favorece as seguintes

características:

° camada gelationosa S3 (Figura 2.3);

° mais celulose e menos lignina;

° maior rendimento;

° mais galactana e menos xilana;

° vasos menores e menos freqüentes;

° densidade mais elevada;

° propriedades de resistência inferiores.

• Idade da madeira;

Do ponto de vista prático, a idade da madeira é um fator de gerenciamento

operacional das florestas e afeta as propriedades de interesse do

processamento das seguintes formas:

° quanto maior a idade da árvore maior será sua densidade;

° quanto maior a idade maior é o RD (rendimento depurado); Queiroz

(2004) conclui em seus experimentos, que a madeira de baixa

densidade apresenta menor requerimento de álcali para produção de

polpa, maior rendimento depurado e viscosidade da polpa mais

elevada.

° quanto maior a idade menor será o consumo específico (capacidade de

conversão e polpa de celulose ou seja m³ de madeira / tonelada polpa).

• Variação na densidade básica da madeira alimentada no cozimento

(densidade a granel dos cavacos);

34

Para a Cenibra, a densidade tem sido um dos únicos fatores utilizados como

característica de qualidade no acompanhamento operacional da fábrica. É

sabido que a densidade afeta de forma significativa no processo de produção

de celulose.

Embora a densidade represente as tendências definidas nas características da

madeira, sabe-se que outros fatores também influenciam essa avaliação e que,

por exemplo, o teor e composição da lignina da árvore poderão afetar muito

as características do processamento, e até mesmo se sobrepondo a tendência

da densidade.

As alterações de densidade na madeira influenciam nas:

° alterações no processo de picagem;

° alterações no dimensionamento dos cavacos;

° alterações na densidade a granel dos cavacos;

° alterações no teor de rejeitos;

° variações no consumo específico de madeira em m³ / tonelada polpa;

° alterações do consumo de álcali efetivo;

° alterações no RD (rendimento depurado);

° variações na viscosidade;

° maior consumo de energia no refino.

De forma geral, a densidade causa vários efeitos em um processo de

cozimento, e consequentemente nos processos de produção de celulose e do

próprio papel, e se relaciona com as seguintes características (QUEIROZ et

al., 2004):

° variação de volume específico aparente;

° variação de resistência à refinação;

° variação de resistência ao rasgo;

° variações nas características de opacidade;

° alterações nas características superficiais;

° alterações na qualidade de impressão;

° variação na resistência à tração;

° variação no alongamento;

° variação da resistência ao arrebentamento;

35

° variação da resistência a dobras;

° variação no peso específico aparente;

° alterações nas propriedades de ligação entre fibras;

• Composição química da madeira alimentada

Espécies de madeira que apresentam as melhores características para a

produção de polpa celulósica são as que possuem maiores teores de

carboidratos (celulose, hemicelulose) menores teores de extrativos, de lignina

e maior relação SG5. siringila/guaiacila.

Composição:

° celulose: 40 a 50%;

° hemicelulose: 20 a 30%;

° lignina (guaiacila, co-polímero siringila-guaiacila): 25 a 35%;

° extrativos (resina, cera, gordura, açúcar, tanino): 2 a 4%;

° cinzas: < 0,5%;

° Mn, Fe, Cu, Co, Zn: afetam o branqueamento que utiliza reagentes

como ozônio (O3) e peróxido de hidrogênio (H2O2), causam perda de

viscosidade e reversão de alvura;

° Ca, Al, Si, Ba, Mg, Mn: causam incrustações na caldeira de

recuperação, evaporadores e lavadores;

° P, N: nutrientes que afetam qualidade do efluente;

° K, Cl, Cr: corrosão entupimentos na caldeira de recuperação;

° Cd, Cu, Ni, As, Hg, Zn, Cr: aumentam toxidez do efluente.

A Figura 2.6 mostra a relação e o rendimento para os principais

componentes do Eucalyptus grandis (COLODETTE, 2004). Considerou-se uma

estimativa para um processo com produção, tomando como referência o #Kappa

igual 16 e rendimento depurado igual a 50%. Pode ser observado que dos 100 Kg de

madeira, aproximadamente 50%, após a etapa de polpação, segue na linha de fibras

como polpa marrom e o restante é extraído como licor negro fraco e é considerado

como perdas, mas no entanto é reaproveitado na etapa de recuperação.

5 Siringila/Guaiacila (S/G) são tipos de lignina presentes na constituição química da madeira.

36

100 Kg Madeira Eucalyptus grandis

Figura 2.6: Rendimento do Eucalyptus grandis para um processo em produção com

#Kappa=16 (COLODETTE, 2004)

2.3 Caracterização da madeira utilizada na Cenibra

Caldeira et al. (2006) descreve que até o ano de 2001, a Cenibra não possuía

nenhum tipo de classificação com objetivo de abastecimento de madeira. Toda a

caracterização realizada limitava-se à conversão de quantidades utilizadas nos

processamentos florestais. A partir de 2001, iniciou-se uma simples caracterização,

dividindo a madeira em leve e pesada. Entre 2003 e 2005, a caracterização por

densidade foi implantada, e a madeira foi dividida em cinco classes conforme Tabela

2.1, utilizadas na confecção de misturas para atender as necessidades de produção.

Em algumas situações, entretanto, observava-se que a densidade não era suficiente

para entendimento dos distúrbios do processo e o manuseio destas cinco classes de

qualidade era bastante oneroso nas operações florestais.

Dessa forma, em 2005 iniciou-se uma nova estratégia de caracterização da

madeira. A área de plantio da Cenibra foi classificada segundo extratos, que são

áreas correspondentes a um material genético homogêneo, de mesma idade, rotação e

região.

Extrativos 2,1 kg

Ligninas 26,7 kg

Hemiceluloses 21,0 kg

Celulose 50,2 kg

Cinzas 0,4 kg

Extrativos 0,25 kg

Ligninas 0,75 kg

Hemiceluloses 8,0 kg

Celulose 41,0 kg

Cinzas 0,1 kg

Extrativos 88%

Ligninas 97%

Hemiceluloses 62%

Celulose 18%

Cinzas 75 %

Madeira

Fibras Marrons (50 kg) Cozimento Kraft com #Kappa 16 Rendimento 50%

(10 kappa x 0,15 x 0,50) Perdas

37

Tabela 2.1: Evolução da classificação da madeira na Cenibra, Caldeira, et al., (2006)

Até 2001 2000 a 2002 2003 a 2005 2006 Classificação por

densidade Classificação por Qualidade

A - <= 450 kg/m3 A

B - = 451 a 480 kg/m3 B

C - = 481 a 510 kg/m3 C

D - > 510 kg/m3

Sem Classificação Média e Peso

E - Desconhecido

Em 2006 iniciou-se a classificação por qualidade da madeira (Tabela 2.1),

sendo:

• Classe A: é a madeira da linha de produção #1, com densidade baixa, menor

teor de lignina e extrativos, rendimentos maiores (estudada neste trabalho);

• Classe B: é madeira da linha de produção #2, com densidade altas, com

maiores teores de lignina e extrativos, rendimentos menores e maior

tolerância para o MIX (mistura de madeira de diferentes qualidades);

• Classe C: é a madeira com características de qualidade maiores que o Limite

máximo permitido.

Através de um projeto de avaliação pré-corte da madeira utilizada na

Cenibra, foi realizada a avaliação do consumo de AE (Álcali Efetivo) e RD

(Rendimento Depurado) para #Kappa igual a 17, através de testes experimentais

(cozimento) em laboratório, utilizando as seguintes condições de cozimento:

• tempo de cozimento: 150 minutos;

• temperatura do digestor: 170 ºC;

• sulfidez: 30 %.

Ao final destes testes, foram analisadas as concentrações dos seguintes

parâmetros de qualidade:

• lignina total, solúvel e insolúvel;

• Extrativos (resinas);

• densidade básica (DB); siringila e guaiacila (S/G).

38

Paralelamente a esse trabalho de classificação da madeira em laboratório,

iniciaram-se as medições através da tecnologia FT-NIR. A tecnologia FT-NIR é uma

metodologia mais rápida e de menor custo, já que são necessárias análises das

características para o volume de todo o maciço florestal da Cenibra.

A primeira parte do trabalho de segregação da madeira constou da criação

das curvas de calibração, nas quais foram obtidas as correlações mostradas na Tabela

2.2, com dados provenientes da caracterização do ano de 2005.

Para amostras desconhecidas e não caracterizadas pelo FT-NIR, foram feitas

extrapolações baseadas na idade, procedência e região de origem da madeira.

Em função dos resultados obtidos, Caldeira et al. (2006) relata que foi

possível selecionar 2 variáveis que passaram a descrever a qualidade madeira. São

eles: densidade e consumo de álcali efetivo para #Kappa 17 (chamado a partir daqui

para simplificação de AE).

Tabela 2.2: Curvas de correção linear de características da madeira (CALDEIRA et al., 2006)

Característica Correlação

AE-Álcali Efeivo (%) 0,623

RD-Rendimento Depurado(%) 0,561

DB- Densidade Básica (kg/m3) 0,778

Lignina(%) 0,230

Extrativos (%) 0,573

Dessa forma, foi possível obter uma visão da distribuição da qualidade da

madeira programada para abastecimento em 2006, representada pelos histogramas na

Figura 2.7 (referentes à densidade) e na Figura 2.8 (correspondente ao AE). Somente

após esta classificação foi possível determinar e reduzir os desvios padrões destas

variáveis, através de alterações de procedimentos operacionais.

39

Histogram: DensidadeK-S d=,04284, p> .20; Lilliefors p> .20

Expected Normal

360 380 400 420 440 460 480 500 520 540 560

X <= Category Boundary

0

5

10

15

20

25

30

35

40

45

50

55

No.

of o

bs.

Média: 468,71

Desvio padrão: 30,94

Coef. variabilidade: 6,6 %

Fig. 2.7: Características da madeira da Cenibra (histograma de densidade)

(CALDEIRA et al., 2006)

Histogram: AEK-S d=,09960, p<,10 ; Lilliefors p<,01

Expected Normal

12 13 14 15 16 17 18 19 20


0

10

20

30

40

50

60

No.

of o

bs.

Média: 15,57

Desvio padrão: 1,36

Coef. variabilidade: 8,73 %

Fig. 2.8 Características da madeira da Cenibra (histograma de AE)

(CALDEIRA et al., 2006)

Para melhor entendimento sobre os conceitos de álcali e sulfidez, variáveis

importantes no processo de polpação, mostra-se a seguir o exemplo para

determinação do álcali efetivo (AE), em função do álcali ativo. Esta abordagem

significa dizer que se tivermos um licor branco com concentração de 110,20 g/l, o

40

mesmo terá 97,42 g/l de Álcali Efetivo e 13,77 g/l de NaHS, considerando uma um

percentual de 25% de enxofre.

⎪⎪⎪⎪

⎩

⎪⎪⎪⎪

⎨

⎧

−→⇒⇓

⎩⎨⎧

⇒

+=AElgNaOHlg

Sulfidez

NaOHlgNaHSlg

SNalg

SNaNaOHAtivoAlcalilg

/42,97/65,82)%25(

/77,13/77,13

/55,27 2

/20,1102

2.4 Sistema de recebimento e manuseio da madeira

As fábricas de celulose possuem geralmente pátios de estocagem de

cavacos, a fim de garantir um abastecimento contínuo ao digestor. Manter o nível de

cavacos nos pátios garante um estoque capaz de suprir o processo sem interrupção

momentânea das linhas de abastecimento e picagem.

Algumas empresas utilizam os pátios para estocagem de cavacos por um

período mais longo, a fim de obter propriedades dos cavacos específicas, como é o

caso da eliminação de extrativos e secagem da madeira, o que não é o caso específico

da Cenibra.

2.4.1 Preparação de cavacos

Após o corte da madeira no campo e o seu transporte até a fábrica, a

madeira é conduzida até a mesa receptora de toras nas linhas de picagem, onde

recebe pulverização de água com o objetivo de impedir a geração de suspensão de

particulado (poeira) e remoção de areia. O sistema de arraste das mesas, constituído

por correntes, favorece a remoção de terra, areia, pequenos galhos e um pouco de

casca da madeira recém chegada.

41

Após a mesa receptora, a madeira é conduzida por transportadores de

correias aos tambores descascadores onde, por atrito com a superfície irregular das

paredes internas e entre a própria madeira, ocorre seu descascamento.

Após a saída do tambor descascador a tora de madeira é conduzida ao

picador de disco através de correias transportadoras. O picador é constituído por

facas fixadas em um disco, que gira em alta velocidade. A tora de madeira desce por

uma calha inclinada de encontro com as facas, sendo reduzida à cavacos. Os cavacos

produzidos são enviados em seguida aos pátios de estocagem.

2.4.1.1 Pátio de estocagem

O pátio de estocagem de madeira da linha I da Cenibra é o pátio mais

antigo, portanto com uma concepção menos moderna. O cavaco que chega até o

pátio é conduzido por uma correia transportadora localizada acima do pátio. Possui

uma correia principal que transporta o cavaco desde a saída do picador, onde é

transferido para uma outra correia, que está montada sobre um transportador móvel

que se desloca no sentido longitudinal.

Através da correia móvel o cavaco pode ser descarregado diretamente sobre

o leito do pátio ou ser descarregado em uma outra correia que está no sentido

perpendicular, que por sua vez descarrega na direção dos arrastadores de extração do

pátio, chamado de stocker.

O deslocamento do carro é feito manualmente pelo operador podendo

formar pilhas espaçadas sobre a camada de cavacos existentes no pátio. O formato do

pátio é um retângulo, com 110 metros de comprimento por 30 metros de largura na

base, mantendo esta dimensão até o topo da pilha, que mede 16 metros.

Normalmente o pátio preserva o cavaco espalhado em toda a sua área,

variando, portanto sua altura e conseqüentemente o volume, conforme o ritmo de

produção dos picadores, em relação ao ritmo de produção do digestor.

O cavaco é removido para ser cozido no digestor utilizando arrastadores

instalados na lateral direita do pátio. Na maior parte do tempo, uma correia sobre o

pátio desvia o cavaco sobre os arrastadores deixando o volume armazenado no pátio

como estoque.

42

Com esta logística de operação Caldeira et al. (2006) afirma que

determinadas camadas de cavacos podem permanecer no pátio por um período muito

grande, principalmente as que fazem parte das camadas mais inferiores, enquanto o

cavaco que acaba de entrar no pátio pode ser extraído quase no mesmo instante.

Afirma ainda que não é difícil definir o MIX dos cavacos recém produzidos

quando associados aos cavacos que estão ha mais tempo estocados. Esta situação irá

depender de vários fatores, principalmente quanto ao volume consumido pelo

digestor em relação ao produzido pelos picadores. Maior consumo no digestor,

implica numa maior extração dos cavacos recém chegados ao pátio, devendo ser

completada por mais uma parcela de cavacos estocados anteriormente. À medida que

o pátio abaixa em altura, camadas de cavacos estocados por mais tempo passam a

serem utilizadas. Por outro lado, a diminuição do consumo implica que o pátio irá

ganhar volume. Assim, mais cavacos ficarão estocados, e as camadas mais inferiores

ficarão estocadas por um período muito maior.

Existem períodos do ano em que o volume de cavacos do pátio varia em

virtude de melhor ganho na picagem da madeira. Tradicionalmente, épocas chuvosas

contribuem para uma diminuir o volume dos cavacos no pátio.

Caldeira et al. (2006) relatam que neste tipo de pátio é possível os cavacos

podem sofrer alteração química devido ao tempo de estocagem, como já mencionado

anteriormente. Os cavacos podem ainda sofrer alterações físicas devido à

movimentação freqüente de máquinas de grande porte no pátio, o que provoca a

compactação, quebra e a formação de finos.

2.4.1.2 Extração dos cavacos do pátio para consumo no digestor

A extração dos cavacos para o peneiramento e posteriormente para consumo

no digestor, é realizada através de três arrastadores montados abaixo do pátio,

localizados em pontos longitudinais. Estes arrastadores fazem parte de um

equipamento denominado stocker, e são responsáveis pela extração do cavaco para o

peneiramento e posteriormente para consumo no digestor. São acionados por

cilindros hidráulicos e comandados por um controlador lógico programável (CLP).

43

Uma rosca helicoidal posicionada dentro de uma calha, completa o ciclo de

extração dos cavacos em cada stoker. Quando a calha da rosca está vazia um sinal

de comando, proveniente de uma célula de carga é enviado ao CLP, que por sua vez,

obedecendo a uma programação estabelecida, executa automaticamente os comandos

necessários para a movimentação dos arrastadores (retração e avanço). Os

arrastadores funcionam de forma alternada, ou seja, quando um arrastador estiver

inserido no pátio o outro retrairá e o que estiver retraído tende a avançar. O

retrocesso dos arrastadores traz consigo a porção dos cavacos que alimentam a calha

da rosca e através do helicóide alimenta a correia, rumo ao peneiramento.

O curso de avanço e retrocesso dos arrastadores é de aproximadamente 1,4

m, a distância máxima possível do alcance dos arrastadores dentro do pátio é de 4,0

metros. Diante desta estrutura, pode-se afirmar que os arrastadores estão limitados a

uma área de captação restrita e fixa dentro do pátio, local onde estão montados os

stockers. Portanto, haverá sempre a necessidade de direcionar o cavaco nestes

pontos, seja através da correia transportadora, ou pela alimentação através de

máquina móvel (pá mecânica).

Após a extração pelos stockers, os cavacos são enviados à etapa de

peneiramento para remoção dos finos e dos overs. Em seguida, são transportados ao

processo de cozimento.

2.5 Cozimento (polpeamento)

O processo de cozimento consiste na separação da lignina das fibras

celulósicas, constituintes básicos da madeira. Para efetuá-la, a CENIBRA utiliza o

processo químico Kraft ou Sulfato.

Este processo de cozimento químico usa soda cáustica, compostos de

enxofre (denominado licor branco ou licor de cozimento), temperatura e tempo de

cozimento adequados em um vaso pressurizado, conhecido como digestor. O

digestor estudado neste trabalho possui capacidade volumétrica de 1.000 m³. A

alimentação é feita continuamente pelo topo, com descarga simultaneamente pelo

fundo o tempo de retenção é de aproximadamente 3 horas.

44

Os produtos resultantes do cozimento são as fibras celulósicas, denominadas

massa marrom e uma mistura de matéria orgânica e inorgânica denominada licor

preto fraco. Este licor, após tratamento, é queimado na caldeira de recuperação,

gerando energia e vapor.

Desde a alimentação até a descarga, os cavacos permanecem

aproximadamente 3 horas em regime de cozimento. A massa, antes de ser

descarregada pelo fundo, é pré-lavada dentro do próprio digestor.

Os cavacos que vêm do peneiramento caem em um silo. No silo, é

introduzido vapor de baixa pressão para um pré-aquecimento. No fundo deste silo, os

cavacos passam por uma rosca que funciona como um medidor de cavacos. Em

seguida, passam por um alimentador de baixa pressão, que está localizado na calha

de cavacos para depois caírem no alimentador de alta pressão, onde em contato com

o licor de topo, inicia o processo de circulação. Este licor transportará os cavacos até

o topo do digestor.

Parte deste licor passa por uma peneira localizada no alimentador de alta

pressão e vai para dois filtros. O licor filtrado vai para o tanque de nível e o licor não

filtrado vai para a calha de cavacos, com objetivo de manter o nível desta. Do tanque

de nível o licor retorna à circulação de topo. A mistura de cavaco e licor chegará

direto no separador de topo, que irá extrair parte deste licor para que o mesmo

retorne a circulação de topo. O restante será transportado pelo separador de topo para

dentro do digestor, onde ocorrerá o cozimento dos cavacos, com introdução de vapor

a pressão de 13 Kgf/cm2.

2.6 Digestor

Os digestores são vasos de pressão onde os cavacos de madeira são tratados

com o licor de cozimento, à pressão e temperatura estabelecida, visando a produção

de pasta de celulose (ASSUMPÇÃO et al., 1988, p.235). O ciclo de operação do

cozimento inicia-se com a introdução dos cavacos e do licor no digestor, seguido

pelo aquecimento do conjunto até a temperatura estabelecida, conforme o tipo de

45

cozimento empregado. As variáveis: temperatura, tempo de cozimento e quantidade

de reagentes, promovem a solubilização e separação das fibras.

Para evitar a ebulição o licor de cozimento é necessário que o digestor

trabalhe com uma pressão acima da pressão atmosférica, possibilitando assim

aumento da temperatura de cozimento, uma aceleração nas reações químicas de

deslignificação e maior produtividade no equipamento.

Por ser um material de menor custo, os digestores são em sua maioria,

construídos em aço carbono sendo empregado também, em alguns casos, aço

inoxidável na forma de revestimento. As seções superiores e médias do digestor são

as mais sujeitas a corrosão (ASSUMPÇÃO et al., 1988, p.237).

Digestores de maior porte são mais econômicos que os de pequeno porte,

pois necessitam de quantidades específicas menores de vapor e mão-de-obra. Porém,

atualmente para instalação de novas fábricas, tem surgido uma nova tecnologia

chamada de Compact Cooking, onde há o pré-cozimento do cavaco antes de entrar

no digestor propriamente dito.

Os digestores descontínuos são os empregados na polpação alcalina. Estes

equipamentos possuem aquecimento direto ou indireto, e os processos de cozimentos

empregados por eles mais conhecidos são: Batch e Superbatch.

Nos sistemas descontínuos, também chamados de batelada, existem três

processos com aplicação comercial: RDH (Rapid Displacement Heating),

SuperBatch e EnerBatch. Nos processos RDH e SuperBatch é feito um pré-

tratamento (impregnação) do cavaco com licor negro, visando reduzir o consumo de

vapor e ao mesmo tempo aumentar a sulfidez inicial e reduzir a carga de álcali

efetiva. Já no processo EnerBatch é feito um pré-tratamento do cavaco com licor

branco seguido de um pré-tratamento com licor negro. Todos estes processos

possibilitam uma substancial economia de energia e melhoram a qualidade da polpa

(PIOTTO, 2003, p.201).

Já os digestores contínuos, podem ser classificados em função dos processos

utilizados para o cozimento: Convencional, ITC (Isothermal Cooking), Kobudo-

Mari, Lo-Solids, Compact Cooking. Nestes equipamentos, toda matéria prima de

produção de celulose é introduzida continuamente através de equipamentos

46

especiais, sendo os produtos descarregados, simultaneamente e na mesma proporção,

após o tempo de retenção necessário para acontecer o cozimento da madeira.

A celulose marrom é obtida no digestor contínuo estudado, com objetivo de

produzir de 1288 tSA/d (tonelada seca ao ar por dia). O digestor é um vaso

pressurizado com aproximadamente 60m de altura, 3 m e 6m de diâmetro na parte

superior e inferior, respectivamente (Figura 2.9).

Figura 2.9: Digestor contínuo – Cenibra

Basicamente, durante sua operação, o digestor é mantido continuamente

cheio, sendo alimentado na parte superior com cavacos e licor de cozimento (licor

branco). A polpa de celulose descarregada na parte inferior possui uma consistência

de 10%. O rendimento do processo é da ordem de 50%, ou seja, para cada tonelada

(peso seco) de cavacos alimentados, obtém-se 0,5 tonelada de celulose. A

temperatura de cozimento é aproximadamente 170 ºC a uma pressão do vapor de

alimentação é de 13 kgf/cm² (fundo).

No digestor, processa-se o cozimento da madeira com o licor branco, agente

químico que separa as fibras de celulose dos compostos orgânicos restantes da

madeira que são dissolvidos. Como a lignina é o principal composto a ser separado,

esta etapa é também chamada de deslignificação.

47

Uma consideração importante em processos de cozimento, é Fator H que é

um método desenvolvido por Vroon (1957) para expressar o tempo e a temperatura

de cozimento como uma única variável, é calculado com base na área sob a curva da

velocidade relativa em função do tempo.

A tecnologia de cozimento utilizada atualmente na Cenibra é a chamada Lo-

Solids. O objetivo básico desta metodologia é minimizar a concentração de sólidos

oriundos da madeira nas fases de deslignificação principal e residual, mantendo as

condições necessárias para um processo modificado. A tecnologia Lo-Solids oferece

como benefícios:

• redução de picos de concentração de álcali;

• redução de picos de temperatura;

• mínima concentração de lignina ao final do cozimento;

• máxima sulfidez no início do cozimento.

Segundo Marcoccia et al. (1998) tem-se verificado que a concentração de

sólidos de madeira dissolvidos pode ser reduzida em até 30%. No processo Lo-

Solids, as condições de reação desejáveis são obtidas pela extração do licor negro do

sistema várias vezes durante o processo de polpação. Cada uma das extrações é

seguida de uma injeção de licor para reconstituição das concentrações de reagentes

desejáveis. O cozimento Lo-Solids apresenta muitas vantagens dentre elas, destacam-

se:

• o aumento da resistência e viscosidade da polpa;

• a redução da temperatura de cozimento e do uso de álcali;

• a melhoria na eficiência de lavagem no digestor;

• o cozimento mais uniforme;

• um melhor desempenho no deslocamento da coluna de cavacos

dentro do digestor;

• a redução na demanda de reagentes químicos no branqueamento.

Devido a estas vantagens o processo Lo-Solids tem apresentando uma rápida

expansão na sua aplicação industrial no mundo. Além disto, em várias fábricas

observou-se uma redução no consumo específico de madeira da ordem de 8% , o que

segundo Marcoccia et al. (1998) evidencia o aumento de rendimento devido ao uso

deste processo.

48

Basicamente este tipo de cozimento objetiva:

• estabilizar o perfil de concentrações de carga alcalina ao longo do

cozimento;

• concentrar maior número de íons sulfeto na fase de deslignificação

inicial e no começo da fase principal de remoção de lignina, como

forma de se proteger os carboidratos;

• uniformizar as temperaturas ao longo de cozimento, as quais são

mantidas menores em relação ao que se fazia no passado;

• reduzir a concentração de lignina dissolvida e de íons de sódio,

conseguindo-se isso pela troca constante dos licores conforme vão

sendo extraídos os compostos da madeira;

• processar condições brandas de cozimento e uniformes, levando em

consideração as principais variáveis do processo de cozimento Kraft.

Estes sólidos dissolvidos referem-se à lignina, celulose, hemicelulose,

extrativos, metais e sais minerais, os quais são removidos da madeira e dissolvidos

nos licores extraídos, durante o cozimento. Este processo inicia-se na impregnação,

onde os cavacos recebem o licor de cozimento e são aquecidos até a temperatura de

cozimento. O final da deslignificação refere-se à última zona de cozimento no

digestor.

Conceitualmente a hemicelulose, assim como a celulose, é um

polissacarídeo constituído de vários tipos de unidades de açúcar. Além de ser um

polímero ramificado de cadeia mais curta, possui baixa massa molecular, estrutura

amorfa e tem como principal constituinte a D-xilose (eucalipto), encontrado na

parede da fibra e representa de 20 a 30% da madeira (folhosas).

Sólidos de madeira dissolvidos são removidos do sistema pela extração do

licor de impregnação consumido e/ou pelos múltiplos licores de cozimento

consumidos ao longo do digestor. Em adição aos sólidos de madeira dissolvidos,

água e químicos do cozimento também serão removidos em cada extração. A

quantidade de água e álcali efetivo removido para uma dada extração dependerá do

fluxo de extração e da concentração do licor extraído. A reposição de água deve ser

realizada de maneira a satisfazer as necessidades do sistema hidráulico.

49

A reposição dos químicos do cozimento deve executada de forma a

satisfazer o grau de deslignificação necessário ao longo do digestor. Como resultado,

de licor branco e filtrado de lavagem são adicionados juntos para satisfazer o grau de

cozimento necessário ou em cada ponto onde é efetuada a extração, como afirma

Marcoccia et al. (1998).

Porém, nem todo sólido dissolvido presente no processo de cozimento, pode

ser removido do sistema via extração. Os licores de reposição, licor branco e

reposição de filtrado de lavagem, juntos, têm significativamente mais baixas

concentrações de sólidos de madeira dissolvidos do que os licores remanescentes no

digestor quando se efetua a mistura.

A combinação dos fluxos de reposição, junto com os licores remanescentes,

permanece no sistema após a extração. Ao mesmo tempo a combinação de fluxos de

reposição aumenta a relação líquido/madeira descendente de uma dada extração. A

alta relação líquido/madeira ajuda a diluir algum sólido dissolvido adicional formado

durante a zona de cozimento subseqüente.

A Figura 2.10, mostra um digestor contínuo tipo hidráulico, para processo

de cozimento Kraft com os principais equipamentos do sistema.

Figura 2.10: Digestor contínuo para cozimento Kraft (Lo-Solids)

50

Todo o processo descrito tem como objetivo controlar o grau de cozimento,

ou seja, o teor de lignina residual na massa, medido pelo #Kappa, que é um

parâmetro utilizado como referência para o controle do processo.

No processo de cozimento Lo-Solids, as múltiplas entradas de licor branco e

as múltiplas extrações de licor negro fraco, podem ser rearranjadas de diferentes

formas, dependendo das características individuais de cada digestor. A flexibilidade

inerente do processo de Lo-Solids, permite um controle independente de reações

químicas nas diferentes zonas existentes, conforme a Figura 2.11.

Licor Branco

Zona de Impregnação

Segundo estágio de cozimento

Primeiro estágio de cozimento Licor Branco

Zona de lavagem Licor Branco

Figura 2.11 Processo de cozimento Lo-Solids com 04 diferentes zonas de cozimento

Andritz, 2006

Moczydlower (2002) descreve o digestor, como um vaso de pressão onde os

cavacos e o licor branco são alimentados continuamente pela parte superior. O

cozimento da madeira ocorre do topo até o centro do digestor em fluxo co-corrente.

Do centro até a parte inferior, realiza-se uma operação de lavagem com fluxo em

contra-corrente, a fim de se retirar o licor negro formado. Uma visão esquemática do

digestor de celulose é apresentada na Figura 2.11. Assim, a flexibilidade inerente do

processo permite um controle independente de reações químicas nas diferentes zonas

existentes.

51

A finalidade do cozimento da madeira é separar da sua organização

compacta as fibras que estão unidas pela substância lignina como mencionado

anteriormente. De acordo Assumpção et al. (1988) para a produção de pastas

uniformes, deve-se dar um tratamento químico e térmico idêntico a todas as fibras.

Isto só é possível se os reagentes químicos houverem sido transportados para o

interior dos cavacos. Este transporte é realizado por meio de dois mecanismos

conforme comenta Assumpção et al. (1988): primeiro pela penetração do licor na

madeira devido a um gradiente de pressão hidrostática; e pela difusão de íons ou

outros solutos através da água sob a influência de um gradiente de concentração.

Embora a lignina seja o componente da madeira mais afetado pela polpação

alcalina, todos os carboidratos, incluindo a celulose, são atacados pelo licor de

cozimento composto principalmente de NaOH e Na2S segundo afirma Assumpção et

al. (1988). Estes autores comentam também que as variáveis que controlam o

rendimento, a composição química a as propriedades físicas da pasta produzida

podem ser dividas em dois grupos:

• variáveis associadas com a madeira: espécie, densidade básica (Expressa em

gramas ou quilogramas de madeira seca por centímetro cúbico ou por

decímetro cúbico de madeira verde, respectivamente.), fatores de

crescimento, estocagem e dimensões do cavaco;

• variáveis associadas com a operação do digestor: relação entre massa dos

reagentes e a massa de madeira seca, concentração dos reagentes no licor de

cozimento, sufidez do licor, temperatura e tempo de cozimento.

2.7 Número Kappa (#Kappa)

A qualidade da polpa é usualmente verificada ao final do processo de

cozimento da madeira. Uma maneira tradicional de se realizar esta medida é a

obtenção do #Kappa para o processo. D`Almeida (1988) afirma que a lignina

presente em pasta não branqueada é prontamente oxidada por permanganato de

potássio, enquanto a celulose é muito pouco atacada. Tomando-se esta propriedade,

pode-se definir o #Kappa como sendo o número em ml de solução de permanganato

52

de potássio 0,1N consumido por um grama de pasta absolutamente seca, sob

condições específicas.

O #Kappa foi determinado pela norma TAPPI (Technical Association for

the Pulp, Paper, and converting Industry) T236 cm-85. O #Kappa corrigido foi

obtido após a quantificação dos ácidos hexenurônicos e utilizando-se do fator de

conversão proposto por Li & Gellertedt (1997), no qual 11,9 mmol de Ahexs/kg de

polpa corresponde a uma unidade de Kappa.

Já o procedimento ISO 302:1981, define o #Kappa como o número de ml

de 0,02 mol/l de solução de permanganato de potássio, consumido sobre condições

especificadas em 1 g de polpa (calculada em base seca). Os resultados são corrigidos

para um valor correspondente obtido, quando 50% (massa/massa) de permanganato

de potássio são consumidos no teste.

Na Cenibra existe um instrumento on-line para medição contínua da

variável Kappa no digestor estudado, no entanto, para este trabalho foi adotado o

procedimento de análises laboratoriais, objetivando maior precisão na variável

medida.

2.8 Variabilidade das Linhas de Produção

Através dos dados de processo levantados no período de 01/01/2006 a

15/05/2006, Caldeira et al. (2006) descreve que se observou a variabilidade da linha

de produção, medida pelo desvio padrão do #Kappa do digestor, chegando aos

resultados mostrados na Figura 2.12.

O #Kappa médio no cozimento do processo estudado medido nesse

período, foi de 15,6 com um desvio padrão de 2,42, refletindo em um coeficiente de

variabilidade de 15,56%. Espera-se com a implementação do modelo proposto neste

trabalho, oferecer ao operador uma ferramenta de controle que facilite suas ações

operacionais, para reduzir a variabilidade por informações antecipadas da variável

#Kappa, preditas pelo modelo.

53

Histogram: Kappa Dig1K-S d=,07361, p> .20; Lilliefors p<,10

Expected Normal

10 11 12 13 14 15 16 17 18 19 20


0

10

20

30

40

50

60

No.

of o

bs.

Figura 2.12 Histograma de #Kappa

54

3 ANÁLISE DOS COMPONENTES PRINCIPAIS (PCA)

3.1 Introdução

A Análise de Componentes Principais (PCA) é uma técnica de análise

multivariada, baseada na combinação linear entre as variáveis analisadas, para

redução de dimensionalidade de matrizes. Quando esta técnica é aplicada à uma

matriz com muitas variáveis de entrada o novo conjunto de variáveis torna-se

ortogonal entre si e, portanto não fica correlacionado com os dados originais, em que

as primeiras componentes, denominadas componentes principais, explicam a maior

parte da variância total existente no conjunto de dados, podendo assim representá-

los.

A Análise de Componentes Principais (também conhecida como a

transformação de Karhnen-Loève na teoria da comunicação) maximiza a taxa de

redução de variância (HAYKIN, 2001, p.433).

A seleção e a extração de características são problemas comuns no

reconhecimento estatístico de padrões. A seleção de características é um processo no

qual o espaço de dados é transformado em um espaço de características. Entretanto,

esta transformação é promovida para reduzir o número de características efetivas,

mantendo o conteúdo das informações dos dados originais. O objetivo é reduzir a

dimensionalidade dos dados em análise e encontrar uma transformação mais

representativa e mais compacta destes.

O método consiste em transformar um vetor aleatório x mR∈ em outro

vetor x nR∈ (para ), projetando x nas n direções ortogonais de maior

variância, ou seja, as componentes principais.

mn ≤

Segundo Johnson (2002), os principais objetivos de se utilizar métodos de

análise estatística multivariada são:

• reduzir os dados ou simplificação estruturada: O caso estudado é

apresentado em uma matriz de espectros de freqüência com uma dimensão

elevada, e a técnica PCA reduzirá a dimensão dos dados, porém sem perda

significativa de informação;

55

• ordenar e agrupar grupos de objetos ou variáveis com características

similares;

• investigar as dependências entre as variáveis: O interesse está na relação

natural entre as variáveis. Se todas as variáveis são independentes ou se há

uma dependência entre elas. Se sim, como;

• criar e testar hipóteses: hipóteses estatísticas formuladas em função de uma

população de parâmetros multivariados são testadas para validar suposições

ou reforçar convicções anteriores;

• prever a relação entre as variáveis com o intuito de anteceder os valores de

uma ou mais variáveis observadas e até mesmo outras variáveis;

Ainda pode-se comentar que a análise de componentes principais é o

cálculo dos autovalores e correspondentes autovetores de uma matriz de variâncias e

covariâncias ou de uma matriz de coeficientes de correlação entre variáveis. Quando

as variáveis, devido a escalas diferentes de mensurações empregadas, não são

diretamente comparadas, torna-se necessário preliminarmente padronizá-las, de

modo que as variáveis transformadas passem a ter média zero e variância unitária.

Com variáveis padronizadas, a matriz de variâncias e covariâncias e a de coeficientes

de correlação tornam-se idênticas.

3.2 Dedução das Componentes Principais

Algebricamente as componentes principais são combinações lineares de p

variáveis originais: x1, x2,...,xp.

Geometricamente, as combinações lineares representam a seleção de um novo

sistema de coordenadas obtidas por rotação do sistema original com x1, x2,...,xp como

eixos. Os novos eixos, y1, y2,...,yp, representam as direções com variabilidade

máxima, permitindo uma interpretação mais simples da estrutura da matriz de

covariância.

De acordo com Tino (2005) a análise dos componentes principais, consiste

numa transformação linear de “m” variáveis originais em “n” novas variáveis, de tal

56

modo que a primeira nova variável computada seja responsável pela maior variação

possível existente no conjunto de dados. A segunda, pela maior variação possível

restante e assim por diante, até que toda a variação do conjunto tenha sido explicada.

Segundo Howard (2001) do teorema 0)( =− xAIλ possui uma solução

não trivial se e se somente se, 0)det( =− AIλ , e esta equação é chamada de

equação característica de A. Assim, os autovalores de A podem ser encontrados

resolvendo esta equação em λ .

O que realmente interessa é determinar para quais valores de λ o sistema

tem uma solução não trivial. Um valor de λ é chamado de autovalor de A, ou valor

próprio, ou as vezes, valor característico de A. Se λ é um autovalor de A, então cada

solução não trivial é um autovetor de A associado ao autovalor de λ .

Se A é uma matriz n x m (n linhas correspondentes às variáveis e m colunas

correspondentes às amostras) então um vetor não nulo x em nR é chamado um

autovetor de A se Ax é um múltiplo escalar de x, ou seja, xAx λ= para algum

escalar λ . O escalar λ é chamado de autovalor de A e diz-se que x é um autovetor

associado a λ .

Para o PCA geralmente, os dois ou três primeiros autovetores encontrados

explicarão a maior parte da variabilidade presente. Quando o primeiro autovetor

explicar 90 a 95% da variabilidade, isso deve ser encarado com cuidado e verificado

se não estão presentes variáveis com valores de magnitudes muito maiores que as

demais.

Os autovetores correspondem às componentes principais e são os resultados

do carregamento das variáveis originais em cada um deles. Tais carregamentos

podem ser considerados como uma medida da relativa importância de cada variável

em relação às componentes principais e os respectivos sinais, se positivos ou

negativos, indicam relações diretamente e inversamente proporcionais.

A matriz de carregamentos de cada variável nas componentes principais,

quando multiplicada pela matriz original de dados, fornecerá a matriz de contagens

(scores) de cada caso em relação às componentes principais. Esses valores poderão

então ser dispostos num diagrama de dispersão, em que os eixos são as duas

componentes mais importantes, e mostrar o relacionamento entre os casos

condicionados pelas variáveis medidas.

57

Figura 3.1: (a) Dados originais nas coordenadas X1 e X2; (b) Os eixos dos componentes principais Y1 e Y2 (TINO, 2005)

Conforme nas Figuras 3.1a e 3.1b, os dados não estão completamente

correlacionados. Pode-se então calcular uma mudança de eixos ou coordenadas de

modo que a primeira nova coordenada seja responsável pela maior variação ou

dispersão possível existente no conjunto de dados; a segunda coordenada pela maior

variação restante e assim por diante.

No caso exemplificado na Figura 3.2a, pode-se constatar que, de fato, o eixo

Y1 e, do primeiro componente principal, “explica” ou “contém” a maior variação dos

dados, ao passo que a variação “contida” ou explicada no eixo Y2 é muito menor

como na figura 3.2b.

Figura 3.2: Dados projetados nos dois eixos principais: (a) Primeiro componente principal contendo”ou “explicando” a maior parte da variação nos dados; (b) Segundo componente

principal, contendo a menor parte da variação nos dados. (fonte: Tino, 2005).

Seja xT = [x1, x2,... ,xP ] um vetor aleatório p dimensional com vetor de

médias µ, matriz de covariância Σ e autovalores: λ1, ≥ λ2, ≥ ..., ≥ λp.

Considere as combinações lineares:

58

pPP22P11PTpP

pPj22j11jTjj

pP2222112T22

pP1221111T11

xuxuxuxuy

xuxuxuxuy

xuxuxuxuy

xuxuxuxu

+++==

+++==

+++==

+++==

L

M

L

M

L

Ly

ou:

XUY T=

onde:

e

⎥⎥⎥⎥

⎦

⎤

⎢⎢⎢⎢

⎣

⎡

=

P

2

1

y

yy

YM

⎥⎥⎥⎥

⎦

⎤

⎢⎢⎢⎢

⎣

⎡

=

PPP2P1

2P2221

1P1211

uuu

uuuuuu

U

L

MLMM

L

L

com: ( ) ( ) ( ) µuXEuXuEYE T

jTj

Tjj ===

( ) ( ) ( ) juuuXVaruXuVarYVar T

jjTj

Tjj ∑===

( ) ( ) T

jTi

TTiji uuXuX,uVarY,YCov ∑== j

P ,2, 1,ji L=≠ Tendo tudo normalizado com:

[ ]⎥⎥⎥⎥⎥

⎦

⎤

⎢⎢⎢⎢⎢

⎣

⎡

=

Pj

2j

1j

Pj2j1jjTj

u

uu

uuuuuM

L

Define-se, de acordo com Chatfield e Collins (1992):

• A 1.ª componente principal como a combinação linear que maximiza a

variância sujeita à restrição ;

xuT1

)( T1 xuVar 1T

11 =uu

• A 2.ª componente principal como a combinação linear que maximiza a

variância sujeita às restrições e ;

xuT2

)( T2 xuVar 122 =uuT 0),( T

21 =xuxuCov T

59

• A j-ésima componente principal como a combinação linear que maximiza a

variância sujeita às restrições e todo i < j.

xuTj

)( Tj xuVar 1T

j =juu 0),( Tj =xuxuCov T

j

3.3 Escolha do número de Componentes Principais

O método no qual se seleciona ou escolhe os componentes principais é um

dos pontos de grandes discussões técnicas. Vários critérios são relacionados e os

mais conhecidos são:

Critério 1 - Critério de Kaiser (1958)

É provavelmente o critério mais usado. Kaiser (1958) propõe considerar

apenas os autovalores superiores a um, demonstrando que estes seriam os valores

estatisticamente significativos.

Critério 2 - Diagrama de Autovalores

A observação do diagrama de autovalores permite conservar aqueles

situados acima do ponto de mudança ruptura da inclinação da curva da função que

relaciona a ordem e os autovalores. Assim, se dois fatores são associados a

autovalores quase iguais, eles representam a mesma proporção de variabilidade e não

há motivo, a priori, de conservar um e não outro. Inversamente, uma forte

diminuição entre dois autovalores sucessivos leva a conservar na interpretação dos

fatores que a precederam. A Figura 3.3 mostra que há uma alteração brusca no

coeficiente angular da curva após o segundo autovalor. Mostra também que o

primeiro componente principal (PC1) possui uma boa covariância, o que representa

uma maior variância dos dados originais, oferecendo então maior relevância das

informações contidas nos dados. Valores de variância superiores a 1, explicam mais

de 90% dos dados originais.

60

1 2 3 4 5 61,0

1,5

2,0

2,5

3,0

3,5

4,0

Autovalores

Var

iânc

ia

Figura 3.3: Representação dos escores dos autovalores de cada fator (método do Diagrama

de autovalores)

Critério 3 - Fatores Interpretáveis

É um critério empírico, mas não desprovido de sentido, é recomendado por

diferentes autores, em particular Thurstone (1947) que propõem conservar os fatores

que se sabe claramente dar um significado. Faz-se uma análise que tenha uma

coerência com as variáveis que estão sendo avaliadas.

Critério 4 - Simulação de LÉBART (1972)

Para a sua operacionalização, cria-se uma matriz do mesmo tamanho de

números aleatórios, mas que respeitem a mesma distribuição (desvio padrão) e a

mesma média de cada variável da matriz em estudo. Após, faz-se a análise de

componentes principais e obtém-se uma série de autovalores. Este processo é

repetido "n" vezes. Para cada classificação na série de autovalores, conserva-se o

autovalor máximo observado ao longo das "n" simulações. Esses valores máximos

observados representam o limite inferior que deve ser ultrapassado para que um

componente possa ser levado em conta.

Vinte simulações são suficientes para atingir um limiar de significância de

5% (1/20). Sua principal desvantagem é que sua aplicação é mais demorada,

necessitando realizar 20 PCA a partir de dados gerados ao acaso para escolher os

autovalores limites.

61

3.4 Comentários finais

A análise dos componentes principais (PCA) encontra os componentes que

melhor representam o conjunto de dados analisados. É importante ressaltar que o

PCA tem sido aplicado como uma técnica matemática que não requer a especificação

de um modelo estatístico para explicar a estrutura do “erro”. Em particular não é feita

qualquer premissa sobre a distribuição das probabilidades da variável original

comenta Monteiro & Reis (1999).

Como o problema tratado apresenta um sistema que possui muitas entradas,

o PCA foi aplicado para reduzir a dimensionalidade da matriz de dados original.

Neste trabalho, os dados extraídos da análise dos cavacos de madeira,

através da tecnologia FT-NIR, geram um espectro de freqüência com 1557 variáveis

diferentes, após a aplicação do PCA, utilizando a rotina PREPCA do MATLAB®,

optou-se por utilizar o critério do diagrama dos autovalores para a escolha dos

componentes principais mais significativos.

62

4 A TECNOLOGIA FT-NIR (Fourrier Transform Near Infrared)

4.1 Introdução

A obtenção de informações e o conhecimento das variáveis de processo são

imprescindíveis no ajuste dos processos industriais. O Infravermelho Próximo (NIR)

apresenta-se como uma poderosa ferramenta para obtenção de dados, por sua vasta

aplicação.

Gomes (2007) descreve sobre a tecnologia FT-NIR e suas aplicações nas

medições dos diversos tipos de variáveis de processo na indústria.

Apontadas por Gomes (2007), são suas principais vantagens: o grande

potencial na coleta de dados, e possibilidade de uma análise não destrutiva das

amostras (pois a radiação NIR é suficientemente pequena, o que faz com que a

amostra não altere sua estrutura). Se utilizados recursos de transmissão de dados do

tipo fibras óticas, por exemplo, tornam as análises a distâncias mais simples e livres

de vibração e descartam a presença de pessoas em ambientes de riscos ou tóxicos.

A Transformada de Fourier é uma aliada do NIR, pois tem como função

básica decompor ou separar um sinal de diferentes freqüências, com suas respectivas

amplitudes. A junção destas duas técnicas forma a tecnologia FT-NIR (Fourier

Transform Near Infrared).

4.2 Absorbância e absorção da luz

Segundo Jenkins e White (1981), existem dois aspectos importantes quando

um raio de luz passa por um meio, seja ele gasoso, líquido ou sólido. No primeiro, na

medida em que a luz penetra em um meio, a sua intensidade irá diminuir em maior

ou menor proporção. Já no segundo aspecto diz que a velocidade de propagação será

menor no meio do que no espaço livre. A absorção é o principal causa da perda de

intensidade, mas em alguns casos o espalhamento contribui ativamente.

63

Se um meio for diferente do vácuo, o raio que penetra neste meio sofrerá

perda de intensidade, amplitude de ondas e haverá absorção.

Com a lei de Beer-Lambert, pode ser definida a absorbância de um meio

através da equação 4.1:

alcA

II α−− == 1010

0

1

(4.1)

Sendo I0 o raio incidente, I1 o raio emergente, α o coeficiente de absorção, l

espessura do meio e ca a concentração de absorbância do meio.

Logo, a equação 4.2 é definida:

⎟⎟⎠

⎞⎜⎜⎝

⎛=

1

010log

IIA

(4.2)

Com o resultado obtido, a Absorbância do meio pode ser observada na

Figura 4.1.

Figura 4.1: Absorbância do meio

Jenkins e White (1981) observaram que quando a intensidade de todos os

comprimentos de onda é atenuada de maneira semelhante, a substância apresenta

64

uma absorção geral. Mas em grande parte das substâncias onde alguns comprimentos

de onda são absorvidos em relação aos outros, apresentam uma absorção seletiva.

GBC (1995) afirma que toda absorção ocorre a nível molecular. É neste

nível que as moléculas absorvem energia (luz) de determinados comprimentos de

onda. A análise espectrofotométrica tem com base a seletividade na absorção de

energia. Para obtenção de um espectro deve-se medir a quantidade de energia que é

absorvida em função do comprimento de onda, e esta energia e denominada

absorbância.

Hulst (1981) diz que a absorção é a medida da perda de luz do feixe

principal. Quando parte da luz emerge do meio para fora do eixo do raio principal,

da-se o nome de energia espalhada ou difusa. Assim a somatória da absorção e do

espalhamento será o fato da extinção de luz.

4.3 A espectroscopia no infravermelho próximo por Transformada de Fourier

(FT-NIR)

O desenvolvimento computacional trouxe o crescimento de várias técnicas

de obtenção de dados de alta resolução. Dentre estas a Espectroscopia no

Infravermelho Próximo por Transformada de Fourier (FT-NIR) evoluiu na aquisição

de dados, através das análises da radiação espectral, com desenvolvimento de estudos

e pesquisas em diversas áreas. A Transformada de Fourier foi incorporada à

tecnologia NIR com objetivo de decompor ou separar um sinal de diferentes

freqüências, com suas respectivas amplitudes.

Em meados do século XX surgem os primeiros equipamentos comerciais

que utilizavam à espectroscopia de infravermelho para o controle da concentração de

butadieno que era utilizado na síntese de borrachas sintéticas. Esses foram

desenvolvidos durante a Segunda Guerra Mundial.

A espectroscopia no infravermelho possui uma tradição de ser uma análise

que apresenta a ‘impressão digital das substâncias orgânicas’. A absorbância em uma

freqüência particular é característica de um grupo funcional presente no composto

químico. A espectroscopia no IR oferece oportunidades analíticas quase que

ilimitadas para muitas áreas de produção e controle de qualidade.

65

Dessa forma, ela vem ganhando muito espaço nos laboratórios analíticos e

em controle de qualidade dos processos industriais. Isso vem ocorrendo devido ao

baixo custo da instrumentação, à velocidade, à facilidade, à não necessidade de

tratamento da amostra, à baixa quantidade de amostras utilizadas, além de não ser

uma técnica destrutiva e de possuir alta seletividade. Ela também ocorre numa ampla

faixa de aplicações químicas e pode ser usada para determinações qualitativas e

quantitativas conforme descreve Borin (2003).

O infravermelho apresenta divisões que são: Infravermelho próximo com

comprimento de onda de 780 a 2.500 nm e com número de onda de 12.800 a 4.000

cm-1, infravermelho médio com comprimento de onda de 2.500 a 5.000 nm com

número de onda de 4.000 a 200 cm-1 e infravermelho distante com comprimento de

onda de 5.000 a 10.000 nm com número de onda de 200 a 1.000 cm-1 que podem ser

observadas em destaque na Figura 4.2 como descrito no manual da PHILIPS (1981).

Figura 4.2: Espectro Eletromagnético

Scafi e Pasquini (2005) descrevem que o desenvolvimento da

instrumentação está intimamente ligado à necessidade de se obter técnicas capazes de

determinar as propriedades da amostra de forma rápida e simultânea. Além de toda

agilidade na determinação, atualmente deseja-se que a técnica permita algum tipo de

66

classificação, isso se deve a necessidade de comprovar a autenticidade e a qualidade

do produto estudado.

De acordo com Bokobza (1998), a faixa de comprimento de radiação do

infravermelho próximo situa-se entre 780 a 2.500 nm (12.800 a 4.000 cm-1) e que

suas interações provêm de sobretons e combinações de transições associadas á níveis

energéticos vibracionais de grupos de átomos, e sua região de freqüência encontram-

se entre 3,8x1014 a 1,2x1014 hz.

Por definição, um método analítico deve apresentar características que

possibilitam: determinações diretas sem o pré-tratamento na amostra; a obtenção de

resultados em intervalos de tempo em ordem de minutos; operações a longas

distâncias o que torna o instrumento simples e de fácil transporte; verificação de

amostras sejam elas pastas, líquidas ou sólidas para observação de sua autenticidade;

uma análise não-destrutiva e em tempo real.

Os métodos espectroscópicos preenchem as atribuições acima, mas há

problemas em relação à seletividade e limites de detecção. Assim o controle de

qualidade de processo ganha com a possibilidade contribuições em novas

metodologias.

Vale salientar que os instrumentos baseados na tecnologia FT-NIR

necessitam de uma calibração e ajustes iniciais, ou seja, quando instalados pela

primeira vez no processo, ou em laboratórios, é necessário que sejam feitas amostras

e gerada uma curva de calibração e o FT-NIR aprenderá a partir desta curva

comparado com padrões laboratoriais.

4.4 A Transformada de Fourier

Jean-Baptiste Joseph Fourier estudou e desenvolveu uma transformada

integral em que sua função é expressa em termos de funções de base, onde a soma ou

integral de funções senoidais são multiplicadas por coeficientes (amplitudes).

Variações são diretamente relacionadas a esta transformada, dependendo do tipo de

função que se deseja transformar.

Os sinais eletromagnéticos são basicamente compostos por uma sucessão de

ondas de diferentes freqüências, por exemplo, um sinal Doppler (ultra-som). Um

67

sinal de ressonância nuclear magnética, o sinal de infravermelho, o sinal de rádio

freqüência são constituídos de diferentes freqüências e fases. Esses podem ser

analisados através de espectro de freqüências ou da Transformada de Fourier.

O critério de Nyquist tem uma alta relevância quanto ao uso da

transformada, pois este determina que a freqüência de amostragem (freqüência de

Nyquist) de um sinal, precisa ser no mínimo o dobro da maior freqüência presente

neste sinal.

A Equação 4.3 e 4.4 demonstram a Transformada de Fourier de uma função

f(x) e a transformada inversa respectivamente:

( )[ ] ( ) ( ) dxexfwFxfF tjwx

x−∞

∞−∫=≡ (4.3)

( )[ ] ( ) ( ) xxwi

xx dwewFxfwFF xπ

π21

21 −∞

∞−

− ∫=≡(4.4)

Onde wx = 2πfx é a freqüência angular é dada em rd/seg, e j= 1− .

Para que uma função da Transformada de Fourier seja integrável e finita,

esta deve obedecer a seguinte Equação 4.5:

∫∞

∞−∞<dxxf |)(|

(4.5)

A da Transformada de Fourier associada à espectroscopia nos traz novas

maneiras de identificação de variáveis de processo como exemplo a Transformada de

Fourier - Infravermelho Próximo (FT-NIR -Fourier transform Near infrared).

As técnicas para análises quantitativas surgem com o avanço da

espectroscopia NIR. Isso ocorre com a combinação da Transformada de Fourier e a

geometria empregada pelos espectrofotômetros que utilizam o interferômetro de

Michelson comenta Eikrem (1990). As análises de Fourier possibilitam uma

interpretação das informações extraídas da tecnologia NIR.

68

4.5 Técnicas de pré-tratamento matemático empregadas ao FT-NIR

A interpretação dos dados gerados (espectros de freqüência) pelo FT-NIR

requer a utilização de métodos multivariados. Estes métodos são utilizados para

tradução de informações de difícil avaliação, para dados com menor

dimensionalidade e de mais fácil manipulação.

A relação matemática (modelo de calibração) entre os valores químicos e os

dados espectrais vem sendo analisada pela regressão por mínimos quadrados parciais

(PLS), que são pré-tratamentos matemáticos aplicados aos dados espectrais como

descrito por Morgano et al. (2007).

Outro método muito empregado na análise dos espectros NIR é a Análise de

Componentes Principais (PCA) que consiste na projeção dos dados originais de

grande dimensão espacial para dimensões menores. Seu objetivo é transformar dados

complexos para que as informações mais importantes e relevantes se tornem mais

fáceis de visualizar.

Neste trabalho foi utilizado o PCA seguindo o critério do “diagrama de

autovalores” para determinação dos componentes principais que representam as

informações analisadas pelo FT-NIR, como apresentado no capítulo 3.

4.6 Aplicações em indústrias de celulose e papel

Várias aplicações do Infravermelho Próximo por Transformada de

Fourier têm surgido nos diferentes seguimentos na indústria. De acordo com Gomes

(2007) a aplicação da espectroscopia no infravermelho próximo vem crescendo ao

longo dos anos na medição de varáveis nas indústrias. Principalmente nas indústrias

de Papel e Celulose, Petroquímica, Álcool, Açúcar, entre outras.

Caldeira et al. (2007) descrevem as aplicações do NIR na indústria de papel

e celulose para medição de teor de umidade e densidade básica em amostras de

cavacos. Obter uma resposta rápida sobre a composição dos cavacos de madeira faz

com que a qualidade do produto final (celulose) seja garantida. Para isto, foi

instalado para testes na linha produtiva da VCP, um equipamento Direct-LigthTM

69

System 6.500 para obter de informações on line sobre a densidade e o teor seco dos

cavacos. Estes testes mostraram que a tecnologia FT-NIR, pode ser utilizada também

on line.

Os benefícios com o uso desta técnica permitem a indústria melhorar o

controle do consumo específico de madeira, reduzir a variabilidade do #Kappa,

controlar e reduzir na carga de álcali ativo dosada no digestor. Também obter

resultados do teor seco e densidade básica dos cavacos, antes do processar a madeira

no processo de produção de celulose.

Algumas das variáveis que são analisadas pelo NIR na indústria de celulose

e papel:

• Teor de umidade de cavacos de madeira;

• Densidade básica da madeira;

• Teor de álcali dos licores banco e verde;

• Lignina contida nos cavacos de madeira;

• Ácidos hexenurônicos (AHex´s6);

• Viscosidade na polpa celulósica.

De acordo com Cohn & Ribeiro (2002) as variáveis medidas pelo NIR

apresentam uma taxa de correlação linear maior do que 0,9 comparando com

medições laboratoriais. E ainda existem outras variáveis que podem ser medidas com

o auxílio do NIR na indústria de papel e celulose, por exemplo: A medição do teor de

lignina dos ácidos hexenurônicos (AHex´s), viscosidade na polpa celulósica, essas

são utilizadas no processo de branqueamento da polpa Kraft CaldeiraA et al. (2007).

Baseado nestes princípios, a espectroscopia no Infravermelho Próximo por

Transformada de Fourier (FT-NIR) passou a ser uma técnica muito utilizada para

várias análises laboratoriais de variáveis dos processos industriais (COHN e

RIBEIRO, 2002); (BORIN, 2003); (CIENFUEGOS, 2003); (PASQUINI, 2003);

(KARLSSON, 2006) e (CALDEIRA et al., 2007).

Gomes (2007) relaciona as principais aplicações desta tecnologia nos

demais segmentos industriais.

6 Ácidos Hexenurônicos: durante cozimentos Kraft, os grupos ácidos 4-O-metilglucurônicos, das cadeias laterais da xilana, são convertidos para ácidos Hexenurônicos (A HEX). Madeiras como Eucaliptos são grandes fontes destes ácidos, devido ao seu teor de xilanas.

70

4.7 Conclusões

A espectroscopia de infravermelho próximo (NIR) tem sido utilizada para

medição de diversas variáveis industriais e se apresenta como uma importante

ferramenta para medição de variáveis de difícil medição, com boas perspectivas na

realização de análises em tempo real.

Esta se apresenta como uma tecnologia em ascensão, em função das

diversas aplicações em desenvolvimento nos diversos ramos da indústria.

71

5 REDES NEURAIS ARTIFICIAIS (RNA)

5.1 Introdução

De acordo com Haykin (2001) uma rede neural é um processador

paralelamente distribuído constituído de unidades de processamento simples, que

têm a propensão natural para armazenar conhecimento experimental e torná-lo

disponível para uso futuro. Ela se assemelha ao cérebro em dois aspectos:

• o conhecimento é adquirido pela rede a partir de seu ambiente através de um

processo de aprendizagem;

• forças de conexão entre neurônios, conhecidas como pesos sinápticos, são

utilizadas para armazenar o conhecimento adquirido.

Segundo Braga et al. (2000) as RNAs são sistemas paralelos distribuídos

compostos por unidades de processamento simples (nós) que calculam determinadas

funções matemáticas (normalmente não-lineares). Tais unidades são dispostas em

uma ou mais camadas e interligadas por um grande número de conexões, geralmente

unidirecionais.

Na maioria dos modelos estas conexões estão associadas a pesos, os quais

armazenam o conhecimento representado no modelo e servem para ponderar a

entrada recebida por cada neurônio da rede. O funcionamento destas redes é

inspirado em uma estrutura física do cérebro humano.

As RNAs têm sido utilizadas para solução de vários problemas

computacionais e pode-se afirmar que esta utilização se dá em função das seguintes

propriedades:

• não-linearidade;

• mapeamento de entrada;

• adaptabilidade;

• generalização.

As RNAs são capazes de solucionar problemas mais complexos em função

de sua característica natural e do paralelismo interno inerente de sua arquitetura. Por

isto, apresentam possibilidade de maior desempenho comparada com os modelos

72

convencionais. A solução de problemas utilizando RNAs, passam pelos

procedimentos:

• inicialmente é apresentado o problema (os dados de entrada);

• a RNA extrai automaticamente as características destas informações;

• aprendem com estas informações e sugerem um resultado.

A capacidade de reconhecer padrões não apresentados à RNA no período de

treinamento é denominada capacidade de generalização e é uma característica

importante para estes modelos. De acordo com Figueirêdo (2006) as RNAs são

capazes de extrair informações não apresentadas de forma explícita através de

exemplos. Assim, são capazes de atuar como mapeadores universais de funções

multivariáveis.

As RNAs também possuem a capacidade de auto-organização e de

processamento temporal, que associado às demais características, as transformam em

uma ferramenta extremamente atraente e poderosa na solução de problemas

complexos. Especialmente no ramo industrial, vários autores têm utilizado destas

técnicas (Ge , et al., 1998); (LEMMETI et al., 1998); (KASPARIAN, 1998);

(PREMIER et al., 1999); (HAYKIN, 2001); (AGUIAR & FILHO, 2001); (YU &

GOMM, 2003); (LAPERRIÈRE et al., 2004); (DUFOUR et al., 2005);

(MALMBERG, et al., 2005); (COSTA, et al., 2005); (RUBINI & YAMAMOYO,

2006); (FIGUEIRÊDO, 2006) e (BARBER & SCOTT, 2007).

5.2 Modelo de um neurônio artificial

De acordo com Haykin (2001) um neurônio é uma unidade de processamento

de informação que é fundamental para a operação de uma RNA. A descrição do

modelo do neurônio proposto por McCulloch e Pitts (1969) resultou em um modelo

com n terminais de entrada x1, x2,...,xn (que representam os dendritos) e apenas um

terminal de saída y (representando o axônio). Para emular o comportamento das

sinapses, os terminais de entrada do neurônio têm pesos acoplados wk1, wk2, ...,wkm

cujos valores podem ser positivos ou negativos. O efeito de uma sinapse particular i

no neurônio é dado por xiwi. Os pesos determinam em que grau o neurônio deve

73

considerar sinais de disparo que ocorrem naquela conexão. Uma descrição do

neurônio artificial é mostrada na Figura 5.1.

Bias

Figura 5.1: Modelo de um neurônio artificial

Neste modelo não-linear (Figura 5.1), podem ser identificados três

elementos básicos:

• Sinapses: ou conexão de entrada, caracterizadas por pesos ou forças próprias.

Um sinal xj na entrada da sinapse j, conectada ao neurônio k é multiplicado pelo

peso sináptico wkj;

• Junção aditiva: responsável pela soma ponderada dos sinais de entrada;

• Função de ativação: restringe a amplitude da saída de um neurônio, limita o

intervalo permissível de amplitude do sinal de saída. Podem ser do tipo linear e

não-linear. Tipicamente o intervalo normalizado da amplitude da saída de um

neurônio é escrito como o intervalo unitário fechado [0, 1] ou alternativamente [-

1, 1].

O modelo neuronal apresentado na Figura 5.1 inclui também um bias

aplicado externamente, representado por bk. O bias tem o efeito de aumentar (se

bk>0), ou diminuir (se bk<0) a entrada líquida da função de ativação.

Em termos matemáticos, pode-se descrever um neurônio ‘k’ escrevendo o

seguinte par de equações (5.1) e (5.2):

j

m

jkjk xwv ∑

=

=1

(5.1)

Σ

wk1

wk2

wknxn

x2

x1

bk

Função de ativação

( )⋅ϕ vkSinais

de entrada Saída

M M ykJunção aditiva

Pesos sinápticos

74

( )kkk bvy +=ϕ (5.2)

Onde x1, x2,...,xn são os sinais de entrada; wk1, wk2, ..., wkn são os pesos sinápticos do

neurônio k; vk é a saída do combinador linear devido aos sinais de entrada; bk é o

bias; ( )⋅ϕ é a função de ativação; e yk é o sinal de saída do neurônio.

5.3 Função de ativação

A função de ativação ( )⋅ϕ é responsável pela definição da saída do neurônio

em função de seu nível interno de ativação vk. Os tipos de função de ativação mais

utilizadas são:

• Função limiar: ilustrada na Figura 5.2(a). A saída no neurônio é dada

pela Equação 5.3.

( )⎭⎬⎫

⎩⎨⎧

<≥+

=0 para 0,0 para,1

vv

vϕ (5.3)

• Função linear: ilustrada na Figura 5.2(b). A saída no neurônio é dada

pela Equação 5.4.

( ) vv αϕ = (5.4)

Sendo α um número real que define a saída linear para os valores de v .

• Função linear por partes: ilustrada na Figura 5.2(c). A saída no neurônio

é dada pela Equação 5.5.

( )⎪⎭

⎪⎬

⎫

⎪⎩

⎪⎨

⎧

≤<<

≥+=

0 para 0,10 para ,

1 para,1

vvu

vvϕ (5.5)

• Função sigmoidal logística: a saída no neurônio é dada pela Equação 5.6.

75

( ) kvev /1

1−+

=ϕ (5.6)

• Função sigmoidal tangente hiperbólica: ilustrada na Figura 5.2(d). A

saída no neurônio é dada pela Equação 5.7.

( ) v

v

eev 2

2

11

−

−

+−

=ϕ (5.7)

Figura 5.2: Funcões de ativação: (a) Função limiar, (b) Função linear, (c) Função Linear

por partes, (d) Função Sigmoidal tangente hiperbólica. Teixeira (2005)

Gama (2006) afirma que a função de ativação sigmoidal é a mais utilizada

em RNAs do tipo MLP (Multilayer Perceptron) pois é a que mais se aproxima de um

neurônio biológico.

5.4 Arquitetura das RNAs

Segundo Haykin (2001) a arquitetura é uma maneira pela qual os neurônios

de uma RNA estão estruturados e a definição da arquitetura é de grande importância

76

na sua concepção, uma vez que ela restringe o tipo de problema que pode ser tratado

pela RNA. Podem-se identificar três tipos de arquitetura:

• redes alimentadas adiante (feedforward) de uma única camada;

• redes alimentadas adiante de múltiplas camadas (Multilayer

Feedforward Networks);

• redes recorrentes.

Redes com uma única camada de nós só conseguem resolver problemas

linearmente separáveis. Redes recorrentes, por sua vez, são mais apropriadas para

resolver problemas que envolvem processamento temporal. Fazem parte da definição

da arquitetura os seguintes parâmetros: número de camadas da rede, número de nós

da camada escondida, tipo de conexão entre os nós e a topologia da rede.

As RNAs de uma única camada possuem uma camada de entrada contendo

nós fonte e uma única camada de saída, com nós computacionais. A camada de

entrada não é considerada no número de camadas pelo fato dos neurônios de entradas

serem especiais, cuja função é distribuir cada uma das entradas da rede (sem

modificá-las) a todos os neurônios da camada seguinte. A Figura 5.3 ilustra as redes

feedforward de uma única camada.

Figura 5.3: Rede alimentada adiante com uma única camada de neurônios,Haykin (2001)

As RNAs alimentadas adiante de múltiplas camadas diferem-se pela presença

de uma ou mais camadas intermediárias. A função dos neurônios da camada

escondida é extrair as estatísticas de ordem elevada (HAYKIN, 2001, p.183). Uma

Camadas de saídas de neurônios

Camadas de entrada de neurônios fonte

77

RNA é dita totalmente conectada quando cada um dos nós de uma camada da rede

está conectado a todos os nós da camada adjacente seguinte. Entretanto, se alguns

dos elos de comunicação (conexões sinápticas) estiverem faltando na rede, pode-se

dizer que ela está parcialmente conectada. A Figura 5.4 mostra um exemplo de RNA

alimentada adiante, com duas camadas totalmente conectadas. As RNAs alimentadas

adiante com múltiplas camadas (Multilayer Feedforward Networks) comumente

denominadas de MLP (Multilayer Perceptron), são as redes mais difundidas na

literatura e que serão utilizadas neste trabalho.

Camada de entrada de nós

fonte

Camada de neurônios

ocultos

Camada de neurônios de

saída

Figura 5.4: Rede alimentada adiante totalmente conectada com uma camada oculta

Haykin (2001)

5.5 Projeto de uma RNA

Segundo Haykin (2001) o projeto de uma RNA passa pelas seguintes etapas:

• seleção da arquitetura com definição da quantidade de nós de entrada,

nós escondidos e nós de saída;

• treinamento da RNA a partir de um conjunto de dados do processo;

• validação da rede treinada a partir da avaliação das respostas da rede

mediante a apresentação de dados não utilizados durante o treinamento,

ou seja, avaliação de sua capacidade de generalização.

78

5.6 Aprendizado supervisionado

As propriedades de uma RNA de fundamental importância são: a habilidade

de aprender a partir de seu ambiente e a habilidade de melhorar o seu desempenho

através da aprendizagem. Uma rede neural aprende acerca de seu ambiente através de

um processo iterativo de ajustes aplicados a seus pesos sinápticos e níveis de bias.

Idealmente, a rede se torna mais instruída sobre o seu ambiente após cada iteração do

processo de aprendizagem. Uma definição de aprendizagem no contexto das redes

neurais foi expressa por Haykin (2001): “Aprendizagem é um processo pelo qual, os

parâmetros livres de uma rede neural são adaptados através de um processo de

estimulação pelo ambiente no qual a rede está inserida. O tipo de aprendizagem é

determinado pela maneira pela qual a modificação dos parâmetros ocorre”. Esta

definição do processo de aprendizagem implica na seqüência de eventos:

• a rede neural é estimulada pelo ambiente;

• a rede neural sofre modificações nos seus parâmetros livres como

resultado desta estimulação;

• a rede neural responde de uma maneira nova ao ambiente, devido às

modificações ocorridas na sua estrutura interna.

De acordo com Braga et al. (2000) diversos métodos desenvolvidos para

treinamento de RNAs podem ser agrupados em dois paradigmas principais:

aprendizado supervisionado e aprendizado não supervisionado.

O método mais comum de aprendizado utilizado no treinamento de RNAs é

o aprendizado supervisionado (Figura 5.5), esta metodologia possui esse nome

porque as entradas e saídas desejadas para a rede são fornecidas por um supervisor

(professor) externo. O objetivo é ajustar os parâmetros da rede de forma a encontrar

uma ligação entre os pares de entrada e saída.

79

Vetor descrevendo o estado do ambiente

Figura 5.5: Método de aprendizagem supervisionada com professor (HAYKIN, 2001)

As Figuras 5.6 e 5.7 ilustram o mecanismo de aprendizado supervisionado.

A rede tem sua saída calculada comparada com a saída desejada, sendo então

calculado o erro da resposta atual. A cada padrão de entrada submetido à rede,

compara-se a resposta desejada com a resposta calculada ajustando-se os pesos das

conexões para minimizar o erro. A minimização da diferença é incremental já que

pequenos ajustes são feitos nos pesos a cada etapa de treinamento de tal forma que

estes caminhem para uma solução, se houver. A soma dos erros quadráticos de todas

as saídas é normalmente utilizada como medida de desempenho da rede e também

como função de custo a ser minimizada pelo algoritmo de treinamento.

Figura 5.6: Método de aprendizagem por correção de erros, grafo de fluxo de sinal,

(HAYKIN, 2001)

Resposta desejada

Ambiente

Σ -

Professor

Sistema de aprendizagem

+Resposta Real

Sinal de erro

)(nyk

)(1 nx

)(2 nx

)(nx j

)(nxm

)(nx)(nvk

1−)(⋅ϕ

)(nek

)(ndk

)(1 nwk

)(2 nwk

M

M

)(nwkj

)(nwkm

80

Vetor de

Figura 5.7: Diagrama em blocos de uma RNA, resultando em um único neurônio na camada

de saída, (HAYKIN, 2001)

Os exemplos mais conhecidos de algoritmos para aprendizado

supervisionado são: a regra delta proposta por Wildrow & Hoff (1960) e a sua

generalização para redes de múltiplas camadas, o algoritmo backpropagation

desenvolvido por Rumelhart et al. (1986).

A adaptação por correção de erros procura minimizar a diferença entre a

saída calculada pela rede e a saída desejada, ou seja, o erro da resposta atual da rede.

O termo do erro deve ser escrito como mostrado na Equação 5.8. ( )nek

( ) ( ) ( )nyndne kkk −= (5.8)

Onde é a saída desejada e ( )ndk ( )nyk é a resposta atual calculada pela rede no

intente de tempo t. A forma genérica para alteração dos pesos por correção de erros é

apresentada na Equação 5.9:

( ) ( ) ( ) ( )txtetwtw iii η+=+1 (5.9)

Onde η é a taxa de aprendizado e xi(t) é a entrada para o neurônio i no tempo t.

De acordo com Equação 5.9, o ajuste dos pesos deve ser proporcional ao

produto do erro pelo valor de entrada naquele instante do tempo.

dk(n)

ΣNeurônio de

saída k

yk(n) x(n)

ek(n) Rede de múltiplas camadas

alimentada adiante

entrada Uma ou mais camadas de

neurônios oculto - +

81

5.7 Algoritmo de treinamento Back-propagation

O algoritmo back-propagation é o mais utilizado no treinamento de RNAs

de multicamadas do tipo MLP com uma ou mais camadas escondidas. Este algoritmo

foi proposto por Rumelhart et al. (1986) e citado por Haykin (2001).

O algoritmo de retropropagação de erro, ou simplesmente retropropagação

(back-propagation), utiliza pares de entrada/saída desejada para ajustar os pesos da

RNA, por meio de um mecanismo de correção de erro.

O treinamento através do algoritmo back-propagation ocorre de duas

formas:

• fase de propagação: é utilizada para definir a saída da rede para um dado

padrão de entrada, mantendo os pesos sinapticos fixos. O fluxo segue no

sentido entrada/saída;

• fase de retropropagação: esta fase utiliza a saída desejada e a saída

calculada pela RNA na fase de propagação, para ajustes dos pesos das

conexões da rede. O fluxo de sinal de erro é inverso ao fluxo na fase de

propagação.

O cálculo dos ajustes dos pesos pelo algoritmo de retropropagação do erro é

dado pelas seguintes relações:

1. Cálculo da correção dos pesos, pela regra delta proposta por WILDROW e

HOFF (1960) é mostrada na Equação 5.10.

( ) ( ) )(nynnw iiji ηδ=∆ (5.10)

Sendo:

( )nw ji∆

Correção no peso do neurônio j na iteração n;

η Taxa de aprendizagem;

( )niδ Gradiente local do neurônio j na iteração n;

)(nyi Sinal de entrada i do neurônio j na iteração n;

82

2. Cálculo do gradiente local, Equação 5.11:

• para um neurônio j na camada de saída;

( ) ( ) ))((' nvnen jjj ϕδ = (5.11)

Sendo o erro entre a entrada e saída do neurônio j e a saída desejada

da iteraçao n, é a derivada da função de ativação do neurônio j em

relação a saída linear do neurônio, , na iteração n.

( )nej

))((' nv jϕ

)(nv j

• para um neurônio j na camada intermediária, Equação 5.12;

( ) )()())((' nwnnvn kjk

kjj ∑= δϕδ (5.12)

Sendo a derivada da função de ativação do neurônio j em relação a saída

linear do neurônio na iteração n e

))((' nv jϕ

)()( nwn kjk

k∑δ é a soma ponderada dos gradientes

locais da camada seguinte na iteração n.

Como aparece o termo nas Equações 5.11 e 5.12 do cálculo do

gradiente local, isso significa que as funções de ativação utilizadas em uma RNA do

tipo MLP devem ser diferenciáveis.

))((' nv jϕ

5.7.1 Função de ativação

O cálculo do δ (gradiente local) para cada neurônio do perceptron de

múltiplas camadas requer o conhecimento da função de ativação )(⋅ϕ associada

aquele neurônio. Para que haja esta derivação necessita-se que a função )(⋅ϕ seja

contínua (HAYKIN, 2001, p.195). Em termos básicos, a diferenciabilidade é uma

única exigência que a função de ativação deve satisfazer. Um exemplo de uma

função de ativação não-linear, continuamente diferenciável normalmente utilizada

nos perceptrons de múltiplas camadas é a não-linearidade sigmóide; descreve-se duas

83

formas desta função:

• função logística;

• função tangente hiperbólica.

5.7.2 Taxa de aprendizagem

O algoritmo back-propagation fornece uma “aproximação” para a trajetória

no espaço de pesos calculada pelo método da descida mais íngreme. Quanto menor

for o parâmetro da taxa de aprendizagem η , menor serão as variações dos pesos

sinápticos da rede, de uma iteração para a outra e mais suave será a trajetória no

espaço de pesos (HAYKIN, 2001, p.196). Por outro lado, se fizermos o parâmetro da

taxa de aprendizagem

w∆

η muito grande para acelerar a taxa de aprendizagem, as

grandes alterações nos pesos sinápticos resultantes podem tornar a rede instável

(oscilatória).

Um método simples para aumentar a taxa de aprendizagem, evitando o

perigo da instabilidade, é alterar a “regra delta generalizada” mostrada na Equação

5.13, incluindo um termo de momento como mostrado por Rumelhart et al. (1986):

( ) ( ) )()(1 nynnwnw ijjiji ηδα +−∆=∆ (5.13)

Sendo α um número positivo chamado de constante de momento, ele controla o laço

de realimentação que age em torno de ( )nwji∆ .

A equação 5.13 é chamada de regra delta generalizada.

5.7.3 Modos de treinamento seqüencial e por lote

É chamado de época a apresentação de todos os padrões do conjunto de

treinamento à rede. De acordo com Haykin (2001), para um dado conjunto de

treinamento, o algoritmo back-propagation pode ser executado de dois modos

distintos.

84

• modo seqüencial que é também de modo on-line, no qual o ajuste de

pesos é realizado após a apresentação de cada padrão à rede. Neste

modo, considerando um conjunto de treinamento com m padrões, ao

final de uma época terão sido realizados m ajustes nos pesos;

• modo por lote ou batelada que é também chamado modo batch, no qual

o ajuste de pesos é realizado após a apresentação de todos os padrões à

rede. Ainda considerando um conjunto de treinamento com m padrões,

ao final de uma época será realizado apenas um ajuste nos pesos, porém

este ajuste considera os erros obtidos em todos os padrões.

5.7.4 Critérios de parada

Haykin (2001) descreve que não existe critérios de parada bem formalizados

para o algoritmo back-propagation, mas sim, critérios de parada razoáveis do ponto

de vista prático e que são normalmente empregados. Alguns dos critérios são:

• pelo valor da norma euclidiana do vetor gradiente: o algoritmo converge

quando a norma euclidiana do vetor gradiente atinge um limiar

especificado;

• pelo valor da taxa de variação do erro médio quadrático: o algoritmo

converge quando a taxa de variação do erro médio quadrático por época

for suficientemente pequena;

• pela capacidade de generalização da rede: neste caso deve ser usado um

conjunto de padrões, segregado do conjunto total de padrões, para

validação.

5.8 Redes de múltiplas camadas (MLP)

As redes neurais de uma só camada resolvem apenas problemas linearmente

separáveis. A solução de problemas não linearmente separáveis passa pelo uso de

redes com uma ou mais camadas intermediárias, ou escondidas. Segundo Cybenko

(1989) uma rede com uma camada intermediária pode implementar qualquer função

85

contínua. A utilização de duas camadas intermediárias permite a aproximação de

qualquer função.

As redes com múltiplas camadas são conhecidas como MLPs (Multilayer

Perceptron) e apresentam um poder computacional muito maior do que aquele de

uma rede sem camada intermediária. A precisão obtida e a implementação da função

objetivo dependem do número de nós utilizados nas camadas intermediárias.

A Figura 5.8 mostra o grafo arquitetural de uma MLP com duas camadas

ocultas e uma camada de saída. A rede aqui representada é totalmente conectada. Isto

significa que um neurônio em qualquer camada da rede está conectado a todos os

neurônios da camada anterior. O fluxo do sinal através da rede progride para frente,

da esquerda para a direita e de camada em camada.

Figura 5.8 Rede MLP típica com duas camadas intermediárias, Haykin, 2001

Em uma rede MLP o processamento realizado por cada nó é definido pela

combinação dos processamentos realizados pelos nodos da camada anterior que estão

conectados a ele. Quando se segue da primeira camada intermediária em direção a

camada de saída, as funções implementadas se tornam cada vez mais complexas

(FIGUEIRÊDO, 2006, p.72).

O número de nós nas camadas intermediárias é em geral definido

empiricamente. Este número depende fortemente da distribuição dos padrões de

treinamento e validação da rede.

Conexões

Camadas Intermediárias

Camadas de Camada de Entrada Saída

86

De acordo com Braga et al. (2000) o número de neurônios na camada

intermediária depende dos fatores:

• número de amostras de treinamento;

• quantidade de ruído presente nos exemplos;

• complexidade da função a ser aprendida;

• distribuição estatística dos dados de treinamento.

Existem problemas que necessitam apenas de uma unidade de entrada e de

uma unidade de saída, e outros que podem precisar de várias unidades

intermediárias. O número de unidades intermediárias pode também, em alguns casos,

crescer exponencialmente com o número de entradas. A solução neural mais

eficiente é aquela em que o número de unidades cresce apenas proporcionalmente

com o aumento do número de unidades de entrada.

Para a solução de problemas práticos de reconhecimento de padrões, aloca-

se para a rede um número de unidades intermediárias suficientes para a solução do

problema. Deve-se ter cuidado para não utilizar unidades demais, o que pode levar a

rede a memorizar os padrões de treinamento, em vez de extrair características gerais

que permitirão a generalização ou o reconhecimento de padrões não vistos durante o

treinamento (overfitting), nem um número muito pequeno, que pode forçar a rede a

gastar tempo em excesso tentando encontrar uma representação ótima, sem

apresentar convergência durante o treinamento (underfitting).

5.9 Métodos de primeira e segunda ordem

Como mostrado por Haykin (2001) no desenvolvimento do algoritmo back-

propagation, o treinamento de redes neurais de multicamadas é um problema de

otimização não-linear de uma função de custo, que mede o erro quadrático médio

calculado pela saída da rede neural frente a uma saída desejada.

A literatura mostra vários métodos de otimização não-lineares que podem

ser aplicados ao problema de treinamento de redes neurais para minimização do erro.

O algoritmo back-propagation é uma implementação baseada no método do

gradiente, em que o vetor de parâmetros (pesos) é ajustado na direção oposta ao do

87

vetor gradiente. Este método é classificado como um método indireto de primeira

ordem já que utiliza apenas a informação do gradiente (primeira derivada) da função

de custo para o ajuste dos pesos da rede.

Os métodos de primeira ordem são conhecidos pela baixa eficiência no

tratamento de problemas de larga escala, pois apresentam taxas de convergência

muito pobres, especialmente em regiões próximas a mínimos locais descrito por

Iyoda (2000). Do ponto de vista da direção de busca, o método do gradiente pode ser

interpretado como sendo ortogonal a uma aproximação linear da função de custo em

determinado ponto descrevem Edgar e Himmelblau (1988).

Nos métodos indiretos de segunda ordem, além do vetor gradiente da função

objetivo, faz-se também o uso da matriz Hessiana (matriz de derivadas de segunda

ordem) da função erro. Na literatura referente a otimização não-linear, uma classe de

algoritmos de segunda ordem é apontada como apropriada para problemas de larga

escala afirma Silva (1998). De acordo com Takahashi (2006) apesar de notadamente

superiores aos métodos de primeira ordem, os métodos de segunda ordem também

apresentam desvantagens, sendo a principal delas o alto custo computacional

associado ao cálculo e armazenamento da matriz Hessiana.

Jones et al. (2005) descreve que um dos algoritmos de segunda ordem mais

rápidos para o treinamento de RNAs de tamanho moderado é o algoritmo proposto

por Levenberg Marquardt, uma variação do método de Newton que aproxima

localmente a superfície de erro por uma função quadrática, mas que simplifica o

cálculo da matriz Hessiana usando apenas a matriz Jacobiana (Matriz de derivadas de

primeira ordem com relação aos pesos e termos de polarização da RNA).

5.10 Generalização em uma RNA

Capacidade de generalização em RNA é a capacidade desta, devidamente

treinada, responder coerentemente a padrões desconhecidos. Ao termo “padrões

desconhecidos” fica subentendido que seja um conjunto de padrões extraído da

mesma população dos conjuntos de dados de treinamento, ou seja, dados com

mesmas características estatísticas dos padrões de treinamento.

88

Segundo Teixeira (2001) a capacidade de generalização não é uma

propriedade inerente às RNAs, ou seja, ela não é facilmente obtida simplesmente

submetendo a rede à fase de treinamento. Braga et al. (2000) descrevem que alguns

fatores devem ser levados em consideração para se obter uma RNA com elevada

capacidade de generalização e basicamente esta generalização sofre a influências:

• do tamanho e representatividade estatística do conjunto de dados de

treinamento;

• da arquitetura da rede neural;

• da complexidade fisica do problema abordado.

Não existe uma regra para escolher o tamanho do conjunto de treinamento.

Cada problema abordado requer uma quantidade de amostras capaz de representá-lo.

Este parâmetro não é de simples estimativa dado que o domínio do problema nem

sempre é conhecido a priori.

A escolha da arquitetura do modelo neural adequada à complexidade do

problema é um dos maiores desafios no estudo da capacidade de generalização.

Modelos com arquiteturas muito grandes elevam sua complexidade. Quando a

complexidade do modelo é maior que a necessária para modelar o problema, a rede

tende a ficar super-ajustada aos dados de treinamento, respondendo inadequadamente

aos padrões de validação e testes.

Este fenômeno de super-ajuste do modelo aos dados de treinamento é

comumente chamado de overfitting e, reduz a capacidade de um modelo generalizar.

Porém, se a complexidade do problema supera a complexidade do modelo, este não é

capaz de descrever e representar o domínio do problema, caracterizando assim o

fenômeno de sub-ajuste ou underfitting. A Figura 5.9 ilustra o que pode ocorrer com

o erro de generalização quando sob os efeitos de sub ajuste e super ajuste aos dados e

treinamento.

Nas Figuras 5.9a, b e c, a função geradora é uma senóide que varia de 0 a 2π

que foi contaminada por um ruído de média 0 e desvio padrão 1. Apenas os pontos

nas figuras foram submetidos às RNAs para treinamento.

A Figura 5.9(a) mostra uma RNA que não foi capaz de modelar toda a

complexidade do problema, gerando um modelo neural pobre em termos de

generalização. Já na Figura 5.9(c) o modelo neural criado superou a complexidade da

89

função geradora, passando a modelar o ruído presente nos dados, ficando também

mal ajustado à função geradora. Apenas na Figura 5.9(b) o ajuste do modelo está

compatível com a complexidade do problema e nota-se que a RNA buscou modelar a

função geradora.

(5.9a) Underfitting

(5.9b) Ajuste Adequado

(5.9c) Overerfitting

Figura 5.9: Problema de ajuste do modelo – ( HAYKIN, 2001)

Braga et al. (2000), Teixeira (2001) e Takahashi (2006), afirmam que os

fenômenos de underfitting e overfitting afetam a capacidade de generalização das

RNAs e buscar um equilíbrio pode ser uma tarefa árdua. Esses fenômenos sofrem

influências pelo tamanho do conjunto de treinamento, pelo número de épocas de

treinamento, e também pelo número de parâmetros livres (pesos) da RNA.

De acordo com Haykin (2001) uma RNA que é projetada para generalizar

bem, produzirá um mapeamento correto de entrada - saída mesmo quando as

entradas forem um pouco diferentes dos exemplos utilizados para o treinamento da

rede. Se uma rede é treinada em excesso, ela perde a habilidade de generalizar entre

padrões de entrada – saída similares.

5.11 Early Stopping (parada antecipada)

O método de treinamento com parada antecipada (Early Stopping) é uma

técnica de treinamento baseada na divisão dos padrões em pelo menos dois conjuntos

distintos de dados, mas com mesma representatividade estatística. Estes conjuntos

são chamados normalmente de conjuntos de treinamento e de validação que após um

90

período de estimação (treinamento) os pesos sinápticos e os níveis dos bias, do

perceptron de múltiplas camadas são todos fixos e a rede opera no seu modo direto

para frente. O erro de validação é então medido por cada exemplo do subconjunto de

validação. Quando a fase de validação é completada, a estimação (treinamento) é

reiniciada para um novo período e o processo é repetido.

O erro de treinamento deve ser monotonicamente decrescente a partir do

início do treinamento, que deve ser interrompido no momento que este erro começa a

crescer com os padrões de validação, embora o erro de treinamento ainda seja

decrescente (TAKAHASHI, 2006, p.27). Esta sintonia indica que o treinamento está

levando a rede a uma condição de sobre ajuste e para evitá-lo o treinamento é

interrompido e os parâmetros da RNA na época anterior são considerados como os

parâmetros finais obtidos com o treinamento.

A Figura 5.10 mostra o comportamento dos erros de treinamento e de

validação com dados ruidosos. Teixeira (2006) comenta que o processo de

treinamento pode ser dividido em duas partes. Na primeira parte, caracterizada pelo

início do treinamento até o ponto de mínimo da curva erro de validação, a rede se

adapta somente às características principais dos dados, ou seja, aprende a função

geradora. Na segunda parte, na medida em que o treinamento prossegue o ruído

também começa a ser mapeado pela rede.

Erro de ValidaçãoErro de Treinamento

Err

o

Épocas

Figura 5.10: Comportamento dos erros de treinamento e validação para uma RNA –

(HAYKIN, 2001, p.243)

91

5.12 Conclusões

Este capítulo exibiu os conceitos fundamentais de um sistema de

processamento paralelo distribuído denominado redes neurais artificiais. De acordo

com a literatura estudada a inteligência artificial tem se mostrado uma ótima

ferramenta para solução de problemas lineares e não-lineares.

As redes neurais têm se mostrado uma poderosa ferramenta no

desenvolvimento de modelos baseados na modelagem empírica e apresentam uma

boa capacidade de representar as não linearidades dos processos industriais.

Assim como todo sistema, os modelos baseados em RNAs possuem

vantagens e desvantagens, mas é uma ferramenta que tem tido uma vasta utilização

pela diversidade em suas aplicações.

Sua fácil utilização e sua baixa sensibilidade a ruídos tornam-nas mais

flexíveis que os modelos convencionais para lidar com a solução de problemas.

92

6 METODOLOGIA E RESULTADOS

6.1 Introdução

De acrdo com Pasquini et al. (2007) a demanda por resultados analíticos,

que são empregados na definição da qualidade da madeira que se destina a produção

de celulose e papel, tem aumentado continuamente. Alguns fatores influenciam esta

demanda. São eles:

• A preocupação constante com a qualidade da matéria prima que chega ao

pátio de cavacos e é destinada ao processo produtivo;

• As pesquisas de melhoria genética associada à necessidade de clones cada

vez mais perfeitos;

• E os critérios de segregação separando a madeira por diferentes

características próprias.

A busca de técnica para aprimoramento da qualidade da madeira que chega

ao processo de cozimento tem gerado um número elevado de pesquisas, não só no

âmbito do desenvolvimento genético, mas também com a utilização de técnicas de

espectroscopia no infravermelho próximo (PASQUINI et al., 2007). Este é um

método rápido, não destrutivo e que demanda pouca quantidade de amostras, as quais

precisam ser submetidos a procedimentos mínimos e rápidos de pré-tratamento.

Em testes realizados no laboratório da Cenibra, foram analisadas várias

amostras de cavacos de diferentes clones e diferentes regiões e em datas distintas. As

análises feitas com o equipamento FT-NIR (Antaris) foram utilizadas como parte das

variáveis para composição do conjunto de dados de entrada do modelo proposto

neste trabalho. Este modelo objetiva predizer a variável #Kappa em um digestor

contínuo de cozimento de madeira.

Em cada amostra de cavaco analisada pelo equipamento denominado FT-

NIR é gerado um conjunto de informações de aproximadamente 1.557 variáveis

correspondentes ao espectro de freqüência do comprimento de onda (ν) de 4.000 a

10.000 cm-1. O FT-NIR utiliza a Transformada de Fourrier para melhor avaliação

deste espectro de freqüência e estes espectros são informações de difícil

93

interpretação. Para melhor utilização desta metodologia faz-se necessária a utilização

de técnicas multivariadas para redução da dimensionalidade da matriz gerada. A

técnica utilizada no presente trabalho foi o PCA (Principal Componentes Analysis)

descrito no capítulo 3.

As informações dos espectros de freqüência referem-se à absorbância do

infravermelho no cavaco, ou seja, a quantidade de luz infravermelha que cada

amostra de cavaco absorve. Através desta absorbância muitas informações sobre os

cavacos de madeira podem ser conhecidas. Vários pesquisadores abordam este tema

(SKOGLUND, et al., 2004); (PASQUINI, et al., 2007) e (CALDEIRAA et al., 2007).

O FT-NIR é capaz de identificar nos cavacos variáveis importantes para o

processo de cozimento, tais como: lignina total, densidade básica, teor seco, teor de

extrativos e ainda reconhecer diferentes materiais genéticos de madeira de eucalipto.

Todas estas variáveis são de grande influência no processo de cozimento conforme

descrito por vários pesquisadores (BARRICHELO, 1976); (LEE, 1997); (SIDRAK,

1998); (FERNANDES, 1999); (DOYLE III, 1999); (CARDOSO et al., 2002);

(BLAKE et al., 2004); (CALDEIRA et al., 2006) e (PASQUINI, et al., 2007).

Baseado nestas informações sobre os cavacos, decidiu-se estudar as

influências destes espectros de freqüência no processo de cozimento, especialmente

no #Kappa. Para isto, o modelo estudado utiliza destas informações, dentre outras

variáveis de processo que influenciam no grau de cozimento do digestor, para

predição da variável #Kappa na saída deste equipamento.

Testes realizados no laboratório de qualidade da Cenibra utilizando a

tecnologia FT-NIR, indicaram uma alta correlação entre a variabilidade da qualidade

da madeira (AE) e a variabilidade do processo de cozimento, ou seja, variações no

espectro de freqüência da madeira que entra no processo de cozimento apresentam

correlações com as variações do grau de cozimento. Esta constatação subsidiou a

decisão para a utilização destas análises para composição do grupo das variáveis de

entrada do modelo proposto neste trabalho.

A Figura 6.1 mostra a curva de correlação linear entre o desvio padrão de

#Kappa e o desvio padrão de álcali (AE).

94

Pode-se verificar que as variações das características da madeira, analisadas

pelo FT-NIR, influenciam fortemente a variabilidade da variável #Kappa no

processo de cozimento estudado.

Desvio padrão de kappa / Desvio padrão Alc Mad L1

y = 0,7373x + 1,2045R2 = 0,6954

0,00

0,50

1,00

1,50

2,00

2,50

3,00

0,00 0,20 0,40 0,60 0,80 1,00 1,20 1,40 1,60 1,80 2,00

Des

vio

Padr

ão C

arac

. Mad

eira

Desvio Padrão de #Kappa

Figura 6.1: Gráfico de correlação entre o desvio padrão de #Kappa e AE - madeira da

Cenibra

Neste capítulo serão abordados os procedimentos e testes executados, bem

como os resultados alcançados.

6.2 O problema estudado

Os digestores em plantas de celulose sempre foram alvos de estudos com

foco na elaboração de modelos matemáticos. Segundo Winewski (2001) existem

vários atributos nos digestores contínuos que desafiam uma boa modelagem e os

problemas de controle do equipamento, destacam-se:

• a variável #Kappa possui atrasos em sua medição. O instrumento on

line que a mede não oferece resultados instantâneos e dependendo do

fabricante, pode demorar até 45 minutos entre as análises;

• o tempo elevado de atraso entre as variáveis de entrada e seus efeitos no

#Kappa;

95

• os digestores apresentam comportamento não linear;

• as variações biológicas da química da madeira estão sujeitas à variações

aleatórias não mensuráveis nas componentes como concentração,

umidade, densidade que são as principais fontes de variações contínuas

na operação dos digestores.

No digestor estudado com o ritmo de produção normal, o cavaco que entra

sai do equipamento como polpa de celulose 3 horas depois. Isto significa que a

variável #Kappa possui um atraso de aproximadamente 3 horas em relação a entrada,

pois esta é medida na saída do digestor.

As ações operacionais para correção dos desvios desta variável somente

podem ser feitas após sua medição. Isto significa muitas intervenções do operador

com um tempo de atraso grande, o que na prática gera uma variabilidade no #Kappa.

Este trabalho propõe um modelo que em função das características da

madeira, analisadas pela técnica FT-NIR, e das variáveis de processo que de acordo

com a experiência operacional, mais influenciam no resultado do cozimento, seja

capaz de predizer o #Kappa logo que o cavaco entra no digestor.

Identificar e conhecer as características físicas, químicas e anatômicas da

madeira (cavacos) antes de sua entrada no processo de cozimento, e utilizar destas

informações para predição do #Kappa trará grandes benefícios operacionais para o

processo de produção de celulose.

6.3 Preparação dos dados e procedimentos para os testes das RNAs

6.3.1 Planejamento dos testes

Para obtenção dos resultados foi criada uma metodologia para testes das

RNAs, seguindo os seguintes procedimentos:

• RNA _01_PCA1

• Aplicado PCA em toda a matriz de entrada (dados do FT-NIR mais

dados de processo), escolhidos os 17 PCs (Componentes Principais)

mais significativos. Uma nova matriz de PCs foi formada e a partir

96

desta matriz foram feitos todos os testes das RNAs, conforme descrito

na metodologia, subitem 6.6.1.

• RNA _02_PCA2

• separado a matriz de dados de processo, da matriz de dados gerados

pelo FT-NIR (absorbância de IV) dos cavacos de madeira;

• aplicado a técnica de redução de dimensionalidade com retorno de 25

PCs. Em seguida foram unificadas as matrizes de dados de processo

com a matriz de retorno de 25 PCs e formando uma matriz única.

• RNA_03_PCA3

• idem ao procedimento RNA_02_PCA2, no entanto com retorno da

matriz de absorbância dos cavacos (FT-NIR) com 15 PCs.

• RNA_04_PCA4

• idem ao procedimento RNA_02_PCA2, no entanto com retorno da

matriz de absorbância dos cavacos (FT-NIR) com 10 PCs.

• RNA_05_NIR

• separado a matriz de dados de processo, da matriz de dados gerados

pelo FT-NIR (absorbância de IV) dos cavacos de madeira;

• aplicado á técnica de redução de dimensionalidade com retorno de 3

PCs, em seguida foram unificadas as matrizes de dados de processo

com a matriz de retorno de 3 PCs, formando uma matriz única e

treinadas as RNAs.

Para todos os procedimentos relacionados foram treinadas RNAs utilizando

os algoritmos de otimização paramétrica7: Levenberg Marquadt, gradiente conjugado

escalonado, regularização Bayssiana, gradiente decrescente e gradiente decrescente

com momentum. Para as simulações foram utilizadas rotinas do MATLAB® que

simulam estes métodos de busca;

Também foram treinadas RNAs com os seguintes número de neurônios na

camada escondida: 3, 4, 5, 6, 7, 8, 9, 10, 12, 15, 20, 25, 30, 35, 40;

E ainda foram treinadas 300 redes para cada teste, sendo que dentre estas a

7 Otimização paramétrica: a partir do conjunto de dados de aproximação, e fixada a função de aproximação );(. θg , como encontrar um valor ótimo para o vetor de parâmetros .pR∈θ

97

que obteve melhor resultado foi a validada.

6.3.2 Tratamento dos dados

Utilizando a tecnologia FT-NIR para análise dos cavacos de madeira, pôde-

se obter os espetros de freqüência demonstrados na Figura 6.1.

0,0

0,2

0,4

0,6

0,8

1,0

1,2

Comprimento de Onda

Ab

sorb

ânci

a

Amostra 1

Amostra 2Amostra 3

Amostra 4Amostra 5

Amostra 6Amostra 7Amostra 8

Amostra 9Amostra 10

Amostra 11Amostra n10.000cm-14.000cm-1

2.500nm 1.000nm

Figura 6.2: Exemplo de espectro de freqüência de cavacos de madeira, obtidos

usando a técnica FT-NIR

Como já descrito, a matriz de dados gerada pelo FT-NIR possui uma alta

dimensionalidade, assim, foi necessário aplicar uma técnica estatística multivariada

de análise de dados denominada PCA (Principal Components Analysis), para

redução da dimensão da matriz em uma representação mais tratável, sob o ponto de

vista computacional.

Os cavacos de madeira (padrões analisados) geram uma matriz de dados n x

m (1557 x 1) onde n é o espectro de freqüência que o FT-NIR e m representa as

amostras dos cavacos.

Os dados utilizados para este estudo foram coletados aleatoriamente no

período de setembro de 2006 a março de 2007.

98

O equipamento denominado FT-NIR modelo “Nicolet Antaris” instalado no

laboratório do setor de qualidade da Cenibra foi utilizado para obter a absorbância de

luz do infravermelho próximo dos cavacos em análises feitas no período estudado.

Desta forma, considera-se as análises para este trabalho feitas Off Line. Tecnologias

para medição online ainda encontram-se em desenvolvimento e não estão disponíveis

comercialmente no mercado.

Em avaliação de outros modelos propostos para digestores contínuos

observa-se trabalhos similares, sendo o que mais se aproxima, são os estudos de

Aguiar (2000). Em seu trabalho, iniciou estudos com 22 variáveis de entrada e

concluiu com a proposta de apenas 9 variáveis de entrada para seu modelo, foram

escolhidas aquelas que possuem forte correlação com o #Kappa destacando: o álcali

e a sulfidez do licor de cozimento, temperatura e o fator H nas diferentes zonas do

cozimento. A técnica de modelagem aplicada por Aguiar (2000) foi a de RNA (Rede

Neural Artificial), utilizando redes do tipo MLPs (Multilayer Perceptron). Vale

ressaltar que o modelo proposto por Aguiar (2000) não incluía as análises do FT-NIR

como padrões de entrada.

Para compor o grupo de variáveis de entrada do modelo proposto neste

trabalho, foram utilizadas as sugestões de Aguiar (2000), a experiência operacional

em função de anos de operação do digestor estudado e as análises feitas pelo FT-NIR

nos cavacos de madeira, ou seja, os principais fatores que influenciam o #Kappa,

analisados por anos de conhecimentos adquiridos pela equipe de operação da área do

digestor da Celulose Nipo Brasileira SA. (Cenibra), e pela pesquisa nos modelos já

desenvolvidos por outros pesquisadores (HARKONEN, 1987); (MICHELSEN &

FOSS, 1996); (QIAN et al., 1997); (AL-AWAMI & SIDRAK, 1998); (WISNEWSKI

& DOILE III, 1998); DOYLE III & KYIAHAN, 1999); (FERREIRA et al., 2000);

(WISNEWSKI et al., 2001); (AGUIAR, 2000); (AGUIAR & FILHO, 2001);

(QUEIROZ et al., 2004); (KAYIHAN, 2002); (CARDOSO et al., 2002); (POLIT et

al., 2002); (POUGATCH et al., 2005); (DUFOUR et al., 2005) e (PADHIYAR,

2006).

Foi feita uma avaliação global do conjunto de dados e eliminados os

outliers, ou seja, aqueles dados cujo comportamento não seguem o comportamento

geral para mais de uma variável. Esta etapa consistiu em uma análise criteriosa e

99

visual na matriz de dados disponível. Uma análise do histograma dos dados foi

utilizada para facilitar a identifição dos outliers.

Um total de 160 padrões foi utilizado para obtenção do modelo neural.

Dentre estes, 111 foram utilizados para treinamento e 49 para validação.

6.4 Apresentação de Dados, utilização de análise de componentes principais

para definição de variáveis de entrada aplicadas a rede neural artificial

Os dados (padrões) definidos como entradas para desenvolvimento do

modelo neural seguiram os procedimentos estabelecidos no item 6.3.

Durante todas as etapas dos testes foram mantidas como entradas 7 variáveis

de processo e a estas foram associados os dados do FT-NIR, com diferentes números

de PCs de acordo com os procedimentos estabelecidos. São as variáveis:

• E1 a temperatura na circulação de homogeneização após o aquecimento

do licor de cozimento;

• E2 a temperatura na circulação de cozimento antes do aquecimento de

licor de cozimento;

• E3 a temperatura na circulação de homogeneização antes do

aquecimento de licor de cozimento;

• E4 o Alcali Total Titulável (AT);

• E5 o Alcali Residual (AR);

• E6 a sulfididade (sulfidez) do licor Branco de cozimento;

• E7 a relação lignina por Kilograma de celulose;

Inicialmente foram utilizados os dados do FT-NIR e os dados de processo

para formar uma única matriz, e sobre esta matriz total, foi aplicada a ferramenta

estatística PCA. Os 17 CPs (Componentes Principais) mais significativos foram

escolhidos e apresentados à RNA para treinamento e validação.

Para segunda apresentação de dados no desenvolvimento do modelo, foi

separado as variáveis de processo dos dados do FT-NIR, em seguida aplicado PCA

somente nos dados do FT-NIR, foram escolhidos os 25 CPs mais significativos e a

estes foram adicionados às 7 variáveis de processo. Uma matriz total de 32 variáveis

foi formada e utilizada como entrada para treinamento e validação da RNA.

100

A terceira apresentação de dados para desenvolvimento do modelo, seguiu o

segundo procedimento, no entanto, foram utilizados os 15 CPs mais significativos,

retornados da aplicação do PCA nos dados FT-NIR. Uma matriz total de 22 entradas

foi formada e utilizada para treinamento e validação da RNA.

A quarta apresentação de dados para desenvolvimento do modelo, também

seguiu o segundo e terceiro procedimento, desta vez utilizados os 10 CPs mais

significativos. Uma matriz total de 17 entradas foi formada e utilizada para

treinamento e validação da RNA.

Analisando as respostas da aplicação de PCA na matriz de dados do FT-NIR

e os testes nos diversos modelos estudados, pôde-se perceber através dos

procedimentos mostrados no item 6.3.1 (RNA_01_PCA1, RNA_02_PCA2,

RNA_03_PCA3, RNA_04_PCA4) que estes modelos não apresentavam resultados

expressivos. Foi estão necessário reavaliar o procedimento de tratamento dos dados

do FT_NIR e para isto, foi utilizado o método de escolha dos CPs denominado

“Diagrama de Autovalores” como descrito na seção 3.3. Uma nova composição da

matriz de dados de entrada da RNA foi elaborada formando a quinta apresentação de

dados para desenvolvimento do modelo. Uma nova matriz de dados foi apresentada à

RNA, composta dos 3 CPs mais significativos, retornados da aplicação do PCA nos

dados FT-NIR, mais 7 variáveis de processo. Uma matriz total de 10 entradas foi

formada e utilizada para treinamento e validação da RNA como na primeira geração

de resultados.

A Tabela 6.1 mostra valores de variância dos dados do FT-NIR.

Tabela 6.1: Variâncias dos componentes principais

Variância (%) Somatório acumulado das variâncias

1488,432 1488,432 63,56655 1551,99855 4,106359 1556,104909 0,62289 1556,727799 0,139754 1556,867553 0,067604 1556,935157 0,027346 1556,962503 0,011637 1556,97414

.

.

.

.

.

.

101

Valores e variância superiores a 1%, somente são observados nos três

primeiros PCs, isto explica mais de 90% dos dados originais. No entanto, somente

estes, possuem relevância para a matriz de dados, e foram utilizados para compor a

matriz de dados final apresentada à RNA para treinamento e validação durante esta

etapa dos testes, denominada procedimento RNA_05_NIR.

A Tabela 6.2 apresenta os 3 CPs mais significativos obtidos, sendo que é

mostrado apenas uma parte dos dados devido a sua dimensão.

Estes componentes principais mostrados na Tabela 6.2 foram associados

aos dados de processo de cozimento (7 variáveis) e formado a matriz na qual foi

utilizada para o treinamento da rede neural.

Tabela 6.2: Componentes principais

Padrão 1 Padrão 2 Padrão 3 Padrão 4 Padrão 5 Padrão 6 Padrão n CP1 -7,49192 28,21503 -8,34711 -36,1454 -22,3949 -66,3442 ... CP2 12,98745 1,151334 4,07441 2,76574 2,239127 9,24616 ... CP3 -0,23153 0,672787 -0,25518 1,237489 -1,21237 -2,77446 ...

Em função de praticidade, somente foram mostrados neste trabalho a

composição do conjunto de entrada de dados referentes a quinta geração de

resultados, pois foi esta a combinação que apresentou melhores resultados para o

modelo testado.

CP1, CP2, CP3, são os componentes principais que representam a matriz de dados

analisados pelo FT-NIR (dados de absorbância do NIR, extraídos dos cavacos de

madeira).

Também foram feitos testes utilizando a decimação dos dados, entretanto,

apesar de reduzir consideravelmente o número de variáveis de entrada da RNA, os

resultados não foram satisfatórios. A técnica PCA se mostrou, para este caso, mais

atrativa, pois apresentou melhores resultados no modelo final.

A massa de dados que foi apresentada à RNA durante todas as etapas dos

treinamentos embora tenha sidos os mesmos padrões (total de 160), foram de forma

aleatória, ou seja, cada treinamento teve uma randomização dos dados de entrada.

102

6.5 Implementação da RNA

Uma vez realizado o tratamento nos dados que descreve a qualidade da

madeira, as informações do processo são associadas a estes dados e empregadas

como entradas das redes neurais testadas. Neste estudo são empregadas redes tipo

MLP com 2 camadas. O número de neurônios na camada intermediária (ou

escondida) foi definido durante a etapa de treinamento, sendo este um parâmetro

empregado na busca de melhores modelos.

Durante os testes, uma camada intermediária produziu melhores resultados e

quando aumentado o número de camadas intermediárias, o modelo apresentou uma

redução considerável no coeficiente de correlação linear entre a variável medida e a

predita.

A função de ativação implementada que apresentou melhores resultados foi

a “sigmoidal tangente hiperbólica” usualmente tratada no programa comercial

(software de simulação) MATLAB® como TANSIG. Outras funções (sigmoidal

logística) também foram testadas, mas foram descartadas, por não apresentarem

melhorias nos resultados.

A ordem com que os padrões foram apresentados à RNA influenciou os

resultados. As redes treinadas com conjuntos em ordem aleatória apresentaram

melhor qualidade de predição do que aquelas treinadas com dados ordenados, isto

também pôde ser observado por Aguiar (2000).

De acordo com Haykin (2001) as redes MLP (Multilayer Perceptron), têm

sido aplicadas com sucesso para resolver diversos problemas de difíceis soluções

através de treinamento supervisionado com o algoritmo de retropropagação de erro

(Error Back propagation). Basicamente, a aprendizagem por retropropagação de erro

consiste em dois passos através das diferentes camadas de rede, o de propagação e

retropropagação, como mostrado no item 5.7.

Neste trabalho foi utilizado o algoritmo de retropropagação

(backpropagation) proposto por Rumelhart et al. (1986). Este é o algoritmo mais

utilizado em treinamentos de redes neurais de multicamadas utiliza pares de entrada-

saída proveniente do modelo de tal forma que os pesos possam ser ajustados por um

método de correção de erros.

103

Os conjuntos de dados (entradas e saída das redes) foram normalizados antes

de se iniciar o processo de obtenção dos modelos. A escolha dos dados empregados

no treinamento das redes e os usados na validação do modelo foram aleatórios. A

Figura 6.3 evidencia a estrutura de todos os modelos testados.

Rede Neural

Amostra de cavaco de madeira

PCAVariáveis

operacionais

Espectro de freqüência FT-NIR

Predição do #Kappa

Figura 6.3: Estrutura de todos os modelos testados

As rotinas de otimização paramétricas utilizadas neste estudo, foram de

primeira e segunda ordem, sendo que através da utilização do software de simulação

MATLAB®, utilizou-se:

• TRAINSCG: esta rotina emprega o método de treinamento do gradiente

conjugado escalonado foi elaborado por Moller (1993) sendo introduzida

uma nova variação no algoritmo de gradiente conjugado (Gradiente

Conjugado Escalonado – SCG) que evita a busca unidimensional a cada

iteração utilizando uma abordagem de Levenberg-Marquardt cujo

objetivo é fazer um escalonamento do passo de ajuste α.

Este algoritmo de treinamento é um método de segunda ordem que utiliza

informações sobre a derivada segunda da função de custo (erro).

• TRAINBR: esta rotina (Regularização Baysiana) envolve a modificação

da função objetivo, geralmente utilizada, que é o somatório dos erros

quadráticos médio das respostas da rede. O objetivo da modificação é

melhorar a capacidade de generalização do modelo. Este tipo de método

de treinamento foi proposto por MacKay (1992). É assumido que os pesos

e os bias da rede são variáveis randômicas que seguem uma distribuição

104

Gaussiana e os parâmetros estão relacionados às variâncias associadas

com essas distribuições.

• TRAINLM: esta rotina, assim como o método de Newton, é bastante

eficiente quando estamos tratando de redes que não possuem mais do que

algumas centenas de conexões a serem ajustadas. Isto se deve,

principalmente, ao fato de que estes algoritmos necessitam armazenar

uma matriz quadrada cuja dimensão é da ordem do número de conexões

da rede.

• TRAINGD: esta rotina emprega o método do gradiente descendente, que

atualiza os pesos e os bias de acordo com o gradiente descendente.

• TRAINGDM: é o método do gradiente descendente com momento, que

atualiza os pesos e os bias de acordo com o gradiente descendente com

momento.

Após a implementação da RNA vários testes foram executados na busca de

obter os melhores resultados, o item 6.6 detalha os testes e resultados encontrados.

Os subitens 6.6.5 e 6.6.6, mostram os melhores resultados obtidos durante todas as

etapas de desenvolvimento dos testes. Ainda no subitem 6.6.6 uma extrapolação dos

testes é mostrada, na qual houve uma melhora significativa nos resultados de

predição da variável #Kappa.

6.6 Comparação dos resultados obtidos

Foram considerados um total de 160 padrões (pares de entradas/saídas), para

obtenção dos modelos. Deste total são escolhidos aleatoriamente 70% para etapa de

treinamento e 30% para a de validação do modelo. Como mencionado anteriormente,

a escolha de quais padrões foram empregados no treinamento e quais foram

empregados na validação foi aleatória.

Um tempo de retenção (ou tempo de residência) igual a 3 horas foi

calculado em função da velocidade de alimentação do digestor. Ou ainda,

considerou-se que após 3 horas de alimentação do cavaco, a polpa gerada desta

alimentação sairá do equipamento. Esta informação foi considerada na elaboração do

105

conjunto de dados originais. Assim, o #Kappa (variável a ser predita) considerado

para cada conjunto de entradas é avaliado 3 horas depois do momento que as

entradas são verificadas na planta industrial.

Em uma situação ótima, deseja-se que o valor predito para o #Kappa seja

exatamente igual ao valor real. Isto nos leva a uma correlação linear igual a 1 (100%)

entre o #Kappa real e o predito. Sabe-se ainda que, para sistemas reais e complexos,

como é o caso do digestor estudado, esta correlação dificilmente será alcançada. O

que se faz na prática é buscar modelos que se aproximem ao máximo desta meta.

Além disso, deseja-se modelos que possam ser empregados no

acompanhamento do processo em tempo real, ou seja, modelos que funcionem como

sensores virtuais (soft sensor) para a variável estudada. Neste sentido, a validação

dos modelos indica a capacidade do modelo para desempenhar este papel.

Os dados de validação simulam as novas condições (ou novos dados)

operacionais que serão gerados pela planta industrial, uma vez que não são usados na

estimação dos parâmetros do modelo. Ou ainda, embora o desempenho da rede no

teste de treinamento seja importante, mais significativo é o obtido no teste de

validação.

Os testes das RNAs tiveram uma seqüência baseada no procedimento

proposto no subitem 6.3.1, objetivando utilizar vários algoritmos de treinamento e

diferentes números de neurônios na camada escondida para se obter uma comparação

entre os resultados alcançados.

6.6.1 Primeira geração de resultados RNA_01_PCA1

Aplicado PCA em todos os padrões de entradas juntos, ou seja, os dados de

absorbância dos cavacos (dados do FT-NIR) juntos com os dados de processo,

escolhido os 17 CPs mais significativos, formando uma matriz única (17 x 160), e a

partir desta foram treinadas RNAs utilizando os algoritmos otimização paramétrica:

TRAINSCG, TRAINBR, TRAINLM, TRAINGD e TRAINGDM do Toolbox de

RNAs do MATLAB® na versão 7.0.0 (R.14).

A Figura 6.4 apresenta a estrutura do modelo treinado, na qual se utilizou de

uma matriz única para treinamento da RNA.

106

Amostra de cavacos de madeira

PCA Predição do #Kappa

Rede Neural

Matriz de 17 x 160

Variáveis operacionais

7 variáveis de processo

Matriz Total

Espectro de freqüência FT-NIR 1557 espectros de

freqüência FT-NIR

Figura 6.4: Estrutura do modelo testado RNA01_PCA_01

As Figuras 6.5 a 6.9 mostram a evolução dos testes para todos os métodos

de otimização utilizados, quando variados o número de neurônios na camada

intermediária, tanto para a etapa de treinamento quanto para a validação da RNA.

Os resultados podem ser observados nos gráficos mostrados nas Figuras 6.5

a 6.9.

Número de neurônios na camada intermediária

5 10 15 20 25 30 35 40

Corr

elaçã

o lin

ear

0,2

0,4

0,6

0,8

1,0

TreinamentoValidação

Figura 6.5: Simulação da RNA com o algoritmo TRAINSCG-Teste RNA _01_PCA1

107


5 10 15 20 25 30 35 40

Corr

elaçã

o lin

ear

0,2

0,4

0,6

0,8

1,0


Figura 6.6: Simulação da RNA com o algoritmo TRAINBR - Teste RNA _01_PCA1


5 10 15 20 25 30 35 40

Corr

elaçã

o lin

ear

0,2

0,4

0,6

0,8

1,0


Figura 6.7: Simulação da RNA com o algoritmo TRAINLM - Teste RNA _01_PCA1


5 10 15 20 25 30 35 40

Corr

elaçã

o lin

ear

0,2

0,4

0,6

0,8

1,0


Figura 6.8: Simulação da RNA com o algoritmo TRAINGD- Teste RNA _01_PCA1

108


5 10 15 20 25 30 35 40

Corr

elaç

ão li

near

0,2

0,4

0,6

0,8

1,0


Figura 6.9: Simulação da RNA com algoritmo TRAINGDM- Teste RNA _01_PCA1

Os testes apresentaram bons resultados na etapa de treinamento, mas não se

obteve resultados significativos para a validação da rede. A RNA que apresentou

melhor resultado nesta etapa dos testes foi a treinada com o algoritmo TRAINGD,

com 4 neurônios na camada intermediária e que apresentou um coeficiente de

correlação linear de 0,641 para a validação, conforme Figura 6.8.

6.6.2 Segunda geração de resultados RNA_02_PCA2

Aplicado PCA nos dados de absorbância dos cavacos (dados do FT-NIR),

escolhido os 25 CPs mais significativos, em seguida foram unificadas as matrizes de

dados de processo composta pelas variáveis E1, E2, E3, E4, E5, E6 e E7, matriz de

retorno de 25 CPs, formando uma matriz única (32 x 160), e a partir desta foram

treinadas RNAs utilizando os algoritmos de otimização: TRAINSCG, TRAINBR,

TRAINLM, TRAINGD e TRAINGDM do Toolbox de RNAs do MATLAB® na

versão 7.0.0 (R.14).

A Figura 6.10 apresenta a estrutura do modelo treinado, na qual se utilizou

de uma matriz única para treinamento da RNA.

109




Matriz Total

Rede Neural

Matriz de 32 x 160

1557 espectros de freqüência FT-NIR

PCAVariáveis

operacionais



As Figuras 6.11 a 6.15 mostram os resultados dos testes para aos algoritmos

de treinamento com a variação do número de neurônios.


5 10 15 20 25 30 35 40

Corr

elaç

ão li

near

0,2

0,4

0,6

0,8

1,0

Treinamento Validação

Figura 6.11: Simulação da RNA com algoritmo TRAINSCG- Teste RNA _02_PCA2

110


5 10 15 20 25 30 35 40

Corr

elaçã

o lin

ear

0,2

0,4

0,6

0,8

1,0


Figura 6.12: Simulação da RNA com algoritmo TRAINBR- Teste RNA _02_PCA2


5 10 15 20 25 30 35 40

Corr

elaçã

o lin

ear

0,2

0,4

0,6

0,8

1,0




5 10 15 20 25 30 35 40

Corr

elaç

ão li

near

0,2

0,4

0,6

0,8

1,0


Figura 6.14: Simulação da RNA com o algoritmo TRAINGD - Teste RNA _02_PCA2

111


5 10 15 20 25 30 35 40

Corr

elaç

ão li

near

0,2

0,4

0,6

0,8

1,0


Figura 6.15: Simulação da RNA com o algoritmo TRAINGDM - Teste RNA _02_PCA2

Observa-se através dos gráficos mostrados nas Figuras 6.11 a 6.15 que o

algoritmo que apresentou melhor resultado para esta etapa dos testes foi o

TRAINGDM (Figura 6.15), apresentou um coeficiente de correlação de 0,648 para o

treinamento e de 0,701 para a validação, quando treinado a RNA com 8 neurônios na

camada escondida.

6.6.3 Terceira geração de resultados (RNA _03_PCA3)


escolhido os 15 PCs mais significativos, em seguida foram unificadas as matrizes de

dados de processo composta pelas variáveis E1, E2, E3, E4, E5, E6, E7, com a matriz

de retorno de 15 PCs, formando uma matriz única (22 x 160), e a partir desta foram

treinadas RNAs utilizando os algoritmos de otimização: TRAINSCG, TRAINBR,


versão 7.0.0 (R.14).

A Figura 6.16 apresenta a estrutura do modelo treinado para esta geração e

resultados, na qual se utilizou de uma matriz única para treinamento da RNA.

112




Matriz Total

Rede Neural

Matriz de 22 x 160


PCAVariáveis

operacionais



As Figuras 6.17 a 6.21 mostram a evolução dos testes para todos os métodos

de otimização utilizados, quando variados o número de neurônios na camada

intermediária, tanto para a etapa de treinamento quanto para a validação da RNA.


5 10 15 20 25 30 35 40

Corr

elaç

ão li

near

0,2

0,4

0,6

0,8

1,0


Figura 6.17: Simulação da RNA com o algoritmo TRAINSCG - Teste RNA _03_PCA3

113


5 10 15 20 25 30 35 40

Corr

elaç

ão li

near

0,2

0,4

0,6

0,8

1,0




5 10 15 20 25 30 35 40

Corr

elaçã

o lin

ear

0,2

0,4

0,6

0,8

1,0




5 10 15 20 25 30 35 40

Corr

elaçã

o lin

ear

0,2

0,4

0,6

0,8

1,0

Treinamento Validação

Figura 6.20: Simulação da RNA com o algoritmo TRAINGD- Teste RNA _03_PCA3

114


5 10 15 20 25 30 35 40

Corr

elaçã

o lin

ear

0,2

0,4

0,6

0,8

1,0





TRAINGDM (Figura 6.21), apresentou um coeficiente de correlação de 0,767 para o

treinamento e de 0,705 para a validação, quando treinado a RNA com 6 neurônios na

camada escondida.

Observa-se também que algoritmo de otimização TRAINSCG apresenta

resultados similares para a validação, com uma RNA com 12 neurônios na camada

intermediária (Figura 6.17). Apresentou um coeficiente de correlação de 0,947 para o

treinamento e de 0,701 para a validação.

6.6.4 Quarta geração de resultados (RNA_04_PCA4)


escolhido os 10 PCs mais significativos, em seguida foram unificadas as matrizes de

dados de processo composta pelas variáveis E1, E2, E3, E4, E5, E6, E7, com a matriz

de retorno de 10 PCs, formando uma matriz única (17 x 160), e a partir desta foram

treinadas RNAs utilizando os algoritmos de treinamento: TRAINSCG, TRAINBR,


versão 7.0.0 (R.14).



115




Matriz Total

Rede Neural

Matriz de 17 x 160


PCAVariáveis

operacionais



As Figuras 6.23 a 6.27 mostram os resultados dos testes para aos algoritmos

de treinamento com a variação do número de neurônios.


5 10 15 20 25 30 35 40

Corr

elaçã

o lin

ear

0,2

0,4

0,6

0,8

1,0


Figura 6.23: Simulação da RNA com o algoritmo TRAINSCG- Teste RNA _04_PCA4

116


5 10 15 20 25 30 35 40

Corr

elaçã

o lin

ear

0,2

0,4

0,6

0,8

1,0




5 10 15 20 25 30 35 40

Corr

elaçã

o lin

ear

0,2

0,4

0,6

0,8

1,0




5 10 15 20 25 30 35 40

Corr

elaçã

o lin

ear

0,2

0,4

0,6

0,8

1,0


Figura 6.26: Simulação da RNA com o algoritmo TRAINGD - Teste RNA _04_PCA4

117


5 10 15 20 25 30 35 40

Corr

elaç

ão li

near

0,2

0,4

0,6

0,8

1,0





TRAINGD (Figura 6.26), apresentou um coeficiente de correlação de 0,704 para o

treinamento e de 0,771 para a validação, quando treinado a RNA com 10 neurônios

na camada escondida.

6.6.5 Quinta Geração de resultados (RNA_05_ NIR)


escolhido os 3 PCs mais significativos com variância maior que 1% (Tabela 6.1), em

seguida foram unificadas as matrizes de dados de processo com a matriz dos 3

componentes mais relevantes, foi formado uma nova matriz composta pelas variáveis

E1, E2, E3, E4, E5, E6, E7, CP1, CP2, CP3, formando uma matriz única (10 x 160), e a

partir desta foram treinadas RNAs utilizando os algoritmos de treinamento:

TRAINSCG, TRAINBR, TRAINLM, TRAINGD e TRAINGDM do Toolbox de

RNAs do MATLAB® na versão 7.0.0 (R.14).



118




Matriz Total

Rede Neural

Matriz de 10 x 160


PCAVariáveis

operacionais


Figura 6.28: Estrutura do modelo testado RNA05_NIR

Pode-se observar através dos gráficos mostrados nas Figuras 6.29 a 6.33 que

o algoritmo que apresentou melhor resultado, ou seja, um coeficiente de correlação

para o teste de validação de 0,8174 foi o TRAINSCG (Figura 6.29), quando treinado

a RNA com 6 neurônios na camada escondida.

Estas Figuras 6.29 a 6.33 também evidenciam que os algoritmos com menor

número de neurônios na camada escondida apresentam melhores resultados, embora

em alguns casos obtenham-se bons resultados com número elevado de neurônios na

camada escondida. Para efeitos de simplicidade, são evitados modelos com número

elevado de neurônios nesta camada.


5 10 15 20 25 30 35 40

Corr

elaçã

o lin

ear

0,2

0,4

0,6

0,8

1,0

treinamentovalidação

0,8174

Figura 6.29: Simulação da RNA com o algoritmo TRAINSCG - Teste RNA _05_NIR

119


5 10 15 20 25 30 35 40

Corr

elaçã

o lin

ear

0,2

0,4

0,6

0,8

1,0

TreinamentoValidacao

Figura 6.30: Simulação da RNA com o algoritmo TRAINBR - Teste RNA _05_NIR


5 10 15 20 25 30 35 40

Corr

elaçã

o lin

ear

0,2

0,4

0,6

0,8

1,0


Figura 6.31: Simulação da RNA com o algoritmo TRAINLM - Teste RNA _05_NIR


5 10 15 20 25 30 35 40

Corr

elaçã

o lin

ear

0,2

0,4

0,6

0,8

1,0

TreinamentoValidaçao

Figura 6.32: Simulação da RNA com o do algoritmo TRAINGD - Teste RNA _05_NIR

120


5 10 15 20 25 30 35 40

Corr

elaç

ão li

near

0,2

0,4

0,6

0,8

1,0


Figura 6.33: Simulação da RNA com o algoritmo TRAINGDM - Teste RNA _05_NIR

Os resultados obtidos indicam que para todos os modelos testados, as

correlações lineares entre os dados reais e os preditos obtidos para os testes de

treinamento superam 60% salvo em algumas poucas exceções. Ou ainda, 40% da

variabilidade dos dados de treinamento não são descritos pelas redes.

Para os testes de validação, verifica-se que existe uma tendência de se obter

melhores modelos com número menores de neurônios na camada intermediária. Os

melhores modelos obtidos neste caso possuem 4, 6 neurônios na camada

intermediária e apresentam boas correlações lineares entre a variável real do processo

(#Kappa) e o valor predito pela RNA, considerando os algoritmos que utilizam os

métodos de treinamento do gradiente descendente com momento (TRAINGDM) e o

método gradiente do conjugado escalonado (TRAINSCG) respectivamente.

A Figura 6.34 mostra a curva de correlação da melhor rede treinada

utilizando o método de otimização paramétrica “gradiente conjugado escalonado”

(TRAINSCG), e com 6 neurônios na camada escondida.

121

Figura 6.34: Correlação linear da melhor rede obtida

A Figura 6.35 evidencia a curva de tendência de treinamento da melhor rede

obtida, pode-se observar que a RNA apresenta um baixo resíduo e um baixo RMSE

(Root Mean Square Errors) durante a etapa de treinamento. O coeficiente de

correlação linear nesta etapa, entre a variável medida e a predita pela RNA, foi de

0,9276% e um RMSE de 0,2092.

Os resultados de RMSE apresentados são em função da raiz quadrada do erro

quadrático médio (RMSE), dado pela Equação 6.1 (HAYKIN, 2001, p.225) :

∑∑==

−=M

kkk

N

nnynd

NRMSE

1

2

1))()((

21

(6.1)

Onde é a saída desejada do neurônio de saída k para a amostra n, ) é a

saída fornecida pela rede neural e N o número de padrões.

)(ndk (nyk

122

De acordo com Aguirre (2004) o índice RMSE mede o erro da predição livre

do modelo com relação a média dos dados reais e índices de RMSE superiores a 1,

significa que a resposta do modelo é pior que a média temporal dos dados.

A análise da Figura 6.35 evidencia também, que para todos os modelos

testados, as correlações lineares entre os dados reais e preditos obtidos para os testes

de treinamento superam 90%. Ou ainda, apenas 10% da variabilidade dos dados de

treinamento não são descritos pelas redes nesta etapa. Para os testes de validação,

verifica-se que existe uma tendência de se obter melhores modelos com menor

número neurônios.

5 10 15 20 25-5

0

5

10

15

20

#Kappa medido no processo#Kappa predito pela RNAResíduos

Núm

ero

Kap

pa

Padrões apresentados à RNA no Treinamento

Correlaçao=0,9276

RMSE=0,2092

Figura 6.35: Tendência dos valores do #Kappa no treinamento com o algoritmo TRAINSCG

Uma RNA com arquitetura de 10 x 6 x 1 produziu melhores resultados

durante a validação. A Figura 6.36 evidencia a curva de tendência de validação da

melhor rede obtida. Através do gráfico pode-se observar uma boa capacidade de

resposta do modelo treinado, pois os valores preditos pela RNA acompanham a

tendência dos valores reais da variável #Kappa medidos no processo.

Uma correlação linear de 0,8174 pode ser observada na Figura 6.36, quando

comparadas as variáveis #Kappa predito e medido, é evidenciado ainda os resíduos

durante esta etapa de validação do modelo.

123

5 10 15 20 25-5

0

5

10

15

20

25

#Kappa Medido no Processo#Kappa Predito pela RNAResíduos

Núm

ero

Kap

pa

Padrões apresentados à RNA

Correlaçao=0,8174

Figura 6.36: Comparação da variável #Kappa predito e medido para o melhor modelo

obtido

A Figura 6.37 apresenta o histograma dos dados de treinamento onde a

maior parte dos dados analisados, encontra-se com valores de #Kappa entre 14 a 18.

Observa-se também que ocorreram valores entre 10 e 22, ou seja, foram

apresentados padrões de #Kappa para a rede, com uma faixa ampla sugerindo que na

presença de informações operacionais compreendidos dentro desta faixa, RNA terá

capacidade de reconhecê-los satisfatoriamente. No entanto, acredita-se que a

apresentação de um maior número de padrões à rede, poderia melhorar ainda mais os

resultados alcançados.

Figura 6.37: Histograma dos dados de treinamento

124

A Figura 6.38 mostra a arquitetura da RNA que apresentou melhor correlação

linear na validação, possui uma arquitetura 10 x 6 x 1, apresenta 10 entradas, 6

neurônios na camada intermediária e um na camada de saída.

E1

E2

E3

E4

E5

E6 #Kappa

E7

PC1

PC2

PC3

CAMADA DE ENTRADA

DE NÓS DE FONTE

CAMADA DE NEURÔNIOS

OCULTOS

CAMADA DE NEURÔNIOS

DE SAÍDA

Figura 6.38: Arquitetura RNA que apresentou melhor resultado (10x6x1)

Pode-se observar com os resultados mostrados nos subitens 6.6.2 a 6.6.5,

que o aumento de CPs para representação do conjunto de padrões do FT-NIR não

traz melhorias nos resultados da predição do #Kappa, ou seja, poucos componentes

principais são suficientes para representarem o conjunto de padrões mostrados pelas

análises do FT-NIR.

6.6.6 Testes com Early Stopping

Após obter os melhores resultados utilizando o método de otimização

paramétrica do gradiente do conjugado escalonado (rotina do MATALAB®,

TRAINSCG), foi aplicado no treinamento o Early Stopping na tentativa de melhorar

o modelo encontrado, os resultados são evidenciados nas Figuras 6.39.

125

Obteve-se uma melhora significativa na correlação da variável predita,

comparada com a variável efetivamente medida no processo. A correlação linear de

0,8174 passou para 0,873, quando utilizado o critério de treinamento com parada

antecipada denominado Early Stopping.

Outros testes foram realizados utilizando as mesmas rotinas de otimização

paramétrica mostradas nos itens 6.6.1 a 6.6.5, no entanto, a RNA que apresentou

melhor coeficiente de correlação linear foi a treinada com o algoritmo gradiente do

conjugado escalonado (rotina do MATALAB®, TRAINSCG). As demais rotinas não

apresentaram melhoria nos resultados mostrados nos itens 6.6.1 a 6.6.5.

A Figura 6.39 apresenta os resultados de validação da melhor rede treinada,

comparados com os dados reais medidos no processo durante esta etapa dos testes.

5 10 15 20 25-5

0

5

10

15

20

#Kappa Predito pela RNA#Kappa Medido no ProcessoResíduos

Núm

ero

Kap

pa

Padrões apresentados à RNA

Correlaçao=0,873RMSE=0,34979

Figura 6.39: Resposta com Early Stopping, RNA com melhor resultado na validação

Estes resultados foram obtidos com uma arquitetura diferente daquela

conseguida sem o treinamento utilizando o Early Stopping, esta arquitetura apresenta

10 entradas, 5 neurônios na camada intermediária e 1 uma camada de saída (10 x 7 x

1). Com isto há a redução do número de parâmetros da RNA.

A Tabela 6.3 mostra um resumo dos resultados alcançados durante os testes,

pode ser observado uma maior relevância nos testes mostrados nos itens 5 e 6.

126

Tabela 6.3: Resumo dos resultados dos testes

item Testes

Método de

otimização

paramétrica

Correlação

Linear na

validação

Neurônios na Camada

escondida

1 RNA_01_PCA1 TRAINGD 0,641 4

2 RNA_02_PCA2 TRAINGDM 0,701 8

3 RNA_03_PCA3 TRAINGDM 0,705 6

4 RNA_04_PCA4 TRAINGD 0,771 10

5 RNA_05_NIR TRAINSCG 0,8174 6

6 Early Stopping TRAINSCG 0,873 7

6.6.7 Simulador de processos

Como ferramenta de apoio à tomada de decisões operacionais, foi

desenvolvido um simulador para predição da variável #Kappa baseado na RNA em

questão, desenvolvido através do software MATLAB® na versão 7.0.0 (R.14).

O simulador tem como entradas as variáveis mostradas no subitem 6.6.5. A

simulação do processo acontece baseando-se em uma análise dos espectros de

freqüência dos cavacos de entrada do digestor, feita pelo FT-NIR e pela entrada

manual de dados conforme mostrado na Figura 6.40, esta ilustra os parâmetros de

entrada do simulador.

Após inseridas todas as informações requeridas (dados de entrada), o

comando “Load” carrega estas informações na matriz e dados de entrada da RNA em

seguida um comando “Carrega” busca os parâmetros da melhor RNA treinada.

Acionando o comando “Simula” o modelo fará a predição do #Kappa e o mostrará

na tela.

O simulador é capaz de predizer a variável #Kappa com um índice de

correlação linear de 0,8174, quando utilizado os parâmetros da RNA mostrada no

item 6.6.5.

127

Figura 6.40: Janela de entrada de dados para predição do #Kappa

Quando utilizados os parâmetros da RNA mostrada no item 6.6.6, esta é

capaz de predizer a variável #Kappa com coeficiente de correlação linear de 0,873.

Esta rede foi treinada utilizando o algoritmo gradiente do conjugado escalonado

(rotina do MATALAB®, TRAINSCG) com critério de parada Ealy Stopping.

128

7 COMENTÁRIOS FINAIS

7.1 Conclusões

A tecnologia FT-NIR vem se mostrado uma importante ferramenta de

análises de variáveis industriais e combinada com as redes neurais, se mostrou viável

na elaboração de modelos para digestores em fábricas de celulose com processos do

tipo Kraft.

A seqüência de testes levou à exaustão o treinamento das redes neurais. O

melhor modelo foi escolhido em função da melhor correlação linear obtida entre a

variável medida e a variável predita.

Basicamente foram treinadas RNAs com uma quantidade de 15 diferentes

números de neurônios na camada escondida. Foram utilizados 5 algoritmos de

treinamento diferentes, sendo estes algoritmos de otimização paramétrica de primeira

e segunda ordem. Os resultados obtidos são similares, com uma pequena melhora

nos resultados para os de segunda ordem.

Para cada número de neurônios na camada escondida e cada algoritmo de

otimização paramétrica, foram treinadas 300 diferentes redes, sendo que destas a que

apresentou melhor resultado foi validada.

O melhor modelo obtido é capaz de predizer a variável #Kappa, com um

coeficiente de correlação linear de 0,8174 em relação a variável efetivamente

medida. Isto mostra um resultado satisfatório e oferece ao operador uma informação

antecipada, para que o mesmo possa intervir no processo e consequentemente

controlar melhor as variabilidades do #Kappa no processo de cozimento.

A utilização do critério parada antecipada Early Stopping, melhorou a

correlação linear entre as variáveis predita e medida, de 0,8174 para 0,873, se

mostrando como uma boa ferramenta para contribuição durante as etapas de

treinamento dos modelos.

A técnica multivariada PCA, se mostrou uma boa ferramenta para redução

da dimensionalidade de matrizes com número elevado de padrões de entrada.

Acredita-se que quantidade de padrões utilizados (total de 160) foi um fator

129

determinante para os resultados do modelo. Acredita-se também que com um volume

maior de padrões seja possível obter um modelo que possa apresentar melhores

coeficientes de correlação na predição do #Kappa.

Digestores contínuos de cozimento de madeira em processos do tipo Kraft,

embora apresentem atributos que desafiam uma boa modelagem, podem ser

estudados utilizando várias técnicas dentre elas as RNAs se mostram capazes de

oferecer bons modelos matemáticos.

As redes neurais artificiais têm se apresentado como ferramenta necessária

e importante no contexto industrial. Sua capacidade de aprendizado e de predizer

resultados, quando submetidas a padrões desconhecidos, as transformam em

interessante opção nas soluções dos problemas industriais.

7.2 Sugestões para trabalhos futuros

Como propostas para trabalhos futuros têm-se:

• testar outras arquiteturas de redes para o sistema proposto;

• utilizar um maior número de padrões para treinar novas RNAs;

• ampliar a abrangência deste trabalho para demais variáveis no processo

de fabricação de celulose, ou seja, aquelas variáveis de difícil medição

com os métodos já existentes, como exemplo viscosidade, umidade dentre

outras;

• implementar o modelo que apresentou melhor resultado em uma

ferramenta mais robusta operacionalmente;

• Instalar um sistema de medição FT-NIR online no processo produtivo e

desenvolver um modelo também com predição online.

130

REFERÊNCIAS BIBLIOGRÁFICAS

ABRAF, Anuário Estatístico da ABRAF: ano base 2006 / ABRAF. – Brasília 2007.

81p.

ANDRITZ. Kraft Mill Business. Cenibra Lo-Level/Lo-Solids – Apostila de

Treinamento. Belo Oriente. 2006, 224p.

AL-AWAMI, L.; SIDRAK Y. Understending th dynamic behavior of Kamyr

digesters. ISA Transactions, 37. p. 53-64. 1998.

AGUIAR, H. C. I. L. Modelagem de digestores Kraft contínuo: Redes neurais e

modelos híbridos. 2000. 173p. Dissertação de mestrado – Universidade Estadual de

Campinas –UNICAMP. Campinas Fevereiro de 2000.

AGUIAR, H. C.; FILHO R. M. Neural network and hybrid model: a discussion

about different modeling techniques to predict pulping degree with industrial

data. Chemical Engineering Science; p. 565-570; 2001.

AGUIRRE, L. Introdução à identificação de Sistemas: técnicas lineares e não-

lineares aplicadas a sistemas reais. UFMG, Editora UFMG - Belo Horizonte,

Minas Gerais, 2 edition, 2004.

ASSUMPÇÃO, R. M. V.; PINHO, M. R. R.; CAHEN, R.; PHILIPP, P. “Polpação

química”. Celulose e Papel. Tecnologia de Fabricação de Pasta Celulósica,

Volume 1, 2ª edição, Capítulo 6. São Paulo: IPT-SENAI, 1988.

BARBER, V. A.; SCOTT, G. M. Dynamic modeling of a paper machine software

development. TAPPI Journal, vol. 6, no. 1, January 2007.

131

BARBER, V. A.; SCOTT, G. M. Dynamic modeling of a paper machine part II:

evaluation of wet-end model dynamics. TAPPI Journal, vol. 6, no. 1, February

2007.

BARRICHELO, L. E. G.; FOEKEL, C. E. B.; AHEN, R. Estudos para produção

de celulose de sulfato de seis espécies de eucalipto. IPEF, n.12, p. 77 – 95, junho

1976.

BLAKE, S. C. S. Influência da densidade básica da madeira na qualidade da

polpa Kraft de clones híbridos, Eucalyptus Grandis W. Hill ex Maiden X

Eucalyptus Urophylla S. T. Blake; R. Árvore, Viçosa, v.28, p.901-909, 2004.

BOKOBZA, L. Near Infrared Spectroscopy, .J. Near Infrared Spesctrosc., 6, p. 3-

17, 1998.

BORIN, A. Aplicação de Quimiometria e Espectroscopia no Infravermelho no

Controle de Qualidade de Lubrificantes, Dissertação Mestrado, 2003-

Universidade Estadual de Campinas – Instituto de Química – LAQQA., 2003.

BRAGA, A. P.; LUDERMIR, T. B.; CARVALHO, A. C. P. L. F. Redes Neurais

Artificiais: Teoria e Aplicações. LTC – Livros Técnicos e Científicos Editora S.A.,

2000.

BUGAGER, S.; CAHEN, R.; A. F. & PINHO, M. R. R. Fator-H – Parâmetro

válido para polpação de eucalipto. O Papel, São Paulo: p.35-49. 1979.

CALDEIRA, R. L. A.; FIGUEIREDO A. B. D.; NETO, J. A.; CARLECH, R. P.;

PAIVA, J. M. Influência da Variabilidade da Madeira no Processo de Cozimento

da Cenibra: Proposta de Segregação por Classes de Qualidade. Curso de Pós-

graduação Latu Sensu em Tecnologia de Celulose e Papel (UFV). Belo Oriente,

Cenibra, 2006.

132

CALDEIRAA, A. F.; ROCHA, A. P.; SANTOS, C. V. C.; ALMEIDA. C.; PATELLI,

J. E.; CALVOSA, P. S. P; SACON, V. NIR On Line: An Innovation in the VCP

Wood Yard. Colóquio internacional de celulose e papel, Março 2007, Belo

Horizonte, Brasil. CARDOSO, V. C.; FIZZO, S. M. B.; ROSA, C. A. B.; FOEKEL, C. E. B; ASSIS, T.

F; OILVEIRA, P. Otimização das condições do cozimento kraft de eucalyptus

globulus em função do teor de lignina da madeira. In: 35º Congresso e Exposição

Anual de Celulose e Papel da ABTCP, 2002.

CARVALHO, A. M. M. L. Estrutura Anatômica e Química da Madeira, Parte I;

Curso de pós-graduação lato Sensu em tecnologia de celulose e papel. Universidade

Federal de Viçosa; Engenharia Florestal; Viçosa, MG; 2005; 44p.

CHATFIELD, C.; COLLINS, A. J. Introduction to multivariate analysis. London:

Chapman & Hall, 1992.

CIENFUEGOS, F. Introdução à fotocolorimetria e espectrofotometria. São

Paulo: ALTEC manual; 1995.

CIENFUEGOS, F. Análise Instrumental: Conceitos e Avanços da Análise no

Infravermelho, Revista Química e Derivados, São Paulo, ano 35, N°413, p. 40-46,

março 2003.

COLODETTE, J. L. Química da Madeira; Curso de pós-graduação lato Sensu em

tecnologia de celulose e papel. Universidade Federal de Viçosa; Engenharia

Florestal; Viçosa, MG; 2004.

COHN, P. E. e RIBEIRO, R. N. Medição “on line” do alcali total nos licores

branco e verde empregando tecnologia FT-NIR. In: 35º Congresso e Exposição

Anual de Celulose e Papel da ABTCP, 2002.

133

COLUZZI, DJ. Fundamentals of dental lasers: science and instruments. Dent Clin N Am 2004; 48(4)751-770.

COSTA, A. O. S. Alternativas para o Controle de um Sistema de Evaporadores

de Múltiplo Efeito. 2000. Dissertação (Mestrado em Engenharia Química) –

Programa de Engenharia Química do Instituto Alberto Luis Coimbra de Pós-

Graduação e Pesquisa em Engenharia - PEQ-COPPE-UFRJ, Rio de Janeiro, RJ.

COSTA, A. O. S.; SOUZA, M. B.; BISCAIA, E. C.; LIMA, H. L. Monitoring

particulate material formation in a kraft furnace recovery boiler. Tappi Journal,

vol. 4. no. 4, 2005.

CYBENKO, G. Continuous Valued Neural Networks With Two Hidden Layers

Are Sufficient. Technical Report, Department of Computer Science, Tufts

University, 1988.

CYBENKO, G. Approximation by Superpositions of a Sigmoid Function.

Mathematics of Control, Signals and Systems, 2:303-314, 1989.

D`ALMEIDA, M. L. O. Celulose e Papel. Tecnologia de fabricação de pasta

celulósica. Volume 1, 2ª edição, Capítulo 3. São Paulo: IPT-SENAI, 1988.

DOYLE III, F. J.; KYIHAN, F. Reaction profile control of the continuous pulp

digester. Chemical Engineering Science, 54 (1999) 2679 -2688.

DUFOUR, S.; BHARTIYA, S.; DHURJATI P. S.; DOYLE III, F. J. Neural

network-based software sensor: training set design and application to a

continuous pulp digester. Control Engineering Pratice 13. p. 135-143; 2005.

EDGAR, T. F.; HIMMELBLAU, D. M. Optimization of chemical processes; Mc

Graw Hill Book Company; New York, NY, 1ª ediçao, 1998.

134

EIKREM, L. O. Process Fourier Transform Infrared Spectroscopy, Anal.

Chem.,9, 107-109, 1990.

ESBENSEN, K. H. Multivariate data analysis – In Practice: 5th Edition. Oslo:

CAMO, 2002, 598p.

FACKLER, K.; GRADINGER, C.; HINTERSTOISSER, B.; MESSNER, K.;

SCHWANNINGER, M. Lignin degradation by white rot fungi on spruce wood

shavings during short-time solid-state fermentations monitored by near

infrared spectroscopy. Enzyme and Microbial Technology 39 p.1476–1483, 2006.

FERNANDES, N. C. P. and CASTRO, José A. A. M. “Steady-state simulation of a

continuous moving bed reactor in pulp and paper industry”. Chemichal

Engineering Science, 2000, p3729-3738.

FERREIRA, C. R. S.; GOMIDE, J. L.; OLIVEIRA, R. C.; COLODETTE, J. L.;

NETO, H. F. Estudos de otimização do perfil de temperatura na polpação.

Congresso Internacional de Celulose e Papel; 2000.

FIGUEIRÊDO, L. S. Modelagem e simulação do processo de caustificação. Curso

de Pós-graduação Latu Sensu em Tecnologia de Celulose e Papel (UFV). Belo

Oriente, Cenibra, 2006.

FOEKEL, C. E.; MOURA, E.; MENOCHELLI, S. Densidade Básica: sua

verdadeira utilização como índice de qualidade da madeira de eucalipto para

produção de celulose. In. CONGRESSO FLORESTAL BRASILEIRO, 6, Campos

do Jordão, 1990, Anais ... p. 719-728.

FUNKQUIST, J. Grey box identification of a continuous digester - distributed

parameter process. STFI (Swidish Pulp and Paper Research Institute), Box 5604, S-

114 86 Stockholm, Sweden. Copyright © 1997 Elsevier Science, LTD.

135

GAMA, L. F, A. Análise de componentes principais para redução de

dimensionalidade das entradas em redes neurais artificiais. 2006. 96p.

Monografia (conclusão de curso Engenharia Elétrica) – Centro Universitário do leste

de Minas Gerais UNILESTE-MG. Cel. Fabriciano Julho de 2006.

GARCIA, C. B. Anatomia, composição e propriedade de 5 madeiras paraguaias.

1995. 126f. Dissertação (Mestrado em Ciência Florestal) – Universidade Federal de

Viçosa,Viçosa, 1995.

GARCIA, C. "Modelagem e Simulação" Editora: USP - 1997;

GBC.In: Introduction to UV-Visible spectroscopy. GBC UV-VIS Cintra 10/20/40

Spectrometer Operation Manual. Dandenong: GBC Scientific Equipment Pty Ltd

1996;1;1-3.

Ge, S. S.; HANG, C. C.; ZHANG, T. Z. Nonlinear adaptive control using neural

networks and its aplication to CSTS systems. Journal of process control 9, p 313-

323, 1998.

GOMES, F. F. V. Aplicações do Infravermelho Próximo por Transformada de

Fourier (FT-NIR) na medição de variáveis na indústria. Coronel Fabriciano,

UNILESTE-MG, junho de 2007, 51 p.

GOMIDE, J. L. Caracterização tecnológica para produção de celulose da nova

geração de clones de Eucalyptus do Brasil. R. Árvore, Viçosa, v.29, p.129-137,

2005.

GOMIDE, J. L. Tecnologia e química da produção de celulose. Curso de pós-

graduação Latu Senso em tecnologia de celulose e papel; Universidade Federal de

Viçosa; 2006.

HAYKIN, S. Neural Networks – A Comprehensive Foundation. New York: Macmillan Publishing Company, 1994.

136

HAYKIN, S. Redes Neurais: princípios e práticas; trad. Paulo Martins Engel. -

2.ed. – Porto Alegre: Bookman 2001.

JENKINS, F. A.; WHITE, H. E. Fundamentals of optics. 4th, ed. Auckland: McGranw-Hill; 1981.

HARKONEN, E. J. A mathematical model for two-phase flow in a continuous

digester; Research engineer, Kamyr; TAPPI Journal, dec. 1987, Sweden.

HOANG, V.; BHARDWAJ, N. K.; NGUYEN, K. L. A FTIR method for

determining the content of hexeneuronic acid (hexA) and Kappa number of a

high-yield kraft pulp. Carbohydrate Polymers 61 (2005) 5–9. 2005.

HOWARD, A.; RORRES C. Álgebra Linear com Aplicações / Anton Howad e Cris

Rorres; trad. Claus Ivo Doering. – 8. ed. – Porto Alegre: Bookman, 2001.

HULST, V. Light scattering by small particles. New York: Dover; 1981.

IYODA, E. M.; Inteligência computacional no projeto automático de redes

neurais híbridas e redes neurofuzzy heterogêneas. Dissertação de mestrado,

programa de pós-graduação da faculdade de Engenharia Elétrica e Computação,

Universidade Federal de Campinas, 2000.

JOHNSON, R. A.; WICHERN D. W. Applied Multivariate Statistical Analysis,

Fifth Edition, cp. 1 – Aspects of Multivariate Analysis, cp. 2 – Matrix Algebra and

Random Vectors, cp. 8 – Principal Components, 2002.

JONES, D. M.; WATTSON, J.; BROWN, K. J. Comparison of hot rolled steel

mechanical property prediction models using linear multiple regression, non-

linear multiple regression and non-linear artificial neural networks. Ironmaking

and Steelmaking, 32(5):435 442, 2005.

137

KAISER, H. F. The Varimax critéria for analytical rotation in factor analysis.

Psychometrica, 23: 141-151, 1958.

KARLSSON, H. AB Lorentzen &Wettre. FIBER GUIDE; Fiber analysis and

process applications in pulp and paper industry. Sweden, 2006.

KASPARIAN, V.; BATUR C. Model reference based neural network adaptative

controller. ISA Transactions 37, 1998 21-39.

KAYIHAN, F. A stochastic continuous digester model to capture transition,

compaction an chip size distribution effects. IETek – Integrated Engineering

Technologies; 2002.

KOGA, M. E. T. Celulose e Papel. Tecnologia de fabricação de pasta celulósica.

Volume 1, 2ª edição, Capítulo 2. São Paulo: IPT-SENAI, 1988.

LANSDELL, O.; CREUS, A.; BONA, E. PPPC (Pulp and Paper Products Council)

Report; Supply and Demand MARKET PULP, April, 2006.

LAPERRIÈRE, L.; LEDUC, C.; DANEAULT C.; BÉDARD, P. Chip properties

analysis for predicting bleaching requirements for TMP pulps. TAPPI Journal,

vol. 3, no. 12, December 2004.

LEMMETI, A.; LEIVISKÄ, K.; SUTINEN, R. Kappa number prediction based

on cooking liquor measurements, Report A No 5, May 1998.

LEE, J. H.; RAJA, A. Subspace Identification Based Inferential Control of A

Continuous Pulp Digester; PSE '97-ESCAPE-7 Joint Conference, Computeres

chem.. Eng, Vol. 21, Suppl., pp. S1143-S1148, 1997, Elsevier Science Ltd.

138

LI, J.; GELLERSTEDT, G.; On the structural significance of kappa number

measurement. In: INTERNATIONAL SYMPOSIUM WOOD PULPING

CHEMICAL, 9.; Montreal, 1997. Proceedings. Montreal: TAPPI, 1997. p.56-71

LJUNG, L. (1987). System Identification – Theory of the user. Prentice-Hall

International, New Jersey.

MACKAY, D. J. C. Bayesian interpolation. Neural Computation. vol. 4, p. 415-

447, 1992.

MALMBERG, B.; EDWARDS, L.; LUNDBORG, S.; AHLROTH,; M.

WARNQVIST. B. Prediction of dust composition and amount in kraft recovery

boilers. TAPPI Journal, March 2005.

MARCOCCIA. B. S.; STROMBERG. B. & PROUGH. J. R. Achieving major

increases in hardwood yield with Lo-Solids. In: BREAKING THE PULP YIELD

BARRIER SYMPOSIUM. Atlanta. TAPPI. 1998.

MARQUES, A. R.; FOEKEL, C. E. B. & OLIVERA. L. M. Otimização da relação

tempo-temperatura na produção de celulose Kraft de Eucalypts Urophilla de

origem híbrida. In: Anais do XII Congresso Anual de Cleulose e Papel da ABTCP.

p. 5-15. São Paulo, 1979.

MICHELSEN, F. A.; FOSS, B. A. A dynamic model of the interaction between

the chemical reactions and the residence time in a continuous digester. TAPPI

Journal, vol. 79: no. 4. Ap. 1996.

MOCZYDLOWER, D. Modelagem e Controle de um Digestor Contínuo de

Celulose. 2002. Dissertação (Mestrado em Engenharia Química) – Programa de

Engenharia Química do Instituto Alberto Luis Coimbra de Pós-Graduação e Pesquisa

em Engenharia - PEQ-COPPE-UFRJ, Rio de Janeiro, RJ.

139

MOKFIENSKI, A. Importância da densidade e do teor de carboidratos totais da

madeira de eucalipto no desempenho da linha de fibras. In: Colóquio

internacional sobre celulose Kraft de Eucalipto, 2003, Viçosa. p. 15-38.

MOLLER, M. F. A scaled conjugate gradient algorithm for fast supervised

learning. Neural Networks, Vol. 6, pp. 525-533, 1993;

MONTEIRO, L. R.; REIS, S. F. Princípios de Morfometria Geométrica. Holos

Editora, Ribeirão Preto, Brasil,1999,198p.

MORGANO, M. A.; FARIA, C. G.; FERRÃO, M. F.; FERREIRA, M. M. C.

Determinação de açúcar total em café cru por espectroscopia no infravermelho

próximo e regressão por mínimos quadrados parciais, Química

Nova, vol.30 nº.2, São Paulo, 2007.

PADHIYAR, N.; GUPTA, A.; GAUNTAM, A.; BHARTIYA, S.; DOYLE III, F. J.;

DASH, S.; GAIKWAD, S. Nonlinear inferential multi-rate control of kappa

number at multiple locations in a continuous pulp digester. Journal of Process.

2006.

PASQUINI, J. L. Caracterização tecnológica para produção de celulose da nova

geração de clones de Eucalyptus do Brasil. R. Árvore, Viçosa, v.29, p.129-137,

2005.

PASQUINI, C.; CARNEIRO, C. J. G.; BOMFIM, P. M. Desenvolvimento e

validação de modelos multivariados empregando espectrometria no

infravermelho próximo para estimativa de características da madeira de

Eucalipto. R. O Papel, São Paulo, Março 2007, p. 71-83, 2007.

PHILIPS NV Gloeilampenfabrieken. Manual de Iluminação. Eindhoven: 1981.

PIOTTO, Z. C. Eco-eficiência na indústria de celulose e papel - estudo de caso.

140

2003. Tese. Escola Politécnica da Universidade de São Paulo. São Paulo SP, 2003,

379p.

POLIT, M.; ESTABEM, M.; LABAT, P. A fuzzy model for an anaerobic digester,

comparison with experimental results. Enginneering Aplications of Artificial

Intelligence 15; p. 385-390; 2002.

POUGACTH, K.; SALCUDEAN, M.; GARTSHORE, I. A numerical model of the

reacting multiphase flow in a pulp digester; Aplpied Mathematical Modelling 30

(2006), p. 209-230; march 2005.

PREMIER, G. C.; DINSDALE, R.; GUWY, A. J.; HAWKES, F. R.; HAWKES, D.

L.; WILCOX, S. J. A comparison of the ability of blackbox of arx structure to

represent a fluidized bed anaerobic digestion process. Wat. Res. Vol.33, no. 4, pp.

1027-1037, 1999.

QIAN Y.; LIU H.; ZHANG X.; TESSIER P. J. C.; Optimization of a wood chip

refining process based on fuzzy relational models. Computers Chemical

Engineering, vol. 21; Suppl., p. S1137-S1142, 1997. Elsevier Science LTD.

QUEIROZ, S. C. S.; GOMIDE, J. L.; COLODETTE, J. L.; OLIVEIRA, R. C.

Influência da Densidade Básica da madeira na qualidade da polpa Kraft de

clones híbridos de Eucalyptus grandis W. Hill ex Maiden X Eucalyptus urophila

S. T. Blake; R. Árvore, Viçosa-MG, v.28, n.6, p.901-909, 2004.

RUBINI, B. R.; YAMAMOTO, C. Development of predictive oxygen

delignification models using kinetic expressions and neural networks. TAPPI

Joournal, vol. 5, no. 4, 2006.

RUMELHART, D. E.; HILTON, G. E.; WILLIANS, R.J. Learning representations

by back-propagating errors. Nature, 323:533-536, 1986.

141

RUMELHART, D. E. and McCLELLAND, editors. Parallel distributed process:

explorations in the microstructure cognition, v. 1; Foundation Mit Press. (1986).

SANTOS, R. B.; SOUZA, L. C.; GOMIDE, J. L. Utilização de cavacos para

análises por espectrometria de infravermelho próximo (NIR). Revista O Papel, nº

5, ano 2006, p. 84-88. SP.

SCAFI, S. H. F.; PASQUINI, C. Sistema de Monitoramento em Tempo Real de

Destilação de Petróleo e Derivados Empregando a Espectroscopia no

Infravermelho Próximo. 2005. 196p. Dissertação (Doutorado) – Universidade

Estadual de Campinas. Campinas, 2005.

SKOGLUND, A.; KESSLER, W.; KESSLER, R. W.; BRUNDIN, A.;

MANDENIUS, C. F. On-line spectroscopic measurements of wood chips before a

continuous digester. Chemometrics and Intelligent Laboratory Systems, 70 (2004),

p.129– 135.

SHIN, N. H.; STROTROMBERG, B. Impact of Cooking Conditions On Pulp

Yield And Other Parameters, Andritz Inc. 13 Pruyn’s Island Drive, Glens Falls,

NY 12801

SIDRAK, Y.; AWAMI, A. L. Understanding the dynamic behavior of Kamyr

digesters, ISA Transactions 37 (1998) 53 – 64.

SILVA, L. N. C. Análise e síntese de estratégias de aprendizado para redes

neurais artificiais. Dissertação de Mestrado, Programa de Pós-Graduação da

Faculdade de Engenharia Elétrica e de Computação - Universidade Estadual de

Campinas, 1998.

SPIEGEL, M. R. Schaum’s Outline of Theory and Problems of Estatistics: 13th

Edition. Brasil: McGraw-Hill, inc, 1979, 580p.

142

TAKAHASHI, H, J. Predição de propriedades mecânicas de aços de alta

resistência microligados utilizando técnicas de inteligência computacional. 2006.

128p. Dissertação de Mestrado – Centro Universitário do Leste de Minas Gerais

UNILESTE-MG. Cel. Fabriciano Dezembro de 2006.

TEIXEIRA, R. A. Treinamento de Redes Neurais Artficais Através de

Otimização Multiobjetivo: Uma Abordagem para o Equilíbrio entre a

Polarização e a Variáncia. Tese de Doutorado, Programa de Pós-Graduação em

Engenharia Elétrica - Universidade Federal de Minas Gerais, 2001.

TEIXEIRA, R. A. Redes Neurais Artificiais. Notas de Aula. Centro Universitário

do Leste de Minas Gerais, Brasil, 2005.

TAPPI (Technical Association for the Pulp, Paper, and converting Industry) T236 cm-85.

THURSTONE, L. L. Multiple factor analysis. Chicago, University of Chicago Press, 1947.

TINO, V. F. Utilização de análise de componentes principais na regulagem de

máquinas de injeção plástica, 2005, 79p, Dissertação (Mestrado) – Universidade

Federal do Rio de Janeiro, Rio de Janeiro, 2005.

TOMAZELLO, F. M. Formação e caracterização da estrutura anatômica da

madeira de Eucalyptus. In. Curso de processamento mecânico e secagem da

madeira de Eucalyptus. Piracicaba, IPEF, 1994.

VILELA, R. R. Descrição e balanço de massa de um digestor Lo-Solids. Coronel

Fabriciano: UNILESTE, 2006. (Monografia final do curso de Engenharia Mecânica).

VROON, K. E. (1957). The “H” Factor: A mean of expressing cooking times and

temperature as a single variable. Pulp and Paper Canada, 58(3), 228-231.

YU, D. L.; GOMM, J. B. Implementation of neural network predictive control to

143

a multivariable chemical reactor. Control Engineering Practice 11. p. 1315-1323,

2003.

WILDROW, B.; HOFF, M. E. Adaptative switching circuits. Institute of Radio

Engineers, Western Electronic Show and Convention, 1960.

WISNEWSKI P. A.; DOYLE III, F. J.; KAYAHAN, F. A Fundamental

continuous pulp digester model for simulation and control. IEEE Transactions of

Control Systems Technology, 1998.

WISNEWSKI P. A.; DOYLE III, F. J. Control structure selection and model

predictive control of the Weyerhaeuser digester problem; J. Proc. Cont. Vol. 8.

Nos. 5 6, pp. 487 - 495. 1998; 1998 Elsevier Science Ltd.

WISNEWSKI P. A.; DOYLE III; F. J. Model-Based Predictive Control Studies

for a Continuous Digester, IEEE Transactions of Control Systems Technology, vol.

9, No. 3, May 2001.

utilizaÇÃo de redes neurais artificiais e … · kappa em um processo kraft de cozimento de...

Documents