Download - LAURO BERNARDINO COELHO JUNIOR - UFV
ix
LAURO BERNARDINO COELHO JUNIOR
MODELAGEM HÍBRIDO-NEURAL DA EXTRAÇÃO LÍQUIDO-LÍQUIDO DAS PROTEÍNAS DO SORO DE QUEIJO COM SISTEMAS AQUOSOS
BIFÁSICOS EM EXTRATOR GRAESSER
VIÇOSA MINAS GERAIS – BRASIL
2001
x
LAURO BERNARDINO COELHO JUNIOR
MODELAGEM HÍBRIDO-NEURAL DA EXTRAÇÃO LÍQUIDO-LÍQUIDO DAS PROTEÍNAS DO SORO DE QUEIJO COM SISTEMAS AQUOSOS
BIFÁSICOS EM EXTRATOR GRAESSER
Tese apresentada à Universidade Federal de Viçosa, como parte das exigências do Programa de Pós-Graduação em Ciência e Tecnologia de Alimentos, para obtenção do título de “Magister Scientiae”.
VIÇOSA MINAS GERAIS – BRASIL
2001
xi
LAURO BERNARDINO COELHO JUNIOR
MODELAGEM HÍBRIDO-NEURAL DA EXTRAÇÃO LÍQUIDO-LÍQUIDO DAS PROTEÍNAS DO SORO DE QUEIJO COM SISTEMAS AQUOSOS
BIFÁSICOS EM EXTRATOR GRAESSER
Tese apresentada à Universidade Federal de Viçosa, como parte das exigências do Programa de Pós-Graduação em Ciência e Tecnologia de Alimentos, para obtenção do título de “Magister Scientiae”.
APROVADA: 30 de agosto de 2001.
Profª . Jane Sélia dos Reis Coimbra Prof. José Antônio M. Pereira (Conselheira) (Conselheiro)
Prof. Luis Henrique Mendes Silva Prof. Sandra Regina S. Ferreira
Prof. Luís Antônio Minim (Orientador)
xii
A Deus, que por Seu amor grandioso me deu forças para completar mais esta
etapa em minha vida. À minha querida esposa Nástia, pelo auxílio, incentivo e
dedicação. Ao meu pai e minhas irmãs pelo amor e apoio.
xiii
AGRADECIMENTOS
À Universidade Federal de Viçosa e ao Departamento de Tecnologia
de Alimentos, pela oportunidade oferecida.
À Coordenação de Aperfeiçoamento de Pessoal de Nível Superior
(CAPES/PEG-PG), FAPEMIG e ao CNPq, pelo auxílio financeiro.
Ao Prof. Dr. Luís Antônio Minim, pela oportunidade, pela orientação,
pelo apoio e os ensinamentos durante o período de realização deste trabalho.
Aos Profs. Drs. Jane Sélia dos Reis Coimbra e José Antônio Pereira,
pelas valiosas contribuições como conselheiros, e aos Profs. Drs. Sandra
Regina Salvador Ferreira e Luis Henrique Mendes Silva pela participação nas
correções deste trabalho.
À minha querida esposa, pelo apoio e compreensão nos momentos
mais difíceis, e por sempre acreditar em mim. À minha família, pelo carinho e
incentivo. Aos meus irmãos na fé da IASD - Viçosa que me apoiaram e
tornaram nosso período em Viçosa inesquecível.
Aos grandes amigos que contribuíram em muito na execução e término
deste trabalho Ms. Abraham Damian Giraldo Zuñiga e Ms. Sérgio Henriques
Saraiva. À estudante de Engenharia de Alimentos Mariana, pela colaboração
oportuna durante a realização dos experimentos.
E aos amigos Jean, Elias, Renata, Ximena, Eliana, Edgard e Edwin
pelo auxílio e companheirismo, e a todos aqueles que, de alguma maneira
também contribuíram para a realização deste trabalho.
xiv
BIOGRAFIA
LAURO BERNARDINO COELHO JUNIOR, filho de Lauro Bernardino
Coelho e Maria Geraldo Coelho, nasceu em Itajaí, Estado de Santa Catarina,
em 02 de fevereiro de 1974.
Concluiu o curso de Engenharia de Alimentos pela Universidade
Federal de Santa Catarina, em setembro de 1998.
Em outubro de 1998, iniciou o curso de Mestrado em Ciência e
Tecnologia de Alimentos na Universidade Federal de Viçosa, concentrando os
estudos na área de Simulação de Processos em Biosseparação.
Em agosto de 2001, submeteu-se ou exame final de defesa de tese.
xv
ÍNDICE
LISTA DE TABELAS.................................................................................... viii
LISTA DE FIGURAS.................................................................................... ix
LISTA DE SIMBOLOS.................................................................................. xiii
RESUMO...................................................................................................... xv
ABSTRACT.................................................................................................. xvii
1. INTRODUÇÃO......................................................................................... 01
2. REVISÃO DE LITERATURA.................................................................... 04
2.1. Soro de Queijo.................................................................................. 04
2.1.1. Proteínas do Soro...................................................................... 06
2.2. Extração Líquido-Líquido.................................................................. 08
2.2.1. Tipos de Extratores Líquido-Líquido.......................................... 11
2.2.2. Extrator Graesser....................................................................... 13
2.3. Sistemas Aquosos Bifásicos............................................................. 15
2.4. Hidrodinâmica e Transferência de Massa em Extratores................. 16
2.4.1. Coeficiente de Partição.............................................................. 16
2.4.2. Fração Retida da Fase (“hold-up”)............................................ 17
2.4.3. Distribuição de Tempos de Residência..................................... 17
2.4.4. Número de Peclet...................................................................... 19
2.4.5. Número de Unidades de Transferência..................................... 19
2.4.6. Modelos de Transferência de Massa......................................... 20
2.4.6.1. Modelo da Dispersão.......................................................... 21
2.5. Redes Neurais Artificiais.................................................................. 25
2.5.1. Analogia com o Cérebro Humano.............................................. 27
2.5.2. Componentes de um Nodo........................................................ 29
2.5.3. Topologias de Redes Neurais.................................................... 31
2.5.4. Desenvolvimento de uma Rede Neural..................................... 32
2.5.5. Redes Neurais como Ferramenta de Modelagem..................... 34
xvi
2.5.6. Aplicações de Redes Neurais.................................................... 36
2.6. Modelagem Híbrido-Neural............................................................... 38
2.7. Geração de Dados Semi-Empíricos.................................................. 40
3. MATERIAL E MÉTODOS......................................................................... 46
3.1. Seleção e Caracterização do Sistema de Trabalho.......................... 46
3.1.1. Preparo dos Sistemas de Fases................................................ 46
3.1.2. Quantificação de α-lactoalbumina e β -lactoglobulina nas fases 47
3.1.2.1. Curvas de Calibração......................................................... 48
3.2. Experimentos de Transferência de Massa........................................ 49
3.2.1. Extrator Graesser....................................................................... 49
3.2.2. Condições Operacionais............................................................ 51
3.2.3. Preparação do Sistema............................................................. 51
3.2.3.1. Coleta de Dados no Extrator.............................................. 52
3.3. Simulação da Extração das Proteínas.............................................. 52
3.3.1. Determinação dos Parâmetros Físicos...................................... 52
3.3.2. Modelagem Utilizando Redes Neurais Artificiais....................... 53
3.3.2.1. Geração de Dados Semi-Empíricos................................... 53
3.3.2.2. Aplicação das Redes Neurais............................................. 54
3.3.3. Modelagem Híbrida.................................................................... 55
4. RESULTADOS E DISCUSSÃO............................................................... 57
4.1. Transferência de Massa.................................................................... 57
4.1.1. Seleção do Sistema de Trabalho............................................... 58
4.1.2. Caracterização Hidrodinâmica do Extrator Graesser................ 58
4.1.3. Determinação da Concentração de α -lactoalbumina e
β-lactoglobulina.........................................................................
59
4.1.4. Experimentos no Extrator.......................................................... 59
4.1.4.1. Separação Contínua das Proteínas do Soro de Queijo..... 60
4.1.4.2. Influência da Mistura Axial na Transferência de Massa..... 63
4.1.5. Cálculo do Número de Unidades de Transferência................... 66
4.2. Geração do Dados Semi-Empíricos.................................................. 70
4.3. Modelagem Híbrida........................................................................... 79
4.3.1. Desenvolvimento da Rede Neural............................................. 80
xvii
4.3.1.1. Determinação da Topologia da Rede e da Taxa de
Aprendizagem.....................................................................
81
4.3.1.2. Curva de Aprendizagem..................................................... 84
4.3.1.3. Desempenho da Rede Neural............................................ 86
4.3.2. Modelagem Híbrido-Neural........................................................ 88
5. CONCLUSÕES........................................................................................ 92
REFERÊNCIAS BIBLIOGRÁFICAS............................................................. 95
xviii
LISTA DE TABELAS
Tabela 2.1 - Comparação entre a constituição do leite humano e bovino... 05
Tabela 3.1 - Dimensões do extrator Graesser utilizado nos experimentos.. 50
Tabela 3.2 - Condições operacionais do extrator para o estudo da
transferência de massa............................................................
51
Tabela 4.1 - Valores de Peclet e número de unidades de transferência
estimados a partir dos dados experimentais de
caracterização hidrodinâmica e transferência de massa para
o extrator Graesser..................................................................
69
Tabela 4.2 - Análise de Variância, teste t e R2 para o modelo descrito
pela equação 4.8......................................................................
71
Tabela 4.3 - Análise de Variância, teste t e R2 para o modelo descrito
pela equação 4.9......................................................................
73
Tabela 4.4 - Análise de Variância, teste t e R2 para o modelo descrito
pela equação 4.10....................................................................
74
Tabela 4.5 - Desempenho R1 (equação 4.11) apresentado pelas
diferentes técnicas analisadas.................................................
76
Tabela 4.6 - Análise de variância (rede com uma camada interna)............. 82
Tabela 4.7 - Análise de variância (rede com duas camadas internas)........ 82
xix
LISTA DE FIGURAS
Figura 2.1 - Composição dos compostos nitrogenados no soro de queijo 06
Figura 2.2 - Distribuição dos componentes e formação das fases ao
longo do tempo após a adição do solvente............................
09
Figura 2.3 - Diferentes tipos de extratores líquidos................................... 12
Figura 2.4 - Diagrama esquemático das correntes de entrada e saída
no Extrator..............................................................................
13
Figura 2.5 - Visão transversal do Extrator Greasser................................. 14
Figura 2.6 - Arquitetura de uma rede neural do tipo feedforward com 3
camadas.................................................................................
26
Figura 2.7 - Componentes do neurônio biológico...................................... 28
Figura 2.8 - Anatomia de um nodo, em que: ai representam as
entradas, W i j os fatores pesos, f(xj) a função transferência
signoidal, TJ o limiar interno, bJ a saída.................................
30
Figura 2.9 - Construção de um modelo híbrido neural em série............... 39
Figura 2.10 - Extrapolação a partir de diferentes pontos experimentais..... 42
Figura 2.11 - Representação de um dado semi-empírico pela técnica
MEM.......................................................................................
45
Figura 3.1 - Montagem experimental do Extrator Graesser...................... 49
Figura 3.2 - Visualização do corpo interno do Extrator Graesser.............. 50
x
Figura 3.3 - Etapas do procedimento geral para elaborar uma rede
neural.....................................................................................
55
Figura 4.1 - Cromatograma do soro de queijo in natura............................ 59
Figura 4.2 - Concentração adimensional de β-lg nas saídas das fases.
Parâmetro: relação de vazão entre a fase polimérica e
salina. 1: Vazão(fase salina) = 80 mL/min e Vazão(fase polimérica) =
60 mL/min. 2: Vazão(fase salina) = 80 mL/min e Vazão(fase
polimérica) = 40 mL/min. 3. Vazão(fase salina) = 60 mL/min e
Vazão(fase polimérica) = 60 mL /min)............................................
61
Figura 4.3 - Concentração adimensional da α -la nas saídas das fases.
Parâmetro: relação de vazão entre a fase polimérica e
salina. 1: Vazão(fase polimérica) = 60 mL/min e Vazão(fase salina) =
80 mL/min. 2: Vazão(fase polimérica) = 60 mL/min e Vazão(fase
salina) = 60 mL/min...................................................................
63
Figura 4.4 - Influência da velocidade de rotação sobre o valor de Peclet
na fase salina (Vazão da fase polimérica =
60 mL/min).............................................................................
64
Figura 4.5 - Influência da velocidade de rotação sobre o valor de Peclet
na fase polimérica (Vazão da fase salina =
80 /min)..................................................................................
65
Figura 4.6 - Perfil de concentração adimensional da α-la para a
velocidade de rotação = 6,6 rpm. Vazão(fase salina) =
80 mL/min, Vazão(fase polimérica) = 60 mL/min............................
68
Figura 4.7 - Perfil de concentração adimensional da α-la para a
velocidade de rotação = 6,6 rpm. Vazão(fase salina) =
60 mL/min, Vazão(fase polimérica) = 60 mL/min............................
69
Figura 4.8 - Comparação entre o número de Peclet experimental na
fase x e o calculado através do modelo da regressão
(equação 4.8).........................................................................
72
Figura 4.9 - Comparação entre o número de Peclet experimental na
fase y e o calculado através do modelo da regressão
(equação 4.9).........................................................................
73
xi
Figura 4.10 - Comparação entre o Nox experimental e o calculado
através do modelo da regressão (equação 4.10)..................
75
Figura 4.11 - Valores de Pex estimados pelas técnicas aplicadas,
utilizando os 9 pontos experimentais e a equação 4.8 para
uma relação de vazão de 0,75...............................................
77
Figura 4.12 - Valores de Pey estimados pelas técnicas aplicadas
utilizando os 9 pontos experimentais e a equação 4.9 para
uma relação de vazão de 0,50...............................................
78
Figura 4.13 - Valores de Nox estimados pelas técnicas aplicadas
utilizando os 9 pontos experimentais e a equação 4.10 para
uma relação de vazão de 1,00...............................................
79
Figura 4.14 - Erro quadrado médio em função do número de nodos na
camada interna para redes com uma camada interna e
duas camadas internas..........................................................
83
Figura 4.15 - Topologia da rede neural com duas camadas internas
selecionada para a simulação dos parâmetros......................
84
Figura 4.16 - Erro quadrado médio para as etapas de treinamento e
validação em função do número de ciclos utilizados no
treinamento............................................................................
85
Figura 4.17 - Comparação entre os valores preditos pela rede neural e
os valores do conjunto de teste para o parâmetro Nox.........
86
Figura 4.18 - Comparação entre os valores preditos pela rede neural e
os valores do conjunto de teste para o parâmetro Pex..........
87
Figura 4.19 - Comparação entre os valores preditos pela rede neural e
os valores do conjunto de teste para o parâmetro Pey..........
88
Figura 4.20 - Comparação entre as concentrações simuladas pelo
modelo da dispersão axial, modelo híbrido e os dados
experimentais. Vazão da fase salina = 60 mL/min e Vazão
da fase polimérica = 60 mL/min.............................................
89
Figura 4.21 - Comparação entre as concentrações simuladas pelo
modelo da dispersão axial, modelo híbrido e os dados
experimentais. Vazão da fase salina = 80 mL/min e Vazão
da fase polimérica = 40 mL/min.............................................
90
1
Figura 4.22 - Comparação entre as concentrações simuladas pelo
modelo da dispersão axial, modelo híbrido e os dados
experimentais. Vazão da fase salina = 80 mL/min e Vazão
da fase polimérica = 60 mL/min.............................................
91
2
LISTA DE SÍMBOLOS
NOMENCLATURA
a, área interfacial ................................................................................... m2
av, área interfacial por unidade de volume............................................. m2/m3
Ci, concentração no instante ti............................................................... g/mL
cx, concentração do soluto na fase x..................................................... kg/m3
cy, concentração do soluto na fase y..................................................... kg/m3
0xc , concentração na alimentação da fase x.......................................... kg/m3
Dx, coeficiente de dispersão axial da fase x.......................................... m2/s
Dy, coeficiente de dispersão axial da fase y.......................................... m2/s
Kox, coeficiente global de transferência de massa................................. m/s
L, comprimento total do extrator............................................................ m
ti, tempo.................................................................................................. min
Ux, velocidade linear média na fase x.................................................... m/s
Uy, velocidade linear média na fase y.................................................... m/s
Vo, volume da fase de interesse no interior do equipamento................ L
Vot, volume total no interior do equipamento........................................ L
Vx, vazão da fase x................................................................................ mL/min
Vy, vazão da fase y................................................................................ mL/min
z, distancia axial, medida da entrada da fase x na direção do
escoamento............................................................................................
m
∆ti, intervalo de tempo............................................................................ min
ADIMENSIONAIS
Cx, concentração admensionalizada do soluto na fase x
Cy, concentração admensionalizada do soluto na fase y
m, coeficiente de partição
3
Nox, número de unidades de transferência para a fase x
Pex, número de Peclet na fase x
Pey, número de Peclet na fase y
R, relação de velocidade de agitação
tr, tempo de residência
Z, comprimento adimensional ao longo da coluna
φ, fração de volume da fase, “Hold - Up”
λ, relação de vazão das fases
ABREVIATURAS
α-la, α-lactoalbumina
β-lg, β-lactoglobulina
DTR, distribuição de tempos de residência
GDS3, técnica alternativa para geração de dados semi-empíricos baseada em erros de modelagem
GDSE1, técnica desenvolvida por TSEN (1996) através da expansão em série de Taylor de primeira ordem
GDSE2, técnica para geração de dados semi-empíricos descrita por STUART através da expansão em série de Taylor de ordem zero
HTU, altura da unidade de transferência
MM, massa molecular
NTU, número de unidades de transferência
Pe, número de Peclet
PEG, polietilenoglicol
QP, regra de aprendizagem Quick Propagation
SAB, sistema aquoso bifásico
4
RESUMO
COELHO JUNIOR, Lauro Bernardino, M.S., Universidade Federal de Viçosa, agosto de 2001, Modelagem Híbrido-Neural da Extração Líquido-Líquido das
Proteínas do Soro de Queijo com Sistemas Aquosos Bifásicos em Extrator Graesser. Orientador: Luis Antônio Minim. Conselheiros: Jane Sélia dos Reis Coimbra e José Antônio Marques Pereira.
Este trabalho apresenta os resultados obtidos na aplicação da técnica de modelagem híbrido-neural da extração líquido-líquido com sistemas aquosos
bifásicos em extrator Graesser. Foi estudada a separação das proteínas αα -
lactoalbumina e ββ-lactoglobulina do soro de queijo em sistemas aquosos bifásicos
compostos por 18 % em peso de polietilenoglicol 1500 e 18 % em peso de fosfato de potássio em pH 7. Foi empregada uma rede neural do tipo feedforward para
predizer os parâmetros de transferência de massa Peclet (Pe) e número de unidades de transferência (Nox) em função das variáveis operacionais velocidade
de rotação e relação de vazões das fases. Dado a escassez de dados experimentais, dados semi-empíricos foram gerados através de uma técnica alternativa baseada em erros de modelagem (GDS3), para treinamento e validação da rede. A
topologia da rede foi determinada utilizando a técnica de superfície de resposta, que forneceu valores ótimos do número de camadas escondidas, do número de
nodos nestas camadas e da taxa de aprendizagem. Foi definida uma rede do tipo 2-10-5-3, com uma taxa de aprendizagem de 0,001. Os dados experimentais para estudo de transferência de massa foram obtidos em um extrator do tipo Graesser.
As variáveis testadas foram relação de vazão das fases e velocidade de rotação. Tendo sido usados os dados experimentais como parte do conjunto de dados para
testar a rede, pode -se notar sua grande performance na predição dos parâmetros Pe e Nox em função das variáveis operacionais do extrator. O modelo da operação de extração foi obtido através do balanço diferencial de massa no extrator
Graesser, para ambas as fases, tendo como parâmetros Pe e Nox. A simulação da operação foi realizada após a solução das equações diferenciais pelo método de Gauss-Seidel, sendo os parâmetros de transferência de massa Pe e Nox fornecidos pela rede neural, em função das variáveis operacionais do equipamento. O modelo híbrido-neural correlacionou os dados experimentais com boa acuracidade. Esta
abordagem mostrou-se uma alternativa promissora para a modelagem de operações complicadas, como é o caso da extração líquido-líquido em extrator
Graesser.
5
ABSTRACT
COELHO JUNIOR, Lauro Bernardino, M.S., Universidade Federal de Viçosa, August, 2001, Hybrid Neural Modeling of The Liquid-Liquid Extraction of the Whey Proteins Using Aqueous Two-Phase Systems in a Graesser Contactor. Advisor: Luis Antônio Minim. Committee Members: Jane Sélia dos Reis Coimbra and José Antônio Marques Pereira.
This work presents the results acquired by applying the hybrid neural
modeling technique of the liquid-liquid extraction in a Graesser Contactor. The operation of separating the αα -lactalbumin and ββ-lactoglobulin whey’s proteins was
studied in a aqueous two-phase system composed by 18% polyethylene glycol (w/w) and potassim phosphate in pH 7 (w/w). A feedforward network was used to
predict the Peclet (Pe) mass transfer parameters and the number of transfer unit (NTU) as a function of the operating variables speed agitation and flow ratio. Because of the scarcity of available data, a semi-empirical GDS3 based technique
was used to generate the data for training and evaluating the network. Its topology was determined using the response surface technique which provided the optimum
value for the number of hidden layers, the number of nodes for these layers and the learning rate. A 2-10-5-3 network was defined with a learning rate of 0,001. Because experimental data was used as part of the data set to test the network, we
notice the network great performance in predicting the Pe and NTU parameters as function of the extractor operating variables. The extracting operation model was obtained by the mass differential balance in the Graesser contactor, for both phases, using Pe and NTU as parameters. The simulating was carried out after solving the differential equations using the Gauss-Seidel method with the Pe and
NTU mass transfer parameters given by the neural network, and function of the equipment operating variables. The hybrid neural model correlated the
experimental data with good accuracy. We can notice that this broaching could be a promising alternative for modeling complex operations like the liquid-liquid extraction in the Graesser contactor.
6
1. INTRODUÇÃO
Com o desenvolvimento de novas técnicas de separação e purificação
de biocompostos nos últimos anos, a modelagem e simulação destas faz-se
necessária, pois permitem o controle e a ampliação de escala nos mais
variados seguimentos industriais.
Em alguns ramos da indústria de alimentos uma grande quantidade de
subprodutos obtidos durante o processamento ainda não é devidamente
reaproveitada de forma eficiente. Como por exemplo o soro de queijo que é um
subproduto da industria de laticínios, rico em proteínas que possuem elevado
valor nutricional e funcional. Uma maneira de reutilizar estas proteínas do soro
para o consumo humano é através do emprego em formulações alimentares,
consideradas como ingredientes alimentícios potenciais em produtos para
lactantes e gestantes, panificação e na fortificação de cereais com capacidade
para substituir outras mais caras, como por exemplo as proteínas de ovo.
Como o soro de queijo é praticamente o leite bovino de onde foi
retirada a fraç ão da caseína, é qualificado para o emprego na formulação de
alimentos infantis em substituição ao leite materno. Entretanto, deve-se
considerar que o uso direto do soro nos alimentos infantis eleva o conteúdo de
β-lactoglobulina (β -lg) quando comparado ao leite materno. Esse último
4
apresenta somente resíduos de β-lg, considerada o maior componente
alergênico do leite bovino (CHEN, 1992). Desta maneira, surgiu a importância
do desenvolvimento de processos de separação desta proteína do soro.
Adicionalmente, quando o soro é descartado sem tratamento adequado em
solos e leitos de rios é considerado um resíduo altamente poluente, devido a
sua alta demanda bioquímica de oxigênio.
A extração líquido-líquido com Sistema Aquoso Bifásico (SAB) foi bem
sucedida na separação das proteínas do soro e, entre os equipamentos de
extração líquido-líquido disponíveis no mercado, o extrator Graesser é um dos
mais adequados ao manuseio de SABs (COIMBRA, 1995; ZUNIGA, 2000).
A modelagem e simulação da transferência de massa em extratores
possibilita a determinação das melhores condições operacionais do
equipamento, as quais resultam em uma eficiência máxima. Alguns modelos
que utilizam unicamente os princípios básicos de conservação de massa e
determinadas correlações empíricas, podem ser aplicadas para a modelagem e
simulação da extração líquido-líquido. O modelo da dispersão axial foi
empregado com êxito por COIMBRA (1995), mas a dificuldade encontrada para
a aplicação deste modelo reside na determinação dos seus parâmetros,
Número de Unidades de Transferência e número de Peclet. Esta determinação
demanda bastante tempo e o custo dos experimentos é elevado.
Uma outra técnica de modelagem aplicável à extração líquido-líquido
faz uso de uma rede neural cujo modelo matemático é inspirado na estrutura
neural de organismos inteligentes e que adquirem conhecimento através da
experiência. Redes neurais não necessitam conhecer a natureza dos sistemas
nem as correlações entre as variáveis e os parâmetros destes sistemas mas
precisam de dados experimentais suficientemente representativos (ALDRICH e
SLATER, 1995). Apesar das vantagens apresentadas pelas redes neurais,
como características de generalização e baixo tempo computacional, elas
também possuem certas desvantagens, como a estimação de parâmetros sem
significado físico, um longo período de treinamento e a necessidade de um
considerável conjunto de dados experimentais, nem sempre disponíveis.
5
A modelagem híbrido-neural é uma forma de superar as falhas
resultantes da modelagem feita unicamente através de redes neurais. Este
processo assegura o significado físico dos parâmetros envolvidos na
modelagem incorporando as restrições dos mesmos por meio de informações
obtidas a partir de modelos matemáticos baseados nos princípios de
conservação. Embora o ajuste desses modelos necessite de um conjunto de
dados menor do que as redes neurais, ainda requerem um conjunto de dados
grande o suficiente para dificultar o seu uso em algumas situações práticas.
Neste caso, a solução pode ser encontrada através da criação de uma certa
quantidade de dados semi-empíricos, baseados em uma combinação
ponderada de dados experimentais e simulados a partir de modelos
(FONSECA, 1999).
Baseado no exposto e na carência de informações sobre a simulação e
a modelagem híbrido-neural de uma operação de extração líquido-líquido
utilizando SABs em um extrator Graesser, o presente trabalho teve como
objetivos:
• Estudar a transferência de massa em um extrator Graesser, determinando o
parâmetro número de unidade de transferência na fase x (Nox) em função
das variáveis operacionais velocidade de rotação e relação de vazões das
fases;
• Utilizar técnicas de geração de dados semi-empíricos a fim de aumentar o
tamanho do conjunto de dados, tornando possível a implementação de uma
rede neural para predizer os parâmetros do processo;
• Mapear os valores dos parâmetros número de Peclet na fase x e y (Pex e
Pey) e Nox em função das condições operacionais no extrator,
desenvolvendo uma rede neural do tipo feedforward através da utilização do
Quick Propagation como regra de aprendizagem;
• Desenvolver um modelo híbrido-neural baseado no modelo da dispersão
axial para predição do perfil de concentração das fases ao longo do
extrator.
6
2. REVISÃO DE LITERATURA
2.1. Soro de Queijo
Na prática industrial, o soro de queijo é um subproduto oriundo tanto do
processamento da caseína quanto de queijos. Representa aproximadamente
85% do volume inicial do leite e quando lançado em um curso de água provoca
sérios efeitos poluidores. As bactérias e outros microrganismos aquáticos
atacam alguns dos componentes do soro (em especial a lactose) e, para isto,
consomem o oxigênio dissolvido na água, causando a destruição de animais e
plantas aquáticos. A demanda bioquímica de oxigênio (DBO) do soro varia
entre 30000 e 60000 mg/L. Considerando o coeficiente de Imhoff, que
estabelece a carga poluente lançada por um habitante/dia como equivalente a
uma DBO de 54000 mg de O2, um litro de soro corresponde aproximadamente
à poluição diária lançada por um habitante (CHEFTEL et al., 1989).
O soro tem uma composição global semelhante à do leite, privado da
caseína. Seu extrato seco é reduzido e representa em média 7% do peso total.
No entanto, é bastante rico possibilitando o aproveitamento comercial de seus
nutrientes e sua composição média compreende: lactose (70 a 80)%,
compostos nitrogenados (10 a 14)% e matérias minerais (1,5 a 4)%
(CHEFTEL et al., 1989).
5
Por se tratar de uma solução muito rica em nutrientes, o soro tratado
tem sido utilizado como adubo, na alimentação animal, na fabricação de
derivados do soro e bebidas lácteas, e também como ingrediente na
formulação de alguns alimentos.
A presença de proteínas compostas por aminoácidos em quantidades equilibradas torna o soro um material adequado para uso na alimentação humana (TOSI et al., 1997). O soro de queijo concentrado pode ser tratado para isolar suas proteínas, a exemplo de β -lactoglobulina (β -lg) e α-lactoalbumina (α -la), bem como para separar lactose e gerar hidrolisados compostos por glicose e galactose, aumentando a sua utilização nas industrias de alimentos.
A aplicação destas proteínas na tecnologia de alimentos tem-se
desenvolvido principalmente nas formulações de alimentos para o consumo
humano visando regular a relação proteínas/caseína do leite materno, para
alimentação de crianças prematuras. Como apresentado na Tabela 2.1, o
elevado conteúdo de β-lg no soro bovino quando comparado com o seu teor no
leite materno inviabiliza a adição direta do soro “in natura” no alimento infantil,
pois esta proteína é considerada como o principal componente alergênico do
leite bovino (MÄKINEN-KILJUNEN e PALOUSUO, 1992).
Tabela 2.1 - Comparação entre a constituição do leite humano e bovino.
Proteínas Leite humano (g/L) Leite bovino (g/L)
Fração de caseína
3,6
26
β-lactoglobulina Traços 3,2
α-lactoalbumina 2,8 1,2
Albumina 0,6 0,4
Lisozima 0,4 Traços
Lactoferrina 2 0,1
Imunoglobulinas 1 0,7
(Fonte: DAVIES, D. T. e LAW, A., 1980)
6
Portanto, no processamento das proteínas do soro para nutrição infantil
é importante reduzir o conteúdo de β -lg, mantendo constante a concentração
das outras proteínas. KANEKO et al., (1985) alertaram para a necessidade da
retenção das propriedades imunológicas do soro nas formulações de alimentos
infantis. Este objetivo é atingido mantendo no produto duas outras proteínas do
soro, a lactoferrina e as imunoglobulinas.
2.1.1. Proteínas do Soro
As proteínas que permanecem no soro (em média 20% das proteínas
do leite), após a coagulação do leite pelo coalho, são denominadas “proteínas
solúveis”. Não se coagulam com a renina e não formam colóides, mantendo-se
em solução à temperatura ambiente. As proteínas que fazem parte dos
compostos nitrogenados estão divididas de acordo com a Figura 2.1.
19%
13%
5%
3%
10%
50%
β -lactoglobulina
α -lactoalbumina
imunoglobulina
lactoferrina
albumina
outros produtos que contêm nitrogênio não protéico
Figura 2.1 - Composição dos compostos nitrogenados no soro de queijo.
(Fonte: DAMODARAN, S. e PARAF, A., 1997).
7
A α-la é uma proteína solúvel em água em pH 6,0, devido à
predominância de sua forma monomérica, e menos solúvel na faixa de pH
entre 4,0 e 4,6, devido à sua polimerização. É constituída por um único
polipeptídio com 123 aminoácidos (MM = 14150 Dalton), 4 ligações
dissulfídricas e predominância de triptofano. A presença das ligações
dissulfídricas é de importância prática; elas participam da formação de
antioxidantes e do sabor de cozido em produtos lácteos tratados termicamente,
apesar de se tratar de uma das proteínas mais termoresistentes do soro
(SGARBIERI, 1996).
A β -lg é solúvel em água na presença de sais. É constituída por um
único polipeptídeo com 162 aminoácidos (MM = 18000 Dalton), 2 ligações
dissulfídricas e um grupo sulfidrila livre. A sua molécula (monômero) é
compactada e tende a formar polímeros em função do pH do meio; o
monômero é encontrado em pH inferior a 3,0 e acima de 8,0, enquanto no leite
normal (pH 6,7) e no seu ponto isoelétrico (pH 5,4) tende a formar dímeros
estáveis em forma de esferas. É desnaturada por tratamentos térmicos acima
de 65 °C, permitindo o controle da viscosidade em alimentos. Sua estrutura é
modificada expondo grupos nucleofílicos bastante reativos (-SH e –NH2)
capazes de reagir com outras proteínas. É um excelente agente de
gelatinização (SGARBIERI, 1996).
Em 1992, CHEN descreveu a utilização de um Sistema Aquoso
Bifásico (SAB), composto de Polietileno Glicol (PEG) - fosfato de potássio, para
a separação de β-lg da α-la. Ele estudou o efeito da massa molecular do PEG
e do pH do sistema sobre os coeficientes de partição das proteínas. A β-lg se
distribuiu predominantemente na fase rica em sal e a α-la na fase rica em PEG.
COIMBRA (1995) concluiu que o soro contém quantidades
consideráveis de sais, e portanto alguns métodos de separação não podem ser
diretamente aplicados. Os SABs são tolerantes a sais adequando-se bem ao
tratamento com soro de queijo. Em princípio, todos os tipos de SAB podem ser
empregados na separação de biomoléculas em uma operação de extração
8
líquido-líquido. No entanto, quando se considera o aumento de escala onde
critérios como custo, quantidade de reagentes, tempo de separação das fases
e reciclagem dos componentes não podem ser negligenciados, o número de
sistemas capazes de conjugar os requisitos necessários é bastante reduzido.
De acordo com estas limitações os sistemas usados no processamento em
larga escala tem-se restrito àqueles constituídos por PEG-dextrana e PEG-sal,
por se encontrarem disponíveis no mercado em grandes quantidades, serem
atóxicos, passíveis de esterilização e apresentarem uma maior faixa de
aplicação e de propriedades físicas adequadas, principalmente com relação à
diferença de densidade e viscosidade. A adição de PEG e dextrana em
alimentos é permitida em muitos países, enquadrando-se dentro da legislação
para o trabalho com produtos alimentícios e farmacêuticos. O mesmo pode ser
dito para alguns tipos de sais de citratos, fosfatos e sulfatos.
2.2. Extração Líquido-Líquido
A extração líquido-líquido fundamenta-se na separação de
componentes de uma solução que é submetida ao contato direto com um
líquido imiscível ou parcialmente miscível (solvente), causando uma
distribuição desigual dos componentes nas duas fases (TREYBAL, 1968).
Consequentemente, ocorre um fluxo de massa dos componentes entre as
fases formadas e quando o equilíbrio é atingido, cada uma das fases conterá
concentrações diferentes dos componentes (Figura 2.2).
Segundo TREYBAL (1968), a extração líquido-líquido pode ser
empregada vantajosamente nos casos em que os componentes a serem
purificados possuem baixa volatilidade relativa, sejam termossensíveis na
temperatura requerida para separação, estejam presentes em pequena
quantidade na solução, formem um azeótropo, tenham pontos de ebulição
próximos ou quando a cristalização fracionada é antieconômica. Nos últimos
anos, e em particular, desde a segunda guerra mundial, o crescente aumento
na variedade de produtos e a necessidade paralela de realizar separações
difíceis resultaram na rápida penetração industrial da extração líquido-líquido.
9
Figura 2.2 - Distribuição dos componentes e formação das fases ao longo do
tempo após a adição do solvente.
Razões econômicas constituem-se no principal fator para a
competitividade da operação de extração líquido-líquido em relação aos
processos convencionais como cristalização e destilação, entre outros.
Em relação aos métodos clássicos de separação, como precipitação, a
extração líquido-líquido apresenta vantagens, como baixa perda de atividade
do componente, baixo custo de material, boa reprodutibilidade e fácil ampliação
de escala, além de ser altamente específica na separação.
Existem substâncias de naturezas química e física diferentes que
possuem pontos de ebulição praticamente iguais inviabilizando sua separação
por destilação. A extração líquido-líquido participa como uma importante etapa
de purificação destes produtos, visando melhorar ao máximo sua qualidade
para os diversos usos.
A extração líquido-líquido convencional baseada em uma solução
aquosa e solventes orgânicos, não é adequada para separar biocompostos,
como proteínas, pois sua estabilidade é baixa em solventes orgânicos
(SUBRAMANIAM, 1998). Uma alternativa adequada aos processos tradicionais
10
de biosseparações é a partição em SABs, a qual vem sendo usada com
sucesso no isolamento de proteínas e outros materiais biológicos em grande
escala (KULA et al., 1982).
As diferentes matérias-primas empregadas na indústria de alimentos
são altamente complexas. A extração líquido-líquido é utilizada
vantajosamente, preservando as características biológicas, estruturais, de
aroma e estabilidade oxidativa das diferentes classes de alimentos
processados. Entre as várias utilizações, pode-se citar a extração de aditivos
para a indústria de alimentos como ácidos carboxílicos, aminoácidos, lecitina,
óleos essenciais como citral, geranial, eugenol, entre outros, e nos processos
de descafeinização de produtos cafeinados (BARUFFALDI, 1998).
ROBBINS (1980) concluiu que o processo de extração líquido-líquido é
uma alternativa econômica e tecnologicamente viável para o tratamento de
efluentes industriais, através da redução de substâncias tóxicas extraídas pelo
solvente.
COIMBRA (1991) usou esta operação para a recuperação de ácido
lático obtido na fermentação do permeado de soro de queijo, com o objetivo de
reduzir a carga poluidora ambiental, gerando, paralelamente, um produto de
interesse comercial.
COIMBRA (1995) utilizou SABs compostos por 14 % (em peso) PEG
1550 – 18 % (em peso) fosfato de potássio para separar as proteínas do soro
de queijo utilizando um extrator Graesser.
ANTONIASSI (1996) utilizou um extrator de discos rotativos para a
desacidificação de óleo de milho bruto, empregando etanol como solvente.
SILVA et al., (1997) purificaram três diferentes β-galactosidases
microbianas por partição em SABs a partir de variações na composição do
sistema.
11
ALVARENGA (1999) estudou a transferência de massa da operação de
extração líquido-líquido de ácido lático em colunas de discos rotativos.
2.2.1. Tipos de Extratores Líquido-Líquido
LOGSDAIL e LOWES (1971) previram o avanço da tecnologia de
extração líquido-líquido e sua tendência moderna de projetos de equipamentos
visando uma maior eficiência através da aplicação de energia mecânica. Isto foi
devido à necessidade do aumento da capacidade dos equipamentos contínuos,
que devem possuir dimensões limitadas, mantendo ao mesmo tempo uma alta
eficiência.
Os vários tipos de extratores podem ser divididos em duas categorias
distintas: colunas em estágios e colunas diferenciais. As colunas em estágios
são constituídas por uma série de estágios, nos quais as fases entram em
contato até que o equilíbrio seja atingido. As fases são então separadas e
conduzidas para um novo estágio. As colunas diferenciais são construídas de
tal maneira que a composição das fases muda continuamente ao longo de seu
comprimento (SARAIVA, 1999).
Estes equipamentos são ainda subdivididos em função do método
utilizado para a dispersão das fases no regime de escoamento contracorrente.
A dispersão das fases pode ser conseguida por ação da força da gravidade,
introdução de pulsos, agitação mecânica e força centrífuga. A Figura 2.3
mostra uma classificação dos extratores.
12
Figura 2.3 - Diferentes tipos de extratores líquidos (Fonte : Abdel - Kader B., 1985, adaptado por ALVARENGA, 1999).
Tipos de Extratores
Contato das fases por Gravidade Contato das Fases por Força Centrífuga
Extratores Centrífugos
Extrator Podbielniak Extrator de Laval Extrator Quadronic Extrator Westfalia Extrator Robatel
Colunas sem Agitação Extratores Agitados mecanicamente
Coluna Spray Coluna Recheada Coluna de Pratos perfurados
Colunas Pulsantes
Pratos perfurados pulsantes Recheada Pulsante Misturador Separador Pulsante
Coluna de pratos perfurados Malha Oscilante
Misturador – decantador Coluna Sheibel Coluna Oldshue Rushton Extrator de Discos Rotativos (RDC) Extrator de Discos Rotativos Assimétricos (ARD) Coluna Kunhi Extrator Graesser Coluna de Mistura Elevada ( EC)
Misturador estático Extrator de pratos vibrantes
Modelos Oscilantes Modelos Rotatórios Outros Modelos
46
2.2.2. Extrator Graesser
O extrator Graesser foi patenteado em 1962 (COLEBY) e desde então
tem sido usado industrialmente. Neste equipamento as duas fases são
introduzidas, em contracorrente, nas extremidades do extrator (Figura 2.4) que,
ao contrário da maioria dos extratores convencionais, é operado
horizontalmente. A mistura das fases se dá devido ao movimento de uma série
de cestos cilíndricos e parcialmente abertos, presos em placas circulares
(Figura 2.5).
Segundo COIMBRA (1995), uma mistura suave é gerada através do
movimento dos cestos semicilíndricos que transportam porções de uma fase
para o interior da outra. Por exemplo, na parte inferior do extrator (ver Figura
2.5), o cesto se enche da fase que preenche esta região do equipamento. Com
a rotação este a carrega para o lado superior, ocupado pela fase do topo.
Figura 2.4 - Diagrama esquemático das correntes de entrada e saída no
Extrator.
Acima da interface começa a descarregá-la na forma de gotas dentro
da fase superior, a qual também escoa na direção da interface. À medida que
descarrega a fase inferior, se enche da do topo que será levada para a fase de
fundo.
47
Portanto, a fase superior é conduzida simultaneamente e da mesma
maneira para dentro do líquido inferior, escoando também na forma de gotas
em direção à interface. O movimento dos líquidos causado por esta circulação
na direção da interface é do tipo cascata. A separação das fases ocorre nas
duas zonas de separação, localizadas nas extremidades direita e esquerda do
corpo cilíndrico. As placas estão presas, coaxialmente, em um eixo horizontal
ligado a um rotor de velocidade variável.
Figura 2.5 – Visão transversal do Extrator Greasser.
Ainda segundo COIMBRA (1995), a particular construção do extrator
Graesser leva a determinadas características hidrodinâmicas que o tornam
especialmente adequado para o trabalho com SAB:
1) A suavidade da mistura evita a emulsificação, pois o tamanho médio da
gota é mantido relativamente grande quando comparado com outros
extratores operados continuamente;
2) As velocidades de ascensão e queda das gotas são altas, levando a boas
taxas de transferência de massa;
48
3) A posição do nível da interface no centro equatorial do extrator, mantendo o
escoamento individual das fases, auxilia o uso de sistemas com pequena
diferença de densidade;
4) A compartimentação do vaso reduz a mistura axial, um problema em
extratores operados continuamente.
Apesar da baixa intensidade da mistura, são obtidas boas taxas de
transferência de massa adequando o extrator Graesser para a purificação
contínua de produtos sensíveis, como proteínas. Este comportamento foi
observado por HUSTED et al., (1980) em testes preliminares com um extrator
Graesser de 100 cm de comprimento e 10 cm de diâmetro interno usando
SABs.
2.3. Sistemas Aquosos Bifásicos
Os SABs são constituídos por duas fases imiscíveis que promovem a separação de produtos biotecnológicos em condições amenas e em um ambiente adequado, de forma a preservar suas principais características (COIMBRA, 1995). A formação das duas fases, em temperatura ambiente, resulta da incompatibilidade de dois polímeros em solução aquosa ou do “salting-out” na fase polimérica, quando o sistema é composto por um polímero e um sal (MACHADO, 1999).
O interesse pelo desenvolvimento de diferentes metodologias e
composições das fases para a utilização dos SABs no isolamento e na
purificação de biocompostos de importância comercial, tais como células,
proteínas, vírus, fragmentos de membranas e organelas celulares, é devido à
alta concentração de água (65 a 90)%, que em tais sistemas favorece a
estabilidade de biocompostos durante a separação. MACHADO (1999) utilizou
o SAB formado por PEG e maltodextrina para separar células de Lactobacillus
acidophilus de meio fermentado.
Um sistema composto por polipropileno glicol 400 e maltodextrina, foi
usado por SILVA (2000) para a separação de α -la, β-lg e albumina de soro
49
bovino. O equilíbrio de fases em SABs compostos por polímero/polímero e
polímero/sal está detalhado neste trabalho.
COIMBRA (1995) e ZUNIGA (2000) analisaram a influência da massa
molecular do PEG sobre o coeficiente de partição e a relação de volume entre
as fases em SABs compostos por PEG e fosfato de potássio para separar α -la
e β-lg do soro de queijo. Os experimentos foram realizados em um extrator
Graesser, e um estudo sobre a hidrodinâmica e transferência de massa
utilizando este equipamento foi feito por estes pesquisadores.
2.4. Hidrodinâmica e Transferência de Massa em Extratores
Para predizer a capacidade da coluna e as taxas de transferência de
massa associadas à operação de extratores, o conhecimento do
comportamento hidrodinâmico do extrator e das características termodinâmicas
e físicas do sistema empregado são condições necessárias para a correta
utilização da unidade.
O desempenho do equipamento é função de fatores como tipo de
coluna, detalhes da geometria, material de construção, grau de molhabilidade
dos líquidos, altura e diâmetro do extrator, efeitos de entrada e saída,
ocorrência de mistura axial, propriedades físicas das fases, direção da
extração, relação de vazão entre os líquidos, concentração do soluto e
natureza do líquido disperso (COIMBRA, 1995).
2.4.1. Coeficiente de Partição
Materiais biológicos adicionados a SABs distribuem-se entre as duas
fases sem perda da atividade biológica. A razão entre a concentração de
biomoléculas na fase superior e na fase inferior define o coeficiente de partição
nos sistemas aquosos, conforme mostra a equação 2.1 (ALBERTSSON, 1986):
50
x
y
c
cm = (2.1)
em que:
m = Coeficiente de partição;
cy = Concentração de biomoléculas na fase superior (mg/mL);
cx = Concentração de biomoléculas na fase inferior (mg/mL).
2.4.2. Fração Retida da Fase (“hold-up”)
É um parâmetro importante no cálculo da transferência de massa e na
teoria da inundação, por permitir a previsão do tamanho da gota e do ponto de
inundação. O “hold-up” ou fração volumétrica de uma das fases, dispersa ou
contínua, retida no equipamento e disponível para a extração, pode ser previsto
a partir das dimensões do equipamento e, em princípio, de correlações para a
velocidade superficial da gota (COIMBRA, 1995).
ZUNIGA (2000) estudou o “hold-up” em um extrator Graesser utilizando
o sistema 18 % (em peso) PEG e 18 % (em peso) fosfato de potássio, tendo
sido para isto empregada a técnica de estancamento rápido, que consiste em
bloquear repentinamente o extrator após atingir o estado estacionário, e efetuar
a leitura do volume da fase de interesse. A técnica fornece valores médios de
“hold-up”, que é descrito pela seguinte equação:
tVo
Vo=φ (2.2)
em que:
φ = "Hold-Up"
Vo = volume da fase de interesse (L);
Vo t = Volume total (L).
51
2.4.3. Distribuição de Tempos de Residência
Tempo de residência é aquele durante o qual um elemento de fluido
permanece dentro de um equipamento. A diversidade de tempos de residência
com que partículas de fluidos, a uma taxa constante, escoam através de
equipamentos é caracterizada pela função Distribuição de Tempos de
Residência (DTR). Este conceito foi aplicado amplamente nos processos
químicos e recentemente tem ganhado interesse significativo em várias
aplicações biotecnológicas (ZUNIGA, 2000).
Na indústria de alimentos, a DTR tem uma aplicação extensa no que se
refere ao processamento asséptico, comumente aplicado em alimentos líquidos
como leite, suco e concentrados de frutas, iogurte, ovos e em suspensões
líquidas contendo partículas de tamanho pequeno como queijo, alimentos
infantis e concentrado de tomate (TORRES e OLIVEIRA, 1998).
O procedimento geral para a determinação da DTR é através do estudo
de respostas a estímulos fornecidos ao sistema. O método de medida mais
simples apresentado por LEVENSPIEL (1992) consiste na introdução de um
traçador na forma de um pulso, sendo a medida de sua concentração na saída
do equipamento feita em intervalos de tempo regulares. Para caracterizar a
distribuição de tempos de residência, o parâmetro mais importante é o tempo
de residência médio, que é calculado por meio da equação 2.3:
∑∑
∆
∆≅
ii
iiir
tC
tCtt (2.3)
em que:
tr = tempo de residência médio (adimensional);
ti = tempo (min);
Ci = concentração no instante ti (g/mL);
∆ti = intervalo de tempo (min).
52
ZUNIGA (2000) utilizou o método da injeção de corante, na forma de um pulso Dirac para determinar a DTR, tanto da fase polimérica como da fase salina. O traçador foi injetado com o extrator operando em cada uma das velocidades de rotação e para as diferentes vazões das fases estudadas neste trabalho de modelagem. 2.4.4. Número de Peclet
LEVENSPIEL (1992) apresentou dois modelos principais para o estudo
de tempos de residência em equipamentos operando continuamente: o modelo
da dispersão e o de tanques em série. O primeiro modelo considera que o
escoamento do fluido é do tipo pistão, ao qual se sobrepõe algum grau de
mistura axial e retroativa ("backmixing"), implicando na não-existência de
bolsas estagnantes ou "by pass" do fluido no equipamento. O número de Pe
segundo COIMBRA (1995) seria uma medida quantitativa da influência da
mistura axial para cada uma das fases no desempenho do extrator. A mistura
axial reduz os gradientes de concentração e portanto as taxas de transferência
de massa.
O segundo modelo considera que o escoamento do fluido é através de
uma série de tanques iguais. O parâmetro do modelo da dispersão é o
coeficiente de dispersão axial e o de tanques em série é o número de tanques.
2.4.5. Número de Unidades de Transferência
Em equipamentos de contato contínuo, o número de estágios, ou a
altura da coluna, necessários para atingir o grau de separação desejado podem
ser calculados com base nos conceitos de NTU (Number of Transfer Unit) ou
altura da unidade de transferência (HTU – Height of Transfer Unit). Esses
parâmetros são calculados a partir dos dados de transferência de massa,
conforme as equações.
( )∫ −=
0
1
x
x
C
Cxix
xx
CC
dCNTU (2.4)
53
( )∫ −=
0
1
x
x
C
Cxix
x
ox
xx
CC
dC
ak
UHTU (2.5)
em que a é a área interfacial por unidade de volume do extrator (m2/m3); Kox é o
coeficiente de transferência de massa (m/s); Ux é a velocidade linear da fase
(m/s); Cx é a concentração adimensional do soluto na fase superior; e os
subscritos 0, 1 e i referem-se às posições na entrada, saída do extrator e na
interface entre as fases, respectivamente.
2.4.6. Modelos de Transferência de Massa
Os modelos propostos para descrição do processo de transferência
são fundamentados em dois tipos de escoamentos idealizados: fluxo pistão e
completamente misturado. No primeiro, assume-se que cada fase percorre o
equipamento com velocidade constante, uniforme e independente da posição.
A transferência de soluto se dá somente na direção perpendicular ao
escoamento. No segundo, o conteúdo do extrator é considerado totalmente
misturado. As fases são instantaneamente misturadas com todo o líquido no
interior da unidade. Formam -se fases com composições de soluto homogêneas
em todo o meio. A consideração de fluxo pistão contracorrente gera maior força
motriz, sendo portanto preferível ao completamente misturado, no qual ambas
as fases são sempre mantidas na mesma concentração de saída (COIMBRA,
1995).
Os modelos ideais consideram que somente o soluto é transferido, que
as concentrações de soluto são baixas, que são constantes o coeficiente de
partição, a distribuição de tamanhos de gotas, as taxas de escoamento das
fases e propriedades físicas, como viscosidade e densidade. Já que estas
hipóteses, geralmente, não são obedecidas na sua totalidade em um processo
industrial, outros modelos foram desenvolvidos para uma representação mais
realista do comportamento do extrator. Entretanto, deve-se recordar que o fluxo
no extrator é complexo e uma modelagem precisa é de difícil obtenção. As
54
novas aproximações partem dos dois tipos de fluxos idealizados, considerando
a existência da difusão molecular e de turbilhões na direção do escoamento
das fases, variações das velocidades lineares dos líquidos nas direções radial
e axial e, também, o arraste de uma fase pela outra (COIMBRA, 1995).
Um modelo dificilmente englobará todas estas variáveis, a menos que
seja extremamente complexo. O procedimento mais freqüente é assumir uma
representação para o processo em estudo, aplicá-la e compará-la com as
observações experimentais. Então, novos parâmetros poderão ser adicionados
ou modificados para se obter uma melhor predição da transferência de massa
no equipamento em estudo (COIMBRA, 1995).
2.4.6.1. Modelo da Dispersão
MIYAUCHI e VERMEULEN (1963) desenvolveram em seu estudo o
modelo da dispersão, também chamado de modelo da difusão, ou fluxo pistão
com dispersão axial (que incorpora o coeficiente de dispersão axial e o
coeficiente de transferência de massa), para uma coluna empacotada, baseado
no balanço de massa do soluto, através de uma altura diferencial da coluna dZ,
conforme a equação 2.6:
[ ] 0 2
2
=−− *xxox
xx
xx -ccaK
dz
dcV
dz
cdD (2.6)
Expressando o modelo na forma adimensional para as fases x e y
respectivamente:
[ ] 0 2
2=−− *
xxoxxx
xx -CCNPe
dZ
dCPe
dZ
Cd (2.7)
[ ] 0 2
2
=++ *xxoxy
yy
y-CCNPe
dZ
dCPe
dZ
Cdλ (2.8)
55
As variáveis e os parâmetros do sistema acima estão representados,
respectivamente, pelas equações 2.9 a 2.12 e 2.13 a 2.15.
y
x
V
V=λ (2.9)
0x
xx
c
cC = (2.10)
0x
yy
c
cC = (2.11)
L
zZ = (2.12)
x
xx
D
LUPe = (2.13)
y
yy
D
LUPe = (2.14)
x
oxx
U
LaKNo = (2.15)
em que:
λ = relação de vazões, adimensional;
0xc = concentração na alimentação da fase x (kg/m3);
a = área interfacial por unidade de volume do extrator (m2/m3);
Cx = concentração adimensional na fase x;
cx = concentração do soluto na fase x (kg/m3);
Cy = concentração adimensional na fase y;
cy = concentração do soluto na fase y (kg/m3);
Dx = coeficiente de dispersão axial da fase x (m2/s);
Dy = coeficiente de dispersão axial da fase y (m2/s);
Kox = coeficiente global de transferência de massa (m/s);
L = comprimento total do extrator (m);
Pe = número de Peclet, adimensional;
Ux = velocidade superficial da fase x (m/s);
56
Uy = velocidade superficial da fase y (m/s).
Vx = vazão da fase x (m3/s);
Vy = vazão da fase y (m3/s);
Z = comprimento adimensional ao longo da coluna;
z = comprimento longitudinal ao longo da coluna (m).
Segundo MIYAUCHI e VERMEULEN (1963), supondo-se que a taxa de
dispersão longitudinal para ambas as fases fora da coluna é muito maior que
nos fluxos de entrada e saída da coluna, as condições de contorno para as
fases refinado e extrato são, respectivamente:
Para Z = 0 (entrada da alimentação):
( )0 1 xxx C-Pe
dZ
dC=− (2.16)
0=−dZ
dCy (2.17)
Para Z = 1 (saída do refinado):
0=−dZ
dCx (2.18)
( )11 yyy
yC-CPe
dZ
dC=− (2.19)
Os subscritos 0 e 1 representam a posição axial (Z) dentro do extrator. Os
sobrescritos 0 e 1 representam as concentrações do soluto nas correntes de
entrada e saída do equipamento, respectivamente.
Segundo COIMBRA (1995) este modelo é aquele no qual ao
escoamento pistão é adicionado um fluxo longitudinal, de difusão molecular e
por turbilhões, dentro de cada fase. Considera a dispersão axial do soluto em
57
cada fase e assume que todos os desvios do escoamento tipo pistão são
representados por um único parâmetro, o coeficiente de dispersão axial.
As equações de balanço levam a um sistema de equações diferenciais
que após discretização geram um sistema de equações algébricas não
lineares. Sua solução permite descrever o perfil de concentração do soluto nas
fases ao longo do extrator. As considerações inerentes ao modelo da dispersão
para o extrator Graesser, são:
1. O backmixing de cada fase pode ser caracterizado por um coeficiente de
dispersão axial constante D;
2. As condições de contorno descritas por MIYAUCHI e VERMEULEN (1963)
são aplicáveis;
3. A velocidade média e a concentração em cada fase é constante em qualquer
secção transversal da coluna;
4. O coeficiente de transferência de massa é constante ou pode ser a média de
toda coluna;
5. Os gradientes de concentração do soluto em cada fase são contínuos
(exceto nas entradas das correntes);
6. As fases do sistema são imiscíveis, ou têm uma miscibilidade constante
independente da concentração do soluto;
7. As vazões volumétricas da alimentação e do solvente são constantes ao
longo de toda a coluna.
Os valores preditos de eficiência irão variar para um dado Nox entre
aqueles fornecidos pelos escoamentos ideais tipo pistão (Pe = ∞), e
completamente misturado (Pe = 0). Assim, se tem disponível um modelo
flexível na predição de desempenho para uma grande variedade de
58
comportamentos de escoamentos de fases, mesmo que a melhoria alcançada
dependa somente da inclusão de um único parâmetro adicional, Pe
(COIMBRA, 1995).
Variações deste modelo foram desenvolvidas considerando o tamanho
de gotas, área interfacial e coeficiente de transferência de massa através de
correlações empíricas envolvendo outros parâmetros e foram resumidas por
KORCHINSKY (1992). Segundo esse autor, o modelo de dispersão axial pode
predizer, adequadamente, os processos de transferência de massa em colunas
de extração líquido-líquido, e os coeficientes de transferência de massa e
dispersão axial devem ser determinados através de medidas do perfil de
concentração. O problema deste modelo reside na estimação dos seus
parâmetros (Pex, Pey e Nox) para as fases inferior e superior. A determinação
dos parâmetros deste modelo é difícil devido ao custo elevado para realizar
todos os experimentos necessários, além das considerações feitas para
simplificação dos cálculos modificando um pouco o comportamento real do
processo.
Redes neurais apresentam-se como uma ótima opção para a
estimativa destes parâmetros, já que não é necessário conhecer as relações
complexas dos fenômenos que envolvem o processo, e sim, dados de entrada
e saída.
2.5. Redes Neurais Artificiais
As denominadas redes neurais artificiais, podem ser definidas como
um conjunto de elementos processadores simples, denominados neurônios,
organizados em camadas e interligados através de pesos que atuam como
controladores da força do sinal a ser transmitido pelo respectivo neurônio
(FONSECA, 1999).
Uma rede neural não é seqüencial nem necessariamente
determinística. Ela é composta de muitos elementos processadores que
59
usualmente fazem pouco mais que receber uma soma de valores de entrada
multiplicados por pesos. Ao invés de executar uma série de instruções, uma
rede neural responde, trabalhando de forma paralela, às entradas fornecidas a
ela. O resultado final consiste de um estado global da rede após esta ter
alcançado uma condição ideal que correlaciona modelos entre os conjuntos de
dados de entrada e os dados correspondentes de saída. A rede final pode ser
usada para predizer novos valores de saída a partir de novos dados de entrada
(CHITRA et al., 1995).
Redes neurais têm sido sugeridas como uma alternativa à geração de
modelos de processo. São modelos tipo ‘caixa-preta’ cuja principal
característica é aproximar funções não-lineares em espaços multidimensionais.
Apresentam as vantagens de serem eficientes computacionalmente e de fácil
construção (FONSECA, 1999).
As redes neurais mais utilizadas na área de modelagem e controle de
processos são as do tipo feedforward compostas de uma camada de entrada,
outra de saída e uma ou mais camadas intermediárias (Figura 2.6). Cada
neurônio recebe informações, sob a forma de entradas, de outros neurônios e
processa-as através de uma função de ativação. O número de neurônios da
camada de entradas está relacionado com o número de variáveis de entrada
do sistema que se deseja identificar, assim como o número de neurônios na
camada de saídas se relaciona com o número de variáveis de saída.
O número de camadas internas e a quantidade respectiva de
neurônios, no entanto, devem ser estimados, de acordo com o menor erro na
validação do modelo neural (FONSECA, 1999).
60
Figura 2.6 – Arquitetura de uma rede neural do tipo feedforward com 3
camadas.
A rede neural da Figura 2.6 representa a arquitetura de uma rede
neural feedforward multicamada. Cada camada é constituída por um ou mais
neurônios artificiais, representados na figura por círculos. As linhas unindo os
neurônios são as conexões ou pesos que devem ser ajustados no processo de
aprendizagem. As setas indicam o sentido do fluxo de informações. A
arquitetura da rede mostrada assemelha-se à de algumas redes de neurônios
biológicos.
2.5.1. Analogia com o Cérebro Humano
O cérebro humano contém em torno de 1011 neurônios, sua célula
fundamental. Cada um destes neurônios processa e se comunica com milhares
de outros, continuamente e em paralelo. A estrutura individual dos nodos, a
topologia de suas conexões e o comportamento conjunto destes nodos naturais
formam a base para o estudo das redes neurais artificiais (BRAGA et al., 2000).
O cérebro humano é responsável pelo que se chama de emoção,
pensamento, percepção e cognição, assim como pela execução de funções
sensoriomotoras e autônomas. Além disso, sua rede de nodos tem a
61
capacidade de reconhecer padrões e relacioná-los, usar e armazenar
conhecimento por experiência, além de interpretar observações. Apesar do
estudo contínuo, o funcionamento das redes biológicas ainda não foi totalmente
desvendado pelo homem. Não se sabe ao certo a forma como as funções
cerebrais são realizadas. O que se tem até o momento são modelos, os quais
são atualizados a cada nova descoberta. No entanto, a estrutura fisiológica
básica destas redes de nodos naturais é conhecida, e é exatamente nesta
estrutura fisiológica que se baseiam as redes neurais artificiais (BRAGA et al.,
2000).
As redes neurais artificiais tentam reproduzir as funções das redes
biológicas, buscando implementar seu comportamento básico e sua dinâmica.
No entanto, do ponto de vista físico, as redes artificiais se diferem bastante das
redes biológicas. É importante, contudo, observar as similaridades entre estes
dois tipos de sistemas, tanto para que se possa entender melhor o sistema
nervoso quanto para buscar idéias e inspirações para a pesquisa em
neurocomputação. Como características comuns, pode-se citar que os dois
sistemas são baseados em unidades de computação paralela e distribuída que
se comunicam por meio de conexões sinápticas, possuem detetores de
características, redundância e modularização das conexões. Apesar da pouca
similaridade entre os dois sistemas do ponto de vista biológico, estas
características comuns permitem às redes neurais artificias reproduzir com
fidelidade várias funções somente encontradas nos seres humanos. Acredita-
se, portanto, que o futuro da neurocomputação possa se beneficiar ainda mais
do desenvolvimento de modelos que tenham apelo biológico. Estruturas
encontradas nos sistemas biológicos podem inspirar o desenvolvimento de
novas arquiteturas para modelos de redes neurais artificiais (BRAGA et al.,
2000).
Como pode ser observado na Figura 2.7 a sinapse é a região onde dois
neurônios entram em contato e através da qual os impulsos nervosos são
transmitidos entre eles. Os impulsos recebidos por um neurônio A, em um
determinado momento, são processados, e atingindo um dado limiar de ação, o
62
neurônio A dispara, produzindo uma substância neurotransmissora que flui do
corpo celular para o axônio, que pode estar conectado a um dentrito de um
outro neurônio B. O neurotransmissor pode diminuir ou aumentar a polaridade
da membrana pós-sináptica, inibindo ou excitando a geração dos pulsos no
neurônio B (BRAGA et al., 2000).
Figura 2.7 – Componentes do neurônio biológico.
O processamento da informação dentro do neurônio biológico envolve duas operações diferentes: a primeira operação, sináptica, proporciona um peso nas entradas dos neurônios, ou seja, proporciona um peso relativo para cada informação de acordo com experiências passadas armazenadas na sinapse; A segunda operação, somática, que providencia uma agregação de ativação não linear da entrada do dendrito, com a qual os pesos da entrada fornecem sinais de saídas (THYAGARAJAN et al., 1998).
Redes neurais são adaptáveis para diferentes tipos de problemas e aplicações, porque elas podem ser implementadas por ambas formas básicas de aprendizagem: supervisionada e não supervisionada. Aprendizagem supervisionada significa que, durante a aprendizagem, a rede dispõe de algumas informações sobre qual deve ser a resposta correta. Aprendizagem não supervisionada é aquela em que a rede não dispõe de tais informações. O exemplo de uma criança que aprende a reconhecer figuras e cores ilustra uma forma de aprendizagem supervisionada. Um exemplo de aprendizagem não supervisionada pode ser como um bebê aprende a focalizar seus olhos. Esta habilidade não é conhecida pelos recém-nascidos, mas eles adquirem-na pouco depois do nascimento. Em poucos dias, o bebê aprende a associar conjuntos de estímulos visuais com objetos e formas com pouca ou nenhuma ajuda externa. Redes neurais não supervisionadas operam de forma semelhante por meio da aprendizagem com pouca ou nenhuma informação sobre a resposta correta para um modelo de entrada. Embora os diferentes tipos de aprendizagem sejam importantes para diferentes aplicações, para
63
quase todos os problemas de engenharia, aprendizagem supervisionada é adequada (CHITRA et al., 1995).
2.5.2. Componentes de um Nodo
O elemento fundamental de uma rede neural é o neurônio artificial ou nodo ilustrado na Figura 2.8. Este modelo proposto inicialmente por McCulloch e Pitts em 1943 é uma simplificação do que se sabia então a respeito do neurônio biológico. Os nodos conduzem à maioria dos cálculos na rede neural e os seus principais componentes são: 1. Entradas e saídas
As entradas (que representam os dendritos) são constituídas do vetor
de entrada, a, com componentes ai (i=1 até n). O nodo manipula estas entradas
para calcular a saída, bj (representando o axônio), que pode ser um
componente do vetor de entrada para outros nodos (BAUGHMAN e LIU, 1995).
Figura 2.8 – Anatomia de um nodo, em que: ai representam as entradas, Wi j os
fatores pesos, f(xj) a função transferência signoidal, TJ o limiar
interno, bJ a saída.
2. Fatores peso
Para emular o comportamento das sinapses, os terminais de entrada
do neurônio têm pesos acoplados w1,1, w2,1, ...,wn,1 cujos valores podem ser
positivos ou negativos, dependendo de as sinapses correspondentes serem
inibitórias ou excitatórias. Cada entrada ai para o j-ésimo nodo é multiplicada
64
pelo seu fator peso correspondente, wi,j, e o nodo usa esta entrada ponderada
para conduzir seus cálculos.
3. Limiares internos
Um neurônio dispara quando a soma dos impulsos que ele recebe
ultrapassa o seu limiar de excitação (threshold). O corpo do neurônio, por sua
vez, é emulado por um mecanismo simples que faz a soma dos valores ai.wi,j
recebidos pelo neurônio (soma ponderada) e decide se o neurônio deve ou não
disparar comparando a soma obtida ao limiar ou threshold do neurônio
(BRAGA et al., 2000). É um importante fator no cálculo da saída de um nodo. O
limiar interno para o j-ésimo nodo, denotado Tj, controla a ativação deste nodo,
denominada xj, de acordo com a equação 2.20:
j
n
iiijj T)a(wx −
= ∑
=1
(2.20)
4. Funções Transferência
O fator final determinando a saída de um nodo é a função
transferência. Após o nodo calcular a sua ativação xi, de acordo com a
equação 2.20, ele passa este resultado para uma função transferência, f(xi). A
saída bj para o j-ésimo nodo é então calculada de acordo com a equação 2.21
(BAUGHMAN e LIU, 1995):
bj = f(xi) (2.21)
Segundo Baughman e Liu (1995), as funções de transferência mais
comumente utilizadas são:
Função sigmoidal: f(xi) = (1 + e-x)-1 (2.22)
Função tangente hiperbólica: f(xi) = tanh(xi) (2.23)
65
Função Gaussiana: f(xi) = exp(-x2/2) (2.24)
2.5.3. Topologias de Redes Neurais
A topologia ou arquitetura de uma rede neural refere-se a como seus nodos são interconectados. A Figura 2.6 mostra uma topologia típica de redes neurais denominada perceptron em multicamadas, definida como uma rede que possui somente conexões no sentido da primeira camada para as camadas subsequentes, ou seja, sem conexões intracamada ou recorrentes.
O número de nodos na camada de entrada deve ser igual ao número de variáveis independentes, das quais se deseja estudar seu efeito sobre as variáveis de resposta do processo. O número de nodos na camada de saída deve ser igual ao número de variáveis dependentes, que são as variáveis de resposta do processo. O número de camadas escondidas, bem como o número de nodos nestas, são fatores importantes que devem ser determinados para que se tenha uma topologia que torne acurado e eficiente o processo de aprendizagem da rede (ZHANG et al., 1994).
2.5.4. Desenvolvimento de uma Rede Neural
Os dois primeiros passos do processo de desenvolvimento de redes
neurais artificiais são a coleta de dados relativos ao problema e a sua
separação em um conjunto de treinamento, validação e um conjunto de testes.
Esta tarefa requer uma análise cuidadosa sobre o problema para minimizar
ambigüidades e erros nos dados. Além disso, os dados coletados devem ser
significativos e cobrir amplamente o domínio do problema; não devem cobrir
apenas as operações normais ou rotineiras, mas também as exceções e as
condições nos limites do domínio do problema.
O terceiro passo é a definição da configuração da rede, que pode ser dividida em três etapas:
1) Seleção da arquitetura que determinará como serão interconectados os
pesos na rede e quais regras de aprendizagem (algoritmos de treinamento)
podem ser utilizadas;
66
2) Determinação da topologia da rede a ser utilizada - o número de camadas,
o número de unidades em cada camada, entre outras;
3) Determinação de parâmetros do algoritmo de treinamento e funções de
ativação. Este passo tem um grande impacto na performance do sistema
resultante.
Existem metodologias desenvolvidas na condução destas tarefas.
Normalmente estas escolhas são feitas de forma empírica. A definição da
configuração de redes neurais é ainda considerada uma arte, que requer
grande experiência dos projetistas.
O quarto passo é a fase de treinamento ou aprendizagem. Segundo
BRAGA et al., (2000) aprendizagem é o processo pelo qual os parâmetros de
uma rede neural são ajustados através de uma forma continuada de estímulo
pelo ambiente no qual a rede está operando, sendo o tipo específico de
aprendizagem realizada definido pela maneira particular como ocorrem os
ajustes nos parâmetros.
Apresenta-se repetidamente para a rede, um conjunto de variáveis de
entrada-saída para ensiná-la. Os fatores pesos são então ajustados de forma
que a entrada especificada produza a saída desejada. Por meio destes ajustes
a rede neural aprende o modelo do comportamento entre entrada-saída. Esta
fase é tipicamente a mais longa no desenvolvimento da rede e ela é crítica para
o sucesso da mesma (SARAIVA, 1999). Nesta fase, pode-se utilizar um outro
conjunto de dados para validação, que não contenha dados utilizados no
treinamento, para testar o desempenho da rede durante esta etapa.
O quinto passo é o teste da rede. Durante esta fase o conjunto de
dados para teste é utilizado para determinar a performance da rede com dados
que não foram previamente utilizados. A performance da rede, medida nesta
fase, é uma boa indicação de sua performance real.
67
Devem ser considerados ainda outros testes como análise do
comportamento da rede utilizando entradas especiais e análise dos pesos
atuais da rede, pois se existirem valores muito pequenos, as conexões
associadas podem ser consideradas insignificantes e assim serem eliminadas
(prunning). De modo inverso, valores substantivamente maiores que os outros
poderiam indicar que houve super treinamento da rede (over-training).
Finalmente, com a rede treinada e avaliada, ela pode ser integrada em um sistema do ambiente operacional de aplicação. Para maior eficiência da solução, este sistema deverá conter facilidades de utilização como interface conveniente e facilidades de aquisição de dados através de planilhas eletrônicas, interfaces com unidades de processamento de sinais, ou arquivos padronizados.
Segundo SARAIVA (1999) há muitos parâmetros de rede neural que
controlam o seu desempenho e a sua capacidade de predição. No
desenvolvimento de uma rede neural eficiente, tais parâmetros devem ser
estudados cuidadosamente.
2.5.5. Redes Neurais como Ferramenta de Modelagem
Comumente, os modelos dos processos são obtidos a partir dos
princípios básicos de conservação por meio da aplicação dos balanços de
massa, momento e energia, incorporando correlações termodinâmicas e
cinéticas. Modelos deste tipo são chamados determinísticos, e podem ser
estruturados ou não estruturados dependendo de sua complexidade e das
considerações nele contidas. Modelos não estruturados usualmente fazem
considerações a respeito do processo e têm poucos parâmetros se
comparados com os modelos estruturados. O modelo estruturado tenta
incorporar todos os mecanismos do processo, por isso ele também é conhecido
como modelo mecanístico, e normalmente tem muitos parâmetros. Contudo,
alguns processos são difíceis de ser modelados a partir dos princípios básicos
de conservação. Os modelos não estruturados podem falhar devido às
considerações nele contidas, e os modelos estruturados ou podem ser difíceis
de obter, isto é, o mecanismo do processo não é bem compreendido, ou ainda,
68
quando se conhece o modelo estruturado, mas este contém parâmetros que
são difíceis de determinar (Karim et al., 1997, citado por SARAIVA, 1999).
A técnica de modelagem por redes neurais é bastante recomendada para o estudo de processos complexos e pouco compreendidos. Uma das características mais atrativas de redes neurais é a habilidade de aprender relações complexas sem requerer o conhecimento da estrutura do modelo (THIBAULT et al., 1990). Seu desempenho depende da qualidade e quantidade dos dados de entrada-saída utilizados no desenvolvimento da rede (ALDRICH e SLATER, 1995).
Segundo BAUGHMAN e LIU (1995), rede neural artificial é uma
ferramenta de modelagem empírica, contudo, algumas diferenças notáveis
existem entre redes neurais e modelos empíricos típicos:
1. Redes neurais possuem uma melhor capacidade de filtragem que modelos
empíricos tradicionais. Rede neural é massivamente paralela, de forma que
cada nodo opera independentemente dos outros. Cada nodo pode ser visto
como um processador, e todos estes processadores operam em paralelo.
Como resultado, a rede não depende tão fortemente de um único nodo
quanto, por exemplo, um modelo empírico tradicional que é função de uma
variável independente. Devido a este paralelismo, redes neurais tem uma
melhor capacidade de filtragem e geralmente trabalham melhor que
modelos empíricos tradicionais com dados incompletos ou com ruídos.
2. Redes neurais são mais adaptativas que modelos empíricos. Redes neurais
possuem algoritmos de treinamento específicos, onde ajustam -se fatores
pesos entre nodos até que se alcance o modelo desejado que relaciona a
entrada-saída. Se as condições mudam de tal forma que o desempenho da
rede é inadequado, pode-se retreinar a rede neural sob estas novas
condições para corrigir seu desempenho. Além disso, pode-se desenvolver
uma rede para periodicamente avaliar e corrigir seu desempenho,
resultando em um modelo contínuo, on-line, de auto-correção. Modelos
empíricos típicos não possuem esta habilidade.
69
3. Redes neurais são verdadeiramente sistemas de múltipla entrada e múltipla
saída. A maioria das ferramentas de modelagem empírica mapeam uma, ou
no máximo duas ou três variáveis dependentes. Redes neurais podem
mapear tantas variáveis independentes com quantas variáveis dependentes
necessitar. Consequentemente, redes neurais trabalham melhor em
modelos de reconhecimento que sistemas de modelagem empírica
tradicionais.
2.5.6. Aplicações de Redes Neurais
Segundo BAUGHMAN e LIU (1995), o primeiro relato da aplicação de
redes neurais em engenharia e bioprocessos é o artigo publicado por Hoskins e
Himmelblau de 1988, onde foi usada uma rede neural para diagnosticar falhas
de operação de um reator químico. Desde então, o número de aplicações desta
técnica em bioprocessos e engenharia tem crescido rapidamente.
THIBAULT et al., (1990) utilizaram uma rede neural feedforward para
predição “on-line” das variáveis de um processo fermentativo em um tanque
continuamente agitado, comparando os resultados com os obtidos usando filtro
Kalman. A comparação mostrou os ótimos resultados obtidos através da
modelagem neural, que foi capaz de predizer com muita precisão o
comportamento dinâmico do processo demostrando que as redes neurais
podem competir com outras técnicas de predição.
GHEORGHITA e LAVRIC (1995) estudaram a topologia e os valores
dos parâmetros do algoritmo back-propagation para a modelagem de
processos de secagem através de redes neurais e a performance encontrada
foi satisfatória nos casos estudados.
BALASUBRAMANIAN et al., (1996) modelaram um secador de leito
fluidizado através de uma rede neural feedforward com três entradas na
primeira camada (temperatura, vazão de ar na entrada e o tempo de
residência), uma camada intermediária com 10 elementos e duas saídas na
70
última camada (temperatura e umidade do ar na saída). Os dados para o
treinamento da rede foram obtidos através da simulação de um modelo
mecanístico.
De semelhante forma, PEÑA (1999) obteve uma quantidade de dados
suficiente para a aplicação da técnica de redes neurais recorrentes para o
desenvolvimento de um modelo matemático preditivo do processamento
térmico de alimentos, que possibilita estimar a temperatura do ponto frio de um
alimento acondicionado em um recipiente, a partir da temperatura ou pressão
da autoclave e o tempo de processo. As redes neurais usadas mostraram
grande eficiência para estimar as variáveis de controle.
SARAIVA (1999) avaliou a aplicação das redes neurais na modelagem
da eficiência de um extrator líquido-líquido. Sua conclusão foi que redes
neurais mostram-se uma excelente alternativa na modelagem de processos
pouco compreendidos, como extração líquido-líquido, uma vez que ela
necessita apenas de um conjunto de dados representativos do fenômeno.
KAN e LEE (1996) utilizaram uma rede neural do tipo feedforward para
predizer o diagrama de equilíbrio para o SAB (PEG-fosfato de potássio-água),
onde diferentes sistemas foram preparados em pH 7 variando a massa
molecular do PEG (600, 1500, 3400, 8000, e 20000). As simulações
extrapoladas e interpoladas pelo modelo neural demonstraram excelente
precisão quando comparados com os dados experimentais. Concluíram os
autores que os resultados indicaram a aplicabilidade do modelo de rede neural
como uma técnica adequada para o projeto de otimização das condições de
extração.
Psichogios e Ungar (1992) citados por FONSECA (1999) propuseram
uma abordagem diferente na utilização de redes neurais, a modelagem híbrido-
neural. O modelo híbrido é composto de duas partes incluindo um modelo
baseado em princípios fenomenológicos, que reflete o conhecimento a priori do
processo, e a rede neural, que serve como estimador de parâmetros de difícil
modelagem.
71
2.6. Modelagem Híbrido-Neural
A modelagem híbrido-neural, ou seja, as redes neurais trabalhando
como estimadores dos parâmetros empíricos do processo, acopladas ao
modelo fenomenológico apresenta melhores propriedades do que as redes
neurais ‘caixa-preta’, pois interpola e extrapola com maior acurácia, é mais fácil
de analisar e interpretar, além de requerer menos dados para a etapa de
treinamento. Esta técnica foi aplicada inicialmente a um processo fermentativo
hipotético operando em batelada alimentada. Foram utilizadas as equações de
balanço de massa de células e substrato, sendo a taxa específica de
crescimento celular descrita por uma rede neural. A saída da rede serviu como
entrada para o modelo, que produziu como saída os valores das variáveis de
processo (concentração de substrato e de biomassa) ao final de cada tempo de
amostragem (Psichogios e Ungar, 1992; citados por FONSECA,1999).
Segundo BRAGA et al., (2000) a principal idéia por trás do
desenvolvimento de sistemas híbridos é a de que uma única técnica, devido às
suas limitações e/ou deficiências, pode não ser capaz, por si só, de resolver um
dado problema. Neste caso, a combinação de duas ou mais técnicas pode
levar a uma solução mais robusta e eficiente.
O modelo híbrido apresentado por Psichogios e Ungar (1992), citados
por FONSECA (1999) caracterizou-se por uma construção em série, já que a
rede neural era responsável pela estimação dos parâmetros do modelo, no
caso, a taxa específica de crescimento celular. A construção de uma rede em
série é demonstrada através da Figura 2.9.
A modelagem híbrido-neural proposta por Psichogios e Ungar (1992),
citado por FONSECA (1999), também foi aplicada por SCHUBERT et al.,
(1994), a um processo de produção de biomassa. Uma desvantagem
apresentada pelas redes neurais e observada pelos autores é que as mesmas
não são confiáveis em áreas onde os dados experimentais não estão
disponíveis. Os autores propuseram utilizar um modelo matemático como
72
forma de gerar dados artificiais em regiões não cobertas pelos dados
experimentais. As redes foram treinadas, tanto com os dados artificiais como
com os dados experimentais. Com o intuito de confirmar as vantagens em se
utilizar a modelagem híbrida, a técnica foi comparada à modelagem
matemática clássica e à modelagem neural convencional. Os resultados
mostraram a superioridade do modelo híbrido, tanto na estimativa dos
parâmetros como na predição das variáveis de estado do sistema.
Figura 2.9 - Construção de um modelo híbrido neural em série.
CUBILLOS et al., (1996) empregaram a modelagem híbrido-neural para simular os processos de secagem de partículas sólidas, onde a rede neural foi utilizada para estimar os parâmetros de transferência de massa de um modelo baseado nas equações de equilíbrio. Os resultados da modelagem mostraram uma adaptação e predição melhor quando comparados com a modelagem somente fenomenológica ou puramente neural. A principal razão para este comportamento segundo os autores, é que redes neurais dentro do modelo híbrido são menos redundantes e mais completas para informações pobres que as clássicas rede neurais tipo caixa preta.
STUART et al., (1997) simularam a extração supercrítica do óleo
essencial de alfavaca e alecrim através da modelagem híbrido-neural na
configuração em série para estimar os parâmetros do modelo fenomenológico
(modelo de Sovová), onde um pequeno conjunto de dados experimentais, para
cada matriz vegetal, foi utilizado para gerar um conjunto estendido de dados,
suficiente para a etapa de treinamento da rede. A validação da rede foi feita
através da comparação entre os resultados preditos e aqueles obtidos
experimentalmente que não constaram no processo de treinamento da rede.
73
Mostrou-se neste trabalho que a rede híbrido-neural correlaciona e prediz
satisfatoriamente os dados experimentais, mostrando-se portanto promissora
no campo da modelagem de processos de extração supercrítica.
FONSECA (1999) também aplicou a modelagem híbrido-neural para
processos de extração supercrítica de óleos essenciais de pimenta-do-reino e
alecrim. A rede neural desenvolvida a partir de um conjunto de dados
estendidos estimou os parâmetros empíricos do modelo fenomenológico. O
modelo final correlacionou os dados experimentais com boa acurácia.
Muitos outros trabalhos envolvendo aplicações da modelagem híbrido-
neural são encontradas na literatura como: AZEVEDO et al., (1997), para
modelagem de processos bioquímicos envolvendo a produção comercial de
leveduras; TEISSIER et al., (1997) que desenvolveram um modelo híbrido-
neural recorrente para monitorar o crescimento das leveduras e controlar a
produção de vinho; e ZBICINSKI et al., (1997) que utilizaram a técnica para
predizer o comportamento dinâmico de um secador de leito fluidizado.
A conclusão que se pode obter é a superioridade da modelagem
híbrido-neural no que diz respeito à modelagem de sistemas complexos e não -
lineares. Entretanto, tem -se que uma das principais desvantagens
apresentadas por tal modelagem é a necessidade de um extenso conjunto de
dados para serem usados na etapa de treinamento da rede a fim de que a
representatividade do sistema seja precisa (FONSECA, 1999). A geração de
dados semi-empíricos se apresenta como uma alternativa para resolver este
problema.
2.7. Geração de Dados Semi-Empíricos
ALBERT e HORWITZ (1995) descreveram algumas técnicas para se
lidar com dados ruins, dados não confiáveis e, também, com a ausência de
dados, dentre elas a criação de interpoladores e subterfúgios estatísticos. A
conclusão apresentada é que se os dados apresentarem erros, corrija-os. Se
74
são em pequeno número, gere alguns outros. Se são dados ruidosos, retifique-
os.
A necessidade de dados é uma condição estabelecida não só pelas modelagens neurais, mas sim por qualquer tipo de representação. Portanto, o uso de um número elevado de dados durante a caracterização de um sistema qualquer é uma condição que deve ser obedecida a fim de que não se perca a capacidade de representação e que assim seja permitida a análise do processo (BRAGA et al., 2000).
O primeiro indício da geração de dados semi-empíricos foi apresentado
por Schubert et al., (1994) citado por FONSECA (1999), que utilizaram este
artifício para cobrir regiões sem dados experimentais. Entretanto, a primeira
metodologia para a geração de dados semi-empíricos com um embasamento
teórico foi apresentada por TSEN et al., (1996), utilizando a expansão em série
de Taylor.
TSEN et al., (1996) propuseram uma metodologia para superar o problema da falta de dados para a aplicação das redes neurais na simulação e controle do processo de polimerização, através da geração de um conjunto de dados semi-empíricos, permitindo um treinamento apropriado da rede neural que foi integrada a um modelo híbrido-neural. Basicamente, os dados semi-empíricos são gerados a partir da interpolação e extrapolação de dados experimentais, como ilustrado através da Figura 2.10, utilizando a expansão em série de Taylor até o termo de primeira ordem e informações de um modelo fenomenológico.
Matematicamente, a metodologia utilizada por TSEN et al., (1996) pode
ser representada da seguinte forma: sejam ) x..., , x,( M21x as M variáveis
independentes de uma certa função não-linear, ) x..., , x,( M21xf , e
) x..., , ,( eM121111
eee xxf , ) x..., , ,( eM222122
eee xxf , ) x..., , ,( eMN21
eN
eN
eN xxf um conjunto de N valores
experimentais da mesma. Dado um novo conjunto de M variáveis
independentes ) x..., , x,( seM
se21
sex , para o qual desejamos determinar o valor
correspondente da função, ) x..., , x,( Mse21
sesese xf , este será obtido através de uma
75
Figura 2.10 - Extrapolação a partir de diferentes pontos experimentais.
combinação linear de valores extrapolados (usando a expansão em série de
Taylor de primeira ordem) a partir dos pontos experimentais disponíveis:
= ∑∑≠
=
M
1=j
ejk
sej
jk
mke
MNe2k1
1
) x- (x x
f + ) x..., , x,(
eji ,ki
x
ek
ek
N
k
sek
se xfwf∂∂
(2.25)
onde mk
f é o valor da função não-linear, correspondente ao ponto experimental
k, fornecido por um modelo fenomenológico e sekw um fator de ponderação,
que é inversamente proporcional à distância entre o ponto semi-empírico a
gerar e o ponto experimental, dado por:
∑ ∑
∑−
=
−
=
−
−
=N
1=’
1
1
2e’
1
1
2
)(
)(
i
M
jji
sej
M
j
ejk
sej
sek
xx
xx
w (2.26)
O conjunto de dados semi-empíricos combina a informação do conjunto
de dados experimentais com a tendência predita por um modelo aproximado,
76
construído a partir dos fenômenos físico-químicos que ocorrem no sistema
(TSEN et al., 1996). Embora as precisões do modelo não sejam
quantitativamente acuradas, o modelo captura o gradiente em relação às
variáveis do processo, pelo menos, qualitativamente (FONSECA, 1999).
Segundo TSEN et al.(1996), quando os pontos experimentais utilizados na geração de um novo dado estão espalhados, provavelmente é mais apropriado usar apenas os pontos experimentais mais próximos para a interpolação (vizinho mais próximo), mas quando os dados foram todos espaçados em uma região densa, estreita, é importante garantir que todos os pontos experimentais sejam empregados na geração de cada ponto semi-empírico.
MILANIC et al., (1997) apresentaram uma rede neural treinada com
dados semi-empíricos com a função de predizer a taxa de precipitação das
partículas de TiO2 que ocorre durante o processo industrial de hidrólise. De
posse de um modelo semi-empírico foi possível implementar um modelo do tipo
híbrido-neural aplicando a metodologia proposta por TSEN et al., (1996) e
fazendo uso de um conjunto de dados semi-empíricos.
O procedimento de se utilizar um conjunto de dados semi-empíricos provou ser extremamente sensível ao número de vizinhos usados para o cálculo de cada ponto, selecionados por tentativa e erro. Assim, MILANIC et al., (1997) concluíram que a aplicação do procedimento de aumentar o conjunto de dados é justificada apenas se o modelo teórico é aproximado. Se o modelo é muito acurado, é preferível utilizá-lo apenas para gerar os dados de treinamento, ao invés de aplicar o procedimento proposto por TSEN et al., (1996).
HENRIQUES (1998) utilizou, no treinamento de redes neurais, a
estratégia de geração de dados semi-empíricos proposta por TSEN et al.,
(1996), como forma de obter um modelo híbrido-neural do processo de
produção de etanol pela bactéria Zymomonas mobilis em modo de operação
batelada alimentada. Nesta abordagem, um conjunto de dados - ditos
aumentados - foi gerado através da combinação dos dados experimentais com
o modelo de tendência, e utilizados no treinamento das redes neurais. Os
melhores resultados foram obtidos quando apenas 4 pontos experimentais
foram utilizados na extrapolação do ponto semi-empírico.
77
Uma simplificação da metodologia apresentada por TSEN et al., (1996)
foi proposta por STUART et al., (1997). Nesta nova abordagem, apenas o
termo zero da expansão foi levado em consideração, como forma de se evitar o
cálculo da derivada na expansão usando a série de Taylor. Um conjunto de 600
dados semi-empíricos, obtidos a partir da metodologia simplificada e do
conjunto de dados experimentais, foi gerado para a etapa de treinamento da
rede neural híbrida cujo objetivo principal era predizer os parâmetros do
processo de extração de óleo essencial de matrizes vegetais.
Quando o modelo fenomenológico não é simples o suficiente, esta
técnica pode resultar em algumas dificuldades computacionais associadas ao
cálculo numérico das derivadas envolvidas. Assim, para certos casos, a
geração de dados semi-empíricos pode se dar através da simplificação da
equação (2.25), representada pela equação (2.27) (FONSECA, 1999):
[ ] ) x..., , x,( eMN
e2k1
1
ek
ek
N
k
sek
se xfwf ∑=
= (2.27)
Baseada nos modelos propostos por TSEN et al., (1996) e STUART et
al., (1997), FONSECA (1999) propôs uma nova abordagem para a geração de
dados semi-empíricos. Esta constituiu-se de uma técnica alternativa baseada
em erros de modelagem, a qual foi denominada MEM. Esta técnica surgiu com
o objetivo de inserir as informações fenomenológicas, sem que fosse
necessária a diferenciação numérica.
A utilização do modelo teórico para fornecer parte da informação na
geração de dados semi-empíricos através da técnica MEM é feita calculando-
se, em cada ponto experimental, a diferença, δ, existente entre o valor
experimental e aquele fornecido pelo modelo. Esta diferença é multiplicada
pelo fator de ponderação sekw para levar em conta a distância entre o ponto
semi-empírico a gerar e o ponto experimental. A geração de um dado semi-
empírico será feita acrescentando-se ao valor teórico, fornecido pelo modelo,
78
uma determinada correção, seδ , que consiste na soma dessas diferenças
ponderadas. Matematicamente, a geração de um novo ponto semi-empírico
pode ser representada pelas seguintes equações:
N ..., 1,=k ) x..., , x,( - ) x..., , x,( eMk
e2k1
eMk
e2k1
ek
ek
ek
mkk xfxf=δ (2.28)
∑=
⋅=N
k
ksek
se w
1
δδ (2.29)
sesemse xff δ + ) x..., , x,( seM
se21= (2.30)
A Figura 2.11 apresenta os elementos envolvidos nesta nova
abordagem para o caso de uma função de duas variáveis, considerando dois
pontos experimentais (fe1 e fe2). Esta técnica de geração de dados semi-
empíricos foi aplicada com sucesso por FONSECA (1999) na modelagem
híbrido-neural de processos de extração supercrítica, onde foi possível modelar
as curvas de extração de óleos essenciais de pimenta-do-reino e alecrim.
Figura 2.11 - Representação de um dado semi-empírico pela técnica MEM.
79
3. MATERIAL E MÉTODOS
Os experimentos foram realizados no Laboratório de Processos de
Separação (LPS) do Departamento de Tecnologia de Alimentos da
Universidade Federal de Viçosa - MG.
3.1. Seleção e Caracterização do Sistema de Trabalho
3.1.1. Preparo dos Sistemas de Fases
Para os experimentos de transferência de massa, foi selecionado o
mais adequado SAB para separar as proteínas do soro de queijo de acordo
com o trabalho de ZUNIGA (2000). A relação de volumes entre fases próxima
da unidade e o maior coeficiente de partição foram os critérios empregados
para a escolha da composição do SAB formado por PEG 1500 e fosfato de
potássio.
Foram analisados sistemas contendo SAB 18% em peso de PEG 1500,
18% em peso de fosfato de potássio na proporção 1 (monobásico):1,82
(dibásico) e 60% de água, acrescidos de 4% de uma solução composta de soro
de queijo in natura e concentrado de proteínas do soro (em pó).
Inicialmente, o PEG e o fosfato de potássio foram dissolvidos
completamente em água seguida de agitação por 2 horas. Foram então
separados em um funil de separação em duas fases: a fase superior rica em
PEG (fase polimérica) e a fase inferior rica em sal (fase salina). A fase salina foi
acrescida da solução composta de soro de queijo in natura e concentrado
58
protéico em pó. Assim, partindo de um total de 100 g do SAB, foram
elaborados 4 sistemas de composição variável em peso na fase salina:
• Sistema 1: foram adicionados 4 g de solução composta de 96,8 % de soro
de queijo e 3,2 % de concentrado de soro de queijo (WPC-80%, AMP-
8000).
• Sistema 2: foram adicionados 4 g de solução composta de 97,2 % de soro
de queijo e 2,8 % de concentrado de soro de queijo com grau de pureza de
90 % (Davisco Foods cedido pelo LASEFI/FEA/UNICAMP - Brasil).
• Sistema 3: foram adicionados 4 g de solução composta de 100 % de soro
de queijo in natura.
• Sistema 4: foram adicionados 4 g de solução composta de 0,5 % de α-la,
1,2 % de β-lg, ambas puras (Sigma) e 98,3% de água.
Estes sistemas foram preparados com o objetivo de identificar aquele
que apresentasse maior solubilidade das proteínas na fase salina e
possibilitasse não só a identificação como também a quantificação das
mesmas.
3.1.2. Quantificação de αα -lactoalbumina e ββ -lactoglobulina nas fases
As proteínas α -la e β-lg foram quantificadas por cromatografia líquida
de alto desempenho (HPLC-Shimadzu, modelo LC-10VP), de acordo com
ZUNIGA (2000) e FERREIRA (2001). As condições operacionais do
cromatógrafo foram: coluna de fase reversa: CLC ODS-C18 (Shimadzu) de 250
mm por 4,6 mm, coluna de guarda: CLC ODS-C18 (Shimadzu) de 10 mm por 4
mm, fase móvel: (A) acetonitrila, (B) NaCl 0,15 M, pH 2,5, vazão da fase móvel:
1 mL/min, temperatura: 40 0C, detector: feixe de diodos (SPD-M10AVP-
Shimadzu), volume de injeção: 20 µL e comprimento de onda: 210 nm.
Os reagentes empregados foram de grau analítico, a água foi deionizada e a acetonitrila, de grau cromatográfico. Todas as soluções
59
utilizadas no equipamento foram preparadas com água deionizada e desgaseificada, tendo sido submetidas à filtração em kitasato com membrana de acetato de celulose com poros de 0,45 µm (Durapor).
Alíquotas das fases polimérica e salina foram injetadas de forma
automática (SIL-10ADVP) e todas as análises foram feitas em duplicata. As
amostras da fase salina foram dessalinizadas por meio de uma coluna
Sephadex (PD-10) pré-empacotada (Pharmacia Biotech). Para tanto, a coluna
foi montada em um suporte adequado e equilibrada com aproximadamente 25
mL de solução tampão (fosfato de potássio 0,01 M e pH 7). Foi adicionado um
volume de 2,5 mL da amostra, sendo o eluente descartado. Um volume de 3,5
mL de solução tampão foi adicionado e uma amostra dessalinizada e diluída foi
coletada.
3.1.2.1. Curvas de Calibração
As curvas de calibração para as proteínas α-la e β-lg foram
determinadas usando soluções das proteínas puras em concentrações na faixa
de 0,02 mg/mL a 3,0 mg/mL. As soluções de proteínas foram preparadas
empregando a fase móvel A (NaCl 0,15M, pH 2,5). O pH da fase móvel foi
ajustado utilizando uma solução concentrada de HCl e o coeficiente de
determinação para cada curva de calibração foi calculado por meio de análise
de regressão linear.
3.2. Experimentos de Transferência de Massa
3.2.1. Extrator Graesser
O extrator Graesser (QVF – Glastechnik Copm., Alemanha) (Figura
3.1), utilizado nos experimentos, diferente da maioria das colunas de extração
60
usuais, é operado horizontalmente. É constituído por um corpo cilíndrico de
vidro e equipado com um motor de 0,25 kW e 35 compartimentos formados por
37 placas circulares de aço inoxidável. Em cada placa estão fixados seis cestos
semicilíndricos de aço inoxidável, parcialmente abertos na direção da mistura
(Figura 3.2).
Figura 3.1 - Montagem experimental do Extrator Graesser.
61
Figura 3.2 – Visualização do corpo interno do Extrator Graesser.
As dimensões do extrator estão listadas na Tabela 3.1.
Tabela 3.1 – Dimensões do extrator Graesser utilizado nos experimentos.
Diâmetro Cm
Interno 10,00 Placa cilíndrica 9,40
Cestos semicilíndricos 2,54 Tubos de entrada e saída 1,30 Eixo do rotor 1,30 Comprimento Cm
Total 100,00 Região de mistura 92,00
Região de separação 8,00 Espaçamento entre as placas cilíndricas 2,54
As fases, escoando em modo contracorrente, como pode ser visto na
Figura 2.4, foram alimentadas pelas extremidades do corpo cilíndrico. A fase
rica em sal foi introduzida e retirada na parte inferior pelos lados esquerdo e
direito, respectivamente. A fase rica em PEG 1500 foi introduzida e retirada na
parte superior pelos lados direito e esquerdo, respectivamente.
62
O extrator trabalha continuamente descarregando a fase inferior, e se
enchendo da fase superior que será levada para a fase de fundo e, ao mesmo
tempo descarrega na fase inferior. Portanto, a fase superior é conduzida
simultaneamente e da mesma maneira para dentro do líquido inferior,
escoando em forma de gotas na direção da interface. O movimento dos
líquidos causado por esta circulação na direção da interface é do tipo cascata.
A separação das fases ocorre nas duas zonas de separação, localizadas nas
extremidades direita e esquerda do corpo cilíndrico (Figura 2.4).
3.2.2. Condições Operacionais
Os experimentos de transferência de massa foram realizados partindo
dos resultados de ZUNIGA (2000), que investigou a influência de diferentes
velocidades de rotação e relações de vazões entre as fases polimérica e salina
sobre a distribuição de tempos de residência e o “hold-up” para o sistema
formado por 18% em peso PEG 1500 - 18% em peso fosfato de potássio. A
Tabela 3.2 mostra as diferentes condições operacionais para os referidos
experimentos.
Tabela 3.2 – Condições operacionais do extrator para o estudo da transferência
de massa.
Velocidade de Rotação (rpm)
Relação de Vazões
salina fase
polimérica fase
V
V
6,6 0,50 0,75 1,00 10,0 0,50 0,75 1,00 12,5 0,50 0,75 1,00
3.2.3. Preparação do Sistema
Para os experimentos em processo contínuo no extrator Graesser,
foram pesados diretamente 9 kg de PEG 1500, 5,8 kg de fosfato de potássio
dibásico, 3,2 kg de monobásico e 30 kg de água, levando a um sistema com
pH 7. Os componentes foram agitados durante 2 horas em recipiente de 50
litros. Após a agitação, o sistema permaneceu em repouso durante 12 horas
63
para decantar e atingir o estado de equilíbrio. Após este intervalo de tempo, as
fases foram separadas em dois recipientes de 26 litros. Uma mistura preparada
com 1,97 kg de soro de queijo in natura (planta piloto da Usina de
Beneficiamento Arthur Bernardes) e 30 g de soro de queijo concentrado, foi
agitada por 2 horas até completa solubilização do concentrado. Esta solução foi
misturada com a fase salina, agitada por 1 hora e alimentada no extrator; a
fase polimérica foi introduzida como solvente extrator. A soma dos sistemas
totalizou 50 kg. Todos os experimentos foram realizados à temperatura
ambiente (aproximadamente 25ºC).
3.2.3.1. Coleta de Dados no Extrator
No extrator operado continuamente a interface entre as fases era
visível. Os experimentos foram conduzidos até que o estado estacionário fosse
atingido, nas condições preestabelecidas de velocidade de rotação e relação
de vazões, como observado na Tabela 3.2. As amostras foram coletadas,
primeiro da fase salina na entrada do extrator e depois em intervalos de 2
tempos de residência da fase salina, nas saídas das fases polimérica e salina.
As concentrações de α-la e β -lg nas amostras foram quantificadas
através de cromatografia líquida conforme descrito anteriormente.
3.3. Simulação da Extração das Proteínas
3.3.1. Determinação dos Parâmetros Físicos
Nesta etapa foram calculados os parâmetros necessários ao estudo da
transferência de massa, Nox e o número de Peclet para as duas fases (Pex e
Pey). Os valores de Pex e Pey foram determinados através do modelo da
dispersão, que utiliza a distribuição do tempo de residência, tanto para a fase
polimérica quanto para fase salina. Os dados usados no cálculo dos tempos de
residência foram determinados por ZUNIGA (2000) no mesmo equipamento e
nas mesmas condições de operação. A partir dos diferentes valores de Pex e
Pey estimados por ZUNIGA (2000) e dos dados de transferência de massa, os
64
valores de Nox foram estimados através de um programa computacional a
partir da solução do modelo de MIYAUCHI e VERMEULEN (1963). O referido
programa também simulou o perfil de concentração ao longo do extrator da
α-la, que foi selecionada como componente-chave.
Para solucionar as equações diferenciais do modelo da dispersão axial,
foi utilizado o método de discretização por diferenças centrais que gera um
sistema de equações algébricas não lineares. Este sistema foi resolvido pelo
método Gauss-Seidel (GERALD e WHEATLEY, 1984) implementado em um
programa computacional em linguagem FORTRAN.
3.3.2. Modelagem Utilizando Redes Neurais Artificiais
3.3.2.1. Geração de Dados Semi-Empíricos
O conjunto de dados obtidos nos experimentos foi insuficiente para o
treinamento, validação e teste de uma rede neural. Assim, houve a
necessidade de aumentar o conjunto de dados através da interpolação e
extrapolação de dados. Diferentes metodologias para interpolação e
extrapolação desses dados foram encontradas na literatura (TSEN et al., 1996,
MILANIC et al., 1997, FONSECA, 1999). Os resultados indicaram que estas
técnicas, quando utilizadas apropriadamente, podem ser eficientes para a
modelagem por redes neurais.
Para utilizar as técnicas de geração de dados semi-empíricos, é
necessário estabelecer funções que correlacionem as variáveis independentes
com uma variável dependente. Como no presente estudo dispõe-se de 2
variáveis independentes (velocidade de rotação e relação de vazões) e 3
variáveis dependentes (Pex, Pey e Nox), foram ajustados 3 modelos através do
software estatístico SAEG (Sistemas para Análises Estatísticas) versão 7.1
(1997).
65
3.3.2.2. Aplicação das Redes Neurais
Um conjunto de 671 dados foi gerado utilizando-se os 9 dados obtidos
experimentalmente. Este conjunto gerado foi subdividido em 3 outros, sendo
462 dados para treinamento, 132 dados para validação e 77 dados para teste,
no qual estão contidos os 9 dados experimentais. Todos os dados foram
normalizados dividindo os valores de cada variável pelo seu maior valor no
conjunto de dados.
Redes neurais do tipo feedforward utilizando a regra de aprendizagem
Quick Propagation (QP) e a função sigmoidal como ativação, foram construídas
através de um software simulador de redes neurais. Para redes com uma e
duas camadas internas, foram testados o número de nodos em cada camada e
diferentes valores para a taxa de aprendizagem, na etapa de treinamento. O
erro de validação foi computado após 1000 iterações da rede. Os outros
parâmetros da regra de aprendizagem seguiram os valores padrões
recomendados pelo programa e a literatura.
O número de camadas internas e o número de nodos em cada camada interna são fatores importantes para que o processo de treinamento da rede seja acurado e eficiente. Não existe uma técnica padrão para determinar a topologia ótima de uma rede. Alguns autores têm empregado a técnica de tentativa e erro, na qual várias arquiteturas distintas de rede são testadas e a que apresenta o menor erro é selecionada. No presente estudo, foi usada a metodologia de superfície de resposta. Para cada rede, dois modelos de superfície de resposta foram ajustados, um para redes com apenas uma camada interna e outro para redes com duas camadas internas. Em ambos os casos, a variável resposta foi o erro quadrado médio obtido na etapa de validação. O modelo quadrático completo foi testado pelo programa computacional para analises estatísticas SAEG.
No caso das redes com duas camadas, a segunda camada interna teve a metade dos nodos da primeira camada interna.
A rede neural com dois nodos na camada de entrada (variáveis
independentes), 10 e 5 nodos, respectivamente, na primeira e segunda
66
camadas intermediárias e três nodos na camada de saída (variáveis
dependentes) foi treinada até o erro de validação atingir o seu menor valor.
Após ser treinada e validada, a rede foi analisada através do conjunto
de teste, que produziu saídas que foram comparadas com as saídas
desejadas. Finalmente, a rede neural foi integralizada e os valores dos pesos
foram tomados. Uma forma simples de visualizar as etapas do
desenvolvimento de uma rede neural é através da figura abaixo.
Figura 3.3 - Etapas do procedimento geral para elaborar uma rede neural.
3.3.3. Modelagem Híbrida
Um novo programa de computador em linguagem FORTRAN foi
desenvolvido para simular o perfil de concentração ao longo da coluna. Foram
utilizadas as redes neurais (para estimar os parâmetros a partir dos dados de
entrada) e as equações 2.7 e 2.8, sujeitas às condições de contorno descritas
pelas equações 2.16 a 2.19.
Por meio dos valores dos pesos da rede, dos limiares internos e da
função de transferência sigmoidal, foi possível representar matematicamente a
rede e calcular as saídas da mesma a partir dos dados de entrada. Os
parâmetros estimados pela rede neural foram implementados no modelo da
dispersão de MIYAUCHI e VERMEULEN (1963) que, pelo algoritmo de iteração
de Gauss-Seidel, simulou o perfil de concentração ao longo do extrator.
67
4. RESULTADOS E DISCUSSÃO
Este capítulo se destina à apresentação e discussão dos resultados
experimentais e da modelagem híbrido-neural do processo de extração das
proteínas do soro de queijo utilizando SABs.
Será mostrado como a modelagem híbrido-neural pode ser considerada
uma ferramenta útil na representação e predição do comportamento de
processos complexos como a extração líquido-líquido.
4.1. Transferência de Massa
A primeira parte deste trabalho consistiu em obter os dados
experimentais de transferência de massa, da composição do SAB que
possibilitasse a maior separação entre as proteínas e das condições de
operação do extrator Graesser (velocidade de rotação e as vazões das fases).
Os resultados experimentais de um determinado fenômeno são importantes
para o estudo e a avaliação de uma nova técnica de modelagem que procura
simular o mesmo fenômeno. Para a modelagem do processo de extração
também foram utilizados os coeficientes de partição das proteínas entre as
fases e os valores de Pex e Pey obtidos por ZUNIGA (2000) nos testes de
caracterização hidrodinâmica no extrator Graesser.
92
4.1.1. Seleção do Sistema de Trabalho
A partir dos resultados experimentais obtidos por ZUNIGA (2000), nos
quais foi observada a influência de diferentes massas moleculares de PEG e o
teor de fosfato de potássio sobre a relação de volumes entre as fases e sobre o
valor do coeficiente de partição das proteínas, foi adotado para os
experimentos de transferência de massa o sistema de trabalho (18% em peso
de PEG - 18% em peso de fosfato de potássio). A seleção deste sistema foi
feita com base no maior valor do coeficiente de partição da α -la, pois levou a
uma separação da α-la e β -lg em maior proporção.
4.1.2. Caracterização Hidrodinâmica do Extrator Graesser
Os dados experimentais para caracterizar a hidrodinâmica do extrator
Graesser foram determinados por ZUNIGA (2000), baseando-se nas
avaliações da distribuição dos tempos de residência e medidas de “hold up”
sob as condições de operação apresentadas na Tabela 3.2. O autor concluiu
que o modelo de dispersão aberto (equação 4.1) descrito por LEVENSPIEL
(1992) foi o que representou melhor a distribuição de tempo de residência para
o sistema sob estudo.
( )
−−
=
PePe
E1
4
1exp
12
1 2
θ
θ
πθθ (4.1)
em que: Eθ é a função resposta; θ é o tempo adimensional; e Pe é o número
de Peclet.
Uma discussão detalhada sobre a influência da velocidade de rotação
e a relação de vazões sobre o coeficiente de dispersão axial pode ser
encontrada em ZUNIGA (2000).
93
4.1.3. Determinação da Concentração de αα -lactoalbumina e
ββ -lactoglobulina
Para os estudos de transferência de massa foi necessário definir um
método analítico adequado para quantificar as concentrações das proteínas
nas fases. O método utilizado foi desenvolvido por ZUNIGA (2000) e
FERREIRA (2001).
A Figura 4.1 mostra um cromatograma para uma amostra de soro de
queijo, evidenciando a boa resolução da técnica.
Figura 4.1 - Cromatograma do soro de queijo in natura.
4.1.4. Experimentos no Extrator
Foram realizados testes experimentais para determinar as condições
de extração favoráveis à quantificação das proteínas em ambas as fases. Os
sistemas pré-selecionados foram aqueles contendo 18% em peso de PEG
1500, 18% em peso de fosfato de potássio e solução aquosa composta por
diferentes proporções de soro in natura e concentrado protéico. Notou-se que a
94
gordura contida no soro in natura e as partículas do concentrado em pó que
permaneceram insolúveis na fase salina, levaram a formação de uma camada
sólida entre as duas fases no processo de extração, dificultando a transferência
de massa.
Testes realizados no laboratório da usina de beneficiamento de leite da
Fundação Arthur Bernardes mostraram um percentual médio de gordura de
3,3% no soro in natura. Os testes em bancada revelaram que o sistema
composto de PEG 18% (em peso), fosfato de potássio 18% (em peso), água
60% (em peso), soro in natura 3,94% (em peso) e concentrado protéico 0,06%
(em peso) foi o mais adequado para a operação em estudo.
4.1.4.1. Separação Contínua das Proteínas do Soro de Queijo
Os experimentos foram realizados em duplicata para cada uma das
condições diferentes (Tabela 3.2) em que o equipamento foi operado. Como os
experimentos foram conduzidos em dias diferentes e dessa forma o soro in
natura utilizado também foi coletado em dias diferentes, os experimentos não
partiram da mesma concentração inicial de proteínas.
COIMBRA (1995) trabalhou com um sistema muito semelhante (14%
em peso PEG 1550 e 18% em peso de fosfato de potássio) e testou as duas
direções de transferência, tanto a da fase polimérica para a fase salina (topo
para fundo) quanto a da fase salina para a fase polimérica (fundo para topo). A
autora utilizou um filtro-prensa para filtrar os sistemas e verificou a
impossibilidade da transferência para o fundo, pelo fato da maior parte da α-la,
presente na solução formada por soro e fase rica em PEG, ficar retida na torta
da filtração. Também verificou a ocorrência de separação de fases no
permeado. Por esse motivo todos os experimentos foram feitos com a direção
de transferência de solutos da fase salina para a fase polimérica.
A Figura 4.2 mostra a permanência da β -lg na fase salina para as 3
velocidades de rotação e as 3 relações de vazão analisadas. Para as relações
de vazão 0,75 e 0,5 nota-se uma independência entre a velocidade de rotação
95
no intervalo de 6,6 a 10 rpm na extração da β -lg. COIMBRA (1995) verificou a
mesma independência da velocidade de rotação na extração da β -lg em um
intervalo de 3 a 9 rpm, onde seus experimentos partiram de concentrações
iguais na entrada da fase salina. Observa-se, ainda, que acima de 10 rpm um
comportamento diferente pode ser observado, onde para a relação de vazão de
0,75 ocorre uma diminuição na extração da proteína, e para a relação de vazão
de 0,5 se verifica um leve aumento. Para a relação de vazão 1 nota-se uma
leve tendência de aumento da extração na faixa de velocidade de rotação
estudada.
Velocidade de rotação (rpm)
6 7 8 9 10 11 12 13
Con
cent
raçã
o ad
imen
sion
al d
a β -
lg
0.0
0.2
0.4
0.6
0.8
1.0
Fase salina 1Fase polimérica 1Fase salina 2Fase polimérica 2Fase salina 3Fase polimérica 3
Figura 4.2 - Concentração adimensional de β-lg nas saídas das fases.
Parâmetro: relação de vazão entre a fase polimérica e salina.
1: Vazão(fase salina) = 80 mL/min e Vazão(fase polimérica) = 60 mL/min.
2: Vazão(fase salina) = 80 mL/min Vazão(fase polimérica) = 40 mL/min.
3: Vazão(fase salina) = 60 mL/min Vazão(fase polimérica) = 60 mL/min.
Durante os experimentos de transferência de massa houve um certo
grau de dificuldade para se manter a interface entre as duas fases na região de
separação. Foi constatado que quanto maior a velocidade de rotação, maior
96
era a dificuldade para controlar a interface. Através da quantificação das
proteínas na saída das fases do extrator e dos experimentos em bancada,
permitiu o tratamento da α -la como o componente que se transfere da fase
salina para a polimérica, e a β-lg que permanece em grande quantidade na
fase salina.
Através do conjunto de dados experimentais, duas relações de fases
foram empregadas para mostrar o efeito do aumento da relação entre PEG e
fosfato de potássio sobre a transferência da α-la. Como pode ser observado na
Figura 4.3, com a razão de vazões entre PEG e fosfato de potássio menor que
1, tem-se um maior enriquecimento da α-la na fase polimérica.
O aumento da velocidade de rotação leva a um pequeno aumento da
concentração da α-la na fase salina, o que não é desejado para o processo.
Adicionalmente, segundo COIMBRA (1995), altas rotações podem levar à
desnaturação da proteína. É importante notar a existência de uma significativa
extração de α-la na fase superior, fazendo desta técnica uma ferramenta
adequada para a separação das proteínas do soro.
97
Velocidade de rotação (rpm)
6 7 8 9 10 11 12 13
Co
nce
ntr
açã
o a
dim
en
sio
na
l da
α-l
a
0.0
0.2
0.4
0.6
0.8
1.0
1.2
Fase salina 1Fase polimérica 1Fase salina 2Fase polimérica 2
Figura 4.3 - Concentração adimensional da α -la nas saídas das fases.
Parâmetro: relação de vazão entre a fase polimérica e salina.
1: Vazão(fase polimérica) = 60 mL/min e Vazão(fase salina) = 80 mL/min.
2: Vazão(fase polimérica) = 60 mL/min e Vazão(fase salina) = 60 mL/min.
4.1.4.2. Influência da Mistura Axial na Transferência de Massa
A Figura 4.4 mostra os resultados obtidos por ZUNIGA (2000) relativos à
dependência do valor de Peclet na fase salina com o aumento da velocidade
de rotação do extrator. Observa-se que maiores velocidades de rotação
levaram a um aumento do grau de mistura axial, expresso por menores valores
de Peclet, para vazões constantes. A mesma tendência foi verificada para a
fase rica em PEG. Assim, maiores velocidades de rotação levaram a um maior
grau de turbulência do sistema, aumentando os valores do coeficiente de
dispersão axial.
98
Velocidade de rotação (rpm)
6 7 8 9 10 11 12 13
Pe
x
22
24
26
28
30
32
34
36
38
40
42
44
Vazão da fase salina = 80 ml/minVazão da fase salina = 60 ml/min
Figura 4.4 - Influência da velocidade de rotação sobre o valor de Peclet
na fase
salina (Vazão da fase polimérica = 60 mL/min) (Fonte: ZUNIGA,
2000).
A Figura 4.5 mostra o mesmo comportamento para a fase polimérica, ou
seja, a vazão da fase polimérica influencia o número de Peclet. Quanto maior a
velocidade de rotação menor o valor de Peclet e maior o efeito da mistura axial
na fase polimérica.
Foi constatado também que os valores de Peclet para a fase rica em sal
são levemente maiores do que para a fase polimérica. O número de Peclet
variou, para a fase salina, de 24,82 a 56,59 e, para a fase polimérica, de 26,03
a 35,93. ZUNIGA (2000) encontrou resultados semelhantes aos obtidos por
COIMBRA (1995).
99
Velocidade de rotação (rpm)
6 7 8 9 10 11 12 13
Pey
25
30
35
40
45
50
55
60
Vazão da fase polimérica = 60 ml/minVazão da fase polimérica = 40 ml/min
Figura 4.5 - Influência da velocidade de rotação sobre o valor de Peclet na fase polimérica (Vazão da fase salina = 80 mL/min). (Fonte: ZUNIGA, 2000).
Durante os experimentos de transferência de massa, foi observado que
as fases se dispersam uma na outra provocando a queda e ascensão das
gotas em direções opostas. Portanto, pode-se supor que sejam duas fases
contínuas se dispersando mutuamente. Segundo COIMBRA (1995), a
suavidade da mistura evita a formação de emulsões, comuns em sistemas com
baixa tensão interfacial e pequena diferença de densidade, que retardariam e
dificultariam a separação das fases.
Com base nos resultados obtidos através dos experimentos de
transferência de massa e por ZUNIGA (2000), é recomendável a operação do
extrator em baixas velocidades de rotação e com baixas relações entre PEG e
fosfato de potássio, o que garantirá a boa separação das proteínas. É
importante enfatizar que das condições estudadas, a extração de α-la foi
satisfatória em 6,6 rpm e na relação PEG e fosfato de potássio de 0,75.
100
4.1.5. Cálculo do Número de Unidades de Transferência
Para o cálculo do NTU foi utilizado o modelo da dispersão axial de
MIYAUCHI e VERMEULEN (1963), os dados com os valores de Peclet e as
concentrações das proteínas determinadas para ambas as fases, nas saídas e
entradas do extrator, para as condições estudadas.
A solução numérica do modelo da dispersão axial (equações 2.7 e 2.8),
juntamente com as condições de contorno (equações 2.16 a 2.19), foi obtida
através da discretização das equações diferenciais empregando-se o método
de diferenças centrais. O sistema de equações algébricas resultantes é dado
pelas equações 4.2 a 4.7.
1j Para =
BX)PexZ2(AX
Y(1))DXPexZ2AXCX)(AX(X(2))1(
+⋅⋅⋅⋅+⋅⋅⋅++⋅
=X (4.2)
BY
X(1))DYY(2)CY)((AYY(1)
⋅+⋅+= (4.3)
M<< j 1 Para
BX
Y(j))DX1)X(jCX1)-X(j(AXX(j)
⋅++⋅+⋅= (4.4)
BY
X(j))DY1)-Y(jCY1)Y(j(AYY(j)
⋅+⋅++⋅= (4.5)
M=j Para
BX
Y(M))DX1)-X(MCX)((AXX(M)
⋅+⋅+= (4.6)
101
Pey)Z2AY(BY
X(M))DYCY1/CX0AYPeyZ21)-Y(MCY)((AYY(M)
⋅⋅⋅+⋅+⋅⋅⋅⋅+⋅+= (4.7)
em que, para a fase salina (x):
AX = 2.0+Z*Pex
BX = 4.0+2.0*(Z2)*Nox*Pex
CX = 2.0-Z*Pex
DX = 2.0*(Z2)*Nox*Pex*k
e para a fase polimérica (y):
AY = 2.0+Z*Pey
BY = 4.0+2.0*(Z2)*Noy*Pey*k
CY = 2.0-Z*Pey
DY = 2.0*(Z2)*Noy*Pey
Foi utilizado o método de Gauss-Seidel para solução do sistema de
equações, enquanto que para a determinação do valor de Nox foi usado o
método de programação quadrática sucessiva. A partir de 400 nodos na malha
e estabelecendo-se um valor máximo de 1x10-6 para a soma do erro total, o
valor de Nox foi determinado com sucesso.
As Figuras 4.6 e 4.7 mostram o perfil de concentração da α-la,
escolhida como componente chave nas fases salina e polimérica em relação ao
comprimento adimensional da coluna (Z). Estas figuras representam apenas 2
das 9 diferentes combinações testadas através do modelo. Nota-se que a
concentração adimensional na saída da fase polimérica é maior que 1, e na
Figura 4.7 não acontece o mesmo efeito. Isto deve-se ao fato da vazão da fase
salina ser maior que a da fase polimérica para o primeiro caso. Como a α -la é
transferida da fase salina para a fase polimérica e esta por sua vez está em
menor volume no equipamento, ao final desta fase sua concentração de
proteína será superior a da entrada da fase salina. Na Figura 4.7, como o
volume das fases são iguais, a concentração protéica final da fase polimérica é
102
um pouco menor que 1, onde pode-se confirmar que a maior parte foi
transferida para a fase polimérica. Através das Figuras 4.6 e 4.7 pode-se
observar ainda um salto da concentração de entrada na fase salina, isto
acontece devido às condições de contorno assumidas para solução do modelo.
Z
0.0 0.2 0.4 0.6 0.8 1.0
Co
nce
ntr
açã
o a
dim
en
sio
na
l da
α-la
0.0
0.2
0.4
0.6
0.8
1.0
1.2
Fase SalinaFase Polimérica
Figura 4.6 - Perfil de concentração adimensional da α -la para a velocidade de
rotação = 6,6 rpm. Vazão(fase salina) = 80 mL/min, Vazão(fase polimérica) =
60 mL/min.
Os parâmetros estimados a partir dos dados experimentais, utilizados
na simulação, estão representados na Tabela 4.1, e também foram
empregados para testar o desempenho da rede neural. As técnicas de geração
de dados semi-empíricos também utilizaram os dados experimentais para
aumentar o conjunto de dados, possibilitando o treinamento e validação da
rede neural.
103
Z
0.0 0.2 0.4 0.6 0.8 1.0
Con
cent
raçã
o ad
imen
sion
al d
a α -
la
0.0
0.2
0.4
0.6
0.8
1.0
Fase SalinaFase Polimérica
Figura 4.7 - Perfil de concentração adimensional da α-la para a velocidade de
rotação = 6,6 rpm. Vazão(fase salina) = 60 mL/min, Vazão(fase polimérica)
= 60 mL/min.
Tabela 4.1 - Valores de Peclet e número de unidades de transferência estimados a partir dos dados experimentais de caracterização hidrodinâmica e transferência de massa para o extrator Graesser.
Vazão (mL/min) Velocidade de rotação (rpm) Fase Salina Fase Polimérica
Pex Pey Nox Noy
80 40 55,19 26,03 1,78 3,56
80 60 41,43 32,18 2,34 3,12 6,6
60 60 36,84 35,93 3,76 3,76
80 40 56,59 32,14 1,28 2,57
80 60 41,54 32,27 1,91 2,55 10
60 60 34,97 34,45 2,01 2,01
80 40 35,74 33,95 0,74 1,47
80 60 27,64 27,63 1,18 1,58 12,5
60 60 24,82 30,11 1,62 1,62
104
4.2. Geração do Dados Semi-Empíricos
Uma desvantagem apresentada pelas redes neurais refere-se a
enorme quantidade de informações requerida para um ajuste eficiente dos
parâmetros. Embora este problema seja reduzido no caso da modelagem
híbrido-neural, algumas dificuldades práticas ainda podem surgir.
Três técnicas distintas, baseadas em diferentes princípios, foram
descritas anteriormente, e podem ser empregadas para solucionar o problema
do número reduzido de dados experimentais disponíveis. A escolha entre uma
ou outra depende da qualidade e informações disponíveis, e os melhores
resultados foram analisados junto com os dados experimentais. Assim, foram
empregadas funções relacionando as duas variáveis independentes,
velocidade de rotação (V) e relação de vazão entre as fases (R), com cada
uma das variáveis dependentes (Pex, Pey, Nox). O objetivo foi avaliar cada
uma das técnicas no sentido de se gerar “conhecimento” que facilitasse a
escolha da mais apropriada.
Através dos dados da Tabela 4.1, procurou-se estabelecer modelos para
cada uma das variáveis Pex, Pey e Nox. Através de análises estatísticas foram
verificados 8 diferentes modelos de regressão para três variáveis, sendo uma
dependente e duas independentes. Os critérios utilizados na escolha destes
modelos foram: a) verificar se o modelo é significativo pelo teste F em um nível
menor que 5%; b) aplicar o teste t de student (análise dos parâmetros
associados aos termos de maior grau) com uma probabilidade menor que 5%;
c) calcular o coeficiente de determinação R2 e escolher o modelo com o maior
coeficiente.
A equação 4.8 apresenta o modelo para Peclet na fase salina. A Tabela
4.2 apresenta as análises estatísticas efetuadas pelo teste de t de student.
Verificou-se que todos os parâmetros foram significativos (p<0,05). Nota-se na
Figura 4.8 que os erros não foram tendenciosos, sendo os resíduos distribuídos
aleatoriamente.
105
343 0347,02290,70328,1027075,1282079,26 RRVVPex ⋅−⋅+⋅+⋅−= (4.8)
Tabela 4.2 – Análise de Variância, teste de t e R2 para o modelo descrito pela
equação 4.8.
Analise de variância
FV GL SQ QM F P
Regressão 4 912,4684 228,1171 28,9667 0,0033 Resíduo 4 31,5006 7,8752
Total 8 943,9691 117,9961
Teste t
Coeficiente Erro Padrão T P
A 26,2079 B -128,7075 34,2700 -3,7557 0,0198 C 102,0328 31,4490 3,2444 0,0315 D 7,2290 2,2727 3,1809 0,0335 E -0,0347 0,0081 -4,3043 0,0126
R2 = 0,96
É importante que estes modelos utilizados nas técnicas para a geração
de novos dados representem bem o comportamento dos dados experimentais,
e não ajustem os dados simplesmente sem demonstrar sua tendência real.
106
Pex (experimental)
20 25 30 35 40 45 50 55 60
Pe
x (m
od
elo
)
20
25
30
35
40
45
50
55
60
Figura 4.8 – Comparação entre o número de Peclet experimental na fase x e o
calculado através do modelo da regressão (equação 4.8).
A equação 4.9 apresenta o modelo para o valor de Peclet na fase
polimérica, e as análises estatísticas relacionadas estão descritas na
Tabela 4.3. Na Figura 4.9 são comparados os valores obtidos
experimentalmente e os valores calculados pelo modelo (equação 4.9). Os
erros também não foram tendenciosos, e os resíduos estão distribuídos
aleatoriamente.
2,22,2 1422,03973,31382,182075,5 RVRVPey ⋅⋅−⋅+⋅+= (4.9)
107
Tabela 4.3 - Análise de Variância, teste t e R2 para o modelo descrito pela
equação 4.9.
Analise de variância
FV GL SQ QM F P
Regressão 3 71,5405 23,8468 10,9017 0,0124 Resíduo 5 10,9372 2,1874
Total 8 82,4777 10,3097
Teste t
Coeficiente Erro Padrão T P
A 5,2075 B 18,1382 3,1894 5,6870 0,0023 C 3,3973 0,7105 4,7812 0,0050 D -0,1422 0,0277 -5,1430 0,0036
R2 = 0,87
Pey (experimental)
24 26 28 30 32 34 36 38
Pe
y (m
od
elo
)
24
26
28
30
32
34
36
38
Figura 4.9 - Comparação entre o número de Peclet experimental na fase y e o
calculado através do modelo da regressão (equação 4.9).
A equação 4.10 representa o modelo para o valor do número de
unidades de transferência na fase salina (Nox). A Tabela 4.4 apresenta as
análises estatísticas para a regressão da equação 4.10. Por meio da
108
Figura 4.10, é feita a comparação dos valores de Nox obtidos através dos
experimentos de transferência de massa e o modelo da dispersão axial, com os
valores obtidos pelo modelo da regressão. Os erros também não foram
tendenciosos, sendo os resíduos distribuídos aleatoriamente.
4,02,1 1605,30067,92473,1 RVVNox ⋅⋅−⋅+= (4.10)
Tabela 4.4 – Análise de Variância, teste t e R2 para o modelo descrito pela
equação 4.10.
Analise de variância
FV GL SQ QM F P
Regressão 2 5,6987 2,8493 60,3818 0,0001 Residual 6 0,2831 0,0472
Total 8 5,9818 0,7477
Teste t
Coeficiente Erro Padrão T P
A 1,2473 B 9,0067 0,8541 10,5452 <0,0001 D -3,1605 0,3645 -8,6698 0,0001
R2 = 0,95
A partir dos modelos ajustados para cada uma das variáveis
independentes e com o uso dos dados experimentais (Tabela 4.1) foram
testadas as várias técnicas para geração dos dados semi-empíricos. A
velocidade de rotação variou em uma faixa de 6,1 a 13 rpm para cada uma das
3 relações de vazões utilizadas nos experimentos de transferência de massa.
Como forma de comparar os resultados apresentados pelas diferentes
técnicas, estabeleceu-se um índice de desempenho (R1) como definido por
FONSECA (1999):
( )∑=
−=ndse
i
sem YYndse
R
1
211 (4.11)
109
em que ndse é o número de dados semi-empíricos, Ym é o valor obtido pelo
modelo e Yse o valor semi-empírico gerado.
Nox (experimental)
0 1 2 3 4
No
x (m
od
ela
do
)
0
1
2
3
4
Figura 4.10 - Comparação entre o Nox experimental e o calculado através do
modelo da regressão (equação 4.10).
Os dados gerados a partir da técnica desenvolvida por TSEN (1996)
(expansão em série de Taylor de primeira ordem) serão aqui denominados
GDSE1 e, pela técnica descrita por STUART et al. (1997) (expansão em série
de Taylor de ordem zero), GDSE2. Para a técnica proposta por FONSECA
(1999) (baseada em erros de modelagem), os dados serão denominados por
GDSE3. Os resultados obtidos com o uso das diferentes técnicas encontram-se
na Tabela 4.5.
110
Tabela 4.5 - Desempenho R1 (equação 4.11) apresentado pelas diferentes
técnicas analisadas.
salina fase
polimérica fase
V
V Parâmetros GDSE1 GDSE2 GDSE3
Pex 5,75 117,97 0,159
Pey 2,61 4,13 0,0079 0,50
Nox 0,135 0,250 0,00051
Pex 1,98 7,65 0,00687
Pey 0,104 0,512 0,0333 0,75
Nox 0,0695 0,0235 0,0042
Pex 59,52 28,66 0,145
Pey 1,80 10,83 0,0048 1,00
Nox 0,0792 0,424 0,00078
Analisando os índices acima, nota-se a superioridade da técnica
GDSE3. A influência da função multivariável na geração dos dados semi-
empíricos contribui para a qualidade dos dados gerados segundo a técnica
GDSE3. FOSECA (1999) analisou as três técnicas utilizando dados de duas
regiões distintas, uma linear e outra não linear e concluiu que, as técnicas
GDSE1 e GDSE2 não são indicadas em regiões não-lineares com poucos
dados representativos. Ao se fazer uso destas duas técnicas, todos os pontos
experimentais poderão ser utilizados na geração de um dado semi-empírico,
desde que a região a ser estendida seja aproximadamente linear.
As Figuras 4.11, 4.12 e 4.13 apresentam os valores de Pex, Pey e Nox
em função da velocidade de rotação, a partir dos dados semi-empíricos
gerados pelas três técnicas utilizadas. Pode-se comprovar a superioridade da
técnica GDSE3 e visualizar onde as outras metodologias apresentam falhas,
levando a aumentos no índice R1. A forma de visualização dos resultados foi
estabelecida por meio de gráficos feitos no plano velocidade de rotação e valor
de cada parâmetro com cortes na relação de vazões.
111
19
24
29
34
39
44
5.8 6.8 7.8 8.8 9.8 10.8 11.8 12.8
Velocidade de Agitação (rpm)
Pe
x
Pontos experimentais
Modelo (Regressão)
GDSE1
GDSE2
GDSE3
Figura 4.11 - Valores de Pex estimados pelas técnicas aplicadas, utilizando os
9 pontos experimentais e a equação 4.8 para uma relação de
vazão de 0,75.
Verifica-se na Figura 4.11 a superioridade da técnica GDSE3
observando que as outras duas técnicas apresentam erros maiores. A técnica
GDSE1, entretanto, também é adequada no acompanhamento dos pontos
experimentais, mas não descreve bem a função, que mostra a tendência dos
três pontos experimentais.
Nas Figuras 4.12 e 4.13 pode-se notar que, para os valores de Pey e
Nox, as técnicas GDSE1 e GDSE2 se aproximam dos dados experimentais nas
regiões próximas a eles, mas em regiões mais afastadas dos dados
experimentais a diferença em relação ao modelo ajustado é muito grande. Para
a técnica GDSE3 ocorre a mesma aproximação nas regiões próximas aos
dados experimentais e uma grande uniformidade com o modelo ajustado nas
regiões mais afastadas. Portando, o comportamento da técnica GDSE3 foi
satisfatório para gerar o conjunto de dados expandidos necessários para o
112
desenvolvido da rede neural na modelagem híbrido-neural para o processo de
extração líquido-líquido.
25
26
27
28
29
30
31
32
33
34
35
5.8 6.8 7.8 8.8 9.8 10.8 11.8 12.8
Velocidade de Rotação (rpm)
Pey
Pontos experimentais
Modelo (Regressão)
GDSE1
GDSE2
GDSE3
Figura 4.12 - Valores de Pey estimados pelas técnicas aplicadas, utilizando os
9 pontos experimentais e a equação 4.9 para uma relação de
vazão de 0,50.
113
1
1.5
2
2.5
3
3.5
4
5.8 6.8 7.8 8.8 9.8 10.8 11.8 12.8
Velocidade de Rotação (rpm)
Nox
Pontos experimentais
Modelo (Regressão)
GDSE1
GDSE2
GDSE3
Figura 4.13 - Valores de Nox estimados pelas técnicas aplicadas, utilizando os
9 pontos experimentais e a equação 4.10 para uma relação de
vazão de 1,00.
4.3. Modelagem Híbrida
Usando a técnica GDSE3, foram gerados 662 dados semi-empíricos, a
partir dos 9 dados experimentais, sendo estes divididos em 3 conjuntos
distintos: a) 68,8% dados de treinamento; b) 19,7% dados para validaç ão;
c) 11,5% para teste.
A divisão dos dados nestas porcentagens para a formação dos
conjuntos seguiu a recomendação do software utilizado para a simulação da
rede neural, onde uma estimativa do número de exemplos de treinamento
necessários para um determinado tamanho de rede é restrita pelas seguintes
equações:
Ε⋅
Ε=
NWLs log (4.12)
114
Ε= W
Li (4.13)
em que:
Ls = limite superior da quantidade de dados necessários;
Li = limite inferior da quantidade de dados necessários;
W = número de pesos na rede;
N = número de elementos de processamento (nodos);
Ε = fração de erro da resposta aceitável.
O último conjunto incluiu os 9 dados experimentais. A relação de vazão
variou de 0,05 em um intervalo de (0,50 a 1,00) mL/min e a velocidade de
rotação de 0,10 em um intervalo de (6,50 a 12,50) rpm. Estes intervalos foram
escolhidos por estarem dentro dos limites tratados experimentalmente.
Observou-se que para os dados semi-empíricos interpolados, o erro contido
era menor do que para dados extrapolados.
Em geral, quanto menor a rede neural, menor número de dados são
necessários para alcançar um bom desempenho da rede. Os dados gerados
foram normalizados e dispostos em ordem aleatória em cada um dos
conjuntos. A normalização dos dados foi feita através da divisão de todos os
valores do parâmetro pelo maior valor deste.
4.3.1. Desenvolvimento da Rede Neural
Dado as características do problema a ser modelado, foi selecionada
uma arquitetura de rede em multicamadas do tipo feedforward. Cada camada
interna da rede para este tipo de arquitetura recebe um vetor de entrada, que é
o vetor de saída da camada anterior. As camadas são colocadas em uma
ordem linear, de forma que a entrada da primeira camada recebe os valores
das variáveis independentes (relação de vazões e velocidade de rotação),
enquanto que a saída da última camada fornece os valores das variáveis
dependentes, neste caso correspondendo ao valor dos parâmetros do modelo
(Pex, Pey e Nox).
115
Outro importante passo desenvolvido foi a escolha do tipo de erro da rede para a avaliação e ajuste dos pesos da mesma através do algoritmo de
aprendizagem. O tipo de erro utilizado foi o erro quadrado médio.
A regra de aprendizagem Quick Propagation (QP) foi utilizada nas
camadas intermediárias e na camada de saída. A rede neural foi treinada e
avaliada simultaneamente variando o valor da taxa de aprendizagem do
algoritmo QP e sua topologia.
4.3.1.1. Determinação da Topologia da Rede e da Taxa de Aprendizagem
A metodologia de superfície de resposta foi utilizada para determinar a
topologia que gera uma rede com melhor desempenho, além de quantificar o
parâmetro taxa de aprendizagem, que faz com que o processo de
aprendizagem seja mais eficiente. SARAIVA (1999) utilizou com sucesso esta
metodologia para determinar a topologia de uma rede neural para predição da
eficiência do processo de extração em uma coluna de discos rotativos
perfurados. O número de ciclos (iterações durante o treinamento) foi fixado em
1000 para todos os testes e a etapa de validação foi realizada
simultaneamente. Um modelo quadrático completo foi ajustado para redes com
uma camada interna e com duas camadas internas. Os resultados foram
obtidos através do programa SAEG e estão resumidos a seguir.
O modelo ajustado para a rede com uma camada interna foi:
Y = 0,10 - 9,92 x1 - 0,019 x2 + 1329,31 x12 + 0,0013 x2
2 + 0,89 x1x2 (4.14)
em que:
Y = erro quadrado médio;
x1 = taxa de aprendizagem;
x2 = número de nodos na primeira camada.
Tabela 4.6 - Análise de variância (rede com uma camada interna).
116
FV GL SQ QM F P
Regressão 5 0,000257 0,0000515 2,78 0,0327
Independente
da regressão
34 0,000629 0,0000185
A análise de variância mostra que o modelo ajustado é adequado
(p<0,005) para descrever a relação funcional de Y com as variáveis x1 e x2.
Os valores críticos determinados foram: x1 = 0,001 e x2 = 6,81
Valor predito: Y = 0,0280 **
** O ponto crítico é um mínimo.
O modelo ajustado para a rede com duas camadas internas foi:
Y = 0,12 – 4,76 x1 – 0,022 x2 + 1503,61 x12 + 0,0011 x2
2 + 0,0078 x1 x2 (4.15)
Tabela 4.7 - Análise de variância (rede com duas camadas internas).
FV GL SQ QM F P
Regressão 5 0,000307 0,0000615 2,78 0,0329
Independente
da regressão
34 0,000752 0,0000221
A análise de variância mostra também que o modelo ajustado é
adequado (p<0,05) para descrever a relação funcional de Y com as variáveis x1
e x2.
Os valores críticos determinados foram: x1 = 0,001 e x2 = 9,99
Valor predito: Y = 0,0063 **
** O ponto crítico é um mínimo.
A Figura 4.14 mostra um comportamento típico do erro quadrado médio,
diminuindo com o aumento do número de nodos, até atingir um valor mínimo.
Em seguida o erro aumenta porque o número de exemplos passa a ser
117
insuficiente para as redes com muitos nodos. Quanto maior a rede maior o
número de exemplos necessários para estabelecer as relações entre os
parâmetros preditos. Essas curvas foram geradas a partir do modelo ajustado
pela metodologia de superfície de resposta, mantendo-se uma taxa de
aprendizagem igual a 0,001 (valor padrão do simulador). Pode-se notar que as
redes com duas camadas internas apresentam um melhor desempenho que a
rede com uma camada interna. Deve-se levar em conta que as redes com duas
camadas internas apresentam um maior esforço computacional, fazendo com
que o processo de aprendizagem da rede consuma maior tempo. No entanto,
as redes com duas camadas apresentaram um erro menor quando
comparadas com as de uma camada.
Número de Nodos na Primeira Camada Interna
0 2 4 6 8 10 12 14
Err
o Q
uadr
ado
Méd
io
0.00
0.02
0.04
0.06
0.08
0.10
rede com 1 camada internarede com 2 camadas internas
Figura 4.14 - Erro quadrado médio em função do número de nodos na camada interna para redes com uma camada interna e duas camadas internas.
Observou-se ainda que para as redes com duas camadas internas, o
erro quadrado médio é mínimo quando o número de nodos na primeira camada
interna é 10. Portanto, a rede neural que apresenta melhor desempenho é a
118
rede que contém duas camadas internas com 10 e 5 nodos na primeira e
segunda camadas, respectivamente. A topologia desta rede pode ser
visualizada pela Figura 4.15.
Figura 4.15 – Topologia da rede neural com duas camadas internas selecionada
para simulação dos parâmetros.
4.3.1.2. Curva de Aprendizagem
Após a determinação da topologia da rede com uma taxa de
aprendizagem igual a 0,001 e utilizando a função sigmoidal como função
transferência, a rede foi treinada durante 10000 ciclos e o conjunto de
validação foi estimado para cada ciclo do conjunto de treinamento. O erro
quadrado médio foi calculado para os dados de treinamento e validação. A
Figura 4.16 mostra o erro quadrado médio ao longo do treinamento para cada
uma destas etapas como função do número de ciclos. Pode-se notar que
inicialmente os erros das etapas de treinamento e validação diminuem
bruscamente até atingirem um valor a partir do qual ficam praticamente
constantes. Tais valores, correspondem a aproximadamente 0,0078 e 0,0079
para os conjuntos de treinamento e validação, respectivamente, após 10000
119
ciclos. O erro quadrado médio para o conjunto de validação foi maior do que o
conjunto de treinamento durante cada ciclo de treinamento. Verificou-se pela
curva de aprendizagem que não ocorreu overfitting (ajuste excessivo dos pesos
da rede). Segundo BRAGA et al. (2000) o overfitting ocorre quando, após um
certo ciclo do treinamento, a rede, ao invés de melhorar, começa a piorar a sua
taxa de acertos para padrões diferentes daqueles utilizados (conjunto de
validação) para o ajuste dos pesos. Diz-se então que a rede memorizou os
padrões de treinamento, gravando suas peculiaridades e ruídos.
Visto que os parâmetros da rede e sua topologia estão adequados de
acordo com a curva de aprendizagem durante o treinamento, a rede foi
integrada e avaliada através do conjunto de teste.
Iterações
0 2000 4000 6000 8000 10000
Err
o qu
adra
do m
édio
0.0
0.1
0.2
0.3
0.4
Erro do conjunto de treinamentoErro do conjunto de validação
Figura 4.16 - Erro quadrado médio para as etapas de treinamento e validação em função do número de ciclos utilizados no treinamento. 4.3.1.3. Desempenho da Rede Neural
A rede neural desenvolvida apresentou um baixo erro na fase de
validação o que indica que a rede possui boa capacidade de generalização, ou
120
seja, consegue prever bem situações que não foram apresentadas a ela na
etapa de treinamento.
As Figuras 4.17 a 4.19 mostram a comparação dos valores dos
parâmetros do conjunto de teste (onde estão incluídos os dados experimentais)
com os preditos pela rede durante a etapa de teste. A proximidade destes
pontos com a reta Y=X indica que os valores preditos pela rede neural estão
muito próximos dos valores exatos.
Nox (conjunto de teste)
0.5 1.0 1.5 2.0 2.5 3.0 3.5 4.0
Nox
(si
mul
ado
pela
red
e ne
ural
)
0.5
1.0
1.5
2.0
2.5
3.0
3.5
4.0
Dados experimentais
Figura 4.17 – Comparação entre os valores preditos pela rede neural e os
valores do conjunto de teste para o parâmetro Nox.
121
Pex (conjunto de teste)
20 25 30 35 40 45 50 55 60
Pex
(si
mul
ado
pela
red
e ne
ural
)
20
25
30
35
40
45
50
55
60
Dados experimentais
Figura 4.18 – Comparação entre os valores preditos pela rede neural e os
valores do conjunto de teste para o parâmetro Pex.
Pode-se notar que a distribuição dos resíduos ocorre aleatoriamente
para os três parâmetros, não havendo nenhuma variação tendenciosa nas
respostas do modelo. A partir dos valores da velocidade de rotação e relação
de vazão entre as fases, a rede neural simulou os parâmetros com boa
precisão descrevendo bem os seus comportamentos.
Com o programa desenvolvido para simular o gradiente de
concentração ao longo do extrator, a rede neural foi incorporada para estimar
os parâmetros do modelo (Pex, Pey e Nox). Este modelo híbrido representou
muito bem o experimento estudado, conforme apresentado a seguir.
122
Pey (conjunto de teste)
26 28 30 32 34 36 38
Pe
y (s
imu
lad
o p
ela
re
de
ne
ura
l)
26
28
30
32
34
36
38
Dados experimentais
Figura 4.19 – Comparação entre os valores preditos pela rede neural e os
valores do conjunto de teste para o parâmetro Pey.
4.3.2. Modelagem Híbrido-Neural
Através dos valores dos pesos nas conexões, dos limiares internos da
rede selecionada e da função de transferência sigmoidal, foi possível
reconstruir a rede neural dentro do programa desenvolvido para estimar o
gradiente de concentração da proteína escolhida como componente chave.
O programa calcula o perfil de concentração a partir da velocidade de
rotação (rpm) e as vazões da fase polimérica e salina. Através das Figuras 4.20
a 4.22 os resultados da simulação híbrido-neural foram comparados com os
nove pontos experimentais e o modelo desenvolvido inicialmente para estimar
o Nox a partir dos dados de transferência de massa.
Os valores das concentrações simuladas a partir da modelagem híbrido-
neural apresentaram precisão semelhante ao modelo de dispersão axial desenvolvido por MIYAUCHI e VERMEULEN (1963). Pode -se notar pelas
123
Figuras 4.20 a 4.22 que quanto maior a velocidade de rotação pior a precisão nos resultados simulados. Esse prejuízo deve-se, provavelmente, à dificuldade de
realização dos experimentos nesta região de velocidade elevada.
Velocidade de rotação (rpm)
6 7 8 9 10 11 12 13
Co
nce
ntr
açã
o d
a
α-la
(m
g/m
l)
0.0
0.1
0.2
0.3
0.4
0.5
Saída da fase salina (modelo da dispersão axial)Saída da fase salina (experimental)Saída da fase salina (modelo híbrido)Saída da fase polimérica (modelo da dispersão axial)Saída da fase polimérica (experimental)Saída da fase polimérica (modelo híbrido)
Figura 4.20 – Comparação entre as concentrações simuladas pelo modelo da
dispersão axial, modelo híbrido e os dados experimentais: vazão
da fase salina = 60 mL/min e vazão da fase polimérica =
60 mL/min.
Os dados obtidos através da modelagem híbrido-neural provam que
esta técnica pode ser utilizada adequadamente para a simulação do processo
de extração de proteínas empregando um extrator líquido-líquido, uma vez que
a determinação dos parâmetros (Pex, Pey e Nox) é muito mais simplificada e
rápida que a técnica tradicional.
124
Velocidade de rotação (rpm)
6 7 8 9 10 11 12 13
Co
nce
ntr
açã
o d
a α
-la
(m
g/m
l)
0.0
0.2
0.4
0.6
0.8
1.0
Saída da fase salina (modelo da dispersão axial)Saída da fase salina (experimental)Saída da fase salina (modelo híbrido)Saída da fase polimérica (modelo da dispersão axial)Saída da fase polimérica (experimental)Saída da fase polimérica (modelo híbrido)
Figura 4.21 – Comparação entre as concentrações simuladas pelo modelo de
dispersão axial, modelo híbrido e os dados experimentais: vazão
da fase salina = 80 mL/min e vazão da fase polimérica =
40 mL/min.
125
Velocidade de rotação (rpm)
6 7 8 9 10 11 12 13
Co
nce
ntr
açã
o d
a α
-la
(m
g/m
l)
0.0
0.2
0.4
0.6
Saída da fase salina (modelo da dispersão axial)Saída da fase salina (experimental)Saída da fase salina (modelo híbrido)Saída da fase polimérica (modelo da dispersão axial)Saída da fase polimérica (experimental)Saída da fase polimérica (modelo híbrido)
Figura 4.22 – Comparação entre as concentrações simuladas pelo modelo de
dispersão axial, modelo híbrido e os dados experimentais: vazão
da fase salina = 80 mL/min e vazão da fase polimérica =
60 mL/min.
126
5. CONCLUSÕES
Neste trabalho foi avaliado o comportamento do processo de
recuperação das proteínas do soro de queijo empregando SABs em um
extrator líquido-líquido diferencial, operando continuamente em modo
contracorrente, bem como foi simulada esta operação usando a técnica de
modelagem híbrido-neural. Esta modelagem consistiu em utilizar uma rede
neural para predizer os valores dos parâmetros necessários para o modelo da
dispersão axial, selecionado como o modelo mecanístico mais adequado para
calcular o perfil de concentração ao longo do extrator.
Três etapas distintas podem ser identificadas na realização deste
trabalho de dissertação:
• A primeira consistiu em obter os dados experimentais de transferência de
massa para os sistemas estudados, uma vez que bons resultados foram
encontrados por outros pesquisadores (COIMBRA, 1995, e ZUNIGA, 2000)
na caracterização hidrodinâmica do extrator para o mesmo sistema com as
mesmas condições estudadas.
• A segunda procurou simular o processo de extração através do modelo da
dispersão axial e determinar seus parâmetros para as condições
estudadas.
95
• Durante a última etapa foi construída uma rede neural híbrida para predizer
o perfil de concentração. Para isto foram testadas metodologias com o
intuito de gerar conjuntos estendidos de dados (parâmetros do modelo em
função das variáveis operacionais velocidade de rotação e relação de
vazão solvente/alimentação), compreendendo os dados semi-empíricos e
os dados experimentais, cuja principal função foi aprimorar a etapa de
treinamento da rede neural. Como discutido por FONSECA (1999), isto faz
com que a acurácia na predição dos parâmetros do modelo seja
aumentada visando um melhor desenvolvimento da modelagem híbrido-
neural.
Durante os experimentos de transferência de massa o extrator
demonstrou que é uma unidade de extração apropriada para o trabalho com
SABs. Foram estabelecidas 9 condições operacionais diferentes as quais
levaram a boas taxas de extração durante o processamento. A α-la e a β-lg
foram separadas satisfatoriamente do soro de queijo. A α -la foi concentrada na
fase superior ou fase rica em PEG e a β -lg na fase inferior ou fase salina.
Para a construção da rede neural feedforward foram determinados
parâmetros ótimos como a taxa de aprendizagem para o algoritmo de
treinamento Quick Propagation (0.001), topologia da rede (2x10x5x3) e o
número de exemplos (entrada-saída) para cada conjunto de dados necessários
para um bom treinamento da rede. O bom treinamento da rede desenvolvida
levou a uma boa capacidade de generalização, e tornou-a capaz de gerar
resultados próximos àqueles obtidos pelo modelo da dispersão axial utilizando
os dados experimentais.
Um software foi desenvolvido para a modelagem híbrida, na qual o modelo da dispersão axial foi utilizado para estimar o perfil de concentração sendo que os parâmetros deste modelo (Pex, Pey e Nox) foram estimados utilizando uma rede neural a partir dos dados operacionais. Esta arquitetura criou um ambiente de simulação eficiente e flexível para pesquisa deste processo de extração, sendo capaz de predizer, com razoável precisão, a concentração da α-la nas duas fases ao longo de toda a coluna.
96
A tecnologia de redes neurais mostrou-se uma excelente alternativa na
modelagem de processos pouco compreendidos, como a extração líquido-
líquido, cujos fenômenos físicos não são completamente esclarecidos, uma vez
que ela necessita apenas de um conjunto representativo de dados de entrada –
saída para aprender as relações implícitas nestes dados.
Com relação ao problema do número reduzido de dados experimentais,
a geração dos dados semi-empíricos mostrou-se uma solução alternativa
eficiente para aprimorar a etapa de treinamento da rede neural.
A modelagem híbrida constitui-se como uma poderosa ferramenta na representação e predição do comportamento de processos complexos. Essa nova técnica proporcionou uma forma particularmente conveniente para aumentar o conhecimento anterior na estimação, predição e controle do sistema estudado.
97
REFERÊNCIAS BIBLIOGRÁFICAS
ALBERT, R. H., HORWITZ, W. Incomplete data sets: coping with inadequate databases. Journal of AOAC International, v. 78, n. 6, p. 1513-1515, 1995.
ALBERTSSON, P. A. Partition of cell and macromolecules. John Wiley, New York, 1986, 346 p.
ALDRICH, C., SLATER, M. J. Neural separation - how neural networks will lead to better control and simulation of extraction columns. The Chemical Engineer, p. 11, 6 april 1995.
ALVARENGA, A. L. B. Separação de ácido lático por extração líquido-líquido em coluna de discos rotativos perfurados. 1999. 87 p. Dissertação (Mestrado), Departamento de Ciência e Tecnologia de Alimentos, Universidade Federal de Viçosa.
ANTONIASSI, Rosemar. Desacidificação de óleo de milho com etanol em colunas de discos rotativos (RDC). 1996. 185 p. Tese (Doutorado), Faculdade de Engenharia de Alimentos, Universidade Estadual de Campinas.
AZEVEDO, S. F., DAHM, B., OLIVEIRA, F. R. Hybrid modelling of biochemical processes: a comparison with the conventional approach. Computers Chem. Eng., v. 21, p. S751-S756, 1997.
BALASUBRAMANIAN, A., PANDA, R. C., RAO, V. S. R. Modeling of a fluidized bed drier using artificial neural network. Drying Technology, v. 14, n. 7-8, p. 1881-1889, 1996.
BARUFFALDI, R., OLIVEIRA, M. N. Fundamentos de tecnologia de alimentos. São Paulo: Atheneu, 1998. V. 3, 316 p.
BAUGHMAN, D. R., LIU, Y. A. An expert network for predictive modeling and optimal design of extractive bioseparations in aqueous two-phase systems. Industrial & Engineering Chemistry Research, v. 33, p. 2688-2687, 1994.
BAUGHMAN, D. R., LIU, Y. A. Neural networks in bioprocessing and chemical engineering. San Diego, California: Academic Press, Inc., 1995, 488 p.
BRAGA, A. P., LUDIMIR, T. B., CARVALHO, A. C. P. L. F. Redes neurais artificiais: teoria e aplicações. 1. ed. Rio de Janeiro: LTC - Livros Técnicos e Científicos Editora S. A., 2000, 262 p.
CHEFTEL, J. C., CUQ, J. L., LORIENT, D. Proteínas alimentarias. Zaragoza, Espanha: Editorial Acribia, 1989, 346 p.
CHEN, J. P. Partitioning and separation of α -lactalbumin and β-lactoglobulin in peg/potassium phosphate aqueous two-phase systems, Journal of Fermentation Bioengineering, v. 73, n. 2, p. 140-147, 1992.
CHITRA, S. P., BULSON III, R. J., MORRELL, D. G. Computer programs that learn from experience. Chemtech, p. 18-26, february 1995.
COIMBRA, J.S.R. Análise da eficiência de extração em colunas de discos rotativos na purificação de ácido láctico. 1991. 115 p. Dissertação (Mestrado), Faculdade de Engenharia de Alimentos, Universidade Estadual de Campinas.
COIMBRA, J.S.R. Desempenho de um extrator tipo Graesser na separação de proteínas do soro de queijo usando sistemas aquosos bifásicos. 1995. 129 p. Tese (Doutorado), Faculdade de Engenharia de Alimentos, Universidade Estadual de Campinas.
CUBILLOS, F. A., ALVAREZ, P. I., PINTO, J. C., LIMA, E. L. Hybrid-neural modeling for particulate solid drying processes. Powder Technology, v. 87, p. 153-160, 1996.
DAMODARAN, S., PARAF, A. Food proteins and their applications, New York: Marcel Dekker, Inc., 1997, 681 p.
DAVIES, D. T., LAW, A. Composición proteica comparativa de leche de mujer y vaca. J. Dairy Res., v. 47, p. 82-83, 1980.
FERREIRA, R. C. Separação de αα -lactoalbumina e ββ-lactoglobulina de proteínas de soro de queijo por adsorção em colunas de leito fixo. 2001. 81 p. Dissertação (Mestrado), Departamento de Ciência e Tecnologia de Alimentos, Universidade Federal de Viçosa.
FONSECA, A. P. Modelagem híbrido-neuronal do processo de extração supercrítica. 1999. 139 p. Dissertação (Mestrado), COPPE - Engenharia Química, UFRJ.
GERALD e WHEATLEY, Applied numerical analysis 3. ed. California: Addison-Wesley Publishing Company, 1984, 579 p.
GHEORGHITA, J., LAVRIC, V. The artificial neural networks and the drying process modeling. Drying Technology, v. 13, n. 5-7, p. 1579-1586, 1995.
HENRIQUES, A. W. S. Controle ótimo da produção de etanol por zymomonas mobilis. 1998. 119 p. Dissertação (Mestrado), COPPE - Engenharia Química, UFRJ.
HUSTED, H., KRONER, K. H., MENGE, U., KULA, M. R. Enzyme purification by liquid-liquid extraction. Enzyme Eng., v. 5, p. 45-47, 1980.
KAN, P., LEE, C. J. A neural network model for prediction of phase equilibria in aqueous two-phase extraction. Ind. Eng. Chen., v. 35, p. 2015-2023, 1996.
KANEKO, T., WU, B. T., NAKAI, S. Selective concentration of bovine immunoglobulins and α -lactalbumins from acid whey using FeCl3. Journal of Food Science , v. 50, p. 1531-1536, 1985.
KORCHINSKY, W.J. Liquid-liquid extraction column modeling: Is the forward mixing influence necessary? Trans. IChem. E., v. 70, p. 333-345, 1992.
KULA, M. R., KRONER, K. H., HUSTED, H. Purification of enzymes by liquid-liquid extraction. Adv. Biochem. Eng., Spring Verlag, Berlin: Fiechter A., v. 24, p. 73-118, 1982.
LEVENSPIEL, O. Chemical Reaction Engineering, 3. ed. New York: Wiley, 1992, 668 p.
LOGSDAIL, D. H., LOWES, L. Industrial contacting equipment. In: HANSON, C. (ed.) Recent advances in liquid-liquid extraction. Braunschweig, Hungary, 1971, p. 237-291.
MACHADO, F. L. C. Equilíbrio de fases para sistemas aquosos bifásicos compostos por polietilenoglicol - maltodextrina - água. 1999. 170 p. Dissertação (Mestrado), Departamento de Ciência e Tecnologia de Alimentos, Universidade Federal de Viçosa.
MÄKINEN-KILJUNEN, S., PALOUSUO, T. A. A sensitive enzyme-linked immunosorbent assay for the determination of bovine β-lactoglobulin in infant feeding formulas and in human milk. Clinical and Experimental Allergy, v. 47, p. 347-352, 1992.
MILANIC, S., SEL, D., HVALA, N., STRMCNIK, S., KARBA, R. Applying artificial neural network models to control a time variant chemical plant. Computers Chem. Eng., v. 21, p. S637-S642, 1997.
MIYAUCHI, T. and VERMEULEN, T. Longitudinal dispersion in two-phase continuos-flow operations, Ind. Eng. Chem. Fundamentals, v. 2, n. 2, p. 113-127, 1963.
PEÑA, Wilmer E. L. Aplicação de redes neurais na modelagem do tratamento térmico de alimentos. 1999. 79 p. Dissertação (Mestrado), Departamento de Ciência e Tecnologia de Alimentos, Universidade Federal de Viçosa.
ROBBINS, L. A. Liquid-liquid extraction: A pretreatment process for wastewater. Chem. Eng. Prog., p. 58-61, October, 1980.
SARAIVA, S. H. Aplicação de redes neurais na predição da eficiência de uma coluna de discos rotativos perfurados em função de variáveis operacionais e geométricas. 1999. 102 p. Dissertação (Mestrado), Departamento de Ciência e Tecnologia de Alimentos, Universidade Federal de Viçosa.
SCHUBERT, J., SIMUTIS, R., DORS, M., HAVLIK, I., LUBBERT, A. Bioprocess optimization and control: Application of hybrid modeling, Journal of Biotechnology, v. 35, p. 51-68, 1994.
SGARBIERI, V. C. Proteínas em alimentos protéicos: propriedades, degradações, modificações. São Paulo, SP: Livraria Varela, 1996, 292 p.
SILVA, L. H. M. Equilíbrio de fases em sistemas aquosos bifásicos: polímero/polímero e polímero/sal. Campinas, SP: UNICAMP, 1995. Tese (Doutorado), Universidade Estadual de Campinas, 2000, 132 p.
SILVA, M. E., PELLOGIA, C., FRANCO, F. A. T., TEIXEIRA, T. Purification of three different microbial β-galactosidases by partitioning in aqueous two-phase systems. Ciência e Tecnologia de Alimentos, v. 17(3), p. 219-223, 1997.
STUART, G., MACHADO, R. A. F., ULLER, A. M. C., LIMA, E. L., OLIVEIRA, J. V. Hybrid artificial neural network applied modeling SCFE of basil and rosemary oils. Ciência e Tecnologia de Alimentos, v. 17(4), p. 501-505, 1997.
SUBRAMANIAM, G. Bioseparation and bioprocessing. Vol II: Processing quality and characterization economics, safety and hygiene. Edited by Subramaniam - NY, 1998, 474 p.
TEISSIER, P., PERRET, B., LATRILLE, E., BARILLERE, J. M., CORRIEU, G. A hybrid recurrent neural network model for yeast production monitoring and control in a wine base medium. Journal of Biotechnology, v. 55, p. 157-169,
1997. THIBAULT, J., BREUSEGEM, V. V., CHÉRUY, A. On-line prediction of
fermentation variables using neural networks. Biotechnology and Bioengineering, v. 36, p. 1041-1048, 1990.
THYAGARAJAN, T., SHANMUGAN, J., R. C., PONNAVAIKKO, M., RAO, P. G. Artificial neural networks: principle and application to model based control of drying systems - a review. Drying Technology, v. 16, n. 6, p. 931-966, 1998.
TORRES, A. P & OLIVEIRA, F. A. R. Residence time distribution studies in continuous thermal processing of liquid foods: a review. Journal of Food Engineering, v. 36, p. 1-30, 1998.
TOSI, E., CAZOOLY., CATALANO, O. Uso de la harina de triticale y suero de leche ultrafiltrado em polvo para la fabricación de pastas frescal. Alimentaria, v. 39, p. 39-41, 1997.
TREYBAL, R. E. Extraccion en fase liquida. Toral, M.T. (trad.). Mexico: Uteha, 1968, 729 p.
TSEN, A. Y. D., JANG, S. S., WONG, D. S. H., JOSEPH, B. Predictive control of quality in batch polymerization using hybrid ANN models. AIChE Journal, v. 42, n. 2, p. 455-465, 1996.
ZBICINSKI, I., KAMINSKI, W., STRUMILLO, P. Dynamic and hybrid neural model of thermal drying in a fluidized bed. Drying Technology, v. 15, n. 6-8, p. 1743-1752, 1997.
ZHANG, Q., REID, J. F., LITCHFIELD, J. B., REN, J., CHANG, S.-W. A prototype neural network supervised control system for bacillus thuringiensis fermentations. Biotechnology and Bioengineering. v. 43, p. 483-489, 1994.
ZUNIGA, A. D. G. Sistemas aquosos polietilenoglicol - Sal: separação de αα -lactoalbumina e ββ -lactoglobulina do soro de queijo e hidrodinâmica em um extrator graesser. 2000. 78 p. Dissertação (Mestrado), Departamento de Ciência e Tecnologia de Alimentos, Universidade Federal de Viçosa.